【実施例1】
【0032】
図1は、実施形態の機械翻訳装置のハードウエア構成図である。
【0033】
図1において、機械翻訳装置11は、例えば一般的なコンピュータであり、メモリ19に記憶されたプログラム20を、演算制御装置12のプロセッサ18において実行する。
【0034】
演算制御装置12には、表示装置13、マウス14、キーボード15、ディスクドライブ16及び記憶装置17が接続されている。表示装置13は、演算制御装置12の演算結果等を表示するものであり、マウス14やキーボード15等の入力装置は、表示装置13に表示されるユーザインターフェースとともに演算制御装置12に対する各種指令の入力に用いられる。また、キーボード15から翻訳対象の第一言語の原文文書を入力することも可能である。ディスクドライブ16は、翻訳対象の第一言語の原文文書などのファイルを記憶媒体に入出力するものであり、翻訳対象の第一言語の原文文書を入力する入力装置としても使用可能である。
【0035】
記憶装置17は、演算制御装置12の演算結果や翻訳辞書等を記憶するものであり、例えば、複数個のハードディスクドライブ(HDD)で構成される。演算制御装置12は、プロセッサ18とメモリ19とを含んで構成されている。メモリ19には、プログラム20が記憶されると共に、プロセッサ18により演算処理が実行される際に使用される作業エリア21が設けられている。
【0036】
図2は、実施形態の機械翻訳装置の機能ブロック図である。ここでは
図1に示したハードウエア構成図を参照しながら説明する。
【0037】
入力部22は翻訳対象となる第一言語の原文データの入力を受け付けるものである。例えば、
図1に示したように、原文データがユーザ自身によりキーボード15等から直接入力されたときや、記憶媒体を介してディスクドライブ16から入力されたときに、原文データを演算制御装置12内のメモリ19や記憶装置17内に入力し記憶させるものである。
【0038】
文分割部23は、入力部22から入力された原文データの原文を文単位に分割し、メモリ19の作業エリア21に格納するものである。1文単位で分割された原文は、制御部24に受け渡される。制御部24は、原文解析・翻訳部25、翻訳用例検索部26、差分判定部27、類似用例対応付け部28、差分語句訳語選択部29、訳語置換部30、辞書部31、翻訳用例データベース32、類似用例語句対応関係記憶部33、出力部34を制御するものである。
【0039】
原文解析・翻訳部25は、入力部22から入力され、文分割部23によって1文単位に分割された原文に対して、辞書部31を参照しながら文の解析を行うものである。
【0040】
翻訳用例検索部26は、文分割部23にて1文単位に分割された入力された原文を検索キーとして翻訳用例データベース部32から翻訳対象原文に類似する翻訳用例を検索するものである。
【0041】
差分判定部27は、検索された類似用例原文と翻訳対象原文との差異部分を判定するものである。この差異部分に対応する類似用例原文中の語句と翻訳対象原文中の語句とが対応付けられる。この語句を差分語句という。
【0042】
類似用例対応付け部28は、検索された類似用例原文と類似用例訳文との語句単位での対応付けを行うものである。ここで対応付けられた類似用例原文中の語句と類似用例訳文中の語句との対応関係は、類似用例語句対応関係記憶部33に記憶される。
【0043】
差分語句訳語選択部29は、後述する辞書部31と類似用例語句対応関係記憶部33とを参照して、採用する訳語の優先度を特定の基準に基づいて算出することにより、前記差分判定部27によって特定された前記原文中の差異部分に対応する、第二言語による訳語の選択を行うものである。
【0044】
訳語置換部30は、差分判定部27によって特定された類似用例訳文中の語句を、差分語句訳語選択部29によって取得した訳語で置き換えて、訳文を生成するものである。
【0045】
辞書部31は、入力した第一言語の原文の解析及び第二言語への翻訳に必要な語彙・規則を格納するものであり、記憶装置17内に形成されている。翻訳に必要な規則では、特定の条件下において用いる語句の優先度などが指定されている。翻訳に必要な語彙・規則は、辞書部31の語彙部31a、形態素解析処理部31b、構文解析部31c、変換規則部31d、および生成規則部31eに格納されている。類似用例は翻訳用例データベース32に格納されている。
【0046】
出力部34は、原文解析・翻訳部25によって生成された翻訳の結果を出力装置に出力するものである。例えば、出力装置としての表示装置13に表示出力する。出力装置は
図1の表示装置13だけでなく、表示装置13による出力に代え、あるいは、表示装置13による出力に加えて、音声により音声出力装置に出力するようにしてもよいし、印刷装置に印刷出力するようにしてもよいし、ディスクドライブ16を介して記録媒体に出力するようにしてもよい。
【0047】
図2に示す演算制御装置12内の各部は、
図1に示したプロセッサ18がプログラム20をメモリ19に読み込んで実行することで、演算制御装置12は当該各部として機能するものである。
【0048】
図3は、実施形態の機械翻訳装置の処理のフローチャートである。
【0049】
ユーザが入力装置から翻訳対象の第一言語の原文を入力すると、入力部22は原文を受け付ける(ステップS301)。入力された原文は、メモリ19または記憶装置17に記憶される。次に、文分割部23は、メモリ19または記憶装置17から原文を読み出して1文単位に分割する(ステップS302)。分割された原文の各1文に対して、制御部24は、変数iに「1」をセットし(ステップS303)、i番目の原文1文を取り出す(ステップS304)。i番目の原文1文はメモリ19の作業エリア21に取り出される。
【0050】
次に、取り出されたi番目の原文1文に対して、原文解析・翻訳部25は、辞書部31を参照して原文言語解析処理を行う(ステップS305)。すなわち、原文解析・翻訳部25が語彙部31a及び形態素解析規則部31bを参照して原文1文の形態素解析処理を行い、構文解析規則部31cを参照して構文解析処理を行い、原文1文を構成する各語の品詞、構文に関する情報を取得する。なお、ここで用いる構文解析処理その他の技術は、本実施形態に固有のものではなく、言語処理に関わる一般的な技術である。
【0051】
続いて、翻訳用例検索部26が、原文を検索キーとして翻訳用例データベース32から前記原文と同一または類似している翻訳用例を検索する(ステップS306)。類似用例の検索は、原文を構成する各単語と一致する単語数の割合から算出される文の一致度、その他の属性の一致などを考慮して行われる。
【0052】
なお、単語の一致の判定を行うに当たり、ステップS305で取得した言語解析処理の結果を用いて、表記の揺れは違いとみなさない処理を行うこともできる。表記の揺れとは、長音記号の有無などのカタカナ表記や送り仮名の表記の揺れや、漢字表記とひらがな表記の揺れ、送り仮名の有無の揺れなどを指している。
【0053】
もちろん、表記の揺れは吸収しない完全一致の翻訳用例のみを検索結果とする実施形態も可能である。また、文字・単語上の違いがあっても、違いの割合が特定の値以下の場合は違いを無視するというように、差異文字数ないしは差異単語数の割合の下限値を設けて検索の可否を制御する実施形態であってもよい。これにより、語句・文字の使われ方が類似した翻訳用例を抽出することもできる。この場合は、用例検索のステップS306を辞書引き処理・形態素解析のステップS305の後に行う必要はない。
【0054】
用例検索では、複数の類似用例が検索される場合もあるが、最終的には類似度が最も高い用例を絞り込み、処理対象とする。本実施形態の本質的な部分でないためここでは詳細に説明しないが、複数の類似用例から優先度の最も高い用例を決定するには、類似度、用例の登録者、登録日時などの基準を用いて行うのが一般的である。
【0055】
翻訳用例検索部26が、類似用例があると判定した場合は(ステップS307:Yes)、類似用例をメモリ19の類似用例記憶エリアに記憶する。
【0056】
続いて、処理対象の類似用例に対して差分関連の処理を行う(ステップS308〜ステップS311)。まず差分判定部27によって、翻訳対象原文と類似用例原文に対して差分対応付け処理を行う(ステップS308)。差分対応付けの具体例については後で説明する。
【0057】
次に、類似用例対応付け部28によって、類似用例に対して類似用例対応付け処理を行う(ステップS309)。すなわち、原文の語句と訳文の語句との対応付けである。この類似用例対応付け処理のステップS309の詳細については後で
図4を参照して説明する。
【0058】
続いて差分語句訳語選択部29が、差分判定部27によって判定された翻訳対象原文と類似用例原文との差分語句に対して、辞書部31の語彙部31aおよび類似用例語句対応関係記憶部33を参照してその訳語を選択・取得する、差分語句訳語取得処理を行う(ステップS310)。
【0059】
その後、訳語置換部30が、差分語句訳語選択部29が取得した訳語を用いて、差分判定部27によって判定済みの差分語句に対応する類似用例訳文中の語句を置き換える(ステップS311)。訳語置換処理の結果得られた訳文をi番目の原文1文の翻訳結果とする。
【0060】
一方、ステップS307の判定で、類似用例はないと判定した場合は(ステップS307:No)、差分関連の処理(ステップS308〜ステップS311)を行わず省略してステップS312に移行し、原文解析・翻訳部25によるi番目の原文1文の翻訳処理が行われる(ステップS312)。
【0061】
最後に、上流の各処理によって得られた翻訳結果を、出力部33から表示する(ステップS313)。表示される内容としては、ステップS307で類似用例が検出されなかった場合には、ステップS312で得られた翻訳結果が表示される。ステップS307で類似用例が見つかり、かつステップS308の差分対応付け処理にて類似用例の原文中の差分に一対一に対応する類似用例の訳文中の語句の判定(対応付け)が成功している場合には、類似用例の訳文に対して、ステップS309で得られた翻訳対象原文の差分に対応する訳語を置き換えた訳文が表示される。
【0062】
なお、ステップS307で類似用例が検出されてはいたが、ステップS308の差分対応付け処理にて類似用例の原文中の差分に一対一に対応する類似用例の訳文中の語句の判定(対応付け)に失敗している場合には、ステップS307で検出された類似用例の訳文が、参考訳文として表示される。
【0063】
そして、原文のすべての文について処理が終了したかどうか、つまり全原文処理が終了したかどうかを判定し(ステップS314)、原文のすべての文に対する処理が終了している場合は処理を終了し、原文のすべての文に対する処理が終了していない場合には、変数iに「1」を加算して(i=i+1)とし(ステップS315)、ステップS304に戻る。
【0064】
図4は、
図3の類似用例対応付け処理S309の詳細なフローチャートである。
【0065】
原文解析・翻訳部25は、類似用例の原文と翻訳対象の原文とをメモリ19の作業エリア21に取り出し、翻訳用例検索部26によって取得された類似用例の原文に対して、
図3のステップS305において翻訳対象原文に対して行ったものと同様な言語解析処理を行う(ステップS401)。
【0066】
次に、類似用例の訳文に対しても、原文と同様な言語解析処理を原文解析・翻訳部25が行う(ステップS402)。
【0067】
ステップS401とステップS402において得られた言語解析結果を用いて、差分判定部27が、翻訳対象原文中の語句と類似用例原文中の語句との対応付けを行う(ステップS403)。
【0068】
ここで、
図9に示した英日機械翻訳の具体例において、同図の翻訳対象原文(欄901)に対して同図の類似用例原文(欄902)および類似用例訳文(欄903)が検出された場合における、ステップS308の差分対応付け処理およびステップS309の類似用例対応付け処理について詳しく説明する。
【0069】
図5は、実施例1における翻訳対象原文の形態素解析および構文解析の結果のツリー構造である。
【0070】
図5の翻訳対象原文は、
図9に示した翻訳対象原文(欄901)と同じものである。この翻訳対象原文に対して、ステップS305の原文言語解析(形態素解析および構文解析)の処理の結果として得られるツリー構造が示されている。
【0071】
実線で囲まれた語句は形態素解析によって得られた文を構成する各要素であり、これら各要素をつなぐ線によって、各要素同士の構文上のつながり方が表現されている。本実施形態において、このように文を構成する各語句の構文上のつながりを図上に表したものをツリー構造と呼ぶ。
【0072】
図5において、例えば、「memory access」は、形態素としては「memory」および「access」の二つの単語からなるものであるが、構文解析によるツリー構造においては「memory access」という一つの要素となっている。また、「memory means」についても同様にツリー構造における一つの要素となっている。
【0073】
図6は、実施例1における類似用例原文の形態素解析および構文解析の結果のツリー構造である。
【0074】
図6の類似用例原文は、
図9に示した類似用例原文(欄902)と同じものである。この類似用例原文に対して、ステップS401の類似用例原文言語解析(形態素解析および構文解析)の処理の結果として得られるツリー構造が示されている。
【0075】
破線で囲まれた語句は、類似用例原文を構成する各要素に対する第二言語の訳語候補として語彙部31aに登録されている訳語候補のリストである。訳語が複数あるものはコンマで区切って列挙しており、訳語がない場合は「Φ」記号で表される。後述する類似用例原文と類似用例訳文の差分の対応付け(ステップS404)の処理で使用する。
【0076】
この
図5および
図6のツリー構造のマッチングにより、翻訳対象原文と類似用例原文との差分を以下のように判定する(ステップS403)。
【0077】
翻訳対象原文:「the memory access」―― 類似文用例原文:「the memory capacity」
翻訳対象原文:「the above memory means」―― 類似文用例原文:「a memory means」
翻訳対象原文:「reading and rewriting registration data」―― 類似文用例原文:「recording information data」
【0078】
なお、このようなツリー構造を基にした文のマッチングの手法は、特開2005−208825号公報等に開示される既存の手法であり、その説明は省略する。
【0079】
図7は、実施例1における類似用例訳文の形態素解析および構文解析の結果のツリー構造である。
【0080】
図7の類似用例訳文は、
図9に示した類似用例訳文(欄903)と同じものである。この類似用例訳文に対して、ステップS402の類似用例訳文言語解析(形態素解析および構文解析)の処理の結果として得られるツリー構造が示されている。
【0081】
破線で囲まれた語句は、類似用例訳文を構成する各要素に対する第一言語の訳語候補として語彙部31aに登録されている訳語候補のリストである。
【0082】
次に、類似用例原文と類似用例訳文との対応付け処理の流れの概要を以下に示す。
【0083】
[1]類似用例対応付け部28が、以下の処理を類似用例原文の各構成要素について行う。
【0084】
[1−1]類似用例原文を構成する語句(第一言語)に対して、類似用例訳文(第二言語)を構成する各語句の訳語(第一言語)から一致するものを検索し、一致する訳語を持つ類似用例訳文の構成語を、類似用例原文の構成語に対応する類似用例訳文の対応語候補(第一言語)として抽出する。候補が複数存在すれば、複数の候補を抽出する。
【0085】
[1−2]類似用例訳文を構成する各語句(第二言語)に対して、類似用例原文(第一言語)を構成する各語句の訳語(第二言語)から一致するものを検索し、一致する訳語を持つ類似用例原文の構成語を、類似用例訳文の構成語に対応する類似用例原文の対応語候補(第二言語)として抽出する。候補が複数存在すれば、複数の候補を抽出する。
【0086】
[2]上記[1]の結果、対応関係に重複がなく1対1に対応が決まる場合、類似用例対応付け部28が、対応関係のつけられた語句を確定する。
【0087】
以上説明した対応付け処理によって得られた類似用例原文と類似用例訳文を構成する各語句の対応関係に基づいて、原文語句・訳文語句対応テーブル33aを作成し(S404)、類似用例語句対応関係記憶部33に格納する。
【0088】
図8は、実施例1における原文語句・訳語対応テーブルの内容を示す図である。
【0089】
すなわち、
図6の類似用例原文の形態素解析および構文解析の結果として得られるツリー構造と、
図7の類似用例訳文の形態素解析および構文解析の結果として得られるツリー構造とから、類似用例対応付け部28による上記[1][2]の対応付け処理によって得られた対応関係である。この内容が、類似用例語句対応関係記憶部33に格納される。
【0090】
次に、翻訳対象原文の差分語句に対する差分語句訳語取得部29による処理を、翻訳対象原文(欄901)の差分語句の一つである「the above memory means」を用いて説明する。まず、差分語句訳語取得部29が「the above memory means」を構成する各語(「the above」についてはここでは説明を省略する)の訳語を、語彙部31aおよび原文語句・訳文語句対応テーブル33aを参照して取得する。取得される訳語候補は以下の通りとなる。
【0091】
(語彙部31aに登録されている訳語候補)
「memory」の訳語候補:「メモリ」「記憶」「回想」等
「means」の訳語候補:「方法」「手段」「財力」等
【0092】
(原文語句・訳文語句対応テーブル33aに登録されている訳語候補)
「memory」の訳語候補:「記憶」
「means」の訳語候補:「手段」
「memory means」の訳語候補:「記憶手段」
【0093】
また、この例では、以下(1)および(2)の場合を想定している。
(1)ユーザ辞書に「memory」「means」「memory means」は登録されていない。
(2)語彙部31aに登録されている各訳語に対して、訳語の優先順位に関する翻訳規則は登録されていない。
【0094】
本実施形態は、このように語彙部31aにおいて置き換え対象の訳語の候補が複数ある場合に、原文語句・訳文語句対応テーブル33aに基づいて、類似用例から記憶した語句を優先して選択することにより、訳語統一を行う。
【0095】
また、変形例としては、各訳語の優先度は、以下の各基準を満たす訳語の優先度に点数を加算することで算出するようにしてもよい。
【0096】
1.見出し語が、差分語句である「memory means」と一致している単語数が多いほど高得点を加算する。
【0097】
2.語彙部31aに、訳語の優先順位に関する規則が登録されている。
【0098】
3.原文語句・訳文語句対応テーブル33aに登録されている。
【0099】
4.ユーザ辞書に登録されている。
【0100】
このような優先度を算出する場合、上記3.の基準である原文語句・訳文語句対応テーブル33aに登録されていることの点数を高くすると好ましい。これらの基準に基づいて上記の訳語候補の優先度を算出すると、「memory means」に対応付けられた「記憶手段」の優先度の値が最も大きくなり、訳語として選択される。
【0101】
その結果、本実施形態において、翻訳対象原文(欄901)に対する合成訳文は、「上記記憶手段の記憶アクセスを低減すると共に、記憶手段中の登録データを読み書きし直すことに必要な時間を低減する。」となる(欄905)。つまり、「memory」に対する訳語は「記憶」に統一されることになる。
【0102】
なお、上記の基準については、ステップS306で行った類似用例検索処理と同様な、表記の揺れを吸収する処理を行っても良い。
【0103】
また、必要に応じて、上記の訳語の優先度の算出に際して、加算する点数に条件に応じた重みを付けても良い。これによって、例えば会社名などの固有名詞が登録されているユーザが作成した辞書には大きな点数を与え、どのような状況でも登録した訳語が選出されるようにすることもできる。また、必要に応じて、特定の翻訳規則に対して大きな点数を与えることで、例えば慣用表現などに対しては、語彙部に登録された訳語が優先して選出されるようにすることもできる。
【0104】
上記の例では、差分語句訳語選択部29において算出された優先度の値に基づいて訳語を自動的に決定したが、優先度判断の対象となった語句をユーザに一覧表示する訳語候補表示部を設けることもできる。具体的には、類似用例で使われている訳語とユーザ辞書、翻訳辞書とに登録されている訳語をユーザに一覧表示することができる。その場合、訳語候補は優先度の高い順に並べるユーザインタフェースを設けるようにする。
【0105】
これによって、類似用例を基に合成された訳文における訳語の統一を図る際に、ユーザの判断を加味することができる。また、ユーザが自動的に選択された訳語以外の訳語を選択する際の労力を削減することもできる。
【0106】
また、優先度の値に基づいて決定された訳語以外の訳語候補をユーザが選択した場合には、ユーザ辞書に自動的に登録する、あるいは、ユーザ辞書に登録することをユーザに知らせる訳語優先度編集部を設けることもできる。これによって、ユーザが何度も訳語選択をする労力を削減することができる。
【0107】
もしくは、翻訳対象原文と類似用例原文との差分語句に対応する第二言語による訳語を決定する際に、表示された訳語の優先度を編集できるようにしてもよい。これによって、表示された訳語とは異なる訳語を選択することもできる。編集した優先度が記憶されるため、次回から変更後の優先度が適用され、ユーザが何度も同じ訳語の優先度を編集する手間を省くことができる。
【実施例2】
【0108】
図10は、翻訳対象原文に対し類似用例を用いて作成された合成訳文の第2の例を示す図である。
【0109】
翻訳対象の原文が、「Over a 63-month period, FAST scans were retrospectively studied.」(欄1001)であり、検索された類似用例の原文が「Over a 63-month period, FAST scans were prospectively studied.」(欄1002)であるとする。
【0110】
上記例において、翻訳対象の原文と検索された類似用例の原文との差異部分は1箇所あり、以下の通りである。
図10における欄1001と欄1002において下線を引いた部分である。
【0111】
「retrospectively」と「prospectively」
【0112】
一方、この類似用例原文と対応付けて検索される類似用例訳文は「63ヶ月に渡ってFASTを前向きに調査した。」(欄1003)であるとする。
【0113】
ここで、類似用例の原文と類似用例の訳文との間では、差異部分の対応訳語は、以下のように対応付けられる。
図10における欄1002と欄1003において下線を引いた部分である。
【0114】
「prospectively」と「前向きに」
【0115】
そして、翻訳対象原文に対する合成訳文は、これらの対応関係に基づいて作成されることになるが、従来の技術によって作成された合成訳文は、「63ヶ月に渡ってFASTを回顧的に調査した。」(欄1004)となっている。
【0116】
この従来の技術によって作成された合成訳文においては、翻訳対象の原文中の差異部分の語句は、辞書部の語彙部における見出し語とその訳語(欄1100)に従って、以下のように訳されて、置き換え訳語として使用される。
図10における欄1001と欄1004において下線を引いた部分である。
【0117】
「retrospectively」→「回顧的に」
【0118】
この類似用例中の差分、すなわち置き換えの元になった部分では、「retrospectively」が「回顧的に」と訳されている。このように、従来の技術による合成訳文では、置き換えられた訳語の「回顧的に」が、置き換えの元になった類似用例訳文の文脈にそぐわないという問題があった。
【0119】
そこで、本実施形態において作成された合成訳文によれば、欄1005に示すように、「63ヶ月に渡ってFASTを後ろ向きに調査した。」という適切な結果となる。以下、この結果が得られる処理について具体的に説明する。
【0120】
図11は、実施例2における翻訳対象原文の形態素解析および構文解析の結果のツリー構造である。
【0121】
図11の翻訳対象原文は、
図10に示した翻訳対象原文(欄1001)と同じものである。この翻訳対象原文に対して、ステップS305の原文言語解析(形態素解析および構文解析)の処理の結果として得られるツリー構造が示されている。
【0122】
図12は、実施例2における類似用例原文の形態素解析および構文解析の結果のツリー構造である。
【0123】
図12の類似用例原文は、
図10に示した類似用例原文(欄1002)と同じものである。この類似用例原文に対して、ステップS401の類似用例原文言語解析(形態素解析および構文解析)の処理の結果として得られるツリー構造が示されている。
【0124】
そして、この
図11および
図12のツリー構造のマッチングにより、翻訳対象原文と類似用例原文との差異部分を以下のように判定する(
図4のステップS403、
図10に示した翻訳対象原文の欄1001と類似用例原文の欄1002において下線を引いた差異部分を参照。)。
【0125】
翻訳対象原文:「retrospectively」―― 類似文用例原文:「prospectively」
【0126】
図13は、実施例2における類似用例訳文の形態素解析および構文解析の結果のツリー構造である。
【0127】
図13の類似用例訳文は、
図10に示した類似用例訳文(欄1003)と同じものである。この類似用例訳文に対して、ステップS402の類似用例訳文言語解析(形態素解析および構文解析)の処理の結果として得られるツリー構造が示されている。
【0128】
そして、この対応付け処理によって得られた類似用例原文と類似用例訳文を構成する各語句の対応関係に基づいて、原文語句・訳文語句対応テーブル33aを作成し(S404)、類似用例語句対応関係記憶部33に格納する。
【0129】
図14は、実施例2における原文語句・訳語対応テーブルの内容を示す図である。
【0130】
すなわち、
図12の類似用例原文の形態素解析および構文解析の結果として得られるツリー構造と、
図13の類似用例訳文の形態素解析および構文解析の結果として得られるツリー構造とから、類似用例対応付け部28による上記[1][2]の対応付け処理によって得られた対応関係である。
【0131】
次に、翻訳対象原文の差分語句に対する差分語句訳語取得部29による処理を、翻訳対象原文(欄1001)の差分語句である「retrospectively」を用いて説明する。まず、差分語句訳語取得部29が「retrospectively」の訳語を、語彙部31aおよび原文語句・訳文語句対応テーブル33aを参照して取得する。取得される訳語候補は以下の通りとなる。
【0132】
(語彙部31aに登録されている訳語候補。
図10および
図11の欄1100参照。)
「retrospectively」の訳語候補:回顧的に、回想的に、遡及的に、後ろ向きに、…
【0133】
(
図14の原文語句・訳文語句対応テーブル33aに登録されている訳語候補)
「prospectively」の訳語候補:「前向きに」
【0134】
また、この例では、以下(1)および(2)の場合を想定している。
(1)ユーザ辞書に「retrospectively」は登録されていない。
(2)語彙部31aに登録されている各訳語に対して、訳語の優先順位に関する翻訳規則は登録されていない。
【0135】
本実施例では、各訳語の優先度は、以下の基準を満たす訳語の優先度に点数を加算することで算出する。
【0136】
1.見出し語が、差分語句である「retrospectively」と一致している単語数が多いほど高得点を加算する。
【0137】
2.差分語句に対する類似用例訳文中の対応訳語「前向きに」と文字列の類似度が高いほど高得点を加算する。(
図10および
図12の欄1200参照。)
【0138】
3.語彙部31aに、訳語の優先順位に関する規則が登録されている。
【0139】
4.原文語句・訳文語句対応テーブル33aに登録されている。
【0140】
5.ユーザ辞書に登録されている。
【0141】
これらの基準に基づいて上記の訳語候補の優先度を算出すると、「後ろ向きに」の優先度の値が最も大きくなり、
図10に示すように、訳語として選択される。上記の基準2.の類似度は、例えば、一致している文字数の割合などによって算出することができる。上記の基準1.および2.では、S306で行った類似用例検索処理と同様な、表記の揺れを吸収する処理を行っても良い。