IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本特許翻訳株式会社の特許一覧

<>
  • 特開-翻訳支援装置、及びプログラム 図1
  • 特開-翻訳支援装置、及びプログラム 図2
  • 特開-翻訳支援装置、及びプログラム 図3
  • 特開-翻訳支援装置、及びプログラム 図4
  • 特開-翻訳支援装置、及びプログラム 図5
  • 特開-翻訳支援装置、及びプログラム 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024061321
(43)【公開日】2024-05-07
(54)【発明の名称】翻訳支援装置、及びプログラム
(51)【国際特許分類】
   G06F 40/51 20200101AFI20240425BHJP
   G06F 40/45 20200101ALI20240425BHJP
   G06F 40/47 20200101ALI20240425BHJP
【FI】
G06F40/51
G06F40/45
G06F40/47
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2022169187
(22)【出願日】2022-10-21
(71)【出願人】
【識別番号】517163249
【氏名又は名称】日本特許翻訳株式会社
(74)【代理人】
【識別番号】100122275
【弁理士】
【氏名又は名称】竹居 信利
(72)【発明者】
【氏名】本間 奨
【テーマコード(参考)】
5B091
【Fターム(参考)】
5B091AA03
5B091CD11
5B091EA14
(57)【要約】
【課題】機械翻訳の貢献等を定量的に評価できる翻訳支援装置、及びプログラムを提供する。
【解決手段】第1の言語による原文を、当該第1の言語とは異なる第2の言語の翻訳文へ翻訳する作業を支援する翻訳支援装置1であって、翻訳の対象となる原文を対象原文として取得して機械翻訳し、翻訳文を生成する。またこの翻訳支援装置1は、生成した翻訳文を、第1の言語による再翻訳文に機械翻訳し、当該再翻訳文と生成した翻訳文とを互いに関連付けて臨時翻訳メモリとして保持する。そして翻訳支援装置1は、対象原文をキーとして、臨時翻訳メモリに保持された再翻訳文と比較し、対象原文と再翻訳文との適合率を演算して出力する。
【選択図】図1
【特許請求の範囲】
【請求項1】
第1の言語による原文を、当該第1の言語とは異なる第2の言語の翻訳文へ翻訳する作業を支援する翻訳支援装置であって、
翻訳の対象となる原文を対象原文として取得する取得手段と、
前記対象原文を機械翻訳して、翻訳文を生成する翻訳手段と、
前記生成した翻訳文を、第1の言語による再翻訳文に機械翻訳する逆翻訳手段と、
前記再翻訳文と、前記生成した翻訳文とを互いに関連付けて臨時翻訳メモリとして保持する保持手段と、
前記対象原文をキーとして、臨時翻訳メモリに保持された再翻訳文と比較し、対象原文と再翻訳文との適合率を演算する適合率演算手段と、
前記演算された適合率を出力する出力手段と、
を含む翻訳支援装置。
【請求項2】
請求項1に記載の翻訳支援装置であって、
前記出力手段は、前記対象原文と、当該対象原文に対応して生成された翻訳文と、対応して演算された適合率とを関連付けて出力する翻訳支援装置。
【請求項3】
請求項2に記載の翻訳支援装置であって、
前記出力手段は、前記対象原文のうち、対応する前記再翻訳文と一致する部分と相違する部分とを互いに区別可能な態様で出力する翻訳支援装置。
【請求項4】
請求項1に記載の翻訳支援装置であって、
前記翻訳手段は、複数の互いに異なる機械翻訳処理により、前記対象原文に対応する複数の翻訳文を生成し、
前記逆翻訳手段は、前記生成された複数の翻訳文のそれぞれを、第1の言語による再翻訳文に機械翻訳し、
前記保持手段は、前記複数の翻訳文のそれぞれに対応する再翻訳文と、前記生成した翻訳文とを互いに関連付けて臨時翻訳メモリとして保持し、
前記適合率演算手段は、前記対象原文をキーとして、臨時翻訳メモリに保持された再翻訳文と比較し、対象原文と前記複数の翻訳文に対応するそれぞれの再翻訳文との適合率を演算し、
前記出力手段は、前記生成された複数の翻訳文のうち、対象原文との適合率が最も高い再翻訳文に対応する翻訳文を少なくとも出力する翻訳支援装置。
【請求項5】
請求項1から4のいずれか一項に記載の翻訳支援装置であって、
前記取得手段は、翻訳の対象となった対象文書を、所定の条件を満足する原文に分割し、当該分割した原文のそれぞれを順次、対象原文として選択して取得する翻訳支援装置。
【請求項6】
コンピュータを、第1の言語による原文を、当該第1の言語とは異なる第2の言語の翻訳文へ翻訳する作業を支援する翻訳支援装置として機能させるプログラムであって、
コンピュータを、
翻訳の対象となる原文を対象原文として取得する取得手段と、
前記対象原文を機械翻訳して、翻訳文を生成する翻訳手段と、
前記生成した翻訳文を、第1の言語による再翻訳文に機械翻訳する逆翻訳手段と、
前記再翻訳文と、前記生成した翻訳文とを互いに関連付けて臨時翻訳メモリとして保持する保持手段と、
前記対象原文をキーとして、臨時翻訳メモリに保持された再翻訳文と比較し、対象原文と再翻訳文との適合率を演算する適合率演算手段と、
前記演算された適合率を出力する出力手段と、
として機能させるプログラム。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、翻訳支援装置、及びプログラムに関する。
【背景技術】
【0002】
近年、機械翻訳の技術が向上し、翻訳の現場などでも広く利用されるに至っている。翻訳会社で用いられる翻訳支援システムでは、翻訳メモリおよび機械翻訳を組み合わせて翻訳支援する技術が知られている。例えば、特許文献1には、翻訳支援システムにおける翻訳メモリと機械翻訳との結合方法であって、ユーザが翻訳支援システムにおいて翻訳タスクを実行する時、翻訳原文を翻訳メモリに送信し、送信された原文を翻訳メモリに対して類似文検索を行い、類似文検索の適合率が、あらかじめ定めた閾値以上の場合、翻訳メモリ訳文を翻訳結果として適用し、適合率が閾値以下の場合、原文に対して機械翻訳を行い、機械翻訳の訳文を翻訳結果として適用するという技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】中国公開特許108519979号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
従来の技術では、ユーザが翻訳支援システムに、翻訳したい原文言語のドキュメントを送信すると、翻訳支援システムは、ドキュメントを文節や文に分解する。分解された文節や文をセグメントと呼ぶ。翻訳メモリと機械翻訳による事前翻訳を指定すると、セグメント単位に、適合ソース言語の原文に対する翻訳メモリの原文との適合率が閾値以上であればその翻訳メモリのターゲット言語の文と前記適合率を翻訳支援システムの表示装置にターゲット言語の対訳文として表示することができるが、適合率が閾値に満たないセグメントでは機械翻訳結果のみが表示され、機械翻訳セグメントの適合率は不明のままとなる。この結果、例えば、適合率が100%、95%~99%、90%~95%、85%~90%、80%~90%、75%~90%、70~75%、70%未満などの適合率の区分に応じた課金率を設定し、各区分の文字(ワード)の割合と課金率の積によるデータ分析を行おうとすると、適合率が閾値以上の翻訳メモリが適用されたセグメントのみが分析対象となるため、機械翻訳のセグメントについては分析結果が不明のままとなり、分析は限定的とならざるを得なかった。
【0005】
本発明は上記実情に鑑みて為されたもので、機械翻訳の貢献等を定量的に評価できる翻訳支援装置、及びプログラムを提供することを、その目的の一つとする。
【課題を解決するための手段】
【0006】
上記従来例の問題点を解決する本発明の一態様は、第1の言語による原文を、当該第1の言語とは異なる第2の言語の翻訳文へ翻訳する作業を支援する翻訳支援装置であって、翻訳の対象となる原文を対象原文として取得する取得手段と、前記対象原文を機械翻訳して、翻訳文を生成する翻訳手段と、前記生成した翻訳文を、第1の言語による再翻訳文に機械翻訳する逆翻訳手段と、前記再翻訳文と、前記生成した翻訳文とを互いに関連付けて臨時翻訳メモリとして保持する保持手段と、前記対象原文をキーとして、臨時翻訳メモリに保持された再翻訳文と比較し、対象原文と再翻訳文との適合率を演算する適合率演算手段と、前記演算された適合率を出力する出力手段と、を含むこととしたものである。
【発明の効果】
【0007】
本発明によると、機械翻訳の貢献等を定量的に評価できる。
【図面の簡単な説明】
【0008】
図1】本発明の実施の形態に係る翻訳支援装置の構成例を表すブロック図である。
図2】本発明の実施の形態に係る翻訳支援装置が用いる翻訳メモリのデータベースの内容の概要例を表す説明図である。
図3】本発明の実施の形態に係る翻訳支援装置の例を表す機能ブロック図である。
図4】本発明の実施の形態に係る翻訳支援装置が表示する情報の例を表す説明図である。
図5】本発明の実施の形態に係る翻訳支援装置の動作例を表すフローチャート図である。
図6】本発明の実施の形態に係る翻訳支援装置の効果の例を表す説明図である。
【発明を実施するための形態】
【0009】
本発明の実施の形態について図面を参照しながら説明する。本発明の実施の形態に係る翻訳支援装置1は、コンピュータ装置によって実現され、図1に例示するように、制御部11と、記憶部12と、操作部13と、表示部14と、通信部15とを含んで構成される。
【0010】
制御部11は、CPU等のプログラム制御デバイスであり、記憶部12に格納されたプログラムに従って動作する。本実施の形態の例では、この制御部11は、翻訳の対象となる原文を対象原文として取得し、当該対象原文を機械翻訳して、翻訳文を生成する。
【0011】
またこの制御部11は、当該生成した翻訳文を、第1の言語による再翻訳文に機械翻訳し、得られた再翻訳文と、生成した翻訳文とを互いに関連付けて臨時翻訳メモリとして翻訳メモリに保持する。そして制御部11は、対象原文をキーとして、臨時翻訳メモリに保持された再翻訳文と比較し、対象原文と再翻訳文との適合率を演算し、この演算された適合率を出力する。こうした制御部11の動作例については後に述べる。
【0012】
記憶部12は、メモリデバイスやディスクデバイス等であり、制御部11によって実行されるプログラムを保持する。この記憶部12に格納されるプログラムは、コンピュータ可読かつ非一時的な記録媒体に格納されて提供され、この記憶部12に格納されたものであってもよい。また本実施の形態の一例では、この記憶部12は、翻訳メモリ及び上記臨時翻訳メモリとしてのデータベースを保持する。つまりこの例では、翻訳支援装置1が翻訳メモリとしても機能する。さらにこの記憶部12は、制御部11のワークメモリとしても動作する。
【0013】
なお、本実施の形態では、このように翻訳支援装置1が翻訳メモリとしても動作するが、翻訳メモリは、別体の装置として実現され、ネットワーク等を介して通信可能に接続されているものであってもよい。この場合、翻訳メモリのデータベースや、臨時翻訳メモリのデータベースは当該別体の翻訳メモリのサーバ装置に配され、翻訳支援装置1は、当該サーバ装置にアクセスして、翻訳メモリや臨時翻訳メモリへのデータの登録や、検索等を行う。
【0014】
操作部13は、マウスやキーボード等であり、ユーザの操作を受け入れて、当該操作の内容を制御部11に出力する。表示部14は、ディスプレイ等であり、制御部11から入力される指示に従って種々の情報を表示出力する。
【0015】
通信部15は、ネットワークインタフェース等であり、制御部11から入力される指示に従って、ネットワークを介して種々のサーバ装置や、パーソナルコンピュータ(PC)等との間でデータを送受する。
【0016】
本実施の形態の一例では、既に述べたように、記憶部12に翻訳メモリのデータベースを格納しておく。このデータベースは、例えば図2に例示するように、過去に翻訳された原文(S)とその翻訳の結果である翻訳文(T)とを互いに関連付けた、過去の翻訳履歴の情報(レコード)を少なくとも一つ含む。ここでの翻訳文(T)は機械翻訳されたものに限られず、原文(S)に対して翻訳者が妥当と考えた翻訳文が用いられる。以下、区別のため、この過去の翻訳履歴に含まれる原文を、過去原文と呼ぶ。
【0017】
次に、本実施の形態の制御部11の動作例について説明する。本実施の形態の制御部11は、記憶部12に格納されたプログラムを実行することで、図3に例示するように、機能的に、受入部21と、原文取得部22と、機械翻訳処理部23と、逆翻訳部24と、登録部25と、翻訳メモリ検索部26と、適合率演算部27と、出力処理部28とを含んで構成される。
【0018】
受入部21は、翻訳の対象となった対象文書を、ネットワーク等を介して受け入れ、原文取得部22に出力する。この対象文書は、一般に、複数の文を含み、また第1の言語で記述されているものとする。
【0019】
原文取得部22は、受け入れた対象文書を、所定の条件を満足する原文に分割し、当該分割した原文のそれぞれを順次、対象原文として出力する。本実施の形態の例では、この受入部21と、原文取得部22とが取得手段を実現する。
【0020】
なお、この原文取得部22による、翻訳の対象となる原文への分割は、例えば対象文書を段落ごと(改行コードごと)で分割することで行えばよい。この場合は一段落に含まれる一以上の文が原文として処理される。もっともこれは一例であり、原文取得部22は、文ごとに分割して、各文を原文としてもよい。
【0021】
機械翻訳処理部23は、原文取得部22が出力する翻訳の対象となる原文(対象原文)を、予め定められた機械翻訳プログラムに従って処理し、第2の言語(第1の言語とは異なる言語)で記述された翻訳文に機械翻訳する。この機械翻訳プログラムは、広く知られたニューラルネットワークを用いた機械翻訳プログラム等でよい。こうした機械翻訳プログラムとしては、DeepL(商標)などの汎用の機械翻訳プログラムであってもよいし、例えば対象文書が予め定められた種類の文書、例えば特許文書であれば、当該種類の文書に特化して設計された機械翻訳プログラム(特許文書の例であれば、情報通信研究機構の特許NTなどがある)を用いてもよい。
【0022】
逆翻訳部24は、機械翻訳処理部23が生成した翻訳文を、予め定められた機械翻訳プログラムに従って処理し、第1の言語で記述された再翻訳文に機械翻訳する。ここで用いる機械翻訳プログラムは、第1,第2の言語を入れ替えるほかは、機械翻訳処理部23が対象原文から翻訳文を得るときに用いた機械翻訳プログラムを用いることが好適である。
【0023】
登録部25は、処理の開始時に臨時の翻訳メモリ(臨時翻訳メモリ)のデータベースを記憶部12に生成して初期化する。この登録部25は、再翻訳文(第1の言語)と、生成された翻訳文(第2の言語)とを互いに関連付けたレコードをこの臨時翻訳メモリのデータベースに格納する。またこの登録部25は、処理の終了時に、当該臨時翻訳メモリのデータベースを破棄することとしてもよい。
【0024】
翻訳メモリ検索部26は、対象原文をキーとして、当該キーとした対象原文と類似する過去原文または再翻訳文を、翻訳メモリのデータベースと、登録部25が生成した臨時翻訳メモリのデータベースとのうちから検索する。一例としてこの翻訳メモリ検索部26は、翻訳メモリのデータベースに格納された各レコードの過去原文、または、登録部25が生成した臨時翻訳メモリのデータベースに格納された各レコードの再翻訳文と、対象原文との適合率を、適合率演算部27により演算する。そして翻訳メモリ検索部26は、当該適合率が高い順に、翻訳メモリまたは臨時翻訳メモリのデータベースに格納された少なくとも一つのレコードを取得して、当該取得したレコードに含まれる過去原文または再翻訳文と、翻訳文とを出力する。また翻訳メモリ検索部26は、当該取得したレコードに係る適合率を併せて出力してもよい。
【0025】
適合率演算部27は、翻訳メモリのデータベースに格納された各レコードの過去原文、または、登録部25が生成した臨時翻訳メモリのデータベースに格納された各レコードの再翻訳文と、対象原文との適合率を演算する。ここで適合率は、広く知られたBLEU(Bilingual Evaluation Understudy)スコアや、RIBES(Rank-based Intuitive Bilingual Evaluation Score)を用いて求めることとしてもよい。一例として、適合率演算部27は、翻訳メモリのデータベースに格納された各レコードについては、レコードに含まれる過去原文と対象原文との間、臨時翻訳メモリのデータベースに格納された各レコードについては、レコードに組まれる再翻訳文と対象原文との間のBLEUスコアS1と、RIBEスコアS2とを用い、適合率Sを、
【数1】
として求める。ここでa,bは、実験的に定められる重みである。もっともこれは一例であり、単語ごとに分散表現(ベクトル表現)を得て、各文に含まれる単語間のコサイン距離により適合率が演算されてもよい。さらにここでは適合率は数値が大きいほど、再翻訳文等と対象原文とがより一致していることを表すものとするが、これも一例であり、数値が小さいほど、再翻訳文等と対象原文とがより一致していることを表すものとなっていてもよい。
【0026】
出力処理部28は、翻訳メモリ検索部26が取得して出力した過去原文または再翻訳文と、翻訳文と、適合率とを受けて、これらを関連付けて出力する。一例として、この出力処理部28は、図4に例示するように、原文取得部22が取得した対象原文と、翻訳メモリまたは臨時翻訳メモリから取得されたレコードに含まれる過去原文または再翻訳文との差分(P)及び、翻訳文(Q)、対応して演算された適合率(R)を関連付けたリストを含む表形式で出力する。
【0027】
[動作]
本実施の形態は以上の構成を基本的に備えており、次のように動作する。以下の例では、記憶部12に翻訳メモリのデータベースが格納されているものとする。またこのデータベースには、図2に例示したように、過去に翻訳された過去原文(S)とその翻訳の結果である翻訳文(T)とを互いに関連付けたレコードが、翻訳者の操作により記録されているものとする。
【0028】
本実施の形態の翻訳支援装置1は、図5に例示するように、第1の言語で記述されている、翻訳の対象となった対象文書をネットワーク等を介して受け入れると、この受け入れた対象文書を段落ごと(改行コードごと)で分割する(S11:セグメンテーション)。
【0029】
また翻訳支援装置1は、臨時の翻訳メモリ(臨時翻訳メモリ)を記憶部12に生成して初期化するなど、所定の初期化処理を実行しておく(S12:初期化処理)。翻訳支援装置1は、ステップS11で分割して得た段落ごとの文(複数の文が含まれてもよい)を順次、対象原文として選択しつつ次の処理を実行する。
【0030】
翻訳支援装置1は、対象原文を、予め定められた機械翻訳プログラムにより、対象原文の第1の言語とは異なる第2の言語の翻訳文に機械翻訳する(S13)。また翻訳支援装置1は、ステップS13で生成した翻訳文を、ステップS13で用いた機械翻訳プログラムと同じプログラムを用いて、第1の言語で記述された再翻訳文に機械翻訳する(S14)。
【0031】
翻訳支援装置1は、ステップS14で得た再翻訳文(第1の言語)と、ステップS13で生成された翻訳文(第2の言語)とを互いに関連付けたレコードを、臨時翻訳メモリのデータベースに格納する(S15)。この臨時翻訳メモリは既存の翻訳メモリプログラムを用いて実現できる。この場合、翻訳支援装置1は、ステップS15において、再翻訳文と翻訳文とを用いて、一般的な翻訳メモリプログラムで利用されるtmx形式のデータを生成し、翻訳メモリプログラムに指示して、臨時翻訳メモリに登録させる。
【0032】
翻訳支援装置1は、ステップS11で分割して得たすべての段落の文を処理したか否かを判断し、ステップS11で分割して得た段落ごとの文のうち処理していないものがあれば、ステップS13に戻って、次の段落の文についての処理を続ける。
【0033】
翻訳支援装置1は、また、ステップS11で分割して得た段落ごとの文について再度、順次選択しつつ、次の処理を実行する。翻訳支援装置1は、選択した文を対象原文として、この対象原文をキーとして、翻訳メモリのデータベースと、臨時翻訳メモリのデータベースとを検索する。ここでは翻訳支援装置1は、臨時翻訳メモリのデータベースに格納された各レコードの再翻訳文と、キーとなった対象原文との間のBLEUスコアS1と、RIBEスコアS2とを用い、適合率Sを、
【数1】
として求める(S16)。なお、重みa,bは予め実験的に定めておく。
【0034】
同様に、翻訳支援装置1は、翻訳メモリのデータベースに格納された各レコードの過去原文と、キーとなった対象原文との間のBLEUスコアS1と、RIBEスコアS2とを用い、適合率Sを、ステップS16で用いた数式と同じ数式により求める(S17)。
【0035】
翻訳支援装置1は、ステップS16及びS17で求めた、キーとなった対象原文との適合率が最大となっている再翻訳文または過去原文を含むレコードを取得し(S18)、当該適合率が予め定められた(ユーザの設定等により定められる)しきい値を超えているか否かを調べる(S19)。
【0036】
ここでステップS16,17で求めた適合率のうち最大のものが、上記しきい値を超えていない場合(S19:No)、翻訳支援装置1は、対象原文に対応する対訳がない旨の表示を行う(S20)。翻訳支援装置1は、この場合、図4に例示されるように、対象原文と、対訳がない旨の表示とを表示することとなる(X)。
【0037】
一方、ステップS16,17で求めた適合率のうち最大のものが、上記しきい値を超えている場合(S19:Yes)、翻訳支援装置1は、当該最大の適合率に対応する、ステップS18で取得した再翻訳文または過去原文を含むレコードの情報を表示する(S21)。この表示には、図4に例示したように、対象原文と、当該レコードに含まれる再翻訳文または過去原文との差分を表す情報(P)と、翻訳文(Q)と、適合率(R)とを含む。
【0038】
ここで差分は、対象原文のうち、対応する再翻訳文または過去原文と一致する部分と相違する部分とを互いに区別可能な態様で表すもので、対象原文と再翻訳文または過去原文との双方に含まれる部分と、対象原文に含まれるが、再翻訳文または過去原文に含まれない部分と、対象原文に含まれないが、再翻訳文または過去原文に含まれる部分とをそれぞれ互いに異なる色で着色したものとしてよい。このような差分の情報は、広く知られた差分抽出処理(例えばdiff等のツールの処理)を用いて得られるので、ここでの詳しい説明は省略する。
【0039】
翻訳支援装置1は、ステップS16で分割して得たすべての段落の文を処理したか否かを判断し、ステップS11で分割して得た段落ごとの文のうち処理していないものがあれば、ステップS16に戻って、次の段落の文についての処理を続ける。
【0040】
翻訳支援装置1のこの処理により、例えば日本語の文書を英語の文書に翻訳する際に、文書の各段落を原文として、当該原文を機械翻訳した結果が得られるとともに、当該原文に類似する再翻訳文または過去原文と原文との差分、及び、当該原文に類似する再翻訳文または過去原文に対応して翻訳メモリ(臨時翻訳メモリを含む)に登録された翻訳文が、原文に対する再翻訳文または過去原文の適合率とともに提示される。これにより機械翻訳の貢献等が定量的に評価される。
【0041】
なおこのとき、第n段落目(n=1,2,…)の原文について、当該第n段落目の原文の機械翻訳結果が必ずしも提示されるとは限られず、第n段落目とは異なる段落の、より機械翻訳に適した類似の原文の機械翻訳結果が提示されることもあり、また、翻訳メモリに登録された過去の翻訳文が提示されることもあり得る。
【0042】
[複数の機械翻訳]
またここまでの説明では、翻訳支援装置1は、原文の機械翻訳を生成する際に、一つの機械翻訳プログラムを利用することとしたが、本実施の形態はこれに限られない。
【0043】
本実施の形態の別の例では、翻訳支援装置1は、図5のステップS13の処理において、複数の互いに異なる機械翻訳プログラムにより、対象原文を、その第1の言語とは異なる第2の言語の翻訳文にそれぞれ機械翻訳する。
【0044】
さらにこのときにはステップS14において、翻訳支援装置1は、ステップS13で生成した各翻訳文を、それぞれの翻訳文を生成した機械翻訳プログラムと同じプログラムを用いて、第1の言語で記述された再翻訳文にそれぞれ機械翻訳する。
【0045】
そして翻訳支援装置1は、ステップS15において、このステップS14で得た再翻訳文のそれぞれを、対応する翻訳文に関連付けた複数のレコードを生成し、臨時翻訳メモリのデータベースに格納する。
【0046】
この例によると、翻訳支援装置1は、複数の機械翻訳プログラムにより得られた翻訳結果の再翻訳文と対象原文との比較により適合率を求め、対象原文ごとに、当該対象原文に対する適合率が最大で、かつ所定のしきい値を超える再翻訳文と、対応する翻訳文と、適合率とが提示される。
【0047】
[適合率の利用例]
本実施の形態の適合率は、そのまま用いられなくてもよい。例えば適合率を複数の適合率範囲に区分してもよい。具体的に本実施の形態のある例では、翻訳支援装置1は、図4に例示した表示において、例えば適合率範囲を
101%(対象原文と、再翻訳文または過去原文とが完全に一致した場合)
100%(完全一致ではないが、演算された適合率が99%を超える場合)
95-99%(演算された適合率が95%を超え、99%以下)
85-94%(演算された適合率が85%を超え、94%以下)

0-50%(演算された適合率が0%を超え、50%以下)
一致せず(演算された適合率が0%の場合)
のように定義し、適合率を、定義された適合率範囲のいずれかに分類して表示してもよい。
【0048】
またこのように分類したときには、各適合率範囲に対応した基準(例えば課金率)により課金額等を算出してもよい。一例として101%または100%の場合、課金率を30%、「95-99%」の場合、課金率を50%、…、74%以下では課金率を0%と設定し、翻訳者がこの翻訳支援装置1を利用したときに請求可能な翻訳料の上限を、翻訳支援装置1を利用しない場合の翻訳料に、上記課金率を乗じた額(すなわち残額の少なくとも一部を翻訳支援装置1の使用料)とするなどといった演算が可能となる。
【0049】
[実施例]
本実施の形態の翻訳支援装置1の効果を、実際の翻訳業務に即して測定した結果を次に示す。翻訳対象となる第1の言語での文書を段落(セグメント)ごとに分割して機械翻訳を生成し、当該機械翻訳結果または過去の翻訳結果を提示するとともに、既に説明した方法で適合率を提示する。
【0050】
まず、従来の方法では、機械翻訳での適合率は演算できないので、機械翻訳の結果を利用できる場合でも適合率は「0%」として扱われ、翻訳メモリに、原文に完全に一致する過去の翻訳例がある場合(「101%」となる)に限り、課金率が求められる(図6(a))。この例では、翻訳メモリを利用できた段落数は「2」であり、文字数の割合は全体の7%であり、101%の課金率を30%とすると、翻訳メモリを利用しない場合の約95%が課金額となる。
【0051】
一方、本実施の形態の翻訳支援装置1を用いた場合、単一の機械翻訳プログラムを利用した例(図6(b))では、適合率は50乃至100%の範囲に分布し、全体として約85%の課金額となった。
【0052】
さらに複数の機械翻訳プログラムを用いる本実施の形態の翻訳支援装置1では、約79%の課金額となった(図6(c))。
【0053】
このように本実施の形態によれば、原文と翻訳結果の逆翻訳との対比により適合率を求めることができ、機械翻訳の貢献等が定量的に評価可能となって、課金等の処理に応用可能となる。
【符号の説明】
【0054】
1 翻訳支援装置、11 制御部、12 記憶部、13 操作部、14 表示部、15 通信部、21 受入部、22 原文取得部、23 機械翻訳処理部、24 逆翻訳部、25 登録部、26 翻訳メモリ検索部、27 適合率演算部、28 出力処理部。
図1
図2
図3
図4
図5
図6