IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本特許翻訳株式会社の特許一覧

<>
  • 特開-翻訳支援装置及びプログラム 図1
  • 特開-翻訳支援装置及びプログラム 図2
  • 特開-翻訳支援装置及びプログラム 図3
  • 特開-翻訳支援装置及びプログラム 図4
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2025005833
(43)【公開日】2025-01-17
(54)【発明の名称】翻訳支援装置及びプログラム
(51)【国際特許分類】
   G06F 40/47 20200101AFI20250109BHJP
【FI】
G06F40/47
【審査請求】未請求
【請求項の数】4
【出願形態】OL
(21)【出願番号】P 2023106225
(22)【出願日】2023-06-28
(71)【出願人】
【識別番号】517163249
【氏名又は名称】日本特許翻訳株式会社
(74)【代理人】
【識別番号】100122275
【弁理士】
【氏名又は名称】竹居 信利
(72)【発明者】
【氏名】本間 奨
(57)【要約】
【課題】指定語を指定訳語とした自然な訳文を得ることのできる翻訳支援装置及びプログラムを提供する。
【解決手段】言語での指示に基づいて、文を生成するよう機械学習された状態にある生成モデル情報を用いた文生成処理結果を取得する翻訳支援装置であって、機械翻訳により得られた、原文と訳文とを含む対訳情報を取得し、原文の言語での指定語と、翻訳文の言語での対応する指定訳語とを関連付けて保持する用語データベースを参照して、対訳情報の訳文を、当該対訳情報の原文に含まれる指定語が当該指定語に関連づけて用語データベースに保持された指定訳語で訳された文とするべき旨の指示を生成し、上記生成モデル情報を用いて得られた文生成処理結果である文を、修正訳文情報として取得する。
【選択図】図1


【特許請求の範囲】
【請求項1】
言語での指示に基づいて、文を生成するよう機械学習された状態にある生成モデル情報を用いた文生成処理結果を取得する生成情報取得手段と、
機械翻訳により得られた、原文と訳文とを含む対訳情報を取得する取得手段と、
原文の言語での指定語と、翻訳文の言語での対応する指定訳語とを関連付けて保持する用語データベースを参照し、前記対訳情報の訳文を、当該対訳情報の原文に含まれる指定語が当該指定語に関連づけて用語データベースに保持された指定訳語で訳された文とするべき旨の指示を生成する指示生成手段と、
前記生成された指示を、前記生成情報取得手段に供して、当該生成情報取得手段が取得した文生成処理結果である文を、修正訳文情報として取得する修正訳文取得手段と、
を含み、当該修正訳文取得手段が取得した修正訳文情報が、所定の翻訳作業支援処理に供される翻訳支援装置。
【請求項2】
請求項1に記載の翻訳支援装置であって、
第1の言語での原文情報を受け入れて、当該原文情報を所定のセグメント単位に分割し、当該分割して得られたセグメント単位ごとに、第2の言語での訳文を生成して、当該対応するセグメント単位を原文として、生成した訳文に関連付けて記録した対訳情報を生成する翻訳手段をさらに含み、
この翻訳手段が、前記生成モデル情報とは異なる機械学習モデルを用いて、前記第1の言語でのセグメント単位から第2の言語での訳文を生成する翻訳支援装置。
【請求項3】
請求項1に記載の翻訳支援装置であって、
前記指示生成手段は、前記対訳情報に含まれる、互いに対応する原文と訳文とのそれぞれについて、
原文に、前記用語データベースに格納された指定語が含まれ、かつ、
訳文に、当該指定語に対応する指定訳語が含まれない
場合に、前記対訳情報の訳文を、当該指定語が当該指定語に関連づけて用語データベースに保持された指定訳語で訳された文とするべき旨の指示を生成する翻訳支援装置。
【請求項4】
コンピュータを、
言語での指示に基づいて、文を生成するよう機械学習された状態にある生成モデル情報を用いた文生成処理結果を取得する生成情報取得手段と、
機械翻訳により得られた、原文と訳文とを含む対訳情報を取得する取得手段と、
原文の言語での指定語と、翻訳文の言語での対応する指定訳語とを関連付けて保持する用語データベースを参照し、前記対訳情報の訳文を、当該対訳情報の原文に含まれる指定語が当該指定語に関連づけて用語データベースに保持された指定訳語で訳された文とするべき旨の指示を生成する指示生成手段と、
前記生成された指示を、前記生成情報取得手段に供して、当該生成情報取得手段が取得した文生成処理結果である文を、修正訳文情報として取得する修正訳文取得手段と、
として機能させ、当該修正訳文取得手段が取得した修正訳文情報を、所定の翻訳作業支援処理に供するようコンピュータを制御するプログラム。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、翻訳支援装置及びプログラムに関する。
【背景技術】
【0002】
近年では、翻訳作業を支援するために、用語データベース、翻訳メモリ、さらに機械翻訳ソフトウェアを統合した技術が広く利用されるようになってきている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】中国特許出願公開第108984540号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来の機械翻訳ソフトウェアは、機械学習モデルを用いて原文を翻訳するものであり、予め指定された語(指定語)を、特定の訳語(指定訳語)とする、といった設定ができない。このため、翻訳のために指定訳語が指示されている指定語がある場合、翻訳者自身が機械翻訳された訳文を編集する必要がある。
【0005】
特許文献1には、翻訳プロセスにおける翻訳結果内の特殊用語の自動検索およびマッチングを自動的に行うとする技術が開示されている。しかし特許文献1に開示の技術では、指定語に対応する訳語が指定訳語でない場合に、当該訳語を指定訳語にそのまま置き換えてしまうため、その置き換えが妥当でない場合、誤訳となってしまうなどといった問題点があった。
【0006】
本発明は上記実情に鑑みて為されたもので、機械翻訳等で得られた対訳情報を参照し、翻訳結果に、指定語に対応する訳語であって、指定訳語となっていない訳語がある場合に、翻訳結果を利用しつつ、指定語を指定訳語とした自然な訳文を得ることのできる翻訳支援装置及びプログラムを提供することを、その目的の一つとする。
【課題を解決するための手段】
【0007】
上記従来例の問題点を解決する本発明の一態様は、翻訳支援装置であって、言語での指示に基づいて、文を生成するよう機械学習された状態にある生成モデル情報を用いた文生成処理結果を取得する生成情報取得手段と、機械翻訳により得られた、原文と訳文とを含む対訳情報を取得する取得手段と、原文の言語での指定語と、翻訳文の言語での対応する指定訳語とを関連付けて保持する用語データベースを参照し、前記対訳情報の訳文を、当該対訳情報の原文に含まれる指定語が当該指定語に関連づけて用語データベースに保持された指定訳語で訳された文とするべき旨の指示を生成する指示生成手段と、前記生成された指示を、前記生成情報取得手段に供して、当該生成情報取得手段が取得した文生成処理結果である文を、修正訳文情報として取得する修正訳文取得手段と、を含み、当該修正訳文取得手段が取得した修正訳文情報が、所定の翻訳作業支援処理に供されることとしたものである。
【発明の効果】
【0008】
本発明によると、既に行われた翻訳結果を利用しつつ、指定語を指定訳語とした自然な訳文を得ることができる。
【図面の簡単な説明】
【0009】
図1】本発明の実施の形態に係る翻訳支援装置の例を表す構成ブロック図である。
図2】本発明の実施の形態に係る翻訳支援装置の例を表す機能ブロック図である。
図3】本発明の実施の形態に係る翻訳支援装置が用いる対訳情報の例を表す説明図である。
図4】本発明の実施の形態に係る翻訳支援装置の動作例を表すフローチャート図である。
【発明を実施するための形態】
【0010】
本発明の実施の形態について図面を参照しながら説明する。本発明の実施の形態に係る翻訳支援装置1は、図1に例示するように、一般的なコンピュータシステムによって実現され、例えば制御部11と、記憶部12と、操作部13と、表示部14と、通信部15とを含んで構成される。
【0011】
制御部11は、CPUなどのプログラム制御デバイスであり、記憶部12に格納されたプログラムに従って動作する。本実施の形態の一例では、この制御部11は、機械翻訳により得られた、原文と訳文とを含む対訳情報(例えばいわゆるXLIFF(XML Localization Interchange File Format)データ)を取得して記憶部12に保持する。またこの制御部11は、原文の言語での指定語と、翻訳文の言語での対応する指定訳語とを関連付けて保持する用語データベースを参照し、上記対訳情報の訳文を、当該対訳情報の原文に含まれる指定語が当該指定語に関連づけて用語データベースに保持された指定訳語で訳された文とするべき旨の指示を生成する。
【0012】
この指示は、いずれかの言語で記述され、この指示を入力として、文を生成し、当該生成した文を出力するよう機械学習された状態にある生成モデル情報を用いた文生成処理結果を取得する処理に供される。具体的にこの処理は、オープンAI社のChatGPT(登録商標)に対して当該指示を入力し、当該ChatGPTが生成した文を取得することで実現できる。この例ではChatGPTに対して指示を送出し、その生成した文を取得する処理を行う制御部11が、本発明の生成情報取得手段に相当する。
【0013】
制御部11は、当該取得した文生成処理結果である文を、修正訳文情報として出力するなどして、翻訳作業支援処理に供する。これらの制御部11の動作については、変形例を含め、後に説明する。
【0014】
記憶部12は、メモリデバイスやディスクデバイス等であり、制御部11によって実行されるプログラムを保持する。このプログラムは、コンピュータ可読かつ非一時的な記録媒体に格納されて提供されて、この記憶部12に複写されたものであってよい。またこの記憶部12は、制御部11のワークメモリとしても動作する。
【0015】
本実施の形態では記憶部12に、原文の言語での指定語と、翻訳文の言語での対応する指定訳語とを関連付けて保持する用語データベースが保持される。
【0016】
操作部13は、マウスやキーボードなどを含む。この操作部13は、翻訳支援装置1のユーザの指示を受け入れて、当該受け入れた指示の内容を表す情報を、制御部11に出力する。表示部14は、ディスプレイ装置等であり、制御部11から入力される指示に従い、情報を表示する。
【0017】
通信部15は、ネットワークインタフェース等であり、制御部11から入力される指示に従って、外部のサーバR(例えば上述のChatGPTのサービスを提供するサーバなど)との間で情報を送受する。
【0018】
次に制御部11の動作の例について説明する。本実施の形態の一例において制御部11は、記憶部12に格納されたプログラムを実行することで、図2に例示するように、生成情報取得部20と、対訳情報取得部30と、一致判定部31と、指示生成部32と、修正訳文取得部33と、出力処理部34と、を含んで構成される。
【0019】
生成情報取得部20は、所定の言語で記述された指示を入力として、文を生成し、当該生成した文を出力するよう機械学習された状態にある生成モデル情報を用いた文生成処理結果を取得する処理(生成AIによる処理)を実行する。一例としてこの生成情報取得部20は、既に述べたように、オープンAI社のChatGPTサーバに対して後に説明する指示生成部32が生成した指示を送出し、当該ChatGPTサーバにて生成された文を取得する。この処理は、ChatGPTのAPI(Application Program Interface)をコールする、広く知られた方法で実現できる。
【0020】
もっとも、本実施の形態の生成情報取得部20はこの例に限られるものではなく、制御部11自身が所定の言語で記述された指示を入力として、文を生成し、当該生成した文を出力するよう機械学習された状態にある生成モデル情報を用いた文生成処理を実行してもよい。
【0021】
対訳情報取得部30は、機械翻訳された原文と訳文とを含む対訳情報を取得する。本実施の形態の一例では、制御部11が、第1の言語(例えば日本語)で記述された原文情報を受け入れて当該原文情報を所定のセグメント単位に分割し、当該分割して得られたセグメント単位ごとに、第2の言語での訳文を生成して、当該対応するセグメント単位を原文として、生成した訳文に関連付けて記憶部12に記録し(この記録は例えばXLIFFなど広く知られた形式で行われてよい)、対訳情報を生成する。
【0022】
ここでの例において機械翻訳は、第1の言語で記述された原文を入力とし、当該原文に対応する第2の言語(第1の言語とは異なる言語)で記述された訳文を出力するよう機械学習されたものであり、指示(いわゆるプロンプト)に応じて翻訳文に相当する文を生成するものとは異なる機械学習モデルを用いたものである。このような機械翻訳は、NMT(Neural Machine Translation)等として広く知られたものがある。
【0023】
本実施の形態の一例では、この対訳情報は、図3にその概要を示すように、原文情報に含まれるセグメント単位ごとに、識別情報(文ごとに固有の連番でよい)Nと、原文(S)と、原文の機械翻訳結果である訳文(T)とを互いに関連付けたものであるとする。
【0024】
この例では、対訳情報取得部30は、制御部11が生成して記憶部12に格納した対訳情報をそのまま処理の対象として取得する。
【0025】
また本実施の形態の別の例では、この対訳情報取得部30は、他のコンピュータでの機械翻訳処理で得られた対訳情報(この例でもXLIFFの形式としてよい)を、ネットワークを介して取得する。
【0026】
一致判定部31は、対訳情報取得部30が取得した対訳情報を参照して次の処理を行う。この一致判定部31は、対訳情報に含まれる、セグメント単位の原文のそれぞれについて、当該原文に用語データベースに格納された指定語が含まれるか否かを判断する。一致判定部31は、当該原文に、用語データベースに格納された指定語が含まれると判断すると、当該原文に対応して対訳情報に含まれる訳文(対応訳文と呼ぶ)に、当該含まれると判断した指定語に対応する指定訳語が含まれるか否かを調べる。
【0027】
一致判定部31は、ここで対応訳文に、原文から見いだされた指定語に対応する指定訳語が含まれないと判断すると、指示生成部32に対して、対応訳文に関連付けられた識別情報と、見いだした指定語と、対応する指定訳語と、を出力して指示を生成させる。
【0028】
つまりこの一致判定部31は、対訳情報に含まれる、互いに対応する原文と訳文(対応訳文)とのそれぞれについて、
(1)原文に、用語データベースに格納された指定語が含まれ、かつ、
(2)対応訳文に、当該指定語に対応する指定訳語が含まれない
場合に、指示生成部32に対して識別情報と、見いだした指定語と、対応する指定訳語と、を出力して指示を生成させる。上記(1)かつ(2)の条件を満足しない場合、一致判定部31は、次のセグメント単位の原文について上記判断の処理を繰り返す。
【0029】
指示生成部32は、一致判定部31から識別情報と、見いだした指定語と、対応する指定訳語と、の入力を受けて、生成情報取得部20に出力する指示を生成する。この指示生成部32は、入力された識別情報に関連付けて対訳情報に記録されている訳文を、入力された指示語(当該識別情報に関連付けられた対訳情報の原文に含まれる指定語)が、当該指定語に関連づけて用語データベースに保持された指定訳語で訳された文とするべき旨の指示を生成する。
【0030】
具体的な例の一つとして、この指示生成部32は、
「[対応訳文]を、[指定語]が[指定訳語]で訳されている文で置き換える」
べき旨の指示を生成する。例えば対応する日英翻訳の機械翻訳の訳文が、
Translation support devices display machine-translated text and its corresponding original text associated with each other in response to user instructions.
(原文:翻訳支援装置は、ユーザからの指示に応じて、機械翻訳した文と、対応する原文とを互いに関連付けて表示する。)
というものであるとき、用語データベースに、
指定語:翻訳支援装置
指定訳語:translation assistance apparatus
として記録されているときには、
「Replace the following English text and appropriately add an indefinite article or a definite article wherein the word “翻訳支援装置” is translated as “translation assistance apparatus”: "Translation support devices display machine-translated text and its corresponding original text associated with each other in response to user instructions."」
として指示を生成する。
【0031】
修正訳文取得部33は、指示生成部32が生成した指示を、生成情報取得部20に出力する。そして修正訳文取得部33は、生成情報取得部20が出力する、文生成処理の結果として得られた文を、一致判定部31が出力した識別情報に関連付けて対訳情報に含まれる訳文(対応訳文)に係る修正訳文情報として次のような修正文を取得する:
A translation assistance apparatus displays machine-translated text and its corresponding original text associated with each other in response to user instructions.
【0032】
なお、一般に指定語を指定訳語とする用語データベースに冠詞は含めない。これは、従来、訳文全体でみて単複表現をどうするか、単数の場合、定冠詞とするか不定冠詞とするかなどは翻訳支援ツールの対訳エディター上で翻訳者が適切に判断して訳語および前後の訳文の調整作業を行っていたのに対し、生成モデルを用いた修正文(生成AIによる修正文)は、指定訳語に冠詞を付与すべきかどうか、付与する場合は不定冠詞または定冠詞のいずれが適切か、単数または複数のいずれが適切かといった判断を生成AIが行うためである。これにより、従来の単純な訳語置換では成し得ない修正文を生成することが可能となっている。
【0033】
また別の具体的な例として、英日翻訳の場合、対応する機械翻訳の訳文が:
彼は、いつの日か自分の子供ができたときに、それをゆりかごとして非常によく使うことができると思った。
(原文:He thought he could use it very well as a cradle, some day when he had children of his own.)
というものであるとき、用語データベースに、
指定語:use it very well
指定訳語:うまく使える
が記録されているときには、指示生成部32は、
Replace the following Japanese text and show only corrected text wherein the word “use it very well” is translated as “うまく使える”.:「彼は、いつの日か自分の子供ができたときに、それをゆりかごとして非常によく使うことができると思った。」
とした指示を生成することとなる。
【0034】
そして修正訳文取得部33が、指示生成部32が生成した指示を、生成情報取得部20に出力し、修正訳文取得部33は、生成情報取得部20が出力する、文生成処理の結果として得られた文を、一致判定部31が出力した識別情報に関連付けて対訳情報に含まれる訳文(対応訳文)に係る修正訳文情報として次のような修正文を取得する:
「彼は、いつの日か自分の子供ができたときに、それをゆりかごとしてうまく使えると思った。」
【0035】
従来、指定語を指定訳語とする用語データベースに動詞や副詞がある場合、機械的に訳語を置き換えることはできなかった。このため従来は、動詞や副詞を含む訳語は翻訳支援ツールの対訳エディター上で翻訳者が適切に判断して訳語および前後の訳文の調整作業を行っていた。一方、生成AIを用いた修正文は、指定訳語が動詞や副詞であってもどの部分を置き換えるべきかを生成モデルを用いて得られる修正文では、動詞や副詞を置き換える場合であっても、周辺の語を機械学習の結果に基づいて修正された結果を生成する。これにより、従来の機械的な置換では成し得ない動詞や副詞からなる訳語を含む修正文を生成することが可能となっている。
【0036】
出力処理部34は、修正訳文情報と、対応する識別情報との入力を受けて、修正訳文情報を、所定の翻訳作業支援処理に供する。具体的にこの出力処理部34は、対訳情報取得部30が取得した対訳情報における、修正訳文取得部33から入力された識別情報に関連付けられている訳文を、修正訳文情報に置き換えて、対訳情報を更新する。
【0037】
翻訳者がこの更新された対訳情報を表示すると、機械翻訳により得られた訳文に代えて、当該機械翻訳された訳文を、生成モデル情報を用いた処理により書き換えた修正訳文情報が表示部14に表示される。このとき、翻訳支援装置1は、対応する原文を併せて表示してもよい。
【0038】
[動作]
本実施の形態は以上の構成を備えており、次の例のように動作する。ここでの説明では、第1言語としての和文(日本語による原文情報)を、第2言語としての英語での訳文情報に翻訳する場合を例とする。もっともこれは一例であり、言語は日本語や英語等に限られない。
【0039】
また以下の例では、所定の言語で記述された指示を入力として、文を生成し、当該生成した文を出力するよう機械学習された状態にある生成モデル情報を用いた文生成処理結果を得る処理は、外部のサーバによって行われるものとし、その際には、本実施の形態の翻訳支援装置1は、APIにより上記サーバに指示を送出して呼び出しを行い、文生成処理結果を当該サーバから受信して取得するものとする。
【0040】
さらに用語データベースには、予め、第1言語で表された語であって、特定の第2言語の訳語に置き換えるべき語を指定語とし、置き換えるべき訳語を指定訳語として対応付けた情報が格納されているものとする。つまり、既に例示したように、この用語データベースには、
{指定語:翻訳支援装置,指定訳語:translation assistance apparatus},
{指定語:生成AI,指定訳語:Generative AI}

などのエントリが格納されている。
【0041】
翻訳支援装置1のユーザは、原文情報を翻訳支援装置1に入力する。翻訳支援装置1は、この原文情報を、所定のセグメント単位(例えば段落の単位や文ごと、以下では段落の単位を例とし、セグメント単位を段落の語で置き換えて説明する)に分割し、当該分割して得られた段落ごとに、第2の言語である英語の訳文を生成する。この機械翻訳の処理は一般的なNMTによって行われるものとしてよい。そして翻訳支援装置1は、段落ごとに発行した固有の識別情報(ここでは段落番号;N)と、原文情報のうちの当該段落に含まれる部分(原文;S(N))と、対応して生成した訳文(T(N))とを互いに関連付けて、XLIFFの形式で対訳情報として記録する(図3)。以下、識別情報Nに対応する原文をS(N)、識別情報Nに対応する訳文をT(N)と表記する。
【0042】
次に、翻訳支援装置1は、得られた対訳情報を読み出して次の図4に例示する処理を開始する。図4に例示するように、翻訳支援装置1は、対訳情報に含まれる識別情報を順次、処理の対象として選択しつつ以下の処理を繰り返す(S11)。
【0043】
すなわち翻訳支援装置1は、処理の対象となった識別情報Nに関連付けられた原文S(N)を参照し、この原文S(N)に、用語データベースに格納された指定語Wが含まれ、かつ、対応訳文T(N)に、当該指定語Wに対応する指定訳語TWが含まれない、との条件(指定語一致条件と呼ぶ)を満足するか指定語があるか否かを判断する(一致判定;S12)。
【0044】
ここで指定語一致条件が満足される指定語があると判断すると(S12:Yes)、翻訳支援装置1は、処理の対象としている段落の識別情報(N)と、ステップS12で見いだした指定語Wと、対応する指定訳語TWとを用いて、生成モデル情報を用いた文生成処理を行う外部のサーバへの指示を生成する(S13)。
【0045】
既に述べた例のように、対訳情報のある段落(n)において、
原文S(n):翻訳支援装置は、ユーザからの指示に応じて、機械翻訳した文と、対応する原文とを互いに関連付けて表示する。
に対応して
訳文T(n):Translation support devices display machine-translated text and its corresponding original text associated with each other in response to user instructions.
が含まれる場合、原文S(n)において用例データベースに含まれる指定語Wである「翻訳支援装置」が含まれているのに、訳文T(n)には、対応する指定訳語TWである「A translation assistance apparatus」が含まれないため、翻訳支援装置1は、ステップS12において指定語一致条件が満足されたと判断し、ステップS13にて当該段落の識別情報nに関連付けられた訳文T(n)を用いて、指示:
「Replace the following English text:”Translation support devices display machine-translated text and its corresponding original text associated with each other in response to user instructions.” wherein the word “翻訳支援装置” is translated as “A translation assistance apparatus”」
を生成する。もっともこの指示は一例であり、「訳文T(N)において、指定語Wが指定訳語TWで翻訳されるべき」旨とともに、訳文T(N)を書き直すよう指示する趣旨であれば、他の表現であってもよい。
【0046】
翻訳支援装置1は、ステップS13で生成した指示を、生成モデル情報を用いた文生成処理を行う外部のサーバへ送出して文生成処理を行わせ、その文生成処理の結果を、修正訳文情報として取得する(S14)。
【0047】
そして翻訳支援装置1は、処理の対象としている段落の識別情報Nに関連付けて対訳情報に含まれる訳文TW(N)を、ステップS14で取得した修正訳文情報に置き換えて、対訳情報を更新する(S15)。
【0048】
なお、ステップS12において指定語一致条件を満足する指定語が原文及び対応訳文中にないと判断したとき(S12:No)には、翻訳支援装置1は、ステップS13乃至S15の処理をスキップして実行しない。
【0049】
翻訳支援装置1は、対訳情報に含まれる各段落についてステップS12からS15の処理を繰り返して実行し、すべての段落についての処理を終了すると、当該更新された対訳情報を表示部14に表示出力する。
【0050】
これにより翻訳者であるユーザは、機械翻訳の結果を利用しつつ、指定語を指定訳語とした自然な訳文を参照可能となる。
【0051】
[複数の指定語が見いだされる場合]
また、上記処理においては、一組の指定語Wと、対応する指定訳語TWとを用いた処理が行われる例について説明したが、ステップS12において指定語一致条件を満足する指定語Wと指定訳語TWとの組が一組であるとは限らない。
【0052】
例えば、上記の用語データベースの登録例がある場合において、
原文:「翻訳支援装置は、機械翻訳した英文と生成AIが生成した英文とを比較する。」
に対して
対応訳文:Translation support devices compare machine-translated English text with English text generated by AI.
となっている場合、
{指定語:翻訳支援装置,指定訳語:A translation assistance apparatus},
{指定語:生成AI,指定訳語:Generative AI}
の2つの組について指定語一致条件を満足すると判断されることとなる。
【0053】
この場合、翻訳支援装置1は、
(a)当初は、ある指定語一致条件を満足する指定語について、当該指定語が指定訳語で翻訳しつつ、対応訳文を修正するべき旨の指示を生成して生成モデル情報を用いて文生成処理結果を得、その後は、指定語一致条件を満足する各指定語について順次、直前に、生成モデル情報を用いて得られた文生成処理結果において、当該指定語が指定訳語で翻訳しつつ、当該直前に得た文生成処理結果をさらに修正するべき旨の指示を生成して生成モデル情報を用いて文生成処理結果を得るという処理を繰り返してもよい。
【0054】
また、翻訳支援装置1は、
(b)複数の指定語のそれぞれが、それぞれに対応する指定訳語で翻訳されるべきであるとして、対応訳文を修正するべき旨の指示を生成して生成モデル情報を用いて文生成処理結果を得てもよい。
【0055】
前者(a)の場合、上述の例では、翻訳支援装置1は、まず、
「Replace the following English text:”Translation support devices compare machine-translated English text with English text generated by AI.” wherein the word “翻訳支援装置” is translated as “A translation assistance apparatus”」
といった指示を生成して、生成モデル情報を用いた文生成処理結果:
A translation assistance apparatus compares machine-translated English text with English text generated by AI.
を得、次に、もう一つの指定語一致条件を満足する指定語である「生成AI」について、
「Replace the following English text:”A translation assistance apparatus compares machine-translated English text with English text generated by AI.” wherein the word “生成AI” is translated as “Generative AI”」
といった指示を生成して、この指示により生成モデル情報を用いて生成される文生成処理結果:
A translation assistance apparatus compares machine-translated English text with English text generated by a generative AI.
を得る。
【0056】
また、上記(b)の処理の場合、翻訳支援装置1は、
「Replace the following English text:”Translation support devices compare machine-translated English text with English text generated by AI.” wherein the word “翻訳支援装置” is translated as “A translation assistance apparatus”, and the word “生成AI” is translated as “Generative AI”」
といった指示を生成して、この指示により生成モデル情報を用いて生成される文生成処理結果:
A translation assistance apparatus compares machine-translated English text with English text generated by a generative AI.
を得る。
【0057】
もっとも前者(a)では、2回目以降の処理において、先行する処理で指定語に対応して置き換えられた指定訳語が、さらに別の訳語に置き換えられてしまう場合があり、後者(b)のように指示が冗長となる場合は、生成モデル情報を用いた処理において負荷がかかる場合がある。そこで翻訳支援装置1は、例えば、指定語一致条件を満足する指定語Wと指定訳語TWとの組が予め定めたしきい値より少ない場合に(b)の処理を行い、そうでないときに(a)の処理を行う、といったように上記の処理を組み合わせて用いてもよい。
【0058】
[実施形態の効果]
日本語から英語への翻訳の場合、従来技術では、名詞や名詞句の訳語に冠詞をどのように付与すべきか、また単数形・複数形の語尾の変化への対応などが対応できず、指定用語を指定訳語として単純置換することしかできない課題があった。また、動詞や副詞を含む訳語の場合、従来技術の訳語置換では、訳語の後の文言の調整が必要となる場合は誤訳となっていた。本実施の形態では、名詞の場合の適切な冠詞の付与や単数形・複数形への語尾変化や動詞や副詞の場合の文言調整にも適切に対応が可能となった。
【0059】
ニューラルネットワークによる機械翻訳により、非常に大きな精度改善が行われたが、汎用的な機械翻訳エンジンでは、平均的な訳語となるため、分野特有の用語に適応できないという課題は現在でも解決されていない。また、訳語は文単位で決められるため、文書全体としてみた場合、訳語揺れの問題があった。この問題を解決するため、翻訳支援ツールを用いて、原文と機械翻訳文の対訳上に用語データベースの原文用語が一致するセグメントには、原文中の該当用語をハイライト表示するとともに、用語データベースの訳語を表示し、翻訳者が冠詞や単複への対応、あるいは動詞や副詞の場合の訳文の調整を行って、訳文を修正するといった作業を行っていた。
【0060】
本実施の形態の翻訳支援ツールでは、原文と機械翻訳文の対訳上に用語データベースの原文用語が一致するセグメントには用語データベースの訳語を適切に表示するため、翻訳者による訳語調整の作業が不要となる。この結果、翻訳者による機械翻訳文のポストエディットの中心となる訳語修正作業が効率化されるため、翻訳生産性が飛躍的に向上する。
【符号の説明】
【0061】
1 翻訳支援装置、11 制御部、12 記憶部、13 操作部、14 表示部、15 通信部、20 生成情報取得部、30 対訳情報取得部、31 一致判定部、32 指示生成部、33 修正訳文取得部、34 出力処理部。
図1
図2
図3
図4