(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022181151
(43)【公開日】2022-12-07
(54)【発明の名称】翻訳方法及び翻訳装置
(51)【国際特許分類】
G06F 40/44 20200101AFI20221130BHJP
G10L 15/00 20130101ALI20221130BHJP
G10L 13/00 20060101ALI20221130BHJP
G06F 40/58 20200101ALI20221130BHJP
【FI】
G06F40/44
G10L15/00 200C
G10L13/00 100G
G06F40/58
【審査請求】有
【請求項の数】9
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2021112897
(22)【出願日】2021-07-07
(31)【優先権主張番号】110118893
(32)【優先日】2021-05-25
(33)【優先権主張国・地域又は機関】TW
(71)【出願人】
【識別番号】518040688
【氏名又は名称】仁宝電脳工業股▲ふん▼有限公司
【氏名又は名称原語表記】COMPAL ELECTRONICS, INC.
【住所又は居所原語表記】No. 385, Yangguang St., Neihu District, Taipei City 11491, Taiwan
(74)【代理人】
【識別番号】110001139
【氏名又は名称】SK弁理士法人
(74)【代理人】
【識別番号】100130328
【弁理士】
【氏名又は名称】奥野 彰彦
(74)【代理人】
【識別番号】100130672
【弁理士】
【氏名又は名称】伊藤 寛之
(72)【発明者】
【氏名】湯道文
【テーマコード(参考)】
5B091
【Fターム(参考)】
5B091AA01
5B091CB12
5B091CB32
5B091CD11
5B091EA01
(57)【要約】 (修正有)
【課題】多言語間の音声翻訳におけるリソース消費を大幅に削減し、メモリ使用率を有効に向上させる翻訳方法及び翻訳装置提供する。
【解決手段】方法は、翻訳装置を提供するステップと、第一言語に対応する第一会話音声を入力するステップと、第一会話音声を通用言語内容に変換するステップと、通用言語内容を第二言語に対応する第二会話音声に変換するステップと、第二会話音声を出力するステップとを含む。
【効果】任意の言語を通用言語に変換し、次に通用語言を任意の目標言語に変換し、簡単な設定で多言語の翻訳及び会話を実現可能である。
【選択図】
図2
【特許請求の範囲】
【請求項1】
翻訳方法であって、前記翻訳方法は、
(a)翻訳装置を提供するステップと、
(b)第一言語に対応する第一会話音声を入力するステップと、
(c)前記第一会話音声を通用言語内容に変換するステップと、
(d)前記通用言語内容を第二言語に対応する第二会話音声に変換するステップと、
(e)前記第二会話音声を出力するステップと
を含むことを特徴とする翻訳方法。
【請求項2】
前記ステップ(c)は、サブステップとして、
(c1)音声テキスト変換モジュールで前記第一会話音声を第一言語テキストに変換するステップと、
(c2)前記第一言語テキストをエンコーダに入力するステップと、
(c3)前記エンコーダで前記第一言語テキストをエンコードして前記通用言語内容に変換するステップと。
を含むことを特徴とする請求項1に記載の翻訳方法。
【請求項3】
前記ステップ(d)は、サブステップとして、
(d1)前記通用言語内容をデコーダに入力するステップと、
(d2)前記デコーダで前記通用言語内容をデコードして第二言語テキストに変換するステップと、
(d3)テキスト音声転換モジュールで前記第二言語テキストを前記第二会話音声に変換するステップと
を含むことを特徴とする請求項2に記載の翻訳方法。
【請求項4】
前記第一言語及び前記第二言語は異なる言語であり、前記通用言語内容は通用機械言語に対応し、前記通用言語内容は通用性特徴及び語義特徴を含み、前記通用性特徴は、少なくとも前記第一言語及び前記第二言語の複数の言語特徴を含み、且つ前記語義特徴は、少なくとも部分的に前記第一会話音声及び前記第二会話音声の語義に対応することを特徴とする請求項1に記載の翻訳方法。
【請求項5】
前記複数の言語特徴は、少なくとも1つの品詞特徴、少なくとも1つの意図特徴、少なくとも1つの動詞状態特徴及び少なくとも1つの時間的特徴を含むことを特徴とする請求項4に記載の翻訳方法。
【請求項6】
前記翻訳装置は、予め訓練された特定言語のエンコーダと特定言語のデコーダを含むことを特徴とする請求項1に記載の翻訳方法。
【請求項7】
前記翻訳装置は、以下のステップに従って訓練され、
(a1)予め訓練された前記特定言語のデコーダを抽出してそのパラメータを固定するステップ、
(a2)複数の他の言語のエンコーダによって出力される複数の通用性特徴及び複数の語義特徴を受信して翻訳し、前記複数の他の言語エンコーダによって出力される前記複数の通用性特徴及び前記複数の語義特徴が互いに近いように、翻訳結果に基づいて複数の通用性誤差値及び複数の語義誤差値を生成し、次に前記複数の通用性誤差値及び前記複数の語義誤差値に基づいて前記複数の他の言語のエンコーダのパラメータを調整するステップ、
(a3)再度ステップ(a2)を実施し、前記複数の通用性誤差値及び前記複数の語義誤差値の数値が、前回ステップ(a2)を実施して生成された前記複数の通用性誤差値及び前記複数の語義誤差値の数値よりも減少されているどうかかについて判断し、減少されていると判断された場合、エンコーダの訓練を完了し、減少されていないと判断された場合、再度(a3)ステップを実施するステップ、
(a4)前記複数の他の言語のエンコーダのうち1つの前記他の言語のエンコーダを選択してそのパラメータを固定するステップ、
(a5)前記ステップ(a4)で選択した前記他の言語のエンコーダの言語を受信し、前記言語を通用言語に変換し、次に前記通用言語を複数の他の言語のデコーダにそれぞれ対応する言語に翻訳し、翻訳結果に基づいて複数の翻訳誤差を算出するとともに、前記複数の翻訳誤差に基づいて対応する前記複数の他の言語のデコーダのパラメータを調整するステップ、
(a6)再度前記ステップ(a5)を実施し、前記複数の翻訳誤差の数値が、前回前記ステップ(a5)を実施して算出した前記複数の翻訳誤差の数値よりも減少されなくなっているどうかについて判断し、減少されなくなったと判断された場合、デコーダの訓練を完了し、減少されていると判断された場合、再度(a6)ステップを実施するステップ、
(a7)再度前記ステップ(a1)~前記ステップ(a6)を実施するステップ、
(a8)毎回前記エンコーダの訓練を完了して累積された通用性誤差値の総和及び語義誤差値の総和の数値が、前回前記エンコーダの訓練を完了して累積された前記通用性誤差値の総和及び前記語義誤差値の総和の数値よりも減少されているかどうかについて判断するステップ、
(a9)前記複数の他の言語のエンコーダ及び前記複数の他の言語デコーダの訓練を完了するステップ、
前記ステップ(a8)で減少されていると判断された場合、前記ステップ(a8)後の前記ステップ(a7)を再度実施し、前記ステップ(a8)で減少されていないと判断された場合、前記ステップ(a8)の後に前記ステップ(a9)を実施することを特徴とする請求項6に記載の翻訳方法。
【請求項8】
翻訳方法であって、
(a)第一言語に対応するエンコーダ及びデコーダを含む翻訳装置を提供するステップと、
(b)前記第一言語に対応する第一会話音声を入力するステップと、
(c)前記エンコーダで前記第一会話音声を通用言語の出力内容に変換するステップと、
(d)前記翻訳装置が前記通用言語の出力内容を外部翻訳装置に出力し、前記外部翻訳装置によって出力され且つ第二言語に対応する第二会話音声から変換された通用言語の入力内容を受信するように許可するステップと、
(e)前記デコーダで通用言語の入力内容を前記第一言語に対応する翻訳音声に変換するステップと、
(f)前記翻訳音声を出力するステップと
を含むことを特徴とする翻訳方法。
【請求項9】
翻訳装置であって、前記翻訳装置は、
制御ユニットと、
前記制御ユニットに接続され、第一言語に対応する第一会話音声を受信する音声入力ユニットと、
前記制御ユニットに接続され、前記第一会話音声を第一言語テキストに変換する音声テキスト変換モジュールと、
前記制御ユニットに接続され、前記第一言語テキストを通用言語内容に変換するエンコーダと、
前記制御ユニットに接続され、前記通用言語内容を第二言語に対応する第二言語テキストに変換するデコーダと、
前記制御ユニットに接続され、前記第二言語テキストを第二会話音声に変換するテキスト音声転換モジュールと、
前記制御ユニットに接続され、前記第二会話音声を出力する音声出力ユニットと、
を備えることを特徴とする翻訳装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、翻訳方法に関し、特に翻訳方法及び翻訳装置に関する。
【背景技術】
【0002】
従来から、翻訳作業は日常生活やビジネスにおいて、重要な役割を果たしてきた。例えば、会議や観光には翻訳が必要になる。自習で新しい言語を学ぶことはできるが、複数の言語を習得することは困難である。そのため、翻訳することが必要であり、旅行、スピーチ、多国籍企業の会議などの非政府活動を想定した場合、翻訳者と同行する可能性は低いため、実際には機械翻訳で対応することが多い。
【0003】
市販されている翻訳機を例として挙げると、翻訳する際には、まずユーザが話す言語を選択し、次に翻訳する対象の言語を選択する。そのため、特に複数の言語系の国の人が参加する場合、相手の言語に合わせて各翻訳機の設定を頻繁に変更しなければならず、使い勝手が悪い。
【0004】
図1は、従来の翻訳方法で多言語の翻訳を実施した場合の例を示す。従来の翻訳方法では、異なる言語において1対1の翻訳方法を採用していた。3人がそれぞれ中国語、英語及びスペイン語で対話すると仮定した場合、翻訳装置は会話中に中国語-英語、英語-中国語、中国語-スペイン語、スペイン語-中国語、英語-スペイン語、スペイン語-英語の6種の翻訳機を頻繁に切り替える必要があり、且つほとんどの場合、ユーザは自分で変換操作をする必要があった。なお、4人がそれぞれ中国語、英語、スペイン語及びフランス語で会話すると仮定した場合、翻訳装置は会話中に12種の翻訳機を頻繁に切り替る必要がある。具体的に、中国語を使用するユーザが会話時に英語ユーザ、スペイン語ユーザ及びフランス語を使用するユーザに
(こんにちは)と話すと、中国語の
は対応する英語である「Hello」、スペイン語の「Hola」及びフランス語の「Bonjour」等の同義語に翻訳する必要があるため、中国語-英語、中国語-スペイン語及び中国語-フランス語等の翻訳機が必要となり、英語ユーザ、スペイン語ユーザ及びフランス語を使用するユーザが回答した場合、4つの異なる言語のユーザが互いの会話内容を理解するように、それぞれの言語を他の3つの言語に翻訳する必要がある。簡単に言えば、翻訳する言語及び対象言語が多いほど、より多くの翻訳機が必要となり、ユーザの操作に影響をもたらすだけではなく、例えば演算パフォーマンス、ストレージ空間及びメモリ使用率等の翻訳装置のリソースにもかなりの負担がかかる。
【0005】
そのため、従来技術の問題点及び欠点を解決可能な翻訳方法及び翻訳装置を開発することはまだ解決されていない課題である。
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明の主な目的は、上記のような従来技術の問題点及び欠点を解決且つ改善可能な翻訳方法及び翻訳装置を提供することである。
【0007】
本発明の他の目的は、第一言語に対応する第一会話音声を通用言語内容に変換し、次に通用言語内容を第二言語に対応する第二会話音声に変換して出力することにより、任意の言語を通用言語に変換し、次に通用言語を任意の対象言語に変換することが可能になり、簡単な設定で多言語の翻訳及び会話を実現可能な翻訳方法及び翻訳装置を提供することである。
【0008】
本発明の他の目的は、通用言語内容の通用性特徴及び語義特徴により、複数の言語の共通性を説明し、異なる言語を使用する複数のユーザが複数の翻訳装置を用いて対話する時に、各翻訳装置は、多言語の翻訳及び対話を実現するために、自分の言語に対応する一組のエンコーダ及びデコーダを備えていればよい。これにより、リソース消費を大幅に削減できるだけでなく、メモリ使用率を有効に向上させることができる。
【0009】
上記の目的を達成するために、本発明の好ましい実施例により提供される翻訳方法は、(a)翻訳装置を提供するステップと、(b)第一言語に対応する第一会話音声を入力するステップと、(c)前記第一会話音声を通用言語内容に変換するステップと、(d)前記通用言語内容を第二言語に対応する第二会話音声に変換するステップと、(e)前記第二会話音声を出力するステップとを含む。
【0010】
上記の目的を達成するために、本発明の好ましい実施例により提供される翻訳方法は、(a)第一言語に対応するエンコーダ及びデコーダを含む翻訳装置を提供するステップと、(b)前記第一言語に対応する第一会話音声を入力するステップと、(c)前記エンコーダで前記第一会話音声を通用言語の出力内容に変換するステップと、(d)前記翻訳装置が前記通用言語の出力内容を外部翻訳装置に出力し、前記外部翻訳装置によって出力され且つ第二言語に対応する第二会話音声から変換された通用言語の入力内容を受信するように許可するステップと、(e)前記デコーダで通用言語の入力内容を前記第一言語に対応する翻訳音声に変換するステップと、(f)前記翻訳音声を出力するステップとを含む。
【0011】
上記の目的を達成するために、本発明の好ましい実施例により提供される翻訳装置は制御ユニットと、前記制御ユニットに接続され、第一言語に対応する第一会話音声を受信する音声入力ユニットと、前記制御ユニットに接続され、前記第一会話音声を第一言語テキストに変換する音声テキスト変換モジュールと、前記制御ユニットに接続され、前記第一言語テキストを通用言語内容に変換するエンコーダと、、前記制御ユニットに接続され、前記通用言語内容を第二言語に対応する第二言語テキストに変換するデコーダと、前記制御ユニットに接続され、前記第二言語テキストを第二会話音声に変換するテキスト音声転換モジュールと、前記制御ユニットに接続され、前記第二会話音声を出力する音声出力ユニットと、を備える。
【図面の簡単な説明】
【0012】
【
図1】従来の翻訳方法で多言語の翻訳を実現することを示す概念図である。
【
図2】本発明の一実施例に係る翻訳方法を示すフローチャートである。
【
図3】本発明の翻訳方法により2種の言語の翻訳を実現する流れを示すブロック図である。
【
図4】本発明の翻訳方法により複数の言語の翻訳を実現する流れを示すブロック図である。
【
図5】本発明の翻訳方法により複数の言語の翻訳を実現する概念図である。
【
図6】本発明の一実施例に係る翻訳装置の構造を示すブロック図である。
【
図7】本発明の一実施例に係る翻訳方法の一部のステップを示す局所フローチャートである。
【
図8】本発明の一実施例に係る翻訳方法の一部のステップを示す局所フローチャートである。
【
図9】本発明の一実施例に係る翻訳方法の一部のステップを示すフローチャートである。
【
図10】本発明の翻訳方法のエンコーダの訓練過程を示す概念図である。
【
図11】本発明の翻訳方法のデコーダの訓練過程を示す概念図である。
【
図12】本発明の一実施例に係る翻訳方法の一部のステップを示すフローチャートである。
【
図13】本発明の一実施例に係る翻訳方法を示すフローチャートである。
【
図14】本発明の一実施例に係る翻訳方法の翻訳装置の構造を示すブロックである。
【
図15】複数のユーザが複数の本発明の翻訳装置を用いて仮想チャットルームで多言語翻訳及び会話を実現することを示す概念図である。
【発明を実施するための形態】
【0013】
以下、本発明の特徴及び利点を示す典型的な実施例を詳しく説明する。理解されるべきであることは、本発明の異なる態様には様々な変化があり、何れも本発明の範囲に含まれ、それについての説明及び図面は本質的に説明するためのものであり、本発明を制限するものではない。
【0014】
図2は、本発明の一実施例に係る翻訳方法を示すフローチャートである。
図2に示すように、本発明の一実施例に係る翻訳方法は、以下のステップを含む。まず、ステップS100に示すように、翻訳装置を提供する。次に、ステップS200に示すように、第一言語に対応する第一会話音声を入力する。具体的に、第一会話音声は、第一言語を使用するユーザが発出して翻訳装置に受信される。その後、ステップS300に示すように、第一会話音声を通用言語内容に変換する。続いて、ステップS400に示すように、通用言語内容を第二言語に対応する第二会話音声に変換する。その後、ステップS500に示すように、第二会話音声を出力する。これにより、任意の言語を通用言語に転換し、次に通用言語を任意の対象言語に変換し、簡単な設定で多言語及び対話を実現する。
【0015】
図3は、本発明の翻訳方法により2種の言語の翻訳を実現する流れを示すブロック図である。
図3に示すように、本発明の翻訳方法は、2種の言語の翻訳を実現する時に、主に第一言語内容(例えば第一言語に対応する第一会話音声又は第一言語に対応する第一言語テキスト)を第一言語エンコーダでエンコーして通用言語内容に変換し、次に第二言語のデコーダにより通用言語内容をデコードして第二言語内容(例えば第二言語に対応する第二会話音声又は第二言語に対応する第二言語テキスト)に変換する。本実施例において、第一言語及び第二言語は異なる言語であり、通用言語内容は通用機械言語に対応し、且つ通用言語内容は通用性特徴及び語義特徴に対応する。なお、通用性特徴は、少なくとも第一言語及び第二言語の複数の言語の特徴を含み、且つ語義特徴は、少なくとも部分的に第一会話音声及び第二会話音声の語義に対応するが、これに限らない。更に、複数の言語特徴は、少なくとも1つの品詞特徴、少なくとも1つの意図特徴、少なくとも1つの動詞状態特徴及び少なくとも1つの時間的特徴を含むが、これに限らない。
【0016】
図4及び
図5を参照すると、
図4は本発明の翻訳方法により複数の言語の翻訳を実現する流れを示すブロック図であり、
図5は本発明の翻訳方法により複数の言語の翻訳を実現する概念図である。
図4及び
図5に示すように、本発明の翻訳方法は、多言語の翻訳を実現する時に、第一言語エンコーダで第一言語内容をエンコードして通用言語内容に変換し、第二言語エンコーダで第二言語内容をエンコードして通用言語内容に変換し、第三言語エンコーダで第三言語内容をエンコードして通用言語内容に変換し、第四言語エンコーダで第四言語内容をエンコードして通用言語内容に変換する。いくつかの実施例において、通用言語内容は通用性特徴及び語義特徴を含む。通用性特徴は、第一言語、第二言語、第三言語及び第四言語の複数の言語特徴(例えば品詞特徴、意図特徴、動詞状態特徴及時間性特徴等)を含み、且つ語義特徴は、少なくとも部分的に第一言語内容、第二言語内容、第三言語内容及び第四言語内容の対応している語義に対応する。本発明の翻訳方法により、通用言語内容を第一言語、第二言語、第三言語及び第四言語等の特定の言語に翻訳する時に、第一言語デコーダで通用言語内容をデコードして第一言語内容に変換し、第二言語デコーダで通用言語内容をデコードして第二言語内容に変換し、第三言語デコーダで通用言語内容をデコードして第三言語内容に変換し、第四言語デコーダで通用言語内容をデコードして第四言語内容に変換する。例えば、本発明の翻訳方法により、
図5に示す中国語、英語、スペイン語及びフランス語の間の多言語の翻訳を実現する時に、第一言語を中国語とし、第二言語を英語とし、第三言語をスペイン語とし、第四言語をフランス語とした場合、例えば中国語内容である
を英語内容「Hello」、スペイン語内容「Hola」及びフランス語内容「Bonjour」に翻訳する時に、本発明の翻訳方法では、中国語内容をエンコードして通用言語内容に変換し、即ち
を通用性特徴及び語義特徴を含む通用言語に変換し、次に英語デコーダ、スペイン語デコーダ及びフランス語デコーダで通用言語内容をデコードして英語内容「Hello」、スペイン語内容「Hola」及びフランス語内容「Bonjour」に変換して出力する。簡単に言えば、ソース内容の対応する言語に関係なく、本発明の翻訳方法では、ソース内容をエンコードして通用言語内容に変換し、対応する特定言語のデコーダで翻訳後の言語内容を生成して出力し、従来に比べてリソース消費を有効に削減し、メモリの利用率を向上させることができる。
【0017】
なお、本発明の翻訳方法は、翻訳対象の言語を新たに追加する場合、新たな言語に対応するエンコーダ及びデコーダを新たに追加するだけで、新たな言語内容をエンコードして通用言語内容に変換し、通用言語内容をデコードして新たな言語内容に変換し、新たな言語から他の任意の言語への翻訳を実現可能である。従来技術に比べると、従来技術では、新たに言語を追加する時に、新たに追加した言語と各言語との両方向の翻訳機を用意する必要があり、用意が困難であるとともに、メモリやハードウェアのリソースへの要求も高い。
【0018】
図6、
図7及び
図8を参照すると、
図6は本発明の一実施例に係る翻訳装置の構造を示すブロック図であり、
図7は本発明の一実施例に係る翻訳方法の一部のステップを示す局所フローチャートであり、
図8は本発明の一実施例に係る翻訳方法の一部のステップを示す局所フローチャートである。
図6~
図8に示すように、本発明の翻訳方法のステップS300は、サブステップS310、サブステップS320及びサブステップS330を含み、且つステップS400は、サブステップS410、サブステップS420及びサブステップS430を含む。サブステップS310において、翻訳装置1の音声テキスト変換モジュール12で第一会話音声を第一言語テキストに変換する。サブステップS320において、第一言語テキストをエンコーダ13に入力する。サブステップS330において、エンコーダ13は、第一言語のテキストをエンコードして通用言語内容に変換する。サブステップS410において、通用言語内容をデコーダ14に入力する。サブステップS420において、デコーダ14は、通用言語内容をデコードして第二言語テキストに変換する。サブステップS430において、テキスト音声転換モジュール15は、第二言語のテキストを第二会話音声に変換する。
【0019】
いくつの実施例において、本発明の翻訳装置1は、制御ユニット10、音声入力ユニット11、音声テキスト変換モジュール12、エンコーダ13、デコーダ14、テキスト音声転換モジュール15及び音声出力ユニット16を備える。なお、音声入力ユニット11は、制御ユニット10に接続され、第一言語に対応する第一会話音声を受信する。音声テキスト変換モジュール12は、制御ユニット10に接続され、第一会話音声を第一言語テキストに変換する。エンコーダ13は、制御ユニット10に接続され、第一言語テキストを通用言語内容に変換する。デコーダ14は、制御ユニット10に接続され、通用言語内容を第二言語に対応する第二言語テキストに変換する。テキスト音声転換モジュール15は、制御ユニット10に接続され、第二言語テキストを第二会話音声に変換する。音声出力ユニット16は、制御ユニット10に接続され、第二会話音声を出力する。なお、音声入力ユニット11はマイクロホンであってもよく、音声テキスト変換モジュール12は音声テキスト変換チップ又は音声テキスト変換ソフトウェアモジュールであってもよく、エンコーダ13はハードウェアエンコーダ又はソフトウェアエンコーダであってもよく、デコーダ14はハードウェアデコーダ又はソフトウェアデコーダであってもよく、テキスト音声転換モジュール15はテキスト音声変換チップ又はテキスト音声変換ソフトウェアモジュールであってもよく、且つ音声出力ユニット16はイヤホン又はスピーカーであってもよいが、これに限らない。
【0020】
本発明の概念によれば、本発明の翻訳方法の一実施例において、翻訳装置は、予め訓練された特定言語のエンコーダ及び特定言語のデコーダを含んでおり、具体的に、機器学習による教師あり学習で実現されてもよいが、これに限らない。
図9、
図10、
図11及び
図12を参照すると、
図9は本発明の一実施例に係る翻訳方法の一部のステップを示すフローチャートであり、
図10は本発明の翻訳方法のエンコーダの訓練過程を示す概念図であり、
図11は本発明の翻訳方法のデコーダ訓練過程を示す概念図であり、
図12は本発明の一実施例に係る翻訳方法の一部のステップを示すフローチャートである。
図9~
図12に示すように、本発明の一実施例に係る翻訳方法において、ステップS100とステップS200の間には、更にステップS110~ステップS160及びステップS170~ステップS190を含み、以下詳細に説明する。
【0021】
本発明の翻訳方法による翻訳装置は、予め訓練された特定言語のエンコーダ及び特定言語のデコーダを有しており、ステップS100及びステップS200の間で最適化を行うか、或いは、敵対的ネットワークに基づく深層学習を行うことができる。具体的に、本発明の翻訳装置の訓練は大まかにステップS110~ステップS130を含むエンコーダの訓練プロセス、及びステップS140~ステップS160を含むデコーダ訓練プロセスに分類することができる。まず、ステップS110に示すように、予め訓練された特定言語のデコーダを抽出してそのパラメータを固定する。次に、ステップS120に示すように、複数の他の言語のエンコーダによって出力される複数の通用性特徴及び複数の語義特徴を受信して翻訳し、複数の他の言語エンコーダによって出力される複数の通用性特徴及び複数の語義特徴が互いに近いように、翻訳結果に基づいて複数の通用性誤差値及び複数の語義誤差値を生成し、複数の通用性誤差値及び複数の語義誤差値に基づいて複数の他の言語のエンコーダのパラメータを調整する。なお、通用性誤差値及び語義誤差値は、翻訳プロセスでの損失の程度を表すため、小さいほど良い。その後、ステップS130に示すように、再度ステップS120を行い、複数の通用性誤差値及び複数の語義誤差値の数値が、前回のステップS120によって生成された複数の通用性誤差値及び複数の語義誤差値の数値よりも減少されているどうかかついて判断する。判断結果が「はい」である場合、エンコーダの訓練を完了し、判断結果が「いいえ」である場合、再度ステップS130を実施する。いくつかの実施例において、具体的に上記のエンコーダの訓練を実現する方法は、例えば
図10に示すように、各エンコーダで入力されたテキストを翻訳し、通用性誤差値及び語義誤差値が減少されなくなった時に、デコーダで翻訳されたテキストを出力する。次に、ステップS140に示すように、複数の他の言語エンコーダのうち1つを選択してそのパラメータを固定する。その後、ステップS150に示すように、ステップS140で選択した他の言語エンコーダの言語を受信し、言語を通用言語に変換し、次に通用言語をそれぞれ複数の他の言語デコーダに対応する各言語に翻訳し、翻訳結果に基づいて複数の翻訳誤差を算出するとともに、複数の翻訳誤差に基づいて対応する複数の他の言語デコーダのパラメータを調整する。もちろん、
図11に示すように、各デコーダによって通用言語をそれぞれ各言語の翻訳テキストに翻訳して直接出力してもよいが、これに限らない。続いて、ステップS160に示すように、再度ステップS150を実施し、複数の翻訳誤差の数値が、前回ステップS150を実施して算出された複数の翻訳誤差の数値よりも減少されなくなっているかどうかについて判断する。判断結果が「はい」である場合、デコーダ訓練を完了し、判断結果が「いいえ」である場合、再度ステップS160を実施する。
【0022】
ステップS170では、各他の言語エンコーダが徐々に一致し、各言語の入力を受信でき且つ特定言語に対応するデコーダが訓練できるように、再度上記のステップS110~ステップS160を実施する。次に、ステップS180に示すように、毎回エンコーダの訓練を完了して累積された通用性誤差値の総和及び語義誤差値の総和の数値が、前回エンコーダの訓練を完了して累積された通用性誤差値の総和及び語義誤差値の総和の数値よりも減少されているかどうかついて判断する。ステップS180の判断結果が「はい」である場合、ステップS180の後にステップS170を再度実施し、即ちステップS110~ステップS160を再度実施する。ステップS180の判断結果が「いいえ」である場合、ステップS180の後にステップS190を実施し、複数の他の言語エンコーダ及び複数の他の言語デコーダの訓練を完了する。言い換えると、本発明の翻訳方法では、複数の他の言語エンコーダと複数の他の言語デコーダとの間の翻訳損失を最小化した時に、各他の言語エンコーダ及び他の言語デコーダの訓練が完了する。
【0023】
以下、ユーザが本発明の翻訳方法による翻訳装置を使用して同じ翻訳装置を使用する他のユーザと会話する実施例を説明する。図第13及び
図14を参照すると、
図13は本発明の一実施例に係る翻訳方法を示すフローチャートであり、
図14は本発明の一実施例に係る翻訳方法の翻訳装置の構造を示すブロックである。
図13及び
図14に示すように、いくつかの実施例において、本発明の翻訳方法は、以下のステップを含む。まず、ステップS1に示すように、翻訳装置2を提供し、翻訳装置2は第一言語に対応するエンコーダ21及びデコーダ22を含み、エンコーダ21及びデコーダ22は制御ユニット20に接続されることが好ましいが、これに限らない。且つ、エンコーダ21及びデコーダ22は翻訳装置のユーザが主に使用する特定言語に対応するエンコーダ及びデコーダであり、本実施例において、特定言語は第一言語である。次に、ステップS2に示すように、第一言語に対応する第一会話音声を入力する(例えばユーザが第一言語で特定語句を話す)。続いて、ステップS3に示すように、エンコーダ21は第一会話音声を通用言語の出力内容に変換する。その後、ステップS4に示すように、翻訳装置2が通用言語の出力内容を外部翻訳装置4に出力し(例えば通信ユニット23及びネットワーク3により出力する)、外部翻訳装置4によって出力され、且つ第二言語に対応する第二会話音声から変換された通用言語の入力内容を受信するように許可する。続いて、ステップS5に示すように、デコーダ22は、通用言語の入力内容を第一言語に対応する翻訳音声に変換する。その後、ステップS6に示すように、翻訳音声を出力する。本実施例において、ユーザは、一組のエンコーダ21及びデコーダ22を選択するだけで、自分が生成した会話音声を翻訳装置2によって通用言語の出力内容を外部翻訳装置4に伝送し、各言語を使用するユーザが用いる外部翻訳装置4からの通用言語の入力内容をユーザの選択した言語の翻訳音声として出力する。
【0024】
図15は、複数のユーザが複数の本発明の翻訳装置を用いて仮想チャットルームで多言語翻訳及び会話を実現することを示す概念図である。いくつかの些実施例において、本発明の翻訳方法及び翻訳装置は、例えば仮想チャットルームアプリケーション等のアプリケーションと組み合わせて使用することができる。複数のユーザは、QRコード(登録商標)をスキャンすることで仮想チャットルームに加入することができる。仮想チャットルームの主な機能は、通用言語の出力内容及び通用言語の入力内容を複数のユーザの間で伝送し、ユーザは、上記のように自分が使用する言語に対応するエンコーダ及びデコーダを選択するだけで、各言語を使用するユーザとのリアルタイム翻訳及び会話を実現可能になり、従来技術に比べて、演算及びメモリの使用が大幅に改善された。
【0025】
図13及び第15を参照されたい。例えば、主に中国語を使用するユーザがステップS1に示すように本発明の翻訳装置で仮想チャットルームに入り、異なる言語を使用する他のユーザと会話を開始する時に、ステップS2に示すように、第一言語に対応する第一会話音声を入力する(例えば中国語で
と話す)。続いて、ステップS3に示すように、翻訳装置のエンコーダは、
を通用言語の出力内容に変換する。その後、ステップS4に示すように、翻訳装置は、通用言語内容を外部翻訳装置(即ち異なる言語を使用する各ユーザが用いる翻訳装置)に出力し、外部翻訳装置によって出力され且つ第二言語に対応する第二会話音声から変換された通用言語の入力内容(例えば英語ユーザが話した「Hello」、スペイン語のユーザが話した「Hola」又はフランス語ユーザが話した「Bonjour」から変換された通用言語の入力内容)を受信する。続いて、ステップS5に示すように、デコーダは、通用言語の入力内容を第一言語に対応する翻訳音声(例えば
の翻訳音声)に変換する。最後に、ステップS6に示すように、スピーカー又は拡声器は中国語ユーザに
を出力する。他の言語ユーザの場合も、本発明の翻訳装置及び翻訳方法によって、同様なステップでリアルタイム且つ迅速な翻訳及びリアルタイムの会話を実現することができる。
【0026】
以上によると、本発明により提供される種翻訳方法及び翻訳装置は、第一言語に対応する第一会話音声を通用言語内容に変換し、次に通用言語内容を第二言語に対応する第二会話音声に変換して出力し、任意の言語を通用言語に変換し、続いて通用言語を任意の対象言語に変換することで、簡単な設定で多言語及び対話を実現することができる。また、通用言語内容の通用性特徴及び語義特徴により多言語の共通性を説明し、異なる言語を使用する複数のユーザが複数の翻訳装置で対話する時に、各翻訳装置は独自の言語に対応する一組のエンコーダ及びデコーダを備えるだけで、多言語の翻訳及び対話を実現可能である。よって、リソース消費を大幅に削減できるだけでなく、メモリ使用率を有効に向上させることができる。
【0027】
当業者であれば、本発明の範囲内で変更や修正を加えることができ、いずれも特許請求の範囲に含まれる。
【符号の説明】
【0028】
1:翻訳装置
10:制御ユニット
11:音声入力ユニット
12:音声テキスト変換モジュール
13:エンコーダ
14:デコーダ
15:テキスト音声転換モジュール
16:音声出力ユニット
2:翻訳装置
20:制御ユニット
21:エンコーダ
22:デコーダ
23:通信ユニット
3:ネットワーク
4:外部翻訳装置
S100、S200、S300、S400、S500: ステップ
S310、S320、S330、S410、S420、S430:サブステップ
S110、S120、S130、S140、S150、S160、S170、S180、S190:ステップ
S1、S2、S3、S4、S5、S6:ステップ
【外国語明細書】