IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッドの特許一覧

特許7395553文章翻訳方法、装置、電子機器及び記憶媒体
<>
  • 特許-文章翻訳方法、装置、電子機器及び記憶媒体 図1
  • 特許-文章翻訳方法、装置、電子機器及び記憶媒体 図2
  • 特許-文章翻訳方法、装置、電子機器及び記憶媒体 図3
  • 特許-文章翻訳方法、装置、電子機器及び記憶媒体 図4
  • 特許-文章翻訳方法、装置、電子機器及び記憶媒体 図5
  • 特許-文章翻訳方法、装置、電子機器及び記憶媒体 図6
  • 特許-文章翻訳方法、装置、電子機器及び記憶媒体 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-12-01
(45)【発行日】2023-12-11
(54)【発明の名称】文章翻訳方法、装置、電子機器及び記憶媒体
(51)【国際特許分類】
   G06F 40/44 20200101AFI20231204BHJP
   G06F 40/30 20200101ALI20231204BHJP
【FI】
G06F40/44
G06F40/30
【請求項の数】 11
(21)【出願番号】P 2021194225
(22)【出願日】2021-11-30
(65)【公開番号】P2022028897
(43)【公開日】2022-02-16
【審査請求日】2021-11-30
(31)【優先権主張番号】202011556253.9
(32)【優先日】2020-12-25
(33)【優先権主張国・地域又は機関】CN
【前置審査】
(73)【特許権者】
【識別番号】514322098
【氏名又は名称】ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド
【氏名又は名称原語表記】Beijing Baidu Netcom Science Technology Co., Ltd.
【住所又は居所原語表記】2/F Baidu Campus, No.10, Shangdi 10th Street, Haidian District, Beijing 100085, China
(74)【代理人】
【識別番号】100096091
【弁理士】
【氏名又は名称】井上 誠一
(72)【発明者】
【氏名】▲張▼ ▲伝強▼
(72)【発明者】
【氏名】▲張▼ 睿卿
(72)【発明者】
【氏名】李 芝
(72)【発明者】
【氏名】何 中▲軍▼
(72)【発明者】
【氏名】▲呉▼ ▲華▼
【審査官】成瀬 博之
(56)【参考文献】
【文献】特開2013-122599(JP,A)
【文献】特開2006-107353(JP,A)
【文献】特表2018-528458(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 40/20-40/58
(57)【特許請求の範囲】
【請求項1】
コンピュータによって実行される文章翻訳方法であって、
翻訳対象の文章を取得するステップと、
前記翻訳対象の文章をトレーニング済みの文章翻訳モデルに入力し、前記文章翻訳モデルによって前記翻訳対象の文章を複数のセマンティックユニットに分割し、前記複数のセマンティックユニットの前記翻訳対象の文章における前後順に従って現在のセマンティックユニットを順次選択し、現在のセマンティックユニットの前のすでに翻訳されているN個のセマンティックユニットをローカルコンテキストセマンティックユニットとして決定し、前記ローカルコンテキストセマンティックユニットの前のM個のセマンティックユニットをグローバルコンテキストセマンティックユニットとして決定し、前記ローカルコンテキストセマンティックユニットと前記グローバルコンテキストセマンティックユニットとに基づいて、前記現在のセマンティックユニットの翻訳結果を生成するステップであって、前記Nは整数であり、前記Mは整数であるステップと、を含み、
前記ローカルコンテキストセマンティックユニットと前記グローバルコンテキストセマンティックユニットとに基づいて、前記現在のセマンティックユニットの翻訳結果を生成するステップが、
前記グローバルコンテキストセマンティックユニットのベクトル表現に基づいて、前記現在のセマンティックユニットのベクトル表現を生成するステップと、
前記現在のセマンティックユニットのベクトル表現と前記ローカルコンテキストセマンティックユニットのベクトル表現とに基づいて、前記現在のセマンティックユニットと前記ローカルコンテキストセマンティックユニットに対応するローカル翻訳結果を生成するステップと、
前記ローカルコンテキストセマンティックユニットの翻訳結果を取得し、前記ローカル翻訳結果と前記ローカルコンテキストセマンティックユニットの翻訳結果とに基づいて、前記現在のセマンティックユニットの翻訳結果を生成するステップと、を含み、
前記ローカル翻訳結果と前記ローカルコンテキストセマンティックユニットの翻訳結果とに基づいて、前記現在のセマンティックユニットの翻訳結果を生成することは、
前記ローカル翻訳結果から前記ローカルコンテキストセマンティックユニットの翻訳結果を除去して、前記現在のセマンティックユニットの翻訳結果を取得することを含み、
前記グローバルコンテキストセマンティックユニットのベクトル表現に基づいて、前記現在のセマンティックユニットのベクトル表現を生成するステップが、
前記現在のセマンティックユニットを少なくとも1つの単語セグメンテーションに分割するステップと、
前記単語セグメンテーションのベクトル表現と前記グローバルコンテキストセマンティックユニットのベクトル表現とに基づいて、前記単語セグメンテーションのグローバル融合ベクトル表現を生成するステップと、
前記単語セグメンテーションのグローバル融合ベクトル表現に基づいて、前記現在のセマンティックユニットのベクトル表現を生成するステップと、を含む、
ことを特徴とする文章翻訳方法。
【請求項2】
前記単語セグメンテーションのベクトル表現と前記グローバルコンテキストセマンティックユニットのベクトル表現とに基づいて、前記単語セグメンテーションのグローバル融合ベクトル表現を生成するステップは、
前記単語セグメンテーションのベクトル表現に対して線性変換を行って、セマンティックユニットレベルの前記単語セグメンテーションのセマンティックユニットベクトル表現を生成するステップと、
前記単語セグメンテーションのセマンティックユニットベクトル表現に基づいて、前記グローバルコンテキストセマンティックユニットのベクトル表現に対して特徴抽出を行って、グローバル特徴ベクトルを生成するステップと、
前記グローバル特徴ベクトルと前記単語セグメンテーションのベクトル表現とを融合させて、前記単語セグメンテーションのグローバル融合ベクトル表現を生成するステップと、を含む、
ことを特徴とする請求項1に記載の文章翻訳方法。
【請求項3】
前記単語セグメンテーションのグローバル融合ベクトル表現に基づいて、前記現在のセマンティックユニットのベクトル表現を生成するステップは、
前記単語セグメンテーションのグローバル融合ベクトル表現に対応する重みを決定するステップと、
前記単語セグメンテーションのグローバル融合ベクトル表現と対応する重みとに基づいて、前記現在のセマンティックユニットのベクトル表現を算出するステップと、を含む、
ことを特徴とする請求項1に記載の文章翻訳方法。
【請求項4】
サンプル文章と前記サンプル文章に対応するサンプル翻訳結果とを取得するステップと、
前記サンプル文章と前記サンプル翻訳結果とに基づいて、トレーニング対象の文章翻訳モデルをトレーニングして、前記トレーニング済みの文章翻訳モデルを取得するステップと、をさらに含む、
ことを特徴とする請求項1に記載の文章翻訳方法。
【請求項5】
文章翻訳装置であって、
翻訳対象の文章を取得するための取得モジュールと、
前記翻訳対象の文章をトレーニング済みの文章翻訳モデルに入力し、前記文章翻訳モデルによって前記翻訳対象の文章を複数のセマンティックユニットに分割し、前記複数のセマンティックユニットの前記翻訳対象の文章における前後順に従って現在のセマンティックユニットを順次選択し、現在のセマンティックユニットの前のすでに翻訳されているN個のセマンティックユニットをローカルコンテキストセマンティックユニットとして決定し、前記ローカルコンテキストセマンティックユニットの前のM個のセマンティックユニットをグローバルコンテキストセマンティックユニットとして決定し、前記ローカルコンテキストセマンティックユニットと前記グローバルコンテキストセマンティックユニットとに基づいて、前記現在のセマンティックユニットの翻訳結果を生成するための入力モジュールであって、前記Nは整数であり、前記Mは整数である入力モジュールと、を含み、
前記入力モジュールが、
前記グローバルコンテキストセマンティックユニットのベクトル表現に基づいて、前記現在のセマンティックユニットのベクトル表現を生成するための第1生成ユニットと、
前記現在のセマンティックユニットのベクトル表現と前記ローカルコンテキストセマンティックユニットのベクトル表現とに基づいて、前記現在のセマンティックユニットと前記ローカルコンテキストセマンティックユニットに対応するローカル翻訳結果を生成するための第2生成ユニットと、
前記ローカルコンテキストセマンティックユニットの翻訳結果を取得し、前記ローカル翻訳結果と前記ローカルコンテキストセマンティックユニットの翻訳結果とに基づいて、前記現在のセマンティックユニットの翻訳結果を生成するための第3生成ユニットと、を含み、
前記ローカル翻訳結果と前記ローカルコンテキストセマンティックユニットの翻訳結果とに基づいて、前記現在のセマンティックユニットの翻訳結果を生成することは、
前記ローカル翻訳結果から前記ローカルコンテキストセマンティックユニットの翻訳結果を除去して、前記現在のセマンティックユニットの翻訳結果を取得することを含み、
前記第1生成ユニットが、
前記現在のセマンティックユニットを少なくとも1つの単語セグメンテーションに分割するための分割サブユニットと、
前記単語セグメンテーションのベクトル表現と前記グローバルコンテキストセマンティックユニットのベクトル表現とに基づいて、前記単語セグメンテーションのグローバル融合ベクトル表現を生成するための第1生成サブユニットと、
前記単語セグメンテーションのグローバル融合ベクトル表現に基づいて、前記現在のセマンティックユニットのベクトル表現を生成するための第2生成サブユニットと、を含む、
ことを特徴とする文章翻訳装置。
【請求項6】
前記第1生成サブユニットが、
前記単語セグメンテーションのベクトル表現に対して線性変換を行って、セマンティックユニットレベルの前記単語セグメンテーションのセマンティックユニットベクトル表現を生成し、
前記単語セグメンテーションのセマンティックユニットベクトル表現に基づいて、前記グローバルコンテキストセマンティックユニットのベクトル表現に対して特徴抽出を行って、グローバル特徴ベクトルを生成し、
前記グローバル特徴ベクトルと前記単語セグメンテーションのベクトル表現とを融合させて、前記単語セグメンテーションのグローバル融合ベクトル表現を生成する、
ことを特徴とする請求項5に記載の文章翻訳装置。
【請求項7】
前記第2生成サブユニットが、
前記単語セグメンテーションのグローバル融合ベクトル表現に対応する重みを決定し、
前記単語セグメンテーションのグローバル融合ベクトル表現と対応する重みとに基づいて、前記現在のセマンティックユニットのベクトル表現を算出する、
ことを特徴とする請求項5に記載の文章翻訳装置。
【請求項8】
前記装置は、トレーニングモジュールをさらに含み、
前記トレーニングモジュールが、
サンプル文章と前記サンプル文章に対応するサンプル翻訳結果とを取得するための取得ユニットと、
前記サンプル文章と前記サンプル翻訳結果とに基づいて、トレーニング対象の文章翻訳モデルをトレーニングして、前記トレーニング済みの文章翻訳モデルを取得するためのトレーニングユニットと、を含む、
ことを特徴とする請求項5に記載の文章翻訳装置。
【請求項9】
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサと通信可能に接続されるメモリと、を含み、
前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶され、前記命令は、前記少なくとも1つのプロセッサが請求項1~4のいずれかに記載の文章翻訳方法を実行できるように、前記少なくとも1つのプロセッサによって実行される、
ことを特徴とする電子機器。
【請求項10】
コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
前記コンピュータ命令は、コンピュータに請求項1~4のいずれかに記載の文章翻訳方法を実行させる、
ことを特徴とする非一時的なコンピュータ読み取り可能な記憶媒体。
【請求項11】
コンピュータプログラムであって、
前記コンピュータプログラムがプロセッサによって実行される場合、請求項1~4のいずれかに記載の文章翻訳方法が実現される、
ことを特徴とするコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本出願は、コンピュータ技術の分野における音声、自然言語処理、深層学習技術の分野に関し、特に文章翻訳方法、装置、電子機器、記憶媒体及びコンピュータープログラム製品に関する。
【背景技術】
【0002】
現在、人工知能、自然言語処理などの技術の発展に伴い、音声翻訳技術は同時通訳、外国語教育などのシナリオで広く応用されておる。例えば、同時通訳シナリオでは、音声翻訳技術により、話者の言語タイプを異なる言語タイプに同期的に変換できるため、人々のコミュニケーションを容易にする。しかしながら、関連技術における音声翻訳方法は、翻訳結果に翻訳の一貫性がない、コンテキストの翻訳が一致しないなどの問題を引き起こしやすい。
【発明の概要】
【発明が解決しようとする課題】
【0003】
文章翻訳方法、装置、電子機器、記憶媒体及びコンピュータプログラム製品を提供する。
【課題を解決するための手段】
【0004】
第1態様によれば、文章翻訳方法を提供し、
翻訳対象の文章を取得するステップと、
前記翻訳対象の文章をトレーニング済みの文章翻訳モデルに入力し、前記文章翻訳モデルによって前記翻訳対象の文章を複数のセマンティックユニットに分割し、現在のセマンティックユニットの前のN個のセマンティックユニットをローカルコンテキストセマンティックユニットとして決定し、前記ローカルコンテキストセマンティックユニットの前のM個のセマンティックユニットをグローバルコンテキストセマンティックユニットとして決定し、前記ローカルコンテキストセマンティックユニットと前記グローバルコンテキストセマンティックユニットとに基づいて、前記現在のセマンティックユニットの翻訳結果を生成するステップであって、前記Nは整数であり、前記Mは整数であるステップと、を含む。
【0005】
第2態様によれば、文章翻訳装置を提供し、翻訳対象の文章を取得するための取得モジュールと、前記翻訳対象の文章をトレーニング済みの文章翻訳モデルに入力し、前記文章翻訳モデルによって前記翻訳対象の文章を複数のセマンティックユニットに分割し、現在のセマンティックユニットの前のN個のセマンティックユニットをローカルコンテキストセマンティックユニットとして決定し、前記ローカルコンテキストセマンティックユニットの前のM個のセマンティックユニットをグローバルコンテキストセマンティックユニットとして決定し、前記ローカルコンテキストセマンティックユニットと前記グローバルコンテキストセマンティックユニットとに基づいて、前記現在のセマンティックユニットの翻訳結果を生成するための入力モジュールであって、前記Nは整数であり、前記Mは整数である入力モジュールと、を含む。
【0006】
第3態様によれば、電子機器を提供し、少なくとも1つのプロセッサと、前記少なくとも1つのプロセッサと通信可能に接続されるメモリと、を含み、前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶され、前記命令は、前記少なくとも1つのプロセッサが本出願の第1態様に記載の文章翻訳方法を実行できるように、前記少なくとも1つのプロセッサによって実行される。
【0007】
第4態様によれば、コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体を提供し、前記コンピュータ命令は、コンピュータに本出願の第1態様に記載の文章翻訳方法を実行させる。
【0008】
第5態様によれば、コンピュータプログラムが含まれるコンピュータプログラム製品を提供し、前記コンピュータプログラムがプロセッサによって実行される場合、本出願の第1態様に記載の文章翻訳方法が実現される。
第6態様によれば、コンピュータプログラムを提供し、前記コンピュータプログラムがプロセッサによって実行される場合、本出願の第1態様に記載の文章翻訳方法が実現される。
【0009】
なお、この部分に記載されている内容は、本出願の実施例の肝心または重要な特徴を特定することを意図しておらず、本開示の範囲を限定することも意図していない。本開示の他の特徴は、以下の説明を通して容易に理解される。
【図面の簡単な説明】
【0010】
図面は、本技術案をよりよく理解するために使用され、本出願を限定するものではない。
図1】本出願の第1実施例に係る文章翻訳方法の概略フローチャートである。
図2】本出願の第2実施例に係る文章翻訳方法における現在のセマンティックユニットの翻訳結果を生成することの概略フローチャートである。
図3】本出願の第3実施例に係る文章翻訳方法における現在のセマンティックユニットのベクトル表現を生成することの概略フローチャートである。
図4】本出願の第4実施例に係る文章翻訳方法における単語セグメンテーションのグローバル融合ベクトル表現を生成することの概略図である。
図5】本出願の第1実施例に係る文章翻訳装置のブロック図である。
図6】本出願の第2実施例に係る文章翻訳装置のブロック図である。
図7】本出願の実施例に係る文章翻訳方法を実現するための電子機器のブロック図である。
【発明を実施するための形態】
【0011】
以下、図面と組み合わせて本出願の例示的な実施例を説明し、理解を容易にするためにその中には本出願の実施例の様々な詳細事項を含んでおり、それらは単なる例示的なものと見なされるべきである。したがって、当業者は、本出願の範囲及び精神から逸脱することなく、ここで説明される実施例に対して様々な変更と修正を行うことができることを認識されたい。同様に、明確及び簡潔にするために、以下の説明では、周知の機能及び構造の説明を省略する。
【0012】
音声は、音声認識、音声インタラクションなどの技術分野を含むことができ、人工知能の分野の重要な方向の1つである。
【0013】
音声認識(Voice Recognition)は、機器に認識と理解のプロセスを通じて音声信号を対応するテキストまたは命令に変換させる技術であり、主に特徴抽出技術、モードマッチング基準及びモデルトレーニング技術の3つの側面を含む。
【0014】
音声インタラクション(Voice Interaction)は、機械とユーザが音声を情報媒体としてインタラクション、コミュニケーション、情報交換などのインタラクション動作を行う技術であり、従来のヒューマンマシンインタラクションと比較して、便利で迅速で、ユーザの快適性が高いという利点がある。
【0015】
自然言語処理(Natural Language Processing、NLU)は、自然言語通信を効果的に実現できるコンピュータシステム、特にその中のソフトウェアシステムを研究する科学であり、コンピュータ科学の分野と人工知能の分野の重要な方向の1つである。
【0016】
深層学習(Deep Learning、DL)は、機械学習(Machine Learning、ML)分野における新しい研究方向であり、サンプルデータの固有規則と表示レベルを学習することで、機械が人間のように分析と学習能力を有し、文字、画像及び音声などのデータを認識できるようにする科学であり、音声と画像認識に広く応用されておる。
【0017】
図1は、本出願の第1実施例に係る文章翻訳方法の概略フローチャートである。
【0018】
図1に示すように、本出願の第1実施例に係る文章翻訳方法は、以下のステップ101~102を含む。
【0019】
ステップ101において、翻訳対象の文章を取得する。
【0020】
なお、本出願の実施例に係る文章翻訳方法の実行主体はデータ情報処理能力を有すハードウェア機器及び/又は当該ハードウェア機器の動作を駆動するために必要なソフトウェアであってもよい。選択的に、実行主体は、ワークステーション、サーバ、コンピュータ、ユーザ端末及び他のデバイスを含むことができる。ここで、ユーザ端末は、携帯電話、コンピュータ、インテリジェント音声インタラクティブデバイス、インテリジェント家電、車載端末などを含むが、これらに限定されない。
【0021】
本出願の実施例では、翻訳対象の文章を取得することができる。なお、翻訳対象の文章は、複数の文で構成されてもよい。
【0022】
選択的に、翻訳対象の文章は、録画、ネットワーク伝送などの方式によって取得されることができる。
【0023】
例えば、録画の方式を用いて翻訳対象の文章を取得する場合、デバイス上に音声収集装置があり、音声収集装置はマイクロフォン(Microphone)、マイクロフォンアレイ(Microphone Array)などであってもよい。または、ネットワーク伝送の方式を用いて翻訳対象の文章を取得する場合、デバイス上にネットワーク装置があり、ネットワーク装置を介して他のデバイスまたはサーバとネットワーク伝送を行うことができる。
【0024】
なお、翻訳対象の文章は、オーディオ、テキストなどの形式であってもよく、ここではあまり限定されない。
【0025】
なお、本出願の実施例では、翻訳対象の文章の言語タイプも翻訳結果の言語タイプも限定されない。
【0026】
ステップ102において、翻訳対象の文章をトレーニング済みの文章翻訳モデルに入力し、文章翻訳モデルによって翻訳対象の文章を複数のセマンティックユニットに分割し、現在のセマンティックユニットの前のN個のセマンティックユニットをローカルコンテキストセマンティックユニットとして決定し、ローカルコンテキストセマンティックユニットの前のM個のセマンティックユニットをグローバルコンテキストセマンティックユニットとして決定し、ローカルコンテキストセマンティックユニットとグローバルコンテキストセマンティックユニットとに基づいて、現在のセマンティックユニットの翻訳結果を生成し、Nは整数であり、Mは整数である。
【0027】
関連技術では、文レベルのバイリンガル文のペアに基づいて翻訳モデルをトレーニングし、翻訳モデルの翻訳結果が柔軟でない。例えば、文章翻訳シナリオに対して、翻訳対象のテキストは複数の文で構成される文章であり、この時翻訳モデルの翻訳結果には翻訳の一貫性がなく、コンテキストの翻訳が一致しないという問題がある。例えば、文章翻訳シナリオがアニメーションレンダリングというテーマ講演である場合、翻訳対象のテキストが「It starts with modeling」である場合、この時翻訳モデルの翻訳結果は「造形から始まる」であるが、この時翻訳対象のテキストの「modeling」について、コンテキストと組合わせてそのセマンティックが造形ではなく、モデリングを意味し、翻訳結果が「モデリングから始まる」であることは話者の本当の意図により一致している。
【0028】
この問題を解決するために、本出願では、翻訳対象の文章をトレーニング済みの文章翻訳モデルに入力し、文章翻訳モデルによって翻訳対象の文章を複数のセマンティックユニットに分割し、現在のセマンティックユニットの前のN個のセマンティックユニットをローカルコンテキストセマンティックユニットとして決定し、ローカルコンテキストセマンティックユニットの前のM個のセマンティックユニットをグローバルコンテキストセマンティックユニットとして決定し、ローカルコンテキストセマンティックユニットとグローバルコンテキストセマンティックユニットとに基づいて、現在のセマンティックユニットの翻訳結果を生成でき、Nは整数であり、Mは整数である。
【0029】
なお、文章翻訳モデルは、翻訳対象の文章を複数のセマンティックユニットに分割し、ローカルコンテキストセマンティックユニットとグローバルコンテキストセマンティックユニットとに基づいて、現在のセマンティックユニットの翻訳結果を生成することができ、関連技術における翻訳に一貫性がなく、コンテキストの翻訳が一致しないという問題を解決でき、同時通訳シナリオなどの文章翻訳シナリオに適応する。
【0030】
選択的に、N、Mはいずれも実際の状況に応じて設定されてもよい。
【0031】
本出願の一実施例では、現在のセマンティックユニットの前に合計で(N+M)個のセマンティックユニットがあり、この時に決定されたローカルコンテキストセマンティックユニットとグローバルコンテキストセマンティックユニットとが現在のセマンティックユニットの前のすべてのセマンティックユニットを構成し、この時現在のセマンティックユニットの前のすべてのセマンティックユニットを使用して現在のセマンティックユニットの翻訳結果を生成することができる。
【0032】
本出願の一実施例では、現在のセマンティックユニットが翻訳対象の文章の1番目のセマンティックユニットである場合、即ち現在のセマンティックユニットの前に他のセマンティックユニットが存在しない場合、N=0で、M=0である。
【0033】
例えば、翻訳対象の文章が
である場合、上記翻訳対象の文章を、
などの複数のセマンティックユニットに分割することができる。
【0034】
現在のセマンティックユニットが
である場合、現在のセマンティックユニット
の前の2つのセマンティックユニットをローカルコンテキストセマンティックユニットとして決定し、即ち、
をローカルコンテキストセマンティックユニットとして決定でき、ローカルコンテキストセマンティックユニットの前の4つのセマンティックユニットをグローバルコンテキストセマンティックユニットとして決定し、即ち、
をグローバルコンテキストセマンティックユニットとして決定でき、上記決定されたローカルコンテキストセマンティックユニットとグローバルコンテキストセマンティックユニットとに基づいて、現在のセマンティックユニット
の翻訳結果を生成する。当該実施例では、Nは2であり、Mは4である。
【0035】
または、現在のセマンティックユニットが
である場合、現在のセマンティックユニット
は、翻訳対象の文章の1番目のセマンティックユニットであり、この時ローカルコンテキストセマンティックユニット及びグローバルコンテキストセマンティックユニットが存在せず、即ち、N=0で、M=0である。
【0036】
以上のように、本出願の実施例に係る文章翻訳方法によれば、翻訳対象の文章をトレーニング済みの文章翻訳モデルに入力し、ローカルコンテキストセマンティックユニットとグローバルコンテキストセマンティックユニットとに基づいて現在のセマンティックユニットの翻訳結果を生成することで、関連技術における翻訳に一貫性がなく、コンテキストの翻訳が一致しないという問題を解決でき、翻訳結果の精度を向上させ、文章翻訳シナリオに適応する。
【0037】
上記任意の実施例に基づいて、図2に示すように、ステップ102におけるローカルコンテキストセマンティックユニットとグローバルコンテキストセマンティックユニットとに基づいて、現在のセマンティックユニットの翻訳結果を生成するステップは、以下のステップ201~203を含むことができる。
【0038】
ステップ201において、グローバルコンテキストセマンティックユニットのベクトル表現に基づいて、現在のセマンティックユニットのベクトル表現を生成する。
【0039】
本出願の実施例では、各セマンティックユニットが1つのベクトル表現に対応することができる。
【0040】
なお、まず、グローバルコンテキストセマンティックユニットのベクトル表現を取得し、グローバルコンテキストセマンティックユニットのベクトル表現がローカルコンテキストセマンティックユニットの前のM個のセマンティックユニットのベクトル表現を含み、そしてグローバルコンテキストセマンティックユニットのベクトル表現に基づいて、現在のセマンティックユニットのベクトル表現を生成することができる。
【0041】
ステップ202において、現在のセマンティックユニットのベクトル表現とローカルコンテキストセマンティックユニットのベクトル表現とに基づいて、現在のセマンティックユニットとローカルコンテキストセマンティックユニットに対応するローカル翻訳結果を生成する。
【0042】
なお、まず、ローカルコンテキストセマンティックユニットのベクトル表現を取得し、ローカルコンテキストセマンティックユニットのベクトル表現が現在のセマンティックユニットの前のN個のセマンティックユニットのベクトル表現を含み、そして現在のセマンティックユニットのベクトル表現とローカルコンテキストセマンティックユニットのベクトル表現とに基づいて、現在のセマンティックユニットとローカルコンテキストセマンティックユニットに対応するローカル翻訳結果を生成することができる。
【0043】
例えば、現在のセマンティックユニットが
であり、ローカルセマンティックユニットが
を含む場合、対応するローカル翻訳結果は、「Today’s introduction is mainly divided into」である。
【0044】
ステップ203において、ローカル翻訳結果とローカルコンテキストセマンティックユニットの翻訳結果とに基づいて、現在のセマンティックユニットの翻訳結果を生成する。
【0045】
本出願の実施例では、ローカル翻訳結果とローカルコンテキストセマンティックユニットの翻訳結果とに基づいて、現在のセマンティックユニットの翻訳結果を生成するステップは、ローカルコンテキストセマンティックユニットの翻訳結果を取得し、ローカル翻訳結果からローカルコンテキストセマンティックユニットの翻訳結果を除去して、現在のセマンティックユニットの翻訳結果を取得するステップを含むことができる。
【0046】
なお、現在のセマンティックユニットとローカルコンテキストセマンティックユニットに対応するローカル翻訳結果は、現在のセマンティックユニットの翻訳結果とローカルコンテキストセマンティックユニットの翻訳結果で構成される。
【0047】
例えば、現在のセマンティックユニットが
であり、ローカルセマンティックユニットが
を含む場合、対応するローカル翻訳結果は「Today’s introduction is mainly divided into」であり、その後ローカルセマンティックユニット
の翻訳結果「Today’s introduction」を取得でき、上記ローカル翻訳結果「Today’s introduction is mainly divided into」から「Today’s introduction」を除去して、現在のセマンティックユニット
の翻訳結果である「is mainly divided into」を取得することができる。
【0048】
これによって、当該方法は、グローバルコンテキストセマンティックユニットのベクトル表現に基づいて現在のセマンティックユニットのベクトル表現を生成し、その後現在のセマンティックユニットのベクトル表現とローカルコンテキストセマンティックユニットのベクトル表現とに基づいて、現在のセマンティックユニットとローカルコンテキストセマンティックユニットに対応するローカル翻訳結果を生成し、ローカル翻訳結果とローカルコンテキストセマンティックユニットの翻訳結果とに基づいて、現在のセマンティックユニットの翻訳結果を生成することができる。
【0049】
上記任意の実施例に基づいて、図3に示すように、ステップ201におけるグローバルコンテキストセマンティックユニットのベクトル表現に基づいて、現在のセマンティックユニットのベクトル表現を生成するステップは、以下のステップ301~303を含む。
【0050】
ステップ301において、現在のセマンティックユニットを少なくとも1つの単語セグメンテーションに分割する。
【0051】
なお、各セマンティックユニットに少なくとも1つの単語セグメンテーションが含まれる場合、現在のセマンティックユニットを少なくとも1つの単語セグメンテーションに分割することができる。
【0052】
選択的に、予め設定された単語セグメンテーション単位に従って、現在のセマンティックユニットを少なくとも1つの単語セグメンテーションに分割できる。ここで、単語セグメンテーション単位には字、文字、単語、語句などが含まれるが、これに限定されない。
【0053】
例えば、現在のセマンティックユニットが
であり、単語セグメンテーション単位が字である場合、
という4つの単語セグメンテーションに分割されてもよい。
【0054】
ステップ302において、単語セグメンテーションのベクトル表現とグローバルコンテキストセマンティックユニットのベクトル表現とに基づいて、単語セグメンテーションのグローバル融合ベクトル表現を生成する。
【0055】
なお、各単語セグメンテーションが1つのベクトル表現に対応する場合、単語セグメンテーションのベクトル表現とグローバルコンテキストセマンティックユニットのベクトル表現とに基づいて、単語セグメンテーションのグローバル融合ベクトル表現を生成することができる。
【0056】
選択的に、単語セグメンテーションのベクトル表現とグローバルコンテキストセマンティックユニットのベクトル表現とに基づいて、単語セグメンテーションのグローバル融合ベクトル表現を生成するステップは、単語セグメンテーションのベクトル表現に対して線性変換を行って、セマンティックユニットレベルの単語セグメンテーションのセマンティックユニットベクトル表現を生成し、単語セグメンテーションのセマンティックユニットベクトル表現に基づいて、グローバルコンテキストセマンティックユニットのベクトル表現に対して特徴抽出を行って、グローバル特徴ベクトルを生成し、グローバル特徴ベクトルと単語セグメンテーションのベクトル表現とを融合させて、単語セグメンテーションのグローバル融合ベクトル表現を生成することを含むことができる。
【0057】
選択的に、上記単語セグメンテーションのグローバル融合ベクトル表現を生成するプロセスは、以下の式によって実現することができる。
=f(h
=MutiHeadAttention(q、S)(1≦i≦M)
λ=σ(Wh+Ud

=λ+(1-λ)d
【0058】
ここで、hは、単語セグメンテーションのベクトル表現であり、f(.)は、線性変換関数であり、qは、単語セグメンテーションのセマンティックユニットベクトル表現であり、MutiHeadAttention(.)は、注意力関数であり、dは、グローバル特徴ベクトルであり、h は、単語セグメンテーションのグローバル融合ベクトル表現である。
【0059】
ここで、S(1≦i≦M)は、グローバルコンテキストセマンティックユニットのベクトル表現であり、Sは、グローバルコンテキストセマンティックユニットの1番目のセマンティックユニットのベクトル表現であり、Sは、グローバルコンテキストセマンティックユニットの2番目のセマンティックユニットのベクトル表現であり、このように類推して、Sは、グローバルコンテキストセマンティックユニットのM番目のセマンティックユニットのベクトル表現である。
【0060】
ここで、W、U、σはいずれも係数であり、実際の状況に応じて設定されてもよい。
【0061】
例えば、図4に示すように、現在のセマンティックユニットが
であり、ローカルコンテキストセマンティックユニットが
であり、グローバルコンテキストセマンティックユニットが
である。現在のセマンティックユニット

という4つの単語セグメンテーションに分割でき、そのうちの任意の1つの単語セグメンテーションのベクトル表現hに対して線性変換を行って、セマンティックユニットレベルの単語セグメンテーションのセマンティックユニットベクトル表現qを生成し、そして単語セグメンテーションのセマンティックユニットベクトル表現qに基づいて、グローバルコンテキストセマンティックユニットのベクトル表現S(1≦i≦4)に対して特徴抽出を行って、グローバル特徴ベクトルdを生成し、その後グローバル特徴ベクトルdと単語セグメンテーションのベクトル表現hとを融合させて、単語セグメンテーションのグローバル融合ベクトル表現h を生成することができる。なお、本実施例では、Sはセマンティックユニット
に対応するベクトル表現であり、Sはセマンティックユニット
に対応するベクトル表現であり、Sはセマンティックユニット
に対応するベクトル表現であり、Sはセマンティックユニット
に対応するベクトル表現である。
【0062】
なお、当該方法は、グローバルコンテキストセマンティックユニットのベクトル表現に対して特徴抽出を行って、グローバル特徴ベクトルを生成し、その後グローバル特徴ベクトルと単語セグメンテーションのベクトル表現とを融合させて、単語セグメンテーションのグローバル融合ベクトル表現を生成することができ、グローバル融合ベクトル表現は、グローバルコンテキストセマンティックユニットのベクトル表現の特徴を学習できる。
【0063】
ステップ303において、単語セグメンテーションのグローバル融合ベクトル表現に基づいて、現在のセマンティックユニットのベクトル表現を生成する。
【0064】
なお、現在のセマンティックユニットは少なくとも1つの単語セグメンテーションに分割されてもよく、各単語セグメンテーションが1つのグローバル融合ベクトル表現に対応する場合、現在のセマンティックユニットから分割されたすべての単語セグメンテーションのグローバル融合ベクトル表現に基づいて、現在のセマンティックユニットのベクトル表現を生成することができる。
【0065】
選択的に、単語セグメンテーションのグローバル融合ベクトル表現に基づいて、現在のセマンティックユニットのベクトル表現を生成するステップは、単語セグメンテーションのグローバル融合ベクトル表現に対応する重みを決定し、単語セグメンテーションのグローバル融合ベクトル表現と対応する重みとに基づいて、現在のセマンティックユニットのベクトル表現を算出することを含むことができる。当該方法は、加重平均法を用いて現在のセマンティックユニットのベクトル表現を取得することができる。
【0066】
これにより、当該方法は、現在のセマンティックユニットを少なくとも1つの単語セグメンテーションに分割し、その後単語セグメンテーションのベクトル表現とグローバルコンテキストセマンティックユニットのベクトル表現とに基づいて、単語セグメンテーションのグローバル融合ベクトル表現を生成し、単語セグメンテーションのグローバル融合ベクトル表現に基づいて、現在のセマンティックユニットのベクトル表現を生成することができる。
【0067】
上記任意の実施例に基づいて、ステップ102におけるトレーニング済みの文章翻訳モデルの取得は、サンプル文章とサンプル文章に対応するサンプル翻訳結果とを取得し、サンプル文章とサンプル翻訳結果とに基づいて、トレーニング対象の文章翻訳モデルをトレーニングして、トレーニング済みの文章翻訳モデルを取得することを含むことができる。
【0068】
なお、文章翻訳モデルの性能を向上させるために、大量のサンプル文章とサンプル文章に対応するサンプル翻訳結果とを取得する。
【0069】
具体的な実施では、サンプル文章をトレーニング対象の文章翻訳モデルに入力して、トレーニング対象の文章翻訳モデルから出力された第1サンプル翻訳結果を取得し、第1サンプル翻訳結果とサンプル翻訳結果との間に大きな誤差がある可能性があり、第1サンプル翻訳結果とサンプル翻訳結果との間の誤差に基づいて、トレーニング対象の文章翻訳モデルを、トレーニング対象の文章翻訳モデルが収束するか、または反復回数が予め設定された反復回数閾値に達するか、またはモデル精度が予め設定された精度閾値に達するまでトレーニングし、モデルのトレーニングを終了し、最後のトレーニングによって取得された文章翻訳モデルをトレーニング済みの文章翻訳モデルとすることができる。ここで、反復回数閾値、精度閾値は実際の状況に応じて設定されてもよい。
【0070】
これにより、当該方法は、サンプル文章とサンプル翻訳結果とに基づいて、トレーニング対象の文章翻訳モデルをトレーニングして、トレーニング済みの文章翻訳モデルを取得することができる。
【0071】
図5は、本出願の第1実施例に係る文章翻訳装置のブロック図である。
【0072】
図5に示すように、本出願の実施例に係る文章翻訳装置500は、取得モジュール501と入力モジュール502とを含む。
【0073】
取得モジュール501は、翻訳対象の文章を取得する。
【0074】
入力モジュール502は、前記翻訳対象の文章をトレーニング済みの文章翻訳モデルに入力し、前記文章翻訳モデルによって前記翻訳対象の文章を複数のセマンティックユニットに分割し、現在のセマンティックユニットの前のN個のセマンティックユニットをローカルコンテキストセマンティックユニットとして決定し、前記ローカルコンテキストセマンティックユニットの前のM個のセマンティックユニットをグローバルコンテキストセマンティックユニットとして決定し、前記ローカルコンテキストセマンティックユニットと前記グローバルコンテキストセマンティックユニットとに基づいて、前記現在のセマンティックユニットの翻訳結果を生成し、前記Nは整数であり、前記Mは整数である。
【0075】
以上のように、本出願の実施例に係る文章翻訳装置は、翻訳対象の文章をトレーニング済みの文章翻訳モデルに入力し、ローカルコンテキストセマンティックユニットとグローバルコンテキストセマンティックユニットとに基づいて、現在のセマンティックユニットの翻訳結果を生成することで、関連技術における翻訳に一貫性がなく、コンテキストの翻訳が一致しないという問題を解決でき、翻訳結果の精度を向上させ、文章翻訳シナリオに適応する。
【0076】
図6は、本出願の第2実施例に係る文章翻訳装置のブロック図である。
【0077】
図6に示すように、本出願の実施例に係る文章翻訳装置600は、取得モジュール601、入力モジュール602及びトレーニングモジュール603を含む。
【0078】
ここで、取得モジュール601は、取得モジュール501と同じ機能及び構造を有する。
【0079】
本出願の一実施例では、前記入力モジュール602は、前記グローバルコンテキストセマンティックユニットのベクトル表現に基づいて、前記現在のセマンティックユニットのベクトル表現を生成するための第1生成ユニット6021と、前記現在のセマンティックユニットのベクトル表現と前記ローカルコンテキストセマンティックユニットのベクトル表現とに基づいて、前記現在のセマンティックユニットと前記ローカルコンテキストセマンティックユニットに対応するローカル翻訳結果を生成するための第2生成ユニット6022と、前記ローカル翻訳結果と前記ローカルコンテキストセマンティックユニットの翻訳結果とに基づいて、前記現在のセマンティックユニットの翻訳結果を生成するための第3生成ユニット6023と、を含む。
【0080】
本出願の一実施例では、前記第1生成ユニット6021は、前記現在のセマンティックユニットを少なくとも1つの単語セグメンテーションに分割するための分割サブユニットと、前記単語セグメンテーションのベクトル表現と前記グローバルコンテキストセマンティックユニットのベクトル表現とに基づいて、前記単語セグメンテーションのグローバル融合ベクトル表現を生成するための第1生成サブユニットと、前記単語セグメンテーションのグローバル融合ベクトル表現に基づいて、前記現在のセマンティックユニットのベクトル表現を生成するための第2生成サブユニットと、を含む。
【0081】
本出願の一実施例では、前記第1生成サブユニットは、前記単語セグメンテーションのベクトル表現に対して線性変換を行って、セマンティックユニットレベルの前記単語セグメンテーションのセマンティックユニットベクトル表現を生成し、前記単語セグメンテーションのセマンティックユニットベクトル表現に基づいて、前記グローバルコンテキストセマンティックユニットのベクトル表現に対して特徴抽出を行って、グローバル特徴ベクトルを生成し、前記グローバル特徴ベクトルと前記単語セグメンテーションのベクトル表現とを融合させて、前記単語セグメンテーションのグローバル融合ベクトル表現を生成する。
【0082】
本出願の一実施例では、前記第2生成サブユニットは、前記単語セグメンテーションのグローバル融合ベクトル表現に対応する重みを決定し、前記単語セグメンテーションのグローバル融合ベクトル表現と対応する重みとに基づいて、前記現在のセマンティックユニットのベクトル表現を算出する。
【0083】
本出願の一実施例では、前記トレーニングモジュール603は、サンプル文章と前記サンプル文章に対応するサンプル翻訳結果とを取得するための取得ユニット6031と、前記サンプル文章と前記サンプル翻訳結果とに基づいて、トレーニング対象の文章翻訳モデルをトレーニングして、前記トレーニング済みの文章翻訳モデルを取得するためのトレーニングユニット6032と、を含む。
【0084】
以上のように、本出願の実施例に係る文章翻訳装置は、翻訳対象の文章をトレーニング済みの文章翻訳モデルに入力し、ローカルコンテキストセマンティックユニットとグローバルコンテキストセマンティックユニットとに基づいて、現在のセマンティックユニットの翻訳結果を生成することで、関連技術における翻訳に一貫性がなく、コンテキストの翻訳が一致しないという問題を解決でき、翻訳結果の精度を向上させ、文章翻訳シナリオに適応する。
【0085】
本出願の実施例によれば、本出願は、電子機器、読み取り可能な記憶媒体及びコンピュータプログラム製品をさらに提供する。
本出願の実施例によれば、本出願は、コンピュータプログラムを提供し、コンピュータプログラムがプロセッサによって実行される場合、本出願によって提供される文章翻訳方法が実現される。
【0086】
図7に示すように、それは本出願の実施例に係る文章翻訳方法の電子機器のブロック図である。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレームコンピュータ、及び他の適切なコンピュータなどの様々な形式のデジタルコンピュータを表すことを目的とする。電子機器は、インテリジェント音声インタラクティブデバイス、パーソナルデジタル処理、携帯電話、スマートフォン、ウェアラブルデバイス、及び他の同様のコンピューティングデバイスなどの様々な形式のモバイル装置を表すこともできる。本明細書で示されるコンポーネント、それらの接続と関係、及びそれらの機能は、単なる例であり、本明細書の説明及び/又は要求される本出願の実現を制限することを意図したものではない。
【0087】
図7示すように、当該電子機器は、1つ又は複数のプロセッサ701と、メモリ702と、高速インターフェースと低速インターフェースを含む各コンポーネントを接続するためのインターフェースと、を含む。各コンポーネントは、異なるバスで相互に接続され、共通のマザーボードに取り付けられてもよいし、又は必要に応じて他の方式で取り付けられてもよい。プロセッサ701は、外部入力/出力装置(インターフェースに結合されたディスプレイデバイスなど)にGUIの図形情報をディスプレイするためにメモリに記憶されている命令を含む、電子機器内に実行される命令を処理することができる。他の実施形態では、必要であれば、複数のプロセッサ及び/又は複数のバスを、複数のメモリと複数のメモリとともに使用することができる。同様に、複数の電子機器を接続することができ、各電子機器は、部分的な必要な操作(例えば、サーバアレイ、ブレードサーバ、又はマルチプロセッサシステムとする)を提供する。図7では、1つのプロセッサ701を例とする。
【0088】
メモリ702は、本出願により提供される非一時的なコンピュータ読み取り可能な記憶媒体である。その中、前記メモリには、少なくとも1つのプロセッサによって実行される命令を記憶して、前記少なくとも1つのプロセッサが本出願により提供される文章翻訳方法を実行することができるようにする。本出願の非一時的なコンピュータ読み取り可能な記憶媒体には、コンピュータに本出願により提供される文章翻訳方法を実行させるためのコンピュータ命令が記憶されている。
【0089】
メモリ702は、非一時的なコンピュータ読み取り可能な記憶媒体として、本出願の実施例における文章翻訳方法に対応するプログラム命令/モジュール(例えば、図5に示す取得モジュール501及び入力モジュール502)のような、非一時的なソフトウェアプログラム、非一時的なコンピュータ実行可能なプログラム及びモジュールを記憶する。プロセッサ701は、メモリ702に記憶されている非一時的なソフトウェアプログラム、命令及びモジュールを実行することによって、サーバの様々な機能アプリケーション及びデータ処理を実行し、即ち上記の方法の実施例における文章翻訳方法を実現する。
【0090】
メモリ702は、プログラムストレージ領域とデータストレージ領域とを含むことができ、その中、プログラムストレージ領域は、オペレーティングシステム、少なくとも1つの機能に必要なアプリケーションを記憶することができ、データストレージ領域は、文章翻訳方法の電子機器の使用によって作成されたデータなどを記憶することができる。また、メモリ702は、高速ランダムアクセスメモリを含むことができ、不揮発性メモリ、例えば少なくとも1つの磁気ディスクストレージデバイス、フラッシュメモリデバイス、又は他の非一時的なソリッドステートストレージデバイスをさらに含むことができる。いくつかの実施例では、メモリ702は、プロセッサ701に対して遠隔に設定されたメモリを選択的に含むことができ、これらの遠隔メモリは、ネットワークを介して文章翻訳方法の電子機器に接続されることができる。上記ネットワークの例は、インターネット、イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク及びそれらの組み合わせを含むが、これらに限定されない。
【0091】
文章翻訳方法の電子機器は、入力装置703と出力装置704とをさらに含むことができる。プロセッサ701、メモリ702、入力装置703、及び出力装置704は、バス又は他の方式を介して接続することができ、図7では、バスを介して接続することを例とする。
【0092】
入力装置703は、入力された数字又は文字情報を受信することができ、文章翻訳方法の電子機器のユーザ設定及び機能制御に関するキー信号入力を生成することができ、例えば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、指示杆、1つ又は複数のマウスボタン、トラックボール、ジョイスティックなどの入力装置である。出力装置704は、ディスプレイデバイス、補助照明デバイス(例えば、LED)、及び触覚フィードバックデバイス(例えば、振動モータ)などを含むことができる。当該ディスプレイデバイスは、液晶ディスプレイ(LCD)、発光ダイオード(LED)ディスプレイ、及びプラズマディスプレイを含むことができるが、これらに限定されない。いくつかの実施形態では、ディスプレイデバイスは、タッチスクリーンであってもよい。
【0093】
本明細書で説明されるシステムと技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、特定用途向けASIC(特定用途向け集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はそれらの組み合わせで実現することができる。これらの様々な実施形態は、1つ又は複数のコンピュータプログラムで実施されることを含むことができ、当該1つ又は複数のコンピュータプログラムは、少なくとも1つのプログラマブルプロセッサを含むプログラム可能なシステムで実行及び/又は解釈されることができ、当該プログラマブルプロセッサは、特定用途向け又は汎用プログラマブルプロセッサであってもよく、ストレージシステム、少なくとも1つの入力装置、及び少なくとも1つの出力装置からデータ及び命令を受信し、データ及び命令を当該ストレージシステム、当該少なくとも1つの入力装置、及び当該少なくとも1つの出力装置に伝送することができる。
【0094】
これらのコンピューティングプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、又はコードとも呼ばれる)は、プログラマブルプロセッサの機械命令を含み、高レベルのプロセス及び/又は対象指向プログラミング言語、及び/又はアセンブリ/機械言語でこれらのコンピューティングプログラムを実施することができる。 本明細書に使用されるような、「機械読み取り可能な媒体」及び「コンピュータ読み取り可能な媒体」という用語は、機械命令及び/又はデータをプログラマブルプロセッサに提供するための任意のコンピュータプログラム製品、機器、及び/又は装置(例えば、磁気ディスク、光ディスク、メモリ、プログラマブルロジックデバイス(PLD))を指し、機械読み取り可能な信号である機械命令を受信する機械読み取り可能な媒体を含む。「機械読み取り可能な信号」という用語は、機械命令及び/又はデータをプログラマブルプロセッサに提供するための任意の信号を指す。
【0095】
ユーザとのインタラクションを提供するために、コンピュータ上でここで説明されているシステム及び技術を実施することができ、当該コンピュータは、ユーザに情報を表示するためのディスプレイ装置(例えば、CRT(陰極線管)又はLCD(液晶ディスプレイ)モニタ)と、キーボード及びポインティングデバイス(例えば、マウス又はトラックボール)とを有し、ユーザは、当該キーボード及び当該ポインティングデバイスによって入力をコンピュータに提供することができる。他の種類の装置も、ユーザとのインタラクションを提供することができ、例えば、ユーザに提供されるフィードバックは、任意の形式のセンシングフィードバック(例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック)であってもよく、任意の形式(音響入力と、音声入力と、触覚入力とを含む)でユーザからの入力を受信することができる。
【0096】
ここで説明されるシステム及び技術は、バックエンドコンポーネントを含むコンピューティングシステム(例えば、データサーバとする)、又はミドルウェアコンポーネントを含むコンピューティングシステム(例えば、アプリケーションサーバー)、又はフロントエンドコンポーネントを含むコンピューティングシステム(例えば、グラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータ、ユーザは、当該グラフィカルユーザインタフェース又は当該ウェブブラウザによってここで説明されるシステム及び技術の実施形態とインタラクションする)、又はこのようなバックエンドコンポーネントと、ミドルウェアコンポーネントと、フロントエンドコンポーネントの任意の組み合わせを含むコンピューティングシステムで実施することができる。任意の形式又は媒体のデジタルデータ通信(例えば、通信ネットワーク)によってシステムのコンポーネントを相互に接続されることができる。通信ネットワークの例は、ローカルエリアネットワーク(LAN)と、ワイドエリアネットワーク(WAN)と、インターネットとを含む。
【0097】
コンピュータシステムは、クライアントとサーバとを含むことができる。クライアントとサーバは、一般に、互いに離れており、通常に通信ネットワークを介してインタラクションする。対応するコンピュータ上で実行され、かつ互いにクライアント-サーバ関係を有するコンピュータプログラムによってクライアントとサーバとの関係が生成される。サーバーはクラウドサーバであっても良く、クラウドコンピューティングサーバまたはクラウドホストとも呼ばれ、クラウドコンピューティングサービスシステムにおける1つのホスト製品であり、従来の物理ホストとVPSサービス(「Virtual Private Server」,または「VPS」と省略する)に存在する管理の難しさ、業務拡張性の弱いという欠陥を解決した。サーバーは分散システムのサーバであってもよく、またはブロックチェーンと組合わせたサーバであってもよい。
【0098】
本出願の実施例によれば、本出願は、コンピュータプログラムが含まれるコンピュータプログラム製品を提供し、前記コンピュータプログラムがプロセッサによって実行される場合、本出願の上記実施例の文章翻訳方法が実現される。
【0099】
本出願の実施例の技術案によれば、翻訳対象の文章をトレーニング済みの文章翻訳モデルに入力し、ローカルコンテキストセマンティックユニットとグローバルコンテキストセマンティックユニットとに基づいて、現在のセマンティックユニットの翻訳結果を生成することで、関連技術における翻訳に一貫性がなく、コンテキストの翻訳が一致しないという問題を解決でき、翻訳結果の精度を向上させ、文章翻訳シナリオに適応する。
【0100】
なお、上記に示される様々な形式のフローを使用して、ステップを並べ替え、追加、又は削除することができることを理解されたい。例えば、本出願に記載されている各ステップは、並列に実行されてもよいし、順次実行されてもよいし、異なる順序で実行されてもよいが、本出願で開示されている技術案が所望の結果を実現することができれば、本明細書では限定されない。
【0101】
上記具体的な実施形態は、本出願の保護範囲を制限するものではない。当業者は、設計要求と他の要因に応じて、様々な修正、組み合わせ、サブコンビネーション、及び代替を行うことができる。任意の本出願の精神と原則内で行われる修正、同等の置換、及び改善などは、いずれも本出願の保護範囲内に含まれるべきである。
図1
図2
図3
図4
図5
図6
図7