特開2023-155158 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ アクセンチュア　グローバル　ソリューションズ　リミテッドの特許一覧

特開2023-155158スマート翻訳システム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9A1
9A2
9B
10
11A
11B
11C
12

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2023155158

(43)【公開日】2023-10-20

(54)【発明の名称】スマート翻訳システム

(51)【国際特許分類】

G06F 16/38 20190101AFI20231013BHJP

【ＦＩ】

G06F16/38

【審査請求】有

【請求項の数】20

【出願形態】ＯＬ

【外国語出願】

(21)【出願番号】P 2023018051

(22)【出願日】2023-02-09

(31)【優先権主張番号】202211021330

(32)【優先日】2022-04-09

(33)【優先権主張国・地域又は機関】IN

(31)【優先権主張番号】17/900,704

(32)【優先日】2022-08-31

(33)【優先権主張国・地域又は機関】US

【公序良俗違反の表示】

（特許庁注：以下のものは登録商標）

１．ＭＡＣＯＳ

２．ＵＮＩＸ

３．Ｌｉｎｕｘ

(71)【出願人】

【識別番号】516172237

【氏名又は名称】アクセンチュアグローバルソリューションズリミテッド

(74)【代理人】

【識別番号】100102406

【弁理士】

【氏名又は名称】黒田健二

(74)【代理人】

【識別番号】100100240

【弁理士】

【氏名又は名称】松本孝

(72)【発明者】

【氏名】ガタゲ，プラカシュ

(72)【発明者】

【氏名】タンガラジ，ナヴィーンクマール

(72)【発明者】

【氏名】クルレカール，カウストゥブ

(72)【発明者】

【氏名】プラサド，スリーヴィディヤ

(72)【発明者】

【氏名】サンカラナラヤナン，スリラム

【テーマコード（参考）】

5B175

【Ｆターム（参考）】

5B175DA01

5B175FB03

5B175HB03

(57)【要約】（修正有）

【課題】アプリケーションから受信された入力コンテンツを翻訳メタデータ及びアプリケーションに基づき翻訳するスマート翻訳システム、方法及びストレージ媒体を提供する。
【解決手段】スマート翻訳システムは、入力コンテンツの翻訳がユーザキャッシュに存在するかどうかを最初に判断し、入力コンテンツの翻訳がユーザキャッシュに存在すると判断すると、翻訳をユーザキャッシュから読み出す。入力コンテンツの翻訳がユーザキャッシュに存在しないと判断すると、入力コンテンツのドメインコンテキスト及び言語コンテキストを判断し、コンテキストおよび翻訳メタデータに基づき自動翻訳エンジンを選択すし、アプリケーションのルックアンドフィールを保ちながら、翻訳済みコンテンツをアプリケーションを介してユーザに提示する。
【選択図】図５

【特許請求の範囲】

【請求項1】

少なくとも１つのアプリケーションプロセッサと、
機械可読命令を記憶する非一時的なプロセッサ可読媒体と、
を含むスマート翻訳システムであって、前記機械可読命令は前記アプリケーションプロセッサに、
入力コンテンツにアプリケーションを介してアクセスすることであって、
前記入力コンテンツは翻訳されるものである、
前記アクセスすることと、
前記入力コンテンツのソース言語と、前記入力コンテンツが翻訳されるターゲット言語とを含む翻訳メタデータを取得することと、
前記入力コンテンツに対応する翻訳済みコンテンツをユーザキャッシュから読み出し可能かどうかを判断することと、
前記ユーザキャッシュに前記入力コンテンツの前記翻訳済みコンテンツがあれば、前記ユーザキャッシュから前記翻訳済みコンテンツを得ることと、
そうではなく、前記入力コンテンツの前記翻訳済みコンテンツを前記ユーザキャッシュから読み出し不可能であれば、
前記入力コンテンツを提供している前記アプリケーションのタイプを判断すること、および
前記入力コンテンツの前記翻訳済みコンテンツであって、前記アプリケーションの前記タイプに基づき生成される前記翻訳済みコンテンツを、複数の自動翻訳エンジンから自動で選択された翻訳エンジンから得ることと、
前記入力コンテンツを表示するために使用される前記アプリケーションを介した、前記入力コンテンツの前記翻訳済みコンテンツの表示を可能にすることであって、
前記翻訳済みコンテンツは、前記アプリケーションを通して表示されるときに前記入力コンテンツの可視属性を保つ、
前記可能にすることと、
をさせる、スマート翻訳システム。

【請求項2】

前記入力コンテンツの前記翻訳済みコンテンツが前記ユーザキャッシュに存するかどうかを判断するために、前記プロセッサは、
翻訳のためにユーザにより提出された以前の入力コンテンツと、対応する翻訳済みコンテンツとを、関係する翻訳メタデータとともに前記ユーザキャッシュに記憶することと、
前記以前の入力コンテンツとの前記入力コンテンツの類似度を計算することと、
前記以前の入力コンテンツと前記入力コンテンツとの前記類似度が所定のコンテンツ類似度閾値を上回れば、前記ユーザキャッシュから前記翻訳済みコンテンツを提供することと、
をする、請求項１に記載のスマート翻訳システム。

【請求項3】

前記アプリケーションは、電子メールプログラム、ウェブブラウザ、およびソフトウェアアプリケーションのうちの少なくとも１つを含む、請求項１に記載のスマート翻訳システム。

【請求項4】

前記アプリケーションは、前記電子メールプログラムを含み、前記プロセッサはさらに、
１つ以上の電子メールのうちの少なくとも１つおよび対応する１つ以上の添付物を含む前記入力コンテンツにアクセスすることと、
前記１つ以上の電子メールを区切るヘッダおよびフッタを識別することと、
翻訳する前記入力コンテンツのユーザ選択を受信することと、
前記ユーザ選択の前記翻訳済みコンテンツを得ることと、
をする、請求項３に記載のスマート翻訳システム。

【請求項5】

前記ユーザ選択は、前記対応する１つ以上の添付物を含み、前記ユーザ選択の前記翻訳済みコンテンツを得るために、前記プロセッサはさらに、
前記１つ以上の電子メールから前記対応する１つ以上の添付物を取得することと、
前記対応する１つ以上の添付物それぞれの関連するファイルフォーマットを判断することと、
前記対応する１つ以上の添付物のデジタル化テキストコンテンツを識別することと、
前記関連するファイルフォーマットで前記１つ以上の添付物それぞれの翻訳済みファイルを生成することと、
をする、請求項４に記載のスマート翻訳システム。

【請求項6】

前記ユーザ選択は、１つ以上の電子メールのうちの前記１つをさらに含み、前記ユーザ選択の前記翻訳済みコンテンツを得るために、前記プロセッサはさらに、
前記翻訳メタデータに基づき前記１つ以上の電子メールのデジタル化テキストコンテンツの翻訳を得ることであって、
前記デジタル化テキストコンテンツの前記翻訳は、前記電子メールを区切る前記ヘッダおよびフッタを除く、
前記翻訳を得ることと、
前記１つ以上の電子メールそれぞれに対応する１つ以上の翻訳済み電子メールを含む前記翻訳済みコンテンツを生成することであって、前記１つ以上の翻訳済み電子メールはさらに、前記１つ以上の添付物それぞれの前記翻訳済みファイル１つ以上を添付されている、前記生成することと、
をする、請求項５に記載のスマート翻訳システム。

【請求項7】

前記アプリケーションは、前記ウェブブラウザを含み、前記入力コンテンツの前記翻訳済みコンテンツを得るために、前記プロセッサはさらに、
前記ウェブブラウザにより表示されるコンテンツの少なくとも一部分のユーザ選択を含む前記入力コンテンツを受信することと、
前記翻訳メタデータに基づき前記入力コンテンツの前記翻訳済みコンテンツを得ることと、
前記入力コンテンツの前記翻訳済みコンテンツの前記ウェブブラウザにおける表示を可能にすることと、
をする、請求項３に記載のスマート翻訳システム。

【請求項8】

前記入力コンテンツの前記翻訳済みコンテンツを得るために、前記プロセッサはさらに、
前記ウェブブラウザにより表示される前記コンテンツの前記一部分がテキストの画像を含むと判断することと、
前記画像から前記テキストを取得することと、
前記画像から取得された前記テキストの翻訳を得ることと、
をする、請求項７に記載のスマート翻訳システム。

【請求項9】

前記アプリケーションは、前記ソフトウェアアプリケーションを含み、前記プロセッサはさらに、
前記ソフトウェアアプリケーションのユーザインターフェースの少なくとも一部分のユーザ選択を受信することと、
前記翻訳メタデータに対して自動で選択されたデフォルトオプションのコンテキストメニューを前記ユーザ選択の上に重ねることと、
をする、請求項３に記載のスマート翻訳システム。

【請求項10】

前記入力コンテンツの前記翻訳済みコンテンツを得るために、前記プロセッサはさらに、
前記ソフトウェアアプリケーションの前記ユーザインターフェースの前記一部分に表示される、ラベルを含むもとのフィールドの値を取得することと、
前記値それぞれに対応する翻訳済みコンテンツを得ることと、
をする、請求項９に記載のスマート翻訳システム。

【請求項11】

前記翻訳メタデータに対する前記デフォルトオプションは、ユーザ編集可能である、請求項１に記載のスマート翻訳システム。

【請求項12】

アプリケーションを介した、前記入力コンテンツの前記翻訳済みコンテンツの前記表示を可能にするために、前記プロセッサは、
ラベルそれぞれの前記翻訳済みコンテンツを含む前記ラベルを生成することであって、前記生成されたラベルの背景が、前記ユーザインターフェースの前記一部分に表示される前記もとのフィールドの背景に一致するように設定される、前記生成することと、
前記生成されたラベルを前記もとのフィールドの上に重ねることと、
をする、請求項１１に記載のスマート翻訳システム。

【請求項13】

前記翻訳メタデータは、手動または自動で取得される、請求項１に記載のスマート翻訳システム。

【請求項14】

前記翻訳メタデータを手動で取得するために、前記プロセッサは、
前記翻訳メタデータのユーザリクエストを受信することと、
前記ユーザが前記翻訳メタデータの少なくとも一部を入力することを可能にするコンテキストメニューを提供することと、
をする、請求項１３に記載のスマート翻訳システム。

【請求項15】

人工知能（ＡＩ）ベースの翻訳を提供する方法であって、
翻訳される入力コンテンツを受信するステップと、
前記入力コンテンツのソース言語と、前記入力コンテンツが翻訳されるターゲット言語とを含む翻訳メタデータを取得するステップと、
前記入力コンテンツの翻訳済みコンテンツがユーザキャッシュに存するかどうかを判断するステップと、
前記ユーザキャッシュに前記入力コンテンツの前記翻訳済みコンテンツがあれば、前記ユーザキャッシュから前記翻訳済みコンテンツを得るステップと、
そうではなく、前記入力コンテンツの前記翻訳済みコンテンツが前記ユーザキャッシュに記憶されていなければ、
前記入力コンテンツに関連するコンテキストを取得するステップ、
前記コンテキストに基づき複数の自動翻訳エンジンから翻訳エンジンを自動で選択するステップ、および
前記選択された翻訳エンジンから前記入力コンテンツの前記翻訳済みコンテンツを得るステップと、
前記入力コンテンツを表示するために使用されるアプリケーションを介した、前記入力コンテンツの前記翻訳済みコンテンツの表示を可能にするステップであって、
前記翻訳済みコンテンツは、前記入力コンテンツのものと類似した可視属性を用いて前記アプリケーションを通して表示される、
前記可能にするステップと、
を含む方法。

【請求項16】

翻訳される前記入力コンテンツを受信するステップはさらに、
前記アプリケーションのユーザインターフェース（ＵＩ）上に表示されるコンテンツのユーザ選択を受信するステップ
を含む、請求項１５に記載の方法。

【請求項17】

前記入力コンテンツの前記コンテキストを取得するステップはさらに、
前記入力コンテンツのテキストコンテンツを取得するステップと、
機械学習（ＭＬ）ドメイン分類モデルに前記テキストコンテンツを提供することにより前記入力コンテンツのドメインコンテキストを得るステップと、
前記ターゲット言語に基づき前記入力コンテンツの言語コンテキストを得るステップと、
を含む、請求項１５に記載の方法。

【請求項18】

前記選択された翻訳エンジンから前記入力コンテンツの前記翻訳済みコンテンツを得るステップはさらに、
前記入力コンテンツを構文解析およびトークン化するステップと、
ｎ－ｇｒａｍおよび推論規則のうちの１つ以上に基づき前記入力コンテンツから機密データを識別するステップと、
翻訳のために前記選択された翻訳エンジンに前記機密データを提供する前に、前記入力コンテンツからの前記機密データをマスキングするステップと、
を含む、請求項１５に記載の方法。

【請求項19】

機械可読命令を含む非一時的なプロセッサ可読ストレージ媒体であって、前記機械可読命令はプロセッサに、
翻訳される入力コンテンツにアプリケーションを介してアクセスすることと、
前記入力コンテンツのソース言語と、前記入力コンテンツが翻訳されるターゲット言語とを含む翻訳メタデータを取得することと、
前記入力コンテンツの翻訳済みコンテンツがユーザキャッシュに存するかどうかを判断することと、
前記ユーザキャッシュに前記入力コンテンツの前記翻訳済みコンテンツがあれば、前記ユーザキャッシュから前記翻訳済みコンテンツを得ることと、
そうではなく、前記入力コンテンツの前記翻訳済みコンテンツが前記ユーザキャッシュに記憶されていなければ、
前記入力コンテンツを提供している前記アプリケーションのタイプを判断すること、および
前記入力コンテンツの前記翻訳済みコンテンツであって、前記アプリケーションの前記タイプに基づき生成される前記翻訳済みコンテンツを、複数の自動翻訳エンジンから自動で選択された翻訳エンジンから得ることと、
前記入力コンテンツを表示するために使用される前記アプリケーションを介した、前記入力コンテンツの前記翻訳済みコンテンツの表示を可能にすることであって、
前記翻訳済みコンテンツは、前記アプリケーションを通して表示されるときに前記入力コンテンツの少なくとも１つの可視属性を保つ、
前記可能にすることと、
をさせる、非一時的なプロセッサ可読ストレージ媒体。

【請求項20】

前記プロセッサに、
前記表示の中で前記翻訳済みコンテンツの主要セクションをハイライトすることと、
前記翻訳済みコンテンツの要約を提供することと、
をさせるさらなる命令を含む、請求項１９に記載の非一時的なプロセッサ可読ストレージ媒体。

【発明の詳細な説明】

【技術分野】

【0001】

技術分野
本開示は、全般的に、アプリケーションから受信された入力コンテンツを翻訳するスマート翻訳システムに関する。

【0002】

優先権
本願は、２０２２年４月９日が出願日であるインド特許仮出願第２０２２１１０２１３３０号、および２０２２年８月３１日が出願日である米国特許出願第１７／９００，７０４号の優先権を主張するものであり、その開示全体を参照によって本願明細書に援用したものとする。

【背景技術】

【0003】

機械翻訳（ＭＴ：ｍａｃｈｉｎｅｔｒａｎｓｌａｔｉｏｎ）は、ユーザが或る言語のコンテンツを入力でき、自動翻訳エンジンが別のターゲット言語で入力コンテンツの全体的な翻訳を生成する、ツールのセットである。機械翻訳ツールは、人間による編集なしに翻訳を提供する。最も基本的な機械翻訳ソフトウェアは、逐語的な置き換えにより厳密に動作する。一部のテクノロジーは、精度を高めるために、ルールベースの翻訳または統計的にモデル化された翻訳を実装することができる。現代の機械学習（ＭＬ：ｍａｃｈｉｎｅｌｅａｒｎｉｎｇ）は、ＭＴをまったく新しい時代に導いたニューラルネットワークを含む。現代のニューラルネットワークベースの翻訳エンジンにより作り出される翻訳は、人手による翻訳と機械による翻訳との差を徐々になくしつつある。これは、人間の生産性を向上可能な、機械により実現される翻訳ツールをもたらす。

【発明の概要】

【課題を解決するための手段】

【0004】

一部の実装によれば、スマート翻訳システムは、少なくとも１つのアプリケーションプロセッサと、機械可読命令を記憶する非一時的なプロセッサ可読媒体とを含んでもよく、機械可読命令はアプリケーションプロセッサに、入力コンテンツにアプリケーションを介してアクセスすることであって、入力コンテンツは翻訳されるものである、アクセスすることと、入力コンテンツのソース言語と、入力コンテンツが翻訳されるターゲット言語とを含む翻訳メタデータを取得することと、入力コンテンツに対応する翻訳済みコンテンツをユーザキャッシュから読み出し可能かどうかを判断することと、ユーザキャッシュに入力コンテンツの翻訳済みコンテンツがあれば、ユーザキャッシュから翻訳済みコンテンツを得ることと、そうではなく、入力コンテンツの翻訳済みコンテンツをユーザキャッシュから読み出し不可能であれば、入力コンテンツを提供しているアプリケーションのタイプを判断すること、および入力コンテンツの翻訳済みコンテンツであって、アプリケーションのタイプに基づき生成される翻訳済みコンテンツを、複数の自動翻訳エンジンから自動で選択された翻訳エンジンから得ることと、入力コンテンツを表示するために使用されるアプリケーションを介した、入力コンテンツの翻訳済みコンテンツの表示を可能にすることであって、翻訳済みコンテンツは、アプリケーションを通して表示されるときに入力コンテンツの可視属性を保つ、可能にすることと、をさせる。

【0005】

上記のスマート翻訳システムの一部の実装によれば、入力コンテンツの翻訳済みコンテンツがユーザキャッシュに存するかどうかを判断するために、プロセッサは、翻訳のためにユーザにより提出された以前の入力コンテンツと、対応する翻訳済みコンテンツとを、関係する翻訳メタデータとともにユーザキャッシュに記憶することと、以前の入力コンテンツとの入力コンテンツの類似度を計算することと、以前の入力コンテンツと入力コンテンツとの類似度が所定のコンテンツ類似度閾値を上回れば、ユーザキャッシュから翻訳済みコンテンツを提供することと、をしてもよい。

【0006】

上記のスマート翻訳システムの一部の実装によれば、アプリケーションは、電子メールプログラム、ウェブブラウザ、およびソフトウェアアプリケーションのうちの少なくとも１つを含んでもよい。

【0007】

上記のスマート翻訳システムの一部の実装によれば、アプリケーションは、電子メールプログラムを含んでもよく、プロセッサはさらに、１つ以上の電子メールのうちの少なくとも１つおよび対応する１つ以上の添付物を含む入力コンテンツにアクセスすることと、１つ以上の電子メールを区切るヘッダおよびフッタを識別することと、翻訳する入力コンテンツのユーザ選択を受信することと、ユーザ選択の翻訳済みコンテンツを得ることと、をしてもよい。

【0008】

上記のスマート翻訳システムの一部の実装によれば、ユーザ選択は、対応する１つ以上の添付物を含んでもよく、ユーザ選択の翻訳済みコンテンツを得るために、プロセッサはさらに、１つ以上の電子メールから対応する１つ以上の添付物を取得することと、対応する１つ以上の添付物それぞれの関連するファイルフォーマットを判断することと、対応する１つ以上の添付物のデジタル化テキストコンテンツを識別することと、関連するファイルフォーマットで１つ以上の添付物それぞれの翻訳済みファイルを生成することと、をしてもよい。

【0009】

上記のスマート翻訳システムの一部の実装によれば、ユーザ選択は、１つ以上の電子メールのうちの１つをさらに含んでもよく、ユーザ選択の翻訳済みコンテンツを得るために、プロセッサはさらに、翻訳メタデータに基づき１つ以上の電子メールのデジタル化テキストコンテンツの翻訳を得ることであって、デジタル化テキストコンテンツの翻訳は、電子メールを区切るヘッダおよびフッタを除いてもよい、翻訳を得ることと、１つ以上の電子メールそれぞれに対応する１つ以上の翻訳済み電子メールを含む翻訳済みコンテンツを生成することであって、１つ以上の翻訳済み電子メールはさらに、１つ以上の添付物それぞれの翻訳済みファイル１つ以上を添付されていてもよい、生成することと、をしてもよい。

【0010】

上記のスマート翻訳システムの一部の実装によれば、アプリケーションは、ウェブブラウザを含んでもよく、入力コンテンツの翻訳済みコンテンツを得るために、プロセッサはさらに、ウェブブラウザにより表示されるコンテンツの少なくとも一部分のユーザ選択を含む入力コンテンツを受信することと、翻訳メタデータに基づき入力コンテンツの翻訳済みコンテンツを得ることと、入力コンテンツの翻訳済みコンテンツのウェブブラウザにおける表示を可能にすることと、をしてもよい。

【0011】

上記のスマート翻訳システムの一部の実装によれば、入力コンテンツの翻訳済みコンテンツを得るために、プロセッサはさらに、ウェブブラウザにより表示されるコンテンツの一部分がテキストの画像を含むと判断することと、画像からテキストを取得することと、画像から取得されたテキストの翻訳を得ることと、をしてもよい。

【0012】

上記のスマート翻訳システムの一部の実装によれば、アプリケーションは、ソフトウェアアプリケーションを含んでもよく、プロセッサはさらに、ソフトウェアアプリケーションのユーザインターフェースの少なくとも一部分のユーザ選択を受信することと、翻訳メタデータに対して自動で選択されたデフォルトオプションのコンテキストメニューをユーザ選択の上に重ねることと、をする。

【0013】

上記のスマート翻訳システムの一部の実装によれば、入力コンテンツの翻訳済みコンテンツを得るために、プロセッサはさらに、ソフトウェアアプリケーションのユーザインターフェースの一部分に表示される、ラベルを含むもとのフィールドの値を取得することと、値それぞれに対応する翻訳済みコンテンツを得ることと、をしてもよい。

【0014】

上記のスマート翻訳システムの一部の実装によれば、翻訳メタデータに対するデフォルトオプションは、ユーザ編集可能であってもよい。

【0015】

上記のスマート翻訳システムの一部の実装によれば、入力コンテンツの翻訳済みコンテンツのアプリケーションを介した表示を可能にするために、プロセッサは、ラベルそれぞれの翻訳済みコンテンツを含むラベルを生成することであって、生成されたラベルの背景が、ユーザインターフェースの一部分に表示されるもとのフィールドの背景に一致するように設定される、生成することと、生成されたラベルをもとのフィールドの上に重ねることと、をしてもよい。

【0016】

上記のスマート翻訳システムの一部の実装によれば、翻訳メタデータは、手動または自動で取得されてもよい。

【0017】

上記のスマート翻訳システムの一部の実装によれば、翻訳メタデータを手動で取得するために、プロセッサは、翻訳メタデータのユーザリクエストを受信することと、ユーザが翻訳メタデータの少なくとも一部を入力することを可能にするコンテキストメニューを提供することと、をしてもよい。

【0018】

一部の実装によれば、人工知能（ＡＩ）ベースの翻訳を提供する方法は、翻訳される入力コンテンツを受信するステップと、入力コンテンツのソース言語と、入力コンテンツが翻訳されるターゲット言語とを含む翻訳メタデータを取得するステップと、入力コンテンツの翻訳済みコンテンツがユーザキャッシュに存するかどうかを判断するステップと、ユーザキャッシュに入力コンテンツの翻訳済みコンテンツがあれば、ユーザキャッシュから翻訳済みコンテンツを得るステップと、そうではなく、入力コンテンツの翻訳済みコンテンツがユーザキャッシュに記憶されていなければ、入力コンテンツに関連するコンテキストを取得するステップ、コンテキストに基づき複数の自動翻訳エンジンから翻訳エンジンを自動で選択するステップ、および選択された翻訳エンジンから入力コンテンツの翻訳済みコンテンツを得るステップと、入力コンテンツを表示するために使用されるアプリケーションを介した、入力コンテンツの翻訳済みコンテンツの表示を可能にするステップであって、翻訳済みコンテンツは、入力コンテンツのものと類似した可視属性を用いてアプリケーションを通して表示される、可能にするステップと、を含んでもよい。

【0019】

上記の方法の一部の実装によれば、翻訳される入力コンテンツを受信するステップはさらに、アプリケーションのユーザインターフェース（ＵＩ）上に表示されるコンテンツのユーザ選択を受信するステップを含んでもよい。

【0020】

上記の方法の一部の実装によれば、入力コンテンツのコンテキストを取得するステップはさらに、入力コンテンツのテキストコンテンツを取得するステップと、機械学習（ＭＬ）ドメイン分類モデルにテキストコンテンツを提供することにより入力コンテンツのドメインコンテキストを得るステップと、ターゲット言語に基づき入力コンテンツの言語コンテキストを得るステップと、を含んでもよい。

【0021】

上記の方法の一部の実装によれば、選択された翻訳エンジンから入力コンテンツの翻訳済みコンテンツを得るステップはさらに、入力コンテンツを構文解析およびトークン化するステップと、ｎ－ｇｒａｍおよび推論規則のうちの１つ以上に基づき入力コンテンツから機密データを識別するステップと、翻訳のために選択された翻訳エンジンに機密データを提供する前に、入力コンテンツからの機密データをマスキングするステップと、を含んでもよい。

【0022】

一部の実装によれば、非一時的なプロセッサ可読ストレージ媒体は、機械可読命令を含んでもよく、機械可読命令はプロセッサに、翻訳される入力コンテンツにアプリケーションを介してアクセスすることと、入力コンテンツのソース言語と、入力コンテンツが翻訳されるターゲット言語とを含む翻訳メタデータを取得することと、入力コンテンツの翻訳済みコンテンツがユーザキャッシュに存するかどうかを判断することと、ユーザキャッシュに入力コンテンツの翻訳済みコンテンツがあれば、ユーザキャッシュから翻訳済みコンテンツを得ることと、そうではなく、入力コンテンツの翻訳済みコンテンツがユーザキャッシュに記憶されていなければ、入力コンテンツを提供しているアプリケーションのタイプを判断すること、および入力コンテンツの翻訳済みコンテンツであって、アプリケーションのタイプに基づき生成される翻訳済みコンテンツを、複数の自動翻訳エンジンから自動で選択された翻訳エンジンから得ることと、入力コンテンツを表示するために使用されるアプリケーションを介した、入力コンテンツの翻訳済みコンテンツの表示を可能にすることであって、翻訳済みコンテンツは、アプリケーションを通して表示されるときに入力コンテンツの少なくとも１つの可視属性を保つ、可能にすることと、をさせる。

【0023】

上記の非一時的なプロセッサ可読ストレージ媒体の一部の実装によれば、機械可読命令はプロセッサに、表示の中で翻訳済みコンテンツの主要セクションをハイライトすることと、翻訳済みコンテンツの要約を提供することと、をさせるさらなる命令を含んでもよい。

【0024】

本開示の特徴が、以下の図面に示される例によって明らかにされる。以下の図面において、同じ数字は同じ構成要素を示す。

【図面の簡単な説明】

【0025】

【図1】本願明細書において開示されている例による、スマート翻訳システムのブロック図を示す。

【図2】本願明細書において開示されている例による、入力プロセッサのブロック図を示す。

【図3】本願明細書において開示されている例による、アプリケーションファイルプロセッサのブロック図を示す。

【図4】本願明細書において開示されている例による、翻訳済みコンテンツ生成器のブロック図を示す。

【図5】本願明細書において開示されている例による、入力コンテンツを翻訳する方法のフローチャートを示す。

【図6】本願明細書において開示されている例による、入力コンテンツのコンテキストを判断する方法のフローチャートを示す。

【図7】本願明細書において開示されている例による、翻訳済み電子メール添付物を生成する方法のフローチャートを示す。

【図8】本願明細書において開示されている例による、翻訳済みユーザインターフェース（ＵＩ）を生成する方法のフローチャートを示す。

【図9A1】本願明細書において開示されている例による、ソフトウェアアプリケーションのＵＩの翻訳を示す。

【図9A2】本願明細書において開示されている例による、ソフトウェアアプリケーションのＵＩの翻訳を示す。

【図9B】本願明細書において開示されている例による、様々なオプションに基づき生成された翻訳済みＵＩを示す。

【図10】本願明細書において開示されている例による、電子メールアプリケーションにおけるスマート翻訳システムの機能を示す。

【図11A】本願明細書において開示されている例による、ブラウザベースのアプリケーション用に生成されるページ全体の翻訳を示す。

【図11B】本願明細書において開示されている例による、ブラウザベースのアプリケーション用に生成されるページ全体の翻訳を示す。

【図11C】本願明細書において開示されている例による、ＵＩの選択部分の翻訳を示す。

【図12】本願明細書において開示されている例による、スマート翻訳システムを実装するために使用され得るコンピュータシステムを示す。

【発明を実施するための形態】

【0026】

簡潔さおよび例示の目的で、本開示について、その例を参照することにより説明する。以下の説明では、本開示が十分に理解されるように特定の詳細事項が数多く記載される。しかし、当然のことながら、本開示はこうした特定の詳細事項に限定されることなく実施され得る。そのほか、本開示を不必要に曖昧にしないよう、一部の方法および構造を詳しく説明していない場合もある。本開示全体にわたって、「ａ（或る）」および「ａｎ（或る）」という用語は、少なくとも１つの特定の構成要素を示すよう意図される。本願明細書で使用されるとき、「ｉｎｃｌｕｄｅｓ（含む）」という用語は、含むがそれに限定されないという意味であり、「ｉｎｃｌｕｄｉｎｇ（含んでいる）」という用語は、含んでいるがそれに限定されないという意味である。「ｂａｓｅｄｏｎ（基づく）」という用語は、少なくとも部分的に基づくという意味である。

【0027】

翻訳される入力コンテンツにアプリケーションを介してアクセスし、アプリケーションを通して表示されるときに翻訳済みコンテンツが入力コンテンツのルックアンドフィールを保つように翻訳済みコンテンツが表示されることを可能にする、スマート翻訳システムが開示される。スマート翻訳システムは、ユーザから明示的に、または自動言語検出および推論されるユーザプリファレンスを介して黙示的に、入力コンテンツのソース言語と、入力コンテンツが翻訳されるターゲット言語とを含む翻訳メタデータを取得する。さらに、入力コンテンツを提供しているアプリケーションのタイプが判断される。例として、入力コンテンツを提供しているアプリケーションは、次に限定はされないが、電子メールアプリケーション、ウェブベースのアプリケーション、例えばデスクトップ／モバイルアプリケーションなどのソフトウェアアプリケーションを含むことができる。

【0028】

最初に、入力コンテンツの翻訳済みコンテンツがユーザキャッシュに存するかどうかが判断され、翻訳メタデータ通りの入力コンテンツの翻訳がユーザキャッシュに存在すれば、翻訳済みコンテンツがユーザキャッシュから読み出される。そうではなく、入力コンテンツの翻訳済みコンテンツがユーザキャッシュに記憶されていなければ、複数の自動翻訳エンジンから自動または手動で選択された翻訳エンジンから入力コンテンツの翻訳が得られる。或る例において、複数の翻訳エンジンは、外部翻訳エンジン、およびスマート翻訳システムに対してローカルの翻訳エンジンの、１つ以上を含むことができる。スマート翻訳システムは、翻訳エンジンの自動選択の前に一定の手順を実装する。この手順は、次に限定はされないが、入力コンテンツのドメインコンテキストおよび言語コンテキスト（例えばソース言語）を含むコンテキストを判断することを含む。入力コンテンツのドメインコンテキストは、テキストコンテンツを入力コンテンツから取得することと、構文解析し、トークン化し、トークンに品詞（ＰＯＳ：ｐａｒｔｓｏｆｓｐｅｅｃｈ）データを用いてタグ付けすることによってテキストコンテンツをさらに処理することとにより判断できる。そのように処理されたテキストコンテンツは、ドメインコンテキストの判断のために機械学習（ＭＬ）分類モデルに提供される。さらに、入力コンテンツの言語コンテキストは、ターゲット言語に基づくことができ、ドメインおよび言語固有の用語集データセットに基づきさらに判断されてもよい。処理されたテキストコンテンツはさらに、機密データを識別するために検査され、識別された任意の機密データは、テキストコンテンツが翻訳のために送信される前にマスキング／編集される。翻訳エンジンは、少なくともコンテキストに基づき複数の翻訳エンジンから自動で選択される。翻訳済みコンテンツが、アプリケーションのタイプおよび翻訳メタデータに基づき生成される。翻訳を生成するのに加えて、スマート翻訳システムはさらに、表示の中で翻訳済みコンテンツの主要セクションをハイライトし、翻訳済みコンテンツの要約を提供するように構成される。

【0029】

入力コンテンツの翻訳がユーザキャッシュに存在するかどうかを判断するために、スマート翻訳システムは、翻訳のためにユーザにより提出された以前の入力コンテンツと、関係する翻訳メタデータとともにユーザキャッシュに記憶されている対応する翻訳済みコンテンツとにアクセスする。以前の入力コンテンツとの入力コンテンツの類似度が計算される。以前のコンテンツと入力コンテンツとの類似度が所定のコンテンツ類似度閾値を上回る場合のみ、ユーザキャッシュから翻訳済みコンテンツが提供される。

【0030】

上述のとおり、少なくともアプリケーションに基づき、入力コンテンツに対して異なる翻訳が作り出されることができる。アプリケーションが電子メールプログラムを含む例では、入力コンテンツは、電子メールおよび対応する添付物のうちの１つ以上を含むことができる。電子メールを区切るヘッダおよびフッタが、翻訳される入力コンテンツから識別される。或る例において、ユーザ選択の中の電子メールのうちの１つ以上は、添付物を含むことができる。それに応じて、ユーザ選択に対して生成される翻訳済みコンテンツは、電子メールの翻訳だけでなく、電子メール添付物の翻訳も含むことになるであろう。翻訳済み電子メールおよびもとの電子メールのうちの１つ以上を、もとの添付物および翻訳済み添付物とともに記憶できる。

【0031】

或る例において、アプリケーションは、ウェブブラウザ内で実行されるウェブアプリケーションを含むことができる。この場合もやはり、ウェブブラウザにより表示されるコンテンツの少なくとも一部分のユーザ選択を含む入力コンテンツが、翻訳のために受信される。入力コンテンツの翻訳済みコンテンツは、ユーザキャッシュに存在しなければ、翻訳メタデータに基づき選択された翻訳エンジンから得られる。そのようにして生成された翻訳済みコンテンツがウェブブラウザ内に表示される。或る例において、ウェブブラウザにより表示されるコンテンツのユーザ選択部分がテキストの画像を含むと判断されれば、テキストが画像から取得され、画像から取得されたテキストの翻訳も得られる。

【0032】

或る例において、アプリケーションはソフトウェアアプリケーションを含むことができる。ユーザは、ソフトウェアアプリケーションのユーザインターフェース（ＵＩ）の少なくとも一部分を翻訳のために選択することができる。ＵＩの一部分を選択すると、翻訳メタデータに対するデフォルトオプションのコンテキストメニューが、ユーザ選択の上に重ねられることができ、コンテキストメニューは、翻訳メタデータに対して自動で選択されたデフォルトオプションを提供する。なお、翻訳メタデータに対するデフォルトオプションは、ユーザ編集可能とすることができる。最初に、ソフトウェアアプリケーションのユーザインターフェースの一部分に表示されるラベルを含む、もとのフィールドの値が取得され、その値それぞれに対応するコンテンツの翻訳が得られる。翻訳済みコンテンツを含むラベルが、もとのフィールドそれぞれに対して生成される。生成されるラベルの背景色は、ユーザインターフェースの一部分に表示されているもとのフィールドの背景と一致するように設定される。同じく、テキストコンテンツのフォントプロパティを、可能な限りもとのフィールドと一致するように設定できる。そのようにして生成された翻訳済みラベルが、もとのフィールドの上に重ねられる。

【0033】

本願明細書において開示されるスマート翻訳システムは、データのプライバシーを保ちながらテキストコンテンツの迅速、正確な自動翻訳を生成するという技術的課題に対する技術的解決策を提供する。したがって、スマート翻訳システムは、最初にユーザキャッシュをチェックして、受信された入力コンテンツが所与の翻訳メタデータに対して以前翻訳されたかどうかを判断するように構成される。翻訳されていれば、スマート翻訳システムは、自動翻訳エンジンにアクセスする代わりにユーザキャッシュから翻訳を読み出し、それによって時間および処理リソースを節約して、データが外部翻訳リソースに送信されることを防ぐ。入力コンテンツが自動翻訳エンジンに送信される場合でも、入力コンテンツは機密データのフィルタリングをされ、機密データがマスキングされるとよい。スマート翻訳システムはさらに、ユーザが表示全体ではなく表示の一部分のみを翻訳のために選択し、それによって自動翻訳のためのプロセッサリソースを節約しながらより迅速な翻訳を得られるように、翻訳の範囲に対するより強力な制御権をユーザに与える。さらにスマート翻訳システムは、種々のアプリケーションにより生成される種々のタイプのコンテンツの翻訳を、アプリケーションに対してカスタマイズされた形で処理するように構成される。例として、電子メールアプリケーションの事例では、翻訳は電子メールについてのみではなく、電子メールの添付物についても得ることができる。同じく、ソフトウェアアプリケーションの翻訳済みＵＩは、ソフトウェアアプリケーションのルックアンドフィールが保たれるように提示される。翻訳済みコンテンツのスペルおよび文法の訂正、主要セクションの識別、感情の識別、および要約の生成などの他の機能性も、開示されるスマート翻訳システムにより可能にされる。

【0034】

図１は、本願明細書において開示されている例によるスマート翻訳システム１００のブロック図を示す。スマート翻訳システム１００は、アプリケーション１５０を介して入力コンテンツ１５２を受信し、入力コンテンツ１５２に対応する翻訳済みコンテンツ１５６を、受信された入力コンテンツ１５２が由来したアプリケーション１５０のＵＩを介して提供する。種々の例において、スマート翻訳システム１００は、プラグインとしてアプリケーション１５０に組み込まれることが可能であり、またはスマート翻訳システム１００は、リモートシステムにより実行されてアプリケーション１５０に通信可能に結合されてもよい。いずれの事例においても、スマート翻訳システム１００は、アプリケーション１５０のＵＩ上のボタンまたはメニュー項目などのＵＩ要素を介してアクセスされ得る。ユーザは、アプリケーション１５０のＵＩの部分を全体的に選択して、そのＵＩ要素のアクティブ化を介してスマート翻訳システム１００を翻訳のためにトリガすることにより、入力コンテンツ１５２を生成してもよい。

【0035】

翻訳済みコンテンツ１５６は、アプリケーション１５０のルックアンドフィールが実質的に保たれた形でアプリケーション１５０を介して提供される。アプリケーション１５０の例は、次に限定はされないが、電子メールアプリケーション、ブラウザベースのアプリケーション、およびデスクトップアプリケーションまたはモバイルアプリケーション（「アプリ」）などのソフトウェアアプリケーションを含むことができる。本願明細書に詳述された翻訳済みコンテンツ１５６の種々のバージョンが、入力コンテンツ１５２が受信されるアプリケーション１５０に基づき生成されることが可能である。スマート翻訳システム１００は、入力受信器１０２、コンテンツ翻訳器１０４、および翻訳済みコンテンツプロバイダ１０６を含む。入力受信器１０２は、翻訳される入力コンテンツ１５２を翻訳メタデータ１５４とともに受信する。翻訳メタデータ１５４は、限定はされないが、入力コンテンツ１５２のソース言語、入力コンテンツ１５２が翻訳されるターゲット言語、アプリケーション１５０の識別メタデータ、およびそのほか入力コンテンツ１５２に含まれる１つ以上のファイルに関わるファイルフォーマットなどのメタデータを含むことができる。或る例において、スマート翻訳システム１００には、ソース言語がターゲット言語と同じであれば翻訳が不要であると判断するのに十分な知能がある。

【0036】

入力コンテンツ１５２は翻訳メタデータ１５４とともに、翻訳済みコンテンツ１５６の生成を可能にするコンテンツ翻訳器１０４に提供される。コンテンツ翻訳器１０４は、入力プロセッサ１４２、アプリケーションファイルプロセッサ１４４、および翻訳生成器１４６を含む。入力プロセッサ１４２は、入力コンテンツ１５２の翻訳済みコンテンツ１５６がすでにユーザキャッシュ１４８に存在するかどうかを判断するために、入力コンテンツ１５２にアクセスする。或る例において、スマート翻訳システム１００のユーザは、例えば、翻訳エンジンのユーザプリファレンス、ソース／ターゲット言語、ならびに書き起こしサービス（該当する場合）および頻繁にリクエストされる翻訳などのユーザ固有データを記憶する専用のユーザキャッシュ１４８など、キャッシュ上の特定のスペースを有してもよい。翻訳済みコンテンツ１５６がユーザキャッシュ１４８において発見されれば、それがユーザキャッシュ１４８から読み出され、複数の翻訳エンジン１２０－１，１２０－２，…，１２０－ｎなどの外部翻訳サービスにアクセスする必要がない。翻訳済みコンテンツ１５６をユーザキャッシュ１４８から読み出し不可能であれば、入力コンテンツ１５２はさらにアプリケーションファイルプロセッサ１４４により処理されて、翻訳生成器１４６に提供されるとよい。

【0037】

入力プロセッサ１４２は、翻訳済みコンテンツ１５６をユーザキャッシュ１４８から読み出し不可能であれば、ドメインコンテキストおよび言語コンテキストを含む入力コンテンツ１５２のコンテキスト１７２を判断するようにさらに構成可能である。或る例において入力プロセッサ１４２は、入力コンテンツ１５２を翻訳のために翻訳生成器１４６に送信する前に機密データを編集するようにさらに構成できる。或る例においてスマート翻訳システム１００は、翻訳動作において使用されるコンテキスト１７２などの情報を記憶するデータストア１７０に通信可能に結合されてもよい。入力コンテンツ１５２のコンテキスト１７２は、複数の翻訳エンジン１２０－１，１２０－２，…，１２０－ｎ（ｎは自然数であり、ｎ＝１，２，…）のうちの１つを自動で選択するために翻訳生成器１４６により使用される。或る例において、複数の翻訳エンジン１２０－１，１２０－２，…，１２０－ｎは、外部翻訳サービス、例えば次に限定はされないがＧｏｏｇｌｅ翻訳（登録商標）、ＡＷＳ（登録商標）、Ａｚｕｒｅ（登録商標）などがあるがこれらに限定はされない他のクラウドプロバイダにより提供される翻訳サービス、またはスマート翻訳システム１００によりホストされるローカル翻訳エンジンさえも含むことができる。複数の翻訳エンジン１２０－１，１２０－２，…，１２０－ｎは、ドメイン固有または言語固有の翻訳を提供するために動作してもよい。或る例において、ユーザには、ユーザが特定の翻訳エンジンを選択してそれによりスマート翻訳システム１００により行われた自動選択をオーバーライドできるようにするコンテキストメニューを、アプリケーション１５０を介して提示できる。選択された翻訳エンジンにより出力される翻訳済みバージョン１６２は、アプリケーション１５０を介して提示するために翻訳済みコンテンツプロバイダ１０６によりさらに処理される。

【0038】

或る例において、翻訳生成器１４６は、少なくともドメイン／言語コンテキストおよび翻訳メタデータ１５４に基づき複数の翻訳エンジン１２０－１，１２０－２，…，１２０－ｎのうちの１つを自動で選択するように構成された、エンジン選択器１４６－１を含むことができる。さらにエンジン選択器１４６－１は、以前の翻訳のために行われたエンジンの選択に関するユーザフィードバックを受信することができる。或る例において、エンジン選択器１４６－１は、各ソース／ターゲット言語ペアおよびコンテキスト１７２に対して最良のエンジンを予測するために、モデルフリー強化学習アルゴリズムを実装することができる。アルゴリズムは、ベルマン方程式を使用してＱ値（またはクオリティ値）を算出してもよい。Ｑテーブルが、各言語ペアおよびコンテキスト１７２の組み合わせに対してまず構築され、複数の翻訳エンジン１２０－１，１２０－２，…，１２０－ｎの数に対応するｎの行と、翻訳エンジンに関連する状態の数に対応するｍの列とがあり、ｎ，ｍは自然数であり、ｎ，ｍ≧１である。例示の状態は、優、良、並、劣、未対応などを含んでもよい。最初、Ｑテーブルのすべての値はゼロに設定され、エンジン選択器１４６－１は、複数の翻訳エンジン１２０－１，１２０－２，…，１２０－ｎからランダムなエンジン選択を行う。反復の数が増加するのに伴い、エンジン選択器１４６－１によって、ユーザからのフィードバックに基づきより正確なＱ値を算出でき、したがって、各コンテキスト１７２および言語ペアに対して最良の翻訳エンジンのエンジン選択器１４６－１による予測を改善できる。新たなエンジンが導入されたとき、または当初のセットアップ中、エンジン選択器１４６－１はその訓練段階にあると予想される。この時点で、語学専門家およびドメイン専門家が、新たに追加されたエンジンをランダムに評価し、新たなエンジンをユーザに渡す前に正確なフィードバックを提供することができる。機密データの編集が行われた入力コンテンツ１５２が、翻訳済みバージョン１６２を生成するために、選択された翻訳エンジンに送信される。

【0039】

入力プロセッサ１４２または翻訳生成器１４６のうちの一方（翻訳済みコンテンツ１５６がユーザキャッシュ１４８から読み出されたか、または翻訳済みバージョン１６２が複数の翻訳エンジン１２０－１，１２０－２，…，１２０－ｎのうちの１つにより生成されたかに応じる）からの出力が、翻訳済みバージョン１６２をアプリケーション１５０を介して表示するために処理する翻訳済みコンテンツプロバイダ１０６に提供される。翻訳済みバージョン１６２は、スペルおよび文法の訂正を含む翻訳後の精緻化、主要セクションの識別、翻訳済みコンテンツの要約などのためにさらに処理できる。さらに翻訳済みバージョン１６２は、翻訳済みコンテンツ１５６として提供される前に、よりターゲット言語に適した形式に、言語コンテキストに基づいてさらに修正できる。翻訳済みコンテンツ１５６は、アプリケーション１５０を通して表示されるとき、入力コンテンツ１５２のルックアンドフィールを保つ形でアプリケーション１５０を通して提示される。例として、入力電子メールに対応する翻訳済み電子メールは、受信された入力電子メールが由来したのと同じ電子メールアプリケーションを介して、入力電子メールと実質的に同一の形で提示／表示できる。同じく、翻訳済みウェブコンテンツは同じウェブブラウザ内で提示可能であり、アプリケーションの翻訳済みＵＩも、ソフトウェアアプリケーションのもとのＵＩと実質的に類似したルックアンドフィールを保つ。

【0040】

図２は、本願明細書において開示されている例による入力プロセッサ１４２のブロック図を示す。入力プロセッサ１４２は、キャッシュ情報読み出し器２０２、コンテキストプロセッサ２０４、およびデータ編集器２０６を含む。入力コンテンツ１５２の翻訳のリクエストが受信されると、リクエストされた翻訳が以前実行されてユーザキャッシュ１４８に記憶されたかどうかを判断するために、キャッシュ情報読み出し器２０２が最初にアクティブ化される。翻訳は、スマート翻訳システム１００により生成されるたびにユーザキャッシュ１４８に記憶される。或る例において、ユーザ固有データ／コンテンツは、有効期限／削除まで所定の期間にわたりユーザキャッシュ１４８に記憶されてもよい。したがって、或る翻訳が頻繁にリクエストされれば、更新が行われ、それによりユーザキャッシュ１４８からの削除が防がれる。これは、スマート翻訳システム１００がすべての翻訳リクエストについて複数の翻訳エンジン１２０－１，１２０－２，…，１２０－ｎにアクセスする必要性を軽減する。

【0041】

或る例において、キャッシュ情報読み出し器２０２は、キャッシュアクセス器２２２、類似度計算器２２４、およびキャッシュ情報プロバイダ２２６を含むことができる。キャッシュアクセス器２２２は、入力コンテンツ１５２を受信し、ユーザキャッシュ１４８にアクセスして、翻訳メタデータ１５４に基づく入力コンテンツ１５２の以前の翻訳に関する判断を可能にし、翻訳メタデータ１５４は、ソース言語／ターゲット言語のみならず、入力コンテンツ１５２を含むアプリケーション１５０のロケーション／リンクまたはその他識別指示も含む。或る例において、アプリケーション１５０の実行ファイルの名前、および翻訳メタデータ１５４内の任意のパラメータを、スマート翻訳システム１００により受信できる。類似度計算器２２４は、キャッシュコンテンツと、翻訳メタデータ１５４を含む入力コンテンツ１５２との間の類似度を計算してもよい。次に限定はされないが、例えばコサイン類似度、様々な距離測度、ジャカード類似度などの様々な類似度測度が、類似度計算器２２４により用いられることが可能である。キャッシュ情報プロバイダ２２６は、ユーザキャッシュ１４８のコンテンツのいずれかが所定のコンテンツ類似度閾値より大きな類似度を有するかどうかを判断することができる。有する場合、次にその特定のコンテンツ項目が、入力コンテンツ１５２の翻訳済みバージョン１６２としてキャッシュ情報プロバイダ２２６により返されることが可能である。所定のコンテンツ類似度閾値より大きな類似度を有するものとしてユーザキャッシュ１４８から判断可能なコンテンツ項目がなければ、入力コンテンツ１５２は、複数の翻訳エンジン１２０－１，１２０－２，…，１２０－ｎのうちの１つの選択を可能にするコンテキスト識別のためにコンテキストプロセッサ２０４に提供される。

【0042】

コンテキストプロセッサ２０４は、コンテンツ取得器２４２、コンテキスト識別器２４４、および用語集データセット２４６を含む。コンテンツ取得器２４２は、入力コンテンツ１５２内のテキストコンテンツおよび非テキストコンテンツを識別し、画像ファイルなどの非テキストコンテンツをテキストコンテンツに変換するように構成できる。例として入力コンテンツ１５２は、画像ファイルがあるウェブページの一部分の選択を含んでもよい。テキストを含むかどうかを判断するために画像ファイルを処理でき、含む場合、テキストフォーマットへの変換のために画像ファイルを光学文字認識（ＯＣＲ：ｏｐｔｉｃａｌｃｈａｒａｃｔｅｒｒｅｃｏｇｎｉｔｉｏｎ）エンジンに提供できる。そのようにして得られたテキストは、コンテンツ取得器２４２により構文解析され、トークン化され、品詞（ＰＯＳ）を用いてタグ付けされて、コンテキスト識別器２４４に提供されることが可能である。コンテキスト識別器２４４は、入力コンテンツ１５２において受信されたテキストコンテンツを、複数のドメイン／言語コンテキストのうちの１つを含むコンテキスト１７２に分類する、機械学習（ＭＬ）分類モデルを含むことができる。用語集データセット２４６は、種々の言語の種々のドメインからの専門用語を備えたデータセットを含むことができる。例として用語集データセット２４６は、例えば製造、医療、財務、小売、教育など種々のドメインについて、英語、スペイン語、フランス語、日本語などの言語固有の専門用語を含むことができる。コンテキスト識別器２４４は、コンテンツ取得器２４２により提供された単語トークンを、ドメインコンテキスト識別からの様々な用語集データセット２４６の用語と照合するように構成できる。最高の信頼度スコアを備えた特定の言語／ドメイン用語集データセットを、入力コンテンツ１５２のドメイン／言語コンテキストとして出力できる。ドメインコンテキストの識別は、一定の用語の正確な解釈を可能にする。例として、「ｆｉｎｅ」という用語は医療ドメインではすべてが問題ないことを意味することができるのに対して、同じ「ｆｉｎｅ」という用語が財務ドメインでは大きく異なるものを意味する。或る例において、選択された翻訳エンジンにより生成された翻訳済みバージョン１６２も、入力コンテンツ１５２について最初に判断されたコンテキストを確認するためにコンテキスト識別器２４４に提供できる。

【0043】

入力コンテンツ１５２のドメイン／言語コンテキストを識別すると、コンテンツ取得器２４２からのトークンを、機密データを識別してマスキングするように構成されているデータ編集器２０６に提供できる。データ編集器２０６は、コンテンツ取得器２４２によるＰＯＳタグ付けから得られたタプルのリストからの固有表現認識（ＮＥＲ：ｎａｍｅｄｅｎｔｉｔｙｒｅｃｏｇｎｉｔｉｏｎ）およびエンティティ関係検出のための、様々なＭＬ分類モデル２６２を含む。分類再帰型ニューラルネットワーク（ＲＮＮ：ＲｅｃｕｒｒｅｎｔＮｅｕｒａｌＮｅｔｗｏｒｋ）２６４が、ユーザ／ビジネスエンティティが秘密に保ちたいと望むかもしれない機密データを表す機密エンティティから通常の単語／エンティティを分類するように訓練される。機密エンティティの例は、次に限定はされないが、個人名、住所、連絡先情報、および例えば社会保障番号、納税者ｉｄ、財務情報、口座番号、金額などの識別情報を含むことができる。次に限定はされないが、ｎ－ｇｒａｍ、推論規則、および自己相互情報量ベースのアプローチなど、他の機密識別技術も、機密データ識別器２６６により実装できる。ｎ－ｇｒａｍは、所与のシーケンスからのｎ項目のサブシーケンスである。ｎ－ｇｒａｍは、様々な分野の統計的自然言語処理および遺伝子配列分析において使用されている。当該の項目は、用途に応じて文字、単語、または塩基対とすることができる。例として、文字のシーケンス「Ｈａｔｅｍ」は、（「Ｈａｔ」，「ａｔｅ」，「ｔｅｍ」，「ｅｍ」，，…）の３－ｇｒａｍを有し、（「Ｈａ」，「ａｔ」，「ｔｅ」，「ｅｍ」，…）の２－ｇｒａｍを有する。公平且つ頑健な訓練のための相互情報量ベースのアプローチは、ＭＬにおいて信頼されるＡＩを必要とし、正確なモデルを訓練することに加え、データのバイアスおよびポイゾニングの存在下でも公平性と頑健性を兼ね備えた訓練が考慮される。

【0044】

機密データ識別器２６６は、入力コンテンツ１５２に関して、所定の信頼水準より高い信頼水準を備える特定のロケーションを発見するように構成でき、所定の信頼水準より高い信頼水準は、入力コンテンツ１５２の当該特定のロケーションに機密情報が存在することを示すことができる。機密データ識別器２６６からの出力は、入力コンテンツ１５２内の機密データのタイプおよび機密データのロケーションを含むことができる。データマスキングプロバイダ２６８は、機密データ識別器２６６の出力を受信し、識別された機密データを、マスキングし、編集し、またはその他翻訳エンジンへの送出を防ぐ。データマスキングプロバイダ２６８は、次に限定はされないが、機密データを含むフィールドを黒く塗ることでマスキングすること、仮名化、つまり機密エンティティを類似データにより置き換えること、および匿名化、つまり機密エンティティをランダムな文字により置き換えることなど、様々なデータマスキング技術を実装できる。

【0045】

図３は、本願明細書において開示されている例によるアプリケーションファイルプロセッサ１４４のブロック図を示す。入力コンテンツ１５２は、入力コンテンツ１５２が生じるアプリケーション１５０に基づきアプリケーションファイルプロセッサ１４４により翻訳のために処理される。本願明細書で言及されているように、翻訳メタデータ１５４は、アプリケーション１５０が電子メールアプリケーションであるか、ウェブ／ブラウザベースのアプリケーションであるか、またはその他ソフトウェアアプリケーションであるかをアプリケーションファイルプロセッサ１４４が判断できるようにするリンクまたはその他識別された指示を含むことができる。識別された指示に基づき、アプリケーションファイルプロセッサ１４４は、電子メールプロセッサ３０２、ウェブコンテンツプロセッサ３０４、およびアプリケーションＵＩプロセッサ３０６のうちの１つを含むことができる。

【0046】

アプリケーション１５０が電子メールプログラムである場合、アプリケーションファイルプロセッサ１４４は、電子メールチェーンからの１つ以上の電子メールまたは或る電子メールの一部分をユーザが翻訳のために選択できるようにする、電子メールプロセッサ３０２を含む。上述のとおり、ユーザは、翻訳される入力コンテンツを、例えばマウスのクリック、ホールド、およびリリース操作などの選択操作を介して特定してもよい。ユーザ選択領域を示すマウスクリックイベントが発せられることが可能であり、ポップアップメニュー、ボタン、または別のＵＩウィジェットを介してスマート翻訳システム１００がトリガされることが可能である。そのようにして受信またはユーザにより特定された入力コンテンツ１５２は、翻訳前の前処理のために電子メールプロセッサ３０２に提供される。或る例において、電子メールプロセッサ３０２は、ユーザ選択識別器３２２、ヘッダ・フッタ識別器３２４、署名識別器３２６、および添付物取得器３２８を含むことができる。ユーザ選択識別器３２２は、選択操作に基づき入力コンテンツ１５２を識別してもよい。電子メールアプリケーションの入力コンテンツ１５２は、最新の電子メール、複数の電子メールの電子メールチェーン全体、或る電子メール／電子メールチェーンの特定の一部分などを含むことができる。ヘッダ・フッタ識別器３２４は、電子メールのヘッダセクションおよびフッタセクションを識別するために分類サポートベクタマシン（ＳＶＭ：ｓｕｐｐｏｒｔｖｅｃｔｏｒｍａｃｈｉｎｅ）アルゴリズムを実装する。電子メールのヘッダセクションは、送信者、受信者、電子メールが送信または受信された時刻／日付、電子メールの件名、および電子メールが含んでいるかもしれない任意の添付物に関係する情報を含むことができる。電子メールのフッタセクションは、電子メール送信者の署名を含むことができる。電子メールのチェーンが処理される事例では、ヘッダおよびフッタは、電子メールチェーンの中の電子メールそれぞれを個々に識別することを可能にする。特徴をグループ化するために、この場合も、コンテンツ取得器２４２の単語トークンおよびＰＯＳタグを含む出力を使用できる。ヘッダ／フッタを識別するためにＳＶＭモデルにより使用される特徴は、次に限定はされないが、入力コンテンツ１５２を含むファイルにおける単語の位置、画像、またはデータ構造、単語の数、人名などの固有表現、住所、電話番号、ロゴ、特殊なパターン、改行などを含むことができる。署名識別器３２６も、電子メールの署名を識別するために上述の特徴を使用することができる。電子メールが翻訳のために提出される場合、一部の例では、電子メールの署名は翻訳されなくてもよい。添付物取得器３２８は、電子メールヘッダから添付物を識別するように訓練されたＭＬモデルも含むことができる。或る例において、そのようにして得られた添付物は、翻訳のために提出される入力コンテンツ１５２の一部として提供されてもよい。或る例において、翻訳済み添付物は、返信または転送中、もとの電子メールに戻されることが可能である。したがって、翻訳後、もとの電子メールは、ソース言語のもとの添付物およびターゲット言語の翻訳済み添付物の２つの添付物を含んでもよい。或る例において、翻訳済み電子メールは、もとの添付物および翻訳済み添付物とともに電子メールサーバに記憶されてもよい。

【0047】

アプリケーション１５０がウェブアプリケーションまたはウェブブラウザを含む場合、アプリケーションファイルプロセッサ１４４はウェブコンテンツプロセッサ３０４を含んでもよく、ウェブコンテンツプロセッサ３０４はユーザ選択識別器３４２およびウェブコンテンツ分析器３４４をさらに含んでもよい。ユーザ選択識別器３４２は、電子メールアプリケーションに対するユーザ選択識別器３２２と同様に機能することができ、ユーザ選択識別器３４２は、ウェブブラウザのコンテンツのユーザ選択部分を識別する。ウェブコンテンツ分析器３４４は、翻訳メタデータ１５４においてすぐに利用可能でなければウェブページコンテンツのソース言語を自動で検出するなど、入力コンテンツ１５２を分析して翻訳メタデータ１５４を判断する。

【0048】

アプリケーションＵＩプロセッサ３０６はさらに、ユーザ選択識別器３６２、ＵＩ要素識別器３６４、およびＵＩ要素プロパティ取得器３６６を含む。ユーザ選択識別器３６２は、ＵＩ、またはユーザにより選択されたＵＩの一部分を、入力コンテンツ１５２として受信する。ＵＩ要素識別器３６４は、ＵＩのユーザ選択部分の中の、例えばラベル、ボタン、コンボボックスなどのＵＩ要素を識別する。ＵＩ要素プロパティ取得器３６６は、受信される入力コンテンツ１５２が由来するＵＩの中でのＵＩ要素の位置座標を、サイズ、背景色、前景／テキスト色、フォントサイズ、フォントタイプなどのプロパティとともに取得する。ＵＩ要素の位置情報は、スマート翻訳システム１００が、翻訳済みのラベル、名前などを、アプリケーションＵＩのルックアンドフィールが保たれるようにもとのラベルの位置に重ねられるようにする。

【0049】

図４は、本願明細書において開示されている例による翻訳済みコンテンツプロバイダ１０６のブロック図を示す。翻訳済みコンテンツ生成器は、文法／スペルチェッカ４０２、言語コンテキスト修正器４０４、コンテンツ要約器４０６、主要セクション識別器４０８、感情識別器４１４、およびＵＩ生成器４１２を含む。当然のことながら、翻訳済みコンテンツ１５６を生成するために、翻訳済みコンテンツプロバイダ１０６のすべてのコンポーネントが用いられる必要はない。むしろ、翻訳済みコンテンツが生成される対象のアプリケーション１５０に応じてコンポーネントの１つ以上が使用されればよい。例として、アプリケーション１５０が電子メールプログラムであれば、ＵＩ生成器４１０、文法／スペルチェッカ４０２、および言語コンテキスト修正器４０４を含むコンポーネントが使用されてもよく、コンテンツ要約器４０６および主要セクション識別器４０８は使用されなくてもよい。他方、アプリケーション１５０がウェブページであれば、コンテンツ要約器４０６およびセクション識別器４０８が使用されてもよく、ＵＩ生成器４１０または言語コンテキスト修正器４０４は用いられなくてもよい。

【0050】

文法／スペルチェッカ４０２は、自然言語処理（ＮＬＰ：ｎａｔｕｒａｌｌａｎｇｕａｇｅｐｒｏｃｅｓｓｉｎｇ）技術を使用して、翻訳済みバージョン１６２における文法のエラーおよびスペルの誤りの検出を提供する。例として、時制に基づく文法の誤りまたは指示内容に基づく当該の誤りを識別および訂正できる。同じく、言語／ドメイン用語集を使用して、スペルの誤りも文法／スペルチェッカ４０２により訂正できる。辞書ベースの訂正の例は、単純なスペルエラーに対処することができ、「Ｉａｃｅｐｔｔｈｉｓｐｒｏｐｏｓａｌ」が「Ｉａｃｃｅｐｔｔｈｉｓｐｒｏｐｏｓａｌに訂正される。コンテキストベースのスペルエラーも訂正されてもよい。例として、入力文章「Ｉａｃｃｅｐｔｔｈｉｓｔｏｂｅｄｏｎｅｂｙ３ｐｍ」が「Ｉｅｘｐｅｃｔｔｈｉｓｔｏｂｅｄｏｎｅｂｙ３ｐｍ」に訂正されてもよい。

【0051】

各言語には、口語または文語でテキスト表現する特有の形がある。例として、日本語の丁寧な口語では、人の呼びかけには名前を「さん」と組み合わせて、例えば「Ｊｏｈｎさん」とすることが要求される。そのような言語の特色に対して、言語コンテキスト修正器４０４は、翻訳済みバージョン１６２を取得し、翻訳済みの単語／文章に言語コンテキストを用いてさらなる追加／置き替えを行うことにより、対応する。ＮＬＰ技術を使用して、修正／置き換えが行われる単語が識別され、言語／ドメイン用語集データセットからの単語が使用され、自然言語生成（ＮＬＧ：ＮａｔｕｒａｌＬａｎｇｕａｇｅＧｅｎｅｒａｔｉｏｎ）技術を用いて文章が生成される。これは、電子メール通信を翻訳するときに非常に有用となり得る。

【0052】

コンテンツ要約器４０６は、データを解釈および要約するＮＬＰ技術を実装することにより、翻訳済みバージョン１６２を読み取るように構成される。例として、入力コンテンツ１５２が長い契約文書であれば、コンテンツ要約器４０６は、例えば関与する当事者、契約開始日、達成されるべきマイルストーン、および契約の終了日などの主要な点を要約することができる。或る例において、コンテンツ要約器４０６は、既存のテキストから主要情報を取得して分離し、テキストを要約コンテンツに凝縮することにより、コンテンツ要約を生成することができる。

【0053】

主要セクション識別器４０８は、翻訳済みバージョン１６２を処理して、翻訳済みコンテンツ１５６において主要な点をハイライトする。主要セクション識別器４０８は、主要／非主要セクションを識別するように訓練されたＭＬ分類モデルを実装することができる。次に限定はされないが、例えば単語の位置、単語が肯定的であるか否定的であるか、その位置にある単語の数、人名、最後の文字、特殊なパターン、改行の数などの特徴が、非主要セクションから主要セクションを区別するためにＭＬ分類モデルにより使用されることが可能である。さらに感情識別器４１４が、入力コンテンツ１５２内で表現されている感情を検出するためにスマート翻訳システム１００に含められる。或る例において、感情または情緒を検出する畳み込みニューラルネットワーク（ＣＮＮ：ＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋ）分類モデル。各言語に対して別個のＣＮＮモデルを構築できる。感情は種々のレベルで区別できる。例として、例えば否定的かまたは中立かなどの感情の性質を検出できる。感情の強さも、前兆／切迫／高、中、または低として検出されてもよい。同じく、感情に関連する他のコンテキストも識別されてもよい。例として、感情に基づき、文章がリクエスト問い合わせ、または回答として識別されてもよい。

【0054】

ＵＩ生成器４１２は、アプリケーション１５０のルックアンドフィールが保たれるように翻訳済みコンテンツ１５６を生成してアプリケーション１５０を通して提示するために使用できる。したがって、電子メールプログラムにおいて閲覧されるとき、翻訳済み電子メールは、もとの電子メールのルックアンドフィールを保つ。同じく、コンテンツはソース言語の代わりにターゲット言語で表示されるが、ソフトウェアユーティリティまたはその他ソフトウェアプログラムの翻訳済みＵＩ画面は、もとのＵＩ画面と同じ外観を保つ。実質的に同様のルックアンドフィールを実現するために、ＵＩ生成器４１２は、出力プロパティ識別器４２２、出力テキスト生成器４２４、および出力位置調整コンポーネント４２６により構成される。スマート翻訳システム１００はプラグインとして動作するので、アプリケーション１５０のＵＩの表示プロパティが、出力プロパティ識別器４２２によりアプリケーションプログラミングインターフェース（ＡＰＩ：ａｐｐｌｉｃａｔｉｏｎｐｒｏｇｒａｍｍｉｎｇｉｎｔｅｒｆａｃｅ）を介してアクセスされてもよい。表示プロパティは、次に限定はされないが、ＵＩ画面（単数または複数）の背景色、フォントタイプ、フォントフェイス、フォントの色、その他フォントプロパティ、ＵＩ（単数または複数）上での特定の単語の位置調整などを含んでもよい。出力テキスト生成器４２４は、表示プロパティを使用して出力テキストを生成し、出力位置調整コンポーネント４２６は、表示プロパティに従い修正されたテキストを、取得された入力コンテンツ１５２が由来したもとのＵＩにおける対応するテキストの位置座標により決定される位置に配置する。

【0055】

図５は、本願明細書において開示されている例による、入力コンテンツ１５２を翻訳する方法を詳述するフローチャート５００を示す。本方法は、入力コンテンツ１５２がアプリケーション１５０から受信される５０２にて開始する。本願明細書において言及されているように、ユーザは、アプリケーション１５０のＵＩの全体または一部分を翻訳のために選択でき、それが入力コンテンツ１５２としてスマート翻訳システム１００に伝達されることが可能である。翻訳メタデータ１５４も、入力コンテンツ１５２とともに受信されることが可能である。翻訳メタデータ１５４は、入力コンテンツ１５２のソース言語と、入力コンテンツ１５２が翻訳されるターゲット言語とを少なくとも含むことができる。５０４にて、コンテンツタイプを翻訳メタデータ１５４から識別でき、つまり、入力コンテンツ１５２がウェブコンテンツであるか、電子メールであるか、またはソフトウェアアプリケーションのユーザインターフェースの一部分であるかを判断できる。５０６にて、入力コンテンツのリクエストされた翻訳１５６がすでにユーザキャッシュ１４８に存在するかどうかが判断される。例として、例えば同じウェブページを同じ言語に翻訳するなど、ユーザが特定のコンテンツ部分について同じ翻訳を頻繁にリクエストしていれば、当該の翻訳は、キャッシュのユーザ固有部分、つまりユーザキャッシュ１４８に記憶されているかもしれない。リクエストされた翻訳がユーザキャッシュ１４８に存在すると５０６にて判断されれば、５０８にて翻訳がユーザキャッシュ１４８から読み出されて、５２４にてアプリケーション１５０を介してユーザに提供される。

【0056】

リクエストされた翻訳がユーザキャッシュ１４８に記憶されていないと５０６にて判断され、その結果、本方法は入力コンテンツ１５２のコンテキストを判断する５１０に進む。コンテキストおよび翻訳メタデータ１５４に少なくとも基づき、入力コンテンツ１５２の翻訳済みバージョン１６２を生成するために、５１２にて複数の翻訳エンジン１２０－１，１２０－２，…，１２０－ｎから翻訳エンジンが選択される。５１４にて、入力コンテンツ１５２が何らかの機密データを含むかどうかがさらに判断される。含む場合、５１６にて機密データが編集／マスキングされ、機密データをマスキングされた入力コンテンツ１５２が、選択された翻訳エンジンに５１８にて提供される。５２０にて、翻訳済みバージョン１６２が選択された翻訳エンジンから得られる。翻訳済みバージョン１６２は、スペルおよび文法チェック、言語コンテキスト修正、要約、主要セクション、および感情識別、ならびに／または適切なＵＩの生成により、提示のために５２２にてさらに処理される。５２４にて、翻訳済みバージョン１６２のさらなる処理からそのようにして生成された翻訳済みコンテンツ１５６が、アプリケーション１５０を介してユーザに提供される。

【0057】

図６は、本願明細書において開示されている例による、入力コンテンツ１５２のコンテキストを判断する方法を詳述するフローチャート６００を示す。本方法は、入力コンテンツが非デジタル化テキストを含むかどうかが判断される６０２にて開始する。例として入力コンテンツ１５２は、テキストを含んでもよいスキャンされた画像またはその他の種類の画像を含むことができる。６０２にて入力１５２が非デジタル化テキストを含むと判断されれば、本方法は、例としてＯＣＲにより非デジタル化テキストをデジタル化する６０４に進み、さらに本方法は６０６に進む。６０２にて入力コンテンツ１５２がデジタル化テキストを含むと判断されれば、本方法は入力コンテンツ１５２を特定のドメインコンテキストおよび言語コンテキストに分類する６０６に直接進む。判断されたコンテキストおよび翻訳メタデータ１５４に少なくとも基づき、６０８にて翻訳済みバージョン１６２が得られる。６１０にて、翻訳済みバージョン１６２が、ドメインコンテキストおよび言語コンテキストを判断するために再度処理される。６１２にて、入力コンテンツ１５２のドメインコンテキストおよび言語コンテキストが、翻訳済みバージョン１６２のものと比較される。６１２での比較に基づき、６１４にて、入力コンテンツ１５２と翻訳済みバージョン１６２とのコンテキスト間に十分な重複があるかどうかが判断される。あれば、６１６にてコンテキスト判断について肯定的なフィードバックが与えられ、そうでなければ、６１８にてコンテキスト判断について否定的なフィードバックが与えられる。

【0058】

図７は、本願明細書において開示されている例による、翻訳済み電子メール添付物を生成する方法を詳述するフローチャート７００を示す。７０２にて、添付物のフォーマットがソース言語およびターゲット言語とともに判断される。ソース言語は翻訳メタデータ１５４においてユーザにより明示的に提供可能であるが、種々の言語を識別するように訓練されている訓練済みのＭＬ分類モデルを使用して自動で判断されることも可能である。添付物のファイルフォーマットは、ファイルメタデータから判断できる。添付物は、テキストコンテンツを含む画像７０４、デジタル化テキストコンテンツ７０６、およびロゴ／署名７０８などの種々のフォーマットのファイルを含むことができる。テキストコンテンツを備えた画像７０４は、７１０にてＯＣＲ技術を使用してデジタル化され、７１２にてターゲット言語に翻訳される。デジタル化テキストコンテンツ７０６は、７１２にてターゲット言語に直接翻訳できる。或る例では、ロゴ／署名７０８は、７１４にて翻訳なしでそのままソース言語に保たれる。７１６にて、添付ファイルがターゲット言語で再生成される。或る例では、もとの添付ファイルのコンテンツを翻訳済みコンテンツにより置き換えることにより添付ファイルを生成できる。７１８にて、添付ファイルが、翻訳済み電子メールおよびもとの電子メールのうちの１つ以上に含められて、アプリケーション１５０をホストする電子メールサーバ上に記憶される。

【0059】

図８は、本願明細書において開示されている例による、もとのＵＩのルックアンドフィールを保つ翻訳済みＵＩを生成する方法のフローチャート８００を示す。本方法は、ＵＩのユーザ選択部分を含む入力コンテンツ１５２が受信される８０２にて開始する。８０４にて、ＵＩのユーザ選択部分からＵＩ要素が識別される。或る例では、ＵＩ要素に関する情報は、アプリケーション１５０のＡＰＩを使用して得ることができる。８０６にて、例えば可視属性、値、ＵＩ上の配置などのＵＩ要素のプロパティも、ＡＰＩを使用して、またはウェブアプリケーションなどの事例ではマークアップにアクセスすることにより、得ることができる。８０８にて、翻訳されるＵＩ要素の可視テキストが取得される。例として、ラベルの事例では、ラベル上に表示される値が取得される。同じく、ドロップダウンメニューまたはコンボボックスの場合、ユーザの目に見える値が取得される。取得された値は、機密データのフィルタリングが行われて、選択された翻訳エンジンに８１０にて提供されてもよい。選択された翻訳エンジンから得られた翻訳済みの値は、８１２にてＵＩ要素の可視プロパティに従ってフォーマットできる。可視プロパティは、背景色、例えばフォントタイプ、フォントサイズ、フォントスタイルなどのフォントプロパティを含んでもよい。翻訳済みＵＩは、８１４にて、翻訳済みＵＩ要素を対応するもとのＵＩ要素の上に重ねて、翻訳済みＵＩ要素でもとのＵＩ要素を隠すことにより生成される。

【0060】

図９Ａ１、図９Ａ２は、本願明細書において開示されている例による、ソフトウェアアプリケーションのＵＩの翻訳を示す。当初のＵＩ９０２のソース言語はドイツ語である。しかしながら、ＵＩの一部分またはＵＩ全体が翻訳のために選択されると、画面翻訳のコンテキストメニュー９０４が現れてスマート翻訳システム１００により選択された翻訳のデフォルトオプションを示し、ユーザがデフォルトオプションを変更できるようにしてもよい。デフォルトオプションは、翻訳に使用される、自動で検出された言語９０８、ターゲット言語９１２、翻訳エンジン９１４、およびＯＣＲエンジン９１６を含んでもよい。満足のいく選択を行うと、ユーザは、翻訳オプション９１６をクリックして、ＵＩ９２０に示されているようにＵＩ９０２の翻訳を開始するとよい。

【0061】

図９Ｂは、本願明細書において開示されている例による、ＵＩ９０２に示されたオプションに基づき生成された翻訳済みＵＩ９５０を示す。翻訳済みＵＩ９５０にあるように、様々なラベル９５２、９５４、およびボタン９５６、９５８が、９１２にて選択されたターゲット言語である英語に翻訳される。翻訳済みＵＩ９５０からわかるように、翻訳後の慣れないＵＩにユーザが対処しなくて済むように、ＵＩ９０２のルックアンドフィールは翻訳後にも保たれる。

【0062】

図１０は、本願明細書において開示されている例による、電子メールアプリケーションにおけるスマート翻訳システム１００の機能を示す。当初の電子メール１００２は、例えばドイツ語などのソース言語であり、同じくソース言語の添付物１００４を備える。ユーザオプションに基づき、翻訳済み電子メール１００６が生成される。ただし、翻訳済み電子メールは、もとの添付物１００４と、もとの添付物１００４のターゲット言語への翻訳である翻訳済み添付物１００８との２つの添付物を有する。或る例において、当初の電子メール１００２は、ユーザオプションに応じて添付物１００４および１００６の両方により記憶されてもよい。

【0063】

図１１Ａおよび図１１Ｂは、本願明細書に開示された例による、スマート翻訳システム１００によりブラウザベースのアプリケーションに適用されたときのページ全体の翻訳を示す。具体的には、図１１Ａは、ソース言語である中国語の当初のウェブページ１１１０を示し、図１１Ｂは、ターゲット言語である英語の翻訳済みウェブページ１１２０を示す。或る例において、翻訳済みウェブページ１１２０は、翻訳中に遭遇された特定の言語の方言に関する、スマート翻訳システム１００からの何らかの提案１１２２を含んでもよい。

【0064】

図１１Ｃは、本願明細書において開示されている例による、ＵＩ１１３０の選択部分の翻訳を示す。選択部分１１３４の翻訳１１３２が、ＵＩ上のオーバーレイ１１３６に示されている。或る例において、スマート翻訳システム１００により生成されたオーバーレイ１１３６は、ソーステキストとしての選択部分および出力テキストとしての翻訳１１３２を含むことができる。オーバーレイ１１３６はさらに、ユーザが必要に応じてオーバーライドできるデフォルトのシステム選択値であってもよい、様々な翻訳オプション１１３８を含む。

【0065】

図１２は、本願明細書において開示されている例による、スマート翻訳システム１００を実装するために使用され得るコンピュータシステム１２００を示す。より具体的には、スマート翻訳システム１００からデータを生成するため、またはスマート翻訳システム１００のデータにアクセスするために使用され得るデスクトップ、ラップトップ、スマートフォン、タブレット、およびウェアラブルなどのコンピューティングマシンは、コンピュータシステム１２００の構造を有してもよい。コンピュータシステム１２００は、図示されていない追加のコンポーネントを含んでもよく、説明された処理コンポーネントの一部が除外および／または変更されてもよい。別の例において、コンピュータシステム１２００は、ＡｍａｚｏｎＷｅｂＳｅｒｖｉｃｅｓなどの外部クラウドプラットフォーム、ＡＺＵＲＥ（登録商標）クラウド、もしくは社内のコーポレートクラウドコンピューティングクラスタ、または組織のコンピューティングリソースなどに存在することができる。

【0066】

コンピュータシステム１２００は、中央処理ユニット、ＡＳＩＣ、または別のタイプの処理回路などのプロセッサ（単数または複数）１２０２と、例えばディスプレイ、マウスキーボードなどの入出力（Ｉ／Ｏ：ｉｎｐｕｔ／ｏｕｔｐｕｔ）デバイス１２１２と、ローカルエリアネットワーク（ＬＡＮ：ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）、ワイヤレス８０２．１１ｘＬＡＮ、３Ｇ、４Ｇ、もしくは５ＧモバイルＷＡＮ、またはＷｉＭａｘＷＡＮなどのネットワークインターフェース１２０４と、プロセッサ可読媒体１２０６とを含む。これらのコンポーネントはそれぞれ、動作可能なようにバス１２０１２に結合されていてもよい。プロセッサ可読またはコンピュータ可読媒体１２０６は、実行のために命令をプロセッサ（単数または複数）１２０２に提供することに関与する任意の適切な媒体とすればよい。例として、プロセッサ可読媒体１２０６は、磁気ディスクまたはソリッドステート不揮発性メモリなど、非一時的な、もしくは不揮発性の媒体、またはＲＡＭなどの揮発性媒体としてもよい。プロセッサ可読媒体１２０６上に記憶される命令またはモジュールは、プロセッサ（単数または複数）１２０２により実行されプロセッサ（単数または複数）１２０２に方法およびスマート翻訳システム１００の機能を実行させる、機械可読命令１２６４を含んでもよい。

【0067】

スマート翻訳システム１００は、非一時的なプロセッサ可読媒体上に記憶されて１つ以上のプロセッサ１２０２により実行されるソフトウェアまたは機械可読命令として実装されてもよい。例として、プロセッサ可読媒体１２０６は、ＭＡＣＯＳ、ＭＳＷＩＮＤＯＷＳ、ＵＮＩＸ、またはＬＩＮＵＸなどのオペレーティングシステム１２６２、およびスマート翻訳システム１００のコード／命令１２６４を記憶してもよい。オペレーティングシステム１２６２は、マルチユーザ、マルチプロセッシング、マルチタスキング、マルチスレッディング、リアルタイム、および同様のものなどとされてもよい。例として、ランタイム中、オペレーティングシステム１２６２が動作し、スマート翻訳システム１００のコードがプロセッサ（単数または複数）１２０２により実行される。

【0068】

コンピュータシステム１２００は、不揮発性データストレージを含むこともあるデータストレージ１２１０を含んでもよい。データストレージ１２１０は、スマート翻訳システム１００により使用される任意のデータを記憶する。データストレージ１２１０は、入力コンテンツ１５２、翻訳メタデータ１５４、翻訳バージョン１６２、翻訳済みコンテンツ１５６、ユーザ選択オプション、およびそのほかスマート翻訳システム１００の動作中に生成および／または使用されるデータ要素を記憶するために、スマート翻訳システム１００のローカルデータストレージとして使用されてもよい。

【0069】

ネットワークインターフェース１２０４は、例としてＬＡＮを介してコンピュータシステム１２００を内部システムに接続する。さらにネットワークインターフェース１２０４は、コンピュータシステム１２００をインターネットに接続してもよい。例としてコンピュータシステム１２００は、ネットワークインターフェース１２０４を介してウェブブラウザならびにその他外部のアプリケーションおよびシステムに接続してもよい。

【0070】

一例とともにその変形の一部が本願明細書において説明され、示された。本願明細書で使用された用語、説明、および図面は、例示としてのみ記載されたものであり、限定としては意図されてはいない。添付の特許請求の範囲およびその等価物により定義されるよう意図される主題の意図および範囲内で、多数の変形が可能である。

【図1】