(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023155158
(43)【公開日】2023-10-20
(54)【発明の名称】スマート翻訳システム
(51)【国際特許分類】
G06F 16/38 20190101AFI20231013BHJP
【FI】
G06F16/38
【審査請求】有
【請求項の数】20
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2023018051
(22)【出願日】2023-02-09
(31)【優先権主張番号】202211021330
(32)【優先日】2022-04-09
(33)【優先権主張国・地域又は機関】IN
(31)【優先権主張番号】17/900,704
(32)【優先日】2022-08-31
(33)【優先権主張国・地域又は機関】US
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.MAC OS
2.UNIX
3.Linux
(71)【出願人】
【識別番号】516172237
【氏名又は名称】アクセンチュア グローバル ソリューションズ リミテッド
(74)【代理人】
【識別番号】100102406
【弁理士】
【氏名又は名称】黒田 健二
(74)【代理人】
【識別番号】100100240
【弁理士】
【氏名又は名称】松本 孝
(72)【発明者】
【氏名】ガタゲ,プラカシュ
(72)【発明者】
【氏名】タンガラジ,ナヴィーン クマール
(72)【発明者】
【氏名】クルレカール,カウストゥブ
(72)【発明者】
【氏名】プラサド,スリーヴィディヤ
(72)【発明者】
【氏名】サンカラナラヤナン,スリラム
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175DA01
5B175FB03
5B175HB03
(57)【要約】 (修正有)
【課題】アプリケーションから受信された入力コンテンツを翻訳メタデータ及びアプリケーションに基づき翻訳するスマート翻訳システム、方法及びストレージ媒体を提供する。
【解決手段】スマート翻訳システムは、入力コンテンツの翻訳がユーザキャッシュに存在するかどうかを最初に判断し、入力コンテンツの翻訳がユーザキャッシュに存在すると判断すると、翻訳をユーザキャッシュから読み出す。入力コンテンツの翻訳がユーザキャッシュに存在しないと判断すると、入力コンテンツのドメインコンテキスト及び言語コンテキストを判断し、コンテキストおよび翻訳メタデータに基づき自動翻訳エンジンを選択すし、アプリケーションのルックアンドフィールを保ちながら、翻訳済みコンテンツをアプリケーションを介してユーザに提示する。
【選択図】
図5
【特許請求の範囲】
【請求項1】
少なくとも1つのアプリケーションプロセッサと、
機械可読命令を記憶する非一時的なプロセッサ可読媒体と、
を含むスマート翻訳システムであって、前記機械可読命令は前記アプリケーションプロセッサに、
入力コンテンツにアプリケーションを介してアクセスすることであって、
前記入力コンテンツは翻訳されるものである、
前記アクセスすることと、
前記入力コンテンツのソース言語と、前記入力コンテンツが翻訳されるターゲット言語とを含む翻訳メタデータを取得することと、
前記入力コンテンツに対応する翻訳済みコンテンツをユーザキャッシュから読み出し可能かどうかを判断することと、
前記ユーザキャッシュに前記入力コンテンツの前記翻訳済みコンテンツがあれば、前記ユーザキャッシュから前記翻訳済みコンテンツを得ることと、
そうではなく、前記入力コンテンツの前記翻訳済みコンテンツを前記ユーザキャッシュから読み出し不可能であれば、
前記入力コンテンツを提供している前記アプリケーションのタイプを判断すること、および
前記入力コンテンツの前記翻訳済みコンテンツであって、前記アプリケーションの前記タイプに基づき生成される前記翻訳済みコンテンツを、複数の自動翻訳エンジンから自動で選択された翻訳エンジンから得ることと、
前記入力コンテンツを表示するために使用される前記アプリケーションを介した、前記入力コンテンツの前記翻訳済みコンテンツの表示を可能にすることであって、
前記翻訳済みコンテンツは、前記アプリケーションを通して表示されるときに前記入力コンテンツの可視属性を保つ、
前記可能にすることと、
をさせる、スマート翻訳システム。
【請求項2】
前記入力コンテンツの前記翻訳済みコンテンツが前記ユーザキャッシュに存するかどうかを判断するために、前記プロセッサは、
翻訳のためにユーザにより提出された以前の入力コンテンツと、対応する翻訳済みコンテンツとを、関係する翻訳メタデータとともに前記ユーザキャッシュに記憶することと、
前記以前の入力コンテンツとの前記入力コンテンツの類似度を計算することと、
前記以前の入力コンテンツと前記入力コンテンツとの前記類似度が所定のコンテンツ類似度閾値を上回れば、前記ユーザキャッシュから前記翻訳済みコンテンツを提供することと、
をする、請求項1に記載のスマート翻訳システム。
【請求項3】
前記アプリケーションは、電子メールプログラム、ウェブブラウザ、およびソフトウェアアプリケーションのうちの少なくとも1つを含む、請求項1に記載のスマート翻訳システム。
【請求項4】
前記アプリケーションは、前記電子メールプログラムを含み、前記プロセッサはさらに、
1つ以上の電子メールのうちの少なくとも1つおよび対応する1つ以上の添付物を含む前記入力コンテンツにアクセスすることと、
前記1つ以上の電子メールを区切るヘッダおよびフッタを識別することと、
翻訳する前記入力コンテンツのユーザ選択を受信することと、
前記ユーザ選択の前記翻訳済みコンテンツを得ることと、
をする、請求項3に記載のスマート翻訳システム。
【請求項5】
前記ユーザ選択は、前記対応する1つ以上の添付物を含み、前記ユーザ選択の前記翻訳済みコンテンツを得るために、前記プロセッサはさらに、
前記1つ以上の電子メールから前記対応する1つ以上の添付物を取得することと、
前記対応する1つ以上の添付物それぞれの関連するファイルフォーマットを判断することと、
前記対応する1つ以上の添付物のデジタル化テキストコンテンツを識別することと、
前記関連するファイルフォーマットで前記1つ以上の添付物それぞれの翻訳済みファイルを生成することと、
をする、請求項4に記載のスマート翻訳システム。
【請求項6】
前記ユーザ選択は、1つ以上の電子メールのうちの前記1つをさらに含み、前記ユーザ選択の前記翻訳済みコンテンツを得るために、前記プロセッサはさらに、
前記翻訳メタデータに基づき前記1つ以上の電子メールのデジタル化テキストコンテンツの翻訳を得ることであって、
前記デジタル化テキストコンテンツの前記翻訳は、前記電子メールを区切る前記ヘッダおよびフッタを除く、
前記翻訳を得ることと、
前記1つ以上の電子メールそれぞれに対応する1つ以上の翻訳済み電子メールを含む前記翻訳済みコンテンツを生成することであって、前記1つ以上の翻訳済み電子メールはさらに、前記1つ以上の添付物それぞれの前記翻訳済みファイル1つ以上を添付されている、前記生成することと、
をする、請求項5に記載のスマート翻訳システム。
【請求項7】
前記アプリケーションは、前記ウェブブラウザを含み、前記入力コンテンツの前記翻訳済みコンテンツを得るために、前記プロセッサはさらに、
前記ウェブブラウザにより表示されるコンテンツの少なくとも一部分のユーザ選択を含む前記入力コンテンツを受信することと、
前記翻訳メタデータに基づき前記入力コンテンツの前記翻訳済みコンテンツを得ることと、
前記入力コンテンツの前記翻訳済みコンテンツの前記ウェブブラウザにおける表示を可能にすることと、
をする、請求項3に記載のスマート翻訳システム。
【請求項8】
前記入力コンテンツの前記翻訳済みコンテンツを得るために、前記プロセッサはさらに、
前記ウェブブラウザにより表示される前記コンテンツの前記一部分がテキストの画像を含むと判断することと、
前記画像から前記テキストを取得することと、
前記画像から取得された前記テキストの翻訳を得ることと、
をする、請求項7に記載のスマート翻訳システム。
【請求項9】
前記アプリケーションは、前記ソフトウェアアプリケーションを含み、前記プロセッサはさらに、
前記ソフトウェアアプリケーションのユーザインターフェースの少なくとも一部分のユーザ選択を受信することと、
前記翻訳メタデータに対して自動で選択されたデフォルトオプションのコンテキストメニューを前記ユーザ選択の上に重ねることと、
をする、請求項3に記載のスマート翻訳システム。
【請求項10】
前記入力コンテンツの前記翻訳済みコンテンツを得るために、前記プロセッサはさらに、
前記ソフトウェアアプリケーションの前記ユーザインターフェースの前記一部分に表示される、ラベルを含むもとのフィールドの値を取得することと、
前記値それぞれに対応する翻訳済みコンテンツを得ることと、
をする、請求項9に記載のスマート翻訳システム。
【請求項11】
前記翻訳メタデータに対する前記デフォルトオプションは、ユーザ編集可能である、請求項1に記載のスマート翻訳システム。
【請求項12】
アプリケーションを介した、前記入力コンテンツの前記翻訳済みコンテンツの前記表示を可能にするために、前記プロセッサは、
ラベルそれぞれの前記翻訳済みコンテンツを含む前記ラベルを生成することであって、前記生成されたラベルの背景が、前記ユーザインターフェースの前記一部分に表示される前記もとのフィールドの背景に一致するように設定される、前記生成することと、
前記生成されたラベルを前記もとのフィールドの上に重ねることと、
をする、請求項11に記載のスマート翻訳システム。
【請求項13】
前記翻訳メタデータは、手動または自動で取得される、請求項1に記載のスマート翻訳システム。
【請求項14】
前記翻訳メタデータを手動で取得するために、前記プロセッサは、
前記翻訳メタデータのユーザリクエストを受信することと、
前記ユーザが前記翻訳メタデータの少なくとも一部を入力することを可能にするコンテキストメニューを提供することと、
をする、請求項13に記載のスマート翻訳システム。
【請求項15】
人工知能(AI)ベースの翻訳を提供する方法であって、
翻訳される入力コンテンツを受信するステップと、
前記入力コンテンツのソース言語と、前記入力コンテンツが翻訳されるターゲット言語とを含む翻訳メタデータを取得するステップと、
前記入力コンテンツの翻訳済みコンテンツがユーザキャッシュに存するかどうかを判断するステップと、
前記ユーザキャッシュに前記入力コンテンツの前記翻訳済みコンテンツがあれば、前記ユーザキャッシュから前記翻訳済みコンテンツを得るステップと、
そうではなく、前記入力コンテンツの前記翻訳済みコンテンツが前記ユーザキャッシュに記憶されていなければ、
前記入力コンテンツに関連するコンテキストを取得するステップ、
前記コンテキストに基づき複数の自動翻訳エンジンから翻訳エンジンを自動で選択するステップ、および
前記選択された翻訳エンジンから前記入力コンテンツの前記翻訳済みコンテンツを得るステップと、
前記入力コンテンツを表示するために使用されるアプリケーションを介した、前記入力コンテンツの前記翻訳済みコンテンツの表示を可能にするステップであって、
前記翻訳済みコンテンツは、前記入力コンテンツのものと類似した可視属性を用いて前記アプリケーションを通して表示される、
前記可能にするステップと、
を含む方法。
【請求項16】
翻訳される前記入力コンテンツを受信するステップはさらに、
前記アプリケーションのユーザインターフェース(UI)上に表示されるコンテンツのユーザ選択を受信するステップ
を含む、請求項15に記載の方法。
【請求項17】
前記入力コンテンツの前記コンテキストを取得するステップはさらに、
前記入力コンテンツのテキストコンテンツを取得するステップと、
機械学習(ML)ドメイン分類モデルに前記テキストコンテンツを提供することにより前記入力コンテンツのドメインコンテキストを得るステップと、
前記ターゲット言語に基づき前記入力コンテンツの言語コンテキストを得るステップと、
を含む、請求項15に記載の方法。
【請求項18】
前記選択された翻訳エンジンから前記入力コンテンツの前記翻訳済みコンテンツを得るステップはさらに、
前記入力コンテンツを構文解析およびトークン化するステップと、
n-gramおよび推論規則のうちの1つ以上に基づき前記入力コンテンツから機密データを識別するステップと、
翻訳のために前記選択された翻訳エンジンに前記機密データを提供する前に、前記入力コンテンツからの前記機密データをマスキングするステップと、
を含む、請求項15に記載の方法。
【請求項19】
機械可読命令を含む非一時的なプロセッサ可読ストレージ媒体であって、前記機械可読命令はプロセッサに、
翻訳される入力コンテンツにアプリケーションを介してアクセスすることと、
前記入力コンテンツのソース言語と、前記入力コンテンツが翻訳されるターゲット言語とを含む翻訳メタデータを取得することと、
前記入力コンテンツの翻訳済みコンテンツがユーザキャッシュに存するかどうかを判断することと、
前記ユーザキャッシュに前記入力コンテンツの前記翻訳済みコンテンツがあれば、前記ユーザキャッシュから前記翻訳済みコンテンツを得ることと、
そうではなく、前記入力コンテンツの前記翻訳済みコンテンツが前記ユーザキャッシュに記憶されていなければ、
前記入力コンテンツを提供している前記アプリケーションのタイプを判断すること、および
前記入力コンテンツの前記翻訳済みコンテンツであって、前記アプリケーションの前記タイプに基づき生成される前記翻訳済みコンテンツを、複数の自動翻訳エンジンから自動で選択された翻訳エンジンから得ることと、
前記入力コンテンツを表示するために使用される前記アプリケーションを介した、前記入力コンテンツの前記翻訳済みコンテンツの表示を可能にすることであって、
前記翻訳済みコンテンツは、前記アプリケーションを通して表示されるときに前記入力コンテンツの少なくとも1つの可視属性を保つ、
前記可能にすることと、
をさせる、非一時的なプロセッサ可読ストレージ媒体。
【請求項20】
前記プロセッサに、
前記表示の中で前記翻訳済みコンテンツの主要セクションをハイライトすることと、
前記翻訳済みコンテンツの要約を提供することと、
をさせるさらなる命令を含む、請求項19に記載の非一時的なプロセッサ可読ストレージ媒体。
【発明の詳細な説明】
【技術分野】
【0001】
技術分野
本開示は、全般的に、アプリケーションから受信された入力コンテンツを翻訳するスマート翻訳システムに関する。
【0002】
優先権
本願は、2022年4月9日が出願日であるインド特許仮出願第202211021330号、および2022年8月31日が出願日である米国特許出願第17/900,704号の優先権を主張するものであり、その開示全体を参照によって本願明細書に援用したものとする。
【背景技術】
【0003】
機械翻訳(MT:machine translation)は、ユーザが或る言語のコンテンツを入力でき、自動翻訳エンジンが別のターゲット言語で入力コンテンツの全体的な翻訳を生成する、ツールのセットである。機械翻訳ツールは、人間による編集なしに翻訳を提供する。最も基本的な機械翻訳ソフトウェアは、逐語的な置き換えにより厳密に動作する。一部のテクノロジーは、精度を高めるために、ルールベースの翻訳または統計的にモデル化された翻訳を実装することができる。現代の機械学習(ML:machine learning)は、MTをまったく新しい時代に導いたニューラルネットワークを含む。現代のニューラルネットワークベースの翻訳エンジンにより作り出される翻訳は、人手による翻訳と機械による翻訳との差を徐々になくしつつある。これは、人間の生産性を向上可能な、機械により実現される翻訳ツールをもたらす。
【発明の概要】
【課題を解決するための手段】
【0004】
一部の実装によれば、スマート翻訳システムは、少なくとも1つのアプリケーションプロセッサと、機械可読命令を記憶する非一時的なプロセッサ可読媒体とを含んでもよく、機械可読命令はアプリケーションプロセッサに、入力コンテンツにアプリケーションを介してアクセスすることであって、入力コンテンツは翻訳されるものである、アクセスすることと、入力コンテンツのソース言語と、入力コンテンツが翻訳されるターゲット言語とを含む翻訳メタデータを取得することと、入力コンテンツに対応する翻訳済みコンテンツをユーザキャッシュから読み出し可能かどうかを判断することと、ユーザキャッシュに入力コンテンツの翻訳済みコンテンツがあれば、ユーザキャッシュから翻訳済みコンテンツを得ることと、そうではなく、入力コンテンツの翻訳済みコンテンツをユーザキャッシュから読み出し不可能であれば、入力コンテンツを提供しているアプリケーションのタイプを判断すること、および入力コンテンツの翻訳済みコンテンツであって、アプリケーションのタイプに基づき生成される翻訳済みコンテンツを、複数の自動翻訳エンジンから自動で選択された翻訳エンジンから得ることと、入力コンテンツを表示するために使用されるアプリケーションを介した、入力コンテンツの翻訳済みコンテンツの表示を可能にすることであって、翻訳済みコンテンツは、アプリケーションを通して表示されるときに入力コンテンツの可視属性を保つ、可能にすることと、をさせる。
【0005】
上記のスマート翻訳システムの一部の実装によれば、入力コンテンツの翻訳済みコンテンツがユーザキャッシュに存するかどうかを判断するために、プロセッサは、翻訳のためにユーザにより提出された以前の入力コンテンツと、対応する翻訳済みコンテンツとを、関係する翻訳メタデータとともにユーザキャッシュに記憶することと、以前の入力コンテンツとの入力コンテンツの類似度を計算することと、以前の入力コンテンツと入力コンテンツとの類似度が所定のコンテンツ類似度閾値を上回れば、ユーザキャッシュから翻訳済みコンテンツを提供することと、をしてもよい。
【0006】
上記のスマート翻訳システムの一部の実装によれば、アプリケーションは、電子メールプログラム、ウェブブラウザ、およびソフトウェアアプリケーションのうちの少なくとも1つを含んでもよい。
【0007】
上記のスマート翻訳システムの一部の実装によれば、アプリケーションは、電子メールプログラムを含んでもよく、プロセッサはさらに、1つ以上の電子メールのうちの少なくとも1つおよび対応する1つ以上の添付物を含む入力コンテンツにアクセスすることと、1つ以上の電子メールを区切るヘッダおよびフッタを識別することと、翻訳する入力コンテンツのユーザ選択を受信することと、ユーザ選択の翻訳済みコンテンツを得ることと、をしてもよい。
【0008】
上記のスマート翻訳システムの一部の実装によれば、ユーザ選択は、対応する1つ以上の添付物を含んでもよく、ユーザ選択の翻訳済みコンテンツを得るために、プロセッサはさらに、1つ以上の電子メールから対応する1つ以上の添付物を取得することと、対応する1つ以上の添付物それぞれの関連するファイルフォーマットを判断することと、対応する1つ以上の添付物のデジタル化テキストコンテンツを識別することと、関連するファイルフォーマットで1つ以上の添付物それぞれの翻訳済みファイルを生成することと、をしてもよい。
【0009】
上記のスマート翻訳システムの一部の実装によれば、ユーザ選択は、1つ以上の電子メールのうちの1つをさらに含んでもよく、ユーザ選択の翻訳済みコンテンツを得るために、プロセッサはさらに、翻訳メタデータに基づき1つ以上の電子メールのデジタル化テキストコンテンツの翻訳を得ることであって、デジタル化テキストコンテンツの翻訳は、電子メールを区切るヘッダおよびフッタを除いてもよい、翻訳を得ることと、1つ以上の電子メールそれぞれに対応する1つ以上の翻訳済み電子メールを含む翻訳済みコンテンツを生成することであって、1つ以上の翻訳済み電子メールはさらに、1つ以上の添付物それぞれの翻訳済みファイル1つ以上を添付されていてもよい、生成することと、をしてもよい。
【0010】
上記のスマート翻訳システムの一部の実装によれば、アプリケーションは、ウェブブラウザを含んでもよく、入力コンテンツの翻訳済みコンテンツを得るために、プロセッサはさらに、ウェブブラウザにより表示されるコンテンツの少なくとも一部分のユーザ選択を含む入力コンテンツを受信することと、翻訳メタデータに基づき入力コンテンツの翻訳済みコンテンツを得ることと、入力コンテンツの翻訳済みコンテンツのウェブブラウザにおける表示を可能にすることと、をしてもよい。
【0011】
上記のスマート翻訳システムの一部の実装によれば、入力コンテンツの翻訳済みコンテンツを得るために、プロセッサはさらに、ウェブブラウザにより表示されるコンテンツの一部分がテキストの画像を含むと判断することと、画像からテキストを取得することと、画像から取得されたテキストの翻訳を得ることと、をしてもよい。
【0012】
上記のスマート翻訳システムの一部の実装によれば、アプリケーションは、ソフトウェアアプリケーションを含んでもよく、プロセッサはさらに、ソフトウェアアプリケーションのユーザインターフェースの少なくとも一部分のユーザ選択を受信することと、翻訳メタデータに対して自動で選択されたデフォルトオプションのコンテキストメニューをユーザ選択の上に重ねることと、をする。
【0013】
上記のスマート翻訳システムの一部の実装によれば、入力コンテンツの翻訳済みコンテンツを得るために、プロセッサはさらに、ソフトウェアアプリケーションのユーザインターフェースの一部分に表示される、ラベルを含むもとのフィールドの値を取得することと、値それぞれに対応する翻訳済みコンテンツを得ることと、をしてもよい。
【0014】
上記のスマート翻訳システムの一部の実装によれば、翻訳メタデータに対するデフォルトオプションは、ユーザ編集可能であってもよい。
【0015】
上記のスマート翻訳システムの一部の実装によれば、入力コンテンツの翻訳済みコンテンツのアプリケーションを介した表示を可能にするために、プロセッサは、ラベルそれぞれの翻訳済みコンテンツを含むラベルを生成することであって、生成されたラベルの背景が、ユーザインターフェースの一部分に表示されるもとのフィールドの背景に一致するように設定される、生成することと、生成されたラベルをもとのフィールドの上に重ねることと、をしてもよい。
【0016】
上記のスマート翻訳システムの一部の実装によれば、翻訳メタデータは、手動または自動で取得されてもよい。
【0017】
上記のスマート翻訳システムの一部の実装によれば、翻訳メタデータを手動で取得するために、プロセッサは、翻訳メタデータのユーザリクエストを受信することと、ユーザが翻訳メタデータの少なくとも一部を入力することを可能にするコンテキストメニューを提供することと、をしてもよい。
【0018】
一部の実装によれば、人工知能(AI)ベースの翻訳を提供する方法は、翻訳される入力コンテンツを受信するステップと、入力コンテンツのソース言語と、入力コンテンツが翻訳されるターゲット言語とを含む翻訳メタデータを取得するステップと、入力コンテンツの翻訳済みコンテンツがユーザキャッシュに存するかどうかを判断するステップと、ユーザキャッシュに入力コンテンツの翻訳済みコンテンツがあれば、ユーザキャッシュから翻訳済みコンテンツを得るステップと、そうではなく、入力コンテンツの翻訳済みコンテンツがユーザキャッシュに記憶されていなければ、入力コンテンツに関連するコンテキストを取得するステップ、コンテキストに基づき複数の自動翻訳エンジンから翻訳エンジンを自動で選択するステップ、および選択された翻訳エンジンから入力コンテンツの翻訳済みコンテンツを得るステップと、入力コンテンツを表示するために使用されるアプリケーションを介した、入力コンテンツの翻訳済みコンテンツの表示を可能にするステップであって、翻訳済みコンテンツは、入力コンテンツのものと類似した可視属性を用いてアプリケーションを通して表示される、可能にするステップと、を含んでもよい。
【0019】
上記の方法の一部の実装によれば、翻訳される入力コンテンツを受信するステップはさらに、アプリケーションのユーザインターフェース(UI)上に表示されるコンテンツのユーザ選択を受信するステップを含んでもよい。
【0020】
上記の方法の一部の実装によれば、入力コンテンツのコンテキストを取得するステップはさらに、入力コンテンツのテキストコンテンツを取得するステップと、機械学習(ML)ドメイン分類モデルにテキストコンテンツを提供することにより入力コンテンツのドメインコンテキストを得るステップと、ターゲット言語に基づき入力コンテンツの言語コンテキストを得るステップと、を含んでもよい。
【0021】
上記の方法の一部の実装によれば、選択された翻訳エンジンから入力コンテンツの翻訳済みコンテンツを得るステップはさらに、入力コンテンツを構文解析およびトークン化するステップと、n-gramおよび推論規則のうちの1つ以上に基づき入力コンテンツから機密データを識別するステップと、翻訳のために選択された翻訳エンジンに機密データを提供する前に、入力コンテンツからの機密データをマスキングするステップと、を含んでもよい。
【0022】
一部の実装によれば、非一時的なプロセッサ可読ストレージ媒体は、機械可読命令を含んでもよく、機械可読命令はプロセッサに、翻訳される入力コンテンツにアプリケーションを介してアクセスすることと、入力コンテンツのソース言語と、入力コンテンツが翻訳されるターゲット言語とを含む翻訳メタデータを取得することと、入力コンテンツの翻訳済みコンテンツがユーザキャッシュに存するかどうかを判断することと、ユーザキャッシュに入力コンテンツの翻訳済みコンテンツがあれば、ユーザキャッシュから翻訳済みコンテンツを得ることと、そうではなく、入力コンテンツの翻訳済みコンテンツがユーザキャッシュに記憶されていなければ、入力コンテンツを提供しているアプリケーションのタイプを判断すること、および入力コンテンツの翻訳済みコンテンツであって、アプリケーションのタイプに基づき生成される翻訳済みコンテンツを、複数の自動翻訳エンジンから自動で選択された翻訳エンジンから得ることと、入力コンテンツを表示するために使用されるアプリケーションを介した、入力コンテンツの翻訳済みコンテンツの表示を可能にすることであって、翻訳済みコンテンツは、アプリケーションを通して表示されるときに入力コンテンツの少なくとも1つの可視属性を保つ、可能にすることと、をさせる。
【0023】
上記の非一時的なプロセッサ可読ストレージ媒体の一部の実装によれば、機械可読命令はプロセッサに、表示の中で翻訳済みコンテンツの主要セクションをハイライトすることと、翻訳済みコンテンツの要約を提供することと、をさせるさらなる命令を含んでもよい。
【0024】
本開示の特徴が、以下の図面に示される例によって明らかにされる。以下の図面において、同じ数字は同じ構成要素を示す。
【図面の簡単な説明】
【0025】
【
図1】本願明細書において開示されている例による、スマート翻訳システムのブロック図を示す。
【
図2】本願明細書において開示されている例による、入力プロセッサのブロック図を示す。
【
図3】本願明細書において開示されている例による、アプリケーションファイルプロセッサのブロック図を示す。
【
図4】本願明細書において開示されている例による、翻訳済みコンテンツ生成器のブロック図を示す。
【
図5】本願明細書において開示されている例による、入力コンテンツを翻訳する方法のフローチャートを示す。
【
図6】本願明細書において開示されている例による、入力コンテンツのコンテキストを判断する方法のフローチャートを示す。
【
図7】本願明細書において開示されている例による、翻訳済み電子メール添付物を生成する方法のフローチャートを示す。
【
図8】本願明細書において開示されている例による、翻訳済みユーザインターフェース(UI)を生成する方法のフローチャートを示す。
【
図9A1】本願明細書において開示されている例による、ソフトウェアアプリケーションのUIの翻訳を示す。
【
図9A2】本願明細書において開示されている例による、ソフトウェアアプリケーションのUIの翻訳を示す。
【
図9B】本願明細書において開示されている例による、様々なオプションに基づき生成された翻訳済みUIを示す。
【
図10】本願明細書において開示されている例による、電子メールアプリケーションにおけるスマート翻訳システムの機能を示す。
【
図11A】本願明細書において開示されている例による、ブラウザベースのアプリケーション用に生成されるページ全体の翻訳を示す。
【
図11B】本願明細書において開示されている例による、ブラウザベースのアプリケーション用に生成されるページ全体の翻訳を示す。
【
図11C】本願明細書において開示されている例による、UIの選択部分の翻訳を示す。
【
図12】本願明細書において開示されている例による、スマート翻訳システムを実装するために使用され得るコンピュータシステムを示す。
【発明を実施するための形態】
【0026】
簡潔さおよび例示の目的で、本開示について、その例を参照することにより説明する。以下の説明では、本開示が十分に理解されるように特定の詳細事項が数多く記載される。しかし、当然のことながら、本開示はこうした特定の詳細事項に限定されることなく実施され得る。そのほか、本開示を不必要に曖昧にしないよう、一部の方法および構造を詳しく説明していない場合もある。本開示全体にわたって、「a(或る)」および「an(或る)」という用語は、少なくとも1つの特定の構成要素を示すよう意図される。本願明細書で使用されるとき、「includes(含む)」という用語は、含むがそれに限定されないという意味であり、「including(含んでいる)」という用語は、含んでいるがそれに限定されないという意味である。「based on(基づく)」という用語は、少なくとも部分的に基づくという意味である。
【0027】
翻訳される入力コンテンツにアプリケーションを介してアクセスし、アプリケーションを通して表示されるときに翻訳済みコンテンツが入力コンテンツのルックアンドフィールを保つように翻訳済みコンテンツが表示されることを可能にする、スマート翻訳システムが開示される。スマート翻訳システムは、ユーザから明示的に、または自動言語検出および推論されるユーザプリファレンスを介して黙示的に、入力コンテンツのソース言語と、入力コンテンツが翻訳されるターゲット言語とを含む翻訳メタデータを取得する。さらに、入力コンテンツを提供しているアプリケーションのタイプが判断される。例として、入力コンテンツを提供しているアプリケーションは、次に限定はされないが、電子メールアプリケーション、ウェブベースのアプリケーション、例えばデスクトップ/モバイルアプリケーションなどのソフトウェアアプリケーションを含むことができる。
【0028】
最初に、入力コンテンツの翻訳済みコンテンツがユーザキャッシュに存するかどうかが判断され、翻訳メタデータ通りの入力コンテンツの翻訳がユーザキャッシュに存在すれば、翻訳済みコンテンツがユーザキャッシュから読み出される。そうではなく、入力コンテンツの翻訳済みコンテンツがユーザキャッシュに記憶されていなければ、複数の自動翻訳エンジンから自動または手動で選択された翻訳エンジンから入力コンテンツの翻訳が得られる。或る例において、複数の翻訳エンジンは、外部翻訳エンジン、およびスマート翻訳システムに対してローカルの翻訳エンジンの、1つ以上を含むことができる。スマート翻訳システムは、翻訳エンジンの自動選択の前に一定の手順を実装する。この手順は、次に限定はされないが、入力コンテンツのドメインコンテキストおよび言語コンテキスト(例えばソース言語)を含むコンテキストを判断することを含む。入力コンテンツのドメインコンテキストは、テキストコンテンツを入力コンテンツから取得することと、構文解析し、トークン化し、トークンに品詞(POS:parts of speech)データを用いてタグ付けすることによってテキストコンテンツをさらに処理することとにより判断できる。そのように処理されたテキストコンテンツは、ドメインコンテキストの判断のために機械学習(ML)分類モデルに提供される。さらに、入力コンテンツの言語コンテキストは、ターゲット言語に基づくことができ、ドメインおよび言語固有の用語集データセットに基づきさらに判断されてもよい。処理されたテキストコンテンツはさらに、機密データを識別するために検査され、識別された任意の機密データは、テキストコンテンツが翻訳のために送信される前にマスキング/編集される。翻訳エンジンは、少なくともコンテキストに基づき複数の翻訳エンジンから自動で選択される。翻訳済みコンテンツが、アプリケーションのタイプおよび翻訳メタデータに基づき生成される。翻訳を生成するのに加えて、スマート翻訳システムはさらに、表示の中で翻訳済みコンテンツの主要セクションをハイライトし、翻訳済みコンテンツの要約を提供するように構成される。
【0029】
入力コンテンツの翻訳がユーザキャッシュに存在するかどうかを判断するために、スマート翻訳システムは、翻訳のためにユーザにより提出された以前の入力コンテンツと、関係する翻訳メタデータとともにユーザキャッシュに記憶されている対応する翻訳済みコンテンツとにアクセスする。以前の入力コンテンツとの入力コンテンツの類似度が計算される。以前のコンテンツと入力コンテンツとの類似度が所定のコンテンツ類似度閾値を上回る場合のみ、ユーザキャッシュから翻訳済みコンテンツが提供される。
【0030】
上述のとおり、少なくともアプリケーションに基づき、入力コンテンツに対して異なる翻訳が作り出されることができる。アプリケーションが電子メールプログラムを含む例では、入力コンテンツは、電子メールおよび対応する添付物のうちの1つ以上を含むことができる。電子メールを区切るヘッダおよびフッタが、翻訳される入力コンテンツから識別される。或る例において、ユーザ選択の中の電子メールのうちの1つ以上は、添付物を含むことができる。それに応じて、ユーザ選択に対して生成される翻訳済みコンテンツは、電子メールの翻訳だけでなく、電子メール添付物の翻訳も含むことになるであろう。翻訳済み電子メールおよびもとの電子メールのうちの1つ以上を、もとの添付物および翻訳済み添付物とともに記憶できる。
【0031】
或る例において、アプリケーションは、ウェブブラウザ内で実行されるウェブアプリケーションを含むことができる。この場合もやはり、ウェブブラウザにより表示されるコンテンツの少なくとも一部分のユーザ選択を含む入力コンテンツが、翻訳のために受信される。入力コンテンツの翻訳済みコンテンツは、ユーザキャッシュに存在しなければ、翻訳メタデータに基づき選択された翻訳エンジンから得られる。そのようにして生成された翻訳済みコンテンツがウェブブラウザ内に表示される。或る例において、ウェブブラウザにより表示されるコンテンツのユーザ選択部分がテキストの画像を含むと判断されれば、テキストが画像から取得され、画像から取得されたテキストの翻訳も得られる。
【0032】
或る例において、アプリケーションはソフトウェアアプリケーションを含むことができる。ユーザは、ソフトウェアアプリケーションのユーザインターフェース(UI)の少なくとも一部分を翻訳のために選択することができる。UIの一部分を選択すると、翻訳メタデータに対するデフォルトオプションのコンテキストメニューが、ユーザ選択の上に重ねられることができ、コンテキストメニューは、翻訳メタデータに対して自動で選択されたデフォルトオプションを提供する。なお、翻訳メタデータに対するデフォルトオプションは、ユーザ編集可能とすることができる。最初に、ソフトウェアアプリケーションのユーザインターフェースの一部分に表示されるラベルを含む、もとのフィールドの値が取得され、その値それぞれに対応するコンテンツの翻訳が得られる。翻訳済みコンテンツを含むラベルが、もとのフィールドそれぞれに対して生成される。生成されるラベルの背景色は、ユーザインターフェースの一部分に表示されているもとのフィールドの背景と一致するように設定される。同じく、テキストコンテンツのフォントプロパティを、可能な限りもとのフィールドと一致するように設定できる。そのようにして生成された翻訳済みラベルが、もとのフィールドの上に重ねられる。
【0033】
本願明細書において開示されるスマート翻訳システムは、データのプライバシーを保ちながらテキストコンテンツの迅速、正確な自動翻訳を生成するという技術的課題に対する技術的解決策を提供する。したがって、スマート翻訳システムは、最初にユーザキャッシュをチェックして、受信された入力コンテンツが所与の翻訳メタデータに対して以前翻訳されたかどうかを判断するように構成される。翻訳されていれば、スマート翻訳システムは、自動翻訳エンジンにアクセスする代わりにユーザキャッシュから翻訳を読み出し、それによって時間および処理リソースを節約して、データが外部翻訳リソースに送信されることを防ぐ。入力コンテンツが自動翻訳エンジンに送信される場合でも、入力コンテンツは機密データのフィルタリングをされ、機密データがマスキングされるとよい。スマート翻訳システムはさらに、ユーザが表示全体ではなく表示の一部分のみを翻訳のために選択し、それによって自動翻訳のためのプロセッサリソースを節約しながらより迅速な翻訳を得られるように、翻訳の範囲に対するより強力な制御権をユーザに与える。さらにスマート翻訳システムは、種々のアプリケーションにより生成される種々のタイプのコンテンツの翻訳を、アプリケーションに対してカスタマイズされた形で処理するように構成される。例として、電子メールアプリケーションの事例では、翻訳は電子メールについてのみではなく、電子メールの添付物についても得ることができる。同じく、ソフトウェアアプリケーションの翻訳済みUIは、ソフトウェアアプリケーションのルックアンドフィールが保たれるように提示される。翻訳済みコンテンツのスペルおよび文法の訂正、主要セクションの識別、感情の識別、および要約の生成などの他の機能性も、開示されるスマート翻訳システムにより可能にされる。
【0034】
図1は、本願明細書において開示されている例によるスマート翻訳システム100のブロック図を示す。スマート翻訳システム100は、アプリケーション150を介して入力コンテンツ152を受信し、入力コンテンツ152に対応する翻訳済みコンテンツ156を、受信された入力コンテンツ152が由来したアプリケーション150のUIを介して提供する。種々の例において、スマート翻訳システム100は、プラグインとしてアプリケーション150に組み込まれることが可能であり、またはスマート翻訳システム100は、リモートシステムにより実行されてアプリケーション150に通信可能に結合されてもよい。いずれの事例においても、スマート翻訳システム100は、アプリケーション150のUI上のボタンまたはメニュー項目などのUI要素を介してアクセスされ得る。ユーザは、アプリケーション150のUIの部分を全体的に選択して、そのUI要素のアクティブ化を介してスマート翻訳システム100を翻訳のためにトリガすることにより、入力コンテンツ152を生成してもよい。
【0035】
翻訳済みコンテンツ156は、アプリケーション150のルックアンドフィールが実質的に保たれた形でアプリケーション150を介して提供される。アプリケーション150の例は、次に限定はされないが、電子メールアプリケーション、ブラウザベースのアプリケーション、およびデスクトップアプリケーションまたはモバイルアプリケーション(「アプリ」)などのソフトウェアアプリケーションを含むことができる。本願明細書に詳述された翻訳済みコンテンツ156の種々のバージョンが、入力コンテンツ152が受信されるアプリケーション150に基づき生成されることが可能である。スマート翻訳システム100は、入力受信器102、コンテンツ翻訳器104、および翻訳済みコンテンツプロバイダ106を含む。入力受信器102は、翻訳される入力コンテンツ152を翻訳メタデータ154とともに受信する。翻訳メタデータ154は、限定はされないが、入力コンテンツ152のソース言語、入力コンテンツ152が翻訳されるターゲット言語、アプリケーション150の識別メタデータ、およびそのほか入力コンテンツ152に含まれる1つ以上のファイルに関わるファイルフォーマットなどのメタデータを含むことができる。或る例において、スマート翻訳システム100には、ソース言語がターゲット言語と同じであれば翻訳が不要であると判断するのに十分な知能がある。
【0036】
入力コンテンツ152は翻訳メタデータ154とともに、翻訳済みコンテンツ156の生成を可能にするコンテンツ翻訳器104に提供される。コンテンツ翻訳器104は、入力プロセッサ142、アプリケーションファイルプロセッサ144、および翻訳生成器146を含む。入力プロセッサ142は、入力コンテンツ152の翻訳済みコンテンツ156がすでにユーザキャッシュ148に存在するかどうかを判断するために、入力コンテンツ152にアクセスする。或る例において、スマート翻訳システム100のユーザは、例えば、翻訳エンジンのユーザプリファレンス、ソース/ターゲット言語、ならびに書き起こしサービス(該当する場合)および頻繁にリクエストされる翻訳などのユーザ固有データを記憶する専用のユーザキャッシュ148など、キャッシュ上の特定のスペースを有してもよい。翻訳済みコンテンツ156がユーザキャッシュ148において発見されれば、それがユーザキャッシュ148から読み出され、複数の翻訳エンジン120-1,120-2,…,120-nなどの外部翻訳サービスにアクセスする必要がない。翻訳済みコンテンツ156をユーザキャッシュ148から読み出し不可能であれば、入力コンテンツ152はさらにアプリケーションファイルプロセッサ144により処理されて、翻訳生成器146に提供されるとよい。
【0037】
入力プロセッサ142は、翻訳済みコンテンツ156をユーザキャッシュ148から読み出し不可能であれば、ドメインコンテキストおよび言語コンテキストを含む入力コンテンツ152のコンテキスト172を判断するようにさらに構成可能である。或る例において入力プロセッサ142は、入力コンテンツ152を翻訳のために翻訳生成器146に送信する前に機密データを編集するようにさらに構成できる。或る例においてスマート翻訳システム100は、翻訳動作において使用されるコンテキスト172などの情報を記憶するデータストア170に通信可能に結合されてもよい。入力コンテンツ152のコンテキスト172は、複数の翻訳エンジン120-1,120-2,…,120-n(nは自然数であり、n=1,2,…)のうちの1つを自動で選択するために翻訳生成器146により使用される。或る例において、複数の翻訳エンジン120-1,120-2,…,120-nは、外部翻訳サービス、例えば次に限定はされないがGoogle翻訳(登録商標)、AWS(登録商標)、Azure(登録商標)などがあるがこれらに限定はされない他のクラウドプロバイダにより提供される翻訳サービス、またはスマート翻訳システム100によりホストされるローカル翻訳エンジンさえも含むことができる。複数の翻訳エンジン120-1,120-2,…,120-nは、ドメイン固有または言語固有の翻訳を提供するために動作してもよい。或る例において、ユーザには、ユーザが特定の翻訳エンジンを選択してそれによりスマート翻訳システム100により行われた自動選択をオーバーライドできるようにするコンテキストメニューを、アプリケーション150を介して提示できる。選択された翻訳エンジンにより出力される翻訳済みバージョン162は、アプリケーション150を介して提示するために翻訳済みコンテンツプロバイダ106によりさらに処理される。
【0038】
或る例において、翻訳生成器146は、少なくともドメイン/言語コンテキストおよび翻訳メタデータ154に基づき複数の翻訳エンジン120-1,120-2,…,120-nのうちの1つを自動で選択するように構成された、エンジン選択器146-1を含むことができる。さらにエンジン選択器146-1は、以前の翻訳のために行われたエンジンの選択に関するユーザフィードバックを受信することができる。或る例において、エンジン選択器146-1は、各ソース/ターゲット言語ペアおよびコンテキスト172に対して最良のエンジンを予測するために、モデルフリー強化学習アルゴリズムを実装することができる。アルゴリズムは、ベルマン方程式を使用してQ値(またはクオリティ値)を算出してもよい。Qテーブルが、各言語ペアおよびコンテキスト172の組み合わせに対してまず構築され、複数の翻訳エンジン120-1,120-2,…,120-nの数に対応するnの行と、翻訳エンジンに関連する状態の数に対応するmの列とがあり、n,mは自然数であり、n,m≧1である。例示の状態は、優、良、並、劣、未対応などを含んでもよい。最初、Qテーブルのすべての値はゼロに設定され、エンジン選択器146-1は、複数の翻訳エンジン120-1,120-2,…,120-nからランダムなエンジン選択を行う。反復の数が増加するのに伴い、エンジン選択器146-1によって、ユーザからのフィードバックに基づきより正確なQ値を算出でき、したがって、各コンテキスト172および言語ペアに対して最良の翻訳エンジンのエンジン選択器146-1による予測を改善できる。新たなエンジンが導入されたとき、または当初のセットアップ中、エンジン選択器146-1はその訓練段階にあると予想される。この時点で、語学専門家およびドメイン専門家が、新たに追加されたエンジンをランダムに評価し、新たなエンジンをユーザに渡す前に正確なフィードバックを提供することができる。機密データの編集が行われた入力コンテンツ152が、翻訳済みバージョン162を生成するために、選択された翻訳エンジンに送信される。
【0039】
入力プロセッサ142または翻訳生成器146のうちの一方(翻訳済みコンテンツ156がユーザキャッシュ148から読み出されたか、または翻訳済みバージョン162が複数の翻訳エンジン120-1,120-2,…,120-nのうちの1つにより生成されたかに応じる)からの出力が、翻訳済みバージョン162をアプリケーション150を介して表示するために処理する翻訳済みコンテンツプロバイダ106に提供される。翻訳済みバージョン162は、スペルおよび文法の訂正を含む翻訳後の精緻化、主要セクションの識別、翻訳済みコンテンツの要約などのためにさらに処理できる。さらに翻訳済みバージョン162は、翻訳済みコンテンツ156として提供される前に、よりターゲット言語に適した形式に、言語コンテキストに基づいてさらに修正できる。翻訳済みコンテンツ156は、アプリケーション150を通して表示されるとき、入力コンテンツ152のルックアンドフィールを保つ形でアプリケーション150を通して提示される。例として、入力電子メールに対応する翻訳済み電子メールは、受信された入力電子メールが由来したのと同じ電子メールアプリケーションを介して、入力電子メールと実質的に同一の形で提示/表示できる。同じく、翻訳済みウェブコンテンツは同じウェブブラウザ内で提示可能であり、アプリケーションの翻訳済みUIも、ソフトウェアアプリケーションのもとのUIと実質的に類似したルックアンドフィールを保つ。
【0040】
図2は、本願明細書において開示されている例による入力プロセッサ142のブロック図を示す。入力プロセッサ142は、キャッシュ情報読み出し器202、コンテキストプロセッサ204、およびデータ編集器206を含む。入力コンテンツ152の翻訳のリクエストが受信されると、リクエストされた翻訳が以前実行されてユーザキャッシュ148に記憶されたかどうかを判断するために、キャッシュ情報読み出し器202が最初にアクティブ化される。翻訳は、スマート翻訳システム100により生成されるたびにユーザキャッシュ148に記憶される。或る例において、ユーザ固有データ/コンテンツは、有効期限/削除まで所定の期間にわたりユーザキャッシュ148に記憶されてもよい。したがって、或る翻訳が頻繁にリクエストされれば、更新が行われ、それによりユーザキャッシュ148からの削除が防がれる。これは、スマート翻訳システム100がすべての翻訳リクエストについて複数の翻訳エンジン120-1,120-2,…,120-nにアクセスする必要性を軽減する。
【0041】
或る例において、キャッシュ情報読み出し器202は、キャッシュアクセス器222、類似度計算器224、およびキャッシュ情報プロバイダ226を含むことができる。キャッシュアクセス器222は、入力コンテンツ152を受信し、ユーザキャッシュ148にアクセスして、翻訳メタデータ154に基づく入力コンテンツ152の以前の翻訳に関する判断を可能にし、翻訳メタデータ154は、ソース言語/ターゲット言語のみならず、入力コンテンツ152を含むアプリケーション150のロケーション/リンクまたはその他識別指示も含む。或る例において、アプリケーション150の実行ファイルの名前、および翻訳メタデータ154内の任意のパラメータを、スマート翻訳システム100により受信できる。類似度計算器224は、キャッシュコンテンツと、翻訳メタデータ154を含む入力コンテンツ152との間の類似度を計算してもよい。次に限定はされないが、例えばコサイン類似度、様々な距離測度、ジャカード類似度などの様々な類似度測度が、類似度計算器224により用いられることが可能である。キャッシュ情報プロバイダ226は、ユーザキャッシュ148のコンテンツのいずれかが所定のコンテンツ類似度閾値より大きな類似度を有するかどうかを判断することができる。有する場合、次にその特定のコンテンツ項目が、入力コンテンツ152の翻訳済みバージョン162としてキャッシュ情報プロバイダ226により返されることが可能である。所定のコンテンツ類似度閾値より大きな類似度を有するものとしてユーザキャッシュ148から判断可能なコンテンツ項目がなければ、入力コンテンツ152は、複数の翻訳エンジン120-1,120-2,…,120-nのうちの1つの選択を可能にするコンテキスト識別のためにコンテキストプロセッサ204に提供される。
【0042】
コンテキストプロセッサ204は、コンテンツ取得器242、コンテキスト識別器244、および用語集データセット246を含む。コンテンツ取得器242は、入力コンテンツ152内のテキストコンテンツおよび非テキストコンテンツを識別し、画像ファイルなどの非テキストコンテンツをテキストコンテンツに変換するように構成できる。例として入力コンテンツ152は、画像ファイルがあるウェブページの一部分の選択を含んでもよい。テキストを含むかどうかを判断するために画像ファイルを処理でき、含む場合、テキストフォーマットへの変換のために画像ファイルを光学文字認識(OCR:optical character recognition)エンジンに提供できる。そのようにして得られたテキストは、コンテンツ取得器242により構文解析され、トークン化され、品詞(POS)を用いてタグ付けされて、コンテキスト識別器244に提供されることが可能である。コンテキスト識別器244は、入力コンテンツ152において受信されたテキストコンテンツを、複数のドメイン/言語コンテキストのうちの1つを含むコンテキスト172に分類する、機械学習(ML)分類モデルを含むことができる。用語集データセット246は、種々の言語の種々のドメインからの専門用語を備えたデータセットを含むことができる。例として用語集データセット246は、例えば製造、医療、財務、小売、教育など種々のドメインについて、英語、スペイン語、フランス語、日本語などの言語固有の専門用語を含むことができる。コンテキスト識別器244は、コンテンツ取得器242により提供された単語トークンを、ドメインコンテキスト識別からの様々な用語集データセット246の用語と照合するように構成できる。最高の信頼度スコアを備えた特定の言語/ドメイン用語集データセットを、入力コンテンツ152のドメイン/言語コンテキストとして出力できる。ドメインコンテキストの識別は、一定の用語の正確な解釈を可能にする。例として、「fine」という用語は医療ドメインではすべてが問題ないことを意味することができるのに対して、同じ「fine」という用語が財務ドメインでは大きく異なるものを意味する。或る例において、選択された翻訳エンジンにより生成された翻訳済みバージョン162も、入力コンテンツ152について最初に判断されたコンテキストを確認するためにコンテキスト識別器244に提供できる。
【0043】
入力コンテンツ152のドメイン/言語コンテキストを識別すると、コンテンツ取得器242からのトークンを、機密データを識別してマスキングするように構成されているデータ編集器206に提供できる。データ編集器206は、コンテンツ取得器242によるPOSタグ付けから得られたタプルのリストからの固有表現認識(NER:named entity recognition)およびエンティティ関係検出のための、様々なML分類モデル262を含む。分類再帰型ニューラルネットワーク(RNN:Recurrent Neural Network)264が、ユーザ/ビジネスエンティティが秘密に保ちたいと望むかもしれない機密データを表す機密エンティティから通常の単語/エンティティを分類するように訓練される。機密エンティティの例は、次に限定はされないが、個人名、住所、連絡先情報、および例えば社会保障番号、納税者id、財務情報、口座番号、金額などの識別情報を含むことができる。次に限定はされないが、n-gram、推論規則、および自己相互情報量ベースのアプローチなど、他の機密識別技術も、機密データ識別器266により実装できる。n-gramは、所与のシーケンスからのn項目のサブシーケンスである。n-gramは、様々な分野の統計的自然言語処理および遺伝子配列分析において使用されている。当該の項目は、用途に応じて文字、単語、または塩基対とすることができる。例として、文字のシーケンス「Hatem」は、(「Hat」,「ate」,「tem」,「em 」,,…)の3-gramを有し、(「Ha」,「at」,「te」,「em」,…)の2-gramを有する。公平且つ頑健な訓練のための相互情報量ベースのアプローチは、MLにおいて信頼されるAIを必要とし、正確なモデルを訓練することに加え、データのバイアスおよびポイゾニングの存在下でも公平性と頑健性を兼ね備えた訓練が考慮される。
【0044】
機密データ識別器266は、入力コンテンツ152に関して、所定の信頼水準より高い信頼水準を備える特定のロケーションを発見するように構成でき、所定の信頼水準より高い信頼水準は、入力コンテンツ152の当該特定のロケーションに機密情報が存在することを示すことができる。機密データ識別器266からの出力は、入力コンテンツ152内の機密データのタイプおよび機密データのロケーションを含むことができる。データマスキングプロバイダ268は、機密データ識別器266の出力を受信し、識別された機密データを、マスキングし、編集し、またはその他翻訳エンジンへの送出を防ぐ。データマスキングプロバイダ268は、次に限定はされないが、機密データを含むフィールドを黒く塗ることでマスキングすること、仮名化、つまり機密エンティティを類似データにより置き換えること、および匿名化、つまり機密エンティティをランダムな文字により置き換えることなど、様々なデータマスキング技術を実装できる。
【0045】
図3は、本願明細書において開示されている例によるアプリケーションファイルプロセッサ144のブロック図を示す。入力コンテンツ152は、入力コンテンツ152が生じるアプリケーション150に基づきアプリケーションファイルプロセッサ144により翻訳のために処理される。本願明細書で言及されているように、翻訳メタデータ154は、アプリケーション150が電子メールアプリケーションであるか、ウェブ/ブラウザベースのアプリケーションであるか、またはその他ソフトウェアアプリケーションであるかをアプリケーションファイルプロセッサ144が判断できるようにするリンクまたはその他識別された指示を含むことができる。識別された指示に基づき、アプリケーションファイルプロセッサ144は、電子メールプロセッサ302、ウェブコンテンツプロセッサ304、およびアプリケーションUIプロセッサ306のうちの1つを含むことができる。
【0046】
アプリケーション150が電子メールプログラムである場合、アプリケーションファイルプロセッサ144は、電子メールチェーンからの1つ以上の電子メールまたは或る電子メールの一部分をユーザが翻訳のために選択できるようにする、電子メールプロセッサ302を含む。上述のとおり、ユーザは、翻訳される入力コンテンツを、例えばマウスのクリック、ホールド、およびリリース操作などの選択操作を介して特定してもよい。ユーザ選択領域を示すマウスクリックイベントが発せられることが可能であり、ポップアップメニュー、ボタン、または別のUIウィジェットを介してスマート翻訳システム100がトリガされることが可能である。そのようにして受信またはユーザにより特定された入力コンテンツ152は、翻訳前の前処理のために電子メールプロセッサ302に提供される。或る例において、電子メールプロセッサ302は、ユーザ選択識別器322、ヘッダ・フッタ識別器324、署名識別器326、および添付物取得器328を含むことができる。ユーザ選択識別器322は、選択操作に基づき入力コンテンツ152を識別してもよい。電子メールアプリケーションの入力コンテンツ152は、最新の電子メール、複数の電子メールの電子メールチェーン全体、或る電子メール/電子メールチェーンの特定の一部分などを含むことができる。ヘッダ・フッタ識別器324は、電子メールのヘッダセクションおよびフッタセクションを識別するために分類サポートベクタマシン(SVM:support vector machine)アルゴリズムを実装する。電子メールのヘッダセクションは、送信者、受信者、電子メールが送信または受信された時刻/日付、電子メールの件名、および電子メールが含んでいるかもしれない任意の添付物に関係する情報を含むことができる。電子メールのフッタセクションは、電子メール送信者の署名を含むことができる。電子メールのチェーンが処理される事例では、ヘッダおよびフッタは、電子メールチェーンの中の電子メールそれぞれを個々に識別することを可能にする。特徴をグループ化するために、この場合も、コンテンツ取得器242の単語トークンおよびPOSタグを含む出力を使用できる。ヘッダ/フッタを識別するためにSVMモデルにより使用される特徴は、次に限定はされないが、入力コンテンツ152を含むファイルにおける単語の位置、画像、またはデータ構造、単語の数、人名などの固有表現、住所、電話番号、ロゴ、特殊なパターン、改行などを含むことができる。署名識別器326も、電子メールの署名を識別するために上述の特徴を使用することができる。電子メールが翻訳のために提出される場合、一部の例では、電子メールの署名は翻訳されなくてもよい。添付物取得器328は、電子メールヘッダから添付物を識別するように訓練されたMLモデルも含むことができる。或る例において、そのようにして得られた添付物は、翻訳のために提出される入力コンテンツ152の一部として提供されてもよい。或る例において、翻訳済み添付物は、返信または転送中、もとの電子メールに戻されることが可能である。したがって、翻訳後、もとの電子メールは、ソース言語のもとの添付物およびターゲット言語の翻訳済み添付物の2つの添付物を含んでもよい。或る例において、翻訳済み電子メールは、もとの添付物および翻訳済み添付物とともに電子メールサーバに記憶されてもよい。
【0047】
アプリケーション150がウェブアプリケーションまたはウェブブラウザを含む場合、アプリケーションファイルプロセッサ144はウェブコンテンツプロセッサ304を含んでもよく、ウェブコンテンツプロセッサ304はユーザ選択識別器342およびウェブコンテンツ分析器344をさらに含んでもよい。ユーザ選択識別器342は、電子メールアプリケーションに対するユーザ選択識別器322と同様に機能することができ、ユーザ選択識別器342は、ウェブブラウザのコンテンツのユーザ選択部分を識別する。ウェブコンテンツ分析器344は、翻訳メタデータ154においてすぐに利用可能でなければウェブページコンテンツのソース言語を自動で検出するなど、入力コンテンツ152を分析して翻訳メタデータ154を判断する。
【0048】
アプリケーションUIプロセッサ306はさらに、ユーザ選択識別器362、UI要素識別器364、およびUI要素プロパティ取得器366を含む。ユーザ選択識別器362は、UI、またはユーザにより選択されたUIの一部分を、入力コンテンツ152として受信する。UI要素識別器364は、UIのユーザ選択部分の中の、例えばラベル、ボタン、コンボボックスなどのUI要素を識別する。UI要素プロパティ取得器366は、受信される入力コンテンツ152が由来するUIの中でのUI要素の位置座標を、サイズ、背景色、前景/テキスト色、フォントサイズ、フォントタイプなどのプロパティとともに取得する。UI要素の位置情報は、スマート翻訳システム100が、翻訳済みのラベル、名前などを、アプリケーションUIのルックアンドフィールが保たれるようにもとのラベルの位置に重ねられるようにする。
【0049】
図4は、本願明細書において開示されている例による翻訳済みコンテンツプロバイダ106のブロック図を示す。翻訳済みコンテンツ生成器は、文法/スペルチェッカ402、言語コンテキスト修正器404、コンテンツ要約器406、主要セクション識別器408、感情識別器414、およびUI生成器412を含む。当然のことながら、翻訳済みコンテンツ156を生成するために、翻訳済みコンテンツプロバイダ106のすべてのコンポーネントが用いられる必要はない。むしろ、翻訳済みコンテンツが生成される対象のアプリケーション150に応じてコンポーネントの1つ以上が使用されればよい。例として、アプリケーション150が電子メールプログラムであれば、UI生成器410、文法/スペルチェッカ402、および言語コンテキスト修正器404を含むコンポーネントが使用されてもよく、コンテンツ要約器406および主要セクション識別器408は使用されなくてもよい。他方、アプリケーション150がウェブページであれば、コンテンツ要約器406およびセクション識別器408が使用されてもよく、UI生成器410または言語コンテキスト修正器404は用いられなくてもよい。
【0050】
文法/スペルチェッカ402は、自然言語処理(NLP:natural language processing)技術を使用して、翻訳済みバージョン162における文法のエラーおよびスペルの誤りの検出を提供する。例として、時制に基づく文法の誤りまたは指示内容に基づく当該の誤りを識別および訂正できる。同じく、言語/ドメイン用語集を使用して、スペルの誤りも文法/スペルチェッカ402により訂正できる。辞書ベースの訂正の例は、単純なスペルエラーに対処することができ、「I acept this proposal」が「I accept this proposalに訂正される。コンテキストベースのスペルエラーも訂正されてもよい。例として、入力文章「I accept this to be done by 3 pm」が「I expect this to be done by 3 pm」に訂正されてもよい。
【0051】
各言語には、口語または文語でテキスト表現する特有の形がある。例として、日本語の丁寧な口語では、人の呼びかけには名前を「さん」と組み合わせて、例えば「Johnさん」とすることが要求される。そのような言語の特色に対して、言語コンテキスト修正器404は、翻訳済みバージョン162を取得し、翻訳済みの単語/文章に言語コンテキストを用いてさらなる追加/置き替えを行うことにより、対応する。NLP技術を使用して、修正/置き換えが行われる単語が識別され、言語/ドメイン用語集データセットからの単語が使用され、自然言語生成(NLG:Natural Language Generation)技術を用いて文章が生成される。これは、電子メール通信を翻訳するときに非常に有用となり得る。
【0052】
コンテンツ要約器406は、データを解釈および要約するNLP技術を実装することにより、翻訳済みバージョン162を読み取るように構成される。例として、入力コンテンツ152が長い契約文書であれば、コンテンツ要約器406は、例えば関与する当事者、契約開始日、達成されるべきマイルストーン、および契約の終了日などの主要な点を要約することができる。或る例において、コンテンツ要約器406は、既存のテキストから主要情報を取得して分離し、テキストを要約コンテンツに凝縮することにより、コンテンツ要約を生成することができる。
【0053】
主要セクション識別器408は、翻訳済みバージョン162を処理して、翻訳済みコンテンツ156において主要な点をハイライトする。主要セクション識別器408は、主要/非主要セクションを識別するように訓練されたML分類モデルを実装することができる。次に限定はされないが、例えば単語の位置、単語が肯定的であるか否定的であるか、その位置にある単語の数、人名、最後の文字、特殊なパターン、改行の数などの特徴が、非主要セクションから主要セクションを区別するためにML分類モデルにより使用されることが可能である。さらに感情識別器414が、入力コンテンツ152内で表現されている感情を検出するためにスマート翻訳システム100に含められる。或る例において、感情または情緒を検出する畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)分類モデル。各言語に対して別個のCNNモデルを構築できる。感情は種々のレベルで区別できる。例として、例えば否定的かまたは中立かなどの感情の性質を検出できる。感情の強さも、前兆/切迫/高、中、または低として検出されてもよい。同じく、感情に関連する他のコンテキストも識別されてもよい。例として、感情に基づき、文章がリクエスト問い合わせ、または回答として識別されてもよい。
【0054】
UI生成器412は、アプリケーション150のルックアンドフィールが保たれるように翻訳済みコンテンツ156を生成してアプリケーション150を通して提示するために使用できる。したがって、電子メールプログラムにおいて閲覧されるとき、翻訳済み電子メールは、もとの電子メールのルックアンドフィールを保つ。同じく、コンテンツはソース言語の代わりにターゲット言語で表示されるが、ソフトウェアユーティリティまたはその他ソフトウェアプログラムの翻訳済みUI画面は、もとのUI画面と同じ外観を保つ。実質的に同様のルックアンドフィールを実現するために、UI生成器412は、出力プロパティ識別器422、出力テキスト生成器424、および出力位置調整コンポーネント426により構成される。スマート翻訳システム100はプラグインとして動作するので、アプリケーション150のUIの表示プロパティが、出力プロパティ識別器422によりアプリケーションプログラミングインターフェース(API:application programming interface)を介してアクセスされてもよい。表示プロパティは、次に限定はされないが、UI画面(単数または複数)の背景色、フォントタイプ、フォントフェイス、フォントの色、その他フォントプロパティ、UI(単数または複数)上での特定の単語の位置調整などを含んでもよい。出力テキスト生成器424は、表示プロパティを使用して出力テキストを生成し、出力位置調整コンポーネント426は、表示プロパティに従い修正されたテキストを、取得された入力コンテンツ152が由来したもとのUIにおける対応するテキストの位置座標により決定される位置に配置する。
【0055】
図5は、本願明細書において開示されている例による、入力コンテンツ152を翻訳する方法を詳述するフローチャート500を示す。本方法は、入力コンテンツ152がアプリケーション150から受信される502にて開始する。本願明細書において言及されているように、ユーザは、アプリケーション150のUIの全体または一部分を翻訳のために選択でき、それが入力コンテンツ152としてスマート翻訳システム100に伝達されることが可能である。翻訳メタデータ154も、入力コンテンツ152とともに受信されることが可能である。翻訳メタデータ154は、入力コンテンツ152のソース言語と、入力コンテンツ152が翻訳されるターゲット言語とを少なくとも含むことができる。504にて、コンテンツタイプを翻訳メタデータ154から識別でき、つまり、入力コンテンツ152がウェブコンテンツであるか、電子メールであるか、またはソフトウェアアプリケーションのユーザインターフェースの一部分であるかを判断できる。506にて、入力コンテンツのリクエストされた翻訳156がすでにユーザキャッシュ148に存在するかどうかが判断される。例として、例えば同じウェブページを同じ言語に翻訳するなど、ユーザが特定のコンテンツ部分について同じ翻訳を頻繁にリクエストしていれば、当該の翻訳は、キャッシュのユーザ固有部分、つまりユーザキャッシュ148に記憶されているかもしれない。リクエストされた翻訳がユーザキャッシュ148に存在すると506にて判断されれば、508にて翻訳がユーザキャッシュ148から読み出されて、524にてアプリケーション150を介してユーザに提供される。
【0056】
リクエストされた翻訳がユーザキャッシュ148に記憶されていないと506にて判断され、その結果、本方法は入力コンテンツ152のコンテキストを判断する510に進む。コンテキストおよび翻訳メタデータ154に少なくとも基づき、入力コンテンツ152の翻訳済みバージョン162を生成するために、512にて複数の翻訳エンジン120-1,120-2,…,120-nから翻訳エンジンが選択される。514にて、入力コンテンツ152が何らかの機密データを含むかどうかがさらに判断される。含む場合、516にて機密データが編集/マスキングされ、機密データをマスキングされた入力コンテンツ152が、選択された翻訳エンジンに518にて提供される。520にて、翻訳済みバージョン162が選択された翻訳エンジンから得られる。翻訳済みバージョン162は、スペルおよび文法チェック、言語コンテキスト修正、要約、主要セクション、および感情識別、ならびに/または適切なUIの生成により、提示のために522にてさらに処理される。524にて、翻訳済みバージョン162のさらなる処理からそのようにして生成された翻訳済みコンテンツ156が、アプリケーション150を介してユーザに提供される。
【0057】
図6は、本願明細書において開示されている例による、入力コンテンツ152のコンテキストを判断する方法を詳述するフローチャート600を示す。本方法は、入力コンテンツが非デジタル化テキストを含むかどうかが判断される602にて開始する。例として入力コンテンツ152は、テキストを含んでもよいスキャンされた画像またはその他の種類の画像を含むことができる。602にて入力152が非デジタル化テキストを含むと判断されれば、本方法は、例としてOCRにより非デジタル化テキストをデジタル化する604に進み、さらに本方法は606に進む。602にて入力コンテンツ152がデジタル化テキストを含むと判断されれば、本方法は入力コンテンツ152を特定のドメインコンテキストおよび言語コンテキストに分類する606に直接進む。判断されたコンテキストおよび翻訳メタデータ154に少なくとも基づき、608にて翻訳済みバージョン162が得られる。610にて、翻訳済みバージョン162が、ドメインコンテキストおよび言語コンテキストを判断するために再度処理される。612にて、入力コンテンツ152のドメインコンテキストおよび言語コンテキストが、翻訳済みバージョン162のものと比較される。612での比較に基づき、614にて、入力コンテンツ152と翻訳済みバージョン162とのコンテキスト間に十分な重複があるかどうかが判断される。あれば、616にてコンテキスト判断について肯定的なフィードバックが与えられ、そうでなければ、618にてコンテキスト判断について否定的なフィードバックが与えられる。
【0058】
図7は、本願明細書において開示されている例による、翻訳済み電子メール添付物を生成する方法を詳述するフローチャート700を示す。702にて、添付物のフォーマットがソース言語およびターゲット言語とともに判断される。ソース言語は翻訳メタデータ154においてユーザにより明示的に提供可能であるが、種々の言語を識別するように訓練されている訓練済みのML分類モデルを使用して自動で判断されることも可能である。添付物のファイルフォーマットは、ファイルメタデータから判断できる。添付物は、テキストコンテンツを含む画像704、デジタル化テキストコンテンツ706、およびロゴ/署名708などの種々のフォーマットのファイルを含むことができる。テキストコンテンツを備えた画像704は、710にてOCR技術を使用してデジタル化され、712にてターゲット言語に翻訳される。デジタル化テキストコンテンツ706は、712にてターゲット言語に直接翻訳できる。或る例では、ロゴ/署名708は、714にて翻訳なしでそのままソース言語に保たれる。716にて、添付ファイルがターゲット言語で再生成される。或る例では、もとの添付ファイルのコンテンツを翻訳済みコンテンツにより置き換えることにより添付ファイルを生成できる。718にて、添付ファイルが、翻訳済み電子メールおよびもとの電子メールのうちの1つ以上に含められて、アプリケーション150をホストする電子メールサーバ上に記憶される。
【0059】
図8は、本願明細書において開示されている例による、もとのUIのルックアンドフィールを保つ翻訳済みUIを生成する方法のフローチャート800を示す。本方法は、UIのユーザ選択部分を含む入力コンテンツ152が受信される802にて開始する。804にて、UIのユーザ選択部分からUI要素が識別される。或る例では、UI要素に関する情報は、アプリケーション150のAPIを使用して得ることができる。806にて、例えば可視属性、値、UI上の配置などのUI要素のプロパティも、APIを使用して、またはウェブアプリケーションなどの事例ではマークアップにアクセスすることにより、得ることができる。808にて、翻訳されるUI要素の可視テキストが取得される。例として、ラベルの事例では、ラベル上に表示される値が取得される。同じく、ドロップダウンメニューまたはコンボボックスの場合、ユーザの目に見える値が取得される。取得された値は、機密データのフィルタリングが行われて、選択された翻訳エンジンに810にて提供されてもよい。選択された翻訳エンジンから得られた翻訳済みの値は、812にてUI要素の可視プロパティに従ってフォーマットできる。可視プロパティは、背景色、例えばフォントタイプ、フォントサイズ、フォントスタイルなどのフォントプロパティを含んでもよい。翻訳済みUIは、814にて、翻訳済みUI要素を対応するもとのUI要素の上に重ねて、翻訳済みUI要素でもとのUI要素を隠すことにより生成される。
【0060】
図9A1、
図9A2は、本願明細書において開示されている例による、ソフトウェアアプリケーションのUIの翻訳を示す。当初のUI902のソース言語はドイツ語である。しかしながら、UIの一部分またはUI全体が翻訳のために選択されると、画面翻訳のコンテキストメニュー904が現れてスマート翻訳システム100により選択された翻訳のデフォルトオプションを示し、ユーザがデフォルトオプションを変更できるようにしてもよい。デフォルトオプションは、翻訳に使用される、自動で検出された言語908、ターゲット言語912、翻訳エンジン914、およびOCRエンジン916を含んでもよい。満足のいく選択を行うと、ユーザは、翻訳オプション916をクリックして、UI920に示されているようにUI902の翻訳を開始するとよい。
【0061】
図9Bは、本願明細書において開示されている例による、UI902に示されたオプションに基づき生成された翻訳済みUI950を示す。翻訳済みUI950にあるように、様々なラベル952、954、およびボタン956、958が、912にて選択されたターゲット言語である英語に翻訳される。翻訳済みUI950からわかるように、翻訳後の慣れないUIにユーザが対処しなくて済むように、UI902のルックアンドフィールは翻訳後にも保たれる。
【0062】
図10は、本願明細書において開示されている例による、電子メールアプリケーションにおけるスマート翻訳システム100の機能を示す。当初の電子メール1002は、例えばドイツ語などのソース言語であり、同じくソース言語の添付物1004を備える。ユーザオプションに基づき、翻訳済み電子メール1006が生成される。ただし、翻訳済み電子メールは、もとの添付物1004と、もとの添付物1004のターゲット言語への翻訳である翻訳済み添付物1008との2つの添付物を有する。或る例において、当初の電子メール1002は、ユーザオプションに応じて添付物1004および1006の両方により記憶されてもよい。
【0063】
図11Aおよび
図11Bは、本願明細書に開示された例による、スマート翻訳システム100によりブラウザベースのアプリケーションに適用されたときのページ全体の翻訳を示す。具体的には、
図11Aは、ソース言語である中国語の当初のウェブページ1110を示し、
図11Bは、ターゲット言語である英語の翻訳済みウェブページ1120を示す。或る例において、翻訳済みウェブページ1120は、翻訳中に遭遇された特定の言語の方言に関する、スマート翻訳システム100からの何らかの提案1122を含んでもよい。
【0064】
図11Cは、本願明細書において開示されている例による、UI1130の選択部分の翻訳を示す。選択部分1134の翻訳1132が、UI上のオーバーレイ1136に示されている。或る例において、スマート翻訳システム100により生成されたオーバーレイ1136は、ソーステキストとしての選択部分および出力テキストとしての翻訳1132を含むことができる。オーバーレイ1136はさらに、ユーザが必要に応じてオーバーライドできるデフォルトのシステム選択値であってもよい、様々な翻訳オプション1138を含む。
【0065】
図12は、本願明細書において開示されている例による、スマート翻訳システム100を実装するために使用され得るコンピュータシステム1200を示す。より具体的には、スマート翻訳システム100からデータを生成するため、またはスマート翻訳システム100のデータにアクセスするために使用され得るデスクトップ、ラップトップ、スマートフォン、タブレット、およびウェアラブルなどのコンピューティングマシンは、コンピュータシステム1200の構造を有してもよい。コンピュータシステム1200は、図示されていない追加のコンポーネントを含んでもよく、説明された処理コンポーネントの一部が除外および/または変更されてもよい。別の例において、コンピュータシステム1200は、Amazon Web Servicesなどの外部クラウドプラットフォーム、AZURE(登録商標)クラウド、もしくは社内のコーポレートクラウドコンピューティングクラスタ、または組織のコンピューティングリソースなどに存在することができる。
【0066】
コンピュータシステム1200は、中央処理ユニット、ASIC、または別のタイプの処理回路などのプロセッサ(単数または複数)1202と、例えばディスプレイ、マウスキーボードなどの入出力(I/O:input/output)デバイス1212と、ローカルエリアネットワーク(LAN:Local Area Network)、ワイヤレス802.11x LAN、3G、4G、もしくは5GモバイルWAN、またはWiMax WANなどのネットワークインターフェース1204と、プロセッサ可読媒体1206とを含む。これらのコンポーネントはそれぞれ、動作可能なようにバス12012に結合されていてもよい。プロセッサ可読またはコンピュータ可読媒体1206は、実行のために命令をプロセッサ(単数または複数)1202に提供することに関与する任意の適切な媒体とすればよい。例として、プロセッサ可読媒体1206は、磁気ディスクまたはソリッドステート不揮発性メモリなど、非一時的な、もしくは不揮発性の媒体、またはRAMなどの揮発性媒体としてもよい。プロセッサ可読媒体1206上に記憶される命令またはモジュールは、プロセッサ(単数または複数)1202により実行されプロセッサ(単数または複数)1202に方法およびスマート翻訳システム100の機能を実行させる、機械可読命令1264を含んでもよい。
【0067】
スマート翻訳システム100は、非一時的なプロセッサ可読媒体上に記憶されて1つ以上のプロセッサ1202により実行されるソフトウェアまたは機械可読命令として実装されてもよい。例として、プロセッサ可読媒体1206は、MAC OS、MS WINDOWS、UNIX、またはLINUXなどのオペレーティングシステム1262、およびスマート翻訳システム100のコード/命令1264を記憶してもよい。オペレーティングシステム1262は、マルチユーザ、マルチプロセッシング、マルチタスキング、マルチスレッディング、リアルタイム、および同様のものなどとされてもよい。例として、ランタイム中、オペレーティングシステム1262が動作し、スマート翻訳システム100のコードがプロセッサ(単数または複数)1202により実行される。
【0068】
コンピュータシステム1200は、不揮発性データストレージを含むこともあるデータストレージ1210を含んでもよい。データストレージ1210は、スマート翻訳システム100により使用される任意のデータを記憶する。データストレージ1210は、入力コンテンツ152、翻訳メタデータ154、翻訳バージョン162、翻訳済みコンテンツ156、ユーザ選択オプション、およびそのほかスマート翻訳システム100の動作中に生成および/または使用されるデータ要素を記憶するために、スマート翻訳システム100のローカルデータストレージとして使用されてもよい。
【0069】
ネットワークインターフェース1204は、例としてLANを介してコンピュータシステム1200を内部システムに接続する。さらにネットワークインターフェース1204は、コンピュータシステム1200をインターネットに接続してもよい。例としてコンピュータシステム1200は、ネットワークインターフェース1204を介してウェブブラウザならびにその他外部のアプリケーションおよびシステムに接続してもよい。
【0070】
一例とともにその変形の一部が本願明細書において説明され、示された。本願明細書で使用された用語、説明、および図面は、例示としてのみ記載されたものであり、限定としては意図されてはいない。添付の特許請求の範囲およびその等価物により定義されるよう意図される主題の意図および範囲内で、多数の変形が可能である。
【外国語明細書】