(58)【調査した分野】(Int.Cl.,DB名)
選択された前記テキストメッセージを翻訳することは、前記テキストメッセージの少なくとも部分をチャット用語から平易な言い方へ変換することを含む、請求項1または2に記載の方法。
選択された前記テキストメッセージを翻訳することは、前記テキストメッセージの少なくとも部分をチャット用語から平易な言い方へ変換することを含む、請求項7または8に記載のシステム。
前記動作は、前記テキストメッセージの履歴を閲覧することを停止するよう要求を前記ユーザから受け取ることをさらに含む、請求項7〜9のいずれか1項に記載のシステム。
選択された前記テキストメッセージを翻訳することは、前記テキストメッセージの少なくとも部分をチャット用語から平易な言い方へ変換することを含む、請求項13または請求項14に記載のコンピュータプログラム。
前記動作は、前記テキストメッセージの履歴を閲覧することを停止するよう要求を前記ユーザから受け取ることをさらに含む、請求項13〜15のいずれか1項に記載のコンピュータプログラム。
【発明の概要】
【課題を解決するための手段】
【0005】
発明の概要
本明細書に記載される様々な実施形態は、場合によっては2つ以上のクライアントシステムにいる複数ユーザ間の多言語通信に関連するシステムおよび方法を提供する。実施形態によって円滑化される通信のモードは、インターネットベースのチャット(たとえばApple(登録商標)iMessage(登録商標)、Windows(登録商標)Live Messenger等)、電子メール(たとえば組込みフォーラムメッセージング、Yahoo(登録商標)メール、RFC5322等)、テキストベースの携帯電話通信(たとえばSMSメッセージまたはMMSメッセージ)、オンラインフォーラムへの投稿(たとえばウェブベースの趣味フォーラムへの投稿)、およびオンラインソーシャルメディアサービス(たとえばTwitter(登録商標)、Facebook(登録商標)等)への投稿を含み得る。たとえば、システムおよび方法は、多言語マルチユーザチャットシステムを実現し得る。
【0006】
いくつかの実施形態について、提供される方法は、第1の言語と第2の言語とを識別することと、第1の言語で通信する第1のチャットクライアントシステムにおける第1の人間から、第1の言語での初期メッセージを受信することと、第1の言語での初期メッセージに基づく、第2の言語での第1の対応するメッセージについてデータストアに照会することとを含む。データストアが第1の対応するメッセージを含む場合、当該方法は、第2の言語で通信する第2のチャットクライアントシステムにおける第2の人間に対応するメッセージを送信することを支援する。実施形態に応じて、初期メッセージは、テキスト、顔文字、ASCIIベースアート、またはネットワーク上で送信される人間によって読取り可能なメッセージに好適であるかもしくは慣例的な他のコンテンツを含み得る。加えて、初期メッセージは、チャットクライアントシステム間で通信されているより大きなメッセージの一部であり得る(たとえば初期メッセージはマルチセンテンスメッセージ中の一
文である)。
【0007】
データストアが第1の対応するメッセージを含まない場合、当該方法は、変換エンジンを利用して、初期メッセージの少なくとも一部分を第1の言語での変換されたメッセージに変換することを試み得る。変換されたメッセージを用いて、当該方法は、変換されたメッセージに基づく、第2の言語での第2の対応するメッセージについてデータストアに照会し得る。
【0008】
ある実施形態について、当該システムまたは方法は、変換されたメッセージに基づく第2の対応するメッセージについてデータストアに照会する前に、一連の変換動作を用いて初期メッセージを変換することを試み得る。代替的に、いくつかの実施形態では、当該システムまたは方法は、変換および照会を反復して行なってもよく、それにより初期メッセージは、利用可能な変換動作のサブセットを用いて変換され、結果として得られる変換されたメッセージに基づく第2の対応するメッセージについてデータストアが照会され、第2の対応するメッセージが識別されない場合は、変換および照会の別の反復が行なわれる(たとえば、結果として得られる変換されたメッセージが、利用可能な変換動作の別のサブセットを用いてさらに変換され、結果として得られる変換されたメッセージに基づく第2の対応するメッセージについてデータストアが照会される)。いくつかのそのような実施形態では、各反復において適用される変換動作のサブセットが、初期メッセージに適用されてもよいし、または結果として得られる最新の変換されたメッセージに適用されてもよい。
【0009】
最終的に、当該方法は、初期メッセージまたは変換されたメッセージを第2の言語での対応するメッセージに翻訳することを支援し得る。いくつかの実施形態では、初期メッセージについての第1の対応するメッセージがデータストアになく、変換エンジンが初期メッセージの少なくとも一部分を変換しない時、初期メッセージは対応するメッセージに翻訳され得る。加えて、様々な実施形態では、初期メッセージについての第1の対応するメッセージがデータストアにない時、変換エンジンが初期メッセージの少なくとも一部分の変換を含む変換されたメッセージをもたらす時、および変換されたメッセージについて第2の対応するメッセージをデータストアが含まない時、変換されたメッセージは対応するメッセージに翻訳され得る。
【0010】
実施形態に応じて、初期メッセージの一部分を変換することは、初期メッセージ中のチャット用語の単語もしくは句(たとえば「lol」,「gr8t」)を識別し、チャット用語の
単語もしくは句をチャット用語でない単語もしくは句で置換すること、初期メッセージの一部分に対してスペルチェックを行なうこと、または初期メッセージの一部分における略語を識別し、略語を略語に対応する(たとえば略語によって表される)単語もしくは句で(たとえば「CA」を「California」で、または「brb」を「be right back」で)置換することを含み得る。
【0011】
その上、初期メッセージの一部分を変換することは、初期メッセージの一部分における頭字語を識別し、頭字語を頭字語(たとえば「USA」)に対応する(たとえば頭字語によ
って表される)単語もしくは句で置換すること、または初期メッセージの一部分の口語的な単語もしくは句を識別し、口語的な単語もしくは句を口語的な単語もしくは句を表わす単語もしくは句で置換することを含み得る。さらに、初期メッセージの一部分を変換することは、初期メッセージの一部分における卑罵的な単語もしくは句を識別し、卑罵的な単語もしくは句を(たとえば卑罵的な単語もしくは句を表す)卑罵的でない単語もしくは句で置換すること、または初期メッセージから卑罵的な単語もしくは句を除去することを含み得る。
【0012】
いくつかの実施形態について、初期メッセージの一部分を変換することは、翻訳されないよう初期メッセージの一部分にフラグを立てることを含む。たとえば、初期メッセージのある部分は、固有名詞、普通名詞、縮小形、略語、または頭字語を含み、当該方法は、後続の動作で翻訳されないように、当該ある部分にフラグを立て得る。
【0013】
ある実施形態は、本明細書に記載される様々な動作を行なうように構成された様々なコンポーネントを含むシステムを提供する。同様に、ある実施形態は、本明細書に記載される様々な動作をコンピュータシステムに行なわせるように構成されたコンピュータ命令コードを含むコンピュータプログラムプロダクトを提供する。
【0014】
1つの局面において、本発明はコンピュータによって実現される方法に関する。当該方法は、単語または句を含むメッセージの第1の言語から第2の言語への翻訳の失敗に関連付けられる単語または句をデータストアから選択することと、上記翻訳失敗についてユーザフィードバックを求めるユーザを選択することと、上記ユーザフィードバックと引き換えに上記ユーザに提供するインセンティブの値を判定することと、上記ユーザのコンピューティング装置に上記フィードバックについての要求を送信することとを含み、上記要求は上記インセンティブを含んでおり、上記方法はさらに、上記コンピューティング装置から上記ユーザフィードバックを受け取ることを含み、上記ユーザフィードバックは、上記第1または第2の言語のそれぞれの単語または句を含んでおり、上記方法はさらに、上記ユーザフィードバックが承認されると判定することと、上記承認に基づいて、上記インセンティブの値に従って上記ユーザのアカウントにクレジットを与えることとを含む。
【0015】
ある実施形態において、上記失敗は、上記メッセージの翻訳の実際の失敗による。上記失敗は、潜在的に不正確であるとユーザが上記メッセージにフラグを立てることによって識別され得るか、または、フラグを立てることにより得る。上記ユーザを選択することは、上記ユーザの確実性尺度、上記ユーザに関連付けられる割り当て分、上記ユーザの上記アカウントに対する以前のクレジット、上記ユーザのプレファレンス、または上記ユーザの言語能力に基づき得る。いくつかの実施形態において、上記単語または句は、上記第1の言語のチャット用語を含む。上記応答は、上記第2の言語のチャット用語を含み得る。いくつかの実現例において、上記照会は、テキストベースの値を受け取るように構成されるフィールドを含む。
【0016】
ある実施形態において、上記要求は、上記ユーザが上記単語または句について定義を選択することが可能であるあらかじめ選択された定義のセットを含む。上記あらかじめ選択された定義のセットはたとえば、他の要求に応答して他のユーザによって提供される少なくとも1つの定義を含み得、上記他の要求は、上記他のユーザから上記単語または句について以前のユーザフィードバックを得るよう以前に生成されている。上記他の要求は、上記他のユーザが上記定義を選んだ上記あらかじめ選択された定義の他のセットを含み得る。上記方法はさらに、最も一般的な応答を判定するよう上記ユーザフィードバックを評価することをさらに含み得る。
【0017】
様々な実施形態において、上記方法は、上記ユーザフィードバックに基づいて上記ユーザの適性を判定することをさらに含む。上記方法は、上記ユーザフィードバックに基づいて、上記第1の言語から上記第2の言語への上記単語または句の変換または翻訳を更新することをさらに含み得る。いくつかの実施形態において、上記ユーザフィードバックが承認されると判定することは、上記ユーザフィードバックが不正ではないと判定すること、および/または、上記ユーザフィードバックが正確であると判定することを含み得る。上記ユーザフィードバックが承認されると判定することは、他の要求に応答して他のユーザによって提供される少なくとも1つの以前のユーザフィードバックに対する上記ユーザフィードバックの比較に基づき得、上記他の要求は、上記他のユーザから上記単語または句
についてフィードバックを得るよう以前に生成されている。
【0018】
ある実施形態において、上記インセンティブは、ゲーム内通貨またはゲーム内アイテムを含む(またはそれらについてのオファーである)。上記インセンティブの値はたとえば、上記単語または句の複雑性または上記単語または句の重要性に基づいて判定され得る。いくつかの例において、上記インセンティブの値を判定することは、(i)上記単語または句の複雑性、(ii)上記単語または句の重要性、(iii)上記ユーザによって使用される応答方法、(iv)単語または句のタイプ、および/または(v)翻訳失敗に含まれる言語を考慮することを含む。
【0019】
別の局面では、本発明は、動作を実行するようにプログラムされる1つ以上のコンピュータを含むシステムに関する。上記動作は、単語または句を含むメッセージの第1の言語から第2の言語への翻訳の失敗に関連付けられる単語または句をデータストアから選択することと、上記翻訳失敗についてユーザフィードバックを求めるユーザを選択することと、上記ユーザフィードバックと引き換えに上記ユーザに提供するインセンティブの値を判定することと、上記ユーザのコンピューティング装置に上記フィードバックについての要求を送信することとを含み、上記要求は上記インセンティブを含んでおり、上記動作はさらに、上記コンピューティング装置から上記ユーザフィードバックを受け取ることを含み、上記ユーザフィードバックは、上記第1または第2の言語のそれぞれの単語または句を含んでおり、上記動作はさらに、上記ユーザフィードバックが承認されると判定することと、上記承認に基づいて上記ユーザのアカウントにクレジットを与えることとを含む。
【0020】
ある実施形態において、上記失敗は、上記メッセージの翻訳の実際の失敗による。上記失敗は、潜在的に不正確であるとユーザが上記メッセージにフラグを立てることにより識別され得るか、または、フラグを立てることにより得る。上記ユーザを選択することは、上記ユーザの確実性尺度、上記ユーザに関連付けられる割り当て分、上記ユーザの上記アカウントに対する以前のクレジット、上記ユーザのプレファレンス、または上記ユーザの言語能力に基づき得る。いくつかの実施形態において、上記単語または句は、上記第1の言語のチャット用語を含む。上記応答は、第2の言語のチャット用語を含み得る。いくつかの実現例において、照会は、テキストベースの値を受け取るように構成されるフィールドを含む。
【0021】
ある実施形態において、上記要求は、上記ユーザが上記単語または句について定義を選択することが可能であるあらかじめ選択された定義のセットを含む。上記あらかじめ選択された定義のセットはたとえば、他の要求に応答して他のユーザによって提供される少なくとも1つの定義を含み得、上記他の要求は、上記他のユーザから上記単語または句について以前のユーザフィードバックを得るよう以前に生成されている。上記他の要求は、上記他のユーザが上記定義を選んだ上記あらかじめ選択された定義の他のセットを含み得る。上記動作は、最も一般的な応答を判定するよう上記ユーザフィードバックを評価することをさらに含み得る。
【0022】
様々な実施形態において、上記動作は、上記ユーザフィードバックに基づいて上記ユーザの適性を判定することをさらに含む。上記動作は、上記ユーザフィードバックに基づいて、上記第1の言語から上記第2の言語への上記単語または句の変換または翻訳を更新することをさらに含み得る。いくつかの実施形態において、上記ユーザフィードバックが承認されると判定することは、上記ユーザフィードバックが不正ではないと判定すること、および/または、上記ユーザフィードバックが正確であると判定することを含み得る。上記ユーザフィードバックが承認されると判定することは、他の要求に応答して他のユーザによって提供される少なくとも1つの以前のユーザフィードバックに対する上記ユーザフィードバックの比較に基づき得、上記他の要求は、上記他のユーザから上記単語または句
についてフィードバックを得るよう以前に生成されている。
【0023】
ある実施形態において、上記インセンティブは、ゲーム内通貨またはゲーム内アイテムを含む(またはそれらについてのオファーである)。上記インセンティブの値はたとえば、上記単語または句の複雑性または上記単語または句の重要性に基づいて判定され得る。いくつかの例において、上記インセンティブの値を判定することは、(i)上記単語または句の複雑性、(ii)上記単語または句の重要性、(iii)上記ユーザによって使用される応答方法、(iv)単語または句のタイプ、および/または(v)翻訳失敗に含まれる言語を考慮することを含む。
【0024】
別の局面において、本発明は、インセンティブが与えられるフィードバックを通じて言語翻訳を向上させるための、1つ以上の記憶媒体に格納されるコンピュータプログラムプロダクトに関する。上記コンピュータプログラムプロダクトは、上記データ処理装置が、単語または句を含むメッセージの第1の言語から第2の言語への翻訳の失敗に関連付けられる単語または句をデータストアから選択することと、上記翻訳失敗についてユーザフィードバックを求めるユーザを選択することと、上記ユーザフィードバックと引き換えに上記ユーザに提供するインセンティブの値を判定することと、上記ユーザのコンピューティング装置に上記フィードバックについての要求を送信することとを含む動作を行うよう上記データ処理装置によって実行可能であり、上記要求は上記インセンティブを含んでおり、上記コンピュータプログラムプロダクトはさらに、上記データ処理装置が、上記コンピューティング装置から上記ユーザフィードバックを受け取ることを含む動作を行うよう上記データ処理装置によって実行可能であり、上記ユーザフィードバックは、上記第1または第2の言語のそれぞれの単語または句を含んでおり、上記コンピュータプログラムプロダクトはさらに、上記データ処理装置が、上記ユーザフィードバックが承認されると判定することと、上記承認に基づいて上記ユーザのアカウントにクレジットを与えることとを含む動作を行うよう上記データ処理装置によって実行可能である。
【0025】
ある実施形態において、上記失敗は、上記メッセージの翻訳の実際の失敗による。上記失敗は、潜在的に不正確であるとユーザが上記メッセージにフラグを立てることにより識別され得るか、または、フラグを立てることにより得る。上記ユーザを選択することは、上記ユーザの確実性尺度、上記ユーザに関連付けられる割り当て分、上記ユーザの上記アカウントに対する以前のクレジット、上記ユーザのプレファレンス、または上記ユーザの言語能力に基づき得る。いくつかの実施形態において、上記単語または句は、上記第1の言語のチャット用語を含む。上記応答は、第2の言語のチャット用語を含み得る。いくつかの実現例において、照会は、テキストベースの値を受け取るように構成されるフィールドを含む。
【0026】
ある実施形態において、上記要求は、上記ユーザが上記単語または句について定義を選択することが可能であるあらかじめ選択された定義のセットを含む。上記あらかじめ選択された定義のセットはたとえば、他の要求に応答して他のユーザによって提供される少なくとも1つの定義を含み得、上記他の要求は、上記他のユーザから上記単語または句について以前のユーザフィードバックを得るよう以前に生成されている。上記他の要求は、上記他のユーザが上記定義を選んだ上記あらかじめ選択された定義の他のセットを含み得る。上記動作は、最も一般的な応答を判定するよう上記ユーザフィードバックを評価することをさらに含み得る。
【0027】
様々な実施形態において、上記動作は、上記ユーザフィードバックに基づいて上記ユーザの適性を判定することをさらに含む。上記動作は、上記ユーザフィードバックに基づいて、上記第1の言語から上記第2の言語への上記単語または句の変換または翻訳を更新することをさらに含み得る。いくつかの実施形態において、上記ユーザフィードバックが承
認されると判定することは、上記ユーザフィードバックが不正ではないと判定すること、および/または、上記ユーザフィードバックが正確であると判定することを含み得る。上記ユーザフィードバックが承認されると判定することは、他の要求に応答して他のユーザによって提供される少なくとも1つの以前のユーザフィードバックに対する上記ユーザフィードバックの比較に基づき得、上記他の要求は、上記他のユーザから上記単語または句についてフィードバックを得るよう以前に生成されている。
【0028】
ある実施形態において、上記インセンティブは、ゲーム内通貨またはゲーム内アイテムを含む(またはそれらについてのオファーである)。上記インセンティブの値はたとえば、上記単語または句の複雑性または上記単語または句の重要性に基づいて判定され得る。いくつかの例において、上記インセンティブの値を判定することは、(i)上記単語または句の複雑性、(ii)上記単語または句の重要性、(iii)上記ユーザによって使用される応答方法、(iv)単語または句のタイプ、および/または(v)翻訳失敗に含まれる言語を考慮することを含む。
【0029】
1つの局面において、本発明は、データ処理装置によって実現される方法に関する。上記方法は、複数のユーザにテキストメッセージチャットシステムを提供することと、第1のユーザから第1の言語のオリジナルテキストメッセージを受け取ることと、上記オリジナルテキストメッセージの第2の言語の最初の翻訳を生成することと、第2のユーザに上記オリジナルテキストメッセージおよび上記最初の翻訳を提供することと、上記最初の翻訳におけるエラーに対応するよう上記第2のユーザから翻訳修正を受け取ることと、(a)上記第2のユーザからの上記翻訳修正を含む複数の翻訳修正から最も正確な翻訳修正を識別すること、ならびに、(b)単語ベースの特徴、言語ベースの特徴、および単語アラインメントの特徴のうち少なくとも1つを使用して上記第2のユーザからの上記翻訳修正の正確性を評価することのうち少なくとも1つとを含む。
【0030】
ある実施形態において、上記方法は、上記翻訳修正を提出するように上記第2のユーザを奨励するようインセンティブ(たとえば、オンラインゲームで使用される仮想グッズおよび/または仮想通貨)を提供することを含む。上記最も正確な翻訳修正を判定することは、上記最初の翻訳におけるエラーに対応するために、少なくとも1人の付加的なユーザから少なくとも1つの付加的な翻訳修正を受け取ることを含み得、上記少なくとも1つの付加的な翻訳修正と上記第2のユーザからの上記翻訳修正とは上記複数の翻訳修正を定義しており、上記最も正確な翻訳修正を判定することはさらに、上記複数の翻訳修正の正確性に関してユーザからフィードバックを受け取ることと、上記フィードバックに基づいて、上記複数の翻訳修正から最も正確な翻訳修正を識別することとを含み得る。
【0031】
いくつかの実現例において、上記方法は、最も正確な翻訳修正を提出したユーザに、報酬(たとえば、オンラインゲームで使用される仮想グッズおよび/または仮想通貨)を提供することをさらに含む。上記方法は、最も正確な翻訳を識別するよう使用されたフィードバックを提供したユーザに報酬(たとえば、オンラインゲームで使用される仮想グッズおよび/または仮想通貨)を提供することをさらに含み得る。単語ベースの特徴はたとえば、単語カウント、文字カウント、絵文字、数字および/または句読点を含み得る。上記言語ベースの特徴を使用することは、上記オリジナルテキストメッセージおよび上記第2のユーザからの上記翻訳修正における品詞を識別することを含み得る。
【0032】
いくつかの実施形態において、上記方法はさらに、上記オリジナルテキストメッセージおよび上記第2のユーザからの上記翻訳修正の各々に存在する動詞の数を識別することと、上記オリジナルテキストメッセージにおける上記動詞の数を上記第2のユーザからの上記翻訳修正における上記動詞の数と比較することを含む。上記オリジナルテキストメッセージおよび/または上記第2のユーザからの上記翻訳修正における品詞の欠如は言語検出
失敗を示し得る。上記方法は、上記第2のユーザからの上記翻訳修正が上記最初の翻訳と同じである場合、上記第2のユーザからの上記翻訳修正を拒絶することをさらに含み得る。
【0033】
別の局面において、本発明は、命令を格納したコンピュータ読取可能媒体と、データ処理装置とを含むシステムに関する。上記データ処理装置は、複数のユーザにテキストメッセージチャットシステムを提供することと、第1のユーザから第1の言語のオリジナルテキストメッセージを受け取ることと、上記オリジナルテキストメッセージの第2の言語の最初の翻訳を生成することと、第2のユーザに上記オリジナルテキストメッセージおよび上記最初の翻訳を提供することと、上記最初の翻訳におけるエラーに対応するよう上記第2のユーザから翻訳修正を受け取ることと、(a)上記第2のユーザからの上記翻訳修正を含む複数の翻訳修正から最も正確な翻訳修正を識別すること、ならびに、(b)単語ベースの特徴、言語ベースの特徴、および/または、単語アラインメントの特徴を使用して上記第2のユーザからの上記翻訳修正の正確性を評価することのうちの少なくとも1つを行うこととを含む動作を行うよう命令を実行するように構成される。
【0034】
ある実施形態において、上記動作は、上記翻訳修正を提出するように上記第2のユーザを奨励するようインセンティブ(たとえば、オンラインゲームで使用される仮想グッズおよび/または仮想通貨)を提供することを含む。上記最も正確な翻訳修正を判定することは、上記最初の翻訳におけるエラーに対応するために、少なくとも1人の付加的なユーザから少なくとも1つの付加的な翻訳修正を受け取ることを含み得、上記少なくとも1つの付加的な翻訳修正と上記第2のユーザからの上記翻訳修正とは上記複数の翻訳修正を定義しており、上記最も正確な翻訳修正を判定することはさらに、上記複数の翻訳修正の正確性に関してユーザからフィードバックを受け取ることと、上記フィードバックに基づいて、上記複数の翻訳修正から最も正確な翻訳修正を識別することとを含み得る。
【0035】
いくつかの実現例において、上記動作は、最も正確な翻訳修正を提出したユーザに、報酬(たとえば、オンラインゲームで使用される仮想グッズおよび/または仮想通貨)を提供することをさらに含む。上記動作は、最も正確な翻訳を識別するよう使用されたフィードバックを提供したユーザに報酬(たとえば、オンラインゲームで使用される仮想グッズおよび/または仮想通貨)を提供することをさらに含み得る。単語ベースの特徴はたとえば、単語カウント、文字カウント、絵文字、数字および/または句読点を含み得る。上記言語ベースの特徴を使用することは、上記オリジナルテキストメッセージおよび上記第2のユーザからの上記翻訳修正における品詞を識別することを含み得る。
【0036】
いくつかの実施形態において、上記動作はさらに、上記オリジナルテキストメッセージおよび上記第2のユーザからの上記翻訳修正の各々に存在する動詞の数を識別することと、上記オリジナルテキストメッセージにおける上記動詞の数を上記第2のユーザからの上記翻訳修正における上記動詞の数と比較することとを含む。上記オリジナルテキストメッセージおよび/または上記第2のユーザからの上記翻訳修正における品詞の欠如は言語検出失敗を示し得る。上記動作は、上記第2のユーザからの上記翻訳修正が上記最初の翻訳と同じである場合、上記第2のユーザからの上記翻訳修正を拒絶することをさらに含み得る。
【0037】
別の局面では、本発明は、データ処理装置の処理モードを制御するための、1つ以上の記憶媒体に格納されるコンピュータプログラムプロダクトに関する。上記コンピュータプログラムプロダクトは、上記データ処理装置が、複数のユーザにテキストメッセージチャットシステムを提供することと、第1のユーザから第1の言語のオリジナルテキストメッセージを受け取ることと、上記オリジナルテキストメッセージの第2の言語の最初の翻訳を生成することと、第2のユーザに上記オリジナルテキストメッセージおよび上記最初の
翻訳を提供することと、上記最初の翻訳におけるエラーに対応するよう上記第2のユーザから翻訳修正を受け取ることと、(a)上記第2のユーザからの上記翻訳修正を含む複数の翻訳修正から最も正確な翻訳修正を識別すること、ならびに、(b)単語ベースの特徴、言語ベースの特徴、および/または単語アラインメントの特徴のうち少なくとも1つを使用して上記第2のユーザからの上記翻訳修正の正確性を評価することのうち少なくとも1つとを含む動作を行うよう上記データ処理装置によって実行可能である。
【0038】
ある実施形態において、上記動作は、上記翻訳修正を提出するように上記第2のユーザを奨励するようインセンティブ(たとえば、オンラインゲームで使用される仮想グッズおよび/または仮想通貨)を提供することを含む。上記最も正確な翻訳修正を判定することは、上記最初の翻訳におけるエラーに対応するために、少なくとも1人の付加的なユーザから少なくとも1つの付加的な翻訳修正を受け取ることを含み得、上記少なくとも1つの付加的な翻訳修正と上記第2のユーザからの上記翻訳修正とは上記複数の翻訳修正を定義しており、上記最も正確な翻訳修正を判定することはさらに、上記複数の翻訳修正の正確性に関してユーザからフィードバックを受け取ることと、上記フィードバックに基づいて、上記複数の翻訳修正から最も正確な翻訳修正を識別することとを含み得る。
【0039】
いくつかの実現例において、上記動作は、最も正確な翻訳修正を提出したユーザに、報酬(たとえば、オンラインゲームで使用される仮想グッズおよび/または仮想通貨)を提供することをさらに含む。上記動作は、最も正確な翻訳を識別するよう使用されたフィードバックを提供したユーザに報酬(たとえば、オンラインゲームで使用される仮想グッズおよび/または仮想通貨)を提供することをさらに含み得る。単語ベースの特徴はたとえば、単語カウント、文字カウント、絵文字、数字および/または句読点を含み得る。上記言語ベースの特徴を使用することは、上記オリジナルテキストメッセージおよび上記第2のユーザからの上記翻訳修正における品詞を識別することを含み得る。
【0040】
いくつかの実施形態において、上記動作は上記オリジナルテキストメッセージおよび上記第2のユーザからの上記翻訳修正の各々に存在する動詞の数を識別することと、上記オリジナルテキストメッセージにおける上記動詞の数を上記第2のユーザからの上記翻訳修正における上記動詞の数と比較することとをさらに含む。上記オリジナルテキストメッセージおよび/または上記第2のユーザからの上記翻訳修正における品詞の欠如は言語検出失敗を示し得る。上記動作は、上記第2のユーザからの上記翻訳修正が上記最初の翻訳と同じである場合、上記第2のユーザからの上記翻訳修正を拒絶することを含み得る。
【0041】
1つの局面では、本発明はデータ処理装置によって実現される方法に関する。上記方法は、第1の言語と第2の言語とを識別することと、上記第1の言語で通信する第1のチャットクライアントシステムにおける第1の人間から、上記第1の言語のチャット用語可聴メッセージを受け取ることと、上記チャット用語可聴メッセージを上記第1の言語のチャット用語テキストメッセージに転換することと、上記チャット用語テキストメッセージを上記第1の言語の平易な言い方のテキストメッセージに変換することと、上記平易な言い方のテキストメッセージを上記第2の言語の対応する平易な言い方のテキストメッセージに翻訳することと、上記対応する平易な言い方のテキストメッセージを上記第2の言語の対応するチャット用語テキストメッセージに変換することと、上記対応するチャット用語テキストメッセージを上記第2の言語の対応するチャット用語可聴メッセージに転換することと、上記第2の言語で通信する第2のチャットクライアントシステムにおける第2の人間に上記対応するチャット用語可聴メッセージを送ることとを含む。
【0042】
ある実施形態において、上記チャット用語可聴メッセージを上記第1の言語のチャット用語テキストメッセージに転換することは、音声認識システムに上記チャット用語可聴メッセージを提供することを含む。上記チャット用語テキストメッセージの変換は、上記チ
ャット用語テキストメッセージにおけるチャット用語の単語または句を識別することと、上記チャット用語の単語または句を、チャット用語でない単語または句で置換することとを含み得る。いくつかの例では、上記対応するチャット用語テキストメッセージを上記第2の言語の対応するチャット用語可聴メッセージに転換することは、上記対応するチャット用語テキストメッセージをテキスト・トゥ・スピーチシステムに提供することを含む。
【0043】
ある実現例では、上記音声認識システムおよび/または上記テキスト・トゥ・スピーチシステムは、上記第1および第2の言語の各々について複数のアクセントおよび方言を含むデータを用いる。上記データは、上記第1および第2の言語の各々についてチャット用語および平易な言い方のフォーマットを含み得る。様々な実施形態において、上記方法は、上記対応する平易な言い方のテキストメッセージ、上記対応するチャット用語テキストメッセージ、および/または上記対応するチャット用語可聴メッセージの少なくとも1つの正確性に関してユーザからフィードバックを受け取ることを含む。上記方法は、フィードバックを提供することについて、上記ユーザにインセンティブ(たとえば、オンラインゲームで使用される仮想グッズおよび/または仮想通貨)をオファーすることをさらに含み得る。いくつかの場合において、上記方法は、音声認識システムおよび/またはテキスト・トゥ・スピーチシステムの正確性を向上させるようフィードバックを処理することを含む。
【0044】
別の局面において、本発明は、命令を格納するコンピュータ読取可能媒体とデータ処理装置とを含むシステムに関する。上記データ処理装置は、第1の言語と第2の言語とを識別することと、上記第1の言語で通信する第1のチャットクライアントシステムにおける第1の人間から、上記第1の言語のチャット用語可聴メッセージを受け取ることと、上記チャット用語可聴メッセージを上記第1の言語のチャット用語テキストメッセージに転換することと、上記チャット用語テキストメッセージを上記第1の言語の平易な言い方のテキストメッセージに変換することと、上記平易な言い方のテキストメッセージを上記第2の言語の対応する平易な言い方のテキストメッセージに翻訳することと、上記対応する平易な言い方のテキストメッセージを上記第2の言語の対応するチャット用語テキストメッセージに変換することと、上記対応するチャット用語テキストメッセージを上記第2の言語の対応するチャット用語可聴メッセージに転換することと、上記第2の言語で通信する第2のチャットクライアントシステムにおける第2の人間に上記対応するチャット用語可聴メッセージを送ることとを含む動作を行うよう命令を実行するように構成される。
【0045】
ある実施形態において、上記チャット用語可聴メッセージを上記第1の言語のチャット用語テキストメッセージに転換することは、音声認識システムに上記チャット用語可聴メッセージを提供することを含む。上記チャット用語テキストメッセージを変換することは、上記チャット用語テキストメッセージにおけるチャット用語の単語または句を識別することと、上記チャット用語の単語または句を、チャット用語でない単語または句で置換することとを含み得る。いくつかの例では、上記対応するチャット用語テキストメッセージを上記第2の言語の対応するチャット用語可聴メッセージに転換することは、上記対応するチャット用語テキストメッセージをテキスト・トゥ・スピーチシステムに提供することを含む。
【0046】
ある実現例では、上記音声認識システムおよび/または上記テキスト・トゥ・スピーチシステムは、上記第1および第2の言語の各々について複数のアクセントおよび方言を含むデータを用いる。上記データは、上記第1および第2の言語の各々についてチャット用語および平易な言い方のフォーマットを含み得る。様々な実施形態において、上記応答は、上記対応する平易な言い方のテキストメッセージ、上記対応するチャット用語テキストメッセージ、および/または上記対応するチャット用語可聴メッセージの正確性に関してユーザからフィードバックを受け取ることを含む。上記動作は、フィードバックを提供す
ることについて、上記ユーザにインセンティブ(たとえば、オンラインゲームで使用される仮想グッズおよび/または仮想通貨)を提供することをさらに含み得る。いくつかの場合において、上記動作は、音声認識システムおよび/またはテキスト・トゥ・スピーチシステムの正確性を向上させるようフィードバックを処理することを含む。
【0047】
別の局面において、本発明は、データ処理装置の処理モードを制御するための、1つ以上の記憶媒体に格納されたコンピュータプログラムプロダクトに関する。上記コンピュータプログラムプロダクトは、上記データ処理装置が、第1の言語と第2の言語とを識別することと、上記第1の言語で通信する第1のチャットクライアントシステムにおける第1の人間から、上記第1の言語のチャット用語可聴メッセージを受け取ることと、上記チャット用語可聴メッセージを上記第1の言語のチャット用語テキストメッセージに転換することと、上記チャット用語テキストメッセージを上記第1の言語の平易な言い方のテキストメッセージに変換することと、上記平易な言い方のテキストメッセージを上記第2の言語の対応する平易な言い方のテキストメッセージに翻訳することと、上記対応する平易な言い方のテキストメッセージを上記第2の言語の対応するチャット用語テキストメッセージに変換することと、上記対応するチャット用語テキストメッセージを上記第2の言語の対応するチャット用語可聴メッセージに転換することと、上記第2の言語で通信する第2のチャットクライアントシステムにおける第2の人間に上記対応するチャット用語可聴メッセージを送ることとを含む動作を行うよう上記データ処理装置によって実行可能である。
【0048】
ある実施形態において、上記チャット用語可聴メッセージを上記第1の言語のチャット用語テキストメッセージに転換することは、音声認識システムに上記チャット用語可聴メッセージを提供することを含む。上記チャット用語テキストメッセージを変換することは、上記チャット用語テキストメッセージにおけるチャット用語の単語または句を識別することと、上記チャット用語の単語または句を、チャット用語でない単語または句で置換することとを含み得る。いくつかの例では、上記対応するチャット用語テキストメッセージを上記第2の言語の対応するチャット用語可聴メッセージに転換することは、上記対応するチャット用語テキストメッセージをテキスト・トゥ・スピーチシステムに提供することを含む。
【0049】
ある実現例において、上記音声認識システムおよび/または上記テキスト・トゥ・スピーチシステムは、上記第1および第2の言語の各々について複数のアクセントおよび方言を含むデータを用いる。上記データは、上記第1および第2の言語の各々についてチャット用語および平易な言い方のフォーマットを含み得る。様々な実施形態において、上記動作は、上記対応する平易な言い方のテキストメッセージ、上記対応するチャット用語テキストメッセージ、および/または、上記対応するチャット用語可聴メッセージの正確性に関してユーザからフィードバックを受け取ることを含む。上記動作は、フィードバックを提供することについて、上記ユーザにインセンティブ(たとえば、オンラインゲームで使用される仮想グッズおよび/または仮想通貨)を提供することをさらに含み得る。いくつかの場合において、上記動作は、音声認識システムおよび/またはテキスト・トゥ・スピーチシステムの正確性を向上させるようフィードバックを処理することを含む。
【0050】
1つの局面では、本発明はデータ処理装置によって実現される方法に関する。上記方法は、(たとえば、異なる言語への正しい翻訳が既知である1つ以上の古いテキストメッセージを含む)古いトレーニングデータと、(たとえば、上記異なる言語への正しい翻訳が既知でない1つ以上の新しいテキストメッセージを含む)新しいトレーニングデータの混合を選択することと、(i)ユーザが上記古いトレーニングデータおよび上記新しいトレーニングデータの少なくとも1つを翻訳することへのそれぞれの要求、ならびに/または、(ii)上記翻訳へのそれぞれのインセンティブを含む複数のそれぞれの要求をユーザ
のクライアント装置(または複数のユーザの複数のクライアント装置)に異なる時に送ることと、特定の要求を送った後、上記特定の要求の上記古いトレーニングデータについて上記クライアント装置から翻訳を受け取ることと、受け取られた上記翻訳を上記古いトレーニングデータについての上記正しい翻訳と比較することと、上記比較に基づいて、受け取られた上記翻訳の正確性を判定することと、上記翻訳に基づいて上記ユーザについて確実性スコアを更新することとを含む。上記確実性スコアは、その後、上記ユーザが、上記異なる言語へのテキストメッセージの正確な翻訳を提供するであろう可能性を表わす。
【0051】
ある実施形態において、ユーザはオンラインゲームの参加者である。上記それぞれのインセンティブはたとえば、オンラインゲームのための仮想グッズおよび/または仮想通貨を含み得る。上記ユーザから受け取られる上記翻訳の正確性を判定することは、(i)単語エラー率(WER)を計算すること、および/または、(ii)バイリンガルエバリュエーションアンダースタディ(BLEU: bilingual evaluation understudy)を使用することを含み得る。いくつかの場合において、上記ユーザについて上記確実性スコアを更新することは、ユーザの翻訳の正確性における標準からの逸脱を識別するよう項目反応理論を使用することを含む。上記方法は、上記確実性スコアがしきい値を下回ると、上記ユーザの翻訳権限を取り消すことをさらに含み得る。
【0052】
様々な実現例において、上記方法は、上記ユーザの翻訳が正しいと判定される場合、上記それぞれのインセンティブを上記ユーザに与えることを含む。上記方法は、上記ユーザと第2のユーザとの間の以前から存在する関係を識別することにより上記ユーザと上記第2のユーザとの間の共謀を検出することをさらに含み得る。一例において、上記以前から存在する関係を識別することは、上記ユーザおよび上記第2のユーザの少なくとも一方のソーシャルネットワークを分析することを含む。
【0053】
別の局面において、本発明は、命令を格納したコンピュータ読取可能媒体と、データ処理装置とを含むシステムに関する。上記データ処理装置は、(たとえば、異なる言語への正しい翻訳が既知である1つ以上の古いテキストメッセージを含む)古いトレーニングデータと、(たとえば、上記異なる言語への正しい翻訳が既知でない1つ以上の新しいテキストメッセージを含む)新しいトレーニングデータの混合を選択することと、(i)ユーザが上記古いトレーニングデータおよび上記新しいトレーニングデータの少なくとも1つを翻訳することへのそれぞれの要求、ならびに/または、(ii)上記翻訳へのそれぞれのインセンティブを含む複数のそれぞれの要求をユーザのクライアント装置(または複数のユーザの複数のクライアント装置)に異なる時に送ることと、特定の要求を送った後、上記特定の要求の上記古いトレーニングデータについて上記クライアント装置から翻訳を受け取ることと、受け取られた上記翻訳を上記古いトレーニングデータについての上記正しい翻訳と比較することと、上記比較に基づいて、受け取られた上記翻訳の正確性を判定することと、上記翻訳に基づいて上記ユーザについて確実性スコアを更新することとを含む動作を行うよう命令を実行するように構成される。上記確実性スコアは、その後、上記ユーザが、上記異なる言語へのテキストメッセージの正確な翻訳を提供するであろう可能性を表わす。
【0054】
ある実施形態において、上記ユーザはオンラインゲームの参加者である。上記それぞれのインセンティブはたとえば、オンラインゲームのための仮想グッズおよび/または仮想通貨を含み得る。上記ユーザから受け取られる上記翻訳の正確性を判定することは、(i)単語エラー率(WER)を計算すること、および/または、(ii)バイリンガルエバリュエーションアンダースタディ(BLEU:bilingual evaluation understudy)を使
用することを含み得る。いくつかの場合において、上記ユーザについて上記確実性スコアを更新することは、ユーザの翻訳の正確性における標準からの逸脱を識別するよう項目反応理論を使用することを含む。上記動作は、上記確実性スコアがしきい値を下回ると、上
記ユーザの翻訳権限を取り消すことをさらに含み得る。
【0055】
様々な実現例では、上記動作は、上記ユーザの翻訳が正しいと判定される場合、上記それぞれのインセンティブを上記ユーザに与えることを含む。上記動作は、上記ユーザと第2のユーザとの間の以前から存在する関係を識別することにより上記ユーザと上記第2のユーザとの間の共謀を検出することをさらに含み得る。一例において、上記以前から存在する関係を識別することは、上記ユーザおよび上記第2のユーザの少なくとも一方のソーシャルネットワークを分析することを含む。
【0056】
別の局面において、本発明は、データ処理装置の処理モードを制御するための、1つ以上の記憶媒体に格納されたコンピュータプログラムプロダクトに関する。上記コンピュータプログラムプロダクトは、上記データ処理装置が、(たとえば、異なる言語への正しい翻訳が既知である1つ以上の古いテキストメッセージを含む)古いトレーニングデータと、(たとえば、上記異なる言語への正しい翻訳が既知でない1つ以上の新しいテキストメッセージを含む)新しいトレーニングデータの混合を選択することと、(i)ユーザが上記古いトレーニングデータおよび上記新しいトレーニングデータの少なくとも1つを翻訳することへのそれぞれの要求、ならびに/または、(ii)上記翻訳へのそれぞれのインセンティブを含む複数のそれぞれの要求をユーザのクライアント装置(または複数のユーザの複数のクライアント装置)に異なる時に送ることと、特定の要求を送った後、上記特定の要求の上記古いトレーニングデータについて上記クライアント装置から翻訳を受け取ることと、受け取られた上記翻訳を上記古いトレーニングデータについての上記正しい翻訳と比較することと、上記比較に基づいて、受け取られた上記翻訳の正確性を判定することと、上記翻訳に基づいて上記ユーザについて確実性スコアを更新することとを含む動作を行うよう上記データ処理装置によって実行可能である。上記確実性スコアは、その後、上記ユーザが、上記異なる言語へのテキストメッセージの正確な翻訳を提供するであろう可能性を表わす。
【0057】
ある実施形態において、ユーザはオンラインゲームの参加者である。上記それぞれのインセンティブはたとえば、オンラインゲームのための仮想グッズおよび/または仮想通貨を含み得る。上記ユーザから受け取られる上記翻訳の正確性を判定することは、(i)単語エラー率(WER)を計算すること、および/または、(ii)バイリンガルエバリュエーションアンダースタディ(BLEU: bilingual evaluation understudy)を使用することを含み得る。いくつかの場合において、上記ユーザについて上記確実性スコアを更新することは、ユーザの翻訳の正確性における標準からの逸脱を識別するよう項目反応理論を使用することを含む。上記動作は、上記確実性スコアがしきい値を下回ると、上記ユーザの翻訳権限を取り消すことをさらに含み得る。
【0058】
様々な実現例では、上記動作は、上記ユーザの翻訳が正しいと判定される場合、それぞれのインセンティブを上記ユーザに与えることを含む。上記動作は、上記ユーザと第2のユーザとの間の以前から存在する関係を識別することにより上記ユーザと上記第2のユーザとの間の共謀を検出することをさらに含み得る。一例において、上記以前から存在する関係を識別することは、上記ユーザおよび上記第2のユーザの少なくとも一方のソーシャルネットワークを分析することを含む。
【0059】
1つの局面において、本発明は、データ処理装置によって実現される方法に関する。上記方法は、少なくとも1つの単語を含む、第1の言語のテキストメッセージを得ることと、機械翻訳システムに上記テキストメッセージを提供することと、上記機械翻訳システムから上記テキストメッセージの翻訳を得ることと、上記テキストメッセージおよび上記翻訳は両方とも上記第1の言語の上記少なくとも1つの単語を含むということと、上記少なくとも1つの単語は正確にスペリングされているということとを判定することと、(a)
上記少なくとも1つの単語が以前のテキストメッセージに現われる頻度を判定すること、(b)上記少なくとも1つの単語の前および後に現われる隣接する単語についてベイジアン確率を判定すること、ならびに、(c)同意語を含む単語のクラスタを識別するようk平均法クラスタリングを実行することのうちの1つ以上を行うこととを含む。上記頻度が第1のしきい値を上回る場合、上記ベイジアン確率が第2のしきい値を上回る場合、および/または、上記クラスタが上記少なくとも1つの単語を含む場合、上記方法は、データストアにおける語彙集に上記少なくとも1つの単語を追加することを含む。
【0060】
ある実施形態において、上記少なくとも1つの単語は、ボキャブラリにない単語を含むか、または、ボキャブラリにない単語である。上記少なくとも1つの単語は新しいチャット用語単語であり得るか、または、当該新しいチャット用語単語を含み得る。上記方法は、上記データストアにおける上記語彙集が上記少なくとも1つの単語を含むかどうか判定することを含み得る。上記テキストメッセージは、オンラインゲームにおけるプレーヤーのクライアント装置から受け取られ得る。様々な例において、上記語彙集は第1の言語のボキャブラリにおける単語を含むか、または、当該単語からなる。
【0061】
ベイジアン確率を判定することは、(i)以前のテキストメッセージにおける上記少なくとも1つの単語の以前の使用を検討することと、(ii)上記以前のテキストメッセージにおいて上記少なくとも1つの単語の前および後に現われる単語があれば、当該単語を識別することとを含み得る。上記ベイジアン確率は、上記テキストメッセージにおける上記少なくとも1つの単語の前および後に上記隣接する単語が現われる可能性を示すものを提供し得る。
【0062】
様々な実現例では、上記クラスタを識別することは、以前のテキストメッセージを検討することと、同様のコンテキストにおいて、上記テキストメッセージにおける上記少なくとも1つの単語として使用される単語を識別することとを含む。上記方法は、上記テキストメッセージに存在する品詞を判定するよう、上記テキストメッセージの構文および意味を分析することをさらに含み得る。
【0063】
別の局面において、本発明は、命令を格納したコンピュータ読取可能媒体と、データ処理装置とを含むシステムに関する。上記データ処理装置は、少なくとも1つの単語を含む、第1の言語のテキストメッセージを得ることと、機械翻訳システムに上記テキストメッセージを提供することと、上記機械翻訳システムから上記テキストメッセージの翻訳を得ることと、上記テキストメッセージおよび上記翻訳は両方とも上記第1の言語の上記少なくとも1つの単語を含むということと、上記少なくとも1つの単語は正確にスペリングされているということとを判定することと、(a)上記少なくとも1つの単語が以前のテキストメッセージに現われる頻度を判定すること、(b)上記少なくとも1つの単語の前および後に現われる隣接する単語についてベイジアン確率を判定すること、ならびに、(c)同意語を含む単語のクラスタを識別するようk平均法クラスタリングを実行することのうちの1つ以上を行うこととを含む動作を行うよう命令を実行するように構成される。上記頻度が第1のしきい値を上回る場合、上記ベイジアン確率が第2のしきい値を上回る場合、および/または、上記クラスタが上記少なくとも1つの単語を含む場合、上記方法は、データストアにおける語彙集に上記少なくとも1つの単語を追加することを含む。
【0064】
ある実施形態において、上記少なくとも1つの単語は、ボキャブラリにない単語を含むか、または、ボキャブラリにない単語である。上記少なくとも1つの単語は新しいチャット用語単語であり得るか、または、当該新しいチャット用語単語を含み得る。上記動作は、上記データストアにおける上記語彙集が上記少なくとも1つの単語を含むかどうか判定することを含み得る。上記テキストメッセージは、オンラインゲームにおけるプレーヤーのクライアント装置から受け取られ得る。様々な例において、上記語彙集は第1の言語の
ボキャブラリにおける単語を含むか、または、当該単語からなる。
【0065】
ベイジアン確率を判定することは、(i)以前のテキストメッセージにおける上記少なくとも1つの単語の以前の使用を検討することと、(ii)上記以前のテキストメッセージにおいて上記少なくとも1つの単語の前および後に現われる単語があれば、当該単語を識別することとを含み得る。上記ベイジアン確率は、上記テキストメッセージにおける上記少なくとも1つの単語の前および後に上記隣接する単語が現われる可能性を示すものを提供し得る。
【0066】
様々な実現例では、上記クラスタを識別することは、以前のテキストメッセージを検討することと、同様のコンテキストにおいて、上記テキストメッセージにおける上記少なくとも1つの単語として使用される単語を識別することとを含む。上記動作は、上記テキストメッセージに存在する品詞を判定するよう、上記テキストメッセージの構文および意味を分析することをさらに含み得る。
【0067】
別の局面において、本発明は、データ処理装置の処理モードを制御するための、1つ以上の記憶媒体に格納されたコンピュータプログラムプロダクトに関する。上記コンピュータプログラムプロダクトは、上記データ処理装置が、少なくとも1つの単語を含む、第1の言語のテキストメッセージを得ることと、機械翻訳システムに上記テキストメッセージを提供することと、上記機械翻訳システムから上記テキストメッセージの翻訳を得ることと、上記テキストメッセージおよび上記翻訳は両方とも上記第1の言語の上記少なくとも1つの単語を含むということと、上記少なくとも1つの単語は正確にスペリングされているということとを判定することと、(a)上記少なくとも1つの単語が以前のテキストメッセージに現われる頻度を判定すること、(b)上記少なくとも1つの単語の前および後に現われる隣接する単語についてベイジアン確率を判定すること、ならびに、(c)同意語を含む単語のクラスタを識別するようk平均法クラスタリングを実行することのうちの1つ以上を行うこととを含む動作を実行するよう上記データ処理装置によって実行可能である。上記頻度が第1のしきい値を上回る場合、上記ベイジアン確率が第2のしきい値を上回る場合、および/または、上記クラスタが上記少なくとも1つの単語を含む場合、上記方法は、データストアにおける語彙集に上記少なくとも1つの単語を追加することを含む。
【0068】
ある実施形態において、上記少なくとも1つの単語は、ボキャブラリにない単語を含むか、または、ボキャブラリにない単語である。上記少なくとも1つの単語は新しいチャット用語単語であり得るか、または、当該新しいチャット用語単語を含み得る。上記動作は、上記データストアにおける上記語彙集が上記少なくとも1つの単語を含むかどうか判定することを含み得る。上記テキストメッセージは、オンラインゲームにおけるプレーヤーのクライアント装置から受け取られ得る。様々な例において、上記語彙集は第1の言語のボキャブラリにおける単語を含むか、または、当該単語からなる。
【0069】
ベイジアン確率を判定することは、(i)以前のテキストメッセージにおける上記少なくとも1つの単語の以前の使用を検討することと、(ii)上記以前のテキストメッセージにおいて上記少なくとも1つの単語の前および後に現われる単語があれば、当該単語を識別することとを含み得る。上記ベイジアン確率は、上記テキストメッセージにおける上記少なくとも1つの単語の前および後に上記隣接する単語が現われる可能性を示すものを提供し得る。
【0070】
様々な実現例では、上記クラスタを識別することは、以前のテキストメッセージを検討することと、同様のコンテキストにおいて、上記テキストメッセージにおける上記少なくとも1つの単語として使用される単語を識別することとを含む。上記動作は、上記テキス
トメッセージに存在する品詞を判定するよう、上記テキストメッセージの構文および意味を分析することをさらに含み得る。
【0071】
1つの局面において、本発明は、データ処理装置によって実現される方法に関する。上記方法は、(a)テキストメッセージの履歴の部分を検討するよう要求をマルチユーザチャットセッションから受け取ることを含み、上記履歴は複数のテキストメッセージを含み、各テキストメッセージはそれぞれの言語によるものであり、かつ、それぞれのチャットセッション参加者から発信されており、上記方法はさらに、(b)(i)上記テキストメッセージの履歴の上記部分から異なるそれぞれのテキストメッセージを選択することと、(ii)選択された上記テキストメッセージをターゲット言語に翻訳することとを各々が含む複数の並列プロセスを行うことと、(c)翻訳されたテキストメッセージを上記複数の並列プロセスからユーザのクライアント装置に提供することと、(d)上記テキストメッセージの履歴の異なる部分を検討するよう要求を受け取ることと、(e)上記テキストメッセージの履歴の上記異なる部分についてステップ(b)および(c)を繰り返すこととを含む。
【0072】
ある実施形態において、上記異なるそれぞれのテキストメッセージを選択することは、上記テキストメッセージの履歴の上記部分について記憶デバイスに照会することを含む。選択された上記テキストメッセージを翻訳することは、上記テキストメッセージの少なくとも部分をチャット用語から平易な言い方へ変換することを含み得る。いくつかの実現例において、上記方法は、上記テキストメッセージの履歴を閲覧することを停止するよう要求を上記ユーザから受け取ることを含む。上記複数の並列プロセスは、各それぞれのチャットセッション参加者について1つのプロセスを含み得る。代替的または付加的には、上記複数の並列プロセスは、上記それぞれのチャットセッションにおいて使用される各言語ついて1つのプロセスを含み得る。
【0073】
別の局面において、本発明は、命令を格納したコンピュータ読取可能媒体と、データ処理装置とを含むシステムに関する。上記データ処理装置は、(a)テキストメッセージの履歴の部分を検討するよう要求をマルチユーザチャットセッションから受け取ることを含む動作を行うよう命令を実行するように構成されており、上記履歴は複数のテキストメッセージを含み、各テキストメッセージはそれぞれの言語によるものであり、かつ、それぞれのチャットセッション参加者から発信されており、上記データ処理装置はさらに、(b)(i)上記テキストメッセージの履歴の上記部分から異なるそれぞれのテキストメッセージを選択することと、(ii)選択された上記テキストメッセージをターゲット言語に翻訳することとを各々が含む複数の並列プロセスを行うことと、(c)翻訳されたテキストメッセージを上記複数の並列プロセスからユーザのクライアント装置に提供することと、(d)上記テキストメッセージの履歴の異なる部分を検討するよう要求を受け取ることと、(e)上記テキストメッセージの履歴の上記異なる部分についてステップ(b)および(c)を繰り返すこととを含む動作を行うよう命令を実行するように構成される。
【0074】
ある実施形態において、上記異なるそれぞれのテキストメッセージを選択することは、上記テキストメッセージの履歴の上記部分について記憶デバイスに照会することを含む。選択された上記テキストメッセージを翻訳することは、上記テキストメッセージの少なくとも部分をチャット用語から平易な言い方へ変換することを含み得る。いくつかの実現例では、上記動作は、上記テキストメッセージの履歴を閲覧することを停止するよう要求を上記ユーザから受け取ることを含む。上記複数の並列プロセスは、各それぞれのチャットセッション参加者について1つのプロセスを含み得る。代替的または付加的には、上記複数の並列プロセスは、上記それぞれのチャットセッションにおいて使用される各言語ついて1つのプロセスを含み得る。
【0075】
別の局面において、本発明は、データ処理装置の処理モードを制御するための、1つ以上の記憶媒体に格納されたコンピュータプログラムプロダクトに関する。上記コンピュータプログラムプロダクトは、上記データ処理装置が、(a)テキストメッセージの履歴の部分を検討するよう要求をマルチユーザチャットセッションから受け取ることを含む動作を行うよう上記データ処理装置によって実行可能であり、上記履歴は複数のテキストメッセージを含み、各テキストメッセージはそれぞれの言語によるものであり、かつ、それぞれのチャットセッション参加者から発信されており、上記コンピュータプログラムプロダクトはさらに、上記データ処理装置が、(b)(i)上記テキストメッセージの履歴の上記部分から異なるそれぞれのテキストメッセージを選択することと、(ii)選択された上記テキストメッセージをターゲット言語に翻訳することとを各々が含む複数の並列プロセスを行うことと、(c)翻訳されたテキストメッセージを上記複数の並列プロセスからユーザのクライアント装置に提供することと、(d)上記テキストメッセージの履歴の異なる部分を検討するよう要求を受け取ることと、(e)上記テキストメッセージの履歴の上記異なる部分についてステップ(b)および(c)を繰り返すこととを含む動作を行うよう上記データ処理装置によって実行可能である。
【0076】
ある実施形態において、上記異なるそれぞれのテキストメッセージを選択することは、上記テキストメッセージの履歴の上記部分について記憶デバイスに照会することを含む。選択された上記テキストメッセージを翻訳することは、上記テキストメッセージの少なくとも部分をチャット用語から平易な言い方へ変換することを含み得る。いくつかの実現例では、上記動作は、上記テキストメッセージの履歴を閲覧することを停止するよう要求を上記ユーザから受け取ることを含む。上記複数の並列プロセスは、各それぞれのチャットセッション参加者について1つのプロセスを含み得る。代替的または付加的には、上記複数の並列プロセスは、上記それぞれのチャットセッションにおいて使用される各言語ついて1つのプロセスを含み得る。
【0077】
1つの局面において、本発明はデータ処理装置によって実現される方法に関する。上記方法は、(たとえばオンラインゲームの)複数のユーザにテキストメッセージチャットシステムを提供することと、上記テキストメッセージチャットシステムの第2のユーザをブロックするよう上記テキストメッセージチャットシステムの第1のユーザから要求を受け取ることと、上記要求の受け取りの後、上記第2のユーザからのテキストメッセージが上記第1のユーザに対して表示されるのを防止することとを含む。
【0078】
ある実施形態において、上記方法は、上記要求の受け取りの後、上記テキストメッセージチャットシステムを使用してチャットセッションに参加するよう上記第2のユーザから上記第1のユーザへの将来の招待をブロックすることをさらに含む。上記方法は、上記第2のユーザをブロック解除するよう上記第1のユーザから第2の要求を受け取ることを含み得る。いくつかの場合において、上記方法は、上記第2の要求の受け取りの後、上記第2のユーザからのテキストメッセージが上記第1のユーザに対して表示されることを許可することを含む。上記方法は、上記第2の要求の受け取りの後、上記テキストメッセージチャットシステムを使用してチャットセッションに参加するよう将来の招待が上記第2のユーザから上記第1のユーザに送られることを許可することを含み得る。
【0079】
いくつかの実施形態において、上記複数のユーザは、上記オンラインゲームにおいてアライアンスを含むかまたは定義する。上記方法は、上記テキストメッセージチャットシステムにおけるテキストメッセージの少なくとも部分を第1の言語から第2の言語に翻訳することを含み得る。上記方法は、上記テキストメッセージの少なくとも部分をチャット用語から平易な言い方に変換することをさらに含み得る。いくつかの実現例において、翻訳および/または変形することは、並列プロセスを含むかまたは利用し得る。たとえば、上記並列プロセスは、上記チャットシステムの上記複数のユーザの各々について1つのプロ
セス(または上記ユーザによって使用される各言語について1つのプロセス)を含むかまたは利用し得る。
【0080】
別の局面において、本発明は、命令を格納したコンピュータ読取可能媒体と、データ処理装置とを含むシステムに関する。上記データ処理装置は、(たとえばオンラインゲームの)複数のユーザにテキストメッセージチャットシステムを提供することと、上記テキストメッセージチャットシステムの第2のユーザをブロックするよう上記テキストメッセージチャットシステムの第1のユーザから要求を受け取ることと、上記要求の受け取りの後、上記第2のユーザからのテキストメッセージが上記第1のユーザに対して表示されるのを防止することとを含む動作を行うよう命令を実行するように構成される。
【0081】
ある実施形態において、上記動作は、上記要求の受け取りの後、上記テキストメッセージチャットシステムを使用してチャットセッションに参加するよう上記第2のユーザから上記第1のユーザへの将来の招待をブロックすることをさらに含む。上記動作は、上記第2のユーザをブロック解除するよう上記第1のユーザから第2の要求を受け取ることを含み得る。いくつかの場合において、上記動作は、上記第2の要求の受け取りの後、上記第2のユーザからのテキストメッセージが上記第1のユーザに対して表示されることを許可することを含む。上記動作は、上記第2の要求の受け取りの後、上記テキストメッセージチャットシステムを使用してチャットセッションに参加するよう将来の招待が上記第2のユーザから上記第1のユーザに送られることを許可することをさらに含み得る。
【0082】
いくつかの実施形態において、上記複数のユーザは、上記オンラインゲームにおいてアライアンスを含むかまたは定義する。上記動作は、上記テキストメッセージチャットシステムにおけるテキストメッセージの少なくとも部分を第1の言語から第2の言語に翻訳することを含み得る。上記動作は、上記テキストメッセージの少なくとも部分をチャット用語から平易な言い方に変換することをさらに含み得る。いくつかの実現例において、翻訳および/または変形することは、並列プロセスを含むかまたは利用し得る。たとえば、上記並列プロセスは、上記チャットシステムの上記複数のユーザの各々について1つのプロセス(または上記ユーザによって使用される各言語について1つのプロセス)を含むかまたは利用し得る。
【0083】
別の局面において、本発明は、データ処理装置の処理モードを制御するための、1つ以上の記憶媒体に格納されたコンピュータプログラムプロダクトに関する。上記コンピュータプログラムプロダクトは、上記データ処理装置が、(たとえばオンラインゲームの)複数のユーザにテキストメッセージチャットシステムを提供することと、上記テキストメッセージチャットシステムの第2のユーザをブロックするよう上記テキストメッセージチャットシステムの第1のユーザから要求を受け取ることと、上記要求の受け取りの後、上記第2のユーザからのテキストメッセージが上記第1のユーザに対して表示されるのを防止することとを含む動作を行うよう上記データ処理装置によって実行可能である。
【0084】
ある実施形態において、上記動作は、上記要求の受け取りの後、上記テキストメッセージチャットシステムを使用してチャットセッションに参加するよう上記第2のユーザから上記第1のユーザへの将来の招待をブロックすることを含む。上記動作は、上記第2のユーザをブロック解除するよう上記第1のユーザから第2の要求を受け取ることを含み得る。いくつかの場合において、上記第2の要求の受け取りの後、上記動作は、上記第2のユーザからのテキストメッセージが上記第1のユーザに対して表示されることを許可することを含む。上記第2の要求の受け取りの後、上記動作は、上記テキストメッセージチャットシステムを使用してチャットセッションに参加するよう将来の招待が上記第2のユーザから上記第1のユーザに送られることを許可することを含み得る。
【0085】
いくつかの実施形態において、上記複数のユーザは、上記オンラインゲームにおいてアライアンスを含むかまたは定義する。上記動作は、上記テキストメッセージチャットシステムにおけるテキストメッセージの少なくとも部分を第1の言語から第2の言語に翻訳することを含み得る。上記動作は、上記テキストメッセージの少なくとも部分をチャット用語から平易な言い方に変換することをさらに含み得る。いくつかの実現例において、翻訳および/または変形することは、並列プロセスを含むかまたは利用し得る。たとえば、上記並列プロセスは、上記チャットシステムの上記複数のユーザの各々について1つのプロセス(または上記ユーザによって使用される各言語について1つのプロセス)を含むかまたは利用し得る。
【0086】
本発明の所与の局面に関して記載される実施形態の要素は、本発明の別の局面の様々な実施形態において使用されてもよい。たとえば、ということが考えられる。1つの独立請求項に従属する従属請求項の特徴は、他の独立請求項のいずれかの装置および/または方法において使用され得る。
【0087】
様々な実施形態の他の特徴および局面は、添付図面に関連して読まれると、以下の詳細な説明から明らかとなるであろう。添付図面は、例として、そのような実施形態の特徴を例示する。
【0088】
様々な実施形態が以下の図を参照して詳細に説明される。図面は例示のみを目的として提供され、いくつかの実施形態を描写するにすぎない。これらの図面は、実施形態の幅、範囲または適用可能性を限定するものとは見なされるべきではない。
【発明を実施するための形態】
【0090】
詳細な説明
本明細書に記載される様々な実施形態は、多言語通信に関連し、多言語通信を円滑化する。いくつかの実施形態のシステムおよび方法は、たとえばインターネットベースのチャット(たとえばApple(登録商標)iMessage(登録商標)、Windows(登録商標)Live Messenger等)、電子メール(たとえば組込みフォーラムメッセージング、Yahoo(登録商標)メール、RFC5322等)、テキストベースの携帯電話通信(たとえばSMSメッセージまたはMMSメッセージ)、オンラインフォーラムへの投稿(たとえばウェブベースの趣味フォーラムへの投稿)、オンラインソーシャルメディアサービスへの投稿(たとえばTwitter(登録商標)、Facebook(登録商標)等)などを含む異なるモードの通信による多言語通信を可能にし得る。ある実施形態は、過去に行なわれた通信または会話のトランスクリプト(たとえば堆積トランスクリプトまたはチャット履歴)を翻訳するためにも使用され得る。様々な実施形態は、テキスト中の、特殊化された/ドメイン関連の専門用語(たとえばチャット用語)、略語、頭字語、固有名詞、普通名詞、縮小形、口語的な単語または句、および卑罵的な単語または句のうちの1つ以上に対処/対応しつつ、(たとえば話し言葉の)2つ以上の言語間でテキストを翻訳する通信システムおよび方法を実現し得る。たとえば、本明細書に記載されるいくつかのシステムおよび方法は、異なる外国語でチャットするユーザを有する傾向があるマッシブマルチプレーヤーオンライン(MMO)ゲームで用いられるものなどのチャットシステムに関連して利用され得る。ある実施形態によって、2人以上のユーザ間のチャットダイアログは介在が意識されないように翻訳され、それぞれの母国語または選択言語で各ユーザに提示されることができる。加えて、多層/多モジュール変換処理の使用によって、ある実施形態は、従
来の翻訳システムのみによって他の方法で可能であるよりも速い、2人以上のユーザ間の(たとえばそれぞれの母国語での)通信の翻訳を円滑化し得る(たとえば数マイクロ秒での翻訳)。
【0091】
いくつかの実施形態によれば、システムまたは方法は、英語などの第1の言語でのチャット用語から、フランス語などの第2の言語でのチャット用語への翻訳を行ない得る。別の例では、システムまたは方法は、第2の言語(たとえばフランス語)への翻訳を試みる前に、第1の言語(たとえば英語)でのチャット用語から第1の言語(たとえば英語)での正式な言い方への変換を行ない得る。いくつかの実施形態は、人間のオペレータによって手作業で入力された翻訳、または翻訳システムによってあらかじめ行なわれたものに基づく翻訳(たとえば一実施形態によって行なわれる履歴翻訳)を含み得るデータストア(たとえば翻訳キャッシュ)にまず照会することによって、そのようなテキスト翻訳を実現し得る。実施形態は、正確なテキスト翻訳により好適となるように、テキストの1つ以上の部分を変換する(たとえば、テキスト内の、チャット用語、頭字語、略語、固有名詞、普通名詞、口語、および卑罵語のうちの1つ以上を処理する)ことを試み得る。たとえば、ある実施形態は、所与のテキストを変換して、異なる言語にわたる(現在または過去の)慣用語使用を説明し得る。実施形態は、テキストの一部分の変換後にデータストアに照会することを再び試み得る。この翻訳ルックアップ再試行が失敗した場合、実施形態は、機械翻訳サービス(たとえばGoogle(登録商標)翻訳などの第三者のクラウドベースの翻訳サービス)を用いて、(変換済みであり得る)テキストを翻訳することを試み得る。
【0092】
実施形態は、翻訳された1つの正式なテキストを新たな言語でのチャット用語に変換(たとえばフランス語の正式な言い方をフランス語のチャット用語に変換)して、最終的に生成されるテキストの翻訳をさらに改良することを試み得る。したがって、ある実施形態は、第1の言語(たとえば英語)でのチャット用語と第2の言語(たとえばロシア語、フランス語、スペイン語、中国語、ヒンディー語等)でのチャット用語との間のチャット翻訳を円滑化する。
【0093】
いくつかの実施形態は、機械翻訳を用いる必要性を低下させるかまたは回避する(ことにより機械翻訳に伴う時間、費用、および他の諸経費を減少させる)のに役立ち得、最小のコンテキストを有するかまたは短文構造を含むテキストの正確な翻訳を円滑化し得る。第三者のサービスによって、またはセキュアネットワーク接続(たとえばセキュアソケットレイヤー[SSL]接続)によって機械翻訳が円滑化される場合、ある実施形態によって回避される費用または諸経費は大幅となり得る。
【0094】
本明細書において理解されるように、「変換」とは、第1の言語での第1のテキストセグメントを操作して、第1の言語での第2のテキストセグメントを形成することを意味する。結果として得られる第2のテキストセグメントは、本明細書においては「変換されたテキスト」とも称され得る。「翻訳」とは、第1の言語でのテキストセグメントを、第2の言語での対応するテキストセグメントに転換することを意味するものと理解されるであろう。
【0095】
また本明細書において理解されるように、「変換された翻訳」とは、本明細書に記載される実施形態に従ってすでに変換されている(たとえば第1の言語でのチャット用語のテキストから第1の言語での正式なテキストに変換されている)テキストセグメントの(第1の言語から第2の言語への)翻訳を意味する。「変換されていない翻訳」とは、本明細書に記載される実施形態に従ってテキストセグメントが変換される前のテキストセグメントの(第1の言語から第2の言語への)翻訳を意味するものと理解されるであろう。
【0096】
様々な実施形態は、異なる変換/翻訳手順を実現してもよく、ある手順は、特定の翻訳アプリケーションによく適している。たとえば、特定のチャットシステムアプリケーションについて、実現される変換手順は、次の変換関連モジュールの組:チャット用語モジュール、頭字語モジュール、固有名詞モジュール、普通名詞モジュール、口語モジュール、スペルチェックモジュール、略語モジュール、および卑罵語モジュールを、挙げられた順に適用することを含み得る。概して、採用される変換/翻訳手順は、どの変換動作が行なわれるか、翻訳処理全体においていつ変換動作が行なわれる(たとえば変換が機械翻訳の前または後に行なわれる)か、またはどんな順序で変換動作が行なわれるか(たとえば変換動作の優先度または優先順位)を決定する。変換/翻訳手順は、どんな翻訳がデータストアにあらかじめポピュレートされているか(たとえば翻訳を翻訳「キャッシュ」に格納して処理全体を高速化することができる)、および翻訳処理全体のいつ翻訳キャッシュが利用されるかも決定し得る。ある実施形態について、採用される変換/翻訳手順は、実施形態が用いられる環境の状態に基づいてダイナミックに決定され得る。たとえば、チャットシステムのユーザの負担が通常よりも重い場合、変換/翻訳手順は、チャットシステムの処理負担を減少させるものに切替わり得る(たとえばデータストアにではなく、より機械翻訳に依存する)。
【0097】
図1は、様々な実施形態に係る多言語システムを利用した典型的な環境100を例示するブロック図である。
図1に示されるように、典型的な環境100は、クライアント102−1から102−N(以下「クライアント102」と総称する)、チャットサーバ108、および翻訳サーバ110を含み、その各々は、コンピュータネットワーク106によって互いに通信可能に結合され得る。いくつかの実施形態に従って、コンピュータネットワーク106は、インターネット、WiFi(登録商標)ネットワーク、WiMax(登録商標)ネットワーク、私設網、公衆網などといった1つ以上のローカルまたは広域通信ネットワークを用いて実装または円滑化され得る。実施形態に応じて、コンピュータネットワーク106との通信接続の一部またはすべては、暗号化(たとえばセキュアソケットレイヤー[SSL])を利用して、典型的な環境100に示される様々なエンティティ間で転送されている情報を安全にし得る。
【0098】
クライアント102、チャットサーバ108および翻訳サーバ110の各々は、後で
図12を参照して述べるデジタル装置と同様であり得る1つ以上のデジタル装置を用いて実装され得る。たとえば、クライアント102−1は、(たとえばユーザの対話のために構成された)ユーザ入力を受信することが可能であり、一人以上の他のクライアント(たとえばクライアント102−2から102−Nのうちのいずれか)との通信を円滑化するクライアントユーザインターフェイスを提供することが可能であり、かつコンピュータネットワーク106を介してチャットサーバ108と通信することが可能ないずれかの形態の計算装置であり得る。そのような計算装置は、携帯電話、タブレット計算装置、ラップトップ、デスクトップコンピュータ、携帯情報端末、ポータブルゲームユニット、有線ゲームユニット、シンクライアント、セットトップボックス、ポータブルマルチメディアプレーヤー、または当業者に知られているいずれかの他の種類のネットワークアクセス可能なユーザ装置を含み得る。さらに、チャットサーバ108および翻訳サーバ110の1つ以上は、1つ以上のクラウドベースサービス(たとえばSystem-as-a-Service[SaaS]、Platform-as-a-Service[PaaS]またはInfrastructure-as-a-Service[IaaS])上で動作し得るか
、または1つ以上のクラウドベースサービスを用いて実装され得る1つ以上のサーバで構成され得る。
【0099】
クライアント102は、クライアント102間のチャットセッションを提供するかまたは他の方法で円滑化するチャットサーバ108に通信可能に接続するように構成され得る。クライアント102−1から102−Nの各々は、クライアント102の各々におけるユーザがチャットサーバ108を介してチャットセッションにアクセスすることを可能に
するチャットクライアントシステム(それぞれ104−1から104−N)を含み得る。加えて、実施形態に応じて、チャットクライアントシステム104−1から104−N(以下「チャットクライアントシステム104」と総称する)の各々は、スタンドアロンのチャットアプリケーションとして、チャットではないアプリケーション(たとえばビデオゲーム)に組込まれたチャット機能として、またはクライアントにおいてウェブブラウザを介してアクセス可能なチャットサービスにより、実装され得る。当業者は、いくつかの実施形態について、チャットクライアントシステム104は互いに関してヘテロジニアスではない場合があり、それでもなおそれらの間のチャットセッションを確立することが可能であることを認識するであろう。チャットクライアントシステム104は、ユーザによって(たとえばユーザの設定または嗜好に基づいて)選択された言語(および対応する文字セット)でのそれぞれのユーザからのチャット入力(たとえばチャットメッセージ)を受信し、別のユーザ(たとえば別のチャットクライアントシステムにおける別のユーザ)に中継されるようにチャット入力をチャットサーバ108に送信することが可能であり得る。チャットクライアントシステム104は、チャットサーバ108からの(たとえば別のチャットクライアントシステムにおける別のユーザからの)チャット出力(たとえばチャットセッションダイアログ)を受信し、受信したチャット出力をユーザによって(たとえばユーザの設定または嗜好に基づいて)選択された言語(および対応する文字セット)で表示することも可能であり得る。
【0100】
いくつかの実施形態の使用によって、ダイアログがチャットクライアントシステム104間で渡される際、チャットダイアログの翻訳はユーザにとってトランスペアレントであり得る。したがって、いくつかの実施形態について、所与のチャットクライアントシステム104において提示されたすべてのチャットダイアログは、同じチャットダイアログに寄稿している他のチャットクライアントシステム104においてユーザによってどの言語かに関係なく、その所与のチャットクライアントシステム104におけるユーザに固有の(またはユーザによって選択された)言語であり得る。たとえば、チャットクライアントシステム104−1におけるユーザとチャットクライアントシステム104−2におけるユーザとが同じチャットダイアログに寄稿している(つまり、同じチャットセッションに関与している)場合、チャットクライアントシステム104−1におけるユーザは、チャットダイアログを英語で入力し受信することを選択していてもよく、一方チャットクライアントシステム104−2におけるユーザは、チャットダイアログをロシア語で入力し受信することを選択していてもよい。クライアントシステム104−1および104−2におけるユーザは同じチャットコンテンツを見ることになるが、チャットダイアログは、彼らのそれぞれ選択した言語で提示されることになる。
【0101】
図示されるように、チャットサーバ108は、チャットクライアントシステム104間のチャットセッションを確立および/または円滑化するように構成されたチャットホストシステム112と、本明細書に記載される様々なシステムおよび方法に従って変換および/または翻訳動作を行なうように構成された通信変換および翻訳(CTT)システム114とを含み得る。いくつかの実施形態について、チャットクライアントシステム104は、チャットホストシステム112を介して互いにチャットセッションを確立し得る。チャットホストシステム104は、チャットクライアントシステム104間のチャットダイアログのトランスペアレントな翻訳を円滑化する際に、CTTシステム114の機能を利用し得る。当業者は、いくつかの実施形態について、チャットホストシステム112およびCTTシステム114は別個のサーバの一部であってもよく、チャットホストシステム112を動作させるエンティティはCTTシステム114を動作させるエンティティとは異なっていてもよいことを認識するであろう。たとえば、チャットホストシステム112は、CTTシステム114のサービスを利用する第三者のチャットホストシステムであってもよい。
【0102】
また図示されるように、翻訳サーバ110は、機械テキスト翻訳のリクエストを受信し、そのリクエストに応えるように構成された翻訳モジュール116を含み得る。いくつかの実施形態に従って、CTTシステム114は、テキストの機械翻訳を行なう際に翻訳モジュール116の動作/サービスを利用し得る。CTTシステム114は、1つ以上の翻訳アプリケーションプログラミングインターフェイス(API)を用いて、翻訳モジュール116によって提供されるサービスへのアクセス権を取得し得る。実施形態に応じて、翻訳モジュール116(およびそれが属するサーバ110)は、機械翻訳サービスを無料または有料で提供し得るGoogle(登録商標)などの第三者によって動作され得る。翻訳モジュール116はCTTシステム114とは別個のサーバ上で動作するコンポーネントとして示されているが、当業者は、いくつかの実施形態について、翻訳モジュール116はCTTシステム114と同じサーバ上で動作してもよく、かつ/またはCTTシステム114の統合コンポーネントであってもよいことを認識するであろう。
【0103】
図2は、様々な実施形態に係る典型的な通信変換および翻訳システム114を例示するブロック図である。図示されるように、CTTシステム114は、通信変換および翻訳(CTT)制御モジュール202、通信変換および翻訳(CTT)通信モジュール204、言語モジュール206、変換モジュール208、翻訳データストア210、ならびに翻訳アプリケーションプログラミングインターフェイス(API)モジュール212を含み得る。CTT制御モジュール202は、CTTシステム114が本明細書に記載されるいくつかのシステムおよび方法に従って変換または翻訳動作を行なう際に、CTTシステム114内の様々な動作の性能を制御および/または調整するように構成され得る。いくつかの実施形態について、CTT制御モジュール202は、CTT通信モジュール204、言語モジュール206、変換モジュール208、翻訳データストア210、および翻訳APIモジュール212などのCTTシステム114の他のコンポーネントの動作を制御し得る。
【0104】
CTT通信モジュール204は、CTTシステム114と、チャットサーバ108および/または翻訳サーバ110などの、CTTシステム114外のシステムおよびコンポーネントとの間の通信を円滑化するように構成され得る。したがって、CTT通信モジュール204を介して、CTTシステム114は、CTTシステム114によって変換または翻訳されるべき(1つ以上のチャットメッセージを含む)チャットダイアログを受信し得、CTTシステム114に起因する翻訳されたチャットダイアログを出力し得る。
【0105】
言語モジュール206は、CTTシステム114によって受信されたチャットダイアログに関連して用いられている1つ以上の言語を識別するように構成され得る。いくつかの実施形態について、言語モジュール206は、受信されたチャットダイアログのコンテンツの解析によって言語を識別し、かつ/または受信されたチャットダイアログに関与しているそれぞれのチャットクライアントシステム(たとえばチャットクライアントシステム104)から言語嗜好/設定情報を取得し得る。
【0106】
変換モジュール208は、本明細書に記載されるいくつかのシステムおよび方法に従って、CTTシステム114によって受信された(1つ以上のチャットメッセージを含む)チャットダイアログに対して変換動作を行なうように構成され得る。いくつかの実施形態に従って、変換モジュール208によって行なわれる変換動作は、限定はしないが、チャット用語、頭字語、略語、固有名詞、普通名詞、口語、および卑罵語に関連するものを含み得る。変換モジュール208の追加的な詳細を
図3で述べる。
【0107】
翻訳データストア210は、あらかじめ翻訳されたテキストを格納し、その後、本明細書に記載されるいくつかのシステムおよび方法に従ってCTTシステム114が変換された翻訳および変換されていない翻訳を行なう際に、あらかじめ翻訳されたテキストをCT
Tシステム114に提供するように構成され得る。本明細書に記載されるように、翻訳データストア210は、CTTシステム114によってあらかじめ行なわれる翻訳のためのキャッシュとして動作してもよく、かつ/または人間のオペレータによって(たとえば翻訳トレーニングシステムを介して)手作業で入力され格納された翻訳を格納してもよい。いくつかの実施形態について、あるチャットコンテキストに関してCTTシステム114の性能を高速化することになる翻訳を翻訳データストア210にポピュレートしてもよい。たとえば、CTTシステム114がMMOゲームに関連付けられたチャットシステムと共に利用される場合、具体的にMMOゲームに関連する(変換された、および変換されていない)翻訳を翻訳データストア210に(たとえばCTTシステム114のオペレータによって)ポピュレートしてもよい。ある実施形態について、変換モジュール208によって用いられるテキストを変換する多層/多モジュール手法は、本来複雑になりがちな、MMOゲームにおけるチャットテキストに対処するのに特によく適している。
【0108】
実施形態に応じて、データストア210は、変換されていない翻訳(たとえば<正式な英語>"you"→<正式なフランス語>"vous")、変換された翻訳(たとえば<英語のチャ
ット用語>"u"→<正式なフランス語>"vous")のいずれか、または両方を格納し得る。
いくつかの実施形態について、翻訳データストア210は、対応するチャットメッセージがハッシュ値/タグを用いて識別され得るように翻訳を格納し得る。たとえば、英語の当初のメッセージについてのスペイン語翻訳を格納するために、スペイン語翻訳を英語のメッセージのハッシュ値に基づいて格納してもよく、それによりスペイン語の翻訳を英語のメッセージのハッシュ値を用いて後で捜し出し、取得することが可能となる。当業者は、いくつかの実施形態について、翻訳データストア210は2つの特定言語間の翻訳のために別個のデータストアを含み得ることを認識するであろう。したがって、英語とフランス語との間でチャットメッセージが変換/翻訳されている時、翻訳データストア210に関連する動作のために、対応するデータ英語−フランス語データストアが利用され得る。
【0109】
翻訳APIモジュール212は、(たとえば翻訳サーバ110の翻訳モジュール116によって)CTTシステム114外に設けられた機械翻訳サービスへのアクセス権をCTTシステム114に提供するように構成され得る。本明細書に記載されるように、翻訳データストア210に翻訳がない時、CTTシステム114によって翻訳APIモジュール212が利用され得る。
【0110】
図3は、様々な実施形態に係る典型的な変換モジュール208を例示するブロック図である。図示されるように、変換モジュール208は、チャット用語モジュール302、頭字語モジュール304、固有名詞モジュール306、普通名詞モジュール308、口語モジュール310、スペルチェックモジュール312、略語モジュール314、および/または卑罵語モジュール316を含み得る。いくつかの実施形態によれば、動作中に、変換モジュール208は、チャットメッセージを全体的にまたは部分的に処理し得る(たとえばメッセージをトークンまたは論理部分に分け、次いでそれらのトークン/部分を処理する)。いくつかの実施形態では、変換モジュール208の様々なモジュールが並行して呼び出され得る。
【0111】
チャット用語モジュール302は、チャット専門用語(つまりチャット用語)と関連付けられたチャットメッセージ中の1つ以上の単語または句を識別するように構成されてもよく、さらに、識別された単語または句について、置換(たとえば対応する正式な/つまりチャット用語でない)単語または句を提案するように構成されてもよい。いくつかの実施形態では、チャット用語モジュール302は、(たとえば翻訳モジュール116による)後続の機械翻訳中にスキップされるかまたはそうでなければ無視されるように、識別されたチャット用語の単語または句にフラグを立て得る。加えて、いくつかの実施形態では、人間のオペレータ(たとえばCTTシステム114の管理者)による後のレビューおよ
び処置のために、識別されたチャット用語の単語または句にフラグが立てられ得る。チャット用語の単語もしくは句および/またはその対応する(正式な)単語もしくは句を識別するために、いくつかの実施形態は、チャット用語の単語もしくは句、ならびに/またはチャット用語の単語もしくは句とそれらの対応する単語および句とのマッピングを含む(たとえばデータストア上に格納された)データセットを利用し得る。データセットは、トレーニングもしくは学習システムとして構成されてもよいし、(たとえばCTTシステム114の管理者によって「組織内で」手作業で収集される)専有のものであってもよいし、市販されていてもよいし、または公に利用可能なインターネット知識ベースから得られてもよい。たとえば、チャット用語モジュール302は、その機能において統計的機械翻訳を採用し得る。いくつかの実施形態について、採用された統計的機械翻訳は、コンテキスト情報を保護しかつ/またはそうでなければ非文法的な文章に文法を追加する変換から抽出された対訳テキストを用いて、かつ/または句レベルの対を用いて、トレーニングされ得る。チャット用語モジュール302からの結果は、無視されるようにチャット用語モジュール302によってフラグが立てられたチャット用語の単語もしくは句、提案された置換、またはチャット用語モジュール302によって(たとえば識別されたチャット用語の単語もしくは句の代わりに)メッセージに挿入されたチャット用語でない単語もしくは句を含み得る。実施形態に応じて、チャット用語モジュール302に起因するメッセージは、さらなる処理のために(変換モジュール208内の)別の変換モジュールに提供されてもよいし、またはチャット用語モジュール302によって変換されたメッセージがデータストア210内にあるかどうか判断するために、提案された置換がCTT制御モジュール202に提供されてもよい。
【0112】
頭字語モジュール304は、チャットメッセージ中の1つ以上の頭字語を識別するように構成されてもよく、さらに、頭字語と対応する(たとえば頭字語によって表される)置換単語または句を提案するように構成されてもよい。いくつかの実施形態では、頭字語モジュール304は、(たとえば翻訳モジュール116による)後続の機械翻訳中にスキップされるかまたはそうでなければ無視されるように、識別された頭字語にフラグを立て得る。加えて、いくつかの実施形態では、人間のオペレータ(たとえばCTTシステム114の管理者)による後のレビューおよび処置のために、識別された頭字語にフラグが立てられ得る。頭字語および/またはその対応する単語もしくは句を識別するために、いくつかの実施形態は、頭字語、ならびに/または頭字語とそれらの対応する単語および句とのマッピングを含む(たとえばデータストア上に格納された)データセットを利用し得る。データセットは、トレーニングもしくは学習システムとして構成されてもよいし、(たとえばCTTシステム114の管理者によって「組織内で」手作業で収集される)専有のものであってもよいし、市販されていてもよいし、または公に利用可能なインターネット知識ベースから得られてもよい。頭字語モジュール304からの結果は、無視されるように頭字語モジュール304によってフラグが立てられた頭字語、提案された置換、または頭字語モジュール304によって(たとえば識別された頭字語の代わりに)メッセージに挿入された単語もしくは句を含み得る。実施形態に応じて、頭字語モジュール304に起因するメッセージは、さらなる処理のために(変換モジュール208内の)別の変換モジュールに提供されてもよいし、または頭字語モジュール304によって変換されたメッセージがデータストア210内にあるかどうか判断するために、提案された置換がCTT制御モジュール202に提供されてもよい。
【0113】
固有名詞モジュール306は、チャットメッセージ中の1つ以上の固有名詞を識別するように構成されてもよく、さらに、固有名詞と対応する(たとえば固有名詞によって表される)置換単語または句を提案するように構成されてもよい。いくつかの実施形態では、固有名詞モジュール306は、(たとえば翻訳モジュール116による)後続の機械翻訳中にスキップされるかまたはそうでなければ無視されるように、識別された固有名詞にフラグを立て得る。加えて、いくつかの実施形態では、人間のオペレータ(たとえばCTT
システム114の管理者)による後のレビューおよび処置のために、識別された固有名詞にフラグが立てられ得る。固有名詞および/またはその対応する単語もしくは句を識別するために、いくつかの実施形態は、固有名詞(たとえばDisneyland(登録商標)などの周知の固有名詞または個人の通称)、ならびに/または固有名詞とそれらの対応する単語および句とのマッピングを含む(たとえばデータストア上に格納された)データセットを利用し得る。データセットは、トレーニングもしくは学習システムとして構成されてもよいし、(たとえばCTTシステム114の管理者によって「組織内で」手作業で収集される)専有のものであってもよいし、市販されていてもよいし、または公に利用可能なインターネット知識ベースから得られてもよい。固有名詞モジュール306からの結果は、無視されるように固有名詞モジュール306によってフラグが立てられた固有名詞、提案された置換、または固有名詞モジュール306によって(たとえば識別された固有名詞の代わりに)メッセージに挿入された単語もしくは句を含み得る。実施形態に応じて、固有名詞モジュール306に起因するメッセージは、さらなる処理のために(変換モジュール208内の)別の変換モジュールに提供されてもよいし、または固有名詞モジュール306によって変換されたメッセージがデータストア210内にあるかどうか判断するために、提案された置換がCTT制御モジュール202に提供されてもよい。
【0114】
普通名詞モジュール308は、チャットメッセージ中の1つ以上の普通名詞を識別するように構成されてもよく、さらに、普通名詞と対応する(たとえば普通名詞によって表される)置換単語または句を提案するように構成されてもよい。いくつかの実施形態では、普通名詞モジュール308は、(たとえば翻訳モジュール116による)後続の機械翻訳中にスキップされるかまたはそうでなければ無視されるように、識別された普通名詞にフラグを立て得る。加えて、いくつかの実施形態では、人間のオペレータ(たとえばCTTシステム114の管理者)による後のレビューおよび処置のために、識別された普通名詞にフラグが立てられ得る。普通名詞および/またはその対応する単語もしくは句を識別するために、いくつかの実施形態は、普通名詞、ならびに/または普通名詞とそれらの対応する単語および句とのマッピングを含む(たとえばデータストア上に格納された)データセットを利用し得る。データセットは、トレーニングもしくは学習システムとして構成されてもよいし、(たとえばCTTシステム114の管理者によって「組織内で」手作業で収集される)専有のものであってもよいし、市販されていてもよいし、または公に利用可能なインターネット知識ベースから得られてもよい。普通名詞モジュール308からの結果は、無視されるように普通名詞モジュール308によってフラグが立てられた普通名詞、提案された置換、または普通名詞モジュール308によって(たとえば識別された普通名詞の代わりに)メッセージに挿入された単語もしくは句を含み得る。実施形態に応じて、普通名詞モジュール308に起因するメッセージは、さらなる処理のために(変換モジュール208内の)別の変換モジュールに提供されてもよいし、または普通名詞モジュール308によって変換されたメッセージがデータストア210内にあるかどうか判断するために、提案された置換がCTT制御モジュール202に提供されてもよい。
【0115】
口語モジュール310は、チャットメッセージ中の1つ以上の口語的な単語または句を識別するように構成されてもよく、さらに、識別された単語または句のための置換(たとえば対応する正式な/つまり非口語的な)単語または句を提案するように構成されてもよい。いくつかの実施形態では、口語モジュール310は、(たとえば翻訳モジュール116による)後続の機械翻訳中にスキップされるかまたはそうでなければ無視されるように、識別された口語的な単語または句にフラグを立て得る。加えて、いくつかの実施形態では、人間のオペレータ(たとえばCTTシステム114の管理者)による後のレビューおよび処置のために、識別された口語的な単語または句にフラグが立てられ得る。口語的な単語もしくは句および/またはその対応する(正式な)単語もしくは句を識別するために、いくつかの実施形態は、口語的な単語もしくは句、ならびに/または口語的な単語もしくは句とそれらの対応する単語および句とのマッピングを含む(たとえばデータストア上
に格納された)データセットを利用し得る。データセットは、トレーニングもしくは学習システムとして構成されてもよいし、(たとえばCTTシステム114の管理者によって「組織内で」手作業で収集される)専有のものであってもよいし、市販されていてもよいし、または公に利用可能なインターネット知識ベースから得られてもよい。口語モジュール310からの結果は、無視されるように口語モジュール310によってフラグが立てられた口語的な単語もしくは句、提案された置換、または口語モジュール310によって(たとえば識別された口語的な単語または句の代わりに)メッセージに挿入された非口語的な単語もしくは句を含み得る。実施形態に応じて、口語モジュール310に起因するメッセージがさらなる処理のために(変換モジュール208内の)別の変換モジュールに提供されてもよいし、または口語モジュール310によって変換されたメッセージがデータストア210内にあるかどうか判断するために、提案された置換がCTT制御モジュール202に提供されてもよい。
【0116】
スペルチェックモジュール312は、チャットメッセージ中の1つ以上のミススペルされた単語または句を識別するように構成されてもよく、さらに、識別された単語または句のための置換(たとえば訂正された)単語または句を提案するように構成されてもよい。たとえば、スペルチェックモジュール312は、単語または句を、提案された置換単語または句に自動的に訂正するように構成されてもよい。いくつかの実施形態では、スペルチェックモジュール312は、(たとえば翻訳モジュール116による)後続の機械翻訳中にスキップされるかまたはそうでなければ無視されるように、識別されたミススペルされた単語または句にフラグを立て得る。加えて、いくつかの実施形態では、人間のオペレータ(たとえばCTTシステム114の管理者)による後のレビューおよび処置のために、識別されたミススペルされた単語または句にフラグが立てられ得る。ミススペルされた単語もしくは句および/またはその対応する(訂正された)単語もしくは句を識別するために、いくつかの実施形態は、ミススペルされた単語もしくは句、ならびに/またはミススペルされた単語もしくは句とそれらの対応する単語および句とのマッピングを含む(たとえばデータストア上に格納された)データセットを利用し得る。データセットは、トレーニングもしくは学習システムとして構成されてもよいし、(たとえばCTTシステム114の管理者によって「組織内で」手作業で収集される)専有のものであってもよいし、市販されていてもよいし、または公に利用可能なインターネット知識ベースから得られてもよい。スペルチェックモジュール312からの結果は、無視されるようにスペルチェックモジュール312によってフラグが立てられたミススペルされた単語または句、提案された置換、またはスペルチェックモジュール312によって(たとえばミススペルされた単語または句の代わりに)メッセージに挿入された訂正された単語もしくは句を含み得る。実施形態に応じて、スペルチェックモジュール312に起因するメッセージがさらなる処理のために(変換モジュール208内の)別の変換モジュールに提供されてもよいし、またはスペルチェックモジュール312によって変換されたメッセージがデータストア210内にあるかどうか判断するために、提案された置換がCTT制御モジュール202に提供されてもよい。
【0117】
略語モジュール314は、チャットメッセージ中の1つ以上の略語を識別するように構成されてもよく、さらに、略語と対応する(たとえば略語によって表される)置換単語または句を提案するように構成されてもよい。いくつかの実施形態では、略語モジュール314は、(たとえば翻訳モジュール116による)後続の機械翻訳中にスキップされるかまたはそうでなければ無視されるように、識別された略語にフラグを立て得る。加えて、いくつかの実施形態では、人間のオペレータ(たとえばCTTシステム114の管理者)による後のレビューおよび処置のために、識別された略語にフラグが立てられ得る。略語および/またはその対応する単語もしくは句を識別するために、いくつかの実施形態は、略語、ならびに/または略語とそれらの対応する単語および句とのマッピングを含む(たとえばデータストア上に格納された)データセットを利用し得る。データセットは、トレ
ーニングもしくは学習システムとして構成されてもよいし、(たとえばCTTシステム114の管理者によって「組織内で」手作業で収集される)専有のものであってもよいし、市販されていてもよいし、または公に利用可能なインターネット知識ベースから得られてもよい。略語モジュール314からの結果は、無視されるように略語モジュール314によってフラグが立てられた略語、提案された置換、または略語モジュール314によって(たとえば識別された略語の代わりに)メッセージに挿入された単語もしくは句を含み得る。実施形態に応じて、略語モジュール314に起因するメッセージがさらなる処理のために(変換モジュール208内の)別の変換モジュールに提供されてもよいし、または略語モジュール314によって変換されたメッセージがデータストア210内にあるかどうか判断するために、提案された置換がCTT制御モジュール202に提供されてもよい。
【0118】
卑罵語モジュール316は、チャットメッセージ中の1つ以上の卑罵的な単語または句(以下「卑罵語」と称する)を識別するように構成されてもよく、さらに、卑罵語に対応する置換単語または句(たとえば適切な代替語)(たとえばトーンダウンした婉曲表現)を提案するように構成されてもよい。いくつかの実施形態では、卑罵語モジュール316は、(たとえば翻訳モジュール116による)後続の機械翻訳中にスキップされるかまたはそうでなければ無視されるように、識別された卑罵語にフラグを立て得る。加えて、いくつかの実施形態では、人間のオペレータ(たとえばCTTシステム114の管理者)による後のレビューおよび処置のために、識別された卑罵語にフラグが立てられ得る。卑罵語および/またはその対応する単語もしくは句を識別するために、いくつかの実施形態は、卑罵語、ならびに/または略語とそれらの対応する単語および句とのマッピングを含む(たとえばデータストア上に格納された)データセットを利用し得る。データセットは、トレーニングもしくは学習システムとして構成されてもよいし、(たとえばCTTシステム114の管理者によって「組織内で」手作業で収集される)専有のものであってもよいし、市販されていてもよいし、または公に利用可能なインターネット知識ベースから得られてもよい。卑罵語モジュール316からの結果は、無視されるように卑罵語モジュール316によってフラグが立てられた卑罵語、提案された置換、または卑罵語モジュール316によって(たとえば識別された卑罵語の代わりに)メッセージに挿入された単語もしくは句を含み得る。実施形態に応じて、卑罵語モジュール316に起因するメッセージがさらなる処理のために(変換モジュール208内の)別の変換モジュールに提供されてもよいし、または卑罵語モジュール316によって変換されたメッセージがデータストア210内にあるかどうか判断するために、提案された置換がCTT制御モジュール202に提供されてもよい。
【0119】
いくつかの実施形態について、変換モジュール208のうちの1つ以上の様々なモジュールは、フラグが立てられている部分の前および/または後に所定の文字を挿入することによって、チャットメッセージ中の1つ以上の部分にフラグを立て得る。たとえば、チャット用語モジュール302がチャットメッセージの一部分の単語「LOL」にフラグを立て
る場合、チャット用語モジュール302は、所定の文字("_")をその単語の前および/または後に挿入して(たとえば"_LOL_")、フラグが立てられた部分は翻訳モジュール
116によって無視されるべきであることを示し得る。
【0120】
いくつかの実施形態について、変換モジュール208は、初期メッセージに対して2つ以上の変換動作を並行して行なってもよく、それに応答して、2つ以上の変換動作の各々が別個の応答を戻してもよく、そこから変換モジュール208は次いで、さらなる処理のために(たとえば動作514で用いられるために)1つの変換されたメッセージを選択し得る。実施形態に応じて、各応答は、フラグが立てられたテキスト部分、提案された置換、または初期メッセージに挿入された単語もしくは句を含み得る。その後、選択された変換されたメッセージは選択の優先順位に従ってもよい。選択の優先順位は、どの変換されたメッセージが、どの先例に従ってさらなる処理に選択されるかを決定することができる
。いくつかの実施形態では、優先順位選択は、翻訳データストア210)における後続のルックアップまたは後続の機械翻訳に好適な変換されたメッセージを、どの変換動作が生成する可能性が最も高いかに従ってもよい。加えて、いくつかの実施形態では、選択の優先順位は、どの変換動作が最も正式な変換されたメッセージを生成するかに従ってもよい。選択の優先順位は、実施形態によって選択される変換/翻訳手順に依存してもよい。
【0121】
以下の表1は、変換モジュール208が様々な実施形態に従ってチャットメッセージの一部分をどのように処理し得るかについての例を示す。示されるように、変換モジュール208は、トークンまたはプロキシマルトークン(proximal tokens)に基づいてチャッ
トメッセージを処理してもよく、一旦変換が行なわれると、特定のトークンに対する処理を中止してもよい。
【0123】
表1.チャットメッセージ処理の例
図4は、様々な実施形態に係る典型的なチャットクライアントシステム104を例示するブロック図である。図示されるように、チャットクライアントシステム104は、チャットクライアントコントローラ402、チャットクライアント通信モジュール404、およびチャットクライアントグラフィカルユーザインターフェイス(GUI)モジュール406を含み得る。チャットクライアント制御モジュール402は、チャットクライアントシステム104がチャット関連動作(たとえばチャットサーバ108との通信チャットダイアログ)を行なう際に、チャットクライアントシステム104内の様々な動作の性能を制御および/または調整するように構成され得る。いくつかの実施形態について、チャットクライアント制御モジュール402は、たとえばチャットクライアント通信モジュール404およびチャットクライアントGUIモジュール406などを含む、チャットクライアントシステム104の他のコンポーネントの動作を制御してもよい。
【0124】
チャットクライアント通信モジュール404は、チャットクライアントシステム104と、チャットサーバ108などのチャットクライアントシステム104外のシステムおよびコンポーネントとの間の通信を円滑化するように構成され得る。したがって、チャットクライアントモジュール404により、チャットクライアントシステム104は、チャットクライアントシステム104において提示されるべきチャットダイアログを(たとえばチャットクライアントGUIモジュール406を介して)チャットサーバ108から受信してもよく、チャットクライアントシステム104において(たとえばチャットクライアントGUIモジュール406を介して)ユーザから受信したチャットダイアログをチャットサーバに送信してもよい。
【0125】
チャットクライアントGUIモジュール406は、他のチャットクライアントシステムとのチャットセッションへの図形入力/出力アクセス権をチャットクライアントシステム104におけるユーザに提供するように構成され得る。したがって、いくつかの実施形態について、チャットクライアントGUIモジュール406は、クライアント102によってユーザ対話を受信するように適合されたクライアントGUIをクライアント102におけるユーザに提示し得る。いくつかの実施形態について、チャットクライアントGUIモジュール406は、チャットダイアログを(たとえばそれらがチャットサーバ108から受信されると)、(たとえばユーザの言語嗜好/設定に従った)彼らの選択言語でユーザに提示するように構成され得る。加えて、チャットクライアントGUIモジュール406は、ユーザの選択の(たとえばユーザの言語嗜好/設定に従った)言語でユーザからチャット入力を受信するように構成され得る。本明細書に記載されるように、チャットクライアントシステム104においてチャットダイアログを提示し受信するのに用いられる言語は、別のチャットクライアントシステムにおいてチャットダイアログを提示し受信するのに用いられる言語とは異なっていてもよい。チャットクライアントGUIモジュール406に関して、
図7を参照してさらに述べる。
【0126】
図5は、様々な実施形態に係る多言語通信のための典型的な方法500を例示するフローチャートである。下記のように、いくつかの実施形態について、方法500によって例示される方法は、チャットクライアントシステム104−1、チャットクライアントシステム104−2、(たとえばチャットサーバ108の)CTTシステム114、および(たとえば翻訳サーバ110の)翻訳モジュール116に関連した動作を行ない得る。
【0127】
方法500は動作502において開始し得、(CTTシステム114の)言語モジュール204が、第1のチャットクライアントシステム(たとえば104−1)においてユーザによって用いられている第1の言語と、第2のチャットクライアントシステム(たとえば104−2)においてユーザによって用いられている第2の言語とを識別し得る。いく
つかの実施形態によれば、言語モジュール204は、それぞれのチャットクライアントシステム104から言語嗜好/設定を取得することによって、第1の言語と第2の言語とを識別し得る。
【0128】
動作504において、(CTTシステム114の)CTT通信モジュール204が第1の言語での初期メッセージを受信し得る。いくつかの実施形態では、CTT通信モジュール204は、チャットホストシステム112から初期メッセージを受信してもよく、チャットホストシステム112は、チャットクライアントシステム(たとえば104−1)から初期メッセージを受信していてもよい。
【0129】
動作506において、(CTTシステム114の)CTT制御モジュール202は、初期メッセージに対応する、第2の言語での対応するメッセージについて翻訳データストア210に照会し得る。動作508において、CTT制御モジュール202は、対応するメッセージが翻訳データストア210に見つけられるかどうか判断し得る。1つ存在する場合、動作510において、CTT通信モジュール204は、対応するメッセージを第2のチャットクライアントシステム(たとえばチャットクライアントシステム104−2)に送信することを支援し得る。いくつかの実施形態では、対応するメッセージは、チャットホストシステム112に送信され得る。チャットホストシステム112は、対応するメッセージを第2のチャットクライアントシステム(たとえば104−2)に中継し得る。次いで方法500は終了し得る。
【0130】
対応するメッセージが翻訳データストア210に存在しない場合、動作512において、変換モジュール208は、初期メッセージの少なくとも一部分を第1の言語での変換されたメッセージに変換することを試み得る。本明細書に記載されるように、変換モジュール208に起因するメッセージは、変換されてもよいし、(たとえば変換モジュール208の変換動作が初期メッセージに適用されない時は)元のままであってもよい。いくつかの実施形態について、変換モジュール208は、初期メッセージに対して2つ以上の変換動作を並行して行なってもよく、それに応答して、2つ以上の変換動作の各々が別個の応答を戻してもよく、そこから変換モジュール208は次いで、さらなる処理のために(たとえば動作514で用いられるために)1つの変換されたメッセージを選択し得る。実施形態に応じて、各応答は、フラグが立てられたテキスト部分、提案された置換、または初期メッセージに挿入された単語もしくは句を含み得る。その後、選択された変換されたメッセージは選択の優先順位に従ってもよい。選択の優先順位は、どの変換されたメッセージが、どの先例に従ってさらなる処理に選択されるかを決定することができる。いくつかの実施形態では、優先順位選択は、翻訳データストア210)における後続のルックアップまたは後続の機械翻訳に好適な変換されたメッセージを、どの変換動作が生成する可能性が最も高いかに従ってもよい。加えて、いくつかの実施形態では、選択の優先順位は、どの変換動作が最も正式な変換されたメッセージを生成するかに従ってもよい。選択の優先順位は、実施形態によって選択される変換/翻訳手順に依存してもよい。
【0131】
動作514において、変換モジュール208がメッセージを変換したと想定すると、(CTTシステム114の)CTT制御モジュール202は、変換されたメッセージに対応する、第2の言語での対応するメッセージについて翻訳データストア210に照会し得る。動作516において、CTT制御モジュール202は、対応するメッセージが翻訳データストア210に見つけられるかどうか判断し得る。1つ存在する場合、動作518において、CTT通信モジュール204は、対応するメッセージを第2のチャットクライアントシステム(たとえばチャットクライアントシステム104−2)に送信することを支援し得る。いくつかの実施形態では、対応するメッセージは、チャットホストシステム112に送信され得る。チャットホストシステム112は次いで、対応するメッセージを第2のチャットクライアントシステム(たとえば104−2)に中継し得る。次いで方法50
0は終了し得る。
【0132】
いくつかの実施形態について、対応するメッセージが依然として翻訳データストア210に存在しない場合、動作520において、CTT制御モジュール202は、まだ行なわれていないチャットメッセージに対して行なうべき変換モジュール208のいずれかの追加的な変換動作があるかどうか判断し得る。
【0133】
追加的な変換動作が存在する場合、方法500は動作512に戻り、追加的な変換動作を行なう。実施形態に応じて、追加的な変換動作は、変換モジュール208によって初期メッセージに対してすでに行なわれたものとは異なる変換動作を適用することを含んでもよいし、行なわれた同じ変換動作を英語のチャットメッセージの異なる部分に適用することを含んでもよいし、またはそれらの何らかの組合せを含んでもよい。たとえば、動作512の第1の実行中に、変換モジュール208がチャット用語に関連した動作を初期メッセージに適用(して第1の変換されたメッセージを作成)した場合、動作512の第2の実行中に、変換モジュール208は、略語に関連した動作を第2の変換されたメッセージに適用し得る。動作512の後続の実行に続いて、方法500は動作514および516に進んでもよく、そこでCTT制御モジュール202は、結果として得られた最新の変換されたメッセージに対応する第2の言語での対応するメッセージについて再度翻訳データストア210に照会してもよく、CTT制御モジュール202は、対応するメッセージが翻訳データストア210に見つけられるかどうか判断し得る。このように反復して変換および照会動作を行なうことによって、ある実施形態は、利用可能なすべての変換動作を行なうことになる前に対応するメッセージを見つけることが可能であり得る。当業者は、ある実施形態について、変換および照会動作が連続して行なわれてもよく、照会動作(たとえば動作514)は、変換モジュール208によって提供されるすべての利用可能な変換動作がチャットメッセージに対して行なわれた後でのみ行なわれることを認識するであろう。
【0134】
対応するメッセージが翻訳データストア210に存在せず、(変換モジュール208の)追加的な変換動作が存在しない場合、動作522において(翻訳APIモジュール212を介して)、翻訳モジュール116は、初期メッセージまたは変換されたメッセージを第2の言語での対応するメッセージに翻訳することを支援し得る。その後、動作524において、CTT通信モジュール204は、対応するメッセージを第2のチャットクライアントシステム(たとえばチャットクライアントシステム104−2)に送信することを支援し得る。いくつかの実施形態によれば、対応するメッセージは、チャットホストシステム112に送信され得る。チャットホストシステム112は次いで、対応するメッセージを第2のチャットクライアントシステム(たとえば104−2)に中継し得る。次いで方法500は終了し得る。
【0135】
ある実施形態について、変換モジュール208は、対応するメッセージがチャットホストシステム112に送信される前に、対応するメッセージを第2の言語に変換するために利用され得る。本明細書に記載されるように、第2のチャットクライアントシステム(たとえば104−2)におけるユーザのために翻訳をさらに改良するために、対応するメッセージにさらなる変換処理を行ってもよい。たとえば、初期メッセージが第1の言語(たとえば英語)のチャット用語を含んでいる場合、追加的な変換処理は、第2の言語でのチャット用語を可能な範囲で追加することができる。
【0136】
上記の方法のステップはある順序で表され、記載され得るが、当業者は、ステップが行なわれる順序は実施形態間で変動し得ることを認識するであろう。加えて、当業者は、方法500に関して上記したコンポーネントは当該方法で使用されるコンポーネントの例にすぎず、いくつかの実施形態については他のコンポーネントもいくつかの実施形態におい
て利用され得ることを認識するであろう。
【0137】
図6は、様々な実施形態に係る通信を変換するための典型的な方法600を例示するフローチャートである。下記のように、いくつかの実施形態について、方法600は、(たとえばCTTシステム114の)変換モジュール208に関連した動作を行ない得る。
【0138】
方法は動作602において開始し得、変換処理のために変換モジュール208によって初期メッセージが受信される。いくつかの実施形態に基づいて、変換モジュール208は、翻訳データストア210内のメッセージの識別に失敗した後であって、かつ場合によっては第三者または専有の翻訳処理(たとえば、クラウドベースサービスとして提供され得る翻訳モジュール116)によって初期メッセージが機械翻訳される前の変換のために、初期メッセージを受信し得る。本明細書に記載されるように、特にテキストが最小のコンテキスト、簡潔な文章構造、特殊化された/ドメイン関連の専門用語(たとえばインターネットベースのチャットのためのチャット用語)、略語、頭字語、口語、固有名詞、普通名詞、卑罵語、またはそれらの何らかの組合せを含む場合に、テキスト翻訳を円滑化するかまたは他の方法で向上させるために、様々な実施形態において変換モジュール208が使用され得る。変換モジュール208の動作を活用し得るテキスト翻訳は、限定はしないが、会話(たとえばトランスクリプト)、オフラインまたはオンラインのインターネットベースのチャット(たとえばインスタントメッセージング)、および携帯電話メッセージング(たとえばSMSまたはMMS)から生じるテキストの翻訳を含み得る。
【0139】
動作604において、チャット用語モジュール302は、チャット専門用語(つまりチャット用語)と関連付けられた初期メッセージ中の1つ以上の単語または句を識別してもよく、さらに、識別された単語または句のための置換(たとえば対応する正式な/つまりチャット用語でない)単語または句を提案してもよい。いくつかの実施形態では、チャット用語モジュール302は、(たとえば翻訳モジュール116による)後続の機械翻訳中にスキップされるかまたはそうでなければ無視されるように、識別されたチャット用語の単語または句にフラグを立て得る。加えて、いくつかの実施形態では、人間のオペレータ(たとえばCTTシステム114の管理者)による後のレビューおよび処置のために、識別されたチャット用語の単語または句にフラグが立てられ得る。チャット用語の単語もしくは句および/またはその対応する(正式な)単語もしくは句を識別するために、いくつかの実施形態は、チャット用語の単語もしくは句、ならびに/またはチャット用語の単語もしくは句とそれらの対応する単語および句とのマッピングを含む(たとえばデータストア上に格納された)データセットを利用し得る。データセットは、トレーニングもしくは学習システムとして構成されてもよいし、(たとえばCTTシステム114の管理者によって「組織内で」手作業で収集される)専有のものであってもよいし、市販されていてもよいし、または公に利用可能なインターネット知識ベースから得られてもよい。動作604に起因するメッセージ(以下「第1の中間メッセージ」)は、無視されるようにチャット用語モジュール302によってフラグが立てられたチャット用語の単語もしくは句、提案された置換、またはチャット用語モジュール302によって(たとえば識別されたチャット用語の単語または句の代わりに)初期メッセージに挿入されたチャット用語でない単語もしくは句を含み得る。いくつかの例では、第1の中間メッセージは、(たとえばチャット用語モジュール302によって置換が行なわれない時は)初期メッセージと同じであり得る。実施形態に応じて、チャット用語モジュール302に起因する第1の中間メッセージがさらなる処理のために(変換モジュール208内の)別の変換モジュールに提供されてもよいし、またはチャット用語モジュール302によって変換されたメッセージがデータストア210内にあるかどうか判断するために、提案された置換がCTT制御モジュール202に提供されてもよい。動作604に続いて、第1の中間メッセージは、処理のために変換モジュール208の次の動作(たとえば動作606)に提供され得る。
【0140】
動作606において、頭字語モジュール304は、チャットメッセージ中の1つ以上の頭字語を識別してもよく、さらに、頭字語に対応する(たとえば頭字語によって表される)置換単語または句を提案してもよい。いくつかの実施形態では、頭字語モジュール304は、(たとえば翻訳モジュール116による)後続の機械翻訳中にスキップされるかまたはそうでなければ無視されるように、識別された頭字語にフラグを立て得る。加えて、いくつかの実施形態では、人間のオペレータ(たとえばCTTシステム114の管理者)による後のレビューおよび処置のために、識別された頭字語にフラグが立てられ得る。頭字語および/またはその対応する単語もしくは句を識別するために、いくつかの実施形態は、頭字語、ならびに/または頭字語とそれらの対応する単語および句とのマッピングを含む(たとえばデータストア上に格納された)データセットを利用し得る。データセットは、トレーニングもしくは学習システムとして構成されてもよいし、(たとえばCTTシステム114の管理者によって「組織内で」手作業で収集される)専有のものであってもよいし、市販されていてもよいし、または公に利用可能なインターネット知識ベースから得られてもよい。動作606に起因するメッセージ(以下「第2の中間メッセージ」)は、無視されるように頭字語モジュール304によってフラグが立てられた頭字語、提案された置換、または頭字語モジュール304によって(たとえば識別された頭字語の代わりに)メッセージに挿入された単語もしくは句を含み得る。いくつかの例では、第2の中間メッセージは、(たとえば頭字語モジュール304によって置換が行なわれない時は)第1の中間メッセージと同じであり得る。実施形態に応じて、頭字語モジュール304に起因する第2の中間メッセージがさらなる処理のために(変換モジュール208内の)別の変換モジュールに提供されてもよいし、または頭字語モジュール304によって変換されたメッセージがデータストア210内にあるかどうか判断するために、提案された置換がCTT制御モジュール202に提供されてもよい。動作606に続いて、第2の中間メッセージは、処理のために変換モジュール208の次の動作(たとえば動作608)に提供され得る。
【0141】
動作608において、固有名詞モジュール306は、チャットメッセージ中の1つ以上の固有名詞を識別してもよく、さらに、固有名詞に対応する(たとえば固有名詞によって表される)置換単語または句を提案してもよい。いくつかの実施形態では、固有名詞モジュール306は、(たとえば翻訳モジュール116による)後続の機械翻訳中にスキップされるかまたはそうでなければ無視されるように、識別された固有名詞にフラグを立て得る。加えて、いくつかの実施形態では、人間のオペレータ(たとえばCTTシステム114の管理者)による後のレビューおよび処置のために、識別された固有名詞にフラグが立てられ得る。固有名詞および/またはその対応する単語もしくは句を識別するために、いくつかの実施形態は、固有名詞(たとえばDisneyland(登録商標)などの周知の固有名詞または個人の通称)、ならびに/または固有名詞とそれらの対応する単語および句とのマッピングを含む(たとえばデータストア上に格納された)データセットを利用し得る。データセットは、トレーニングもしくは学習システムとして構成されてもよいし、(たとえばCTTシステム114の管理者によって「組織内で」手作業で収集される)専有のものであってもよいし、市販されていてもよいし、または公に利用可能なインターネット知識ベースから得られてもよい。動作608に起因するメッセージ(以下「第3の中間メッセージ」)は、無視されるように固有名詞モジュール306によってフラグが立てられた固有名詞、提案された置換、または固有名詞モジュール306によって(たとえば識別された固有名詞の代わりに)メッセージに挿入された単語もしくは句を含み得る。いくつかの例では、第3の中間メッセージは、(たとえば固有名詞モジュール306によって置換が行なわれない時は)第2の中間メッセージと同じであり得る。実施形態に応じて、固有名詞モジュール306に起因する第3の中間メッセージは、さらなる処理のために(変換モジュール208内の)別の変換モジュールに提供されてもよいし、または固有名詞モジュール306によって変換されたメッセージがデータストア210内にあるかどうか判断するために、提案された置換がCTT制御モジュール202に提供されてもよい
。動作608に続いて、第3の中間メッセージは、処理のために変換モジュール208の次の動作(たとえば動作610)に提供され得る。
【0142】
動作610において、普通名詞モジュール308は、チャットメッセージ中の1つ以上の普通名詞を識別してもよく、さらに、普通名詞に対応する(たとえば普通名詞によって表される)置換単語または句を提案してもよい。いくつかの実施形態では、普通名詞モジュール308は、(たとえば翻訳モジュール116による)後続の機械翻訳中にスキップされるかまたはそうでなければ無視されるように、識別された普通名詞にフラグを立て得る。加えて、いくつかの実施形態では、人間のオペレータ(たとえばCTTシステム114の管理者)による後のレビューおよび処置のために、識別された普通名詞にフラグが立てられ得る。普通名詞および/またはその対応する単語もしくは句を識別するために、いくつかの実施形態は、普通名詞、ならびに/または普通名詞とそれらの対応する単語および句とのマッピングを含む(たとえばデータストア上に格納された)データセットを利用し得る。データセットは、トレーニングもしくは学習システムとして構成されてもよいし、(たとえばCTTシステム114の管理者によって「組織内で」手作業で収集される)専有のものであってもよいし、市販されていてもよいし、または公に利用可能なインターネット知識ベースから得られてもよい。動作610に起因するメッセージ(以下「第4の中間メッセージ」)は、無視されるように普通名詞モジュール308によってフラグが立てられた普通名詞、提案された置換、または普通名詞モジュール308によって(たとえば識別された普通名詞の代わりに)メッセージに挿入された単語もしくは句を含み得る。いくつかの例では、第4の中間メッセージは、(たとえば普通名詞モジュール308によって置換が行なわれない時は)第3の中間メッセージと同じであり得る。実施形態に応じて、普通名詞モジュール308に起因する第4の中間メッセージは、さらなる処理のために(変換モジュール208内の)別の変換モジュールに提供されてもよいし、または普通名詞モジュール308によって変換されたメッセージがデータストア210内にあるかどうか判断するために、提案された置換がCTT制御モジュール202に提供されてもよい。動作610に続いて、第4の中間メッセージは、処理のために変換モジュール208の次の動作(たとえば動作612)に提供され得る。
【0143】
動作612において、口語モジュール310は、チャットメッセージ中の1つ以上の口語的な単語または句を識別してもよく、さらに、識別された単語または句のための置換(たとえば対応する正式な/つまり非口語的な)単語または句を提案してもよい。いくつかの実施形態では、口語モジュール310は、(たとえば翻訳モジュール116による)後続の機械翻訳中にスキップされるかまたはそうでなければ無視されるように、識別された口語的な単語または句にフラグを立て得る。加えて、いくつかの実施形態では、人間のオペレータ(たとえばCTTシステム114の管理者)による後のレビューおよび処置のために、識別された口語的な単語または句にフラグが立てられ得る。口語的な単語もしくは句および/またはその対応する(正式な)単語もしくは句を識別するために、いくつかの実施形態は、口語的な単語もしくは句、ならびに/または口語的な単語もしくは句とそれらの対応する単語および句とのマッピングを含む(たとえばデータストア上に格納された)データセットを利用し得る。データセットは、トレーニングもしくは学習システムとして構成されてもよいし、(たとえばCTTシステム114の管理者によって「組織内で」手作業で収集される)専有のものであってもよいし、市販されていてもよいし、または公に利用可能なインターネット知識ベースから得られてもよい。動作612に起因するメッセージ(以下「第5の中間メッセージ」)は、無視されるように口語モジュール310によってフラグが立てられた口語的な単語もしくは句、提案された置換、または口語モジュール310によって(たとえば識別された口語的な単語もしくは句の代わりに)メッセージに挿入された非口語的な単語もしくは句を含み得る。いくつかの例では、第5の中間メッセージは、(たとえば口語名詞モジュール310によって置換が行なわれない時は)第4の中間メッセージと同じであり得る。実施形態に応じて、口語モジュール310に起因
する第5の中間メッセージがさらなる処理のために(変換モジュール208内の)別の変換モジュールに提供されてもよいし、または口語モジュール310によって変換されたメッセージがデータストア210内にあるかどうか判断するために、提案された置換がCTT制御モジュール202に提供されてもよい。動作612に続いて、第5の中間メッセージは、処理のために変換モジュール208の次の動作(たとえば動作614)に提供され得る。
【0144】
動作614において、スペルチェックモジュール312は、チャットメッセージ中の1つ以上のミススペルされた単語または句を識別してもよく、さらに、識別された単語または句のための置換(たとえば訂正された)単語または句を提案してもよい。たとえば、スペルチェックモジュール312は、提案された置換単語または句によって単語または句を自動的に訂正し得る。いくつかの実施形態では、スペルチェックモジュール312は、(たとえば翻訳モジュール116による)後続の機械翻訳中にスキップされるかまたはそうでなければ無視されるように、識別されたミススペルされた単語または句にフラグを立て得る。加えて、いくつかの実施形態では、人間のオペレータ(たとえばCTTシステム114の管理者)による後のレビューおよび処置のために、識別されたミススペルされた単語または句にフラグが立てられ得る。ミススペルされた単語もしくは句および/またはその対応する(訂正された)単語もしくは句を識別するために、いくつかの実施形態は、ミススペルされた単語もしくは句、ならびに/またはミススペルされた単語もしくは句とそれらの対応する単語および句とのマッピングを含む(たとえばデータストア上に格納された)データセットを利用し得る。データセットは、トレーニングもしくは学習システムとして構成されてもよいし、(たとえばCTTシステム114の管理者によって「組織内で」手作業で収集される)専有のものであってもよいし、市販されていてもよいし、または公に利用可能なインターネット知識ベースから得られてもよい。動作614に起因するメッセージ(以下「第6の中間メッセージ」)は、無視されるようにスペルチェックモジュール312によってフラグが立てられたミススペルされた単語もしくは句、提案された置換、またはスペルチェックモジュール312によって(たとえばミススペルされた単語もしくは句の代わりに)メッセージに挿入された訂正された単語もしくは句を含み得る。いくつかの例では、第6の中間メッセージは、(たとえばスペルチェックモジュール312によって置換が行なわれない時は)第5の中間メッセージと同じであり得る。実施形態に応じて、スペルチェックモジュール312に起因する第6の中間メッセージは、さらなる処理のために(変換モジュール208内の)別の変換モジュールに提供されてもよいし、またはスペルチェックモジュール312によって変換されたメッセージがデータストア210内にあるかどうか判断するために、提案された置換がCTT制御モジュール202に提供されてもよい。動作614に続いて、第6の中間メッセージは、処理のために変換モジュール208の次の動作(たとえば動作616)に提供され得る。
【0145】
動作616において、略語モジュール314は、チャットメッセージ中の1つ以上の略語を識別してもよく、さらに、略語に対応する(たとえば略語によって表される)置換単語または句を提案してもよい。いくつかの実施形態では、略語モジュール314は、(たとえば翻訳モジュール116による)後続の機械翻訳中にスキップされるかまたはそうでなければ無視されるように、識別された略語にフラグを立て得る。加えて、いくつかの実施形態では、人間のオペレータ(たとえばCTTシステム114の管理者)による後のレビューおよび処置のために、識別された略語にフラグが立てられ得る。略語および/またはその対応する単語もしくは句を識別するために、いくつかの実施形態は、略語、ならびに/または略語とそれらの対応する単語および句とのマッピングを含む(たとえばデータストア上に格納された)データセットを利用し得る。データセットは、トレーニングもしくは学習システムとして構成されてもよいし、(たとえばCTTシステム114の管理者によって「組織内で」手作業で収集される)専有のものであってもよいし、市販されていてもよいし、または公に利用可能なインターネット知識ベースから得られてもよい。動作
616に起因するメッセージ(以下「第7の中間メッセージ」)は、無視されるように略語モジュール314によってフラグが立てられた略語、提案された置換、または略語モジュール314によって(たとえば識別された略語の代わりに)メッセージに挿入された単語もしくは句を含み得る。いくつかの例では、第7の中間メッセージは、(たとえば略語モジュール314によって置換が行なわれない時は)第6の中間メッセージと同じであり得る。実施形態に応じて、略語モジュール314に起因する第7の中間メッセージがさらなる処理のために(変換モジュール208内の)別の変換モジュールに提供されてもよいし、または略語モジュール314によって変換されたメッセージがデータストア210内にあるかどうか判断するために、提案された置換がCTT制御モジュール202に提供されてもよい。動作616に続いて、第7の中間メッセージは、処理のために変換モジュール208の次の動作(たとえば動作618)に提供され得る。
【0146】
動作618において、卑罵語モジュール316は、チャットメッセージ中の1つ以上の卑罵的な単語または句(以下「卑罵語」と称する)を識別してもよく、さらに、卑罵語に対応する置換単語または句(たとえば適切な代替語)(たとえばトーンダウンした婉曲表現)を提案してもよい。いくつかの実施形態では、卑罵語モジュール316は、(たとえば翻訳モジュール116による)後続の機械翻訳中にスキップされるかまたはそうでなければ無視されるように、識別された卑罵語にフラグを立て得る。加えて、いくつかの実施形態では、人間のオペレータ(たとえばCTTシステム114の管理者)による後のレビューおよび処置のために、識別された卑罵語にフラグが立てられ得る。卑罵語および/またはその対応する単語もしくは句を識別するために、いくつかの実施形態は、卑罵語、ならびに/または略語とそれらの対応する単語および句とのマッピングを含む(たとえばデータストア上に格納された)データセットを利用し得る。データセットは、トレーニングもしくは学習システムとして構成されてもよいし、(たとえばCTTシステム114の管理者によって「組織内で」手作業で収集される)専有のものであってもよいし、市販されていてもよいし、または公に利用可能なインターネット知識ベースから得られてもよい。動作618に起因するメッセージ(以下「第8の中間メッセージ」)は、無視されるように卑罵語モジュール316によってフラグが立てられた卑罵語、提案された置換、または卑罵語モジュール316によって(たとえば識別された卑罵語の代わりに)メッセージに挿入された単語もしくは句を含み得る。いくつかの例では、第8の中間メッセージは、(たとえば卑罵語モジュール316によって置換が行なわれない時は)第7の中間メッセージと同じであり得る。実施形態に応じて、卑罵語モジュール316に起因する第8の中間メッセージがさらなる処理のために(変換モジュール208内の)別の変換モジュールに提供されてもよいし、または卑罵語モジュール316によって変換されたメッセージがデータストア210内にあるかどうか判断するために、提案された置換がCTT制御モジュール202に提供されてもよい。動作618に続いて、第8の中間メッセージは、処理のために変換モジュール208の次の動作に提供され得る。次いで方法600は終了し得る。
【0147】
いくつかの実施形態に従って、変換モジュール208に最終的に起因するメッセージ(たとえば動作618に起因する第8の中間メッセージ)は、対応するメッセージについて翻訳データストア210に照会するためにその後用いられてもよい。対応するメッセージは、結果として得られるメッセージについての翻訳として機能することができる。当業者は、いくつかの例では、変換モジュール208に起因するメッセージ(たとえば翻訳データストア210への照会のためにその後用いられるメッセージ)は、初期メッセージに変換が適用されていない(たとえば、いずれの変換も適用されることなく初期メッセージが動作604〜618を通過した)場合には、(たとえば動作602において)受信された初期メッセージと同じであり得ることを認識するであろう。
【0148】
当業者は、様々な実施形態が図示よりも多くの動作または少ない動作を行なってもよく
、図示したものとは異なる動作を行なってもよく、異なる順序で動作を行なってもよいことも認識するであろう。概して、行なわれる変換動作の種類、およびそれらが行なわれる順序は、実施形態によって採用される変換手順に依存し得る。ここに注記されるように、様々な実施形態は、それぞれの変換を実現する際に異なる変換/翻訳手順を実現し得る。ある手順は、特定の翻訳アプリケーションまたは翻訳コンテキストによく適している。採用される変換/翻訳手順は、どの変換動作が行なわれるか、その変換動作がいつ行なわれるか、またはどの順序でその変換動作が行なわれるかを決定し得る。変換/翻訳手順は、どんな翻訳が翻訳データストアにポピュレートされるか、変換/翻訳処理全体のうちいつ翻訳データストアが利用されるかを決定し得る。
【0149】
いくつかの実施形態について、方法600における動作に起因する中間メッセージは、方法600における後続の動作に起因するメッセージに対して影響力および/またはカスケード効果を有し得る。加えて、いくつかの実施形態について、チャットメッセージが方法600によって処理される時、方法が終了する前に、フローチャート600の各動作がチャットメッセージに対して行なわれ得る。代替的に、いくつかの実施形態について、フローチャート600の方法は、(たとえば、少なくとも1つの動作がチャットメッセージの変換に帰着した後で)図示されている動作のサブセットのみの実行によって早期に終了し得る。いくつかの実施形態によれば、フローチャート500の各動作の実行後、結果として得られた最新の変換されたメッセージに基づく所望の言語での対応するメッセージについての翻訳データストア210への照会が続き得る。対応するメッセージが識別された場合、フローチャート500の方法は早期に終了し得る。
【0150】
様々な実施形態について、方法600は、動作604〜612を並行して行ない得る。たとえば、CTT制御モジュール202は、初期メッセージに対して2つ以上の動作604〜612を並行して行い、それらの2つ以上の動作の各々から別個の応答を受信し得る。各応答は、フラグが立てられたテキスト部分、提案された置換、または初期メッセージに挿入された単語もしくは句を含み得る。その後、CTT制御モジュール202は、場合によっては(たとえば、さらなる処理のために、かつどんな先例に従って、どの変換されたメッセージが選択されるかを決定することができる)選択の優先順位に従って、後続の処理(たとえば翻訳データストア210への照会、または翻訳モジュール116による翻訳)のために、受信した応答のうち1つを選択し得る。
【0151】
たとえば、方法600中に、CTT制御モジュール202は、初期メッセージに対して、チャット用語処理を識別するための動作604、普通名詞処理のための動作610、および略語処理のための動作616を行い得る。それに応答して、動作604はチャット用語について変換された初期メッセージを戻し得る。動作610は元のままの初期メッセージを戻し得る。動作616は、略語について変換された初期メッセージを戻し得る。その後、選択の優先順位に基づいて、CTT制御モジュール202は、動作616から戻された変換されたメッセージをさらなる処理のために選択し得る。
【0152】
ある実施形態について、方法600の様々な動作を行なうことに対して時間制限が実施される。時間制限は、時間制限が切れる前に応答/結果が受信されなければ、方法600の変換動作に実行を停止させ得る。その際、様々な実施形態は、ある変換動作が翻訳/翻訳処理全体を不必要に妨害しないことを保証し得る。
【0153】
上記の方法のステップはある順序で表され、記載され得るが、当業者は、ステップが行なわれる順序は実施形態間で変動し得ることを認識するであろう。加えて、当業者は、フローチャート600の方法に関して上記したコンポーネントは当該方法で使用され得るコンポーネントの例にすぎず、いくつかの実施形態については、他のコンポーネントもいくつかの実施形態において利用され得ることを認識するであろう。
【0154】
図7は、様々な実施形態に係る、チャットクライアントシステム104(たとえば104−1および104−2)間での典型的な多言語チャットセッションを例示する
図700である。図示されるように、チャットクライアントシステム104−1は、チャットクライアントGUIモジュール406−1を含み得る。チャットクライアントシステム104−2は、チャットクライアントGUIモジュール406−2を含み得る。本明細書に記載されるように、チャットクライアントGUIモジュール406−1および406−2の各々は、それらの間で共有されるチャットセッションへの図形入力/出力アクセス権を、チャットクライアントシステム104−1および104−2におけるユーザにそれぞれ提供するように構成され得る。いくつかの実施形態について、チャットクライアントGUIモジュール406−1および406−2は、送受信されたチャットダイアログに関するユーザ対話を受信するように適合されたクライアントGUIを、それぞれのユーザに提示し得る。
【0155】
(
図7において双方向矢印によって表される)チャットダイアログ712がチャットクライアントシステム104−1および104−2の間で渡されると、チャットクライアントGUIモジュール406−1および406−2は、それぞれのチャットクライアントシステム104−1または104−2におけるユーザによって(暗示的にまたは明示的に)選択された言語でチャットダイアログ712を提示し得る。図示されるように、チャットクライアントGUIモジュール406−1は、チャットダイアログ712を第1の言語(たとえば英語)で出力領域708に提示し、かつ第1の言語でのチャット入力を第2の領域710において受信するように構成されたチャットダイアログボックス702を含み得る。チャットクライアントGUIモジュール406−2は、チャットダイアログ712を第2の言語(たとえばフランス語)で出力領域720に提示し、かつ第2の言語でのチャット入力を第2の領域722において受信するように構成されたチャットダイアログボックス714を含み得る。いくつかの実施形態について、チャットダイアログ712がダイアログボックス702および714に提示される時、チャットダイアログ712においてチャットメッセージを入力するユーザと関連付けられたユーザ名(たとえばユーザオンライン識別子)の提示を含み得る。
【0156】
図7の例示された実施形態では、チャットクライアントシステム104−1について選択された言語は英語であり、チャットクライアントシステム104−2について選択された言語はフランス語である。したがって、チャットメッセージ704(「LOL」)および
706(「Who u laughin at?」)がチャットクライアントGUIモジュール406−1のダイアログボックス702に英語で提示される一方、それぞれ対応するチャットメッセージ716(「MDR」)および718(「Qui te fair rire?」)がチャットクライアン
トGUIモジュール406−2のダイアログボックス714にフランス語で提示される。チャットメッセージ704,706,716,および718の翻訳は、本明細書に記載される様々なシステムおよび方法によって円滑化され得る。チャットメッセージ704,706,716,および718と同様のメッセージの翻訳に関して、
図8〜
図10を参照してさらに述べる。
【0157】
図8は、様々な実施形態に係る典型的な多言語通信方法800の動作を例示するフローチャートである。下記のように、いくつかの実施形態について、方法800は、チャットクライアントシステム104−1、チャットクライアントシステム104−2、および(たとえばチャートサーバ108の)CTTシステム114に関連した動作を行ない得る。特に、
図8は、いくつかの実施形態に係る、テキスト「LOL」を含む英語のチャットメッ
セージの、フランス語のチャットメッセージへの翻訳を例示する。そのような状況は、第1のチャットクライアントシステム104−1においてユーザによって用いられている言語が英語であり、第2のチャットクライアントシステム104−2においてユーザによっ
て用いられている言語がフランス語である場合に生じ得る。いくつかの実施形態によれば、CTTシステム114は、チャットクライアントシステム104−1および104−2についてこれらの言語選択/嗜好を自動的に検出し得る。
【0158】
図示されるように、動作802において、第1のチャットクライアントシステム104−1は、第2のチャットクライアントシステム104−2への(たとえばチャットホストシステム112を介した)伝送のために英語のメッセージを送信し得る。英語のメッセージは、翻訳処理のために、CTTシステム114のCTT制御モジュール202に送られ得る。
【0159】
動作804において、CTT制御モジュール202は、英語のチャットメッセージ(「LOL」)に対応し、かつあらかじめフランス語に翻訳されているチャットメッセージにつ
いて翻訳データストア210に照会し得る。それに応答して、動作806において、翻訳データストア210は、英語のチャットメッセージ(「LOL」)に対応した、対応するフ
ランス語のメッセージ(「MDR」)をCTT制御モジュール202に戻し得る。その後、
動作808において、CTT制御モジュール202は、対応するフランス語のチャットメッセージ(「MDR」)を第2のチャットクライアントシステム104−2に伝送すること
を支援し得る(たとえばCTTシステム114は、伝送のために、チャットホストシステム112へ、対応するフランス語のチャットメッセージを送信する)。
【0160】
図9は、様々な実施形態に係る典型的な多言語通信方法900の動作を例示するフローチャートである。下記のように、いくつかの実施形態について、フローチャート900によって例示される方法は、チャットクライアントシステム104−1、チャットクライアントシステム104−2、(たとえばチャートサーバ108の)CTTシステム114、および(たとえば翻訳サーバ110の)翻訳モジュール116に関連した動作を行ない得る。特に、
図9は、いくつかの実施形態に係る、テキスト「LOL」を含む英語のチャット
メッセージの、フランス語の相当するチャットメッセージへの翻訳を例示する。
図8の例示された実施形態とは異なり、
図9は、(たとえばCTTシステム114の)変換モジュール208および翻訳モジュール116の使用を例示する。
【0161】
図示されるように、動作902において、第1のチャットクライアントシステム104−1は、フランス語を話すユーザを有する第2のチャットクライアントシステム104−2への(たとえばチャットホストシステム112を介した)伝送のために、英語のチャットメッセージを送信し得る。英語のチャットメッセージは、翻訳処理のためにCTTシステム114のCTT制御モジュール202に送られ得る。
【0162】
動作904において、CTT制御モジュール202は、英語のチャットメッセージ(「LOL」)に対応するフランス語の相当するチャットメッセージについて翻訳データストア
210に照会し得る。それに応答して、動作906において、翻訳データストア210は、照会の失敗をCTT制御モジュール202に戻して、英語のチャットメッセージ(「LOL」)について対応するフランス語のチャットメッセージを翻訳データストア210が有
していないことを示してもよい。そのような場合、動作908において、CTT制御モジュール202は、ある実施形態に係る変換処理のために、変換モジュール208に英語のチャットメッセージを送信し得る。本明細書に記載されるように、変換モジュール208は、チャットメッセージをさらなる翻訳処理により好適なメッセージに変換するように構成された複数の変換関連モジュール932を含み得る。
【0163】
動作910において、変換モジュール208のチャット用語モジュール302は、英語のチャットメッセージ(「LOL」)を変換された英語のチャットメッセージ(「laugh out
loud」)に変換し得、さらなる処理のために、変換された英語のチャットメッセージを
CTT制御モジュール202に戻し得る。当業者は、いくつかの実施形態について、変換された英語のチャットメッセージがCTT制御モジュール202に戻される前に、変換モジュール208の追加モジュールによって英語のチャットメッセージが処理され得ることを認識するであろう。
【0164】
動作912において、CTT制御モジュール202は、変換された英語のチャットメッセージ(「laugh out loud」)に対応するフランス語の相当するチャットメッセージについて翻訳データストア210に照会し得る。それに応答して、動作914において、翻訳データストア210は、照会の失敗をCTT制御モジュール202に戻して、変換された英語のチャットメッセージ(「laugh out loud」)について対応するフランス語のチャットメッセージを翻訳データストア210が有していないことを示してもよい。そのような場合、動作916において、CTT制御モジュール202は、ある実施形態に係る機械翻訳処理のために、翻訳モジュール116に変換された英語のチャットメッセージを送信し得る。
【0165】
動作918において、翻訳モジュール116は、変換された英語のチャットメッセージに対応する機械翻訳されたフランス語のチャットメッセージ(「mort de rire」)を戻し得る。結果として得られる機械翻訳されたフランス語のチャットメッセージ(「mort de rire」)は、英語のチャット用語チャットメッセージ(「LOL」)の変換された翻訳の一
例である。
【0166】
動作920において、CTT制御モジュール202は、ある実施形態に係る機械翻訳されたフランス語のチャットメッセージのさらなる変換処理のために、機械翻訳されたフランス語のチャットメッセージ(「mort de rire」)を変換モジュール208に送信し得る。ここに注記されるように、フランス語の翻訳をさらに改良するためのさらなる変換処理のために、機械翻訳されたテキストが送信され得る。たとえば、当初の英語のチャットメッセージが英語のチャット用語を含んでいた場合、追加的な変換処理は可能な範囲でフランス語のチャット用語を追加することができる。したがって、動作922において、変換モジュール208のチャット用語モジュール302は、機械翻訳されたフランス語のチャットメッセージ(「mort de rire」)を変換されたフランス語のチャットメッセージ(「MDR」)に変換してもよく、変換されたフランス語のチャットメッセージをさらなる処理
のためにCTT制御モジュール202に戻してもよい。
【0167】
最終的に、動作924において、CTT制御モジュール202は、対応するフランス語のチャットメッセージ(「MDR」)を第2のチャットクライアントシステム104−2に
伝送することを支援し得る(たとえばCTTシステム114は、伝送のために、対応するフランス語のチャットメッセージをチャットホストシステム112に送信する)。加えて、動作926において、CTT制御モジュール202は、当初の英語のチャットメッセージ(「LOL」)と翻訳されたフランス語のチャットメッセージ(「MDR」)との間の変換された翻訳の翻訳マッピングを翻訳データストア210に格納し得る。一旦マッピングが翻訳データストア210に格納されると、たとえば
図8に例示されるように、将来の翻訳を高速化するために翻訳エントリを格納するのに用いられ得る。ここに注記されるように、翻訳データストア210は、変換された翻訳および変換されていない翻訳のマッピングを格納し得る。
【0168】
いくつかの実施形態について、CTT制御モジュール202は、方法900の動作中に判断された相当する(変換された、および変換されていない)翻訳マッピングも格納し得る。ある実施形態について、翻訳マッピングは、当初は翻訳データストア210になかったチャットメッセージ(たとえば動作904について示されたチャットメッセージ、および動作912について示されたチャットメッセージ)と、翻訳データストア210のルッ
クアップ後に続く動作中に判断された対応するメッセージとの間のものであり得る(たとえば、変換モジュール208および/または翻訳モジュール116を介した、結果を戻さない翻訳データストア210に対する照会と、照会後に判断された対応するチャットメッセージとの間のマッピング)。
【0169】
たとえば、
図9に示されるように、CTT制御モジュール202は、当初の英語のチャットメッセージ(動作904における「LOL」、および動作912における変換された英
語のチャットメッセージ(「laugh out loud」)(両方とも翻訳データストア210からCTT制御モジュール202が(それぞれ動作906および914において)結果を受信しないことになる))について、翻訳データストア210に照会する。しかし、動作916において、CTT制御モジュール202は、変換された英語のメッセージ(「laugh out loud」)を機械翻訳のために機械翻訳モジュール116に最終的に送信し、それに応答して、動作918において機械翻訳されたフランス語のチャットメッセージ(「mort de rire」)を受信する。したがって、動作928において、CTT制御モジュール202は、当初の英語のチャットメッセージ(「LOL」)と機械翻訳されたフランス語のチャット
メッセージ(「mort de rire」)との間の変換された翻訳の翻訳マッピングを翻訳データストア210に格納し得る。同様に、動作930において、CTT制御モジュール202は、変換された英語のチャットメッセージ(「laugh out loud」)と機械翻訳されたフランス語のチャットメッセージ(「mort de rire」)との間の変換された翻訳の翻訳マッピングを翻訳データストア210に格納し得る。その際、方法900が次に当初の英語のチャットメッセージ(「LOL」)または変換された英語のチャットメッセージ(「laugh out
loud」)について翻訳データストア210に照会すると、翻訳データストア210は、
対応する変換された翻訳を提供することになる。
【0170】
図10は、様々な実施形態に係る典型的な多言語通信方法1000の動作を例示するフローチャートである。下記のように、いくつかの実施形態について、方法1000は、チャットクライアントシステム104−1、チャットクライアントシステム104−2、(たとえばチャートサーバ108の)CTTシステム114、および(たとえば翻訳サーバ110の)翻訳モジュール116に関連した動作を行ない得る。特に、
図10は、いくつかの実施形態に係る、テキスト「Who u laughin at?」を含む英語のチャットメッセージ
の、フランス語のチャットメッセージへの翻訳を例示する。
【0171】
図示されるように、動作1002において、第1のチャットクライアントシステム104−1は、第2のチャットクライアントシステム104−2への(たとえばチャットホストシステム112を介した)伝送のために英語のチャットメッセージを送信し得る。英語のチャットメッセージは、翻訳処理のためにCTTシステム114のCTT制御モジュール202に送られ得る。
【0172】
動作1004において、CTT制御モジュール202は、英語のチャットメッセージ(Who u laughin at?)に対応するフランス語の相当するチャットメッセージについて翻訳
データストア210に照会し得る。それに応答して、動作1006において、翻訳データストア210は、照会の失敗をCTT制御モジュール202に戻して、英語のチャットメッセージ(Who u laughin at?)について対応するフランス語のチャットメッセージを翻
訳データストア210が有していないことを示してもよい。そのような場合、動作1008において、CTT制御モジュール202は、ある実施形態に係る変換処理のために、英語のチャットメッセージを変換モジュール208に送信し得る。本明細書に記載されるように、変換モジュール208は、チャットメッセージをさらなる翻訳処理により好適なメッセージに変換するように構成された複数の変換関連モジュール1036を含んでもよい。
【0173】
動作1010において、変換モジュール208のチャット用語モジュール302は、英語のチャットメッセージ(Who u laughin at?)を変換された英語のチャットメッセージ
(Who you laughin at?)に変換し、変換された英語のチャットメッセージを、スペルチ
ェックモジュール312などの、さらなる処理のための変換モジュール208の追加モジュールに渡してもよい。
【0174】
本明細書において述べたように、チャット用語モジュール302を含む変換モジュール208の様々なモジュールは、チャットメッセージ中の1つ以上の単語または句を識別し、かつ識別された単語または句のための置換単語または句を提案するように構成され得る。したがって当業者は、いくつかの実施形態について、変換モジュール208のモジュールによって行なわれた/提案された変換は、チャットメッセージの単語から句への変換または句から句への変換を伴い得ることを認識するであろう。たとえば、動作1010において、チャット用語モジュール302は、場合によっては変換中に「who u」という句を
「who are you」に置換すること/置換を提案する(その後、「laughin」という単語を「laughing」に置換する/置換を提案する)ことによって、英語のチャットメッセージ(「Who u laughin at?」)を、変換された英語のチャットメッセージ(「Who are you laughing at?」)に代替的に変換し得る。その際、チャット用語モジュール302などの変換
モジュール208の様々なモジュールは、場合によっては変換モジュール208中の別個のモジュールが文法の向上を実現する必要性をなくしつつ、それぞれの変換に対する文法的な向上をもたらし得る。
【0175】
いくつかの実施形態について、変換された英語のチャットメッセージが変換モジュール208の追加モジュールに渡される前に、チャット用語モジュール302は、変換された英語のチャットメッセージを動作1010においてCTT制御モジュール202に渡し得る。次に、CTT制御モジュール202は、変換された英語のチャットメッセージ(「Who you laughin at?」)に対応するフランス語の相当するチャットメッセージについて(
動作1012において)翻訳データストア210に照会し得る。それに応答して、動作1014において、翻訳データストア210は、照会の失敗をCTT制御モジュール202に戻して、変換された英語のチャットメッセージ(「Who you laughin at?」)について
対応するフランス語のチャットメッセージを翻訳データストア210が有していないことを示してもよい。
【0176】
動作1016において、スペルチェックモジュール312は、変換された英語のチャットメッセージ(「Who you laughin at?」)に対して動作1018においてスペルチェッ
ク処理を行ない得る。スペルチェック処理中に、スペルチェックモジュール312は、変換された英語のチャットメッセージを訂正された英語のチャットメッセージ(「Who you laughing at?」)に訂正してもよく、訂正された英語のチャットメッセージをCTT制御モジュール202に戻してもよい。当業者は、いくつかの実施形態について、訂正された英語のチャットメッセージは、変換された英語のチャットメッセージがCTT制御モジュール202に戻される前に、変換モジュール208の追加モジュールによって処理され得ることを認識するであろう。
【0177】
動作1020において、CTT制御モジュール202は、訂正された英語のチャットメッセージ(「Who you laughing at?」)に対応するフランス語の相当するチャットメッセージについて翻訳データストア210に照会し得る。それに応答して、動作1022において、翻訳データストア210は、照会の失敗をCTT制御モジュール202に戻して、訂正された英語のチャットメッセージ(「Who you laughing at?」)について対応するフランス語のチャットメッセージを翻訳データストア210が有していないことを示してもよい。そのような場合、動作1024において、CTT制御モジュール202は、ある実施形態に係る機械翻訳処理のために、訂正された英語のチャットメッセージを翻訳モジュ
ール116に送信し得る。
【0178】
動作1026において、翻訳モジュール116は、訂正された英語のチャットメッセージに対応する機械翻訳されたフランス語のチャットメッセージ(「Qui te fait rire?」
)を戻し得る。動作1028において、CTT制御モジュール202は、ある実施形態に係る機械翻訳されたフランス語のチャットメッセージのさらなる変換処理のために、機械翻訳されたフランス語のチャットメッセージ(「Qui te fait rire?」)を変換モジュー
ル208に送信し得る。
【0179】
ここに注記されるように、機械翻訳されたテキストは、テキストの翻訳をさらに改良するためのさらなる変換処理のために送信され得る。たとえば、当初の英語のチャットメッセージが英語のチャット用語を含んでいた場合、追加的な変換処理は可能な範囲でフランス語のチャット用語を追加することができる。動作1030において、変換モジュール208は、変更されていない機械翻訳されたフランス語のチャットメッセージ(「Qui te fait rire?」)をさらなる処理のためにCTT制御モジュール202に戻し得る(たとえ
ば変換モジュール208のモジュールが機械翻訳されたフランス語のチャットメッセージにいずれの変更も適用しない場合)。
【0180】
動作1032において、CTT制御モジュール202は、機械翻訳されたフランス語のチャットメッセージ(「Qui te fait rire?」)を第2のチャットクライアントシステム
104−2に伝送することを支援し得る(たとえばCTTシステム114は、伝送のために、対応するフランス語のチャットメッセージをチャットホストシステム112に送信する)。加えて、動作1034において、CTT制御モジュール202は、当初の英語のチャットメッセージ(「Who u laughin at?」)と翻訳されたフランス語のチャットメッセ
ージ(「Qui te fait rire?」)との間の翻訳マッピングを翻訳データストア210に格
納し得る。本明細書に記載されるように、追加的な動作(図示せず)において、CTT制御モジュール202は、翻訳データストア210に対する以前に失敗した照会とそれらの照会後に判断された対応するメッセージとに基づく相当する翻訳マッピングも翻訳データストア210に格納し得る(たとえば
図9の動作928および930と同様)。
【0181】
いくつかの実施形態によれば、変換モジュール208によって行なわれる変換動作は、ある変換動作を並行して行なうことを含み、ある変換動作を連続して行ない得る。変換動作が並列にかつ連続して行なわれる順序は、様々な実施形態間で変動し得る。本明細書に記載されるように、変換動作が並行して行なわれる場合、いくつかの実施形態は、さらなる処理のためにどの変換されたメッセージがどの先例に従って選択されるかを決定する選択の優先順位を採用し得る。
【0182】
図11は、様々な実施形態に係る典型的な多言語通信方法1100の動作を例示するフローチャートである。下記のように、いくつかの実施形態について、方法1100は、チャットクライアントシステム104−1、チャットクライアントシステム104−2、(たとえばチャートサーバ108の)CTTシステム114、および(たとえば翻訳サーバ110の)翻訳モジュール116に関連した動作を行ない得る。特に、
図11は、いくつかの実施形態に係る、並行な変換動作による「Who u laughin at?」というテキストを含
む英語のチャットメッセージの、フランス語のチャットメッセージへの翻訳を例示する。
【0183】
図示されるように、動作1102において、第1のチャットクライアントシステム104−1は、第2のチャットクライアントシステム104−2への(たとえばチャットホストシステム112を介した)伝送のために英語のチャットメッセージを送信し得る。英語のチャットメッセージは、翻訳処理のためにCTTシステム114のCTT制御モジュール202に送られ得る。
【0184】
動作1104において、CTT制御モジュール202は、英語のチャットメッセージ(Who u laughin at?)に対応するフランス語の相当するチャットメッセージについて翻訳
データストア210に照会し得る。それに応答して、動作1106において、翻訳データストア210は、照会の失敗をCTT制御モジュール202に戻して、英語のチャットメッセージ(Who u laughin at?)について対応するフランス語のチャットメッセージを翻
訳データストア210が有していないことを示してもよい。
【0185】
そのような場合、CTT制御モジュール202は、ある実施形態に係る英語のチャットメッセージを、変換処理のために変換モジュール208に送信し得る。本明細書に記載されるように、変換モジュール208は、チャットメッセージをさらなる翻訳処理により好適なメッセージに変換するように構成された複数の変換関連モジュール1130を含み得る。
図11に示されるように、動作1108中に、CTT制御モジュール202は、英語のチャットメッセージ(「Who u laughin at?」)を変換モジュール208の2つ以上の
変換関連モジュール1130に並行して送信し得る。加えて、動作1108中に、CTT制御モジュール202は、変換関連モジュール1130からの結果を並行して受信し、変換結果に基づいて翻訳データストア210に照会を並行して送信し得る。
【0186】
したがって、動作1110aにおいて、CTT制御モジュール202は、英語のチャットメッセージ(「Who u laughin at?」)を変換処理のためにチャット用語モジュール3
02に送信し得る。並行して、動作1110bにおいて、CTT制御モジュール202は、英語のチャットメッセージ(「Who u laughin at?」)を変換処理のためにスペルチェ
ックモジュール312に送信し得る。その後、CTT制御モジュール202は、動作1112aにおいて第1の変換された英語のチャットメッセージ(「Who you laughin at?」
)をチャット用語モジュール302から受信し得る一方、動作1112bにおいて、CTT制御モジュール202は、第2の変換された英語のチャットメッセージ(「Who u laughin at?」)をスペルチェックモジュール312から受信し得る。それぞれの変換処理時
間に依存して、チャット用語モジュール302、スペルチェックモジュール312および他の変換関連モジュール1130は、連続して、または互いに並行してCTT制御モジュール202に応答し得る。
【0187】
その後、動作1114aにおいて、CTT制御モジュール202は、第1の変換された英語のチャットメッセージ(「Who you laughin at?」)に対応するフランス語の相当す
るチャットメッセージについて翻訳データストア210に照会し得る。動作1114bにおいて、CTT制御モジュール202は、第2の変換された英語のチャットメッセージ(「Who u laughing at?」)に対応するフランス語の相当するチャットメッセージについて翻訳データストア210に照会し得る。いくつかの実施形態について、動作1114aおよび1114b中に、CTT制御モジュール202は、連続してまたは並行して翻訳データストア210に照会し得る。いくつかの実施形態では、照会のタイミングは、変換モジュール208の変換関連モジュール1130がいつそれぞれの応答を戻すかに依存し得る。
図11に示されるように、翻訳データストア210は、動作1116aおよび1116bにおいて、照会について照会失敗(たとえば<失敗>)を戻し得る。
【0188】
最終的に、CTT制御モジュール202は、並行動作1108に起因する2つ以上のメッセージから、1つの変換されたメッセージをさらなる処理のために選択し得る。変換関連モジュール1130のうち1つのみが変換されたメッセージをもたらす場合、CTT制御モジュール202は、その特定の変換されたメッセージをさらなる処理のために選択し得る。ここに注記されるように、CTT制御モジュール202は、選択の優先順位に基づいて変換されたメッセージを選択し得る。選択の優先順位は、実施形態によって選択された変換/翻訳手順に従って決定され得る。いくつかの実施形態について、選択の優先順位
は、変換されたメッセージが最も正式なコンテンツを有するか、変換されたメッセージが最多の変換を有するか、または変換されたメッセージが機械翻訳に好適な変換されたメッセージを生成する可能性が高いことで知られる変換関連モジュールに起因するかどうかに基づき得る。
【0189】
変換されたメッセージが選択されると、動作1118において、CTT制御モジュール202は、ある実施形態に係る機械翻訳処理のために、変換された英語のチャットメッセージを翻訳モジュール116に送信し得る。たとえば、
図11に示されるように、CTT制御モジュール202は、翻訳モジュール116に送信するために、チャット用語モジュール302によって生成された第1の変換された英語のチャットメッセージ(「Who you laughin at?」)を選択し得る。
【0190】
動作1120において、翻訳モジュール116は、(ミススペルされた単語「laughin
」を含むにもかかわらず)第1の変換された英語のチャットメッセージに対応する機械翻訳されたフランス語のチャットメッセージ(「Qui te fait rire?」)を戻し得る。動作
1122において、CTT制御モジュール202は、ある実施形態に係る機械翻訳されたフランス語のチャットメッセージのさらなる変換処理のために、機械翻訳されたフランス語のチャットメッセージ(「Qui te fait rire?」)を変換モジュール208に送信し得
る。
【0191】
ここに注記されるように、機械翻訳されたテキストは、テキストの翻訳をさらに改良するためのさらなる変換処理のために送信され得る。たとえば、当初の英語のチャットメッセージが英語のチャット用語を含んでいた場合、追加的な変換処理は可能な範囲でフランス語のチャット用語を追加することができる。動作1124において、変換モジュール208は、変更されていない機械翻訳されたフランス語のチャットメッセージ(「Qui te fait rire?」)をさらなる処理のためにCTT制御モジュール202に戻し得る(たとえ
ば、変換モジュール208のモジュールが機械翻訳されたフランス語のチャットメッセージにいずれの変更も適用しない場合)。
【0192】
動作1126において、CTT制御モジュール202は、機械翻訳されたフランス語のチャットメッセージ(「Qui te fait rire?」)を第2のチャットクライアントシステム
104−2に伝送することを支援し得る(たとえばCTTシステム114は、伝送のために、対応するフランス語のチャットメッセージをチャットホストシステム112に送信する)。加えて、動作1128において、CTT制御モジュール202は、当初の英語のチャットメッセージ(「Who u laughin at?」)と翻訳されたフランス語のチャットメッセ
ージ(「Qui te fait rire?」)との間の翻訳マッピングを翻訳データストア210に格
納し得る。本明細書に記載されるように、追加的な動作(図示せず)において、CTT制御モジュール202は、翻訳データストア210に対する以前に失敗した照会とそれらの照会後に判断された対応するメッセージとに基づく相当する翻訳マッピングも翻訳データストア210に格納し得る(たとえば
図9の動作928および930と同様)。
【0193】
いくつかの実施形態について、変換動作は、ハイブリッドな直列/並列配置で行なわれてもよく、それによっていくつかの変換動作が並行して行なわれ、他の変換動作が連続して行なわれる。たとえば、
図11に示されるように、英語のチャットメッセージ(「Who u laughin at?」)が動作1110aおよび1110bにおいてチャット用語モジュール
302およびスペルチェックモジュール312に並行して送信される。その後、結果として得られた変換されたメッセージのうち一方が(たとえば選択の優先順位に基づいて)選択されると、変換モジュール208の他の変換関連モジュール1130(たとえば頭字語モジュール304、固有名詞モジュール306および普通名詞モジュール308)は、選択された変換されたメッセージに対して並行して動作し得る。
【0194】
図12は、典型的なデジタル装置1200のブロック図である。デジタル装置1200は、バス1214に通信可能に結合されたプロセッサ1202、メモリシステム1204、格納システム1206、通信ネットワークインターフェイス1208、I/Oインターフェイス1210、およびディスプレイインターフェイス1212を含む。プロセッサ1202は、実行可能命令(たとえばプログラム)を実行するように構成される。いくつかの実施形態では、プロセッサ1202は、実行可能命令を処理することができる回路系またはいずれかのプロセッサを含む。
【0195】
メモリシステム1204は、データを格納するように構成されたいずれかのメモリである。メモリシステム1204のいくつかの例は、RAMまたはROMなどの記憶デバイスである。メモリシステム1204は、ramキャッシュを含むことができる。様々な実施形態において、データがメモリシステム1204内に格納される。メモリシステム1204内のデータは、クリアされても、最終的に格納システム1206に移動されてもよい。
【0196】
格納システム1206は、データを検索し格納するように構成されたいずれかの記憶装置である。格納システム1206のいくつかの例は、フラッシュドライブ、ハードドライブ、光ドライブ、および/または磁気テープである。いくつかの実施形態において、デジタル装置1200は、RAMの形態のメモリシステム1204と、フラッシュデータの形態の格納システム1206とを含む。メモリシステム1204および格納システム1206の両方は、プロセッサ1202を含むコンピュータプロセッサによって実行可能な命令またはプログラムを格納し得るコンピュータ読取り可能な媒体を含む。
【0197】
通信ネットワークインターフェイス(com.ネットワークインターフェイス)1208は、リンク1216を介してネットワーク(たとえばコンピュータネットワーク106)に結合されることができる。通信ネットワークインターフェイス1208は、たとえばイーサネット(登録商標)接続、直列接続、並列接続、またはATA接続による通信をサポートし得る。通信ネットワークインターフェイス1208は、無線通信(たとえば802.11a/b/g/n,WiMax(登録商標))もサポートし得る。通信ネットワークインターフェイス1208が多くの有線および無線規格をサポートすることができることは当業者にとって明らかであろう。
【0198】
任意の入出力(I/O)インターフェイス1210は、ユーザからの入力を受信し、データを出力するいずれかの装置である。任意のディスプレイインターフェイス1212は、グラフィックスおよびデータをディスプレイに出力するように構成されたいずれかの装置である。一例では、ディスプレイインターフェイス1212はグラフィックスアダプタである。
【0199】
デジタル装置1200のハードウェア要素が
図12に表されたものに限定されないことが当業者によって認識されるであろう。デジタル装置1200は、図示されたものより多いかまたは少ないハードウェア要素を含んでもよい。さらに、ハードウェア要素は機能を共有し、それでもなお、本明細書に記載される様々な実施形態内にあり得る。一例では、符号化および/または復号がプロセッサ1202および/またはGPU(つまりNvidia(登録商標))上に配置されたコプロセッサによって行なわれ得る。
【0200】
上記の機能およびコンポーネントは、コンピュータ読取り可能な媒体などの記録媒体上に格納される命令で構成されることができる。命令はプロセッサによって検索され、実行されることができる。命令のいくつかの例は、ソフトウェア、プログラムコード、およびファームウェアである。記録媒体のいくつかの例は、メモリ装置、テープ、ディスク、集積回路、およびサーバである。命令は、プロセッサによって実行されると、いくつかの実
施形態と一致して動作するようプロセッサを導くように動作可能である。当業者は、命令、プロセッサおよび記録媒体を熟知している。
【0201】
様々な実施形態は、例として本明細書に記載される。様々な変更がなされてもよく、本明細書に提示された発明のより広い範囲から逸脱することなく他の実施形態を用いることができることは当業者にとって明らかであろう。典型的な実施形態に対するこれらおよび他の変形例は、本発明によって包含されるように意図される。
【0202】
図13は、様々な実施形態に係る典型的なユーザフィードバックシステムを例示するブロック図である。例示的な目的のために、
図13において、ユーザフィードバックのための典型的なシステムが、さまざまな実施形態に従った典型的な通信変換および翻訳(CTT)システム1300の一部として示される。たとえば、典型的なユーザフィードバックシステムは、MMOゲームに関連して利用可能なゲームチャットシステム(たとえばゲーム内チャットシステム)を含む、様々な多言語チャットシステムによって採用されるチャット翻訳システムの一部であり得る。典型的なユーザフィードバックシステムの使用により、MMOゲームの様々なプレーヤーは、フィードバック/承認されたフィードバックのためのインセンティブとして場合によってはゲーム内通貨/クレジット/アイテムの見返りに、フラグが立てられた単語または句について、たとえばゲーム内チャットシステムを通じてユーザフィードバックを提供するよう選択し得る。いくつかの実施形態について、典型的なユーザフィードバックシステムおよびその関連するコンポーネントのうちのいくつかまたはすべては、典型的な通信変換および翻訳システム1300とは別個および/または独立し得るということを当業者は認識するであろう。
【0203】
本明細書において使用されるように、「フィードバック」は、場合によっては変換または翻訳についてのフィードバックを要求する照会に応答して、「ユーザフィードバック」または「ユーザフィードバック応答」を指すということが理解されるべきである。さらに、そのユーザフィードバックは、変換についてのユーザフィードバックまたは翻訳についてのユーザフィードバックを含み得るということが理解されるべきである。ユーザフィードバックは、所与の単語または句についての定義を含み得る。当該定義は、(i)所与の単語または句が、第1の言語の所与の単語または句から(同じ)第1の言語の対応する単語または句に変換されることを可能にし、(ii)所与の単語または句が、第1の言語の所与の単語または句から(異なる)第2の言語の対応する単語または句に変換されることを可能にし、これにより単語または句の変換された翻訳を実行し、および/または、(iii)所与の単語または句が第1の言語から第2の言語に翻訳されることを可能にし、これにより単語または句の非変換の翻訳を実行する。本明細書に記載されるように、ユーザフィードバック応答は、翻訳失敗に関連してユーザフィードバックを要求する照会に応答して受け取られ得る。
【0204】
本明細書において使用されるように、「翻訳の失敗」または「翻訳失敗」は、テキストの翻訳の実際の失敗(たとえば、翻訳されたテキストがオリジナルテキストと同一である)か、または、潜在的に翻訳失敗を含んでいるとフラグが立てられるテキスト翻訳(たとえば、翻訳されたテキストを読んでおり、かつ、翻訳されたテキストに疑問の余地があるかまたは当該翻訳されたテキストが正しくない翻訳を含んでいると信じるユーザによってフラグが立てられたテキスト翻訳)を含むということが理解される。
【0205】
図13に示されるように、CTTシステム1300は、通信変換および翻訳(CTT)制御モジュール1302と、通信変換および翻訳(CTT)通信モジュール1304と、言語モジュール1306と、変換モジュール1308と、翻訳データストア1310と、翻訳アプリケーションプログラミングインターフェイス(API)モジュール1312とを含み得る。いくつかの実施形態において、CTT制御モジュール1302、CTT通信
モジュール1304、言語モジュール1306、変換モジュール1308、翻訳データストア1310および翻訳APIモジュール1312は、本明細書に記載されるように、CTTシステム114のコンポーネントと同様であり得る。
【0206】
さらに
図13に示されるように、CTTシステム1300は、翻訳失敗管理モジュール1314と、ユーザフィードバック(UF)照会生成モジュール1316と、ユーザフィードバック(UF)照会オーディエンス選択モジュール1318と、照会/応答付値モジュール1320と、照会アプリケーションプログラムインターフェイス(API)モジュール1322と、応答評価モジュール1324と、翻訳データストア更新モジュール1326と、オーディエンス適性評価モジュール1328と、インセンティブ報酬モジュール1330とを含み得る。
【0207】
翻訳失敗管理モジュール1314は、翻訳失敗(たとえばテキストの第1の言語から第2の言語への翻訳の失敗)の管理を促進するように構成され得る。いくつかの実施形態については、翻訳失敗管理モジュール1314は、システム1300が、チャットセッションの間に第1の言語を使用している第1のユーザからチャットセッションの間に第2の言語を使用している第2のユーザに送信されたチャットメッセージを翻訳することを試みる際に、CTTシステム1300が経験し得る1つ以上の翻訳失敗を扱うように適合され得る。本明細書に記載されるように、CTTシステム1300によって翻訳されるテキストは、チャット用語、略語、口語、およびイディオムなどを含み得るチャットメッセージであり得る。チャットメッセージの変換または翻訳の間に、チャットメッセージのうちのいくつかまたはすべてが翻訳失敗になり得るのは、CTTシステム1300が、チャットメッセージにおけるそれらの失敗を引き起こす部分の変換および/または翻訳をすることができない場合があることによるということが理解されるであろう。
【0208】
翻訳失敗管理モジュール1314によって提供される機能は、テキストの翻訳の失敗がいつ発生したかを自動的に検出することと、テキストのある単語または句がいつ翻訳できないかを自動的に検出することと、翻訳プロセスの後に、実際または潜在的な翻訳エラーを含んでいると、ユーザが「翻訳された」テキストのうちのいくつかまたはすべてにフラグを立てることを可能にすることと、様々なオーディエンスメンバー(たとえばゲーム内チャットシステムを使用するプレーヤーのようなチャットメンバー)からのユーザフィードバックについてどの翻訳失敗が選択されるかを管理することと、翻訳失敗に関連付けられるどの単語または句がユーザフィードバックについて(たとえば、翻訳されるべきテキストにおいて、どれくらい頻繁に当該単語が現れる/使用されるかに基づいて)選択されるかを管理することと、いつ翻訳失敗がもはやユーザフィードバックについての選択に対する候補でなくなったか(たとえば、翻訳失敗に関連付けられる単語または句が選択プールから除去されるか)を管理することとを含み得るがこれらに限定されない。
【0209】
様々な実施形態において、翻訳失敗管理モジュール1314は、オーディエンスメンバーによるユーザフィードバックについて、単語または句の全体的な利用可能性を管理し得る。本明細書において使用されるように、「ユーザフィードバック機会」は、オーディエンスメンバーによるユーザフィードバックについて利用可能な単語または句を含み得る。翻訳失敗管理モジュール1314は、ユーザフィードバックのためのコンピューティングリソースの利用可能性、ユーザフィードバックに関連して与えられたインセンティブ、過去に受け取ったフィードバック応答の品質などといった様々な条件に基づいて1つ以上のユーザフィードバック機会の利用可能性を抑制または一時停止し得る。たとえば、承認されたユーザフィードバック応答に対してインセンティブ(たとえばゲーム内通貨またはゲーム内アイテム)を与え続けることは、当該インセンティブに関係する経済(たとえばゲーム内経済)に対して否定的な影響を与え得るということが判断される場合がある。したがって、いくつかの実施形態は、インセンティブを与えるユーザフィードバック機会の利
用可能性を(一時的に)停止し得るか、または、現在のインセンティブストラテジーが対象の経済(たとえばゲーム内経済)に有害であるとそれらの実施形態が検出すると、当該ユーザフィードバック機会について与えられるインセンティブ(たとえばインセンティブの量またはインセンティブのタイプ)を調節し得る。
【0210】
本明細書に記載されるように、ユーザフィードバックが求められるオーディエンスメンバーは、場合によってはユーザフィードバックプログラムの参加者としてそのようなフィードバックを行なうことを志願したメンバーであるか、および/または、提出したフィードバックが(たとえば、変換または翻訳を定義することにおいて正しい、受け入れられる、または有用であると)承認された場合のインセンティブを見返りにそのようなフィードバックを行なうことを志願したメンバーであり得る。いくつかの実施形態については、本明細書において記載されるユーザフィードバックシステムは、オーディエンスメンバーが、場合によってはゲームシステムにおいて有用なインセンティブ(たとえばゲーム内通貨またはゲーム内アイテム)のためにユーザフィードバック機会に別の態様で参加することを選択するゲームプレーヤーであるオンラインMMOゲームのようなゲームシステムの一部であり得る。このように、ユーザフィードバックシステムは、報酬のために「プレイ」される「ゲーム」であるとゲームオーディエンスメンバーがみなすゲーム機能として提示され得、これにより、ゲーミング環境に本来的である競争をレバレッジする。オーディエンスメンバーの選択に関してさらに多くのことが、UF照会オーディエンス選択モジュール1318に関して記載される。
【0211】
本明細書に記載されるように、通信システムユーザによって、通信されるテキストの翻訳を防げるまたは不正確な翻訳を引き起こすと考えられる単語または句にフラグが立てられ得る。たとえば、オンラインゲームに関連付けられる多言語マルチユーザチャットシステムにおいて、ゲームプレーヤーは、潜在的に翻訳問題または失敗が存在するとして、受け取った全チャットメッセージにフラグを立て得るか、または、チャットメッセージのある部分(たとえばその単語または句)にフラグを立てる。翻訳失敗に関連付けられる単語または句は、たとえば、特殊化された/ドメイン関連の専門用語、略語、頭字語、固有名詞、普通名詞、縮小形、口語の単語または句、および、卑罵的な単語または句を含み得る。さらに、単語または句が翻訳できないものであり、場合によってはより大きな句またはセンテンスの翻訳を防げるものであるとして自動的に検出するシステムまたは方法によって、単語または句にフラグが立てられ得る。
【0212】
翻訳管理モジュール1314は、ユーザフィードバックの対象であるとして単語または句を選択することを担い得、当該選択された単語または句には、第1の言語から第2の言語へのテキストの翻訳の実際または潜在的な失敗に関連付けられるとしてフラグが立てられ得る。翻訳管理モジュール1314は、多くのファクタに基づいて単語または句を選択し得る。これらのファクタのいくつかは、翻訳における当該単語または句の現在の重要性(たとえば単語または句の全体的な用法に基づいた重要性)と、当該単語または句の複雑性(たとえば単語または句の困難性、または、単語または句はどれくらい長く問題であったか)と、ユーザフィードバックを提供するよう選択または志願したユーザの適性(たとえば、ユーザが第2の言語の適性を有する)と、ユーザフィードバックを提供するよう選択/志願したユーザのプレファレンスとを含む。ユーザフィードバックについて単語または句を選択するための他のファクタは、様々な実施形態によって利用されてもよいということを当業者は理解するであろう。
【0213】
様々な実施形態について、ユーザフィードバックを提供するよう選択されたユーザは、そのようなフィードバックを提供することを志願するユーザであり得る。たとえば、関連付けられるユーザプレファレンスを設定することにより、ユーザフィードバックを求めているチャット内システム広告を選択することにより、および/または、選択について利用
可能な1つ以上のユーザフィードバック機会をリストするセクションをブラウズすることにより、ユーザはユーザフィードバックを提供することを選択し得る。
【0214】
本明細書において示されるように、翻訳失敗管理1314は、実際または潜在的な翻訳失敗に関連付けられる特定の単語または句がいつ、もはやオーディエンスメンバーによるユーザフィードバックについての選択に対する候補ではなくなったかを管理し得る。様々な条件によって、翻訳失敗管理1314は、たとえば、ある単語もしくは句に関連して、または、関連付けられる翻訳失敗に関連して、いつ特定の数のフィードバック応答が受け取られたかの判定と、ある単語もしくは句に関連して、または、関連付けられる翻訳失敗に関連して、いつ特定の数の一貫したフィードバック応答が受け取られたかの判定と、求められたユーザフィードバックについての有効な応答として所与のフィードバック応答がいつ承認された(たとえば一意のフィードバック応答の組からの特定の応答が正しい応答としてアドミニストレータによって手動で承認された)かの判定とを含む判定を行い得る。
【0215】
UF照会生成モジュール1316は、ユーザフィードバックについて選択された所与の単語または句について、選択されたオーディエンスメンバーからユーザフィードバックを得るための照会を生成するように構成され得る。本明細書に記載されるように、選択されたオーディエンスメンバーは場合によっては、提出したユーザフィードバックが、正しいと承認された際、受け入れられたフィードバック応答として承認された際、または問題の翻訳を改良するのに有用であると承認された際のインセンティブを見返りにユーザフィードバックを提供することを志願したユーザであり得る。オーディエンスメンバーの選択に関してさらに多くのことが、UF照会オーディエンス選択モジュール1318に関して記載される。
【0216】
いくつかの実施形態について、生成された照会は、選択されたオーディエンスメンバーからの照会応答を受け取る1つ以上の方法を含み得る。たとえば、生成された照会は、生成された照会に対する応答としてオーディエンスメンバーが選択することができる予め規定された応答(本明細書において「セレクトフォーム応答(select-form response)」とも称される)のリストを応答方法として含み得る。別の例において、生成された照会は、生成された照会に対する応答として、オーディエンスメンバーによってフィールドに入力されたテキスト値を受け取るように構成される1つ以上のフィールド(本明細書において「フリーフォーム応答(free-form response)」とも称される)を応答方法として含み得る。他の応答方法は、グラフィカルユーザインターフェイス(GUI)要素、テキスト値またはその何らかの組合せを含み得る。
【0217】
たとえば、生成された照会に含まれる1つ以上の応答方法は、多くのファクタに従い得る。当該多くのファクタはたとえば、オーディエンスメンバーのプレファレンスと、ユーザフィードバックが求められる単語または句の重要性および/または複雑性と、ユーザフィードバックが求められる単語または句について今まで受け取られたフィードバック応答の数と、ユーザフィードバックが求められる単語または句について今まで受け取られた一貫したフィードバック応答の数と、セレクションフォーム応答を作成するのに十分なフリーフォームフィードバック応答が存在するかどうかとを含む。いくつかの実施形態について、生成された照会に応答するオーディエンスメンバーは、生成された照会についての2つ以上の応答方法から選択し得る。
【0218】
さらに、オーディエンスメンバーにユーザフィードバック機会が提供される言語は、多くのファクタに従い得る。当該ファクタはたとえば、当該オーディエンスメンバーのチャット履歴を監視することにより当該オーディエンスメンバーが多言語話者かどうかと、オーディエンスメンバーの言語能力が特定の言語確実性水準に合致または上回るかどうかと
、オーディエンスメンバーがユーザフィードバック機会に参加するために使用しているユーザ装置上の言語設定(たとえばオーディエンスメンバーの装置についてのデフォルトの言語設定)とを含む。たとえば、オーディエンスメンバーの装置のデフォルトの装置言語がドイツ語であり、かつ、オーディエンスメンバーがユーザフィードバック機会に参加するよう選択する場合、生成されてオーディエンスメンバーに送信される照会はドイツ語に基づくことになる(たとえば、英語の単語または句をドイツ語の単語または句に、または、その逆を定義するための照会)。いくつかの実施形態の場合、生成された照会は、(たとえば、生成された照会が特定の言語を特定または要求しない場合に)提出される応答の言語を選択するオプションをオーディエンスメンバーに提供し得、および/または、各応答が場合によっては異なる言語である2つ以上の応答を提供するオプションをオーディエンスメンバーに提供し得る。そのようないくつかの実施形態の場合、オーディエンスメンバーが多言語話者かどうか、および、オーディエンスメンバーのユーザ装置上の言語設定といったような本明細書において論じられる様々な言語ファクタに従って、オーディエンスメンバーには言語応答オプションが提供され得る。
【0219】
UF照会オーディエンス選択モジュール1318は、ユーザフィードバックを求めるオーディエンスメンバーを選択するように構成され得る。いくつかの実施形態において、UF照会オーディエンス選択モジュール1318は、場合によっては(ユーザフィードバックが承認/受け入れられる際に受け取られ得る)インセンティブを見返りにユーザフィードバックを提供することを志願したオーディエンスメンバーのプールからオーディエンスメンバーを選択し得る。本明細書に記載されるように、オーディエンスメンバーは、翻訳に参加することを志願し得、その時には、当該オーディエンスメンバーは、UF照会オーディエンス選択モジュール1318がユーザフィードバックの請求のために選択するオーディエンスメンバーのプールに含まれ得る。いくつかの実施形態において、UF照会オーディエンス選択モジュール1318がオーディエンスメンバーを選択すると、ユーザフィードバックを得るようUF照会生成モジュール1316によって生成された照会が当該オーディエンスメンバーに提供され得る。UF照会生成モジュール1316によって生成された照会は、選択されたオーディエンスメンバーによる参加に利用可能なユーザフィードバックのリストの一部としてUF照会オーディエンス選択モジュール1318によって選択されたオーディエンスメンバーに提供され得る。生成された照会が選択されたオーディエンスメンバーにひとたび提供されると、選択されたオーディエンスメンバーは、(たとえば生成された照会に関連付けられる1つ以上の応答方法により)生成された照会がオーディエンスメンバーに提供されるとともに選択されたオーディエンスメンバーが1つ以上の応答を(たとえば生成された照会とともに含まれる1つ以上の応答方法により)提供することができるユーザフィードバックセッションを開始し得る。
【0220】
実施形態に依存して、オーディエンスメンバーが選択される前に単語または句がユーザフィードバックに選択される場合、当該選択された単語または句(たとえば、選択された単語または句がオーディエンスメンバーの適性またはプレファレンスとマッチするかどうか)に基づいて候補オーディエンスメンバーの組からオーディエンスメンバーが選択され得る。代替的には、ユーザフィードバックについて単語または選択が選択される前にオーディエンスメンバーが選択される場合、選択される単語または句は、選択されているオーディエンスメンバーに従って基づき得る。所与のオーディエンスメンバーの適性は、(たとえば、生成されて所与のオーディエンスメンバーに提供された以前の照会に関連して)当該所与のオーディエンスメンバーによって以前に提供された1つ以上のフィードバック応答および/またはオーディエンスメンバーの1つ以上の言語能力に基づいて判定され得る。オーディエンスメンバーはたとえば、特定の数の承認されたフィードバック応答を達成した場合に、翻訳失敗に関連付けられる1つ以上の単語または句についてユーザフィードバックを提供するのに必要な適性を有すると評価され得る。別の例において、オーディエンスメンバーは、少なくとも、特定の言語について以前に提出されたフィードバック応
答、オーディエンスメンバーのプレファレンス、および/または、当該特定言語の流暢さを示す、オーディエンスメンバーに関係付けられる情報に基づいて、特定の言語における適性を有すると評価され得る。さらに別の例において、以前に不正確または不正であると評価されたフィードバック応答(たとえば意味をなさない応答または捏造された応答)を提出したオーディエンスメンバーは、低い適性を有すると判定され得る。
【0221】
いくつかの実施形態の場合、所与のオーディエンスメンバーがひとたび単語または句に関して応答を提供する(および応答が場合によっては承認される)と、当該所与のオーディエンスメンバーは、同じ単語または句についてユーザフィードバックを提供するために再選択されなくてもよい。同じ単語または句について以前に提出された応答の言語とは異なる言語で所与のオーディエンスメンバーが応答を提供する場合には、ある実施形態はこの制限に対して例外を作り得る。
【0222】
(たとえばフィードバック応答の承認の際に)インセンティブがユーザフィードバックの見返りに提供される場合、様々な実施形態は、時間ベースの割り当て分(たとえばフィードバック応答を提出することについての時間ごと、日ごと、月ごと、年ごとの制限)またはインセンティブ取得割り当て分(たとえばインセンティブベースのユーザフィードバックに対して与えられるゲーム内通貨またはアイテムの制限)といった割り当て分に基づいてオーディエンスメンバーを選択し得る。当該割り当て分は、個々のオーディエンスメンバー、オーディエンスメンバーのグループ、または、その何らかの組合せに関連付けられる。いくつかの実施形態の場合、UF照会オーディエンス選択モジュール1318は、ユーザフィードバックについてのコンピューティングリソースの利用可能性と、ユーザフィードバックに関連して与えられるインセンティブと、過去に受け取られたフィードバック応答の品質などといった様々な条件に基づいて、1人以上のオーディエンスメンバーへのユーザフィードバック機会の利用可能性を抑制または停止し得る。
【0223】
照会/応答(QR: query/response)付値モジュール1320は、照会または照会応答がユーザフィードバックを求めている単語または句に基づいて、照会または照会応答の値または重要性を判定するように構成され得る。照会または照会応答の値を判定する際の様々な実施形態によって考えられるファクタの例は、単語もしくは句の複雑性(たとえば、複雑性が高いほど値がより高い)、変換/翻訳プロセスに対する単語もしくは句の重要性(たとえば、重要性が高いほど値がより高い)、照会もしくは照会応答によって使用される応答方法(たとえばセレクションフォーム応答方法よりも、フリーフォーム応答方法についてより高い値)、単語もしくは句(たとえばチャット用語、略語、または口語)のタイプ、または、含まれる1つ以上の言語を含み得る(たとえば、フランス語の応答を受け取る、英語の単語もしくは句を含む照会が、英語の応答を受け取る、英語の単語もしくは句を含む照会よりも高い値を有する)。いくつかの実施形態において、所与のユーザフィードバックに対して与えられるインセンティブは、照会または照会応答に関連付けられる値に基づき得る。いくつかの実施形態の場合、QR付値モジュール1320は、有益、有用、または正確なユーザフィードバックを求める際に、以前の照会または照会応答の有効性に基づき、照会または照会の応答について値を判定するように構成され得る。したがって、いくつかの実施形態の場合、当該値は、以前の照会または照会応答によって達成されたものの最新の有効性に基づいて動的に調節され得る。ある実施形態において、QR付値モジュール1320は、(たとえばCTTシステム1300の)アドミニストレータまたは別の認定されたユーザが、照会および/または照会応答について、1つ以上のユーザフィードバックに関連して手動で値を割り当てるまたは調節することを可能にし得る。
【0224】
照会APIモジュール1322は、ユーザフィードバック照会を選択されたオーディエンスメンバーに送信すること、および/または、選択されたオーディエンスメンバーから照会応答を受信することを促進するように構成され得る。いくつかの実施形態において、
照会API1322は、選択されたオーディエンスメンバーに利用可能なユーザフィードバック機会のリストを提供し、選択されたオーディエンスメンバーによって選択された1つ以上のユーザフィードバック機会に関する照会を提供し、選択されたオーディエンスメンバーによって選択された1つ以上のユーザフィードバック機会についての応答を受け取り、および/または、今まで承認のために提出された照会応答の現在のステータス(たとえば、承認、拒絶、または承認保留中/承認待ちのステータス)を選択されたオーディエンスメンバーに提供するように適合され得る。いくつかの実施形態の場合、照会API1322は、CTTシステム1300と相互作用するために、場合によっては所与のオーディエンスメンバーによって使用されるチャットクライアントシステムから、所与のオーディエンスメンバーに関連付けられる1つ以上のプレファレンスを取得し得る。本明細書において示されるように、オーディエンスメンバーに関連付けられるプレファレンスは、ユーザフィードバックがオーディエンスメンバーから求められる単語もしくは句の選択を判定し得、および/または、所与の単語または句のユーザフィードバックについて照会を受け取るようオーディエンスメンバーが選択されるかどうかを判定し得る。
【0225】
応答評価モジュール1324は、ユーザフィードバックを得るために生成された照会に関連して提出された照会応答を評価するように構成され得る。いくつかの実施形態の場合、応答評価モジュール1324は、1つ以上のフェーズにおいて照会応答を評価し得る。
【0226】
有効化フェーズの間に、応答評価モジュール1324は、所与の生成された照会について承認または拒絶されたものとして、所与の生成された照会について提出された1つ以上の一意の応答を処置し得る。いくつかの実施形態において、ユーザフィードバックを得るために生成された照会に関連して提出された一意の応答は、一意の応答が当該生成された照会に関連付けられる単語または句について有効であると承認される時まで、または、当該生成された照会に関連付けられる単語または句について無効であると拒絶される時まで、承認保留中と考えられ得る。本明細書において使用されるように、所与の「一意の応答」は、構文において類似しているが必ずしも同一でない(たとえば異なる句読点または間隔)応答の組を含み得る。所与の一意の応答は、2つ以上の応答方法により受け取られ得る。一意の応答は、本明細書において「一意の照会応答」および「一意のユーザフィードバック応答」とも称される。実施形態に依存して、1より多い一意の照会応答は、所与の生成された照会について承認され得る。たとえば、1より多い一意の応答は、求められているユーザフィードバックに関して所与の単語または句を定義していると承認され得る。応答はたとえば、応答(たとえば場合によっては一意の応答のみ)を検討および処置するアドミニストレータなどによって手動で有効にされ得る。付加的または代替的には、応答は、提出された応答を、それらのカウントおよび/または応答カウントに関連付けられるしきい値に基づいて、承認および/または拒絶し得る自動プロセスによって有効にされ得る。いくつかの実施形態において、自動有効化プロセスは、所与の単語または句についてトップの提出された応答をフィルタリングし得、それらのトップの提出された応答を検討および処置のためにアドミニストレータなどに提供し得る。有効化フェーズは、周期的に(たとえば、スケジュールに基づいて)または条件(たとえば、承認保留中の提出された応答の数がしきい値に合致または上回った場合)に基づいて、応答評価モジュール1324によって実行され得る。
【0227】
いくつかの実施形態の場合において、複数の一意のユーザフィードバック応答(たとえば定義)が所与の単語または句について提供される場合、応答評価モジュール1324は、自動的に(および/または手動のアドミニ入力により)、当該複数の一意のユーザフィードバック応答のうちのトップランクの一意のユーザフィードバック応答(たとえば最も一般的な応答)を承認し得るが、当該トップランクの一意のユーザフィードバック応答が統計的に有意である場合にのみこれを行い得る。たとえば、第1の一意のユーザフィードバック応答が所与の単語について26回受け取られ、かつ、第2の一意のユーザフィード
バック応答が同じ所与の単語について24回受け取られた場合、第1の一意のユーザフィードバック応答は、所与の単語についてのトップランクの一意のユーザフィードバック応答であったとしても、所与の単語についての応答として承認され得ない。これは、26回は24回に対して統計的に有意ではないからである。たとえば、第1の一意のユーザフィードバックは、第1の一意のユーザフィードバック応答がトップランクの一意のユーザフィードバック応答のままであり応答カウントが40に到達するまでは選択され得ない。
【0228】
句が同一ではないが性質において類似しており同じ意図を伝え得るとすると、いくつかの実施形態の場合には、句を含む一意のユーザフィードバック応答をグループ化するよう単語エラー率(WER:word error rate)が使用され得る。2つの句について、WER
は、句同士間の類似点を伝えるために、単語の置換、削除および挿入を測定し得る。
【0229】
様々な実施形態の場合において、複数の一意のユーザフィードバック応答(たとえば定義)が所与の句について提供される場合、応答評価モジュール1324は、自動的に(および/または手動アドミニ入力を通じて)トップランクの一意のユーザフィードバック応答を承認し得る。
【0230】
チェックフェーズの間、応答評価モジュール1324は、オーディエンスメンバーによって提出された応答が承認、拒絶、または検証保留中(たとえば承認保留中)として処置されたかどうか判定し得る。いくつかの実施形態の場合、データストアは、所与の単語または句に関連した、オーディエンスメンバーによって提出された一意の応答が所与の単語または句について有効な定義として承認または拒絶されたかどうかのステータスを維持し得る。したがって、チェックフェーズは、所与の単語または句について以前に提出された一意の応答の処置ステータスを維持するデータストアに照会することによって、所与の単語または句について提出された応答の処置を判定し得、当該提出された応答は、提出された応答に対応する一意の応答の処置ステータスを共有する。実施形態に依存して、提出された応答についてのチェックフェーズは、応答が提出された後、直ちにまたはすぐに実行され得る。提出された応答がチェックフェーズの間、まだ検証保留中であると判定される場合、チェックフェーズは、後で、場合によっては有効化フェーズの後で、再実行され得、これにより、同一または同様の提出された応答のステータスが影響される。チェックフェーズの間に判定されたような提出された応答の現在の処置に従って、提出された応答のステータスが更新され得る。本明細書に記載されるように、所与のオーディエンスメンバーによって提出された1つ以上の応答の現在のステータスは、それらの応答について現在のステータスを反映するリストとして提供され得る。応答ステータスに関してさらに多くのことが以下に
図28に関連して論じられる。
【0231】
応答評価モジュール1324の応答の評価は、応答が承認されるかどうかを判定することを含み得る。当該応答は、当該別の人から単語または句についてフィードバックを得るために以前に生成された別の照会に応答して別の人によって提供される少なくとも1つの以前の応答に基づいて承認され得る。応答がひとたび正確に単語または句を定義していると判定されれば、当該応答が承認され得る。
【0232】
翻訳データストア更新モジュール1326は、選択されたオーディエンスメンバーによってユーザフィードバック照会について提出された応答の評価に場合によっては基づいて、(たとえば変換データストア210に格納される)変換または翻訳を更新するように構成され得る。たとえば、応答評価の間に、第1の言語の提出された応答が(同じ)第1の言語の所与の単語について承認された定義であると判定される場合、これにしたがって、当該第1の言語の所与の単語を第1の言語の応答にマッピングする変換が追加または更新され得る。別の例では、応答評価の間に、第2の言語の提出された応答が第1の言語の所与の単語について承認された定義であると判定される場合、これにしたがって、当該第1
の言語の所与の単語を第2の言語の応答にマッピングする変換が追加または更新され得る。変換または翻訳の更新は、チェックフェーズの間またはその後に翻訳データストア更新モジュール1326によって実行され得、提出された応答が承認済になる処置がなされる。
【0233】
オーディエンス適性評価モジュール1328は、正確および/または有用なユーザフィードバック応答を提供するオーディエンスメンバーの能力に関連付けられる確実性のレベルを示し得るオーディエンスメンバーの適性を判定するように構成され得る。本明細書に記載されるように、所与のオーディエンスメンバーの適性は、(たとえば生成されて所与のオーディエンスメンバーに提供された以前の照会に関連して)所与のオーディエンスメンバーによって以前に提供された1つ以上のフィードバック応答、および/または、オーディエンスメンバーの1つ以上の言語能力に基づいて判定され得る。たとえば、オーディエンスメンバーは、特定の数の承認されたフィードバック応答を達成した場合に、翻訳失敗に関連付けられる1つ以上の単語または句についてユーザフィードバックを提供する必要な適性を有すると評価され得る。別の例において、オーディエンスメンバーは、少なくとも、特定の言語について以前に提出されたフィードバック応答、オーディエンスメンバーのプレファレンス、および/または、当該特定言語の流暢さを示す、オーディエンスメンバーに関係付けられる情報に基づいて、特定の言語における適性を有すると評価され得る。さらに別の例において、以前に不正確または不正であると評価されたフィードバック応答(たとえば意味不明な応答)を提出したオーディエンスメンバーは、低い適性を有すると判定され得る。
【0234】
インセンティブ報酬モジュール1330は、ユーザフィードバックについての照会に関連してオーディエンスメンバーによって提出された応答の評価に基づき、インセンティブをオーディエンスメンバーに与えるように構成され得る。本明細書に記載されるように、提出された応答の承認の際、インセンティブがオーディエンスメンバーに与えられ得る。与えられるインセンティブの量またはタイプは、多くのファクタに基づいて決定され得る。当該多くのファクタは、QR付値モジュール1320によって割り当てられる照会または照会応答の値と、照会に応答する際にオーディエンスメンバーによって使用される応答方法と、(たとえば特定の単語または句に関連してまたはインセンティブベースのユーザフィードバックを通じてオーディエンスメンバーまたはすべてのオーディエンスメンバーに)既に与えられたインセンティブの量と、照会の言語または提供される応答の言語と、応答が提出された単語または句のタイプ(たとえばチャット用語、略語または特別のドメイン単語または句)とを含むがこれらに限定されない。与えられるインセンティブは、実際の世界の通貨か、または、その関連する仮想経済の外側で価値(たとえば実際の世界の経済における金銭価値)を有する場合があるかまたは有さない場合もあるゲーム内通貨またはゲーム内アイテムのような仮想通貨を含み得る。いくつかの実施形態の場合、インセンティブは、実際の世界のグッズもしくはサービス、または、関連する金銭価値を有する場合がある仮想のグッズもしくはサービスを含み得る。当業者は、異なる実施形態において、他の形態のインセンティブが与えられてもよいことを認識する。
【0235】
いくつかの実施形態の場合、インセンティブ報酬モジュール1330は、提出された応答の1つ以上が承認された場合、および/または、承認された提出された応答についてオーディエンスメンバーにインセンティブが与えられた場合に、オーディエンスメンバーに通知することを担い得る。様々な実施形態において、インセンティブ報酬モジュール1330は、通知メッセージ(たとえばポップアップメッセージのようなチャット内メッセージ)および/または提出された応答についてステータスのリストへの更新を通じて、インセンティブ報酬をオーディエンスメンバーに通知し得る。
【0236】
当業者は、様々な実施形態の場合、ユーザフィードバックのためのシステムは、
図13
に示されるコンポーネントよりも多いまたは少ないコンポーネントを含んでもよく、
図13に示される各コンポーネントは、各コンポーネントについて記載された動作より多いまたは少ない動作を実行してもよいということを認識するであろう。
【0237】
図14は、様々な実施形態に従った典型的なユーザフィードバッククライアントシステムを例示するブロック図である。例示的な目的のために、
図14において、ユーザフィードバッククライアントシステムは、様々な実施形態に従ったチャットクライアントシステム1400の一部として示される。たとえば、典型的なユーザフィードバッククライアントシステムは、MMOゲームに関連して利用可能であるゲームチャットクライアントシステム(たとえばゲーム内チャットクライアントシステム)の一部であり得る。MMOゲームの様々なプレーヤーは、フィードバックについてのインセンティブとしてゲーム内通貨/クレジット/アイテムを場合によっては見返りに、フラグが立てられた単語または句についてユーザフィードバックを提供することを選択し得る。当業者は、いくつかの実施形態の場合、典型的なシステムユーザフィードバック、その関連するコンポーネントのうちのいくつかまたはすべてが典型的な通信変換および翻訳システム1300と別個であり得るということを認識するであろう。
【0238】
図14に示されるように、チャットクライアントシステム1400は、チャットクライアントコントローラ1402、チャットクライアント通信モジュール1404、およびチャットクライアントグラフィカルユーザインターフェイス(GUI)モジュール1406を含み得る。いくつかの実施形態において、本明細書に記載されるように、チャットクライアントコントローラ1402、チャットクライアント通信モジュール1404およびチャットクライアントGUIモジュール1406は、チャットクライアントシステム104のコンポーネントと同様である。
【0239】
さらに
図14に示されるように、チャットクライアントシステム1400は変換/ユーザフィードバック(UF)照会プレファレンスモジュール1408と、変換/ユーザフィードバック(UF)照会グラフィカルユーザインターフェイス(GUI)モジュール1410とを含む。いくつかの実施形態の場合、UF照会プレファレンスモジュール1408および/またはUF照会GUIモジュール1410は、CTTシステム1300に対するユーザフィードバック相互作用を促進する。チャットクライアントシステム1400のコンテキストにおいて、チャットクライアントシステム1400のチャットユーザは、様々な実施形態のユーザフィードバックシステム(たとえばCTTシステム1300)に対してオーディエンスメンバーであり得る。
【0240】
UF照会プレファレンスモジュール1408は、いくつかの実施形態のユーザフィードバックシステム(たとえばCTTシステム1300)に関連して提供されるユーザフィードバック機能に関して、プレファレンスをプレビューし、定義し、および/または調節するようチャットユーザを管理およびそうでなければ許可するように構成され得る。UF照会プレファレンスモジュール1408によって管理されるプレファレンスの例は、たとえば、ユーザフィードバックに関する言語プレファレンス(たとえばユーザフィードバックが求められる単語または句の言語および/もしくは求められるユーザフィードバックの言語)、ユーザフィードバック照会について好ましい応答方法(たとえばフリーフォーム応答に対するセレクトフォーム応答)、または、好ましい単語または句タイプ(たとえば略語、チャット用語、関連する物理的性質(physics related)、もしくはイディオム)な
どを含み得る。
【0241】
本明細書において使用されるように、セレクトフォーム応答は、あらかじめ定められるとともに、2つ以上のセレクトフォーム応答のリストから選択可能である応答である。実施形態に依存して、セレクトフォーム応答のリストは、適用可能な場合、オーディエンス
メンバーが2つ以上の応答を選択することを可能にし得る。フリーフォーム応答は、オーディエンスメンバーによってフィールドに入力されたテキストベースの値を含む応答(たとえば文字値または文字列値)である。
【0242】
UF照会GUIモジュール1410は、(たとえばCTTシステム1300によって)ユーザフィードバックについて生成されるとともにチャットユーザに提供される照会の提示、当該照会に関連付けられる1つ以上の応答方法の提示、および/または提示された応答方法を通じてチャットユーザから応答を受け取ることをグラフィカルに促進し得る。UF照会GUIモジュール1410はさらに、UF照会プレファレンスモジュール1408を通じてプレファレンスの管理を促進し得る。チャットクライアントシステムにて提示され得るグラフィカルユーザインターフェイスに関してさらに多くのことが
図17〜
図23および
図24〜
図31に関して以下に記載される。
【0243】
当業者は、様々な実施形態の場合、ユーザフィードバックのためのクライアントシステムは、
図14に示されるコンポーネントよりも多いまたは少ないコンポーネントを含んでもよく、
図14に示される各コンポーネントは、各コンポーネントについて記載された動作より多いまたは少ない動作を実行してもよいということを認識するであろう。
【0244】
図15は、様々な実施形態に従ったユーザフィードバックのための典型的な方法1500を例示するフローチャートである。ステップ1502では、翻訳失敗管理モジュール1314は、場合によっては第1の言語から第2の言語へのテキストの変換または翻訳の潜在的失敗を識別し得る。ステップ1504では、翻訳失敗管理モジュール1314はさらに、ユーザフィードバックのために、識別された潜在的失敗から単語または句を選択し得る。ステップ1506では、UF照会オーディエンス選択モジュール1318は、ユーザフィードバックを求めるためにオーディエンスメンバーを選択し得る。ステップ1508では、UF照会生成モジュール1316は、場合によっては選択されたオーディエンスメンバーからユーザフィードバックを得るために照会を生成し得る。ステップ1510では、応答評価モジュール1324は、生成された照会に対する応答を受け取り得る。照会APIモジュール1322は、選択されたオーディエンスメンバーに生成された照会を提供することと、生成された照会に対する応答を受け取ることとを担い得る。ステップ1512では、応答評価モジュール1324は、受け取った応答を評価し得る。ステップ1514では、オーディエンス適性評価モジュール1328は、ステップ1510において提供された応答および/またはステップ1512において実行される際に受け取られた応答の評価に場合によっては基づき、選択されたオーディエンスメンバーの適性を評価し得る。ステップ1516では、インセンティブ報酬モジュール1330は、応答評価に基づいて、選択されたオーディエンスメンバーにインセンティブを与え得る。本明細書において示されるように、応答を評価しそれが承認されると判定する際、インセンティブ報酬モジュール1330は、照会の値および/またはQR付値モジュール1320によって判定されるような照会応答に場合によっては従って、報酬をオーディエンスメンバーに与え得る。ステップ1518では、翻訳データストア更新モジュール1326は、応答評価に基づいて変換または翻訳を更新し得る。本明細書において示されるように、応答を評価しそれが承認されると判定すると、翻訳データストア更新モジュール1326は、照会および提出された照会応答の単語または句に対応する翻訳または変換を更新し得る。
【0245】
図16は、様々な実施形態に従った、ユーザフィードバックシステムのための典型的なデータフロー1600を例示するブロック図である。示されるように、データフロー1600は、チャットクライアントシステム1400、翻訳失敗管理モジュール1314、UF照会生成モジュール1316、UF照会オーディエンス選択モジュール1318、応答評価モジュール1324、翻訳データストア更新モジュール1326、およびインセンティブ報酬モジュール1330を含む。データフロー1600はさらに、未定義単語/句デ
ータストア1602、記録済応答データストア1604、フィードバックオーディエンスデータストア1606、応答承認データストア1608、チャットデータストア1610、および辞書データストア1612を含む。
【0246】
未定義単語/句データストア1602は、翻訳失敗に関連付けられるとともにユーザフィードバックが求められている単語または句を含み得る。未定義単語/句データストア1602は、単語または句と、当該単語または句が使用されるサンプル文(たとえば単語または句のコンテキスト)と、当該単語または句がどれくらい重要かを示す確実性尺度(たとえば単語重要性)と、当該単語または句についてのソース言語と、求められるユーザフィードバックについてのターゲット言語などとを含み得る。いくつかの実施形態において、未定義の単語/句データストア1602における単語または句の単語の重要性は、最初はすべての単語について等しくあり得るが、当該単語または句が出現し問題となるおよび/または翻訳できないと増加する。
【0247】
記録済応答データストア1604は、オーディエンスメンバーから受け取られるとともに、未定義単語/句データストア1602に含まれる単語または句について記録されるユーザフィードバック応答を含み得る。いくつかの実施形態において、ユーザフィードバック応答は、単語または句に関してユーザフィードバックを得るよう生成される照会について受け取られる応答を含む。未定義単語/句データストア1602は、記録されたユーザフィードバック応答と、ユーザフィードバック応答を提出するオーディエンスメンバーについての識別子と、ユーザフィードバック応答が受け取られたおよび/または記録された時についてのタイムスタンプと、記録されたユーザフィードバック応答が承認されるかどうかを示すものと、記録されたユーザフィードバック応答が承認された時についてのタイムスタンプとなどを含み得る。
【0248】
フィードバックオーディエンスデータストア1606は、未定義単語/句データストア1602に含まれる単語または句についてのユーザフィードバックに参加するために選ばれるオーディエンスメンバーについての識別子の組を含み得る。フィードバックオーディエンスデータストア1606は、オーディエンスメンバーについての各識別子と、ユーザフィードバック応答を提供する際のオーディエンスメンバーの一貫性、適性および/または確実性を反映する確実性スコアとを含み得る。
【0249】
応答承認データストア1608は、未定義単語/句データストア1602に含まれる単語または句に関連して受け取られる各一意のユーザフィードバック応答を含み得る。応答承認データストア1608は、各一意のユーザフィードバック応答と、一意のユーザフィードバック応答が、承認された応答(たとえば正しい応答)、拒絶された応答(たとえば不正確な応答)、検討保留中の応答(たとえば検討を必要とする応答)、または他の何らかのステータスを有する応答かどうかを示すものとを含み得る。いくつかの実施形態において、応答承認データストア1608は、オーディエンスメンバーから受け取られるとともに記録済応答データストア1604に記録されたユーザフィードバック応答がいつ承認されたかを判定する際に用いられ得る。
【0250】
いくつかの実施形態に従うと、翻訳失敗管理モジュール1314は、場合によってはチャットデータストア1610によって提供されるチャットログを検討し、かつ、実際または潜在的な翻訳失敗に関連付けられる1つ以上の単語または句を識別するように構成され得る。様々な実施形態において、翻訳失敗管理モジュール1314は、標準的な辞書(たとえばオックスフォード辞書)、ならびに/または、本明細書において記載される実施形態が解析、認識および/もしくは取扱い得る単語もしくは句(たとえばチャット用語の単語もしくは句)の辞書を含み得る辞書データストア1612に定義されたそれらの単語または句を除外するように構成され得る。翻訳失敗管理モジュール1314によって識別さ
れた単語または句は、未定義単語/句データストア1602に追加され得、これにより、それらの追加された単語および句が、選択されたオーディエンスメンバーからのユーザフィードバックについて選択されることを可能にする。
【0251】
翻訳失敗管理モジュール1314は、ユーザフィードバックのために、場合によっては未定義単語/句データストア1602から1つ以上の単語または句を選択するように構成され得る。いくつかの実施形態の場合、翻訳失敗管理モジュール1314は、未定義単語/句データストア1602において最も高い重要性を有すると指定される単語または句の組から選択し得る(たとえば、未定義単語/句データストア1602においてトップ10の重要な単語または句から選択される)。いくつかの実施形態において、翻訳失敗管理モジュール1314は、応答するよう選択するべき(たとえば、オーディエンスメンバーが応答するのに最も自信を感じるユーザフィードバックを選ぶことを可能にする)2つ以上のユーザフィードバックの組がオーディエンスメンバーに提供され得るように、2つ以上の単語または句を選択し得る。未定義単語/句データストア1602からの翻訳失敗管理モジュール1314による選択プロセスは、単語または句の重要性と、未定義単語/句データストア1602における単語または句の時期と、UF照会オーディエンス選択モジュール1318による選択されたオーディエンスメンバーのプレファレンスと、UF照会オーディエンス選択モジュール1318によって選択されたオーディエンスメンバーが、選択される単語または句に既に応答しているかどうか(たとえば、選択される単語または句について記録済応答データストア1604をチェックすることに基づいて判定)となどに基づき、ランダムであり得る。
【0252】
UF照会オーディエンス選択モジュール1318は、ユーザフィードバックが求められ得る1つ以上のオーディエンスメンバーを場合によってはフィードバックオーディエンスデータストア1606から選択するように構成され得る。本明細書に記載されるように、ユーザフィードバックは、場合によってはチャットデータストア1610から翻訳失敗管理モジュール1314によって選択された単語または句について求められ得る。フィードバックオーディエンスデータストア1606からのオーディエンスメンバーの選択は、オーディエンスメンバーに関連付けられる適性レベルに依存し得る。
【0253】
UF照会生成モジュール1316は、ユーザフィードバックのために、場合によっては未定義単語/句データストア1602から翻訳失敗管理モジュール1314によって選択される単語または句について1つ以上の照会を生成するように構成され得る。示されるように、翻訳失敗管理モジュール1314は、1つ以上の照会が生成される選択された単語または句をUF照会生成モジュール1316に提供し得る。本明細書に記載されるように、UF照会生成モジュール1316は、たとえばUF照会オーディエンス選択モジュール1318によって選択されたオーディエンスメンバーのプレファレンスと、翻訳失敗管理モジュール1314によってユーザフィードバックについて選択された単語または句とを含む照会を生成する場合に、多くの異なるファクタを考慮し得る。結果として、UF照会生成モジュール1316は、UF照会生成モジュール1316によって生成された1つ以上の照会をチャットクライアントシステム1400に提供し得、翻訳失敗管理モジュール1314によって選択および提供された各単語について異なる照会を生成し得た。
【0254】
結果として、UF照会生成モジュール1316によって生成された1つ以上の照会は、チャットクライアントシステム1400に提供され得、これにより、チャットクライアントシステム1400にてユーザによる選択のために当該提供された照会を提示する。実施形態に依存して、UF照会生成モジュール1316は、生成された照会をチャットクライアントシステムに提供し得るか、または、代替的には、生成された照会をチャットクライアントシステムに提供することを別のコンポーネントが担い得る。生成された照会がひとたびクライアントチャットシステム1400にて選択のために提示されると、クライアン
トチャットシステム1400のユーザは、提示された照会のうちの1つ以上に応答するよう選択し得、チャットクライアントシステム1400によって提供されるそれらの応答が記録済応答データストア1604へ追加(たとえば記録)され得る。
【0255】
応答が記録済応答データストア1604に追加されると、いくつかの実施形態は、追加された応答が応答評価モジュール1324によって評価され得ることをチェックする。本明細書に記載されるように、応答評価モジュール1324は、応答および応答のステータスのチェックおよび処置により応答を評価し得る。
【0256】
図16に示されるように、応答評価モジュール1324は、応答チェックモジュール1614を含んでおり、応答チェックモジュール1614は、ユーザフィードバック応答の評価の間に、ユーザフィードバック応答のステータスチェックを実行するように構成され得る。応答チェックモジュール1614は、記録済応答データストア1604からユーザフィードバック応答を抽出し、かつ、当該抽出されたユーザフィードバック応答に対応する応答承認データストア1608における一意の応答のステータスをチェックすることにより、クライアントチャットシステム1400からのユーザフィードバック応答のステータスをチェックし得る。その際、応答チェックモジュール1614は、所与のユーザフィードバック応答が承認または拒絶されるかどうかを判定し得る。記録済応答データストア1604における抽出されたユーザフィードバック応答の承認ステータスは、応答チェックモジュール1614によって実行された最新のステータスチェックに従って更新され得る。抽出されたユーザフィードバック応答が承認されていると応答チェックモジュール1614が判定する場合、記録済応答データストア1604における当該抽出されたユーザフィードバック応答の承認ステータスが、当該承認を反映するとともに承認ステータスが更新された時についてのタイムスタンプを含むように更新され得る。結果として、抽出されたユーザフィードバック応答について記録済応答データストア1604に反映される承認によって、インセンティブ報酬モジュール1330が、承認されたユーザフィードバック応答を提出したオーディエンスメンバーにインセンティブを与え得る。
【0257】
抽出された翻訳応答のステータスがまだ検討保留中である場合、応答チェックモジュール1614は、抽出されたユーザフィードバック応答のステータスを後で(たとえば所定のスケジュールに従って)再チェックし得る。抽出された翻訳応答のステータスが拒絶である場合、記録済応答データストア1604における抽出されたユーザフィードバック応答の承認ステータスは、拒絶を反映するよう更新され得る。
【0258】
抽出されたユーザフィードバック応答に対応する一意の応答が見つからない場合、抽出されたユーザフィードバック応答は、(たとえばチャットクライアントシステム1400のユーザによって)ユーザフィードバック応答が提供された当該単語または句についての一意の応答として応答承認データストア1608に追加され得る。さらに、抽出されたユーザフィードバック応答が一意の応答として応答承認データストア1608に追加される場合、一意の応答は承認保留中の初期ステータスを有し得、当該承認保留中の初期ステータスは、一意の応答のステータスが手動または自動で(たとえば評価応答モジュール1324を通じて)処置される時までそのままである。
【0259】
図16に示されるように、応答評価モジュール1324はさらに応答有効化部1616を含んでおり、当該応答有効化部1616は、一意のユーザフィードバック応答のステータスを、承認、拒絶、または承認保留中であると処置するように構成され得る。本明細書に記載されるように、ユーザフィードバックを得るために生成された照会に関連して提出された一意のユーザフィードバック応答は、一意のユーザフィードバック応答が、生成された照会に関連付けられる単語もしくは句について有効であるとして承認されるか、または、生成された照会に関連付けられる単語または句について無効であるとして拒絶される
時まで、承認保留中であると考えられ得る。
【0260】
いくつかの実施形態の場合、応答評価モジュール1324は、所与の単語または句がさらなるユーザフィードバックをもはや必要としていない場合を判定するように構成され得る。応答評価モジュール1324は、どれぐらい多くの一意のユーザフィードバック応答が所与の単語または句について承認されているかと、一意かつ承認されたユーザフィードバック応答のカウントは特定のしきい値を満たしたまたは上回ったかどうかといったファクタの例に基づいてこのような判定を行ない得る。所与の単語または句がもはやさらなるユーザフィードバックを必要としていないと判定されると、応答評価モジュール1324は未定義単語/句データストア1602から当該所与の単語または句を除去するように構成され得、これにより、(たとえば翻訳失敗管理モジュール1314によって)ユーザフィードバックについて将来の選択から単語または句を除去する。
【0261】
本明細書に記載されるように、提供されたユーザフィードバック応答が、(たとえばチャットクライアントシステム1400を通じてオーディエンスメンバーによって)ユーザフィードバック応答が提供された単語または句について有効な応答としてひとたび承認されると、インセンティブ報酬モジュール1330は当該オーディエンスメンバーにインセンティブを与え得る。インセンティブ報酬モジュール1330は、記録済応答データストア1604において、最近承認され(たとえば承認ステータスが承認を反映するよう最近更新され)、および/または、インセンティブ報酬モジュール1330が承認されたステータスを有する記録済応答データストア1604における1つ以上のユーザフィードバック応答を識別するのを試みた最後の時から承認された1つ以上のユーザフィードバック応答を識別し得る。インセンティブ報酬モジュール1330は、ユーザフィードバック応答について記録済応答データストア1604に含まれる承認タイムスタンプに基づいて、所与のユーザフィードバック応答が最後に承認された時を判定し得る。いくつかの実施形態の場合、記録済応答データストア1604における翻訳されたフィードバック応答についてインセンティブがひとたび与えられると、当該翻訳されたフィードバック応答は記録済応答データストア1604から除去され得る。代替的には、記録済応答データストア1604における翻訳されたフィードバック応答に対してインセンティブがひとたび与えられると、当該翻訳されたフィードバック応答は、たとえば、インセンティブがいつ与えられたか、与えられたインセンティブの量、与えられたインセンティブのタイプ、オーディエンスメンバーがいつこの報酬について通知を受けたか、および/または、オーディエンスメンバーがどのように与えられたインセンティブについて通知を受けたかを示すよう記録済応答データストア1604において更新され得る。
【0262】
図17は、様々な実施形態に従った、ある単語についてユーザフィードバックを受け取るための典型的なスクリーンショットを示す。特に、
図17は、ユーザフィードバックプロセスを促進するよう、(たとえばチャットクライアントシステム1400を通じて)オーディエンスメンバーに提示され得るGUIの例を表わすスクリーンショット1702、1704および1706を示す。スクリーンショット1702は、翻訳失敗に関連付けられる単語または句についてユーザフィードバックに参加するように1人以上のオーディエンスメンバーに求めるバナー1708の例を提示する。オーディエンスメンバーは、バナー1708を選択することによりユーザフィードバックに参加することを選択し得、これにより、ユーザフィードバックセッションの開始につながり得、および/または、オーディエンスメンバーが参加することを選択することができる利用可能なユーザフィードバック機会のリストにオーディエンスメンバーを導き得る。本明細書に記載されるように、ユーザフィードバック機会は、実際的または潜在的な翻訳失敗に関連付けられる単語または句についてオーディエンスメンバーが定義を提供することを可能にし得る。いくつかの実施形態に従うと、オーディエンスメンバーは、単語または句に関連付けられる利用可能なユーザフィードバック機会のうちの1つを選択し得、次いで、促されると、関連付けられ
る単語または句について定義を提供し得る。
【0263】
スクリーンショット1704は、様々な単語(たとえば「Skrilla」、「Booty」、「Cray」、「Hecka」および「Freshness」)の利用可能なユーザフィードバック機会のリスト1710を提示する。スクリーンショット1706は、単語「Skrilla」についてユーザ
フィードバックを得るためにオーディエンスメンバーに提示された照会1712の例を提供する。示されるように、照会1712は、単語「Skrilla」が使用される典型的なコン
テキスト1714を提供し、さらに、照会1712についてフリーフォーム応答を受け取るように構成されるフィールド1716を提供する。オーディエンスメンバーによってスクリーンショット1704のリスト1710から単語「Skrilla」についてユーザフィー
ドバックが選択されると、オーディエンスメンバーはスクリーンショット1706へ導かれ得る。
【0264】
図18は、様々な実施形態に従ったユーザフィードバックをスキップするための典型的なスクリーンショットを示す。特に、
図18は、ユーザフィードバックプロセスを促進するよう、(たとえばチャットクライアントシステム1400を通じて)オーディエンスメンバーに提示され得るGUIの例を表わすスクリーンショット1802および1804を示す。スクリーンショット1802は、オーディエンスメンバーによる選択に利用可能なユーザフィードバック機会のリスト1806を提示する。示されるように、リスト1806は、リストにあるユーザフィードバック機会の1つ以上をスキップするオプションをオーディエンスメンバーに提供する。
【0265】
スクリーンショット1804は、様々な単語についてユーザフィードバックを得るために、オーディエンスメンバーに提示される照会1808の例を提示する。示されるように、照会1808は、照会1808に対して応答を提供するプロセスをスキップするオプションをオーディエンスメンバーに提供する。ある実施形態は、あるユーザフィードバック機会および/または様々なユーザフィードバック照会をスキップするオプションをオーディエンスメンバーに提供することによって、様々なユーザフィードバック照会に対する不正確な応答および/または捏造された応答を回避し得る。
【0266】
図19は、様々な実施形態に従った、ある句についてユーザフィードバックを受け取るための典型的なスクリーンショットを示す。特に、
図19は、ユーザフィードバックプロセスを促進するよう、(たとえばチャットクライアントシステム1400を通じて)オーディエンスメンバーに提示され得るGUIの例を表わすスクリーンショット1902および1904を示す。スクリーンショット1902は、オーディエンスメンバーによる選択に利用可能なユーザフィードバック機会のリスト1906を提示する。示されるように、様々な単語および句(たとえば「Skrilla」および「Pardon my french」)について利用
可能なユーザフィードバック機会のリスト1906が存在する。
【0267】
スクリーンショット1904は、句「Pardon my french」についてユーザフィードバックを得るためにオーディエンスメンバーに提示された照会1908の例を提供する。示されるように、照会1908は、句「Pardon my french」が使用される典型的なコンテキスト1910を提供し、さらに、照会1910についてフリーフォーム応答を受け取るように構成されるフィールド1912を提供する。オーディエンスメンバーによってスクリーンショット1902のリスト1906から句「Pardon my french」についてユーザフィードバックが選択されると、オーディエンスメンバーはスクリーンショット1904へ導かれ得る。
【0268】
図20は、様々な実施形態に従った、セレクトフォーム応答のリストを通じてユーザフィードバックを受け取るための典型的なスクリーンショットを示す。特に、
図20は、ユ
ーザフィードバックプロセスを促進するよう、(たとえばチャットクライアントシステム1400を通じて)オーディエンスメンバーに提示され得るGUIの例を表わすスクリーンショット2002、2004および2006を示す。スクリーンショット2002は、翻訳失敗に関連付けられる単語または句についてユーザフィードバックに参加するように1人以上のオーディエンスメンバーに求めるバナー2008の例を提示する。オーディエンスメンバーは、バナー2008を選択することによりユーザフィードバックに参加することを選択し得、これにより、ユーザフィードバックセッションの開始につながり得、および/または、オーディエンスメンバーが参加することを選択することができる利用可能なユーザフィードバック機会のリストにオーディエンスメンバーを導き得る。
【0269】
スクリーンショット2004は、単語「Skrilla」についてユーザフィードバックを得
るためにオーディエンスメンバーに提示された照会2010の例を提供する。照会2010にはセレクトフォーム応答2012が含まれており、当該セレクトフォーム応答2012はオーディエンスメンバーが選択することが可能な応答をリスト化している。スクリーンショット2006は、正しい応答「money」がひとたび単語「Skrilla」に選択されると通知2014および2016によって与えられるインセンティブ(たとえば5つのゴールドコイン)を提示する。
【0270】
図21は、様々な実施形態に従った、選択のリストを作成するための例示的なスクリーンショットを示す。
図21において、スクリーンショット2102は、単語「Skrilla」
についてユーザフィードバックを得るためにオーディエンスメンバーに提示された照会2106の例を提供する。示されるように、照会2106は、単語「Skrilla」が使用され
る典型的なコンテキスト2108を提供し、さらに、照会2106についてフリーフォーム応答を受け取るように構成されるフィールド2110を提供する。
【0271】
いくつかの実施形態に従うと、所与の単語または句についてユーザフィードバックを得るために使用されるセレクトフォーム応答方法は、所与の単語または句について集められたフリーフォーム応答から選択された予め規定された応答のリストを含み得る。したがって、様々なオーディエンスメンバーがフィールド2110を通じて単語「Skrilla」につ
いてフリーフォーム応答(たとえば「A lot of money」、「Cash」、「Money」、および
「Really Rich」)を提供すると、スクリーンショット2104に示されるように、収集
された応答は選択したフォーム応答2112のリストを作成するのに有用であり得る。
【0272】
図22は、様々な実施形態に従った典型的なインセンティブ通知を例示するスクリーンショットを示す。
図22において、スクリーンショット2200は、単語「Skrilla」に
ついて「money」の応答の承認を通知するとともに当該承認された応答に対して与えられ
たインセンティブ(たとえばXXXXゴールド)を通知する、オーディエンスメンバーへの通知の例を提示する。スクリーンショット2202は、単語「Skrilla」について「money」の応答の拒絶を通知する、オーディエンスメンバーへの通知の例を提示する。スクリーンショット2204は、応答の承認を通知する、オーディエンスメンバーへのプッシュ通知の例を提示する。
【0273】
図23は、様々な実施形態に従った、翻訳がクライアントチャットシステム間で失敗した場合の例を示すスクリーンショットを示す。
図23において、スクリーンショット2300は、第1のチャットクライアントシステムの典型的なインターフェイスを表わしており、スクリーンショット2302は、第2のチャットクライアントシステムの典型的なインターフェイスを表わす。両方向矢印2304は、第1のチャットクライアントシステムと第2のチャットクライアントシステムとの間のチャット通信を表わす。示されるように、チャットユーザ「Aramis」が第1のチャットクライアントシステムのインターフェイスに英語でチャット通信を入力すると、当該入力されたチャット通信はフランス語に翻訳さ
れてチャットユーザ「tapir」の第2のチャットクライアントシステムのインターフェイ
ス上に提示される。同様に、チャットユーザ「tapir」が第2のチャットクライアントシ
ステムのインターフェイスにフランス語でチャット通信を入力すると、当該入力されたチャット通信は英語に翻訳されてチャットユーザ「Aramis」の第1のチャットクライアントシステムのインターフェイス上に提示される。
【0274】
図23に示されるように、チャットユーザ「Aramis」によって第1のチャットクライアントシステムのインターフェイスに入力されたチャット通信2306(すなわち「Tru dat bro」)は、チャットユーザ「tapir」の第2のチャットクライアントシステムのインターフェイスへ送信される際に翻訳に失敗している。チャットユーザ「tapir」に提示され
たチャット通信2308(すなわち「Tru dat bro?」)は、チャットユーザ「Aramis」によって入力されたオリジナルのチャット通信を提示し、かつ、このチャット通信がチャットユーザ「Aramis」によって入力されたオリジナルのチャットメッセージであることをチャットユーザに「tapir」に示すことにより、この翻訳失敗を反映する。
【0275】
図23によって示される翻訳失敗は、いくつかの実施形態に従ったユーザフィードバックから利益を得ることができるものであり得る。いくつかの実施形態に従うと、
図23に示される翻訳失敗は、翻訳失敗管理モジュール1314によって識別され得、オリジナルのチャット通信2306からの1つ以上の単語(すなわち「Tru dat bro?」)が、参加オーディエンスメンバーからのユーザフィードバックについて将来の選択のために未定義単語/句データストア1602に追加され得る。たとえば、各々の単語「Tru」、「dat」および「bro」は、各々の将来のユーザフィードバックのために未定義単語/句データスト
ア1602に追加され得る。
【0276】
図24および
図25は、様々な実施形態に従ったユーザフィードバックに利用可能な単語または句の例示的なリストを示すスクリーンショットを示す。
図24において、スクリーンショット2400は、オーディエンスメンバーによる選択に利用可能である単語および句(「Tru」を含む)についてオーディエンスメンバーの選択に利用可能なユーザフィ
ードバック機会のリスト2402を提示する。
図25において、スクリーンショット2500は、オーディエンスメンバーによる選択に利用可能な句についてオーディエンスメンバーの選択に利用可能なユーザフィードバック機会の別のリスト2502を提示する。
図24および
図25の両方において、スクリーンショット2400および2500はゲーム内チャットシステムの部分であり得、これにより、ゲームプレーヤーはある単語または句についてユーザフィードバックを提供し得るとともに、フィードバック応答の承認の際、ゲーム内クレジット(たとえばゲーム内ゴールド)が与えられ得る。
【0277】
図26は、様々な実施形態に従った単語を定義する例を示すスクリーンショットを示す。
図26において、スクリーンショット2600は、単語「Tru」が使用される典型的な
コンテキスト2604を含む照会2602を示し、かつ、照会2602に対するフリーフォーム応答を受け取るように構成されるフィールド2606をさらに提供する。
【0278】
図27は、様々な実施形態に従った、セレクトフォーム応答の典型的なリストを示すスクリーンショットを示す。
図27において、スクリーンショット2700は、単語「nemore」を定義するようオーディエンスメンバーが選択し得る応答のリスト2702を提示する。
【0279】
図28は、様々な実施形態に従って提出された応答についてステータスの典型的なリストを示すスクリーンショットを示す。
図28に示されるように、提出された応答ステータスのリスト2802は、第1の応答2804について保留中ステータスを含み、第2および第3の応答2806および2808について承認ステータスを含む。いくつかの実施形
態について、リスト2802は、たとえば特定の応答がなぜ承認、拒絶、またはまだ検討保留中であるかを含む応答ステータスについてさらなる情報を提供し得る。
【0280】
図29は、様々な実施形態に従った、典型的なインセンティブ通知を示すスクリーンショットを示す。特に、
図29は、実施形態に従ったユーザフィードバックプロセスの間に、句「U still thr」を「You still there?」として正確に定義するために、メンバーに
典型的な通知2902を提示するスクリーンショット2900を提供する。通知は、提供されるユーザフィードバックについてのインセンティブとして、ゲーム内通貨として価値があり得るまたは有用であり得る10個のゴールドピースがユーザに与えられることになることを示す。示されるように、通知はさらにユーザフィードバックのサマリー(すなわち問題の単語または句および提供されるユーザフィードバック応答)を提供する。
【0281】
ある実施形態において、ユーザから得られたフィードバックがプレーヤーの一貫性についてチェックアンドバランスを有する機械学習システムによって自動化される、データ選択のための学習システムが提供される。システムは、プレーヤーから受け取られた対訳文(parallel sentence)を、統計的機械翻訳(SMT)システムを時々再トレーニングす
るために使用され得る対訳コーパス(parallel corpora)に追加する。
【0282】
チャット変換システムは、チャット用語を平易な言い方(plain speak)に変換するシ
ステムであり得るか、または当該システムを含み得る。たとえば、チャット変換は「U r da king」(チャット用語メッセージ)を「You are the king」(平易な言い方のメッセ
ージ)に変換し得る。ある実施形態において、「平易な言い方」とは、チャット用語が優位を占め得る電子チャット環境の外部で通常の個人によって通常話されるおよび/または記述される通常の言語を指す。平易な言い方は、チャット用語よりも文法的である傾向がある。
【0283】
学習システムはさらに、1つの言語を別の言語に翻訳する言語翻訳システムを利用または含み得る。たとえば、言語翻訳は、「How are you doing kind sir」(英語のメッセージ)を「
【0285】
」(スペイン語のメッセージ)に翻訳し得る。
いくつかの実施形態において、「対訳コーパス」は、一方のテキストにおけるラインnが第2の翻訳されたテキストにおけるラインnに対応するように並列に並べられた各言語につき1つのテキストである2つのテキストを意味すると理解される。対訳コーパスはそのようなコンテキストにおける「トレーニングコーパス」とも称される。
【0286】
様々な実施形態において、「機械学習」は、入力データにおけるパターンから学習し得るとともに挙動を検出、変換、または予測するメカニズムを発達し得る教師ありシステム、半教師ありシステム、または教師なしシステムを指すと理解される。
【0287】
一般に、チャット変換システムおよび言語翻訳システムの構築は、適量の構文規則または統計学習のための大量の対訳コーパスを必要とする。本明細書において一般に記載されたシステムおよび方法は、対訳コーパスを使用する信頼性のある統計的チャット変換および言語翻訳システムを利用する。しかしながら、ある状況において、この最初のトレーニングデータセットはその内容および範囲が限定されている場合がある。たとえば、新しいチャット単語は、毎日作成され、チャットルームに追加される。正確かつ信頼性のある変
換および翻訳システムを維持するために、これらの新しいチャット単語はチャット変換トレーニングコーパスに対して補われるべきである。
【0288】
様々な実施形態において、「ボキャブラリにない(OOV:Out of Vocabulary)」(
たとえば所与の語彙集に存在しない単語)である単語を識別するためのシステムおよび方法が提供される。いくつかの実施形態において、
図30を参照して、方法3000はOOV単語を検出および処理するために提供される。ステップ3002では、OVV単語は最初に、CTTシステム114もしくはCTTシステム1300および/またはそれらの1つ以上のモジュールといった翻訳機システムを通じてOVV単語を送信することによって検出される。翻訳機システムからの出力が所与の単語についての入力と同じである場合、翻訳機システムは、当該単語がOOVかもしれないことを示唆する変換可能性の欠如を示す。潜在的なOOV単語としてさらに単語を評価するために、システムおよび方法は、単なるミススペルされた単語ではなく単語が新語であるかどうか判定し得る(ステップ3004)。ミススペルされた単語および新語の両方はOOVとして現われることになる。したがって、スペルチェッカーで修正され得る単語は、OOV単語ではなくミススペルされた単語であると考えられ得る。
【0289】
さらに、チャットに頻繁に現われるOOV単語には一般にOOV単語(たとえば、新しいチャット話語)である傾向がより高い。たとえば、単語が以前のテキストメッセージにおいてユーザによって使用されている場合、そのような以前の使用は、単語がOOV単語である可能性があることを示唆する。いくつかの実施形態において、単語がOOV単語かどうか検出するために、機械学習および言語処理の方法のアンサンブルが並行して使用される(ステップ3006)。
【0290】
付加的または代替的には、OOVがミススペルされた単語ではなく新語である場合の統計的確率を提供するために、ベイジアン確率が計算され得る(ステップ3008)。純粋なチャット用語は、一般に当該チャット用語の前または後に用いられるある単語に続く傾向がある。これと比較して、スペリングエラーは、隣接する単語についてあまり一貫していない分布を有する。先験的および事後的ベイジアン確率(prior and posterior Bayesian probabilities)を計算することにより、語彙集に追加され得る有用なOOV単語を、語彙集に追加されるべきでないスペリングエラーと区別することが補助される。たとえば、句「Wassup, how's it going」を考える。「Wassup」は、標準語彙集に存在しないので、OOV単語と考えられる。しかし、「Wassup」の後にはほとんど常に単語「How's it going」が続くか、または、「Wassup」はしばしば文の初めにて使用される。このパターンまたは一貫した挙動は、ベイジアン確率によって把握される。システムは、ミススペルされた単語を有するがチャット単語を有さないテキストでトレーニングされる。
【0291】
代替的または付加的には、k平均法クラスタリングのような機械学習方法が、新しいチャット単語、ミススペルされた単語またはジャンクのような異なる種類のOOV単語を区別するために使用され得る(ステップ3010)。k平均法クラスタリングは、単語のクラス同士の間の隠れた類似性をもたらす傾向がある。同様のトピックに属する単語は、一緒にクラスタにされる傾向があり、これにより、それらの間の隠れた類似の意味の関係を示す。再び、「Wassup, how's it going」の例を考える。k平均法アルゴリズムを使用して、文のグループをクラスタリングすることにより、「Hi」、「What's up」、「Hello」、「Hi!」などといった挨拶の単語のクラスタにおいてそれらの中に「Wassup」が含まれ
ているというということが明らかになる。対照的に、スペリングエラーはクラスタの縁に位置するか、または、任意の定義されたクラスタにおいて全く位置しないことになる。これらの隠れた関係は、有用なOOV単語をエラーと区別するのを補助する。文がどんな種類のOOV単語(たとえば動詞、名詞または形容詞)を含むか判定するよう文の構文および意味が分析され得る。
【0292】
システムおよび方法は、新しいチャット単語または他のOOV単語を検出すると、当該新しいチャット単語の変換または言語翻訳されたバージョンのチャットを定義するために、当該新しいチャット単語が人間の翻訳者に提示される。その後、新しいチャット単語の変換または翻訳されたバージョンが翻訳語彙集に追加され得、本明細書において記載されたシステムおよび方法によって使用され得る。
【0293】
本明細書に記載されるように、言語間のチャットの人手による翻訳に対してインセンティブが提供される場合、インセンティブ(たとえばゲーム内通貨)を悪用するようユーザが不正にシステムを操作する可能性がある。本明細書において記載されたシステムおよび方法は、不正な提出を検出することができるが人間の翻訳者の能力に一般に寛容である。
【0294】
システムのユーザが翻訳者として振る舞う場合、当該ユーザは1つ以上の単語または文を特定されたターゲット言語に翻訳する。しかしながら、システムを欺く目的で、または、システムの目的を満たすことなくインセンティブを得るために、ユーザが誤った翻訳、不完全な翻訳、または不適当な翻訳を与える場合、ユーザは不正行為を犯している。
【0295】
ある実施形態において、
図31Aを参照して、本明細書において記載されるシステムおよび方法は不正行為検出モジュール3100を利用する。不正行為検出モジュール3100は、新しいトレーニングデータおよび古いトレーニングデータ(たとえば対訳コーパス)の両方をユーザに提示することによって、インセンティブが与えられた翻訳における不正行為を検出する。古いトレーニングデータは、正しい答えが既知である翻訳に対応しており、その一方、新しいトレーニングデータは正しい答えが未知である翻訳に対応している。古いデータに対する新しいデータのパーセンテージは、時間にわたって、ユーザに対して変動され得る。たとえば、最初はより多くの古いデータが示され得、次いで、徐々にそのパーセンテージが減少され得る。
【0296】
いくつかの実施形態において、不正行為の検出は、ユーザから受け取られた古いデータの翻訳の正確性をチェックすることにより行われる。この正確性に基づいて、各ユーザに確実性スコアが割り当てられる。翻訳の正確性における大きな変化もしくは突然の変化、または、一貫して低い正確性は、ユーザにおける不正行為または低い翻訳能力を示す。翻訳者の能力の確実性を確立した後でも、好ましくは、周期的な不正行為チェックのための時間の少なくとも10〜20%に古いデータがランダムに埋め込まれる。
【0297】
この基本構造を使用して、不正行為検出モジュール3100は、教師あり不正行為検出モジュール3102および/または教師なし不正行為検出モジュール3104を含むおよび/または利用し得る。教師あり不正行為検出モジュール3102によると、たとえば、提示された入力文と、得られた翻訳と、既存の真であると分かっている翻訳と、ユーザの現在の確実性スコアと、時間にわたる翻訳者の確実性スコアの変動を示すグラフといったフィールドを有するユーザインターフェイスにおいて、報告ツールが各ユーザからの出力を示し得る。翻訳を検討する際、人間の教師が翻訳を受け入れるかまたは拒絶し得、これによりユーザの確実性スコアを調節し得る。累積的な報告が不正な挙動を示す場合、教師は当該ユーザを除去し得る(ユーザの翻訳権限を取り消し得る)。ユーザの除去またはユーザの翻訳権限の取り消しは翻訳権限モジュール3106を使用して実行され得る。
【0298】
代替的または付加的には、不正行為検出モジュール3100は、教師なし不正行為検出モジュール3104を利用し得る。教師なし不正行為検出モジュール3104によると、翻訳の正確性は、WER(単語エラー率)およびBLEU(機械翻訳を良好な品質の基準翻訳と比較する機械翻訳正確性メトリック)のような様々なメトリックを使用して計算され得る。ユーザ翻訳能力における確実性は、変更または変動(たとえば上昇または下降)
についてチェックされ得る。1人の翻訳者に提示される類似文が、システムを使用する他の独立した翻訳者に提示され得る。翻訳者間の信頼性も計算され得る。たとえば、無作為抽出、ソーシャルネットワーク分析(たとえば2人の翻訳者が社会的につながっていないか、または、以前から関係を有していないかを確認すること)を通じて、かつ、チャットセッションおよび/またはオンラインゲームにおけるユーザ間の繰り返された対話を検出することによって、翻訳者間での共謀が回避され得る。オンラインで(たとえばオンラインゲームまたはチャットセッションにおいて)規則的に一緒に対話する2人のユーザは共謀に携わる可能性がより高くあり得る。いくつかの実施形態において、項目反応理論(すなわち、言語心理学において用いられる理論およびテスト理論)が、翻訳者の能力による翻訳者の確実性の測定を増強するよう使用される。不正行為検出は、インセンティブメカニズムを有する翻訳増強システムにおけて教師なし不正行為検出を行うために、項目反応理論を使用して実行され得る。項目反応理論は、ある期間にわたって一貫性を測定するために翻訳者の正確性がピア(peer)に対しておよび自身に対して測定され得る方法を規定する。この方法により、標準からの逸脱が識別され得る。翻訳者間の信頼性も、ある設定された期間の後に、ある翻訳者に同じ文を再び提示することにより計算され得る。信頼性および翻訳者の確実性における様々なしきい値がセットされ得、翻訳者の確実性がこのようなしきい値を下回るよう低下すれば、当該翻訳者は、翻訳権限モジュール3106を使用してシステムから除去またはブロックされ得る(たとえばユーザの翻訳権限が取り消され得る)。いくつかの実現例において、高い確実性システムからの翻訳は、翻訳対語彙集に追加される。
【0299】
図31Bは、本発明のある実施形態に従った、インセンティブが与えられた翻訳における不正行為を検出する方法3110のフローチャートを含む。当該方法は、古いトレーニングデータおよび新しいトレーニングデータの混合を選択すること(ステップ3112)を含む。古いトレーニングデータは、異なる言語への正しい翻訳が既知である1つ以上の古いテキストメッセージを含む。新しいトレーニングデータは、異なる言語への正しい翻訳が未知である1つ以上の新しいテキストメッセージを含む。複数のそれぞれの要求がユーザのクライアント装置に異なる時間で送信される(ステップ3114)。当該要求は、(i)古いトレーニングデータおよび/または新しいトレーニングデータを翻訳するためのユーザへの要求と、(ii)その翻訳についてのインセンティブとを含む。特定の要求を送った後、特定の要求の古いトレーニングデータについてクライアント装置から翻訳が受け取られる(ステップ3116)。受け取られた翻訳は、古いトレーニングデータについての正しい翻訳と比較される(ステップ3118)。受け取られた翻訳の正確性が当該比較に基づいて判定される(ステップ3120)。次に、翻訳に基づいて、当該ユーザについて確実性スコアが更新される(ステップ3122)。確実性スコアは、ユーザが後で異なる言語へのテキストメッセージの正確な翻訳を提供するであろう可能性を表わす。
【0300】
様々な実施形態において、本明細書において記載されたシステムおよび方法は、音声翻訳または音声認識技術を利用して、グループ音声チャットシステムのユーザのために、1つ言語の可聴音声を別の言語に翻訳する。チャット用語について、音声−テキスト文字起しシステムがテキストへユーザのチャット用語を文字起こしし、その後、このテキストが平易な言い方(たとえば非チャット用語)に変換されて外国語に翻訳されるシステムおよび方法が実現され得る。その後、外国語のチャット用語を作り出すよう最終変換が行われ、その後、外国語のテキスト・トゥ・スピーチシステムを通じてエンドユーザに出力される。当該システムおよび方法は好ましくは、非常に速いデコーダとともに現状技術の音声認識技術および統計的機械翻訳技術を使用する。
【0301】
図32は、異なる言語を話す人々のグループ3202がチャット用語を使用して相互に対話することを可能にするグループチャットシステム3200の概略図である。本明細書に記載されるように、システム3200は、グループチャットシステム3200に参加す
る人々によって話される言語を識別し得る。第1のユーザ3204が第2のユーザ3206に可聴チャット用語メッセージを送信したい場合、第1のユーザ3204は第1の言語(たとえば英語)で可聴チャット用語メッセージ3208をユーザ入力装置(たとえばチャットクライアントシステムにおけるマイクロホン)に入力する。音声認識モジュール3210は、当該可聴チャット用語メッセージを第1の言語のチャット用語テキストメッセージ3212に転換する。変換モジュール3214はチャット用語テキストメッセージ3212を平易な言い方(たとえば非チャット用語)の第1の言語のテキストメッセージ3216に変換するために使用される。次に、翻訳モジュール3218は、当該平易な言い方のテキストメッセージ3216を第2の言語(たとえばフランス語)の対応する平易な言い方のテキストメッセージ3220に翻訳するために使用される。その後、変換モジュール3222が使用されて、当該対応する平易な言い方のテキストメッセージ3220を第2の言語の対応するチャット用語テキストメッセージ3224に変換する。当業者が認識するであろうように、変換モジュール3222は変換モジュール3214と同じであるかまたは変換モジュール3214の部分を形成し得る。その後、テキスト・トゥ・スピーチモジュール3226が使用されて、第2の言語の対応するチャット用語テキストメッセージ3224を対応するチャット用語可聴メッセージ3228に転換する。最後に、出力デバイス(たとえば第2のチャットクライアントシステム上のスピーカー)を使用して、対応するチャット用語可聴メッセージ3228が第2のユーザ3206に送達される。
【0302】
様々な実施形態において、音声認識モジュール3210は、可聴チャット用語テキストメッセージ3208をチャット用語テキストメッセージ3212に転換するために、隠れマルコフモデル、動的タイムワーピング(DTW:dynamic time warping)ベースの音声認識、および/またはニューラルネットワークを利用し得る。同様に、テキスト・トゥ・スピーチモジュール3226は、対応するチャット用語メッセージを対応するチャット用語可聴メッセージに転換するために音声合成を使用し得る。当業者によって理解されるように、音声合成は、連結的合成(concatenative synthesis)(たとえば単位選択合成(unit selection synthesis)、ダイフォン合成(diphone synthesis)および/もしくは分野限定合成(domain-specific synthesis))、フォルマント合成、調音合成(articulatory synthesis)、HMMベースの合成、ならびに/または正弦波合成を利用または含み
得る。
【0303】
そのような音声処理システムを作り出す重要な局面は、処理され得る言語について複数のアクセントおよび方言から音声サンプルを収集することを含む。音声データの性質は、システムが対応する分野に対するシステムの関連性を維持するよう、各言語のチャット用語および平易な言い方のフォーマットを含み得る。本明細書において記載されるインセンティブが与えられるフィードバックメカニズムは、これらのスピーチサンプルを書き起こすために使用され得、当該書き起こされたサンプルは次いで、音声認識モジュール3210および/またはテキスト−スピーチモジュール3226をトレーニングするために使用され得る。疎である場合、分野適応技術がデータポイントを置換するよう用いられ得る。これは、データが疎になる傾向があるチャット用語のスピーチサンプルの場合には必要であり得る。たとえば、ゲーム分野において(たとえばオンラインゲームのために)収集された音声データは、十分に利用可能なデータである平易な言い方データに置き換えられ得る。分野適応は好ましくは、所与の言語でのチャット用語−平易な言い方からの小さな音声変動を管理するルール(たとえば所与の言語でチャット用語から平易な言い方への変換または平易な言い方からチャット用語への変換を管理するルール)を識別することを含む。チャット用語の相当する文章において音声サンプルを有さない平易な言い方の文章は、これらの分野レベルのルールを使用してチャット用語に変換され得る。ユーザフィードバックループは、(たとえば音声認識モジュール3210および/またはテキスト・トゥ・スピーチモジュール3226のための)音響モデルパラメータを、音響モデル分野を限定的にする、したがって、より正確にするレベルにチューニングするよう使用され得る。た
とえば、音声認識モジュール3210が一貫して特定のアクセントに困難性を有する場合、そのアクセントでの様々な単語の付加的な可聴サンプルがシステムに(たとえばユーザによって)提供され得る。これは、音声認識モジュール3210が当該アクセントで話された単語をよりよく認識する方法を学習するのを補助することになる。
【0304】
上述されるように、本明細書において記載されるシステムおよび方法の実施形態は、グループチャット環境からのテキストまたはチャットメッセージを異なる言語に翻訳するために使用される。そのような翻訳されたチャットをアーカイブすることは、異なる言語の非常に多くのテキストがリポジトリに残存することにつながり得る。
【0305】
図33Aを参照して、ある実施形態において、ストレージ要件を低減するとともにユーザによるチャット履歴の検討を容易にするために、チャット履歴がユーザによってブラウズされる際に、チャット履歴モジュール3300がチャット履歴をリアルタイムで翻訳するために使用される。チャット履歴モジュール3300は、様々なユーザからのチャット履歴を格納するためのチャット記憶モジュール3302(たとえばレジスタまたは他の記憶デバイス)を含む。チャット履歴モジュール3300はさらに、テキストメッセージが異なる言語に翻訳される前および/または後にテキストメッセージを変換するチャット履歴変換モジュール3304を含む。たとえば、チャット履歴変換モジュール3304は、チャット用語から正式な言い方または平易な言い方へチャット履歴テキストメッセージのリアルタイム変換を実行し得る。いくつかの実施形態において、チャット履歴変換モジュール3304は、変換モジュール208と同じまたは同様である。チャット履歴モジュール3300はさらに、(たとえば正式な言い方または平易な言い方)を異なる言語(たとえばフランス語から英語)にチャット履歴テキストメッセージのリアルタイム翻訳を実行するよう使用され得るチャット履歴翻訳モジュール3306を含む。チャット履歴翻訳モジュール3306は、言語モジュール206および/または変換データストア210のような、本明細書において記載される他のモジュールまたはコンポーネントであり得るかまたは含み得る。
【0306】
ユーザがひとたびチャット履歴を検討し終えると、チャット履歴モジュール3300によって生成された変換および/または翻訳されたテキストがメモリから削除または除去され得る。これは、システムおよび方法についてストレージ要件を低減する。ユーザが後でチャット履歴を検討したければ、チャット履歴モジュール3300は、必要に応じて、チャット履歴におけるテキストを変換および翻訳するよう再び使用され得る。
【0307】
ある実施形態において、チャット履歴モジュール3300は、リアルタイムでユーザのためのチャット履歴を翻訳する。チャット履歴モジュール3300は、チャットセッションからテキストメッセージの履歴を検討するよう、ユーザから要求を受け取る。チャット履歴モジュール3300は、複数の言語でのテキストメッセージを含むテキストメッセージの履歴をチャット履歴記憶モジュール3302から受け取る。チャット履歴変換モジュール3304およびチャット履歴翻訳モジュール3306は、その後、必要に応じてチャット履歴の最初の部分をユーザによって使用される言語へ変換および/または翻訳するよう使用される。チャット履歴の翻訳された第1の部分を閲覧した後に、ユーザは、チャット履歴の異なる部分を閲覧したい場合がある。その後、チャット履歴モジュール3300は、テキストメッセージの履歴の異なる部分を閲覧する要求をユーザから受け取り得る。その後、チャット履歴変換モジュール3304およびチャット履歴翻訳モジュール3306は、必要に応じて、チャット履歴の異なる部分をユーザによって使用される言語に変換および/または翻訳するよう使用される。チャット履歴モジュール3300は好ましくは、ユーザがチャット履歴をスクロールすると、変換および/または翻訳をリアルタイムに実行する。
【0308】
ある場合において、チャット履歴をスクロールすることは、スケールおよびデータストレージの問題を提示する。チャット履歴の無限スクロールを提供すると、複数のデータベースおよび複数のユーザにわたるデータの高速リアルタイムアクセスの問題が提示される。これは、チャットルームに存在するすべてのユーザから履歴メッセージをフェッチする複数のプロセスを並列に行うことにより行われ得る。これらのメッセージ上の翻訳および関連するチャット変換は、メッセージがデータストレージからフェッチされると、並列に行われ得る。エンドユーザによって実現される結果得られる出力は、チャットの1つのスクリーンから、データベースからのデータルックアップが既に行われた次のスクリーンへのシームレスな遷移の出力である。これは、本明細書において記載されるシステムおよび方法がデータストレージに対して制限を有し得ず、かつ、並列計算が、以前に行なわれたプロセス間で再利用され得るので、無限の数のスクリーンについて継続し得る。
【0309】
図33Bは、本発明のある実施形態に従った、チャット履歴をリアルタイムで翻訳する方法3310のフローチャートである。方法3310は、チャットセッションからのテキストメッセージの履歴を検討するために人から要求を受け取ること(ステップ3312)を含む。履歴は好ましくは、複数の言語によるとともに複数のユーザからのテキストメッセージを含む。少なくとも2つの並列プロセスが実行される(ステップ3314)。各並列プロセスは、(i)チャットセッションのそれぞれのユーザによって生成されるテキストメッセージ(すなわちテキストメッセージの履歴の少なくとも一部を形成するテキストメッセージ)を受け取るまたは選択することと、(ii)テキストメッセージをターゲット言語に翻訳することとを含む。複数の並列プロセスからの翻訳されたテキストメッセージが、ある人のクライアント装置に提供される(ステップ3316)。テキストメッセージの履歴の異なる部分を検討するために当該人から要求が受け取られる(ステップ3318)。ステップ3314および3316は、テキストメッセージの履歴の異なる部分について繰り返される。
【0310】
いくつかの場合において、本明細書において記載されるシステムおよび方法のユーザは、グループチャットまたはゲーミング環境においてある他のユーザと対話することを回避したい場合がある。以前のチャットシステムにおいて、チャットユーザを禁止および沈黙させることは典型的に、チャットサーバのアドミニストレータまたはモデレータによって扱われる。しかしながら、本明細書において記載されるシステムおよび方法の実施形態は、だれがユーザにチャットメッセージおよび/またはチャットコンタクトの招待を送ることができるかについて、ユーザが直接的な制御を有することを可能にする。たとえば、ユーザAは、ユーザAが任意のチャットルームにおいてユーザBからの通信をもう見ないように、および/または、ユーザAがもはやユーザBからパーソナルチャットコンタクトの招待(すなわちの一対一のチャット)を受けないように、ユーザBをブロックすることを許可され得る。
【0311】
様々な実現例において、アライアンスは、ゲームプレイを向上させるためにユニットとして一緒にグループ化することができるゲーム(たとえばマルチプレーヤーのオンラインゲーム)におけるプレーヤーのグループである。各アライアンスは好ましくは、それ自身のためのチャットルームを有しており、当該アライアンスのメンバーは、互いに話すかまたはテキストメッセージを送信することができる。これは、アライアンスチャットルームからあるユーザを時にブロックする必要性を提示する。
【0312】
図34Aは、ある実施形態に従った、ゲームシステムの第1のユーザがゲームシステムの第2のユーザからの通信をブロックすることを可能にするユーザインターフェイス3400のスクリーンショットを含む。示されるように、第1のユーザは(たとえばタッチスクリーンをタップすることによって)管理設定アイコン3402を選択し、これにより、設定ウィンドウ3404が開く。その後、第1のユーザは、設定ウィンドウ3404上の
「アライアンスからブロック」ボタン3406を選択する。第2のユーザからの将来の通信がブロックされることになるのを第1のユーザに通知するようメッセージウィンドウ3408が現われる。第2のユーザは、第1のユーザによってブロックされた他のユーザのリストに追加され得る。第1のユーザは、リストにユーザを追加またはリストからユーザを除去するようこのリストを編集するオプションを有し得る。たとえば、
図34Bを参照して、次にユーザが管理設定アイコン3402を選択する時に、設定ウィンドウ3404は、アライアンスボタン3410からのブロック解除を含み得る。第1のユーザがアライアンスボタン3410からブロック解除を選択する場合、第2のユーザからの将来の通信がブロック解除され得、そのような通信がブロック解除されたことを第1のユーザに通知するようメッセージウィンドウ3412が現われ得る。
【0313】
いくつかの場合において、システムの複雑性は、ブロックとブロック解除とが実行されるスケールによってもたらされるか、または、低減される。従来のシステムにおいて見られるタイムラグの欠点なく、リアルタイムでブロックおよびブロック解除を実行する柔軟性を並列計算が提供し得る。たとえば、並列処理は、テキストメッセージチャットシステムにおけるテキストメッセージを翻訳および/または変換するために使用され得る。別個の並列プロセスは、チャットセッションの各ユーザおよび/またはチャットセッションに使用されている各言語に割り当てられ得る。そのような並列処理は、ユーザをブロックおよびブロック解除するタスクを簡素化し得る。たとえば、別個の並列プロセスは、ユーザがブロックまたはブロック解除されると、それぞれ、チャットシステムから除去または追加され得る。
【0314】
図35は、チャットセッションからユーザをブロックする方法3500のフローチャートであり、方法3500は、オンラインゲームの複数のユーザにテキストメッセージチャットシステムを提供すること(ステップ3502)を含む。テキストメッセージチャットシステムの第2のユーザをブロックするよう要求がテキストメッセージチャットシステムの第1のユーザから受け取られる(ステップ3504)。要求の受信の後、第2のユーザからのテキストメッセージが第1のユーザに対して表示されることを防止する(ステップ3506)。いくつかの場合において、チャットセッションにおけるテキストメッセージは、本明細書において記載されるシステムおよび方法を使用して翻訳および/または変換される。並列プロセスは、テキストメッセージの翻訳および/または変換を実行するために使用され得る。たとえば、別個の並列プロセスが、チャットセッションの各特定のユーザについて、および/または、チャットセッションに含まれる各言語について、テキストメッセージの翻訳および/または変換を扱うよう割り当てられ得る。
【0315】
自動翻訳サービスは、必ずしも正確だとは限らず、あるエラーを修正するために人間の介入から時々利益を得ることがあり得る。いくつかの実現例において、本明細書において記載される翻訳システムおよび方法は、ユーザが翻訳エラーを識別してこれらのエラーを直すよう修正を提供することを可能にする。たとえば、バイリンガルのユーザまたは外国語ユーザ(たとえばオンラインゲームのフランス語のプレーヤー)は、チャットウィンドウを閲覧して、不正確である翻訳(たとえばフランス語への翻訳またはフランス語からの翻訳)を見る場合がある。当該ユーザは、誤った翻訳について修正の提案を提出し得、修正を提出したことについて(たとえばゲーム内通貨または仮想アイテムにより)報酬を与えられ得る。
【0316】
ある実現例において、オリジナルのテキストメッセージおよび対応する翻訳が単一のスクリーン上に表示され、これにより、翻訳に対するフィードバックを即座に行なうよう当該言語に熟達している人に機会を提供する。たとえば、ユーザは翻訳エラーを認識し、修正された翻訳を提出するオプションを選択し得る。その後、ユーザは、修正された翻訳を入力および提出し得、修正された翻訳が承認されると報酬を受け取り得る。修正された翻
訳を提出する際に、ユーザは、オリジナルメッセージのための付加的な修正された翻訳を提出することを防止され得る。したがって、ユーザは、単一の誤った翻訳から複数の報酬を得ることができなくなり得る。
【0317】
いくつかの場合において、システムおよび方法は、オリジナルメッセージがユーザによって正確に入力されなかったので、オリジナルメッセージを翻訳することができない。たとえば、
図36Aは、「Eres el peor!」を表わすオリジナルのスペイン語のメッセージ
3602を示す。このメッセージの英語の自動翻訳3604が、
図36Bに示され、「You are the best!」を表わす。
図36Cおよび
図36Dを参照して、ユーザは、オリジナ
ルメッセージが適切なスペイン語で入力されなかったため翻訳が不正確になったことを認識し得る。このエラーに対応するために、ユーザは、ユーザがオリジナルメッセージについて修正を入力し得る修正ウィンドウ3608が開くよう、「正しい翻訳ボタン」3606を選択し得る。
図36Eおよび
図36Fを参照して、この場合、ユーザは修正ウィンドウ3608に「Ustedes son los mejores!」を入力し、提出ボタン3610を選択する。当該提出が処理されることになることをユーザに通知するよう、確認ウィンドウ3612が現われる。確認ウィンドウ3612を閉じると、ユーザはオリジナルのチャットページに戻る。
【0318】
図37Aおよび
図37Bを参照して、ユーザが他のユーザから受け取られた翻訳修正を検討するのを可能にするユーザインターフェイス3700が提供される。翻訳修正を検討するユーザは、自身の取り組みに対して報酬を与えられ得、自身が受け取る特定タイプの報酬(たとえばオンラインゲームのための仮想グッズまたは通貨)を選択することができ得る。一般に、翻訳修正がユーザによって提出された後、他のユーザが、当該修正がオリジナルの翻訳および他のユーザによって提出された任意の他の翻訳修正よりもよいかどうか決定し得る。ユーザの翻訳が最良の翻訳であると判断されると、そのユーザは賞を受け得、当該ユーザの翻訳は翻訳辞書(たとえば翻訳データストア210)に追加され得る。様々な翻訳を判断することに参加するユーザも報酬を受け取り得る。しかしながら、そのような報酬は、判定者のすべてによって最良に選ばれた翻訳修正を選択するユーザにのみ与えられ得る。
【0319】
一般に、ユーザが翻訳修正の提案を提出することおよび他のユーザの提出物を判断することを可能にすることによって、システムおよび方法は、ユーザが自発的に自由に与えるフィードバックを利用する。このプロセスで収集されたデータは、ひとたび承認されると、翻訳キャッシュエントリを修正するために使用され得、これにより、本明細書において記載されたシステムおよび方法の全体の翻訳能力を向上する。これは、オリジナルメッセージが翻訳のために再び提出される際に、今後は正しい翻訳が示されることを確実にし得る。
【0320】
典型的な実現例において、翻訳修正を提出および/または判断し得る、モノリンガルのユーザとバイリンガルのユーザとの2つのタイプのユーザが存在する。バイリンガルのユーザは一般に、オリジナルの言語の文を理解し、異なる言語でより正確な翻訳を提供することができる。対照的に、モノリンガルのユーザは、オリジナルの言語句を理解し得ないが、それでも(ユーザの装置の言語で提示される)翻訳を検討し、報酬と引き換えに修正を提出し得る。当該2つのタイプのユーザから得られる翻訳は内容が異なる傾向があり、バイリンガルのユーザのほうが一般により正確な翻訳を提供する。システムおよび方法は好ましくは、ユーザがモノリンガルまたはバイリンガルかどうか判定または検出することができ、ユーザのフィードバックはその判定に従って重み付けされ得る。たとえば、ユーザは、システムおよび方法に対して、モノリンガルまたはバイリンガルであると自身を識別することができ得る。
【0321】
ある状況では、ほとんどのユーザがモノリンガルであり、同じ言語(英語)を話す。1つ言語を話す人の供給が大きければ、一般に、その言語について翻訳修正を提出するユーザがより多く存在し、また一般に、その言語への翻訳修正またはその言語からの翻訳修正の需要がより少なくなる。他の言語について翻訳修正の供給の刺激するために、翻訳修正の需要に従ってユーザに報酬が与えられ得る。たとえば、大多数のユーザが1つの言語を話し、かつ、その言語で与えられる翻訳修正の不足はない場合、そのようなユーザは、翻訳修正の提出について、より小さな報酬(たとえば名目量の75%)を受け取り得る。同時に、異なる言語を話す少数のユーザは、その異なる言語の翻訳修正についての需要がより大きいので、より大きな報酬(たとえば名目量の125%)を受け取り得る。
【0322】
ユーザが所与の期間(たとえば1日)の間に修正する翻訳の数は制限されてもよく、制限されなくてもよい。たとえば、修正の提出について報酬が与えられない場合、翻訳修正の数に制限はなくてもよい。他方、そのような提出についてユーザに報酬が与えられる場合、当該期間の間に、ユーザは限られた数の翻訳修正を提出することを許可され得る。そのような制限は、バイリンガルのユーザまたは多数の翻訳修正を提出する傾向があるユーザが過度の報酬を受け取ることにより、基礎をなすゲーム(たとえばマルチプレーヤーのオンラインゲーム)においてフェアでない優位性を得ることを防止し得る。
【0323】
ある場合において、不正確な翻訳に対するフィードバックは、少数のユーザ(たとえば2人または3人のユーザ)のみから受け取られる場合があり、これにより、翻訳提出物の正確性を判定し自動的に報酬を生成することが困難になり得る。たとえば、チャットは連続的なストリームにおいて発生し、多くのユーザは、他のユーザとチャットすることおよび/または基礎をなすゲームをプレイすることにより集中し得、翻訳修正を提出することにはあまり集中しない。さらにユーザは、自身のウィンドウで見るものに基づいて、チャットを選択し得、同じチャットを選択し得るユーザはほとんどいない。したがって、1つより多い翻訳修正が受け取られた場合、修正の提案は、報酬と引き換えに、正しい翻訳に対してコンセンサスを得るために判断するよう他のユーザに利用可能にされ得る。
【0324】
翻訳修正を提出することに対する報酬は、くじシステム(raffle system)に従ってユ
ーザに与えられ得る。そのようなシステムにおいて、すべての提出について報酬が与えられるわけではないが、より多くの修正を提出するユーザが報酬を得る可能性がより高いようにランダムに配付され得る。そのようなアプローチは、あるプレーヤーが、基礎をなすゲームの自身の能力または取り組みではなく、メッセージを翻訳する自身の能力および/または望みにより、他のユーザに対してフェアでない優位性を達成し得る可能性を低減する。
【0325】
ユーザが悪い翻訳を修正することを可能にすることに加えて、ユーザはさらに、誤って検出された言語と、フィルタリングされない卑罵的な言葉と、指定されたエンティティ検出とに関してフィードバックを提出することができ得る。たとえば、オリジナルメッセージおよび翻訳されたメッセージを閲覧すると、ユーザは、自動翻訳システムがオリジナルの言語を不適当に検出したことを認識し得る。その後、ユーザは、可能な報酬と引き換えに、この言語検出の失敗に関してシステムに通知し得る。同様に、ユーザは、メッセージに現われる如何なる卑罵的な言葉に関してもシステムに通知することができ得、これにより、将来のメッセージからのそのような卑罵的な言葉をシステムがフィルタリングまたは削除することを可能にする。ユーザはさらに、会社、ブランド、商標などといった、メッセージに現われる指定されたエンティティについてシステムに通知することができ得る。これは、システムおよび方法が、指定されたエンティティがメッセージに現われるときを認識し、そのようなエンティティが適切に指定および/または識別されることを保証することを可能にし得る。
【0326】
一般に、ユーザによって提出された翻訳修正は、ユーザが正確な修正に対してのみ報酬を与えられることを確実にするよう、注意深い評価を必要とする。これにより、システムの全体の正確性が向上されるとともに、不正な修正を提出することによりユーザが不正行為を行うのを防止する。いくつかの実現例において、翻訳修正の正確性は、ユーザがシステムを悪用するのを防止するよう、単語ベースの特徴、言語のベースの特徴、および他の特徴(たとえば単語アラインメントマッチの特徴)を用いて自動的に評価される。品詞(POS:part of speech)ベースの言語モデルが文法の正確性について文章をチェックするために使用され得る。さらに、何人かのユーザは、文法上正しいがオリジナルメッセージと全く関係がない翻訳修正を提出する場合がある。そのような場合について、単語アラインメントマッチ分析の特徴は有用であり得、ユーザの提出物を承認および/または拒絶するよう周期的なプロセスとして実行され得る。本明細書において記載される翻訳システムおよび方法において、疎のユーザフィードバックを有効にするよう機械学習アプローチが使用され得る。
【0327】
表2は、本発明のある実施形態に従った、ユーザによって提出された翻訳修正の提案の例を示す。これらの例において、ソース言語におけるオリジナルメッセージは「aaa bbb ccc」であり、ターゲット言語の正しい翻訳は「xxx yyy zzz」である。「示された翻訳」というラベル付けされた欄は、本明細書において記載された自動システムによって提案された最初の翻訳の例を含む。
【0329】
表2.ユーザ修正および好ましい結果の例
表2に示されるように、ユーザが正しくかつ向上した翻訳を提出すると、ユーザの提出物は承認されるべきであり、ユーザは適切な報酬を受け取り得る。しかしながら、ユーザ
が低い品質または不正な翻訳(たとえばランダムなメッセージ)を提出すると、当該ユーザの提出物は否認されるべきであり、報酬はユーザに与えられるべきでない。当該システムおよび方法は好ましくは、この表の「ステータス」カラムに示されるようにこのような例を承認または拒絶する。
【0330】
ある実施形態において、オリジナルメッセージの翻訳は、翻訳がオリジナルメッセージについて適切かどうかに従って分類される。当該分類は、翻訳およびオリジナルメッセージから特徴が抽出されるバイナリ分類タスクとして扱われ得る。分類技術は、ユーザによって提出された翻訳修正が正確であることを保証するために使用され得る。たとえば、いくつかの場合において、本明細書において記載される多数派ベースの有効化は、不正確な翻訳につき受け取られ得る少数の応答(たとえば1〜3)により、好適ではない。分類技術はさらに、キャッシュされた変換データに現われるハッシュ衝突(hash collision)を識別および/または対応するように使用され得る。たとえば、データテーブルにおける翻訳エントリの約10%以上は、ハッシュ衝突により破損され得る。
【0331】
図38を参照して、様々な実現例において、翻訳の正確性は、単語ベース特徴モジュール3802、言語ベース特徴モジュール3804、および単語アラインメントモジュール3806を含む翻訳正確性モジュール3800を使用して評価される。単語ベース特徴モジュール3802は、単語カウント、文字カウント、絵文字、数字および/または句読点といった、単語ベースの特徴を評価するために使用される。たとえば、翻訳が正しい場合、オリジナルメッセージにおける単語の数と翻訳の単語の数とは一般にほぼ同じである。したがって、2つのメッセージにおける単語の数がしきい値量より多く異なる場合(たとえば2の係数)、翻訳は、不正確または不正確の可能性が高いと見なされ得る。一例において、メッセージ(たとえば翻訳)のうちの1つにおいて単語の数が、他のメッセージ(たとえばオリジナルメッセージ)における単語の数の1/2(または1/2未満)である場合、単語ベース特徴モジュール3802は、翻訳が不正確であるかまたは不正確である可能性が高いと結論付け得る。
【0332】
翻訳の正確性を評価するために使用され得る別の単語ベースの特徴は、オリジナルメッセージおよび翻訳における文字(たとえば字および数字)の数である。一般に、オリジナルメッセージにおける文字の数がほぼ翻訳における文字の数と同じである場合、翻訳は正確である可能性がより高い。しきい値量は、2つのメッセージにおける文字カウントが著しく異なる場合を判定するよう使用され得る。たとえば、翻訳がオリジナルメッセージの3/2より多い文字を有する場合、単語ベース特徴モジュール3802は、翻訳が不正確かまたは不正確である可能性が高いと結論し得る。
【0333】
翻訳の正確性を評価するために使用され得る別の単語ベースの特徴は、一般にオリジナルメッセージと翻訳との間で変化しないままである絵文字(たとえば日本語の電子メッセージにおいて使用される表意文字またはスマイリー(smiley))のカウントおよび順序である。絵文字は、所与の文においてそれらを検出するのに使用され得るあるユニコードテキスト範囲に該当する傾向がある。このユニコード範囲を使用して、メッセージの両方から絵文字を識別または抽出するために正規表現が使用され得る。たとえば、入力が3つの絵文字を連続的に含んでおり、かつ、その出力がただ1つの絵文字を含んでいる場合、入力と出力との間に相違が示される。絵文字のカウントおよび/または順序が2つのメッセージ間で異なる場合、単語ベース特徴モジュール3802は、翻訳が不正確であるかまたは不正確である可能性が高いと結論し得る。
【0334】
翻訳の正確性を評価するために使用され得る付加的な単語ベースの特徴は、2つのメッセージにおける任意の数字および句読点のカウントである。たとえば、数字および句読点は、存在する場合には、オリジナルメッセージおよび翻訳において識別または抽出され得
、最長共通部分列(LCS:longest common subsequence)の長さは、ソートの後で、それらの間で求められ得る。2つのメッセージの長さの最大値で除算されたこの長さは、この単語ベースの特徴について実数の値を与える。一般に、実数の値は、2つのメッセージにおける重複する数字および句読点のパーセンテージを示すものを提供する。この特定の特徴について、バイナリ値ではなく実数の値を使用してよりよい結果が得られるということを実験結果が示す。たとえば、「I am going to meet you at 4:30 Cya!!」という英語の入力文は、「Je vais vous recontrer a 4:30 Au revoir!!」という等価な出力を有し
得る。句読点および数字を抽出する際、英語バージョンおよびフランス語バージョンの両方について、「4:30!!」が得られる。この場合、LCSは6(単位は文字)であり、英語バージョンおよびフランス語バージョンの中からの長さの最大値は36(単位は文字)である。この単語ベースの特徴について結果得られた実数の値は6/36=0.167である。
【0335】
単語ベースの特徴のみに依存することは、翻訳の正確性の評価に不十分であり得る。たとえば、ユーザは、オリジナルメッセージの各単語がダミーの単語(たとえば「xxx」)と置換される翻訳修正を提出することにより、単語ベースの特徴のうちの少なくともいくつかを欺くことが可能であり得、これにより、オリジナルメッセージにおいて存在する同じ数の単語および文字を有する不正な修正を作り出す。
【0336】
この問題を回避するために、翻訳正確性モジュール3800は、単語ベースの特徴に加えてまたは単語ベースの特徴の代わりに、言語ベースの特徴を評価するよう言語ベース特徴モジュール3804を使用し得る。たとえば、一実施形態では、2つのメッセージにおいて、品詞(POS)(たとえば動詞、名詞、形容詞など)を識別するよう、オリジナルメッセージおよび翻訳に存在する単語は、(たとえばオープンソースのPOSタグ付け機を使用して)タグ付けされる。メッセージにおける各単語は、各言語についてセットされた異なるタグを使用して、異なる数のタグにより、品詞に従ってタグ付けされ得る。たとえば、「The device is easy to use」のサンプル文は、「The_DT device_NP is_VBZ easy_JJ to_TO use_VB」と、POSタグ付け機によってタグ付けされ得、文において各単語
の品詞を示す。この場合、タグは、限定詞(DT)、名詞句(NP)、単数現在形動詞(VBZ)、形容詞(JJ)、To(TO)、また単一動詞(VB)である。この目的についての主な対象のタグは、典型的に動詞であり、その後に形容詞および副詞が続く。
【0337】
ある場合において、オリジナルメッセージおよび翻訳は別々に(たとえばPOSタグ付け機を使用して)タグ付けされ、各メッセージにおいて動詞、形容詞、副詞などの数を識別するよう、各メッセージについて得られるタグがカウントされる。各言語において使用される動詞(たとえば法動詞、不定形動詞、過去形動詞、未来形動詞など)の異なるタイプにより、簡素化された動詞タグVBが、各言語においてすべてのタイプの動詞についてマップを使用して得られ得る。たとえば、英語の動詞品詞タグは、単数動詞タグVBに以下のようにマッピングされ得る。すなわち、’VBD’(動詞,過去形)=>’VB’、’VBG’(動詞,動名詞)=>’VB’、’VBN’(動詞,過去分詞)=>’VB’、’VBP’(動詞,非三人称単数現在)=>’VB’、および’VBZ’(動詞,三人称単数現在)=>’VB’といったようにマッピングされ得る。タグ付きのメッセージにおけるPOSタグは、この簡素化されたPOSタグセットに置換され得る。
【0338】
POSタグを簡素化した後に、動詞タグVBの数は、オリジナルメッセージおよび翻訳の両方においてカウントされ得る。理想的には、各メッセージにおける動詞の数は、同じであるべきであるが、いくつかの例外がある。たとえば、英語の「was sleeping」は、フランス語の「dormais」に翻訳する。英語のPOSタグ付け機は、2つの異なる動詞とし
て「was」および「sleeping」をタグ付し得、その一方、フランス語のPOSタグ付け機
は、単一の動詞として「dormais」にタグ付けし得る。「is」、「was」、および「can」
といった動詞は、英語において助動詞として知られている。他の言語にはこれらの助動詞に相当するものがない場合があり、その代りに、置換として単一の動詞を使用し得る。言語の間での動詞使用のそのような差を考慮して、システムおよび方法は、オリジナルメッセージと翻訳との間で動詞の数の差についてしきい値(たとえば2または3)を使用し得る。たとえば、2つのメッセージにおける動詞の数の間の差が2より大きい場合、言語ベース特徴モジュール3804は、翻訳が不正確かまたは不正確である可能性が高いと考え得る。2であるこのしきい値は、試行錯誤を通じて妥当な結果を生じると分かった。他の品詞(たとえば形容詞および副詞)がカウントされ得、1つ以上の付加的なしきい値を使用して2つのメッセージ同士の間で比較され得る。
【0339】
しかしながら、いくつかの場合において、ユーザは、翻訳についての修正として単純に既存の翻訳をコピーして提出することによってこの翻訳正確性チェックを欺き得る。その場合、当該提出物は、有効な修正として分類されるかもしれないが、ユーザは提出物に対して報酬を与えられ得ない。いくつかの場合に、あるユーザは、有効な修正を作り出して提出するよう、さらに単純に既存の翻訳におけるいくつかの単語の格を変更する場合があり、当該ユーザは報酬に値し、当該提出物に対して報酬を与えられ得る。したがって、いくつかの実施形態において、システムおよび方法は、既存の翻訳とユーザの提出物とが同じかどうか判定する。(たとえば、格と大文字使用を含む)既存の翻訳およびユーザ提出が同じである場合、報酬はユーザに与えられ得ない。
【0340】
ある実施形態において、POSタグチェックは、自動翻訳システムがオリジナルメッセージの言語を正確に識別しなかった場合を識別するよう使用される。たとえば、オリジナルメッセージの言語は、ユーザの翻訳修正が単語カウントチェックをパスする際に、不正確に検出されたが、POSタグチェックにおいて失敗する場合がある。さらに、動詞の数が0に等しい場合、または、すべてのタグが一方のメッセージにおいて名詞であり他方のメッセージにおいてそうでない場合に、不正確な言語検出の可能性がある。たとえば、オリジナルのスペイン語のメッセージは、「
【0342】
」を表し得る。しかしながら、当該言語が英語であると検出されると、英語のPOSタグ付け機は当該メッセージにタグ付けすることができない可能性が高く、デフォルトとしてすべての単語を名詞としてタグ付けし得る。英語のPOSタグ付け機の出力はたとえば以下の通りであり得る。
【0344】
比較として、同じオリジナルメッセージについてのスペイン語のタグ付け機の出力は次のとおりであり得る。
【0346】
タグ「NN」、「RB」および「PPX」は、名詞(単数または複数)、副詞、および所有代名詞をそれぞれ指す。
【0347】
したがって、ある場合において、言語がオリジナルメッセージにおいて適切に識別されたかどうか判定するよう、オリジナルメッセージおよび翻訳の品詞が比較される。一般に、メッセージ(たとえば翻訳)のうちの1つが0でない数の動詞を有するとタグ付けされるとともに他のメッセージ(たとえばオリジナルメッセージ)が動詞を有さないとタグ付けされる場合、言語検出失敗が発生する可能性がより高い。さらに、1つのメッセージにおけるすべての単語が名詞としてタグ付けされる一方、他のメッセージがいくつかのタイプのPOSタグ(たとえば名詞、動詞および形容詞)を有する場合、言語検出失敗の可能性がより高い。
【0348】
様々な実施形態において、翻訳の正確性は、オリジナルメッセージ、および翻訳において固有名詞を識別および検討することにより評価される。一般に、翻訳が正確な場合、固有名詞(たとえば人々の名前および都市の名前)は翻訳およびオリジナルメッセージにおいて同じである。したがって、2つのメッセージを比較し翻訳されないままの共通の単語をフィルタリングすることは、純粋な翻訳を識別するための特徴として有用であり得る。いくつかの場合において、そのような翻訳されていない固有名詞の存在は、翻訳精度を向上させるのを補助し得るが、翻訳されていない固有名詞が存在しないことは翻訳精度に関する如何なる情報も与え得ない。固有名詞が翻訳においてではなくオリジナルメッセージにおいて識別される場合、翻訳の正確性は、不正確かまたは不正確である可能性が高いと考えられ得る。この固有名詞の特徴について返される実数の値のスコアにペナルティーが追加され得、これにより、如何なる悪い翻訳も識別し、翻訳の正確性を向上させる補助をする。たとえば、固有名詞が2つのメッセージの間で一貫しない場合、翻訳について正確性スコアは、ペナルティーによって低減され得る。
【0349】
代替的または付加的には、オリジナルメッセージおよび翻訳における文法を分析および比較することにより、翻訳の正確性が評価され得る。複数の言語で作業することによって、文の文法を理解するために、すべての言語についてツリーを解析することが困難になり得る。メッセージは、母国語での平易なスピーチまたは形式的なスピーチと比較して異なる文法を追従するチャット言語でもしばしば書き込まれる。
【0350】
したがって、チャット言語の文法の間のパターンを認識するために、POSタグに対してNグラム言語モデルを構築するよう文にはPOSタグがタグ付けされ得、これにより、基礎をなす文法構造の近似を提供する。nグラムは、n個の連続する単語の集合として定義され得る。これらのnグラムのモデルは、所与の言語について典型的であり得、および/または、所与の言語においてn個の連続する単語を表わすために使用され得る。ある実現例では、単語ベースのnグラムの方法は、品詞ベースのnグラムまで拡張される。言いかえれば、文における単語がPOSタグ付け機によってタグ付けされる、文を解析する浅
い方法(shallow method)が使用され得る。1つのアプローチでは、実際のテキストではなくPOSタグについてBLEUスコアが計算される。
【0351】
トリグラム(3グラム)言語モデルが、各言語についてPOSタグ付けされた文上に作成され得る。たとえば文「The device is easy to use」は、「The_DT device_NP is_VBZ
easy_JJ to_TO use_VB」のPOSタグ付けされた出力を有する。この文における単語ベ
ースのトリグラムは、{The, device, is}, {device, is, easy}, {is, easy, to}, {easy, to, use}である。対応するPOSベースのトリグラムは、{DT,NP,VBZ}、{NP,VBZ,JJ}、{VBZ,JJ,TO}、{JJ,TO,VB}である。
【0352】
より高い確率を有するトリグラムは、文法の部分的な構造を示すために使用され得る。たとえば、POSタグ上に構築されたトリグラム言語モデルは、各トリグラムに関連付けられる確率を有し得る。同じテキストにおけるすべてのトリグラムと比較して所与のトリグラムがテキストコーパスに発生した回数の比として、確率が計算され得る。文法的なトリグラムは、しばしば繰り返される傾向があり、したがってより高い確率(言語モデルスコアとしても知られる)を有することになる。したがって、メッセージがこの言語モデル上でより高いスコアを受け取る場合、当該メッセージは文法上正しい可能性がより高い。このスコアは、ユーザが報酬を得るためにスパムメッセージをタイプする場合を検出するのに有用であり得る。当該スコアはさらに、言語検出がいつ失敗したかを判定するのに有用であり得る。たとえば、別個のモデルが各言語について使用され得るので、誤った言語における文のスコアは、さらに低くなり得る。当該スコアはさらに、翻訳の品質が良好な場合を検出するのに有用であり得る。この目的のために、人間翻訳および機械翻訳について別個のモデルがトレーニングされ得る。
【0353】
ある実施形態において、言語モデルは、正確であると有効化された翻訳を使用してトレーニングされる。トリグラムモデルがPOSタグ上で構築され得る。
【0354】
任意のサイズのnグラムに関する固有の問題は、すべての可能な仮説の欠如である。そのような場合、n−1グラムおよびn−2グラムが識別されるバックオフ方法(backoff method)が採用される。たとえば、{DT,NP,JJ}のような未知のPOSトリグラムが見られる場合、当該モデルは、バイグラム{DT,NP}および{NP,JJ}が、文法性を示す言語モデルスコアを有するかどうかを遡及してチェックし得る。バイグラムが確率を有さない場合(または確率が低すぎる場合)、{DT}、{NP}、{JJ}についてユニグラム言語モデルスコアをチェックするよう別のバックオフが行われ得る。すべての3つのモデルはさらに、トリグラムモデルに対してより多くの重み付けをし、バイグラムモデルに対してそれより少ない重み付けをし、ユニグラムモデルに対してそれよりさらに少ない重み付けをした状態で直線補間によってグループ化され得る。
【0355】
チャット英語についてPOSタグの最も頻繁に発生するトリグラムは、<IN><VBD><PP>=1.0、<FW><NN><IN>=1.0、<DT><WP><VBP>=1.0、および<RB></Sl></S2>=1.0である。1.0のスコアは、所与のトリグラムシーケンスが、発生するすべての時において文法的である確率が100%であることを示す。一般に、チャット言語は、「Wh」から始まるより多くの代名詞を使用し、その後には動詞が続き、これは<DT><WP><VBP>によって把握される。また、人々は、「You are cool」または「This is awesome」においてのように、チャ
ット言語文を副詞または形容詞で終える傾向があり、これは<RB></S1></S2>によって把握され、S1およびS2は文章終了タグである。したがって、これらのトリグラムは、各言語において基礎をなす文法の少なくとも何らかの構造を認識するよう使用され得る。対象のすべての言語について言語モデルが構築されるので、モデルはJSONフォーマットでセーブされ得るとともにいつでもすぐにロードされ得る。
【0356】
いくつかの実現例において、メッセージがPOSタグ付けされた後、システムおよび方法は、既存のトリグラム言語モデルにマッチするメッセージにおけるトリグラムの数をカウントし得る。モデルにおける各トリグラムは、それに関連付けられる確率スコアを有し得、メッセージにおける各トリグラムについて、トリグラムの対応するスコアはモデルにおいて識別される。いくつかの場合において、スコアがしきい値(たとえば0.05)より高い場合、トリグラムはマッチとしてカウントされる。そうでなければ、トリグラムはマッチとしてカウントされない。システムおよび方法は、文におけるトリグラムの総数に対してトリグラムのマッチの数を計算し得、この比は、翻訳の正確性を評価するために実数の値の特徴として使用され得る。たとえば、文法的なテキストに頻繁に発生し得る{easy, to, use}のトリグラムは、約0.68の高い確率スコア(言語モデルスコア)を有し
得る。対照的に、{easy, use, to}の文法的でないトリグラムは、約0.04のより小さ
な発生確率を有し得る。0.05の定義されたしきい値と比較すると、当該文法的でないトリグラムはフィルタリングされ得るとともに、しきい値を上回るトリグラムの数は、テキストの文法性について量的な値を提供し得る。
【0357】
POSタグ付けされたメッセージを得た後に、トリグラム言語モデルを使用して文の確率が計算され得る。一実施形態において、文における各トリグラムの対数確率(log probability)が決定され、対数確率の合計が計算される。その後、この合計は文における単
語の数で除算され、当該文についてスコアを得る。スコアは、翻訳の正確性を評価するための実数の値の特徴として使用され得る。トリグラムの対数確率は好ましくは、トリグラム確率、バイグラム確率およびユニグラム確率の直線補間として計算される。たとえば、文「The device is easy to use」において、POSタグ付けされた出力は、「The_DT device_NP is_VBZ easy_JJ to_TO use_VB」である。この文についてのPOSベースのトリ
グラムは、{DT,NP,VBZ}、{NP,VBZ,JJ}、{VBZ,JJ,TO}、および{JJ,TO,VB}である。これらのトリグラムの各々は、所与の言語コーパスにおける発生確率を有する。これらの確率がそれぞれのトリグラムについて0.12、0.44、0.32および0.89であると仮定すると、当該文の文法性についての結合スコアは、対数確率として計算され得る。この場合、対数確率は、log(0.12)+log(0.44)+log(0.32)+log(0.89)として計算され、これは−1.82に等しい。相対スケール上で、この対数確率は文の文法性の数値表示を提供する。
【0358】
上に記載された単語ベースの特徴および言語ベースの特徴に加えて、または、それらの特徴の代わりに、翻訳正確性モジュール3800は、オリジナルメッセージと翻訳との間での単語のアラインメントの評価するよう、単語アラインメントモジュール3806を使用し得る。潜在的な単語アラインメントペアのリストを生成するために、データベース上で単語ベースの特徴のみを用いて翻訳正確性チェックアルゴリズムが実行され、>0.90の確率値を有する翻訳ペアを有する対訳コーパスが抽出された。これは、良好な品質の翻訳メッセージペアのみがフィルタリングされて対訳コーパスが作成されることを示す。英語およびフランス語のペアならびに英語およびスペイン語のペアについて、100Kの文が収集された。これらの100Kの文についての対訳コーパスは、単語アラインメントを抽出するために統計的機械翻訳ツールキット(すなわちGIZA++)に供給された。ツールキットは、約25〜30kの単語アラインメントペアと、これらのペアについて関連付けられる確率スコアとを抽出した。
【0359】
1単語当たり通常複数の単語アラインメントが存在するとすれば、あるしきい値(たとえば0.01)より大きな確率スコアを有するアラインメントのみを選択することは有益であり得る。しかしながら、当該しきい値を用いても、そのほとんどが典型的にスペリングエラーまたは異なる時制の同じ単語(たとえば過去形または未来形)により、1単語に
つき1つより多いアラインメントが得られ得る。英語とフランス語との間のサンプル単語アラインメントが表3に示される。2言語の両方の可能な順序(たとえば英語からフランス語およびフランス語から英語)について、別個の単語アラインメントが得られ得る。したがって、言語ペアにつき2つの単語アラインメントファイルが抽出され得る。ターゲット言語(すなわち翻訳の言語)に対するソース言語(すなわちオリジナルメッセージの言語)についての単語アラインメントは、ソースアラインメントと称され得る一方、ソース言語に対するターゲット言語についての単語アラインメントは、ターゲットアラインメントと称され得る。
【0361】
表3.英語とフランス語との間の典型的な単語アラインメント
ソースアラインメントおよびターゲットアラインメントは、2つの別個のファイルにロードされ得る。ソースアラインメントにも存在するオリジナルメッセージにおける各単語について、システムおよび方法は、少なくとも1つの対応する単語が、翻訳およびさらにターゲットアラインメントに存在するかどうか判定する。その後、同じプロセスが翻訳文に適用される。最後に、単語アラインメントファイルにおいて求められた単語のパーセンテージが翻訳の正確性を評価するための特徴として返される。
【0362】
ある実現例において、単語アラインメントは、言語の1つとして英語を含む言語ペアについて抽出される。たとえば、言語ペアは、英語と、スペイン語、フランス語、ポーランド語、ポルトガル語、オランダ語、ドイツ語、デンマーク語、スウェーデン語、トルコ語、イタリア語およびロシア語のうちの1つとを組み合わせたものであり得、合計11の言語ペアが存在し、11×2=22の単語アラインメントファイルが存在する。英語を含まない言語ペア(たとえばフランス語からロシア語に翻訳)について、英語は、アラインメントを抽出するために中間言語として使用され得る。たとえば、フランス語からロシア語への翻訳を有効にする場合、オリジナルメッセージから単語アラインメントを抽出するためにフランス語−英語が使用され得、翻訳から単語アラインメントを抽出するためにロシア語−英語が使用され得る。これらの2つのセットの交わりにより、両方のメッセージにおける単語アラインメントの間のマッチのパーセンテージが与えられる。この方法は、すべての言語ペアに拡張され得る。
【0363】
様々な実施形態において、ユーザの確実性は、ユーザの翻訳提出物が信頼され得るかどうかを示すものを提供するよう計算される。本明細書において論じられる他のアプローチとは別に、ユーザは、ユーザの翻訳修正の履歴に基づき、より多くまたはより少なく信頼され得る。修正された翻訳の数と、報酬が与えられた翻訳の数とは、様々なユーザについてデータテーブルに格納され得る。これにより、プレーヤーによって行われた修正のパーセンテージが計算され得るとともに、少なくとも部分的に特定のユーザの確実性しきい値に基づいて翻訳修正が承認され得る。これにより、容易に翻訳を修正する純粋なプレーヤーからスパマーを分離することができる。
【0364】
図39は、ある実施形態に従った、翻訳エラーを修正する方法3900のフローチャートである。方法3900は、オンラインゲームの複数のユーザにテキストメッセージチャ
ットシステムを提供すること(ステップ3902)を含む。オンラインゲームの第1のユーザからオリジナルテキストメッセージが第1の言語で受け取られる(ステップ3904)。オリジナルテキストメッセージの最初の翻訳が第2の言語で生成される(ステップ3906)。オリジナルテキストメッセージおよび最初の翻訳はオンラインゲームの第2のユーザに提供される(ステップ3908)。たとえば、第2のユーザは、クライアント装置のディスプレイ上で、2つの翻訳を一緒にまたは別々に閲覧し得る。最初の翻訳におけるエラーに対応するために、第2のユーザから翻訳修正が受け取られる(ステップ3910)。方法3900はさらに、(すなわち第2のユーザからの翻訳修正を含む)複数の翻訳修正から最も正確な翻訳修正を識別すること(ステップ3912)を含み得る。代替的または付加的には、方法3900は、単語ベースの特徴、言語ベースの特徴、および単語アラインメントの特徴の少なくとも1つを使用して、第2のユーザからの翻訳修正の正確性を評価すること(ステップ3914)を含む。
【0365】
上に記載された単語ベースの特徴および言語ベースの特徴(たとえば4つの単語ベースの特徴および4つの言語ベースの特徴)が線形回帰モデルを使用してフィッティングされ得る。トレーニングの後、当該モデルは、好ましくは各翻訳ペアについて実数の値の数を返し、各翻訳ペアを良いまたは悪いものとして分類するようしきい値が使用され得る。たとえば、特徴がx1、x2、x3…x8の数値を返す場合、回帰式はy=a1×x1+a2×x2+…+a8×x8であり得、式中、a1、a2…a8は、線形回帰式をモデリングすることから得られた係数であり、yは出力値である。しきい値yについての好ましい値は、ROC曲線を使用した精度および再現度の実験の後、0.65であると分かった。
【0366】
上に記載された単語アラインメントベースの特徴を追加し、かつ、単語ベースの特徴および言語ベースの特徴に対して線形回帰を再度実行した後、好ましいしきい値は0.76に変更された。さらに、単語アラインメントベースの特徴を追加することによって、AUC値が0.853から0.976に増加した。
【0367】
表4は、単語ベースの特徴、言語ベースの特徴および単語アラインメントの特徴の各々について、13kの文のトレーニングから得られた回帰係数を示す。当該表における結果は、正規化の後、絵文字特徴および文字カウントは小さな回帰係数を有することを示しており、これらの特徴は、翻訳の正確性の評価にほとんど寄与しないと分かったことを意味する。
【0369】
表4.翻訳正確性特徴についての回帰係数
回帰モデルは、フランス語−英語ペアおよびスペイン語−英語ペアの13kの文に対して、10分割交差検証によって評価された。データについての代表的なラベルは、何らかの人間の監督を伴うBING翻訳を使用して計算された。表5は、評価のためにパーセンテージで、精度、再現度、正確性、およびF尺度値(F-measure value)を示す。精度は
、我々の方法によって真であるとしてマークされたすべての翻訳ペアのうちの真陽性(true positive)の翻訳ペアの比を表わす。再現度は、真であるペアであることが既知であ
るすべての翻訳ペアのうちの真陽性の翻訳ペアの比である。正確性は、合計のテストセットサイズに対する、真陽性および真陰性(true negative)としてマークされた結果の合
計の比である。F尺度は、精度と再現度との調和平均である。これらのメトリックは、システム性能および信頼性を測定するために分類タスクにおいて使用され得る。13kの文がトレーニングセットとして使用され、400の手で注釈を付けられた文がテストに使用された。テストセットが小さかったので、テストについての数は、13kの文についての数よりも少なかった。
【0371】
表5.13,000文を用いた翻訳の正確性の観察の結果
表6は、13kの文データセットに対する10分割交差検証の結果を示しており、Wは単語ベースの特徴の使用を指し、Lは言語ベースの特徴の使用を指し、Aは単語アラインメントの特徴の使用を指す。これらの結果は、単語ベースの特徴が精度を向上させるのを補助することと、単語アラインメントの特徴が再現度を著しく向上させるのを補助することとを示す。言語ベースの特徴は、精度および再現度の両方に対してわずかなブーストを与える。一般に、再現度は、合計のデータセットから悪い決定がどれくらい正確に検出されるかを示す。上記表における結果は、単語アラインメントベースの特徴を追加することにより再現度が向上されることを示す。精度は、システムによって正しいとマークされた合計の翻訳から良好な翻訳がどれくらい正確に予測されたかを示す。表における結果は、単語ベースの特徴を追加することにより精度が向上されることを示す。
【0373】
表6.13,000の文データセットに対する10分割交差検証の結果
表7は、ある実施形態に従って、様々な単語ベースの特徴、言語ベースの特徴、および単語アラインメントの特徴を他のマシンアルゴリズムでフィッティングする結果を示す。今までの結果は、異なる特徴を一緒に結び付けるために、線形回帰技術を使用して示された。個々の部分より良好なアンサンブルの結果を作り出すよう変数(このコンテキストにおける特徴)を一緒に結び付けるために使用され得る機械学習アルゴリズムが存在する。線形回帰は、変数を組み合わせるための単次元の方法を示す。機械学習アルゴリズムの文献において、変数を組み合わせるための2次元および多次元の方法が存在する。これらのアルゴリズムは、良好な翻訳ペアを予測するタスクにおいて使用される特徴を組み合わせるより最適な方法を見つけるよう使用された。
【0374】
表7における結果は、特徴を様々な機械学習アルゴリズムと組み合わせることにより得られた。使用されたデータセットは13kの文を含み、また、パラメータはグリッドサーチ(gridSearch)アルゴリズムを使用して調整された。表において列記された方法から、勾配ブースティング分類器(gradient boosting classifier)およびランダムフォレスト法(random forests method)は、アンサンブルベースの方法であり、これがなぜこれら
の方法がよりよい結果を与えたことを説明する。勾配ブースティングマシン(GBM:Gradient Boosting Machine)はトレーニングにより長い時間がかかるが、GBMおよびラ
ンダムフォレストは、非常に良好な結果を与える。しかしながら、モデルをトレーニングする必要は一度だけなので、トレーニング時間は概して重要でない。
【0376】
表7.マシンアルゴリズムにより翻訳正確性特徴をフィッティングする結果
最後の翻訳の正確性チェックアルゴリズムが、3045個の英語−フランス語の文ペアの提供されたテストセットに対してテストされる。結果は表8に示される。WLAplain特徴のパフォーマンスは、単語アラインメントが平易な言い方のデータベースから抽出されたという事実により、貧弱である。一連の変換の後にメッセージが修正されるので、これらの結果における急激な減少が発見され得る。単語アラインメントはチャット用語データベースから抽出されており、特徴においてゼロスコアを回避するために、より小さな文について、何らかの平滑化がなされた。WLAは、チャット用語データベースについての結果を示す。WLA特徴による悪い精度は、多くの真である翻訳が否認されたことを示す。ランダムフォレストが結果をオーバーフィッティングしていたので、特徴は線形回帰でフィッティングされた。一般に、これらの結果は、アルゴリズムに使用される特徴の最終セットを選択するための基礎として使用され得る。より高い正確性が一般に好ましい一方、より高い精度はユーザによって入力されたより多くの正確な翻訳ペアに報酬を与え、高い再現率は、正しいと誤って分類されている間違ったエントリをより少なくすることを保証する。表における結果に従うとWLA特徴セットが望ましい。(たとえば正しいとマークされている可能な限り悪意の最も少ないエントリを得るよう)より高い再現度のために0.75のしきい値が選択され得、高精度が望ましい場合に0.68のしきい値が選択され得る。
【0378】
表8.翻訳正確性チェックアルゴリズムからの結果
本発明が特定の好ましい実施形態を参照して詳細に示されかつ記載されたが、添付の請求の範囲によって定義されるような本発明の精神および範囲から逸脱することがなければ、形態および詳細において様々な変更がなされてもよいということが当業者によって理解されるべきである。