特許第5752180号(P5752180)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤフー株式会社の特許一覧

特許5752180翻訳品質モデル生成装置、翻訳品質値算出装置、翻訳品質モデル生成方法、翻訳品質値算出方法、翻訳品質モデル生成プログラム及び翻訳品質値算出プログラム
<>
  • 特許5752180-翻訳品質モデル生成装置、翻訳品質値算出装置、翻訳品質モデル生成方法、翻訳品質値算出方法、翻訳品質モデル生成プログラム及び翻訳品質値算出プログラム 図000002
  • 特許5752180-翻訳品質モデル生成装置、翻訳品質値算出装置、翻訳品質モデル生成方法、翻訳品質値算出方法、翻訳品質モデル生成プログラム及び翻訳品質値算出プログラム 図000003
  • 特許5752180-翻訳品質モデル生成装置、翻訳品質値算出装置、翻訳品質モデル生成方法、翻訳品質値算出方法、翻訳品質モデル生成プログラム及び翻訳品質値算出プログラム 図000004
  • 特許5752180-翻訳品質モデル生成装置、翻訳品質値算出装置、翻訳品質モデル生成方法、翻訳品質値算出方法、翻訳品質モデル生成プログラム及び翻訳品質値算出プログラム 図000005
  • 特許5752180-翻訳品質モデル生成装置、翻訳品質値算出装置、翻訳品質モデル生成方法、翻訳品質値算出方法、翻訳品質モデル生成プログラム及び翻訳品質値算出プログラム 図000006
  • 特許5752180-翻訳品質モデル生成装置、翻訳品質値算出装置、翻訳品質モデル生成方法、翻訳品質値算出方法、翻訳品質モデル生成プログラム及び翻訳品質値算出プログラム 図000007
  • 特許5752180-翻訳品質モデル生成装置、翻訳品質値算出装置、翻訳品質モデル生成方法、翻訳品質値算出方法、翻訳品質モデル生成プログラム及び翻訳品質値算出プログラム 図000008
  • 特許5752180-翻訳品質モデル生成装置、翻訳品質値算出装置、翻訳品質モデル生成方法、翻訳品質値算出方法、翻訳品質モデル生成プログラム及び翻訳品質値算出プログラム 図000009
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5752180
(24)【登録日】2015年5月29日
(45)【発行日】2015年7月22日
(54)【発明の名称】翻訳品質モデル生成装置、翻訳品質値算出装置、翻訳品質モデル生成方法、翻訳品質値算出方法、翻訳品質モデル生成プログラム及び翻訳品質値算出プログラム
(51)【国際特許分類】
   G06F 17/28 20060101AFI20150702BHJP
【FI】
   G06F17/28 654
【請求項の数】8
【全頁数】18
(21)【出願番号】特願2013-123534(P2013-123534)
(22)【出願日】2013年6月12日
(65)【公開番号】特開2014-241069(P2014-241069A)
(43)【公開日】2014年12月25日
【審査請求日】2013年12月16日
(73)【特許権者】
【識別番号】500257300
【氏名又は名称】ヤフー株式会社
(74)【代理人】
【識別番号】100115129
【弁理士】
【氏名又は名称】清水 昇
(72)【発明者】
【氏名】石川 裕貴
(72)【発明者】
【氏名】颯々野 学
【審査官】 成瀬 博之
(56)【参考文献】
【文献】 特開2009−059123(JP,A)
【文献】 特開2003−085172(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 17/27−17/28
(57)【特許請求の範囲】
【請求項1】
第1の言語で記載された原Webページを機械翻訳システムによって第2の言語に翻訳した第1のWebページに対する操作者の操作のログであって、異なる種類の操作内容を項目として含むログを記憶している第1のログ記憶手段と、
前記原Webページを翻訳者によって前記第2の言語に翻訳した第2のWebページに対する操作者の操作のログであって、異なる種類の操作内容を項目として含むログを記憶している第2のログ記憶手段と、
前記第1のログ記憶手段に記憶されたログと前記第2のログ記憶手段に記憶されたログを用いて、前記機械翻訳システムの翻訳品質を示す値である翻訳品質値を算出する算出手段と、
前記第1のログ記憶手段に記憶されたログを用いた学習によって、前記算出手段によって算出された翻訳品質値を予測する式であるモデルを生成するモデル生成手段
を具備し、
前記算出手段は、前記第1のWebページに対する操作者の操作のログ内の項目における値と前記第2のWebページに対する操作者の操作のログ内の項目における値との比率を前記翻訳品質値として算出し、
前記モデル生成手段は、前記第1のログ記憶手段に記憶されたログ内の各項目に対する係数を算出し、前記式を生成し、
前記項目における値として、操作の回数、移動距離、期間のうちいずれか1つ以上を用いて求められる値である
ことを特徴とする翻訳品質モデル生成装置。
【請求項2】
前記モデル生成手段は、前記係数の絶対値が予め定められた値以下又は未満である場合に、前記モデルから該係数に対する項目を削除する
ことを特徴とする請求項に記載の翻訳品質モデル生成装置。
【請求項3】
第1の言語で記載された原Webページを機械翻訳システムによって第2の言語に翻訳したWebページに対する操作者の操作のログであって、異なる種類の操作内容を項目として含むログを記憶している第3のログ記憶手段と、
前記請求項1に記載の翻訳品質モデル生成装置によって生成されたモデルを用いて、前記第3のログ記憶手段に記憶されたログから前記機械翻訳システムによって翻訳したWebページにおける翻訳品質値を算出する算出手段
を具備することを特徴とする翻訳品質値算出装置。
【請求項4】
第1の言語で記載された原Webページを機械翻訳システムによって第2の言語に翻訳した第1のWebページに対する操作者の操作のログであって、異なる種類の操作内容を項目として含むログを記憶している第1のログ記憶手段と、
前記原Webページを翻訳者によって前記第2の言語に翻訳した第2のWebページに対する操作者の操作のログであって、異なる種類の操作内容を項目として含むログを記憶している第2のログ記憶手段と、
前記第1のログ記憶手段に記憶されたログと前記第2のログ記憶手段に記憶されたログを用いて、前記機械翻訳システムの翻訳品質を示す値である翻訳品質値を算出する算出手段と、
前記第1のログ記憶手段に記憶されたログを用いた学習によって、前記算出手段によって算出された翻訳品質値を予測する式であるモデルを生成するモデル生成手段と、
第1の言語で記載された原Webページを前記機械翻訳システムによって第2の言語に翻訳したWebページに対する操作者の操作のログであって、異なる種類の操作内容を項目として含むログを記憶している第3のログ記憶手段と、
前記モデル生成手段によって生成されたモデルを用いて、前記第3のログ記憶手段に記憶されたログから前記機械翻訳システムによって翻訳したWebページにおける翻訳品質値を算出する算出手段
を具備し、
前記算出手段は、前記第1のWebページに対する操作者の操作のログ内の項目における値と前記第2のWebページに対する操作者の操作のログ内の項目における値との比率を前記翻訳品質値として算出し、
前記モデル生成手段は、前記第1のログ記憶手段に記憶されたログ内の各項目に対する係数を算出し、前記式を生成し、
前記項目における値として、操作の回数、移動距離、期間のうちいずれか1つ以上を用いて求められる値である
ことを特徴とする翻訳品質値算出装置。
【請求項5】
第1の言語で記載された原Webページを機械翻訳システムによって第2の言語に翻訳した第1のWebページに対する操作者の操作のログであって、異なる種類の操作内容を項目として含むログを記憶している第1のログ記憶手段と、
前記原Webページを翻訳者によって前記第2の言語に翻訳した第2のWebページに対する操作者の操作のログであって、異なる種類の操作内容を項目として含むログを記憶している第2のログ記憶手段を具備する翻訳品質モデル生成装置が行う翻訳品質モデル生成方法であって、
前記第1のログ記憶手段に記憶されたログと前記第2のログ記憶手段に記憶されたログを用いて、前記機械翻訳システムの翻訳品質を示す値である翻訳品質値を算出する算出ステップと、
前記第1のログ記憶手段に記憶されたログを用いた学習によって、前記算出ステップによって算出された翻訳品質値を予測する式であるモデルを生成するモデル生成ステップ
を具備し、
前記算出ステップは、前記第1のWebページに対する操作者の操作のログ内の項目における値と前記第2のWebページに対する操作者の操作のログ内の項目における値との比率を前記翻訳品質値として算出し、
前記モデル生成ステップは、前記第1のログ記憶手段に記憶されたログ内の各項目に対する係数を算出し、前記式を生成し、
前記項目における値として、操作の回数、移動距離、期間のうちいずれか1つ以上を用いて求められる値である
ことを特徴とする翻訳品質モデル生成方法。
【請求項6】
第1の言語で記載された原Webページを機械翻訳システムによって第2の言語に翻訳したWebページに対する操作者の操作のログであって、異なる種類の操作内容を項目として含むログを記憶している第3のログ記憶手段を具備する翻訳品質値算出装置が行う翻訳品質値算出方法であって、
前記請求項に記載の翻訳品質モデル生成方法によって生成されたモデルを用いて、前記第3のログ記憶手段に記憶されたログから前記機械翻訳システムによって翻訳したWebページにおける翻訳品質値を算出する算出ステップ
を具備することを特徴とする翻訳品質値算出方法。
【請求項7】
第1の言語で記載された原Webページを機械翻訳システムによって第2の言語に翻訳した第1のWebページに対する操作者の操作のログであって、異なる種類の操作内容を項目として含むログを記憶している第1のログ記憶手段と、
前記原Webページを翻訳者によって前記第2の言語に翻訳した第2のWebページに対する操作者の操作のログであって、異なる種類の操作内容を項目として含むログを記憶している第2のログ記憶手段を具備するコンピュータを、
前記第1のログ記憶手段に記憶されたログと前記第2のログ記憶手段に記憶されたログを用いて、前記機械翻訳システムの翻訳品質を示す値である翻訳品質値を算出する算出手段と、
前記第1のログ記憶手段に記憶されたログを用いた学習によって、前記算出手段によって算出された翻訳品質値を予測する式であるモデルを生成するモデル生成手段
として機能させ
前記算出手段は、前記第1のWebページに対する操作者の操作のログ内の項目における値と前記第2のWebページに対する操作者の操作のログ内の項目における値との比率を前記翻訳品質値として算出し、
前記モデル生成手段は、前記第1のログ記憶手段に記憶されたログ内の各項目に対する係数を算出し、前記式を生成し、
前記項目における値として、操作の回数、移動距離、期間のうちいずれか1つ以上を用いて求められる値である
ことを特徴とする翻訳品質モデル生成プログラム。
【請求項8】
第1の言語で記載された原Webページを機械翻訳システムによって第2の言語に翻訳したWebページに対する操作者の操作のログであって、異なる種類の操作内容を項目として含むログを記憶している第3のログ記憶手段を具備するコンピュータを、
前記請求項に記載の翻訳品質モデル生成プログラムによって生成されたモデルを用いて、前記第3のログ記憶手段に記憶されたログから前記機械翻訳システムによって翻訳したWebページにおける翻訳品質値を算出する算出手段
として機能させるための翻訳品質値算出プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、機械翻訳システムを用いて翻訳されたWebページに対して、翻訳品質を評価するための翻訳品質モデル生成装置、翻訳品質値算出装置、翻訳品質モデル生成方法、翻訳品質値算出方法、翻訳品質モデル生成プログラム及び翻訳品質値算出プログラムに関する。
【背景技術】
【0002】
インターネットにおけるWebページにおいて、ユーザが用いる言語(母国語)とは異なる言語(外国語)で作成されたWebページを翻訳して、そのユーザがアクセスしても理解できるようにすることが行われている。その翻訳は、一般的に機械翻訳システムが用いられている。機械翻訳システムを用いた翻訳の場合、翻訳者が翻訳を行った場合と比べると、翻訳品質の劣ることが多い。
したがって、機械翻訳システムを用いて翻訳されたWebページに対して、翻訳品質を評価することが行われている。例えば、自動評価指標としてのBLEU(BiLingual Evaluation Understudy)等がある。
また、関連する技術として、特許文献1、特許文献2等がある。
【0003】
特許文献1には、翻訳精度を向上させる機械翻訳装置を提供することを課題とし、原言語文を入力する入力部と、原言語文を構文解析して構文情報を生成する構文解析部と、構文情報の節点を最上位の節点とし、最上位の節点より下位の全ての節点を含む第1部分構造と対応する形態素とを含む第1部分情報を構文情報から抽出し、2つの第1部分情報の差分を表す第2部分木と対応する形態素とを含む第2部分情報を構文情報から抽出する抽出部と、各部分情報の形態素を複数の翻訳方式で翻訳する翻訳部と、部分訳情報の組み合わせのうち翻訳スコアの平均値が最大となる組み合わせを選択する最尤構造選択部と、選択された組み合わせの翻訳結果を結合した目的言語文を生成する生成部と、目的言語文を出力する出力部と、を備えたことが開示されている。
【0004】
特許文献2には、言語翻訳を取得するシステム及び方法を提供することを課題とし、発信者は、翻訳すべき文章の一節をサーバーに送信することにより、翻訳を依頼してもよく、サーバーは、送信された一節を、翻訳候補者に同報通信し、翻訳者は、発信者と接続されていてもよく及び/又は互いにソーシャルネットワークを通じて繋がっていてもよく、一部の又は全ての翻訳候補者が、サーバーを通じて、発信者に、一節の翻訳を返信し、発信者は、最も望ましい翻訳を選択して、それをサーバーに知らせ、交換取引又はバーター取引の一部として、翻訳サービスが提供されてもよく、サーバーは、選択された翻訳を行った翻訳者にクレジットを付与してもよく、翻訳者は、後に行われる取引又は他の取引において、このクレジットを利用してもよいことが開示されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2009−217360号公報
【特許文献2】特開2011−123871号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
機械翻訳システムを用いて翻訳されたWebページに対して、翻訳品質を評価する場合において、BLEU等の自動評価システムでは、その評価の信頼性は人手による評価と比較すると低い。一方、人手による評価は、その評価の信頼性は高いが、コストが高くなる。
本発明は、このような背景技術の状況の中でなされたもので、人手による評価よりコストを低くすることができ、従来の自動評価システムよりも評価の信頼性を高めるようにした翻訳品質モデル生成装置、翻訳品質値算出装置、翻訳品質モデル生成方法、翻訳品質値算出方法、翻訳品質モデル生成プログラム及び翻訳品質値算出プログラムを提供することを目的としている。
【課題を解決するための手段】
【0007】
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
[1]の発明は、第1の言語で記載された原Webページを機械翻訳システムによって第2の言語に翻訳した第1のWebページに対する操作者の操作のログであって、異なる種類の操作内容を項目として含むログを記憶している第1のログ記憶手段と、前記原Webページを翻訳者によって前記第2の言語に翻訳した第2のWebページに対する操作者の操作のログであって、異なる種類の操作内容を項目として含むログを記憶している第2のログ記憶手段と、前記第1のログ記憶手段に記憶されたログと前記第2のログ記憶手段に記憶されたログを用いて、前記機械翻訳システムの翻訳品質を示す値である翻訳品質値を算出する算出手段と、前記第1のログ記憶手段に記憶されたログを用いた学習によって、前記算出手段によって算出された翻訳品質値を予測する式であるモデルを生成するモデル生成手段を具備し、前記算出手段は、前記第1のWebページに対する操作者の操作のログ内の項目における値と前記第2のWebページに対する操作者の操作のログ内の項目における値との比率を前記翻訳品質値として算出し、前記モデル生成手段は、前記第1のログ記憶手段に記憶されたログ内の各項目に対する係数を算出し、前記式を生成し、前記項目における値として、操作の回数、移動距離、期間のうちいずれか1つ以上を用いて求められる値であることを特徴とする翻訳品質モデル生成装置である。
【0010】
]の発明は、前記モデル生成手段は、前記係数の絶対値が予め定められた値以下又は未満である場合に、前記モデルから該係数に対する項目を削除することを特徴とする[]に記載の翻訳品質モデル生成装置である。
【0011】
]の発明は、第1の言語で記載された原Webページを機械翻訳システムによって第2の言語に翻訳したWebページに対する操作者の操作のログであって、異なる種類の操作内容を項目として含むログを記憶している第3のログ記憶手段と、前記[1]に記載の翻訳品質モデル生成装置によって生成されたモデルを用いて、前記第3のログ記憶手段に記憶されたログから前記機械翻訳システムによって翻訳したWebページにおける翻訳品質値を算出する算出手段を具備することを特徴とする翻訳品質値算出装置である。
【0012】
]の発明は、第1の言語で記載された原Webページを機械翻訳システムによって第2の言語に翻訳した第1のWebページに対する操作者の操作のログであって、異なる種類の操作内容を項目として含むログを記憶している第1のログ記憶手段と、前記原Webページを翻訳者によって前記第2の言語に翻訳した第2のWebページに対する操作者の操作のログであって、異なる種類の操作内容を項目として含むログを記憶している第2のログ記憶手段と、前記第1のログ記憶手段に記憶されたログと前記第2のログ記憶手段に記憶されたログを用いて、前記機械翻訳システムの翻訳品質を示す値である翻訳品質値を算出する算出手段と、前記第1のログ記憶手段に記憶されたログを用いた学習によって、前記算出手段によって算出された翻訳品質値を予測する式であるモデルを生成するモデル生成手段と、第1の言語で記載された原Webページを前記機械翻訳システムによって第2の言語に翻訳したWebページに対する操作者の操作のログであって、異なる種類の操作内容を項目として含むログを記憶している第3のログ記憶手段と、前記モデル生成手段によって生成されたモデルを用いて、前記第3のログ記憶手段に記憶されたログから前記機械翻訳システムによって翻訳したWebページにおける翻訳品質値を算出する算出手段を具備し、前記算出手段は、前記第1のWebページに対する操作者の操作のログ内の項目における値と前記第2のWebページに対する操作者の操作のログ内の項目における値との比率を前記翻訳品質値として算出し、前記モデル生成手段は、前記第1のログ記憶手段に記憶されたログ内の各項目に対する係数を算出し、前記式を生成し、前記項目における値として、操作の回数、移動距離、期間のうちいずれか1つ以上を用いて求められる値であることを特徴とする翻訳品質値算出装置である。
【0013】
]の発明は、第1の言語で記載された原Webページを機械翻訳システムによって第2の言語に翻訳した第1のWebページに対する操作者の操作のログであって、異なる種類の操作内容を項目として含むログを記憶している第1のログ記憶手段と、前記原Webページを翻訳者によって前記第2の言語に翻訳した第2のWebページに対する操作者の操作のログであって、異なる種類の操作内容を項目として含むログを記憶している第2のログ記憶手段を具備する翻訳品質モデル生成装置が行う翻訳品質モデル生成方法であって、前記第1のログ記憶手段に記憶されたログと前記第2のログ記憶手段に記憶されたログを用いて、前記機械翻訳システムの翻訳品質を示す値である翻訳品質値を算出する算出ステップと、前記第1のログ記憶手段に記憶されたログを用いた学習によって、前記算出ステップによって算出された翻訳品質値を予測する式であるモデルを生成するモデル生成ステップを具備し、前記算出ステップは、前記第1のWebページに対する操作者の操作のログ内の項目における値と前記第2のWebページに対する操作者の操作のログ内の項目における値との比率を前記翻訳品質値として算出し、前記モデル生成ステップは、前記第1のログ記憶手段に記憶されたログ内の各項目に対する係数を算出し、前記式を生成し、前記項目における値として、操作の回数、移動距離、期間のうちいずれか1つ以上を用いて求められる値であることを特徴とする翻訳品質モデル生成方法である。
【0014】
]の発明は、第1の言語で記載された原Webページを機械翻訳システムによって第2の言語に翻訳したWebページに対する操作者の操作のログであって、異なる種類の操作内容を項目として含むログを記憶している第3のログ記憶手段を具備する翻訳品質値算出装置が行う翻訳品質値算出方法であって、前記[]に記載の翻訳品質モデル生成方法によって生成されたモデルを用いて、前記第3のログ記憶手段に記憶されたログから前記機械翻訳システムによって翻訳したWebページにおける翻訳品質値を算出する算出ステップを具備することを特徴とする翻訳品質値算出方法である。
【0015】
]の発明は、第1の言語で記載された原Webページを機械翻訳システムによって第2の言語に翻訳した第1のWebページに対する操作者の操作のログであって、異なる種類の操作内容を項目として含むログを記憶している第1のログ記憶手段と、前記原Webページを翻訳者によって前記第2の言語に翻訳した第2のWebページに対する操作者の操作のログであって、異なる種類の操作内容を項目として含むログを記憶している第2のログ記憶手段を具備するコンピュータを、前記第1のログ記憶手段に記憶されたログと前記第2のログ記憶手段に記憶されたログを用いて、前記機械翻訳システムの翻訳品質を示す値である翻訳品質値を算出する算出手段と、前記第1のログ記憶手段に記憶されたログを用いた学習によって、前記算出手段によって算出された翻訳品質値を予測する式であるモデルを生成するモデル生成手段として機能させ、前記算出手段は、前記第1のWebページに対する操作者の操作のログ内の項目における値と前記第2のWebページに対する操作者の操作のログ内の項目における値との比率を前記翻訳品質値として算出し、前記モデル生成手段は、前記第1のログ記憶手段に記憶されたログ内の各項目に対する係数を算出し、前記式を生成し、前記項目における値として、操作の回数、移動距離、期間のうちいずれか1つ以上を用いて求められる値であることを特徴とする翻訳品質モデル生成プログラムである。
【0016】
]の発明は、第1の言語で記載された原Webページを機械翻訳システムによって第2の言語に翻訳したWebページに対する操作者の操作のログであって、異なる種類の操作内容を項目として含むログを記憶している第3のログ記憶手段を具備するコンピュータを、前記[]に記載の翻訳品質モデル生成プログラムによって生成されたモデルを用いて、前記第3のログ記憶手段に記憶されたログから前記機械翻訳システムによって翻訳したWebページにおける翻訳品質値を算出する算出手段として機能させるための翻訳品質値算出プログラムである。
【発明の効果】
【0017】
本発明にかかる翻訳品質モデル生成装置、翻訳品質値算出装置、翻訳品質モデル生成方法、翻訳品質値算出方法、翻訳品質モデル生成プログラム及び翻訳品質値算出プログラムによれば、機械翻訳システムを用いて翻訳されたWebページに対して、翻訳品質を評価する場合において、人手による評価よりコストを低くすることができ、従来の自動評価システムよりも評価の信頼性を高めることができる。
【図面の簡単な説明】
【0018】
図1】本実施の形態(翻訳品質モデル生成装置)の構成例についての概念的なモジュール構成図である。
図2】本実施の形態(翻訳品質スコア算出装置)の構成例についての概念的なモジュール構成図である。
図3】本実施の形態(翻訳品質モデル生成装置、翻訳品質スコア算出装置)における主にデータの流れの例を示す説明図である。
図4】本実施の形態を実現するためのシステム構成例を示す説明図である。
図5】本実施の形態(翻訳品質モデル生成装置)による処理例を示すフローチャートである。
図6】本実施の形態(翻訳品質スコア算出装置)による処理例を示すフローチャートである。
図7】操作ログテーブルのデータ構造例を示す説明図である。
図8】本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。
【発明を実施するための形態】
【0019】
以下、図面に基づき本発明を実現するにあたっての好適な一実施の形態の例を説明する。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(もちろんのことながら、全ての値も含む)が同じであってもよい。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
【0020】
本実施の形態である翻訳品質モデル生成装置100は、機械翻訳システムを用いて翻訳されたWebページに対して、翻訳品質を評価するための翻訳品質モデルを生成するものであって、図1の例に示すように、機械翻訳ページログ収集モジュール110A、人手翻訳ページログ収集モジュール110B、機械翻訳ページログ記憶モジュール120A、人手翻訳ページログ記憶モジュール120B、翻訳品質スコア算出モジュール130、モデル生成モジュール140を有している。
【0021】
機械翻訳ページログ収集モジュール110Aは、機械翻訳ページログ記憶モジュール120Aと接続されている。機械翻訳ページログ収集モジュール110Aは、第1の言語で記載された原Webページを機械翻訳システムによって第2の言語に翻訳した第1のWebページに対する操作者の操作のログを収集する。ここで第1の言語は、原Webページの記載に用いられている言語であり、例えば、英語等がある。第2の言語は、原Webページにアクセスしたいユーザが読むことができる言語であり、例えば、日本語等がある。そのユーザにとっては、一般的に、第1の言語は外国語であり、第2の言語は母国語となる。第1のWebページは、機械翻訳システムによって翻訳されたWebページである。
人手翻訳ページログ収集モジュール110Bは、人手翻訳ページログ記憶モジュール120Bと接続されている。人手翻訳ページログ収集モジュール110Bは、第1の言語で記載された原Webページを翻訳者によって第2の言語に翻訳した第1のWebページに対する操作者の操作のログを収集する。第2のWebページは、翻訳者によって翻訳されたWebページである。一般的に、第2のWebページは、第1のWebページよりも翻訳品質が高い。
機械翻訳ページログ収集モジュール110A、人手翻訳ページログ収集モジュール110Bにおけるログの収集は、そのWebページを表示している端末が収集し、その収集したログを機械翻訳ページログ収集モジュール110A、人手翻訳ページログ収集モジュール110Bに対して送信してもよいし、そのWebページに対する指示を受け付けるWebサーバーがログを収集し、その収集したログを機械翻訳ページログ収集モジュール110A、人手翻訳ページログ収集モジュール110Bに対して送信してもよい。
【0022】
機械翻訳ページログ記憶モジュール120Aは、機械翻訳ページログ収集モジュール110A、翻訳品質スコア算出モジュール130、モデル生成モジュール140と接続されている。機械翻訳ページログ記憶モジュール120Aは、第1の言語で記載された原Webページを機械翻訳システムによって第2の言語に翻訳した第1のWebページに対する操作者の操作のログを記憶している。
人手翻訳ページログ記憶モジュール120Bは、人手翻訳ページログ収集モジュール110B、翻訳品質スコア算出モジュール130、モデル生成モジュール140と接続されている。人手翻訳ページログ記憶モジュール120Bは、第1の言語で記載された原Webページ(機械翻訳ページログ記憶モジュール120Aで対象としている原Webページと同じWebページ)を翻訳者によって第2の言語に翻訳した第2のWebページに対する操作者の操作のログを記憶している。
機械翻訳ページログ記憶モジュール120A、人手翻訳ページログ記憶モジュール120Bが記憶しているログとしては、例えば、操作ログテーブル700がある。図7は、操作ログテーブル700のデータ構造例を示す説明図である。操作ログテーブル700は、URL欄702、配信日時欄704、操作欄706、操作対象欄708、操作日時欄710等を有している。URL欄702は、そのWebページのURL(Uniform Resource Locator)を記憶している。配信日時欄704は、そのWebページを配信した日時(年、月、日、時、分、秒、秒以下、又はこれらの組み合わせであってもよい。以下、同じ)を記憶している。また、Webページを受信した日時、表示した日時であってもよい。操作欄706は、そのWebページに対する操作を記憶している。具体的には、以下に詳述する。操作対象欄708は、その操作の対象となったWebページ内の要素(コンテンツ)を記憶している。例えば、「いいね!」ボタンが選択された場合は、その「いいね!」ボタンを識別し得る情報であるコンテンツIDを記憶する。操作日時欄710は、その操作が行われた日時を記憶している。
【0023】
操作ログテーブル700の操作欄706が記憶する操作(つまり、機械翻訳ページログ収集モジュール110A、人手翻訳ページログ収集モジュール110Bが取得するログとしての操作)としては、例えば、次のようなものがある。なお、以下のものは例示であって、これらの全てをログとして記憶する必要はなく、また、他の操作をログとして記憶してもよい。なお、これらはログ内の項目となり、第1のWebページ又は第2のWebページでの行動パターンとなる。
(1)クリックログ
以下の操作の基本データとなるものであり、Webページ上でのマウス操作(カーソルの移動操作、右ボタン又は左ボタン等の選択操作)をログとして記憶する。また、Webページを表示する装置がタッチパネルである場合は、指等の操作(タップ、ドラッグ、フリック、ピンチイン、ピンチアウト、長押し、シェイク等)をログとして記憶する。このクリックログを解析して、以下の操作をログとして記憶してもよい。
(2)スクロールに関する操作
具体的には、スクロールが行われた回数、スクロールによる移動距離、移動方向等がある。
(3)滞在時間
次のWebページへ移動するまでの期間(第1のWebページ又は第2のWebページの表示期間)である。
(4)原Webページ(原言語(第1の言語)のページ)に関する操作
「原Webページ」を「翻訳された第1のWebページ」又は「翻訳された第2のWebページ」とともに表示する。例えば、タグ等を用いて原Webページを表示できるようにしてもよい。
具体的には、「原Webページ」への移動回数、「原Webページ」の滞在時間等がある。タグを用いた場合は、「原Webページ」のタグが選択された回数が「原Webページ」への移動回数となる。「原Webページ」のタグが選択されてから、他のタグが選択されるまでの期間又は次のWebページへ移動するまでの期間が、「原Webページ」の滞在時間となる。
(5)「いいね!」ボタン等に関する操作
ソーシャルネットワーキングサービス(例えば、フェイスブック、ツイッター)等における「いいね!」ボタンに関する操作である。
具体的には、「いいね!」ボタン等が選択された回数等がある。
(6)売上等に関する操作
対象としているWebページが商用目的である場合は、購入の回数、売上額、予約数等がある。
(7)コンバージョン(CV)に関する操作
コンバージョンとは、商用目的等のウェブサイト上で獲得できる最終的な成果をいい、商用目的のWebページならば商品購入、情報提供やコミュニティのためのWebページならば会員登録等がコンバージョンにあたる。なお、資料請求、問い合わせ等の一次的な成果をコンバージョンとして含めてもよい。また、コンバージョン率(Webページへのアクセス数に対して、コンバージョンに結びついた件数の割合)を記憶してもよい。
(8)辞書検索への遷移に関する操作
具体的には、「原Webページ」、「翻訳された第1のWebページ」、「翻訳された第2のWebページ」内の単語に対して、辞書検索を行った回数、辞書の種類、検索対象となった単語等がある。
(9)検索結果ページからの流入トラフィック
つまり、インターネットの検索システムにおける検索による検索結果から対象としているWebページへの流入の回数(いわゆる検索エンジンを経由したWebページへの訪問回数)を操作ログとする。
この操作ログと翻訳品質とは一定の相関がある。以下に説明する。翻訳品質が悪いと、そもそもユーザの検索クエリと一致しない可能性がある。また、検索結果のページで表示される部分の翻訳品質が悪い場合、例えば、商品タイトルの翻訳品質が悪い場合、又は、検索結果で一部だけ表示する本文の翻訳品質が悪い場合、検索結果であるWebページに対するクリックの可能性が低くなる。
【0024】
翻訳品質スコア算出モジュール130は、機械翻訳ページログ記憶モジュール120A、人手翻訳ページログ記憶モジュール120B、モデル生成モジュール140と接続されている。翻訳品質スコア算出モジュール130は、機械翻訳ページログ記憶モジュール120Aに記憶されたログと人手翻訳ページログ記憶モジュール120Bに記憶されたログを用いて、機械翻訳システムの翻訳品質を示す値を算出する。
また翻訳品質スコア算出モジュール130は、第1のWebページに対する操作者の操作のログと第2のWebページに対する操作者の操作のログとの比率を用いて翻訳品質値を算出するようにしてもよい。これによって、第1のWebページと第2のWebページの操作を比べた場合の翻訳品質を示す品質評価値を用いることができる。ここでログとは、具体的には、操作ログテーブル700の操作欄706に記憶されている項目である。もちろんのことながら、「第1のWebページに対する操作者の操作のログ」と「第2のWebページに対する操作者の操作のログ」は対応している項目(同じ操作を示す項目)である。また、そのWebページの属性に応じて、算出式(又はログ内の操作の項目)を決定するようにしてもよい。例えば、Webページの属性と算出式を対応させたテーブルを用意しておき、それを用いて算出式を決定してもよい。Webページの属性としては、商用目的、情報提供目的、コミュニティ目的等がある。そして、商用目的のWebページである場合は、次のような式を用いて翻訳品質値を算出するようにしてもよい。
翻訳品質値=(第1のWebページのコンバージョン率)/(第2のWebページのコンバージョン率)
また、情報提供目的のWebページである場合は、次のような式を用いて翻訳品質値を算出するようにしてもよい。
翻訳品質値=(第1のWebページのスクロールによる移動距離)/(第2のWebページのスクロールによる移動距離)
なお、翻訳品質値は、高いほど(1に近いほど)良好な翻訳品質であるとしている。なお、機械翻訳ページログ記憶モジュール120A、人手翻訳ページログ記憶モジュール120Bに記憶されているログは複数あり、翻訳品質値を算出する各項目の値として、統計的な代表値(平均値、最頻値、中央値等)を用いてもよい。
【0025】
モデル生成モジュール140は、機械翻訳ページログ記憶モジュール120A、人手翻訳ページログ記憶モジュール120B、翻訳品質スコア算出モジュール130と接続されている。モデル生成モジュール140は、機械翻訳ページログ記憶モジュール120Aに記憶されたログを用いて、翻訳品質スコア算出モジュール130によって算出された翻訳品質値を予測するモデルを生成する。つまり、翻訳品質値を第1のWebページに対する操作だけで予測するモデルを生成するものである。
モデル生成モジュール140は、機械翻訳ページログ記憶モジュール120Aに記憶されたログ内の各項目に対する係数を算出することによって、モデルを生成するようにしてもよい。これによって、翻訳品質値を簡便に算出することができる。
例えば、次のような式を用いてモデルを生成する。
a*(「いいね!」ボタン等が選択された回数)+b*(スクロールが行われた回数)+c*(辞書検索を行った回数)+・・・=翻訳品質値
a、b、c等は係数であり、機械翻訳ページログ記憶モジュール120Aに記憶されたログ内の各項目に対して乗算する値である。このように各項目に係数を積算した値が、翻訳品質値と等しくなるように、各係数を定める。具体的には、ニューラルネットワークを用いた学習によって各係数を定めてもよい。用いる項目は、機械翻訳ページログ記憶モジュール120Aに記憶されたログ内の全ての項目であってもよいし、予め定められた項目であってもよい。もちろんのことながら、機械翻訳ページログ記憶モジュール120Aに記憶されているログは、学習に必要な程度に多くの操作者による操作が記憶されている。
また、モデル生成モジュール140は、係数の絶対値と予め定められた値を比較することによって、モデルを修正するようにしてもよい。ここでの修正とは、前述のモデルの式内の係数と項目の乗算の項を削除することである。係数の絶対値としたのは、係数は負の値をとることもあるからである。係数の絶対値が予め定められた値以下又は未満である場合に、その係数は0と同等とみなしてもよく、つまり、その係数を乗算する項目は、モデルには必要ないことを示している。したがって、モデルからその項目を削除することを行ってもよいし、ログ収集モジュールは、その項目のログを収集しないようにしてもよい。
【0026】
本実施の形態である翻訳品質スコア算出装置200は、機械翻訳システムを用いて翻訳されたWebページに対して、翻訳品質を評価するものであって、図2の例に示すように、機械翻訳ページログ収集モジュール210、機械翻訳ページログ記憶モジュール220、翻訳品質スコア算出モジュール230を有している。
機械翻訳ページログ収集モジュール210は、機械翻訳ページログ記憶モジュール220と接続されている。機械翻訳ページログ収集モジュール210は、前述の図1に例示の機械翻訳ページログ収集モジュール110Aと同等の処理を行う。ただし、ここで対象としているWebページは、機械翻訳システムを用いて翻訳されたものであり、翻訳者によって翻訳されたWebページは不要である。つまり、モデル生成用のWebページではなく、翻訳品質を評価するためのWebページである。
機械翻訳ページログ記憶モジュール220は、機械翻訳ページログ収集モジュール210、翻訳品質スコア算出モジュール230と接続されている。機械翻訳ページログ記憶モジュール220は、第1の言語で記載された原Webページを機械翻訳システムによって第2の言語に翻訳したWebページに対する操作者の操作のログを記憶している。前述の図1に例示の機械翻訳ページログ記憶モジュール120Aと同等の情報を記憶する。もちろんのことながら、ここでの原Webページは、モデル生成に用いた原Webページとは異なるWebページである。したがって、第2の言語に翻訳された結果であるWebページも、モデル生成に用いた第1のWebページとは異なる。
翻訳品質スコア算出モジュール230は、機械翻訳ページログ記憶モジュール220、モデル生成モジュール140と接続されている。ここで、モデル生成モジュール140は、図1に例示した翻訳品質モデル生成装置100内のモデル生成モジュール140である。翻訳品質スコア算出モジュール230は、モデル生成モジュール140が生成したモデルを用いて、機械翻訳ページログ記憶モジュール220に記憶されたログから機械翻訳システムによって翻訳したWebページにおける翻訳品質値を算出する。具体的には、前述のモデルの式(a、b、c等の係数が定まった式)に、機械翻訳ページログ記憶モジュール220内の各項目の値を代入することによって、翻訳品質値を算出する。
また、翻訳品質スコア算出モジュール230は、予め定められた基準値を用いた判断を行うようにしてもよい。例えば、翻訳品質値がその基準値以上である場合は、翻訳者によって翻訳されたWebページと比較して遜色ない翻訳品質が得られていると考えられるので、機械翻訳システムによって翻訳されたWebページをそのまま使い、その基準値未満である場合は、改善が必要なWebページであると判断し、その判断結果を表示する。
なお、図1に例示の翻訳品質モデル生成装置100と図2の例示の翻訳品質スコア算出装置200を組み合わせてもよい。
【0027】
図3は、本実施の形態(翻訳品質モデル生成装置100、翻訳品質スコア算出装置200)における主にデータの流れの例を示す説明図である。
機械翻訳ページ310Aは、原Webページを機械翻訳システムによって翻訳したWebページである。人手翻訳ページ310Bは、その原Webページを翻訳者によって翻訳したWebページである。機械翻訳ページ310Aと人手翻訳ページ310Bは、同じ原Webページから生成されたものであり、その内容は同じである。もちろんのことながら、ここでの同内容とは、同じWebページに対して、機械翻訳システムによる翻訳(機械翻訳ページ310A)と翻訳者による翻訳(人手翻訳ページ310B)が行われたという意味であって、その表現までもが全て同一であるという意味ではない。
ユーザ301、ユーザ302は、それぞれが所持している端末(ノートPC、スマートフォン等を含む携帯情報端末等)を用いて機械翻訳ページ310Aに対して操作を行う。一方、ユーザ303、ユーザ304は、それぞれが所持している端末を用いて人手翻訳ページ310Bに対して操作を行う。ユーザ301、ユーザ302とユーザ303、ユーザ304は同一人物である必要はなく、モデル生成のために必要な人数である。また、試験的に用意されたユーザである必要はなく、一般的なユーザ(購入者等)であってもよい。機械翻訳ページ310Aに対するログは機械翻訳ログ320Aに記録され、人手翻訳ページ310Bに対するログは人手翻訳ログ320Bに記録される。
機械翻訳ログ320Aは機械翻訳ページログ記憶モジュール120A内の内容、人手翻訳ログ320Bは人手翻訳ページログ記憶モジュール120B内の内容を示しており、翻訳品質スコア予測モデル330はモデル生成モジュール140が生成したモデルを示している。つまり、翻訳品質スコア算出モジュール130、モデル生成モジュール140の処理によって翻訳品質スコア予測モデル330を生成する。
機械翻訳ページ360は、機械翻訳システムによって翻訳したWebページである。ユーザ351は、所持している端末を用いて機械翻訳ページ360に対して操作を行う。もちろんのことながら、機械翻訳ページ360は複数人であってもよい。機械翻訳ページ360に対するログはログ370に記録される。ログ370は機械翻訳ページログ記憶モジュール220内の内容、翻訳品質スコア380は翻訳品質スコア算出モジュール230が算出した翻訳品質値を示している。また、評価結果(そのまま)392、評価結果(要改善)394は、翻訳品質スコア算出モジュール230が翻訳品質スコア380から判断した結果を示している。
【0028】
図4は、本実施の形態を実現するためのシステム構成例を示す説明図である。Webページ評価システム400は、翻訳品質モデル生成装置100、翻訳品質スコア算出装置200、Webページサーバー410、ログ収集装置420を有している。Webページ評価システム400、機械翻訳システム430、端末440A、端末440B、端末440C、端末440D、端末440Eは、通信回線499を介してそれぞれ接続されている。
例えば、原Webページを機械翻訳システム430が翻訳し、その翻訳結果であるWebページをWebページサーバー410内に記憶させる。また、その原Webページを翻訳者が翻訳したWebページもWebページサーバー410内に記憶させる。翻訳品質の評価対象であるWebページもWebページサーバー410内に記憶させる。
そして、端末440A、端末440B等は、Webページサーバー410内のWebページにアクセスする。その際に、端末440A、端末440B等が表示しているWebページに対する操作のログをログ収集装置420が収集する。例えば、端末440A、端末440B等が操作を検知し、その検知結果を、通信回線499を介してログ収集装置420へ送信する。そして、ログ収集装置420が収集したログを翻訳品質モデル生成装置100又は翻訳品質スコア算出装置200に渡し、翻訳品質モデル生成装置100はモデルを生成し、翻訳品質スコア算出装置200はそのモデルを用いて評価対象としているWebページの翻訳品質値を算出する。
【0029】
図5は、本実施の形態(翻訳品質モデル生成装置100)による処理例を示すフローチャートである。
ステップS502では、Webページサーバー410が、機械翻訳Webページ(第1のWebページ)を準備する。
ステップS504では、ログ収集装置420が、ログ収集を行う。
ステップS506では、機械翻訳ページログ収集モジュール110Aが、翻訳品質モデル生成用ログ収集を行う。
ステップS512では、Webページサーバー410が、人手翻訳Webページ(第2のWebページ)を準備する。
ステップS514では、ログ収集装置420が、ログ収集を行う。
ステップS516では、人手翻訳ページログ収集モジュール110Bが、翻訳品質モデル生成用ログ収集を行う。
ステップS520では、翻訳品質スコア算出モジュール130が、翻訳品質スコアを算出する。
ステップS522では、モデル生成モジュール140が、翻訳品質スコア予測モデルを生成する。
ステップS524では、モデル生成モジュール140が、翻訳品質スコア予測モデルを翻訳品質スコア算出装置200の翻訳品質スコア算出モジュール230に出力する。
【0030】
図6は、本実施の形態(翻訳品質スコア算出装置200)による処理例を示すフローチャートである。
ステップS602では、Webページサーバー410が、機械翻訳Webページを準備する。
ステップS604では、ログ収集装置420が、ログ収集を行う。
ステップS606では、機械翻訳ページログ収集モジュール210が、翻訳品質モデル生成用ログ収集を行う。
ステップS608では、翻訳品質スコア算出モジュール230が、翻訳品質スコア予測モデルを受け付ける。
ステップS610では、翻訳品質スコア算出モジュール230が、翻訳品質スコアを算出する。
ステップS612では、翻訳品質スコア算出モジュール230が、機械翻訳Webページを評価する。
【0031】
なお、本実施の形態(翻訳品質モデル生成装置100、翻訳品質スコア算出装置200、Webページ評価システム400、機械翻訳システム430)としてのプログラムが実行されるコンピュータのハードウェア構成は、図8に例示するように、一般的なコンピュータであり、具体的にはパーソナルコンピュータ、サーバーとなり得るコンピュータ、携帯電話(スマートフォンを含む)等である。つまり、具体例として、処理部(演算部)としてCPU801を用い、記憶装置としてRAM802、ROM803、HD804を用いている。HD804として、例えばハードディスクを用いてもよい。機械翻訳ページログ収集モジュール110A、人手翻訳ページログ収集モジュール110B、翻訳品質スコア算出モジュール130、モデル生成モジュール140、機械翻訳ページログ収集モジュール210、翻訳品質スコア算出モジュール230等のプログラムを実行するCPU801と、そのプログラムやデータを記憶するRAM802と、本コンピュータを起動するためのプログラム等が格納されているROM803と、補助記憶装置であるHD804と、キーボード、マウス、タッチパネル等に対する利用者の操作に基づいてデータを受け付ける受付装置806と、液晶ディスプレイ等の出力装置805と、ネットワークインタフェースカード等の通信ネットワークと接続するための通信回線インタフェース807、そして、それらをつないでデータのやりとりをするためのバス808により構成されている。これらのコンピュータが複数台互いにネットワークによって接続されていてもよい。
【0032】
前述の実施の形態のうち、コンピュータ・プログラムによるものについては、本ハードウェア構成のシステムにソフトウェアであるコンピュータ・プログラムを読み込ませ、ソフトウェアとハードウェア資源とが協働して、前述の実施の形態が実現される。
なお、図8に示すハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図8に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えばASIC等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図8に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。
【0033】
また、前述の実施の形態の説明において、予め定められた値との比較において、「以上」、「以下」、「より大きい」、「より小さい(未満)」としたものは、その組み合わせに矛盾が生じない限り、それぞれ「より大きい」、「より小さい(未満)」、「以上」、「以下」としてもよい。
【0034】
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray(登録商標) Disc)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
【符号の説明】
【0035】
100…翻訳品質モデル生成装置
110A…機械翻訳ページログ収集モジュール
110B…人手翻訳ページログ収集モジュール
120A…機械翻訳ページログ記憶モジュール
120B…人手翻訳ページログ記憶モジュール
130…翻訳品質スコア算出モジュール
140…モデル生成モジュール
200…翻訳品質スコア算出装置
210…機械翻訳ページログ収集モジュール
220…機械翻訳ページログ記憶モジュール
230…翻訳品質スコア算出モジュール
400…Webページ評価システム
410…Webページサーバー
420…ログ収集装置
430…機械翻訳システム
440…端末
499…通信回線
図1
図2
図3
図4
図5
図6
図7
図8