(58)【調査した分野】(Int.Cl.,DB名)
【背景技術】
【0002】
最近では国家間交流の増大と情報通信網の拡散に伴い、第1言語、すなわちソース言語(source language)の文章を第2言語、すなわちターゲット言語(target language)の文章に翻訳する機械翻訳装置の必要性が次第に増加している。このような機械翻訳装置は、入力原文に対して形態素解析、構文解析、変換および生成の一般的な段階を経ながら、他の言語の原文に翻訳することを目的としている。
【0003】
従来の機械翻訳方式では、文書の分析程度に応じて直接方式(direct method)、変換方式(transfer method)、またはピボット方式(pivot method)などがある。ここで、直接方式は、ソース言語とターゲット言語の間の直接的な対応によって翻訳が行われる。変換方式は、ソース言語とターゲット言語それぞれに対して2種類の形態の中間表現を定義し、分析、変換、生成段階を経て翻訳が行われる。ピボット方式は、ソース言語とターゲット言語に対して1つの中立表現を定義し、大きく分析段階と生成段階の2段階を経て翻訳が行われる。
【0004】
一方、90年代に発表された機械翻訳方式には、ルールベース機械翻訳、統計ベース機械翻訳、ルールベースと統計ベース機械翻訳を結合したハイブリッド機械翻訳などがあるが、これらは予め翻訳された過程から得られた知識や翻訳例題、あるいはその統計を利用して翻訳が行われる。
【0005】
統計的方法に基づいた機械翻訳技術の例として、韓国公開特許第10−2010−0037813号(公開日2010年04月12日)には、二言語パラレルコーパス(bilingual parallel corpus)に対する分析に基づいた統計的機械翻訳に言語的な情報を反映する機械翻訳装置および機械翻訳方法が開示されている。
【0006】
図1では、確率的翻訳候補の例を示している。既存の機械翻訳装置は、
図1のように、原文に対する翻訳候補の単語/句/ルール(word/phrase/rule)に基づいてスコア(score)を測定し、翻訳候補を結合して得られる文章の合計スコアによって整列する方法によって翻訳文を生成している。
【0007】
図2では、ドイツ語原文に対する英語翻訳の正しい経路を検索する例を示している。図に示されている例のような方法により、翻訳候補を利用して確率が高い順に整列して示すことができる。
【0008】
このように、既存の機械翻訳技術は、原文に対する翻訳が正しいか正しくないかのみを考慮する方法に過ぎない。
【発明の概要】
【発明が解決しようとする課題】
【0010】
原文に対する翻訳文に対訳となる候補文章を完全な形態の文章で生成する翻訳結果提供方法およびシステムを提供する。
【0011】
翻訳文の候補文章に対する生成過程において、意味的分類に適合する候補文章を生成する翻訳結果提供方法およびシステムを提供する。
【0012】
ユーザの目的や特性に適合する意味カテゴリの翻訳文を生成する翻訳結果提供方法およびシステムを提供する。
【課題を解決するための手段】
【0013】
コンピュータによって実現される翻訳結果提供方法であって、ソース言語(source language)で作成された原文をターゲット言語(target language)に翻訳した翻訳文を生成し、翻訳結果として前記翻訳文を文章の意味カテゴリ(semantic category)に分類して提供することを含む翻訳結果提供方法を提供する。
【0014】
一実施形態によると、前記意味カテゴリは、文章を分類するための基準として、文体、文型、時制のうち少なくとも1つを含むことを特徴とする。
【0015】
他の一実施形態によると、前記翻訳文を生成することは、前記原文に対する翻訳文の候補文章を機械翻訳モデルによって測定されたスコア順に整列し、スコアが高い上位の複数の文章を抽出し、前記翻訳文を提供することは、前記複数の文章をスコアが最も高い文章と残りの文章を区分して表示することを特徴とする。
【0016】
さらに他の一実施形態によると、前記翻訳文を提供することは、前記原文に対する翻訳文の候補文章が複数である場合、前記候補文章を意味カテゴリ別に区分して表示することを特徴とする。
【0017】
さらに他の一実施形態によると、ユーザから翻訳結果に対する意味カテゴリが選択されることをさらに含み、前記翻訳文を提供することは、前記原文に対する翻訳文の候補文章のうち、前記ユーザによって選択された意味カテゴリに分類された文章を表示することを特徴とする。
【0018】
さらに他の一実施形態によると、前記原文を作成したユーザの文章特性を分析することをさらに含み、前記翻訳文を提供することは、前記原文に対する翻訳文の候補文章のうち、前記ユーザの文章特性に対応する意味カテゴリに分類された文章を表示することを特徴とする。
【0019】
さらに他の一実施形態によると、前記原文の意味カテゴリを分類する段階をさらに含み、前記提供する段階は、前記原文に対する翻訳文の候補文章のうち、前記原文と同一あるいは類似する意味カテゴリに分類された文章を表示することを特徴とする。
【0020】
少なくとも1つのプログラムがローディングされたメモリと、少なくとも1つのプロセッサと、を備え、前記少なくとも1つのプロセッサは、前記プログラムの制御に従って、ソース言語(source language)で作成された原文をターゲット言語(target language)に翻訳した翻訳文を生成し、翻訳結果として前記翻訳文を文章の意味カテゴリ(semantic category)に分類して提供することを処理する翻訳結果提供システムを提供する。
【0021】
ソース言語(source language)で作成された原文をターゲット言語(target language)に翻訳した翻訳文を生成し、翻訳結果として前記翻訳文を文章の意味カテゴリ(semantic category)に分類して提供することをコンピュータに実行させるためのプログラムを提供する。
【0022】
ユーザ端末にインストールされるアプリケーションのファイルを配布するファイル配布システムであって、前記ユーザ端末の要請にしたがって前記ファイルを送信するファイル送信部を備え、前記アプリケーションは、ソース言語(source language)で作成された原文を機械翻訳サーバに送信するように前記ユーザ端末を制御するモジュールと、前記機械翻訳サーバに提供する翻訳文であって、前記原文をターゲット言語(target language)に翻訳した前記翻訳文を表示するように前記ユーザ端末を制御するモジュールと、を備え、前記機械翻訳サーバでは、前記翻訳文を文章の意味カテゴリ(semantic category)に分類して前記ユーザ端末に提供することを特徴とするファイル配布システムを提供する。
【発明の効果】
【0023】
原文に対する翻訳文に対訳となる候補文章を完全な形態の文章で提供することができる翻訳結果提供方法およびシステムを提供する。
【0024】
翻訳文の候補文章に対する生成過程において、意味的分類に適合する候補文章を生成することができる翻訳結果提供方法およびシステムを提供する。
【0025】
ユーザの目的や特性に適合する意味カテゴリの翻訳文を提供することができる翻訳結果提供方法およびシステムを提供する。
【発明を実施するための形態】
【0027】
以下、本発明の実施形態について、添付の図面を参照しながら詳細に説明する。
【0028】
本実施形態は、コンピュータを使用して原文に対する翻訳文を自動で生成する機械翻訳技術に関する。
【0029】
図3は、本発明の一実施形態において、ユーザ端末と機械翻訳システムの関係を概括的に示した図である。
図3は、ユーザ端末301と機械翻訳システム300を示している。
図3において矢印は、ユーザ端末301と機械翻訳システム300の間で有/無線ネットワークを利用してデータが送受信することを意味している。
【0030】
機械翻訳システム300は、ユーザから入力されたソース言語(source language)の文章(以下、「原文」と称する)をターゲット言語(target language)の文章(以下、「翻訳文」と称する)に翻訳して翻訳結果を提供する翻訳エンジンの役割をする。特に、機械翻訳システム300は、原文に対する翻訳文の候補文章をスコア順に整列して少なくとも1つ以上(N個)を抽出した後、抽出された候補文章を意味ベースで分類して翻訳結果を提供する。
【0031】
ユーザ端末301は、PC、スマートフォン(smart phone)、タブレット(tablet)、ノートパソコン(laptop computer)、デジタル放送用端末機(DMB)、PMP(Portable Multimedia Player)、ナビゲーション(navigation)端末などのように、機械翻訳システム300と関連するウェブ/モバイルサイトへの接続、またはサービス専用アプリケーションのインストールおよび実行が可能なすべての端末装置を意味する。このとき、ユーザ端末301は、ウェブ/モバイルサイトまたは専用アプリケーションの制御下に、サービス画面の構成、データ入力、データ送受信、データ格納などのようなサービス全般の動作を実行する。また、ユーザ端末301は、機械翻訳システム300を利用して原文を入力するための入力手段と機械翻訳システム300から提供される翻訳結果を出力するための出力手段とを含む。入力手段としては、例えば、キーボード、マウス、スキャナ、マイクなどが利用される。また、出力手段としては、例えば、モニタ、プリンタ、スピーカなどが利用される。
【0032】
図4は、本発明の一実施形態において、機械翻訳システムの内部構成を示したブロック図である。
図4に示すように、機械翻訳システムは、翻訳文生成部410と結果提供部420からなるプロセッサ400、メモリ401、ネットワークインタフェース402を備える。さらに、機械翻訳システムには、原文から翻訳文を自動で生成するための多様な翻訳モデルと関連するデータベースシステムが備えられてもよい。一例として、機械翻訳のための翻訳モデルとして、ルールベース機械翻訳モデル403、統計ベース機械翻訳モデル404、ルールベース方式と統計ベース方式を混合したハイブリッド機械翻訳モデル405などが利用されてもよい。
【0033】
メモリ401には、原文に対する翻訳文の候補文章を生成し、候補文章の意味カテゴリを分類する機械翻訳ルーチンに該当する命令語を含むプログラムが格納される。以下で説明する機械翻訳システムで実行される各処理は、メモリ401に格納されたプログラムによって実行される。例えば、メモリ401は、ハードディスク、SSD、SDカード(登録商標)、およびその他の格納媒体である。
【0034】
ネットワークインタフェース402は、意味カテゴリベースの機械翻訳サービスを利用するユーザ端末との通信のために、機械翻訳システムをネットワークに接続する。
【0035】
プロセッサ400は、メモリ401に格納されたプログラムの命令語にしたがって処理を行う装置であって、CPUなどのマイクロプロセッサが備えられている。プロセッサ400の処理によって実現される構成は次のとおりである。
【0036】
翻訳文生成部410は、原文に対して事前に定義された機械翻訳モデル(ルールベース機械翻訳モデル、統計ベース機械翻訳モデル、ハイブリッド機械翻訳モデルなど)を適用して翻訳文を生成する。このとき、翻訳文生成部410は、原文に対する翻訳文を生成する過程において、翻訳文の候補文章を多様な意味カテゴリの文章で生成してもよい。言い換えれば、翻訳文生成部410は、原文に翻訳される翻訳文の候補文章をスコア順に整列してN個の文章を抽出し、抽出された候補文章が有する意味カテゴリ別に分類してもよい。このとき、意味カテゴリとは、文体、文型、時制、言語規範などのように、文章の性格を分類するためのすべての基準を意味してもよい。例えば、意味カテゴリは、文体に応じて文語体や口語体などに区分され、文型に応じて平敍文、請誘文、命令文、敬語、平常語などに区分され、時制に応じて過去形、現在形、未来形などに区分され、言語規範に応じて標準語、方言などに区分されてもよい。
【0037】
結果提供部420は、原文に対する翻訳文を提供する。このとき、意味が類似する多様な候補文章を翻訳結果に含ませて提供してもよい。ここで、候補文章とは、単に類似する意味の単語候補を提供するのではなく、完全な文章形態を有するものであって、意味が類似する単語に交換された完全文章はもちろん、単語ないし構造自体がまったく異なるように構成された完全文章までもが含まれてもよい。翻訳結果を提供する一例として、結果提供部420は、翻訳文の候補文章を意味カテゴリ別に区分して表示してもよい。他の例として、結果提供部420は、翻訳文の候補文章のうち、ユーザの目的、すなわちユーザが選択した意味カテゴリに分類された候補文章を選別して表示してもよい。さらに他の例として、結果提供部420は、翻訳文の候補文章のうち、ユーザ特性(personality)に適合する意味カテゴリに分類された候補文章を選別して表示してもよい。このとき、ユーザ特性は、インターネット上に散在しているユーザ情報から分析が可能なものであって、例えば、ユーザが頻繁に利用するサービスの種類や頻繁に利用する文体などを分析し、ユーザが使用するであろうと予想される文章の意味カテゴリを類推してもよい。さらに他の例として、結果提供部420は、ユーザから入力された原文の意味カテゴリを自動で分類し、原文に対する翻訳候補文章のうち、原文の意味カテゴリと同一あるいは類似する文章を選別して表示してもよい。
【0038】
上述した構成によると、本発明の機械翻訳システムは、翻訳候補文章に対する生成過程において、下記の表1の例題のように意味的分類に適合する文章を生成または後処理して提供してもよい。
【0040】
したがって、機械翻訳システムは、機械翻訳の候補文章を生成する過程において、候補文章を意味カテゴリに分類することができ、これによってユーザの目的や特性に適合する翻訳文の提供が可能となる。例えば、ニュース記事の原文に対して記事形態の文語体文章を生成したり、SNS(メッセンジャや掲示物など)上の対話に適合する口語体文章を生成したりするなど、多様な意味カテゴリの翻訳文の生成が可能となる。
【0041】
機械翻訳の実現による意味カテゴリ化方法を具体的に説明すると、次のとおりとなる。
【0042】
ルールベース機械翻訳モデル
一般的なルールベース機械翻訳方式は、ソース言語とターゲット言語の言語情報を利用して翻訳ルールを生成し、このような翻訳ルールに適合するように原文に対する翻訳文を生成する。
【0044】
表2の例におけるルールベース翻訳文生成過程は、次のとおりとなる。
1.一般化:[主語][動詞過去][目的語1][目的語2]
2.順序変更:[主語][目的語2][目的語1][動詞過去]
3.言語特性適用:[主語](は)[目的語2][目的語1](を)[動詞過去]
4.翻訳ルール適用:[私]は[水][一杯]を[飲んだ]。
【0045】
これにより、機械翻訳システムは、多様な意味カテゴリ別にルールを生成した後、意味カテゴリに適合する翻訳文章を生成してもよい。言い換えれば、一般的なルールベース機械翻訳方式の翻訳ルールに意味カテゴリによる翻訳ルールを追加してもよい。表2の翻訳文に対し、意味カテゴリによる翻訳ルールを語尾変化に適用したり文章全体に適用したりしてもよく、その結果は次のように例示する。
【0046】
<翻訳例>
未来形ルール:私は水1杯を飲む
つもりだ。
口語体ルール:私は水1杯を飲
みます。
対話体ルール:
私は水を飲む。
省略(縮約)ルール:
水を飲む。
【0047】
このように、意味カテゴリによる翻訳ルールを適用して多数の候補文章を生成した後、生成された候補文章を適切な意味カテゴリに分類してもよい。
【0048】
<分類例>
私は水1杯を飲むつもりだ。→未来形に分類
私は水1杯を飲みます。→口語体に分類
私は水を飲む。→対話体に分類
水を飲む。→縮約語に分類
【0049】
候補文章は、統計的方法またはルール的方法によって分類が可能である。
【0050】
まず、文章分類の統計的方法は、文章が統計的にどのような意味を有するかを推定して分類する方式である。例えば、「私はご飯を食べた」は確率的に文語体に近く、「ご飯食べた」は確率的に口語体に近いと推定されるであろう。
【0051】
次に、文章分類のルール的方法は、文章の構成要素を意味的に分析した後、該当のルールを適用して文章の意味カテゴリの分類を付与する方式である。例えば、「〜だよ」で終わると口語体に分類し、「〜だ」で終わると文語体に分類するなどの簡単なルールから意味的分析による複雑度のある多様なルールまで、どこまでも拡大が可能である。
【0052】
統計ベース機械翻訳モデル
一般的な統計ベースの機械翻訳方式は、翻訳モデル(translation model)構築過程、言語モデル(language model)構築過程、および翻訳モデルと言語モデルを利用した翻訳文選択過程を備える。
【0053】
まず、機械翻訳システムは、互いに異なる2つの言語の翻訳ペアデータを利用して翻訳確率テーブルを構築する。
【0054】
図5は、統計ベース機械翻訳のための翻訳確率テーブル構築過程を示したフローチャートである。一例として、機械翻訳システムは、
図5に示すように、2つの言語の大容量の翻訳ペアデータ(501)から単語間の翻訳確率を推定した後(502)、推定された単語確率によって句(phrase)区間を決定する(503)。そして、機械翻訳システムは、決定された句区間に対して句候補データ(504)から句を抽出し(505)、翻訳確率テーブルを含む翻訳モデル(506)を構築する。
【0055】
そして、機械翻訳システムは、各言語別に、それぞれの言語の大容量データを利用して言語モデルを、文章の自然度に対する確率リストとして構築する。
【0056】
図6は、統計ベース機械翻訳のための言語モデル構築過程を示したフローチャートである。一例として、機械翻訳システムは、
図6に示すように、特定の言語で構成された文章の大容量の言語データ601から各単語列で該当の単語列の確率を推定して(602)格納することにより、文章の自然度に対する確率リストを示す言語モデル(603)を構築する。
【0057】
この後、機械翻訳システムは、このうち言語の翻訳モデルと単一言語の言語モデルを利用して翻訳文を選択してもよい。
【0058】
図7は、翻訳モデルと言語モデルを利用した翻訳文選択過程を説明するための図である。一例として、機械翻訳システムは、
図7に示すように、デコーダ(decoder)(703)によって二言語コーパス(bilingual corpus)から構築された翻訳モデル(Translation Model)(701)と、単一言語コーパス(monolingual corpus)から構築された言語モデル(Language Model)(702)とを利用し、原文に対する翻訳文の多様な候補のうちから最適候補を選択する。
図8は、ドイツ語原文に対する英語翻訳文を選択する過程を示したものであり、
図8で陰影処理された(斜線で囲まれた)単語の列の結合文章は、翻訳モデルにおける句(phrase)確率と言語モデルにおける単語列確率とが同時に高い文章列を意味する。
【0059】
本発明で提案した候補文章生成技術に、上述した統計ベース機械翻訳方式を適用してもよい。
【0060】
一例として、機械翻訳システムは、統計ベース機械翻訳の翻訳文選択方式を適用して原文に対する翻訳文の候補文章をスコア順に整列した後、そのなかからスコアが高い順にN個の候補文章を抽出してもよい。そして、機械翻訳システムは、抽出されたN個の候補文章を適切な意味カテゴリに分類してもよい。このとき、候補文章の意味カテゴリは、統計的方法またはルール的方法によって分類が可能である。これは、上述したルールベースの機械翻訳方式と同じである。
【0061】
これにより、機械翻訳システムは、多様な意味カテゴリに対して各意味カテゴリに適合する言語モデルを追加して構築し、これを機械翻訳に適用することにより、原文に対する翻訳文が確率的に意味カテゴリに適合するように翻訳されるように誘導してもよい。意味カテゴリに対して構築された言語モデルは、大容量の文章が記されたコーパスによって確率的に自然な文章が生成されるようにする役割をするが、このとき、言語モデルを特定の意味カテゴリに適合するように選択的に構築して意味カテゴリに対する確率を推定してもよい。例えば、ツイッター(登録商標)の大容量コーパスを構築して確率テーブルを生成すると、ツイッタースタイルの文章が選択される確率が高くなる。
【0062】
ハイブリッド機械翻訳モデル
一般的なハイブリッド機械翻訳方式は、上述したルールベース機械翻訳方式と統計ベース機械翻訳方式を適切に適用する方式である。ハイブリッド機械翻訳方式でも同じように、原文に対して多様な翻訳候補文章を生成した後、翻訳候補文章を適切な意味カテゴリに分類してもよい。
【0063】
機械翻訳方式においてルールベースと統計ベースのハイブリッドが可能となるため、翻訳候補文章を意味カテゴリに分類する方式でも、ルールベースと統計ベースのハイブリッドが可能となる。
【0064】
要するに、すべての方法(ルールベース、統計ベース、ハイブリッド)を用いる機械翻訳システムは、原文に対する翻訳文を生成する過程において多様な意味カテゴリによる多様な翻訳候補文章を生成することができる。
【0065】
本発明に係る機械翻訳システムは、原文に対する翻訳文を提供する。このとき、意味が同一あるいは類似する多様な候補文章を翻訳結果に含めて提供してもよい。一例として、機械翻訳システムは、原文に翻訳される翻訳文の候補文章をスコア順に整列してN個の文章を抽出し、そのうちからスコアが最も高い最適文章と残りの候補文章を区分して翻訳結果を表示してもよい。このとき、機械翻訳システムは、翻訳結果として最適な文章以外にも、他の候補文章を完全な文章形態で共に含めて提供してもよい。
【0066】
図9では、韓国語を英語に翻訳する翻訳結果画面(900)を例示的に示している。機械翻訳システムは、韓国語で作成された原文
が入力されると、翻訳結果として英語に翻訳された翻訳文(920、930)を表示する。このとき、原文
に対する翻訳結果として、スコアが最も高い最適文章
「That’s all right.」(920)
と、この最適文章と意味が同一あるいは類似する候補文章、すなわち
「No problem.」、
「Never mind.」、
「It doesn’t matter.」(930)
などとを区分して表示してもよい。
【0067】
図10では、英語を韓国語に翻訳する翻訳結果画面(1000)を例示的に示している。機械翻訳システムは、英語で作成された原文
「I’m just looking around.」(1010)
が入力されると、検索結果として韓国語に翻訳された翻訳文(1020、1030)を表示する。このとき、原文
「I’m just looking around.」(1010)
に対する翻訳結果として、スコアが最も高い最適文章
と、この最適文章と意味が同一あるいは類似する候補文章、すなわち
などとを区分して表示してもよい。
【0068】
特に、本発明に係る機械翻訳システムは、翻訳結果に含まれる文章を意味カテゴリ別に区分して表示してもよい。このとき、意味カテゴリとは、文体(文語体、口語体など)、文型(平敍文、請誘文、命令文、敬語、平常語など)、時制(過去形、現在形、未来形など)、言語規範(標準語、方言など)などのように、文章の特徴を分類する基準を意味してもよい。一例として、
図11に示すように、翻訳結果に含まれた文章(1120、1130)に隣接させて各文章が該当する意味カテゴリ1140を表示してもよい。
【0069】
他の例として、本発明に係る機械翻訳システムは、ユーザによって選択された意味カテゴリに適合する候補文章を翻訳結果として表示してもよい。このとき、機械翻訳システムは、多様な翻訳候補文章のうちからユーザが選択した意味カテゴリに該当する文章だけを表示したり多様な翻訳候補文章を表示したりする。そして、ユーザが選択した意味カテゴリの候補文章を他の候補文章と区分して表示してもよい。例えば、
図12に示すように、翻訳結果画面1200の所定の位置に、ユーザから提供される翻訳文の意味カテゴリを指定することができるメニュー環境1250が提供されてもよい。これにより、機械検索システムは、メニュー環境1250へのユーザによる操作によって意味カテゴリが選択された後、選択された意味カテゴリに分類された候補文章を選別して表示してもよい。上述した方式以外にも、原文が入力されると意味カテゴリ選択を要請するポップアップが表示されてもよい。また、翻訳機において事前設定が可能なように環境設定をユーザに提供することで、ユーザが意味カテゴリを予め選択しておくようにしてもよい。
【0070】
さらに、本発明に係る機械翻訳システムは、ユーザが特定の意味カテゴリを選択しなくても、ユーザ特性から、ユーザから提供される翻訳文の意味カテゴリを予測して自動設定してもよい。このとき、ユーザ特性は、インターネット上のユーザ情報から分析が可能であって、例えば、ユーザが頻繁に利用するサービス(例えば、ニュース記事、カフェ、ブログ、メッセンジャなど)や頻繁に利用する文体などを分析してユーザ特性に適合する文章の意味カテゴリを設定してもよい。言い換えれば、ユーザが好む文章の特徴を分析し、翻訳結果の表示時にユーザが好む文章の特徴をユーザ特性に自動で反映してもよい。
【0071】
また、本発明に係る機械翻訳システムは、ユーザから原文が入力されると、原文の文体や文型などの意味カテゴリを自動で分類してもよく、これによって原文に対して生成された翻訳候補文章のうち、原文と意味カテゴリが同一あるいは近い文章を区分して表示してもよい。例えば、原文の意味カテゴリが口語体であって敬語に分類されると、翻訳候補文章のうち、文体と文型が原文と同じで口語体の敬語に分類される文章を翻訳結果として表示してもよい。
【0072】
上述した機械翻訳方法は、
図3〜
図12を参照しながら説明した機械翻訳システムの詳細内容に基づいて2つ以上の動作で行われてもよい。
【0073】
本発明の実施形態に係る方法は、多様なコンピュータシステムによって実行が可能なプログラム命令(instruction)形態で実現され、コンピュータで読み取り可能な媒体に記録されてもよい。
【0074】
本実施形態に係る機械翻訳方法において、原文入力および翻訳文出力と関連するプログラムは、PCベースのプログラムまたはモバイル端末専用のアプリケーションで構成されてもよい。本実施形態における機械翻訳アプリは、独立的に動作するプログラム形態で実現されたり、あるいは特定のアプリケーション(例えば、検索プログラムなど)イン−アプリ(in−app)形態で構成され、前記特定のアプリケーション上で動作が可能なように実現されたりしてもよい。
【0075】
また、本発明の実施形態に係る方法は、翻訳サービスを提供するサーバシステムと関連するアプリケーションがユーザ端末機を制御して実行されてもよい。一例として、このようなアプリケーションは、ユーザから原文が入力されたり提供される翻訳文の意味カテゴリが選択されてサーバシステムに伝達するためのモジュール、およびサーバシステムから受信された翻訳文を出力するためのモジュールを備えてもよい。また、このようなアプリケーションは、ファイル配布システムが提供するファイルによってユーザ端末機にインストールされてもよい。一例として、ファイル配布システムは、ユーザ端末機の要請にしたがって前記ファイルを送信するファイル送信部(図示せず)を備えてもよい。
【0076】
このように、本発明の実施形態によると、原文に対する翻訳文の対訳となる候補文章を完全な形態の文章で提供することができ、翻訳結果に含まれた翻訳文の文章を意味的カテゴリに分類して表示することができ、特に、ユーザの目的や特性に適合する意味カテゴリの翻訳文を選別して提供することができる。
【0077】
上述した装置は、ハードウェア構成要素、ソフトウェア構成要素、および/またはハードウェア構成要素およびソフトウェア構成要素の組み合わせによって実現されるコンピュータシステムであってもよい。例えば、実施形態で説明された移動通信端末機やファイル配布システムまたはその構成要素は、例えば、プロセッサ、コントローラ、ALU(arithmetic logic unit)、デジタル信号プロセッサ(digital signal processor)、マイクロコンピュータ、FPA(field programmable array)、PLU(programmable logic unit)、マイクロプロセッサ、または命令(instruction)を実行して応答することができる他の装置のように、1つ以上の汎用コンピュータシステムまたは特殊目的コンピュータシステムを利用して実現されてもよい。処理装置は、オペレーションシステム(OS)およびオペレーションシステム上で実行される1つ以上のソフトウェアアプリケーションを実行してもよい。また、処理装置は、ソフトウェアの実行に応答し、データをアクセス、保存、操作、処理、および生成してもよい。理解の便宜のために、処理装置は1つが使用されると説明される場合もあるが、この技術分野において通常の知識を有する者は、処理装置が複数の処理要素(processing element)および/または複数類型の処理要素を含んでもよいことを知ることができる。例えば、処理装置は、複数のプロセッサまたは1つのプロセッサおよび1つのコントローラを含んでもよい。また、並列プロセッサ(parallel processor)のような、他の処理構成(processing configuration)も可能である。
【0078】
ソフトウェアは、コンピュータプログラム(computer program)、コード(code)、命令(instruction)、またはこれらのうち1つ以上の組み合わせを含んでもよく、所望するとおりに動作するように処理装置を構成したり、独立的または結合的に(collectively)処理装置を命令してもよい。ソフトウェアおよび/またはデータは、処理装置によって解釈されたり、処理装置に命令またはデータを提供するために、ある類型の機械、構成要素(component)、物理的装置、仮想装置(virtual equipment)、コンピュータ格納媒体または装置、または送信される信号波(signal wave)に永久的にまたは一時的に具体化(embody)されてもよい。ソフトウェアはネットワークによって接続したコンピュータシステム上に分散され、分散した方法によって格納されたり実行されてもよい。ソフトウェアおよびデータは、1つ以上のコンピュータで読み取り可能な記録媒体に格納されてもよい。
【0079】
実施形態に係る方法は、多様なコンピュータ手段によって実行が可能なプログラム命令形態で実現されてコンピュータで読み取り可能な媒体に記録されてもよい。コンピュータで読み取り可能な媒体は、プログラム命令、データファイル、データ構造などを単独または組み合わせて含んでもよい。媒体に記録されるプログラム命令は、実施形態のために特別に設計されて構成されたものであってもよく、コンピュータソフトウェア当業者に公知されて使用可能なものであってもよい。コンピュータで読み取り可能な記録媒体の例としては、ハードディスク、フロッピーディスク、および磁気テープのような磁気媒体(magnetic media)、CD−ROM、DVDのような光記録媒体(optical media)、フロプティカルディスク(floptical disk)のような磁気−光媒体(magneto−optical media)、およびROM、RAM、フラッシュメモリなどのようなプログラム命令を格納して実行するように特別に構成されたハードウェア装置が含まれる。プログラム命令の例としては、コンパイラによって生成されるもののような機械語コードだけではなく、インタプリタなどを使用してコンピュータによって実行される高級言語コードを含む。上述したハードウェア装置は、実施形態の動作を実行するために1つ以上のソフトウェアモジュールとして作動するように構成されてもよく、その逆も同じである。
【0080】
以上のように、実施形態を限定された実施形態と図面に基づいて説明したが、該当する技術分野において通常の知識を有する者であれば、上述した記載から多様な修正および変形が可能であることが理解できるであろう。例えば、説明された技術が説明された方法とは異なる順序で実行されたり、および/または説明されたシステム、構造、装置、回路などの構成要素が説明された方法とは異なる形態で結合または組み合わされたり、他の構成要素または均等物によって対置されたり置換されたとしても、適切な結果を達成することができる。
【0081】
したがって、異なる実施形態であっても、特許請求の範囲と均等なものであれば、添付される特許請求の範囲に属する。