(58)【調査した分野】(Int.Cl.,DB名)
前記計算部は、第1ディレクトリに格納された文書と、該第1ディレクトリの下位に属する第2ディレクトリに格納された文書とを用いて、該第1ディレクトリに対するスコアを計算する
請求項1に記載の辞書選択装置。
【発明の概要】
【発明が解決しようとする課題】
【0004】
本発明の目的は、文書に用いるべき辞書を当該文書とディレクトリとの関係性に基づいて選択できるようにすることにある。
【課題を解決するための手段】
【0005】
本発明の請求項1に係る辞書選択装置は、文書に用いられる複数の辞書のスコアを、文書が格納されているディレクトリ毎に、該ディレクトリに格納されている文書を用いて、
辞書に含まれている第1言語の語句を含む文書の総数と該ディレクトリに格納されている文書の総数で算出したスコアと、前記第1言語の語句の対訳である第2言語の語句を含む文書の総数と該ディレクトリに格納されている文書の総数で算出したスコアから、第1言語の語句と第2言語の語句の組毎にスコアを算出し、前記組毎のスコアからディレクトリ毎に各辞書のスコアを計算する計算部と、前記計算されたスコアに基づいて、あるディレクトリに格納され、又は該ディレクトリに関連付けられた文書に用いられる1又は複数の辞書を選択する選択部とを備える構成である。
【0006】
本発明の請求項2に係る辞書選択装置は、請求項1に記載の構成において、前記計算部が、第1ディレクトリに格納された文書と、該第1ディレクトリの下位に属する第2ディレクトリに格納された文書とを用いて、該第1ディレクトリに対するスコアを計算する構成である。
本発明の請求項3に係る辞書選択装置は、請求項1又は2に記載の構成において、前記選択部により選択された複数の辞書をユーザに選択肢として提示する提示部と、前記提示された複数の辞書のうち特定の辞書を選択する操作を前記ユーザから受け付ける受付部とを備える構成である。
本発明の請求項4に係る辞書選択装置は、請求項3に記載の構成において、前記計算部は、前記受付部により受け付けられた操作
で選択された回数に応じた値を前記スコアに反映させる構成である。
本発明の請求項5に係る辞書選択装置は、請求項1ないし4のいずれか1項に記載の構成において、前記計算部は、文書毎に
複数の辞書のそれぞれのスコアを計算するとともに、ディレクトリ毎
に辞書のそれぞれのスコアを該ディレクトリに格納されている
文書毎に計算した複数の辞書のそれぞれのスコアを用いて計算する構成である。
本発明の請求項6に係る辞書選択装置は、請求項1ないし5のいずれか1項に記載の構成において、前記計算部が、あるディレクトリに文書が新たに格納された場合に、該ディレクトリに対するスコアを再計算する構成である。
【0007】
本発明の請求項7に係る文書変換システムは、文書に用いられる複数の辞書のスコアを、文書が格納されているディレクトリ毎に、該ディレクトリに格納されている文書を用いて、
辞書に含まれている第1言語の語句を含む文書の総数と該ディレクトリに格納されている文書の総数で算出したスコアと、前記第1言語の語句の対訳である第2言語の語句を含む文書の総数と該ディレクトリに格納されている文書の総数で算出したスコアから、第1言語の語句と第2言語の語句の組毎にスコアを算出し、前記組毎のスコアからディレクトリ毎に各辞書のスコアを計算する計算部と、前記計算されたスコアに基づいて、あるディレクトリに格納され、又は該ディレクトリに関連付けられた特定の文書に用いられる1又は複数の辞書を選択する選択部と、前記選択された辞書を用いて前記特定の文書の一部又は全部を変換する変換部とを備える構成である。
【0008】
本発明の請求項8に係るプログラムは、コンピュータに、文書に用いられる複数の辞書のスコアを、文書が格納されているディレクトリ毎に、該ディレクトリに格納されている文書を用いて、
辞書に含まれている第1言語の語句を含む文書の総数と該ディレクトリに格納されている文書の総数で算出したスコアと、前記第1言語の語句の対訳である第2言語の語句を含む文書の総数と該ディレクトリに格納されている文書の総数で算出したスコアから、第1言語の語句と第2言語の語句の組毎にスコアを算出し、前記組毎のスコアからディレクトリ毎に各辞書のスコアを計算するステップと、前記計算されたスコアに基づいて、あるディレクトリに格納され、又は該ディレクトリに関連付けられた文書に用いられる1又は複数の辞書を選択するステップとを実行させるものである。
【0009】
本発明の請求項9に係る文書変換方法は、文書に用いられる複数の辞書のスコアを、文書が格納されているディレクトリ毎に、該ディレクトリに格納されている文書を用いて、
辞書に含まれている第1言語の語句を含む文書の総数と該ディレクトリに格納されている文書の総数で算出したスコアと、前記第1言語の語句の対訳である第2言語の語句を含む文書の総数と該ディレクトリに格納されている文書の総数で算出したスコアから、第1言語の語句と第2言語の語句の組毎にスコアを算出し、前記組毎のスコアからディレクトリ毎に各辞書のスコアを計算し、前記計算されたスコアに基づいて、あるディレクトリに格納され、又は該ディレクトリに関連付けられた特定の文書に用いられる1又は複数の辞書を選択し、前記選択された辞書を用いて前記特定の文書の一部又は全部を変換するものである。
【発明の効果】
【0010】
請求項1、7、8、9に係る発明によれば、文書に用いるべき辞書を当該文書とディレクトリとの関係性に基づいて選択することが可能である。
請求項2に係る発明によれば、文書が格納されている階層構造に応じたスコアを計算することが可能である。
請求項3に係る発明によれば、文書に用いるべき辞書をスコアとユーザの操作と似基づいて選択することが可能である。
請求項4に係る発明によれば、ユーザによって実際に選択されたか否かによって辞書のスコアを変えることが可能である。
請求項5に係る発明によれば、ディレクトリに格納された複数の文書のスコアを参酌して当該ディレクトリのスコアを計算することが可能である。
請求項6に係る発明によれば、スコアに変化がないディレクトリについてもスコアを再計算する場合に比べ、スコアの再計算に要する負荷を軽減させることが可能である。
【発明を実施するための形態】
【0012】
[第1実施例]
図1は、本発明の一実施例に係る文書変換システム10の機能的構成を示すブロック図である。文書変換システム10は、本発明に係る辞書選択装置を含んで構成された情報処理システムである。
【0013】
文書変換システム10は、辞書を用いて文書の一部又は全部を変換するためのシステムである。ここでいう変換は、例えば翻訳、すなわちある言語の語句を別の言語の語句に変換するものであるが、ある語句を共通の意味の別の語句(同義語)に置き換えたり、ある語句の意味や定義などを提示したりするものであってもよい。例えば、文書変換システム10は、ある文書の全文を翻訳したり、ユーザによって指定された特定の箇所の語句の意味や定義を(元の語句とともに)表示したりする。
【0014】
本実施例における文書とは、文字情報を含んだデータ(ファイル)をいう。ここでいう文書は、いわゆるテキストデータ、すなわち文字コード(ASCII、UNICODEなど)によって記述される文字列を含むデータであってもよいが、OCR(Optical Character Recognition)技術を用いた文字認識処理によって文字列を抽出可能な画像データであってもよいし、テキストデータと画像データとが組み合わされて構成されたデータであってもよい。ただし、文書変換システム10は、画像データを含む文書に対して翻訳等の処理を実行する場合には、文字認識処理によって文字列を事前に抽出しておく。
【0015】
また、文書変換システム10は、ディレクトリによって文書を階層的に管理している。本明細書においては、ディレクトリはフォルダと同義であるとする。特に、ディレクトリが視覚的に表現される場合には、これをフォルダと称するのが一般的である。ただし、これらの呼称は、ファイルシステムやOS(Operating System)によって異なり得る。
【0016】
文書変換システム10において、それぞれのディレクトリには、互いに関連性を有する文書が格納される。例えば、同一のディレクトリに格納される文書は、文書の内容(ジャンル、分野、著者、言語など)に共通性を有する。また、文書が複数のユーザ(あるサービスの加入者や企業等の従業員など)によってアクセスされ得る場合であって、当該複数のユーザがいくつかのグループに分類される場合には、それぞれのグループ毎に異なるディレクトリが文書の格納場所として割り当てられる。この場合、同一のグループに属するユーザは、共通の専門分野について研究を行っているとか、趣味・嗜好が共通する、といったように、共通する属性を有している。各ユーザは、自身が属するグループに応じたディレクトリにアクセスし、文書をアップロード又はダウンロードする。
【0017】
また、本実施例における辞書とは、第1の語句と第2の語句とを対応付けて記憶したデータの集合をいう。例えば、ここでいう辞書が英和辞典であれば、第1の語句は英語の単語であり、第2の語句は当該単語に対応する日本語の単語である。文書変換システム10は、複数の辞書を記憶し、適用対象の文書に応じた辞書を選択して変換に用いるように構成されている。
【0018】
なお、本実施例の辞書には、文書毎又はディレクトリ毎にスコアが付与される。ここでいうスコアとは、当該辞書を文書に使用することの適切さを数値化したものをいう。例えば、ある文書に対する第1の辞書のスコアが当該文書に対する第2の辞書のスコアよりも高い場合には、第1の辞書の方が第2の辞書よりも当該文書への使用に適している(可能性が高い)ことを示している。また、ディレクトリに対するスコアは、当該辞書を当該ディレクトリに格納された文書に使用することの適切さを示すものである。なお、ある辞書のある文書に対するスコアと当該文書が格納されたディレクトリに対するスコアとは、必ずしも一致しない。
【0019】
図1に示したように、本実施例に係る文書変換システム10は、文書管理部11と、辞書管理部12と、計算部13と、選択部14と、変換部15と、出力部16とを備える。なお、文書変換システム10は、一のコンピュータ装置によって構成されてもよいが、複数のコンピュータ装置(例えば、サーバ装置とクライアント装置)の協働によって構成されてもよい。
【0020】
文書管理部11は、文書を管理する手段である。文書管理部11は、ユーザの操作に応じて文書のアップロード及びダウンロードを管理する。例えば、文書管理部11は、複数のユーザが文書にアクセスする場合には、ユーザとそのグループ(すなわちディレクトリ)の対応付けに基づいて、文書のアップロード及びダウンロードを管理する。この場合、文書管理部11は、あるユーザが文書にアクセスする場合に、当該ユーザに応じたディレクトリにアクセスするよう制御する。
【0021】
辞書管理部12は、辞書を管理する手段である。また、辞書管理部12は、それぞれの辞書について、文書管理部11により管理されている文書(すなわち格納済みの文書)毎のスコアと各文書が格納されているディレクトリ毎のスコアを管理している。
【0022】
計算部13は、スコアを計算する手段である。計算部13は、辞書管理部12により管理されているそれぞれの辞書について、文書毎及びディレクトリ毎のスコアを計算する。また、計算部13は、文書が新たに追加され、特定のディレクトリに格納された場合に、当該文書に対するスコアを新たに算出するとともに、当該ディレクトリに対するスコアを再計算する。このとき、計算部13は、新たに追加された文書がスコアに影響を与えないディレクトリについては、スコアを再計算しなくてよい。
【0023】
選択部14は、文書に用いる辞書を選択する手段である。選択部14は、計算部13により計算された各辞書のスコアに基づいて、あるディレクトリに格納された文書に用いるのに適した辞書を1又は複数選択する。あるいは、選択部14は、あるディレクトリに関連付けられた文書に用いるのに適した辞書を選択する。ここでいう関連付けは、例えば、ユーザの操作によって行われる。
【0024】
変換部15は、文書の一部又は全部を変換する手段である。変換部15は、選択部14により選択された辞書を用いて、変換対象である文書を変換する。なお、変換部15は、一の文書に対して複数の辞書を個別に用いて複数の変換結果を出力するように構成されてもよい。
【0025】
出力部16は、変換部15による変換結果を出力する手段である。出力部16による出力は、例えば変換結果を表示することを意味するが、変換結果を表すファイルを生成し、これを記録したり他の装置に送信したりすることであってもよい。例えば、出力部16は、ある文書の翻訳結果として別の文書を生成し、PDF(Portable Document Format)などのあらかじめ決められたファイルフォーマットで保存してもよい。
【0026】
図2は、文書変換システム10の具体例である翻訳装置100のハードウェア構成を示すブロック図である。翻訳装置100は、文書を第1言語から第2言語(ここでは、日本語から英語)に翻訳するためのコンピュータ装置である。翻訳装置100は、例えば、パーソナルコンピュータ、スマートフォン、タブレット端末などによって実現される。具体的には、翻訳装置100は、制御部110と、記憶部120と、入力部130と、出力部140と、通信部150とを備える。また、出力部140は、表示部141を含んで構成されている。
【0027】
制御部110は、翻訳装置100の各部の動作を制御する手段である。制御部110は、CPU(Central Processing Unit)などの演算処理装置と主記憶装置に相当するメモリとを備え、プログラムを実行することによってさまざまな処理を実行する。制御部110は、翻訳装置100の各部と協働し、文書変換システム10の文書管理部11、辞書管理部12、計算部13、選択部14及び変換部15に相当する機能を実現する。
【0028】
記憶部120は、データを記憶する手段である。記憶部120は、ハードディスク、フラッシュメモリなどの記憶媒体を備え、制御部110が必要とするデータを記憶する。具体的には、記憶部120は、制御部110が実行するプログラムに加え、文書、辞書、スコアなどを記憶している。記憶部120において、文書は、ディレクトリによって分類された状態で格納されている。
【0029】
入力部130は、ユーザの入力を受け付ける手段である。入力部130は、キーボード(又はキーパッド)やマウスであってもよいが、表示部141がタッチスクリーンディスプレイによって構成される場合であれば、電磁誘導方式、静電容量方式などのタッチセンサを含み得る。入力部130は、ユーザの操作に応じた情報(信号)を制御部110に供給する。
【0030】
出力部140は、情報を出力する手段である。表示部141は、情報を表示(すなわち視覚的に出力)する手段である。表示部141は、液晶などの表示素子によって構成された表示パネルを備え、制御部110からの指示に応じた画像を表示する。また、出力部140は、表示部141のほかに、文書の一部又は全部を音声により再生する手段(スピーカなど)を備えてもよい。
【0031】
通信部150は、ネットワーク又は他のコンピュータ装置と通信を行い、データを送受信する手段である。通信部150による通信は、有線と無線のいずれであってもよい。なお、通信部150は、文書や辞書を外部から受信したり、あるいは外部に送信したりしてもよいが、翻訳装置100にとって必須の構成要素ではない。
【0032】
図3は、翻訳装置100に格納されている文書とそのディレクトリ構造を例示する図である。この例において、フォルダF1は、最上位のディレクトリに相当する。フォルダF1の下位(直下)には、フォルダF2とF4とがあり、さらにフォルダF2の下位にはフォルダF3がある。フォルダF2には文書D1、D2が格納されており、フォルダF2の下位のフォルダF3には文書D3、D4が格納されている。また、フォルダF4には文書D5、D6が格納されており、フォルダF4の下位のフォルダF5には文書D7、D8、D9が格納されている。
【0033】
なお、フォルダ及び文書のそれぞれには、ここでは便宜的な符号のみが示されているが、実際には、ユーザが各々を区別するのに適した名称が付与されている。フォルダ及び文書の名称は、機械的に付与されてもよいし、ユーザの操作によって決定されてもよい。
【0034】
図4は、辞書のスコアの計算方法を示すフローチャートである。なお、
図4に示す処理によって計算されるスコアは、文書毎のスコアである。文書毎のスコアを計算する場合、翻訳装置100の制御部110は、まず、スコアの計算対象である辞書を取得する(ステップSa1)。このとき取得される事象は、典型的には複数であるが、1つのみであってもよい。
【0035】
スコアの計算対象である辞書を取得したら、制御部110は、全ての辞書について繰り返すループ処理(ループ1)と全ての文書について繰り返すループ処理(ループ2)とを順次実行する(ステップSa2、Sa3)。具体的には、制御部110は、ある辞書についてのある文書に対するスコアを計算し(ステップSa4)、これを全ての文書について繰り返す。制御部110は、ステップSa5においてスコアが未計算の文書があるか判断し、スコアが未計算の文書があればステップSa3、Sa4の処理を実行する一方、スコアが未計算の文書がなければこのループ処理を終える。次に、制御部110は、ある辞書について文書毎のスコアの計算が終了したら、ステップSa6において、スコアが未計算の辞書があるか判断し、スコアが未計算の辞書があればステップSa2〜Sa5の処理を繰り返す。
【0036】
なお、文書毎及びディレクトリ毎のスコアの具体的な計算方法としては、例えば、以下の方法が考えられる。文書毎のスコアは、ここでは、「(辞書に収録された第1言語の語句のうち文書に含まれる語句の総数/辞書に収録された第1言語の語句の総数)+(辞書に収録された第2言語の語句のうち文書に含まれる語句の総数/辞書に収録された第2言語の語句の総数)」であるとする。
【0037】
図5は、辞書の一例(辞書A)を示す図である。ここでは、説明の便宜上、辞書Aには2組の語句のみが収録されているものとする。ただし、実際の辞書には、より多くの語句が収録されていてもよい。辞書Aに収録されている語句は、「文書翻訳」とその対訳である「document translation」と、「専門辞書」とその対訳である「specialized dictionary」の4個である。
【0038】
この場合において、ある文書に「文書翻訳」及び「専門辞書」が含まれ、「document translation」及び「specialized dictionary」が含まれていない場合であれば、当該文書に対する辞書Aのスコアは「1(=2/2+0/2)」である。一方、ある文書にこれらの4個の語句が全て含まれている場合であれば、当該文書に対する辞書Aのスコアは「2(=2/2+2/2)」である。この計算方法の場合、スコアの最大値は「2」である。
【0039】
図6〜8は、辞書Aのディレクトリ毎のスコアの計算方法を示す図である。制御部110は、辞書に収録されているそれぞれの語句が含まれているか否かを文書毎に判断する。
図6は、辞書Aに収録されている「文書翻訳」という語句に関するスコアの計算方法を示している。この例において、各ディレクトリのスコア(暫定値)は、「(当該ディレクトリに格納されている当該語句(ここでは文書翻訳)を含む文書の総数)/(当該ディレクトリに格納されている文書の総数)」であるとする。なお、ここにおいて、「当該ディレクトリに格納されている文書」は、当該ディレクトリの下位のディレクトリに格納されている文書をも含むものである。
【0040】
ここで、文書D1、D2、D3、D7に「文書翻訳」が含まれているとすると、フォルダF1、F2、F3、F4、F5のスコアは、それぞれ「0.44」、「0.75」、「0.50」、「0.20」、「0.33」である。ここにおいて、スコアの値は、小数点第3位未満を四捨五入した値としている。
【0041】
図7は、辞書Aに収録されている「document translation」という語句に関するスコアの計算方法を示している。ここでは、当該語句が文書D4、D7に含まれているものとする。そうすると、フォルダF1、F2、F3、F4、F5のスコアは、それぞれ「0.22」、「0.25」、「0.50」、「0.20」、「0.33」である。
【0042】
これらの値を算出したら、制御部110は、各ディレクトリの「文書翻訳」に関するスコアと「document translation」に関するスコアとを加算し、これを「文書翻訳」とその対訳である「document translation」の組に関するスコアとする。すなわち、フォルダF1、F2、F3、F4、F5のスコアは、それぞれ「0.66」、「1.00」、「1.00」、「0.40」、「0.66」である。
【0043】
制御部110は、同様の計算を他の語句についても実行する。
図8は、「専門辞書」とその対訳である「specialized dictionary」の組に関するスコアを示している。この例において、フォルダF1、F2、F3、F4、F5のスコアは、それぞれ「0.56」、「0.75」、「0.50」、「0.40」、「0.33」である。
【0044】
最後に、制御部110は、このようにして得られた各組のスコアの平均値を算出し、これを辞書Aの各ディレクトリに対するスコアとする。この例において、フォルダF1、F2、F3、F4、F5のスコアは、それぞれ「0.61」、「0.88」、「0.75」、「0.40」、「0.50」である。制御部110は、他の辞書についても同様の要領でスコアを算出する。
【0045】
なお、スコアの計算方法は、上述した例に限定されない。例えば、文書毎のスコアは、「辞書に収録された第1言語の語句のうち文書に含まれる語句の総数/辞書に収録された第1言語の語句の総数」と「辞書に収録された第2言語の語句のうち文書に含まれる語句の総数/辞書に収録された第2言語の語句の総数」の和ではなく、平均(相加平均又は相乗平均)としてもよい。また、ディレクトリ毎のスコアを計算する場合において、「当該ディレクトリに格納されている文書」には、当該ディレクトリの下位のディレクトリに格納されている文書を含まないものとしてもよい。
【0046】
翻訳装置100は、このように計算されたスコアを用いて、文書の翻訳を実行する。具体的には、翻訳装置100は、あるフォルダに格納され、又は当該フォルダに関連付けられた文書に用いられる辞書を、当該フォルダのスコアに基づいて選択し、翻訳結果をユーザに提示する。ここにおいて、フォルダに関連付けられた文書とは、当該フォルダ上にドラッグされた文書をいう。この文書は、フォルダに重なるようにドラッグされた後にドロップ(すなわちドラッグ&ドロップ)されると、当該フォルダに格納される。すなわち、ここでいうフォルダに関連付けられた状態の文書とは、当該フォルダに格納される前の文書のことである。
【0047】
図9は、翻訳結果の表示例を示す図である。翻訳装置100は、フォルダのアイコンの上に文書のアイコンがドラッグされると、当該フォルダに対するスコアが最も高い辞書を選択し、当該辞書による翻訳結果を吹き出し等によって表示する。このとき表示される翻訳結果は、翻訳された文書の全体である必要はなく、冒頭などの一部分であってもよい。また、翻訳装置100は、ドラッグされたフォルダに対するスコアが高い辞書をスコア順に複数個選択し、それぞれの辞書による翻訳結果を比較可能に表示してもよい。この場合、翻訳装置100は、表示された翻訳結果を選択する操作を受け付けると、元の文書を翻訳した文書を新たに生成してもよい。
【0048】
図10は、翻訳装置100の翻訳時の動作を示すフローチャートである。翻訳装置100の制御部110は、文書のアイコンをフォルダのアイコンに重なるようにドラッグする操作を受け付けると(ステップSb1)、当該フォルダを特定し、各辞書の当該フォルダに対するスコアを特定する(ステップSb2)。なお、各辞書のスコアは、事前に計算されているものとする。
【0049】
制御部110は、ステップSb2において特定したスコアに基づいて辞書を選択し(ステップSb3)、選択した辞書を用いてドラッグされた文書を翻訳する(ステップSb4)。翻訳が終了したら、制御部110は、翻訳結果を表示部141に表示させる(ステップSb5)。なお、制御部110は、表示部141による表示に代えて、翻訳結果を合成音声によって読み上げてもよい。また、制御部110は、フォルダにドラッグされた文書に限らず、既にフォルダに格納されている文書に対しても、特定の操作を受け付けることによって翻訳結果を表示するようにしてもよい。
【0050】
以上のとおり、本実施例においては、フォルダ(ディレクトリ)にスコアが付与されているため、文書の翻訳に際して当該文書自体にスコアが事前に付与されている必要がない。本実施例においては、文書がいずれかのフォルダに関連付けられれば、当該文書に適用されるべき辞書が自動的に(すなわちユーザの取捨選択によらずに)選択される。また、本実施例においては、文書を格納するフォルダが変わると、当該文書に用いられる辞書も変わり得る。
【0051】
また、本実施例においては、文書の内容によらずに当該文書に用いるべき辞書が選択され得るため、文字認識処理によって文字列を抽出する必要がある文書を翻訳等する場合において、当該文書に用いる辞書を選択する段階では当該文書から文字列が抽出されている必要がない。
【0052】
[第2実施例]
図11は、本発明の別の実施例に係る文書変換システム20の機能的構成を示すブロック図である。文書変換システム20は、本発明に係る辞書選択装置を含んで構成された情報処理システムである。また、文書変換システム20は、第1実施例において例示された文書変換システム10との共通点を有する。本実施例においては、第1実施例と共通する部分については、説明を適宜省略する。
【0053】
文書変換システム20は、文書変換システム10と同様に、辞書を用いて文書の一部又は全部を変換するためのシステムである。ただし、文書変換システム20は、辞書を用いて文書を変換する前に、当該文書に用いるべき辞書の選択肢をユーザに提示し、ユーザによって選択された辞書を用いる点において文書変換システム10と相違する。
【0054】
文書変換システム20は、文書管理部11と、辞書管理部12と、計算部13と、選択部14と、提示部21と、受付部22と、変換部15と、出力部16とを備える。文書変換システム20の構成のうち、文書管理部11、辞書管理部12、計算部13、選択部14、変換部15及び出力部16は、第1実施例において説明された同一の符号の構成要素と共通の構成及び機能を有する。
【0055】
提示部21は、選択部14により選択された辞書をユーザに選択肢として提示する手段である。提示部21は、ユーザに選択肢を提示してその選択を促す。なお、提示部21は、選択部14により選択された辞書が1つのみである場合には、選択肢の提示を行うことなく文書の変換を行うように構成されていてもよい。
【0056】
受付部22は、ユーザの操作を受け付ける手段である。受付部22が受け付ける操作には、提示部21により提示された選択肢の中から特定の辞書を選択する操作が少なくとも含まれるが、他の操作も含まれ得る。
【0057】
図12は、文書変換システム20の具体例である翻訳システム200の構成を示すブロック図である。翻訳システム200は、文書管理装置200Aと翻訳装置200Bとを含んで構成される。文書管理装置200Aと翻訳装置200Bは、インターネット、無線LAN(Local Area Network)などのネットワークを介して接続される。
【0058】
翻訳システム200は、いわゆるクライアント・サーバシステムであり、文書管理装置200Aがサーバ装置に相当し、翻訳装置200Bがクライアント装置に相当する。また、翻訳システム200は、複数のユーザによって辞書や文書が共用される点において第1実施例の翻訳装置100と異なる。文書管理装置200Aには、それぞれユーザが異なる複数の翻訳装置200Bが接続されてもよいし、翻訳装置200Bが複数のユーザによって共用されてもよい。
【0059】
なお、翻訳装置200Bは、ハードウェア的には、第1実施例の翻訳装置100と同様の構成を有する。また、文書管理装置200Aは、サーバ装置としての一般的なハードウェア構成(制御手段、記憶手段、通信手段など)を少なくとも有する。これらの手段は、基本的な構成及び機能は翻訳装置100の制御部110、記憶部120、通信部150と同様である。
【0060】
文書管理装置200Aは、辞書管理部210Aと、文書管理部220と、辞書取得部230と、計算部240と、翻訳情報送信部250とを備える。また、翻訳装置200Bは、辞書管理部210Bと、翻訳情報受信部260と、辞書選択部270と、翻訳部280とを備える。
【0061】
辞書管理部210A、210Bは、文書変換システム20における辞書管理部12に相当する手段である。ただし、辞書管理部210Aによって管理されている辞書は、いずれのユーザも利用可能な辞書である一方、辞書管理部210Bによって管理されている辞書は、各ユーザ(又はグループ)のために個別に用意された辞書である。
【0062】
文書管理部220は、文書変換システム20における文書管理部11に相当する手段である。翻訳システム200においては、文書は(翻訳装置200Bではなく)文書管理装置200Aに記憶されている。また、翻訳システム200においても、文書はディレクトリによって分類された状態で記憶されている。
【0063】
辞書取得部230は、スコアの計算対象である辞書を取得する手段である。辞書取得部230は、辞書管理部210Aによって管理されている辞書に加え、辞書管理部210Bによって管理されている辞書を取得する。
【0064】
計算部240は、文書変換システム20における計算部13に相当する手段である。計算部240は、辞書取得部230により取得された辞書について、文書毎及びディレクトリ毎のスコアを計算する。
【0065】
翻訳情報送信部250は、翻訳情報を送信する手段である。ここにおいて、翻訳情報とは、翻訳の際に利用すべき辞書とそのスコアとを示す情報をいう。翻訳情報送信部250は、翻訳装置200Bのユーザが翻訳対象の文書を選択した場合に、計算部240により計算されたスコアに基づき、当該文書の翻訳に適した辞書を選択する。すなわち、翻訳情報送信部250は、文書変換システム20における選択部14に相当する手段である。なお、翻訳情報送信部250は、文書の翻訳に適した辞書として選択した辞書が辞書管理部210Aに記憶されている場合には、辞書そのものを送信する一方、当該選択した辞書が辞書管理部210Bに記憶されている場合には、当該辞書の識別情報(ファイル名等)を送信する。
【0066】
翻訳情報受信部260は、翻訳情報送信部250により送信された翻訳情報を受信する手段である。辞書選択部270は、翻訳情報受信部260により受信された翻訳情報に基づいて、翻訳の際に利用すべき辞書を選択肢として表示し、ユーザに選択させる手段である。すなわち、辞書選択部270は、文書変換システム20における提示部21及び受付部22に相当する手段である。
【0067】
翻訳部280は、文書変換システム20における変換部15及び出力部16に相当する手段である。翻訳部280は、ユーザによって選択された辞書を用いて文書を翻訳する。本実施例において、翻訳部280は、元の文書を翻訳して新たな文書(以下「翻訳文書」という。)を生成する。
【0068】
図13は、翻訳システム200の翻訳時の動作を示すシーケンスチャートである。本実施例において、ユーザは、文書管理装置200Aの特定のディレクトリに格納されている文書を翻訳する。このとき、翻訳装置200Bは、文書管理装置200Aに格納された文書のいずれかを選択する操作を受け付ける(ステップSc1)。翻訳装置200Bは、文書管理装置200Aに格納された文書を一覧表示するなどして、ユーザの操作を受け付ける。
【0069】
ユーザが文書を選択すると、翻訳装置200Bは、当該文書のファイル名を文書管理装置200Aに送信する(ステップSc2)。このとき、翻訳装置200Bは、自装置に記憶されている辞書があれば、当該辞書をあわせて送信する。文書管理装置200Aは、ステップSc2においてファイル名を受信すると、ユーザが選択した文書をファイル名に基づいて特定し、各辞書の当該文書に対するスコアを特定する(ステップSc3)。文書管理装置200Aは、自装置に記憶された辞書についてはあらかじめスコアを計算しているが、翻訳装置200Bに記憶された辞書については、翻訳装置200Bから受信してからスコアを計算する。ただし、文書管理装置200Aは、ステップSc2より前に、翻訳装置200Bに記憶されている辞書を受信しておき、スコアを事前に計算しておいてもよい。
【0070】
なお、このとき文書管理装置200Aが辞書の評価に用いるスコアは、文書のスコアと当該文書が格納されたディレクトリのスコアのいずれであってもよく、また、これらのスコアを加算したり平均したりしたスコアを評価に用いてもよい。
【0071】
文書管理装置200Aは、ステップSc3において特定したスコアによって各辞書を評価し、ユーザに選択肢として提示する辞書を選択する(ステップSc4)。ここでいう評価は、絶対評価と相対評価のいずれであってもよい。すなわち、文書管理装置200Aは、あらかじめ決められたスコアを上回る辞書を選択してもよいし、あらかじめ決められた数の辞書をスコア順に選択してもよい。文書管理装置200Aは、このようにして翻訳に適した辞書を選択したら、翻訳情報を生成し、ユーザによって選択された文書とともに送信する(ステップSc5)。
【0072】
翻訳装置200Bは、ステップSc5において翻訳情報を受信すると、文書管理装置200Aによって選択された辞書を選択肢として表示する(ステップSc6)。その後、翻訳装置200Bは、選択肢として表示した辞書のいずれかを選択する操作を受け付ける(ステップSc7)。翻訳装置200Bは、ユーザの操作を受け付けると、ユーザが選択した辞書を用いて翻訳を実行する(ステップSc8)。
【0073】
図14は、選択肢の表示例を示す図である。翻訳装置200Bは、文書を翻訳するようにユーザに指示された場合に、このような画面を表示する。この例において、翻訳装置200Bは、文書管理装置200Aによって選択された辞書をそのスコアとともに表示する。ユーザは、表示された辞書のいずれかを選択し、翻訳装置200Bに翻訳の実行を指示する。
【0074】
なお、ユーザは、選択肢として表示された辞書以外の辞書を選択してもよい。例えば、選択肢として表示された辞書よりも適切な辞書がある場合、ユーザは、当該辞書を用いて翻訳するように翻訳装置200Bに対して指示を行ってもよい。
【0075】
[変形例]
本発明の実施の態様は、上述した実施例に限定されない。例えば、本発明は、以下に説明する態様によって実施されてもよい。また、本発明は、上述した実施例と1又は複数の変形例とを組み合わせて実施されてもよいし、2つの実施例の一方に記載された事項を他方に適用してもよい。
【0076】
(1)スコアの計算方法は、実施例に記載されたものに限定されない。例えば、ある辞書のある文書に対するスコアは、当該辞書に収録されている語句が当該文書において使用されている回数(延べ数)を当該文書に含まれる語句の総数で除した値であってもよい。あるいは、あるディレクトリに格納された文書と、当該ディレクトリの下位に属するディレクトリに格納された文書とを用いてスコアを計算する場合、上位のディレクトリに格納されている文書のスコアと下位のディレクトリに格納されている文書のスコアとで重み付けを異ならせてもよい。
【0077】
また、各辞書のスコアには、当該辞書が提示された場合にユーザによって実際に翻訳に使用されたか否か(すなわち、当該辞書を選択する操作が行われたか否か)が反映されてもよい。例えば、各辞書のスコアには、ユーザによって選択された回数に応じた値が加算されてもよい。これにより、ユーザにより多く用いられた辞書のスコアがより大きくなる。
【0078】
(2)スコアの計算タイミングは、特に限定されない。文書変換システム10(又は20)は、文書や辞書が新たに追加される毎にスコアを計算(更新)してもよいが、例えば1時間に1回、1日に1回、といったように、あらかじめ決められた時間間隔でスコアを計算(更新)してもよい。また、文書変換システム10(又は20)は、システムの負荷が比較的低い時間帯(例えば深夜)にスコアの計算を行うようにしてもよい。
【0079】
(3)文書の分類は、人為的に行われてもよいし、機械的に行われてもよい。例えば、文書変換システム10(又は20)は、文書のファイル名、記述された言語、文書中に含まれる単語などによって文書を分類し、それぞれの文書に応じたディレクトリに格納してもよい。また、文書変換システム10(又は20)は、文書の属性を示すメタデータ(タグ等)が当該文書に含まれる場合には、メタデータを用いて文書を分類してもよい。
【0080】
(4)本発明は、辞書選択装置や文書変換システムのほか、コンピュータを本発明に係る辞書選択装置として機能させるためのプログラム、辞書の選択方法などの形態でも提供され得る。また、本発明に係るプログラムは、光記録媒体、半導体メモリなどのコンピュータが読み取り可能な記録媒体に記憶した状態で提供されてもよい。かかるプログラムは、インターネットなどの通信手段を用いてコンピュータ装置にダウンロードされることによって利用可能になるものであってもよい。