(58)【調査した分野】(Int.Cl.,DB名)
前記翻訳手段は、前記区切り記号付語句の区切り記号内の語句が複数個である場合には、前記区切り記号内の複数個の語句のそれぞれの前記第2の言語への翻訳結果が一致するか否か判別し、前記区切り記号の直前の語句の前記第2の言語への翻訳結果とは不一致であるが、前記区切り記号内の複数個の語句が一致すると判別した場合には、前記自動翻訳結果として、前記一致した翻訳結果の一つを前記区切り記号内に残すようにする
ことを特徴とする請求項1に記載の自動翻訳装置。
前記区切り記号付語句の処理をしないとの指定を受け付けたときに、前記検出手段で検出された前記区切り記号付語句の区切り記号内の語句の属性を判定する属性判定手段を備え、
前記翻訳手段は、前記受付手段で前記区切り記号付語句の処理をしないとの指定を受け付けたときには、前記検出手段で検出された前記区切り記号付語句を前記第1の言語の原文通りに逐語翻訳すると共に、少なくとも前記区切り記号内の語句については、前記属性判定手段で判定された属性に応じた注釈を付加して、前記自動翻訳結果を出力する
ことを特徴とする請求項7に記載の自動翻訳装置。
前記翻訳手段は、前記区切り記号内の語句を除去した場合に、区切り記号のみ、または区切り記号と句読点となる場合には、前記区切り記号及び/または句読点をも前記自動翻訳結果から除去する
ことを特徴とする請求項1〜請求項10のいずれかに記載の自動翻訳装置。
前記翻訳手段は、前記区切り記号付語句の区切り記号内の語句が1つである場合には、前記区切り記号内の語句と、前記区切り記号の直前の語句について、前記第2の言語への翻訳結果が一致すると判別した場合には、前記自動翻訳結果として、前記区切り記号と前記区切り記号内の語句を除去したものを出力する
ことを特徴とする請求項1〜請求項11のいずれかに記載の自動翻訳装置。
【発明を実施するための形態】
【0016】
以下、この発明による自動翻訳装置の実施形態を、図を参照しながら説明する。この自動翻訳装置は専用の装置で構成されてもよいが、この実施形態では、例えばパーソナルコンピュータやタブレット型端末、更には、スマートフォンと呼ばれる高機能携帯電話端末に、この発明による自動翻訳装置用プログラムの実施形態をインストールすることで構成される。以下の実施形態は、第1の言語が日本語であって、第2の言語として英語などの外国語を想定した場合である。
【0017】
[第1の実施形態]
図1は、この発明による自動翻訳装置の第1の実施形態の構成例を説明するためのブロック図である。この
図1のブロック図においては、この発明による自動翻訳装置の実施形態の理解を容易にするために、自動翻訳用プログラムで実行する処理部分の一部(要部)も、機能ブロックとして示してある。
【0018】
この実施形態の自動翻訳装置は、コンピュータ(プロセッサ)で構成される制御部101に対して、システムバス100を通じて、メモリ102、ディスプレイインターフェース103、操作入力部インターフェース104、外部入力インターフェース105、原文メモリ106、翻訳条件受付部107、形態素解析部108、翻訳実行部109、翻訳用辞書記憶部110、翻訳結果メモリ111、区切り記号付語句処理部112、のそれぞれが接続されて構成されている。
【0019】
メモリ102は、制御部101で実行される処理を支援するためのプログラムやデータを記憶する。プログラムには、自動翻訳用プログラムを含む。
【0020】
ディスプレイインターフェース103には、例えばLCD(Liquid Crystal Display;液晶ディスプレイ)からなるディスプレイ121が接続されている。
【0021】
また、操作入力部インターフェース104には、ディスプレイ121を構成するLCDの表示画面に重ねて配設されているタッチセンサで構成される操作入力部122が接続されている。ディスプレイ121の表示画面には、各種の入力用画面に含まれるソフトウェアボタン(アイコンボタン)が表示され、これらソフトウェアボタンへの操作を、タッチセンサからなる操作入力部122で検出し、操作入力部インターフェース104を通じて、制御部101に伝達される。制御部101は、操作入力部122での操作入力に応じた処理を行う。なお、操作入力部は、この例のようなタッチセンサを用いるものに限られる訳ではなく、キーボードや操作ボタン群で構成されていても勿論よい。また、マイクロフォンを用いた音声入力であってもよい。
【0022】
外部入力インターフェース105は、例えばUSBメモリのインターフェースや、カード型メモリのインターフェースなどで構成されている。また、外部入力インターフェース105は、光ディスクドライブで構成されていてもよい。この実施形態では、この外部入力インターフェース105を通じて、USBメモリや、光ディスクなどに記憶されている日本語の原文のデータが取り込まれる。
【0023】
原文メモリ106には、利用者により操作入力部122を通じて入力された日本語の原文のデータや、外部入力インターフェース105を通じて取り込まれた日本語の原文のデータが記憶される。
【0024】
翻訳条件受付部107は、利用者により操作入力部122を通じて指定(文字入力として直接入力により指定される場合のほか、選択指定を含む)された翻訳条件が記憶される。この場合、翻訳条件には、翻訳対象の日本語の原文の指定、指定された日本語の原文から、例えば、英語、フランス語、ドイツ語、スペイン語、ロシア語、中国語、韓国語などの外国語のいずれの言語に翻訳するのかの外国語の指定のほか、区切り記号付語句についての冗長性除去の処理を行うか否かの選択指定を含む。ここで、区切り記号付語句についての冗長性除去の処理とは、区切り記号の直前の語句の翻訳結果と、区切り記号内の語句の翻訳結果とが同一となる場合に、その区切り記号と、その区切り記号内語句の翻訳結果とを、最終的な自動翻訳結果に含めないようにする処理である。
【0025】
この実施形態の自動翻訳装置は、区切り記号付語句についての冗長性除去の処理を常に行うのではなく、利用者により「冗長性除去の処理をする」との選択指定がなされたときに行うようにする。このように利用者の選択指定を行えるようにしたのは、翻訳には、意訳は許されずに、原文の逐語翻訳(逐語訳、逐字訳)のままでなければならない場合があることを考慮したものである。なお、区切り記号直前の語句と区切り記号付語句についての一覧を提示し、利用者がその一覧から選択指定を行えるようにしてもよい。
【0026】
形態素解析部108は、翻訳対象の日本語の原文を形態素(言語の意味を持つ最小単位)の列に分割し、それぞれの品詞(名詞、動詞、接続詞、括弧などの区切り記号や句読点などの記号)を判別するようにする。形態素解析部108は、その解析結果の形態素の列とそれぞれの品詞とからなる解析結果情報を翻訳実行部109に送る。形態素解析部108は、形態素として区切り記号や句読点などの記号をも検出するので、区切り記号付語句検出手段の機能を備えるものである。
【0027】
翻訳実行部109は、形態素解析部108からの日本語の原文についての解析結果情報と、翻訳用辞書記憶部110に記憶されている外国語と日本語との対訳辞書とを用いて、指定された日本語の原文について、指定された外国語への自動翻訳を実行する。翻訳用辞書記憶部110には、予め、英語、フランス語、ドイツ語、スペイン語、ロシア語、中国語、韓国語などの外国語のそれぞれについて、日本語の語句との対訳辞書が記憶されている。なお、対訳辞書は、インターネット上のサーバに存在し、随時アップデートされるようにしてもよい。
【0028】
翻訳結果メモリ111は、翻訳実行部109で生成した自動翻訳結果を一時記憶する。そして、この翻訳結果メモリ111の自動翻訳結果は、ディスプレイインターフェース103を通じてディスプレイ121の表示画面に表示されて、利用者に呈示される。
【0029】
区切り記号付語句処理部112は、この実施形態では、利用者から、操作入力部122を通じて、区切り記号付語句についての冗長性除去の処理を行う選択指定を受け付けたときに起動される。そして、区切り記号付語句処理部112は、形態素解析部108での解析結果と、翻訳実行部109での翻訳結果とを受けて、区切り記号付語句の区切り記号内語句の翻訳結果と、当該区切り記号の直前の語句の翻訳結果とを比較し、両者が一致しているか否か判別する。
【0030】
そして、区切り記号付語句処理部112は、区切り記号付語句の区切り記号内語句の翻訳結果と、当該区切り記号の直前の語句の翻訳結果とが一致していると判別したときには、翻訳結果メモリ111に記憶する自動翻訳結果から、区切り記号及び区切り記号内語句についての翻訳結果を削除する(つまり、区切り記号付語句は自動翻訳結果として出力しない)。ここで、翻訳結果が一致する区切り記号内語句の翻訳結果のみを出力しないのではなく、括弧()などの区切り記号を翻訳結果として出力しないのは、区切り記号内語句の翻訳結果を出力しない状態では、区切り記号内に何の語句も存在しない括弧などの区切り記号のみが残って違和感のある自動翻訳結果となるのを避けるためである。
【0031】
また、区切り記号付語句処理部112は、この実施形態では、区切り記号付語句の区切り記号内語句の翻訳結果と、当該区切り記号の直前の語句の翻訳結果とが一致していないと判別したときには、区切り記号及び区切り記号内語句の翻訳結果をそのまま、翻訳結果メモリ111に記憶する自動翻訳結果に含める。
【0032】
なお、
図1の自動翻訳装置の構成において、翻訳条件受付部107、形態素解析部108、翻訳実行部109、区切り記号付語句処理部112は、制御部101がメモリ102に格納されているプログラムを実行することによるソフトウェア処理機能部の構成とすることができるものである。
【0033】
[第1の実施形態の自動翻訳装置の処理動作]
この第1の実施形態においては、自動翻訳の開始に先立ち、利用者により、原文メモリ106に記憶されている日本語の原文のファイルの中から、翻訳の対象とされる日本語の原文のファイルが選択指定される。そして、選択指定された日本語の原文が、
図2に示すように、ディスプレイ121の表示画面121Dの原文表示欄1211に表示される。
【0034】
そして、このディスプレイ121の表示画面121Dには、
図2に示すように、利用者による翻訳条件の選択指定を受け付ける入力欄1212及び1213が表示されている。入力欄1212は、日本語の原文から翻訳結果を得たい第2の言語としての外国語の選択指定を受ける欄であり、利用者は、図示を省略するプルダウンメニューとして提示される翻訳可能な英語、フランス語、ドイツ語、スペイン語、ロシア語、中国語、韓国語などの外国語の中の一つを選択指定することができる。
図2では、英語が選択指定されている場合を示している。
【0035】
入力欄1213は、上述した冗長性除去処理をするか、しないかの選択入力を受け付ける欄であり、利用者は、冗長性除去処理をする場合には、「する」に、冗長性除去処理をしない場合には、「しない」に、それぞれチェックを入力する。
【0036】
この実施形態の自動翻訳装置においては、以上のようにして利用者の操作入力により、上述した翻訳条件の選択指定入力が完了すると、翻訳開始ボタン(アイコンボタン)1214及び翻訳中止ボタン(アイコンボタン)1215が画面に表示されて、利用者により押下操作可能とされる。なお、この実施形態の場合は、翻訳条件の選択指定入力は一括で行われているが、冗長性除去処理をするか、しないかの候補箇所が順次提示され、提示に従って、個別に選択指定入力をすることもできる。もちろん、選択指定した後、選択指定箇所をプレビューできるようにし、利用者がプレビューを確認後、選択指定を完了するようにすることもできる。
【0037】
また、冗長性除去処理をするか、しないかの選択入力を行うのではなく、デフォルトで冗長性除去処理をすることにし、しない場合のみ、その旨を入力するようにしてもよい。その逆に、デフォルトで冗長性除去処理をせず、する場合にのみ、その旨を入力するようにしてもよい。
【0038】
そして、翻訳開始ボタン1214が利用者により押下操作されると、この第1の実施形態の自動翻訳装置における自動翻訳処理動作が開始される。また、翻訳中止ボタン1215が利用者により押下操作されると、自動翻訳処理動作は開始されず、中止される。
【0039】
図3および
図4は、上述の構成の第1の実施形態の自動翻訳装置における自動翻訳処理動作の流れの一例を示すフローチャートである。以下、この
図3および
図4のフローチャートを参照しながら、第1の実施形態の自動翻訳装置における自動翻訳処理動作の例について説明する。なお、この
図3および
図4のフローチャートの各ステップの処理は、制御部101が、翻訳条件受付部107、形態素解析部108、翻訳実行部109、区切り記号付語句処理部112の各機能処理を、メモリ102に格納されているプログラムを実行することでソフトウェア処理とした場合として説明する。
【0040】
先ず、制御部101は、操作入力部122を通じて利用者により翻訳開始ボタン1214が押下操作されて、自動翻訳の開始指示がなされたか否か判別する(ステップS1)。開始指示がなされた場合、制御部101は、冗長性除去処理についての入力欄1213をチェックし(ステップS2)、「冗長性除去処理をする」に選択指定されているか否かを判別する(ステップS3)。
【0041】
ステップS3で、「冗長性除去処理をしない」に選択指定されていると判別したときには、制御部101は、日本語の原文を形態素解析し、逐語翻訳を実行し(ステップS4)、その翻訳結果を翻訳結果メモリ111に書き込むと共に、ディスプレイ121の表示画面121Dの翻訳結果表示欄1216(
図2参照)に、その翻訳結果を表示する(ステップS5)。
【0042】
そして、制御部101は、翻訳対象の日本語の原文の最後まで翻訳が終了したか否か判別し(ステップS6)、終了していないと判別したときには、処理をステップS4に戻し、このステップS4以降の処理を繰り返す。また、ステップS6で、翻訳対象の日本語の原文の最後まで翻訳が終了したと判別したときには、制御部101は、この自動翻訳処理を終了する。
【0043】
そして、ステップS3で、「冗長性除去処理をする」に選択指定されていると判別したときには、制御部101は、日本語の原文を形態素解析する(
図4のステップS11)。次に、制御部101は、形態素解析の結果から、区切り記号付語句を検出したか否か判別する(ステップS12)。
【0044】
このステップS12で、区切り記号付語句を検出してはいないと判別したときには、制御部101は、逐語翻訳を実行し(ステップS13)、その翻訳結果を翻訳結果メモリ111に書き込むと共に、ディスプレイ121の表示画面121Dの翻訳結果表示欄1216(
図2参照)に、その翻訳結果を表示する(ステップS17)。
【0045】
次に、制御部101は、翻訳対象の日本語の原文の最後まで翻訳が終了したか否か判別し(ステップS18)、終了していないと判別したときには、処理をステップS11に戻し、このステップS11以降の処理を繰り返す。
【0046】
そして、ステップS12で、区切り記号付語句を検出したと判別したときには、制御部101は、日本語の原文を逐語翻訳し、区切り記号内の語句の翻訳結果と区切り記号の直前の語句の翻訳結果とを比較し(ステップS14)、両翻訳結果が一致しているか否か判別する(ステップS15)。制御部101は、ステップS15で、区切り記号内の語句の翻訳結果と区切り記号の直前の語句の翻訳結果とが不一致であれば、区切り記号の直前の語句の翻訳結果と、括弧付の語句の翻訳結果のそれぞれとを、翻訳結果メモリ111に書き込むと共に、ディスプレイ121の表示画面121Dの翻訳結果表示欄1216に、その翻訳結果を表示する(ステップS17)。
【0047】
そして、制御部101は、翻訳対象の日本語の原文の最後まで翻訳が終了したか否か判別し(ステップS18)、終了していないと判別したときには、処理をステップS11に戻し、このステップS11以降の処理を繰り返す。
【0048】
また、ステップS15で、区切り記号内の語句の翻訳結果と区切り記号の直前の語句の翻訳結果とが一致していると判別したときには、区切り記号及び区切り記号内の語句の翻訳結果とを、逐語翻訳結果から除去し(ステップS16)、区切り記号の直前の語句の翻訳結果のみを、翻訳結果メモリ111に書き込むと共に、ディスプレイ121の表示画面121Dの翻訳結果表示欄1216に、その翻訳結果を表示する(ステップS17)。
【0049】
そして、制御部101は、翻訳対象の日本語の原文の最後まで翻訳が終了したか否か判別し(ステップS18)、終了していないと判別したときには、処理をステップS11に戻し、このステップS11以降の処理を繰り返す。また、ステップS18で、翻訳対象の日本語の原文の最後まで翻訳が終了したと判別したときには、制御部101は、この自動翻訳処理を終了する。
【0050】
[第1の実施形態における自動翻訳処理結果の具体例]
以上の第1の実施形態における自動翻訳処理における「冗長性除去処理をする」と選択指定されている場合における動作を、
図5に示すように、具体例を挙げて、さらに説明する。
図5は、
図2に示した日本語の原文に含まれる区切り記号付語句について、英語に翻訳した場合の処理例を示すものである。なお、この例では、区切り記号が全て括弧の場合であるが、前述もしたように、区切り記号は、括弧に限られるものではないことは言うまでもない。
【0051】
図5(A)の例は、漢字(図の例は人の名前)に対してその読みが括弧付語句として記述されている場合であり、この場合には、
図5(A)の右側に示すように、逐語翻訳をしたとき、括弧の直前の翻訳結果と括弧内語句の翻訳結果とは、共に「Tanaka」となって一致する。そこで、制御部101は、括弧と翻訳結果、すなわち、括弧記号()及びTanakaを除去した、つまり(Tanaka)を除去した「Tanaka」のみを自動翻訳結果する。
【0052】
また、
図5(B)の例は、漢字に対して、その英語のカタカナ表記が括弧付語句として記述されている場合であり、この場合には、
図5(B)の右側に示すように、逐語翻訳をしたとき、括弧の直前の翻訳結果と括弧内語句の翻訳結果とは、共に「Patent」となって一致する。そこで、制御部101は、括弧と翻訳結果、すなわち、(Patent)を除去した「Patent」のみを自動翻訳結果とする。
【0053】
また、
図5(C)の例は、直前の語句の説明を括弧付語句でするものとして記述されている場合であり、この場合には、
図5(C)の右側に示すように、逐語翻訳をしたとき、括弧の直前の翻訳結果と括弧内語句の翻訳結果とは、通常、不一致となる。なお、
図5(C)の例は、直前の語句の説明として、当該直前の語句を特定するための語句が括弧付語句とされている場合である。この場合には、括弧の直前の翻訳結果と括弧内語句の翻訳結果とは、不一致となるので、制御部101は、逐語翻訳を、そのまま括弧付で、自動翻訳結果として出力する。
【0054】
なお、
図5(C)の例の類型としては、漢字の字画構成などの成り立ちを括弧付注記として説明したり、フォントのない繁体字の中国漢字の説明を括弧付注記として説明したりするものもある。例えば、「薬(草冠に楽)」や、「●(欲の上の冠が不)」などである。
【0055】
上述のように、この実施形態の自動翻訳装置によれば、区切り記号の直前の語句の翻訳結果と、区切り記号内の語句の翻訳結果とを比較し、両者が一致したときに区切り記号及び区切り記号内語句を、自動翻訳結果から除去するようにして、自動翻訳結果の冗長性除去処理をするので、冒頭で説明した従来のように、予め、区切り記号付語句の類型と、各類型に応じた対応テーブルを記憶部に記憶しておく必要がなく、簡単な処理により、自動翻訳結果の冗長性除去処理をすることができる。
【0056】
また、上述した第1の実施形態では、利用者が自動翻訳の用途に応じて冗長性除去処理をするか否かを選択指定することができるので、例えば意訳のできない証明用の自動翻訳などの利用用途の場合には、冗長性除去処理をすることなく、逐語翻訳をすることができて便利である。
【0057】
[第2の実施形態]
上述の第1の実施形態では、冗長性除去処理をしないと利用者により選択指定された場合の翻訳結果については、何等の処理も行わず、単に同一の翻訳結果の語句が、区切り記号付で連続するものとした。しかし、上述したように、同一の翻訳結果の語句が連続する場合であっても、区切り記号の直前の語句と区切り記号付語句との関係としては、「漢字とその読み」や、「漢字と対応する英語のカタカナ表記」のほか、英語とその発音表記(カタカナ表記)など、種々の態様(分類=属性)がある。これは、区切り記号の直前の語句に対する区切り記号付語句の属性の違いとして分類することができる。
【0058】
利用者は、自動翻訳結果として、同一の翻訳結果の語句が、区切り記号付で連続する場合に、原文における区切り記号の直前の語句と区切り記号付語句との関係がどのようなものであったかを知ることができれば便利である。
【0059】
そこで、この第2の実施形態では、冗長性除去処理をしないと利用者により選択指定された場合の翻訳結果について、区切り記号の直前の語句に対する区切り記号付語句の属性の違いに応じた注釈を自動翻訳結果に含ませることができるようにする。
【0060】
図6は、この第2の実施形態の自動翻訳装置の構成例を示すブロック図であり、
図1の第1の実施形態と同一部分には、同一参照符号を付してある。この第2の実施形態の自動翻訳装置においては、第1の実施形態の自動翻訳装置の前述した各処理部に加えて、システムバス100に対して、区切り記号付語句属性判定部113と、テーブル情報記憶部114とが接続される。そして、第1の実施形態の区切り記号付語句処理部112に代えて、区切り記号付語句処理部112Aが設けられる。その他は、第1の実施形態と同様の構成とされる。
【0061】
テーブル情報記憶部114には、
図7に示すように、区切り記号付語句についての前記属性と、それぞれの属性に対する注釈の例との対応テーブルの情報が記憶されている。すなわち、
図7の例について説明すると、区切り記号付語句の例と、その属性と、その属性について翻訳結果に付加する注釈とが、それぞれ対応付けられたものが、テーブル情報記憶部114に記憶されている。この例では、翻訳結果に付加する注釈としては複数通り(図の例では注釈1と注釈2の2通り)が用意されており、後述するように、利用者により、何れの注釈を用いるかを選択指定可能とされている。
【0062】
具体的には、
図7に示すように、区切り記号付語句例No.1の「田中(たなか)」における区切り記号付語句の属性は、直前の「漢字の読み」となり、区切り記号付語句例No.2の「特許(パテント)」における区切り記号付語句の属性は、直前の「漢字の英語訳カタカナ表記」となり、区切り記号付語句例No.3の「Patent(特許)」における区切り記号付語句の属性は、直前の「英語の日本語訳」となり、区切り記号付語句例No.4の「Patent(パテント)」における区切り記号付語句の属性は、直前の「英語の日本語訳カタカナ表記」となり、区切り記号付語句例No.5の「特許(Patent)」における区切り記号付語句の属性は、直前の「漢字の英語訳」となる。
【0063】
そして、
図7の例においては、注釈の一つ(注釈1)は、記号*と数字とを組み合わせた態様であり、また、注釈の他の態様(注釈2)は、上記の属性を翻訳結果の言語に翻訳したものとされる。なお、この例では、注釈2は、上記の属性を簡略に翻訳したものとして、注釈が長くなって冗長になるのを避けるようにしている。このため、
図7の注釈2の英語例では、区切り記号付語句例No.2〜No.5は、全て「translation」とされるが、それぞれを区別するために、「translation」のそれぞれに、語句例の数字番号が付加されている。
【0064】
以上の区切り記号付語句の例は、逐語翻訳の結果が、区切り記号の直前の語句と区切り記号内語句とで同一となる場合の例であるが、区切り記号付語句には、前述したように、逐語翻訳の結果が、区切り記号の直前の語句と区切り記号内語句とで不一致となる場合もある。しかし、この実施形態では、逐語翻訳の結果が、区切り記号の直前の語句と区切り記号付語句とで同一となる場合についてのみ注釈を翻訳結果に付加することが可能とされている。
【0065】
すなわち、この実施形態では、
図7に示すように、テーブル情報としては、区切り記号付語句例No.6のように、区切り記号の直前の語句と区切り記号内語句とで不一致となる例については、テーブル情報には、その属性は記憶されているが、注釈は定義されず、記憶されない。すなわち、この実施形態では、区切り記号の直前の語句と区切り記号内語句とで不一致となる区切り記号付語句例については、注釈は付加しないからである。
【0066】
なお、
図7では注釈2として英語の場合のみを示したが、この実施形態において、日本語から翻訳される英語、フランス語、ドイツ語、スペイン語、ロシア語、中国語、韓国語などの外国語の全てについて、注釈2が用意されていてもよいことは言うまでもない。
【0067】
また、この第2の実施形態では、注釈1が利用者により選択指定されて、自動翻訳結果に当該注釈1の「記号*と数字の組み合わせ」が付加されたときには、当該付加された注釈1のそれぞれを利用者がクリックすると、その付加された注釈1に対応する属性が何であるかを、翻訳結果の言語による
図7の属性の翻訳が、例えばポップアップ表示されるように構成されている。同様にして、注釈2が利用者により選択指定された場合において、「translation 数字番号」を利用者がクリックすると、その付加された注釈2の「translation 数字番号」に対応する属性が何であるかを、翻訳結果の言語による
図7の属性の翻訳が、例えばポップアップ表示されるように構成されている。
【0068】
区切り記号付語句属性判定部113は、この第2の実施形態では、利用者から、操作入力部122を通じて、区切り記号付語句についての冗長性除去の処理を行わないとの選択指定を受け付けたときであって、注釈を付与すると選択指定されたときに起動される。そして、区切り記号付語句属性判定部113は、起動されたときには、形態素解析部108での解析結果として括弧付語句が検出されたときに、区切り記号付語句の当該区切り記号の直前の語句に対する属性を判定する。そして、区切り記号付語句属性判定部113は、その判定結果の属性情報を、区切り記号付語句処理部112Aに転送する。
【0069】
区切り記号付語句処理部112Aは、第1の実施形態の区切り記号付語句処理部112と同様の処理を実行する他、この第2の実施形態においては、利用者から、操作入力部122を通じて、区切り記号付語句についての冗長性除去の処理を行わないとの選択指定を受け付けたときであって、注釈を付与すると選択指定されたときには、区切り記号付語句属性判定部113からの判定結果の属性情報を受けて、利用者により選択指定された注釈を、自動翻訳結果に付加する処理を実行する。
【0070】
[第2の実施形態の自動翻訳装置の処理動作]
この第2の実施形態においても、自動翻訳の開始に先立ち、利用者による、原文メモリ106に記憶されている日本語の原文のファイルの中からの、翻訳の対象の原文のファイルの選択指定を受け付け、また、日本語から翻訳する外国語の選択指定を受け付けると共に、区切り記号付語句について冗長性除去処理をするか、しないかの選択入力を受け付ける。
【0071】
さらに、この第2の実施形態においては、区切り記号付語句について冗長性除去処理をしないと選択指定されたときには、区切り記号付語句についての注釈付加処理をするか否かの選択指定を受け付けると共に、区切り記号付語句についての注釈付加処理をすると選択指定された場合には、注釈1または注釈2のいずれの注釈を付加するかの選択指定を受け付ける。
【0072】
そして、この第2の実施形態の場合、利用者の操作入力に基づいて上述した翻訳条件の選択指定入力が完了すると、翻訳開始ボタン(アイコンボタン)が画面に表示され、その翻訳開始ボタンが利用者により押下操作されると、この第2の実施形態の自動翻訳装置における自動翻訳処理動作が開始される。
【0073】
図8および
図9は、上述の構成の第2の実施形態の自動翻訳装置における自動翻訳処理動作の流れの一例を示すフローチャートである。以下、この
図8および
図9のフローチャートを参照しながら、第2の実施形態の自動翻訳装置における自動翻訳処理動作の例について説明する。なお、この
図8および
図9のフローチャートの各ステップの処理は、制御部101が、翻訳条件受付部107、形態素解析部108、翻訳実行部109、区切り記号付語句処理部112A、区切り記号付語句属性判定部113の各機能処理を、メモリ102に格納されているプログラムを実行することでソフトウェア処理とした場合として説明する。
【0074】
先ず、制御部101は、操作入力部122を通じて利用者により翻訳開始ボタン1214が押下操作されて、自動翻訳の開始指示がなされたか否か判別する(ステップS21)。開始指示がなされた場合、制御部101は、冗長性除去処理についての入力欄1213をチェックし(ステップS22)、「冗長性除去処理をする」に選択指定されているか否かを判別する(ステップS23)。
【0075】
ステップS23で、「冗長性除去処理をする」に選択指定されていると判別したときには、制御部101は、第1の実施形態の場合と同様に、
図4のフローチャートに示した処理を実行するようにする。ここでは、重複を避けるため説明を省略する。
【0076】
そして、ステップS23で、「冗長性除去処理をしない」に選択指定されていると判別したときには、制御部101は、利用者により、「注釈を付加する」と選択指定されているか否か判別する(ステップS24)。
【0077】
このステップS24で、「注釈を付加しない」と選択指定されていると判別したときには、制御部101は、日本語の原文を形態素解析して、逐語翻訳を実行し(ステップS25)、その翻訳結果を翻訳結果メモリ111に書き込むと共に、ディスプレイ121の表示画面121Dの翻訳結果表示欄1216(
図2参照)に、その翻訳結果を表示する(ステップS26)。
【0078】
そして、制御部101は、翻訳対象の日本語の原文の最後まで翻訳が終了したか否か判別し(ステップS27)、終了していないと判別したときには、処理をステップS25に戻し、このステップS25以降の処理を繰り返す。また、ステップS27で、翻訳対象の日本語の原文の最後まで翻訳が終了したと判別したときには、制御部101は、この自動翻訳処理を終了する。
【0079】
ステップS24で、「注釈を付加する」と選択指定されていると判別したときには、制御部101は、日本語の原文を形態素解析し(
図9のステップS31)、その形態素解析の結果から、区切り記号付語句を検出したか否か判別する(ステップS32)。
【0080】
このステップS32で、区切り記号付語句を検出してはいないと判別したときには、制御部101は、逐語翻訳を実行し(ステップS33)、その翻訳結果を翻訳結果メモリ111に書き込むと共に、ディスプレイ121の表示画面121Dの翻訳結果表示欄1216(
図2参照)に、その翻訳結果を表示する(ステップS36)。
【0081】
次に、制御部101は、翻訳対象の日本語の原文の最後まで翻訳が終了したか否か判別し(ステップS37)、終了していないと判別したときには、処理をステップS31に戻し、このステップS31以降の処理を繰り返す。
【0082】
そして、ステップS32で、区切り記号付語句を検出したと判別したときには、制御部101は、当該区切り記号付語句の属性を判定する(ステップS34)。そして、制御部101は、区切り記号の直前の語句及び区切り記号付語句を順次に逐語翻訳すると共に、ステップS34で判定した属性によりテーブル情報記憶部114を参照して、区切り記号内の語句の翻訳結果に付与する注釈を、判定した属性に応じて決定して付加する(ステップS35)。ここで、注釈1あるいは注釈2のいずれを付加するかは、前述したように、翻訳開始前に利用者により選択指定されているので、その選択指定されている方の注釈を付加する。
【0083】
なお、前述したように、区切り記号付語句の属性によっては、注釈を付加する必要がない場合があることは、前述した通りである。
【0084】
次に、制御部101は、区切り記号の直前の語句の翻訳結果と、区切り記号付語句の翻訳結果と、必要に応じて付加された注釈とを、翻訳結果メモリ111に書き込むと共に、ディスプレイ121の表示画面121Dの翻訳結果表示欄1216に、その翻訳結果を表示する(ステップS36)。
そして、制御部101は、翻訳対象の日本語の原文の最後まで翻訳が終了したか否か判別し(ステップS37)、終了していないと判別したときには、処理をステップS31に戻し、このステップS31以降の処理を繰り返す。また、ステップS37で、翻訳対象の日本語の原文の最後まで翻訳が終了したと判別したときには、制御部101は、この自動翻訳処理を終了する。
【0085】
[注釈付加の具体例]
以上の第2の実施形態における自動翻訳処理における「冗長性除去処理をしない」場合において実行される注釈の付加処理の具体例を、
図10に示す。
図10は、日本語の原文に含まれる区切り記号付語句について、英語に翻訳した場合の処理例を示すものである。なお、この例では、区切り記号が全て括弧の場合であるが、前述もしたように、区切り記号は、括弧に限られるものではないことは言うまでもない。また、注釈1は、区切り記号内において、区切り記号内語句の直後に付加され、注釈2は、区切り記号内において、区切り記号内語句の直後に[]付で付加される。
【0086】
図10(A)の例は、
図7において、区切り記号付語句例No.1の、属性が漢字の読みの場合であり、この場合には、
図10(A)の右側に示すように、利用者により注釈1が選択指定されているときには、「*1」が括弧内語句の直後に付加され、また、利用者により注釈2が選択指定されているときには、[translation 2]が括弧内語句の直後に付加される。
【0087】
また、
図10(B)の例は、
図7において、区切り記号付語句例No.2の、属性が漢字の英語訳カタカナ表記の場合であり、この場合には、
図10(B)の右側に示すように、利用者により注釈1が選択指定されているときには、「*2」が括弧内語句の直後に付加され、また、利用者により注釈2が選択指定されているときには、[translation 2]が括弧内語句の直後に付加される。
【0088】
そして、この第2の実施形態では、
図10では、図示は省略するが、表示画面に表示されている注釈1の「*1」や「*2」を利用者がクリックすると、対応する区切り記号付語句属性が、例えばポップアップ表示される。同様に、表示画面に表示されている注釈2の[translation 1]や[translation 2]を利用者がクリックすると、対応する区切り記号付語句属性が、例えばポップアップ表示される。
【0089】
[第2の実施形態の効果]
第2の実施形態の自動翻訳装置によれば、第1の実施形態の自動翻訳装置と同様の効果が得られると共に、冗長性除去処理をしないとした場合において、区切り記号の直前の語句の翻訳結果と区切り記号内の語句の翻訳結果が同一となる場合においても、区切り記号内の語句についての翻訳結果に、区切り記号付語句の属性に応じた注釈が付加されることで、原文において、区切り記号付語句が直前の語句に対してどのような関係となっているかを容易に理解することができて便利であるという効果がある。
【0090】
そして、上述の第2の実施形態の自動翻訳装置によれば、自動翻訳結果に付加されている注釈を利用者が指示することにより、当該注釈が意味する属性についての詳細な情報が、利用者に提示されるので、非常に便利であるという効果もある。
【0091】
[第2の実施形態の変形例]
上述の第2の実施形態の説明では、注釈は、区切り記号内語句についてのみ付加するようにしたが、区切り記号の直前の語句と、区切り記号内の語句との両方に対して注釈を付加するようにすることにより、区切り記号付語句の、その直前の語句との関係を、より詳しく示すことができる。例えば
図11は、そのように注釈を付加表示する場合の一例であり、日本語の原文に含まれる区切り記号付語句について、英語に翻訳した場合の処理例を示すものである。
【0092】
図11(A)の例は、
図7において、区切り記号付語句例No.1の、属性が漢字の読みの場合であり、この場合には、
図11(A)の右側に示すように、区切り記号(括弧)の直前の漢字「田中」の翻訳結果「Tanaka」には[kanji]が直後に付加され、区切り記号内(括弧内)の読み「たなか」の翻訳結果「Tanaka」には[kana]が直後に付加される。これにより、日本語の原文では、区切り記号付語句が、漢字の読みであったことが容易に理解できるようになる。
【0093】
また、
図11(B)の例は、
図7において、区切り記号付語句例No.3の、属性が英語の日本語訳の場合であり、この場合には、
図11(B)の右側に示すように、区切り記号(括弧)の直前の英語「Patent」の翻訳結果「Patent」には[English]が直後に付加され、区切り記号内(括弧内)の日本語訳「特許」の翻訳結果「Patent」には[Japanese]が直後に付加される。これにより、日本語の原文では、区切り記号付語句が、英語の日本語訳であったことが容易に理解できるようになる。もちろん、英語のフランス語訳の場合、[French]が付加され、ドイツ語訳の場合、[German]が付加される。
【0094】
[その他の実施形態又は変形例]
上述の第2の実施形態では、注釈は、区切り記号の直前の語句の翻訳結果と、区切り記号内語句の翻訳結果とが同一になる場合にのみ、自動翻訳結果に付加するようにしたが、区切り記号の直前の語句の翻訳結果と、区切り記号内語句の翻訳結果とが不一致になる場合にも、区切り記号付語句属性判定部113で判定した属性に応じた注釈を付加するようにしてもよい。
【0095】
また、区切り記号付語句が、読みが難しい漢字のルビの場合、区切り記号の直前の語句の翻訳結果と、区切り記号内語句の翻訳結果とが不一致になるが、外国語への翻訳の場合には、そのルビの翻訳は不要であるので、自動翻訳結果に、当該ルビの翻訳結果を含めないようにしてもよい。
【0096】
上述の実施形態では、区切り記号付語句の区切り記号内語句が1つの場合について説明したが、「、」(カンマ、コンマ)、「:」(コロン)、「;」(セミコロン)、「。」などの句読点で区切られて、区切り記号内語句が複数の場合であっても適用できる。この場合には、区切り記号直前の語句の翻訳結果と、区切り記号内の複数の語句のそれぞれの翻訳結果との一致、不一致を判定すると共に、区切り記号内の複数の語句のそれぞれの翻訳結果同士の一致、不一致をも判定するようにする。
【0097】
なお、区切り記号内語句が句読点で区切られていない場合には、当該句読点で区切られていない語句の全体を1つの語句として扱って、区切り記号の直前の語句との間での翻訳結果の一致、不一致の判定をするようにするのは、上述の第1の実施形態と同様である。
【0098】
そして、区切り記号直前の語句と、区切り記号内の複数の語句のそれぞれとの翻訳結果の全てが一致した場合には、区切り記号及び区切り記号内の複数の語句の翻訳結果を、自動翻訳結果から除去するようにする。
【0099】
また、区切り記号直前の語句の翻訳結果と、区切り記号内の複数の語句の翻訳結果とは一致しないが、区切り記号内の複数の語句の翻訳結果同士は互いに一致する場合には、区切り記号は翻訳結果として残すと共に、その区切り記号内には、一致した1個の翻訳結果を残すようにする。
【0100】
さらに、区切り記号直前の語句の翻訳結果と、区切り記号内の複数の語句の翻訳結果との全てではなく、区切り記号内の複数の語句の翻訳結果の一部とが一致する場合には、区切り記号は翻訳結果として残すと共に、その区切り記号内には、一致した翻訳結果は除去するようにする。
【0101】
具体例を挙げてさらに説明する。例えば、「Patent(特許、パテント)」に対して、第1の実施形態において、冗長性除去処理をしないで自動翻訳する場合は、逐語翻訳結果は「Patent(Patent、Patent)」となり、区切り記号直前の語句と、区切り記号内の複数の語句のそれぞれとの翻訳結果の全てが一致する。このため、冗長性除去処理をすると、区切り記号内語句の「Patent」と、2つの「Patent」の間の「、」と、区切り記号()が除去され、つまり、(Patent、Patent)が除去され、「Patent」となる。なお、第2の実施形態では、区切り記号内語句が複数の場合には、例えば、
図7の注釈1にしたがえば、「Patent(Patent*3、Patent*4)」となり、注釈2にしたがえば、「Patent(Patent[translation 3]、Patent[translation 4])」となる。
【0102】
また、例えば「LCD(Liquid Crystal Display;液晶ディスプレイ)」に対して、冗長性除去処理をしないで自動翻訳(逐語翻訳)する場合には、「LCD(Liquid Crystal Display;Liquid Crystal Display)」または「LCD(Liquid Crystal Display;LCD)」となる。一方、この発明の冗長性除去処理をすると、前者の場合は、区切り記号内の複数の語句が互いに「Liquid Crystal Display」となるので一致が判定され、重複が避けられて翻訳結果が一つになるよう、区切り記号内語句の翻訳結果の内の一つの「Liquid Crystal Display」と句読点「;」を除去し、翻訳結果は、「LCD(Liquid Crystal Display)」となる。後者の場合は、区切り記号の直前の語句と区切り記号内の複数の語句の一部との一致が判定され、一致した区切り記号内語句「LCD」と「;」とを除去し、翻訳結果は「LCD(Liquid Crystal Display)」となる。
【0103】
さらに、他の例として、「プラトン(Platon、紀元前427年−紀元前347年)」に対して、冗長性除去処理をしないで自動翻訳する場合、「Platon(Platon、B.C.427−B.C.347)」となるが、冗長性除去処理をすると、「Platon(B.C.427−B.C.347)」となる。
【0104】
なお、上述の実施形態では、第1の言語が日本語の場合について説明したが、第1の言語は、日本語に限られるものではないことは勿論であり、英語、フランス語、ドイツ語、スペイン語、ロシア語、中国語、韓国語などであってもよい。また、第2の言語は、英語に限られるものではないことは勿論であり、日本語、フランス語、ドイツ語、スペイン語、ロシア語、中国語、韓国語などであってもよい。
【0105】
また、上述の実施形態では、区切り記号付語句の存在を前提としていたが、フォントを通常の書体にイタリック体などの別の書体を挿入することで、区切り記号がなくても、区切り記号付語句と同様の効果を得ることもできる。この場合、イタリック体などの別の書体自体を区切り記号付語句とみなすことができる。
【0106】
なお、この発明による自動翻訳装置や自動翻訳プログラムは、パーソナルコンピュータやタブレット型端末、スマートフォンなどの携帯電話端末に適用されるばかりではなく、腕時計型端末、眼鏡型端末、カーナビゲーション、券売機、案内板、電子掲示板、電子メニュー、デジタルサイネージ、各種表示装置などにも適用されるのは勿論である。