IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ パナソニックIPマネジメント株式会社の特許一覧

<>
  • 特許-翻訳装置 図1
  • 特許-翻訳装置 図2
  • 特許-翻訳装置 図3
  • 特許-翻訳装置 図4
  • 特許-翻訳装置 図5
  • 特許-翻訳装置 図6
  • 特許-翻訳装置 図7
  • 特許-翻訳装置 図8
  • 特許-翻訳装置 図9
  • 特許-翻訳装置 図10
  • 特許-翻訳装置 図11
  • 特許-翻訳装置 図12
  • 特許-翻訳装置 図13
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-07-25
(45)【発行日】2024-08-02
(54)【発明の名称】翻訳装置
(51)【国際特許分類】
   G06F 40/55 20200101AFI20240726BHJP
   G06F 40/51 20200101ALI20240726BHJP
   G06F 40/242 20200101ALI20240726BHJP
【FI】
G06F40/55
G06F40/51
G06F40/242
【請求項の数】 8
(21)【出願番号】P 2021524710
(86)(22)【出願日】2020-04-24
(86)【国際出願番号】 JP2020017824
(87)【国際公開番号】W WO2020246175
(87)【国際公開日】2020-12-10
【審査請求日】2023-04-06
(31)【優先権主張番号】P 2019104680
(32)【優先日】2019-06-04
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】314012076
【氏名又は名称】パナソニックIPマネジメント株式会社
(74)【代理人】
【識別番号】100106518
【弁理士】
【氏名又は名称】松谷 道子
(74)【代理人】
【識別番号】100132241
【弁理士】
【氏名又は名称】岡部 博史
(74)【代理人】
【識別番号】100135703
【弁理士】
【氏名又は名称】岡部 英隆
(74)【代理人】
【識別番号】100199314
【弁理士】
【氏名又は名称】竹内 寛
(72)【発明者】
【氏名】石川 智一
【審査官】成瀬 博之
(56)【参考文献】
【文献】国際公開第2019/016985(WO,A1)
【文献】国際公開第2018/198806(WO,A1)
【文献】特開2015-121992(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 40/20-40/58
(57)【特許請求の範囲】
【請求項1】
第1の言語における入力文を取得し、前記第1の言語から第2の言語への機械翻訳を実行する外部装置と通信して、前記入力文の翻訳結果を示す翻訳文を出力する翻訳装置であって、
前記第1の言語の置換対象の用語と、前記置換対象の用語に対する前記第2の言語の訳語とを対応づけて含む第1の辞書情報、及び、前記置換対象の用語の代わりに使用される、互いに異なる文字列で構成された複数の代替用語を含む第2の辞書情報を記憶する記憶部と、
前記入力文に含まれる前記置換対象の用語を前記代替用語に置換して、置換結果を示す置換文を生成する制御部と、
前記置換文を前記外部装置に出力し、前記外部装置から前記第2の言語における前記置換文の翻訳結果を取得する通信部とを備え、
前記代替用語は、特定の文字列で構成され、
前記制御部は、
前記通信部から取得した置換文の翻訳結果において当該特定の文字列を検知して、
検知した文字列を、前記第1の辞書情報において前記置換対象の用語に対応づけられた訳語に置換して、前記翻訳文を生成し、
前記制御部は、前記通信部から取得した置換文の翻訳結果において、前記置換文に用いた文字列がないことを検知すると、当該文字列の代替用語とは異なる代替用語を用いて再度、前記置換文を生成して前記通信部に出力させる
翻訳装置。
【請求項2】
前記特定の文字列は、当該文字列における先頭と末尾にそれぞれ配置される所定の記号と、前記先頭の記号と前記末尾の記号との間に並んだ互いに同種の複数文字とを含む
請求項1に記載の翻訳装置。
【請求項3】
第1の言語における入力文を取得し、前記第1の言語から第2の言語への機械翻訳を実行する外部装置と通信して、前記入力文の翻訳結果を示す翻訳文を出力する翻訳装置であって、
前記第1の言語の置換対象の用語と、前記置換対象の用語に対する前記第2の言語の訳語とを対応づけて含む第1の辞書情報、及び、前記第1の言語において前記置換対象の用語の代わりに使用される複数の代替用語と、各代替用語に対する前記第2の言語の訳語とを対応づけて含む第2の辞書情報を記憶する記憶部と、
前記入力文に含まれる前記置換対象の用語を前記代替用語に置換して、置換結果を示す置換文を生成する制御部と、
前記置換文を前記外部装置に出力し、前記外部装置から前記第2の言語における前記置換文の翻訳結果を取得する通信部とを備え、
前記制御部は、
前記通信部から取得した置換文の翻訳結果において、前記代替用語の訳語があるか否かを判断し、
前記代替用語の訳語がないと判断した場合、前記第2の辞書情報において当該訳語に対応付けられた代替用語とは異なる代替用語を用いて再度、前記置換文を生成して前記通信部に出力させ、
前記代替用語の訳語があると判断した場合、当該訳語を、前記第1の辞書情報において前記置換対象の用語に対応づけられた訳語に置換して、前記翻訳文を生成する
翻訳装置。
【請求項4】
前記複数の代替用語は、特定の文字列で構成された代替用語を含み、
前記第2の辞書情報は、前記特定の文字列で構成された代替用語の訳語として、当該文字列と同じ文字列を含む
請求項に記載の翻訳装置。
【請求項5】
前記第2の辞書情報は、前記複数の代替用語における優先順位を管理し、
前記制御部は、前記複数の代替用語において前記優先順位が高い代替用語から順番に、前記置換文に用いる
請求項1~4のいずれか1項に記載の翻訳装置。
【請求項6】
前記置換対象の用語は、固有名詞を含む
請求項1~のいずれか1項に記載の翻訳装置。
【請求項7】
前記第2の辞書情報は、用語の種別を示すクラス毎に前記代替用語を分類しており、
前記制御部は、前記入力文に含まれる置換対象の用語と同じクラスに分類された代替用語を用いて、前記置換文を生成する
請求項1~のいずれか1項に記載の翻訳装置。
【請求項8】
発話を入力する音声入力部をさらに備え、
前記通信部は、前記発話の音声データを外部の音声認識装置に出力し、前記音声認識装置から前記音声データに対する前記入力文を取得する
請求項1~のいずれか1項に記載の翻訳装置。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、一の言語で入力した文章を他の言語に翻訳する翻訳装置に関する。
【背景技術】
【0002】
特許文献1は、ユーザにより入力された英語のテキストを日本語のテキストに翻訳する電子辞書装置を開示している。この電子辞書装置は、事前に登録しておいた登録単語が、入力された英語のテキスト中に含まれている場合は、翻訳結果である日本語のテキスト内において登録単語に対応する訳語を英語に置き換えて表示している。すなわち、登録単語については英語の状態で表示し、登録単語以外の部分については日本語に翻訳された状態で表示している。例えば、「cheap」が登録単語として登録されていた場合、「This is a cheap bag.」の翻訳結果として、「これは、cheapかばんです。」を出力している。さらに、特許文献1の電子辞書装置は、訳/決定キーの押下に応じて、英語及び日本語のテキスト中の登録単語及びその訳語を下線付きで表示している。これにより、ユーザが、登録単語についての語学学習をできるようにしている。
【先行技術文献】
【特許文献】
【0003】
【文献】特許第4929632号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
本開示は、第1の言語から第2の言語への機械翻訳を用いて入力文の翻訳結果を示す翻訳文を得易くすることができる翻訳装置を提供する。
【課題を解決するための手段】
【0005】
本開示の一態様に係る翻訳装置は、第1の言語における入力文を取得し、第1の言語から第2の言語への機械翻訳を実行する外部装置と通信して、入力文の翻訳結果を示す翻訳文を出力する。翻訳装置は、記憶部と、制御部と、通信部とを備える。記憶部は、第1の言語の置換対象の用語と、置換対象の用語に対する第2の言語の訳語とを対応づけて含む第1の辞書情報、及び、置換対象の用語の代わりに使用される、少なくとも1つの代替用語を含む第2の辞書情報を記憶する。制御部は、入力文に含まれる置換対象の用語を代替用語に置換して、置換結果を示す置換文を生成する。通信部は、置換文を外部装置に出力し、外部装置から第2の言語における置換文の翻訳結果を取得する。代替用語は、特定の文字列で構成される。制御部は、通信部から取得した置換文の翻訳結果において当該特定の文字列を検知して、検知した文字列を、第1の辞書情報において置換対象の用語に対応づけられた訳語に置換して、翻訳文を生成する。
【0006】
本開示の別の態様に係る翻訳装置は、第1の言語における入力文を取得し、第1の言語から第2の言語への機械翻訳を実行する外部装置と通信して、入力文の翻訳結果を示す翻訳文を出力する。翻訳装置は、記憶部と、制御部と、通信部とを備える。記憶部は、第1の言語の置換対象の用語と、置換対象の用語に対する第2の言語の訳語とを対応づけて含む第1の辞書情報、及び、第1の言語において置換対象の用語の代わりに使用される複数の代替用語と、各代替用語に対する第2の言語の訳語とを対応づけて含む第2の辞書情報を記憶する。制御部は、入力文に含まれる置換対象の用語を代替用語に置換して、置換結果を示す置換文を生成する。通信部は、置換文を外部装置に出力し、外部装置から第2の言語における置換文の翻訳結果を取得する。制御部は、通信部から取得した置換文の翻訳結果において、代替用語の訳語があるか否かを判断する。制御部は、代替用語の訳語がないと判断した場合、第2の辞書情報において当該訳語に対応付けられた代替用語とは異なる代替用語を用いて再度、置換文を生成して通信部に出力させる。制御部は、代替用語の訳語があると判断した場合、当該訳語を、第1の辞書情報において置換対象の用語に対応づけられた訳語に置換して、翻訳文を生成する。
【0007】
これらの概括的かつ特定の態様は、システム、方法、及びコンピュータプログラム、並びに、それらの組み合わせにより、実現されてもよい。
【発明の効果】
【0008】
本開示に係る翻訳装置によると、第1の言語から第2の言語への機械翻訳を用いて入力文の翻訳結果を示す翻訳文を得易くすることができる。
【図面の簡単な説明】
【0009】
図1】本開示に係る翻訳エンジンと語彙置換/復元処理を説明するための図
図2】本開示の実施形態1における翻訳装置の外観を示す図
図3】実施形態1における翻訳システムの構成を示すブロック図
図4】実施形態1における登録語辞書の一例を示す図
図5】実施形態1における代替語辞書の一例を示す図
図6】実施形態1における置換情報の一例を示す図
図7】翻訳システムにおける翻訳装置の動作を説明するためのフローチャート
図8】実施形態1における語彙置換/復元処理を例示するフローチャート
図9】実施形態1における語彙置換/復元処理を説明するための図
図10】実施形態2における代替語辞書の一例を示す図
図11】実施形態2における語彙置換/復元処理を例示するフローチャート
図12】実施形態2における置換情報の一例を示す図
図13】実施形態2における代替語辞書の変形例を示す図
【発明を実施するための形態】
【0010】
以下、適宜図面を参照しながら、本開示の実施形態を詳細に説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。
【0011】
なお、発明者は、当業者が本開示を十分に理解するために添付図面および以下の説明を提供するのであって、これらによって請求の範囲に記載の主題を限定することを意図するものではない。
【0012】
(本開示に到った知見)
本開示の実施形態を説明するにあたり、まずは本願発明者が本開示に到った知見について、図1を用いて説明する。
【0013】
図1は、本開示に係る翻訳エンジン5と語彙置換/復元処理を説明するための図である。翻訳エンジン5は、種々の言語における用語の対訳を管理する翻訳辞書5a、及び文章中の形態素を解析する形態素解析部5b等を備え、各種の第1の言語から第2の言語への機械翻訳を実行する。語彙置換/復元処理は、特定の語彙に関して語彙置換/復元技術を適用し、翻訳文を生成する翻訳処理である。翻訳エンジン5においては、翻訳辞書5a等に登録されていない用語、即ち未知語がある場合が想定される。こうした場合に適用可能な語彙置換/復元処理について、以下では第1の言語が日本語であり、第2の言語が英語である例を用いて説明する。
【0014】
図1では、翻訳対象とする入力文が、日本語で「手荷物カウンターはこちらです。」という文章J1であり、入力文の文章J1中に含まれた「手荷物カウンター」という用語J11が未知語である場合を例示する。未知語としては、例えば、特定の職種に関わるシーンのみで使用される専門的な用語であって、一般的ではないような用語が想定される。
【0015】
語彙置換/復元処理は、例えば、翻訳エンジン5による機械翻訳の前処理を行う置換部2aと、後処理を行う復元部2bとにより実現される。置換部2aは、例えば入力文の文章J1中で未知語である用語J11を置換対象として、未知語の代わりに用いられる用語すなわち代替用語への置換を行う。
【0016】
代替用語としては、例えば、未知語よりは一般的と考えられる一方で、各種の入力文として想定される文章には含まれ難いと考えられる用語を用いることができる。これにより、入力文が含む用語との混同を回避して、誤訳を生じ難くすることが期待される。本例では、日本語で「あさぎりの湯」という用語J21を代替用語に用いる。置換部2aは、置換結果の置換文として、用語J21を含めた「あさぎりの湯はこちらです。」という文章J2を翻訳エンジン5に出力する。
【0017】
図1の例では、翻訳エンジン5は、上記の文章J2に対する機械翻訳の処理を実行し、処理結果の文章E2として「Spa of Asagiri is here.」を出力している。当該文章E2は、未知語の代わりの用語J21の訳語E21として、「Spa of Asagiri」を含んでいる。復元部2bは、当該文章E2のような置換文の機械翻訳の結果から、入力文の翻訳結果として提示する翻訳文において未知語を復元するための処理を行う。
【0018】
図1では、復元部2bの処理が成功した場合を例示している。復元部2bは、上記の文章E2を処理し、入力文の文章J1に対する翻訳文として「Baggage counter is here.」という文章E1を出力している。当該文章E1では、上記文章E2中の代替用語の訳語E21が、入力文では未知語のため置換部2aの置換対象とした用語J11の訳語E11である「Baggage counter」に換わっている。
【0019】
本例のように、復元部2bが、置換文の機械翻訳結果の文章E2中で、代替用語の訳語E21を、訳語E11のような未知語に再置換できれば、適切に未知語が復元された翻訳文を得ることができる。この際、未知語の復元後の訳語E11は、翻訳エンジン5の処理とは独立して予め、置換対象の用語J11に対応づけて、復元部2b及び置換部2a側で設定可能である。
【0020】
しかしながら、代替用語の訳語E21は、翻訳エンジン5の内部処理に応じて変動し、復元部2b側で予め想定した訳語とは、異なるものになってしまう場合が考えられる。又、翻訳エンジン5における処理時に、形態素解析部5bが代替用語の形態素を適切に認識できないことで、機械翻訳結果に不具合が生じる場合も想定される。こうした種々の観点から、従来の語彙置換/復元技術による翻訳処理においては、未知語の復元が失敗するような事態を回避し難く、入力文の翻訳結果を示すように翻訳文を精度良く得ることが困難であるという問題点が、本願発明者の鋭意研究によって明らかとなった。
【0021】
そこで、本願発明者は、上記の問題点について鋭意検討を重ね、語彙置換/復元処理及び代替用語の改善により、例えば翻訳エンジン5の未知語を含んだ入力文の翻訳結果を示す翻訳文を得易くすることができる翻訳装置を考案した。以下、本開示に係る翻訳装置の実施形態を説明する。
【0022】
(実施形態1)
以下、図面を用いて、実施形態1を説明する。実施形態1では、翻訳エンジン5によって翻訳されないような特定の文字列を代替用語として用いる翻訳装置について説明する。
【0023】
1.構成
図2は、実施形態1にかかる翻訳装置1の外観を示す図である。図2に示す翻訳装置1は、例えばタブレットタイプの翻訳装置であり、言語が異なる2人のユーザの会話を翻訳する。以下、本実施形態においては、日本語を話すホスト(例えば、案内者)と英語を話すゲスト(例えば、旅行者)とが対面で行う会話を、翻訳装置1が翻訳することを想定して説明する。
【0024】
翻訳装置1は、マイク10と、スピーカ12と、ディスプレイ14と、タッチパネル16とを備える。マイク10及びスピーカ12は、例えば、翻訳装置1の側面の開口近傍に配置されている。ディスプレイ14及びタッチパネル16は、翻訳装置1の主面に配置されている。ディスプレイ14の長手方向の一方側(例えば、ホスト側)の領域には、発話アイコン14h及び表示領域15hが配置される。ディスプレイ14の長手方向の他方側(例えば、ゲスト側)の領域には、発話アイコン14g及び表示領域15gが表示される。各発話アイコン14h、14gに対して、ユーザによるタッチ操作がなされる。
【0025】
発話アイコン14hは、ホストが発話を行うときに、すなわち、翻訳元として日本語の発話を翻訳装置1に入力するときに、ホスト本人がホストの発話の開始時点及び終了時点を指定するための操作アイコンである。発話アイコン14gは、ゲストが発話を行うときに、すなわち、翻訳元として英語の発話を入力するときに、ゲスト本人がゲストの発話の開始時点及び終了時点を指定するための操作アイコンである。表示領域15h,15gは、音声認識結果および翻訳結果等を文字列として表示するための領域である。
【0026】
図3は、実施形態1にかかる翻訳システム100の構成を示すブロック図である。翻訳システム100は、図2に示す翻訳装置1、音声認識サーバ41、翻訳サーバ42、及び音声合成サーバ43を有する。翻訳装置1は、インターネットのような通信ネットワーク4を介して、音声認識サーバ41、翻訳サーバ42、及び音声合成サーバ43のそれぞれとデータ通信を行う。
【0027】
音声認識サーバ41は、翻訳装置1から通信ネットワーク4を介して音声データを受信し、受信した音声データを音声認識して、認識結果の文字列で構成される音声認識データ、すなわち発話文のテキストデータを生成するサーバである。なお、音声認識サーバ41は、本実施形態における翻訳装置1の外部の音声認識装置の一例である。
【0028】
翻訳サーバ42は、翻訳エンジン5が搭載されたサーバである。翻訳サーバ42は、翻訳装置1から通信ネットワーク4を介して音声認識データを受信し、受信した音声認識データに対して翻訳エンジン5による機械翻訳を実行して、機械翻訳の結果を示すテキストデータである翻訳データを生成する。翻訳サーバ42は、第1の言語から第2の言語への翻訳機能を有する外部装置の一例である。
【0029】
音声合成サーバ43は、翻訳装置1から通信ネットワーク4を介して翻訳データを受信し、受信した翻訳データを音声合成して音声信号を生成するサーバである。
【0030】
翻訳装置1は、マイク10と、スピーカ12と、ディスプレイ14と、タッチパネル16とに加えて、通信部18と、記憶部20と、制御部22とを備える。
【0031】
マイク10は、物理的な音声を音声データに変換する装置である。具体的には、マイク10は、外部から入力される音声を、アナログ電気信号の音声信号に変換し、さらに、AD変換器により音声信号をデジタルの音声データに変換する。マイク10は、発話等の音声を入力する音声入力部の一例である。
【0032】
通信部18は、Bluetooth(登録商標)、Wi-Fi(登録商標)、3G、LTE(登録商標)、IEEE802.11等の通信方式に従って、通信ネットワーク4を介して音声認識サーバ41、翻訳サーバ42、及び音声合成サーバ43とデータ通信を行う通信モジュールである。
【0033】
記憶部20は、フラッシュメモリ、強誘電体メモリ、HDD、SSD、RAM、及びこれらの組み合わせなどで構成される記録媒体である。記憶部20は、マイク10の音声データ、音声認識データ、及び翻訳データを格納する。また、記憶部20は、制御部22のための各種プログラムを格納している。
【0034】
本実施形態において、記憶部20は、登録語辞書31、代替語辞書32、及び置換情報33を格納する。登録語辞書31は、語彙置換/復元処理において置換対象とする特定の用語を登録する辞書情報の一例である。代替語辞書32は、翻訳時に置換対象の代わりに使用される代替用語を含む辞書情報の一例である。置換情報33は、置換前の用語と置換後の用語との対応付けを示す情報である。登録語辞書31、代替語辞書32、及び置換情報33のデータ構造については後述する。
【0035】
制御部22は、CPU、MPU等で構成され、記憶部20に格納された各種プログラムを実行することにより、翻訳装置1の全体の動作を制御する。制御部22は、例えば機能的構成として置換部2a及び復元部2bを含む。本実施形態では、制御部22の機能は、ハードウェアとソフトウェアの協働により実現するが、所定の機能を実現するように専用に設計されたハードウェア回路のみで実現してもよい。すなわち、制御部22は、CPU、MPUのみならず、DSP、FPGA、ASIC等で構成することができる。
【0036】
スピーカ12は、電気信号を音声に変換する装置である。スピーカ12は、制御部22からの音声信号(電気信号)に基づいた音声を出力する。スピーカ12は、翻訳結果等の音声を外部に出力する出力部の一例である。
【0037】
ディスプレイ14は、画像を表示する装置であり、液晶表示デバイスまたは有機EL表示デバイスで構成される。ディスプレイ14は、表示領域15h、15gにおいて、制御部22からの音声認識データ、翻訳データ、及び、逆翻訳データが示す画像を表示する。ディスプレイ14は、音声認識データ、及び翻訳データ等をホスト及びゲストに対して表示出力する出力部の一例である。また、ディスプレイ14は上述した発話アイコン14h、14gを表示する。
【0038】
タッチパネル16は、ユーザが操作する操作部であり、ユーザからの指示を受け付ける。タッチパネル16はディスプレイ14に重畳して配置されている。
【0039】
1-1.データ構造について
本実施形態の翻訳装置1に格納される、登録語辞書31、代替語辞書32、及び置換情報33のデータ構造について、図4図6を参照して説明する。
【0040】
図4は、登録語辞書31の一例を示す。登録語辞書31には、語彙置換/復元処理において置換対象とする特定の用語が登録されている。本実施形態では、翻訳装置1の登録語辞書31に登録される用語が、翻訳エンジン5にとって未知語であることを想定している。こうした置換対象の用語は、例えば各種の固有名詞を含む。
【0041】
登録語辞書31に含まれる用語は、単語及び語句を含む。登録語辞書31は、複数の言語による対訳で記載された用語を含む。図4では、当該複数の言語が日本語および英語である例を示しているが、特にこれに限らず、種々の自然言語を採用可能である。以下では、登録語辞書31内の複数の言語による対訳で記載された用語のうち、翻訳元の言語で記載された用語を「登録用語」と呼び、翻訳先の言語で記載された用語を「登録用語の訳語」と呼ぶ。
【0042】
登録語辞書31は、例えば登録用語の種別を示すクラス毎に設けられる。クラスは、用語を分類するものであって、用語が示す対象のカテゴリである。クラスは、例えば、地名、および食べ物を含む。登録語辞書31は、登録用語と関連付けて付加情報を含んでもよい。付加情報は、例えば、クラスが「地名」であれば、登録用語が示す場所の写真やアクセス手段を示す情報である。
【0043】
登録語辞書31に登録される用語は、必ずしも未知語に限らず、例えば翻訳エンジン5による機械翻訳では所望のとおりに翻訳され難いと想定される用語であってもよい。又、特に翻訳エンジン5における登録の有無を勘案することなく、特定の分野のみで使用される専門用語や、一部の場所又は地域のみで使用される用語が、登録語辞書31に登録されてもよい。これにより、語彙置換/復元処理を介して、登録語辞書31中の対訳に従った登録用語の訳語を翻訳文にて訳出させるようなことができる。
【0044】
図5は、本実施形態における代替語辞書32の一例を示す。代替語辞書32は、翻訳時に登録用語の代わりに使用される代替用語を含む。本実施形態の代替語辞書32は、図5に示すように、特殊な文字列で構成される代替用語である代替文字列を、例えばクラス別に管理する。
【0045】
本実施形態において、代替文字列は、例えば図5に示す文字列W1のように、先頭の記号m0と、末尾の記号m1と、先頭及び末尾の記号m0,m1の間に並んだ文字部分w10とを含む。
【0046】
代替文字列における先頭及び末尾の記号m0,m1は、例えば「+」などの予め規定された記号に設定される。例えば「+」の記号m0,m1によると、代替文字列を含めた文章の形態素解析等において、代替文字列の内外が区別され易くすることができる。各記号m0,m1は、例えば互いに同一の記号に設定されるが、同一の記号でなくてもよい。各記号m0,m1は、例えば各種の括弧記号に設定されてもよい。
【0047】
代替文字列における文字部分w10は、例えば文字列W1に示すように、互いに同種の文字を複数、並べて構成される。文字部分w10の複数文字は、例えば意味を成さないように、すなわち当該文字の並びが意味を有する単語等にならないように設定される。これにより、翻訳エンジン5における機械翻訳の処理前後で、代替文字列が変わらないようにし易くすることができる。代替文字列としては、翻訳エンジン5における機械翻訳の処理前後で変化しないことが想定される特定の文字列に設定可能である。
【0048】
又、文字部分w10の文字種は、例えば翻訳元の言語において発生頻度が比較的低い文字種に設定される。例えば、翻訳元が日本語の場合に、文字部分w10をアルファベットに設定することにより、漢字等よりも発生頻度が低減される。代替語辞書32は、各種言語毎に、別々の代替文字列を管理してもよく、例えば翻訳元とする言語と、同言語において発生頻度が低い文字種の代替文字列とを対応付けてもよい。
【0049】
図6は、置換情報33の一例を示す。置換情報33は、後述する語彙置換/復元処理の実行時に生成され、例えば当該処理中に一時的に記憶部20に記憶される。置換情報33は、置換前の用語と置換後の用語とを対応付けて含む。置換前の用語は、語彙置換/復元処理において置換対象の登録用語であり、置換後の用語は、置換対象の登録用語に対する代替用語である。
【0050】
2.動作
以上のように構成される翻訳システム100及び翻訳装置1の動作を以下説明する。
【0051】
2-1.全体動作
翻訳システム100及び翻訳装置1の全体的な動作について、図7を参照して説明する。本実施形態において、翻訳エンジン5は翻訳サーバ42に搭載されている。翻訳装置1は翻訳サーバ42に発話文のテキストデータを送信し、翻訳サーバ42から翻訳結果を示す翻訳文のテキストデータを取得する。
【0052】
図7は、翻訳システム100における翻訳装置1を説明するためのフローチャートである。図7のフローチャートに示す各処理は、翻訳装置1の制御部22によって実行される。
【0053】
まず、翻訳装置1の制御部22は、マイク10を介して、発話者による発話の音声に応じた音声データを取得する(S1)。
【0054】
制御部22は、音声認識処理により、発話文を取得する(S2)。具体的に、制御部22は、まず取得した音声データを、通信ネットワーク4を介して音声認識サーバ41に送信する。音声認識サーバ41は、受信した音声データを音声認識して、発話文のテキストデータを生成する。翻訳装置1は、音声認識サーバ41から通信ネットワーク4を介して、発話文のテキストデータを受信する。
【0055】
次に、制御部22は、取得した発話文内において、登録語辞書31に含まれる登録用語を検索する(S3)。そして、制御部22は、発話文内に登録用語があるか否かを判断する(S4)。
【0056】
発話文内に登録用語がなければ(S4でNO)、制御部22は、語彙置換/復元処理ではない通常の翻訳処理を行う(S5~S6)。通常の翻訳処理は、特に置換部2a及び復元部2bを用いずに、発話文に対する翻訳文を取得する処理である。
【0057】
具体的に、翻訳装置1の制御部22は、まず発話文のテキストデータを、通信ネットワーク4を介して翻訳サーバ42に送信する(S5)。翻訳サーバ42は、翻訳エンジン5において発話文に対する機械翻訳を実行して、機械翻訳の結果のテキストデータを生成する。翻訳サーバ42は、生成したテキストデータを、通信ネットワーク4を介して翻訳装置1に送信する。翻訳装置1は、翻訳サーバ42から通信ネットワーク4を介して、翻訳結果のテキストデータを、翻訳文として受信する(S6)。
【0058】
一方、発話文内に登録用語があれば(S4でYES)、制御部22は、本実施形態に係る語彙置換/復元処理を行う(S7)。本実施形態に係る語彙置換/復元処理によると、代替文字列を用いることにより、翻訳文の精度を良くすることができる。語彙置換/復元処理の詳細については後述する。
【0059】
制御部22は、例えば、ステップS6、S7の翻訳結果を表示するようにディスプレイ14を制御する(S8)。例えば、ディスプレイ14は、図2に例示するように、発話文をホスト側の表示領域15hに表示すると共に、翻訳文をゲスト側の表示領域15gに表示する。なお、発話文の表示と翻訳文の表示は、同時に行ってもよいし、順番に行ってもよい。例えば、制御部22は、翻訳サーバ42から翻訳文のテキストを受信する前に発話文を先に表示させてもよい。
【0060】
翻訳装置1の制御部22は、例えば翻訳結果の表示(S8)により、図7のフローチャートに示す動作を終了する。
【0061】
以上の翻訳システム100及び翻訳装置1の動作によると、翻訳装置1において、発話によって入力文の一例である発話文の入力を受け付けると共に、翻訳エンジン5による機械翻訳を用いた発話文に対する翻訳結果の翻訳文を提示することができる。
【0062】
翻訳装置1は、翻訳文の表示(S8)に加えて、又は代えて、翻訳文を音声で出力してもよい。この場合、翻訳装置1の制御部22は、ステップS6、S7で得られた翻訳文のテキストデータを、通信ネットワーク4を介して、音声合成サーバ43に送信する。音声合成サーバ43は、翻訳装置1から受信した翻訳文のテキストデータに基づき、音声合成を行って音声信号を生成し、通信ネットワーク4を介して翻訳装置1に音声信号を送信する。制御部22は、音声合成サーバ43から受信した音声信号に基づき、スピーカ12から翻訳結果を示す音声を出力する。
【0063】
2-2.語彙置換/復元処理
本実施形態における語彙置換/復元処理(S7)の詳細について、図8図9を用いて説明する。
【0064】
図8は、本実施形態における語彙置換/復元処理を例示するフローチャートである。図9は、本実施形態における語彙置換/復元処理を説明するための図である。
【0065】
以下の説明では、ホストが発した日本語の発話を翻訳システム100が英語に翻訳し、その翻訳結果をゲストに伝達する場面の一例を想定して説明する。具体的には図9に示すように、入力文の一例の発話文が、未知語として日本語の用語J11を含んだ「手荷物カウンター前に自販機があります。」という文章J10である例を用いて説明する。本例において、翻訳装置1の制御部22は、発話文中の用語J11に基づき図7のステップS4でYESに進み、ステップS7において図8の処理を実行する。
【0066】
まず、翻訳装置1の制御部22は、置換部2aとして機能し、発話文の中の登録用語を、代替用語とする特定の文字列に置換する(S21)。置換部2aとしての制御部22は、記憶部20における登録語辞書31及び代替語辞書32を参照して、ステップS21の処理を行う。
【0067】
例えば、図4に示すように、登録語辞書31には、図9の例の未知語である用語J11が、予めクラス「地名」に属するように登録されている。ステップS21において、制御部22は、クラス「地名」に基づいて、例えば図5に示す代替語辞書32から、同クラスに属する代替文字列の一つである「+LDMVA+」という文字列W1を代替用語として選択する。そして、制御部22は、入力文の文章J10中の用語J11を、選択した代替用語に置換し、置換文として図9に示すように「+LDMVA+前に自販機があります。」という文章J20を生成する。
【0068】
制御部22は、置換前後の用語を対応付けて置換情報33として記録する(S22)。図9の例の置換情報33としては、例えば図6に示すように、置換対象とした用語J11が置換前の用語として記録され、代替用語として選択した文字列W1が置換後の用語として記録される。
【0069】
制御部22は、通信部18を介して、発話文に対する置換結果の置換文を翻訳サーバ42に送信する(S23)。本例では、置換文として、代替用語の文字列W1を含んだ文章J20を示すテキストデータが送信される。
【0070】
翻訳サーバ42は、受信した置換文のテキストデータに対して、翻訳エンジン5による機械翻訳の処理を実行して、機械翻訳の結果を示すテキストデータを生成する。図9の例では、置換文の文章J20に対する機械翻訳の結果として、「There is a vending machine in front of +LDMVA+.」という文章E20が生成されている。翻訳サーバ42は、置換文の翻訳結果の文章を示すテキストデータを、通信ネットワーク4を介して翻訳装置1に送信する。翻訳装置1の制御部22は、翻訳サーバ42から通信部18を介して、置換文の翻訳結果を受信する(S24)。
【0071】
次に、制御部22は、復元部2bとして機能し、受信した翻訳結果において代替用語の文字列を検知して(S25)、発話文の翻訳結果が復元された翻訳文を生成する(S26)。図9の例では、文章J10に対する翻訳文として「Baggage counter is here.」といった文章E1が、上記の文章E20から復元される。
【0072】
具体的に、復元部2bとしての制御部22は、まず図6に示す置換情報33から置換後の代替用語の文字列W1を特定し、置換文の翻訳結果の文章E20において文字列W1を検索する(S25)。さらに、制御部22は、置換情報33から、置換前の登録用語が用語J11であることを特定する。制御部22は、登録語辞書31から用語J11に対応する「Baggage counter」を訳語E11として読み出して、文章E20中の「+LDMVA+」を訳語E11に置換する。これにより、上記の文章E20のような翻訳文が生成される(S26)。
【0073】
制御部22は、翻訳文を生成する(S26)と、図7のステップS7の処理を終了し、ステップS8に進む。
【0074】
以上の処理によると、語彙置換/復元処理において、未知語に対する代替用語として、例えば「+LDMVA+」といった特殊な文字列W1が用いられる(S21)。こうした特殊な文字列W1は、翻訳エンジン5に翻訳されない、即ち翻訳サーバ42における機械翻訳の処理前後で変更されないこととなる。このため、制御部22は、機械翻訳の結果から代替用語と同じ文字列W1の再置換により、翻訳先の言語で未知語を復元する復元部2bとしての処理(S25~S26)を成功し易く、翻訳文を精度良く得ることができる。
【0075】
上記のような特定の文字列W1を代替用語として用いることで、例えば翻訳サーバ42における機械翻訳の処理時(S23~S24)において、形態素解析の誤認識を回避し易くすることができる。
【0076】
例えば図1の例の用語J21を代替用語として用いた場合、一般的な形態素解析部5bは、図9に示すように、発話文の文章J10に対する置換後の文章J22中で、漢字等の同種の文字が並んだ部分を纏めて一形態素と認識する可能性が高い。このため、文章J22における用語J21前後の内容によっては、用語J21の内外を誤って区切るような形態素解析が行われ、文章J22の機械翻訳結果に、用語J21の訳語が現れないような不具合を回避し難い。
【0077】
これに対して、本実施形態の代替用語として用いる特定の文字列W1によると、文字列W1の先頭及び末尾の記号「+」により、形態素解析において、代替用語と外部とが区切られる可能性を高めることができる。又、先頭及び末尾の記号間に同種の文字を並べることにより、代替用語内部を纏めて認識される可能性を高められる。これにより、形態素解析の誤認識を回避し易くすることができる。この際、翻訳サーバ42の形態素解析部5bには、特に形態素解析のための辞書等に文字列W1を登録しなくてもよい。
【0078】
さらに、本実施形態の代替用語としての文字列W1が、日本語などの翻訳元の言語で、特に意味を成さないものに設定されることにより、翻訳サーバ42における機械翻訳の処理時に、文字列W1とは別の文字列の訳語に変更される事態を回避し易くすることができる。これにより、翻訳装置1において復元部2bの処理対象を検知し易くして、翻訳文における未知語の復元を成功し易くすることができる。
【0079】
なお、翻訳サーバ42においては、例えば翻訳辞書5aに、代替用語の文字列W1のクラスが登録されていてもよい。例えば文字列W1が「地名」の意味合いであることを前提として、当該文字列W1を含んだ文章J20全体の翻訳精度を良くすることができる。こうした翻訳辞書5aへの登録は、形態素解析部5bに対する登録とは別に行え、翻訳サーバ42への登録負担を低減することができる。
【0080】
3.まとめ
以上のように、本実施形態において、翻訳装置1は、第1の言語(例えば、日本語)における入力文(例えば、発話文)を取得し、翻訳サーバ43と通信して、文章J10等の入力文の翻訳結果を示す文章E10等の翻訳文を出力する。翻訳サーバ43は、第1の言語から第2の言語(例えば、英語)への機械翻訳を実行する外部装置の一例である。翻訳装置1は、記憶部20と、制御部22と、通信部18とを備える。記憶部20は、第1の辞書情報の一例である登録語辞書31、及び第2の辞書情報の一例である代替語辞書32を記憶する。登録語辞書31は、第1の言語の置換対象の用語である登録用語と、登録用語に対する第2の言語の訳語とを対応づけて含む。代替語辞書32は、置換対象の用語の代わりに使用される、少なくとも1つの代替用語を含む。制御部22は、入力文に含まれる置換対象の用語を代替用語に置換して、文章J20のように置換結果を示す置換文を生成する(S21)。通信部18は、置換文を翻訳サーバ42に出力し(S23)、翻訳サーバ42から、文章E20のように第2の言語における置換文の翻訳結果を取得する(S24)。代替用語は、例えば文字列W1のように、特定の文字列で構成される。制御部22は、通信部18から取得した置換文の翻訳結果において当該特定の文字列を検知して(S25)、検知した文字列を、登録語辞書31において置換対象の登録用語(例えば用語J11)に対応づけられた訳語(例えば訳語E11)に置換して、翻訳文を生成する(S26)。
【0081】
以上の翻訳装置1によると、代替用語として用いる特定の文字列が、翻訳サーバ4に翻訳されないことを利用して、置換文の翻訳結果において当該文字列を検知して(S25)、翻訳文を復元する(S26)。これにより、翻訳サーバ4の翻訳エンジン5に翻訳される代替用語を用いた場合のような復元の失敗を回避し易くして、適切に入力文の翻訳結果を示す翻訳文を得易くすることができる。
【0082】
本実施形態において、代替用語として用いる代替文字列は、当該文字列における先頭と末尾にそれぞれ配置される所定の記号m0,m1と、先頭の記号m0と末尾の記号m1との間に並んだ互いに同種の複数文字の文字部分w10とを含む。
【0083】
こうした代替文字列によると、翻訳エンジン5に翻訳されない可能性が比較的高く、翻訳エンジン5の処理後に、処理前と同じ文字列を維持し易い。代替文字列として、例えば第1の言語において発生頻度が低い文字種を用いることで、当該文字列が翻訳されない可能性をより高めて、適切な翻訳文をより得易くすることができる。
【0084】
本実施形態において、置換対象の用語は、例えば固有名詞を含む。置換対象の用語は、例えば翻訳サーバ4に未登録である未知語と想定される用語に設定可能である。これにより、入力文に未知語が含まれていても、翻訳文を精度良く得ることができる。
【0085】
本実施形態において、代替語辞書32は、用語の種別を示すクラス毎に代替用語を分類してもよい。この場合、制御部22は、入力文に含まれる置換対象の用語と同じクラスに分類された代替用語を用いて、置換文を生成する(S21)。クラスに応じた代替用語により、翻訳文の精度向上を図れる。
【0086】
本実施形態において、翻訳装置1は、発話を入力する音声入力部の一例のマイク10をさらに備えてもよい。通信部18は、発話の音声データを外部の音声認識装置の一例である音声認識サーバ41に出力し、音声認識サーバ41から音声データに対する認識結果の入力文を取得してもよい(S2)。こうした翻訳装置1によると、ユーザの発話に対する適切な翻訳文を得易い。
【0087】
(実施形態2)
以下、図10図12を用いて実施形態2を説明する。実施形態2では、図1を用いて説明した問題点について、実施形態1とは別の解決策を提供する。
【0088】
以下、実施形態1に係る翻訳装置1及び翻訳システム100と同様の構成、動作の説明は適宜、省略して、本実施形態に係る翻訳装置1及び翻訳システム100を説明する。
【0089】
本実施形態では、語彙置換/復元処理において翻訳エンジン5の機械翻訳結果を取得すると代替用語の訳語が含まれているか否かを判断し、判断結果によっては代替用語を替えて同処理を繰り返す翻訳装置1について説明する。
【0090】
図10は、実施形態2における代替語辞書32Aの一例を示す。本実施形態の翻訳装置1は、代替用語として、単語及び語句を含む用語であって、例えば翻訳エンジン5において精度良く翻訳されることが想定される用語を用いる。
【0091】
本実施形態の代替語辞書32Aにおいては、代替用語として用いる用語が、登録語辞書31と同じ複数の言語(例えば日本語及び英語)の対訳で記載される。本実施形態の語彙置換/復元処理では、代替語辞書32Aにおいて複数の言語のうちの翻訳元の言語で記載された用語が「代替用語」として置換文に用いられ、翻訳先の言語で記載された用語が「代替用語の訳語」として翻訳文に用いられる。
【0092】
代替語辞書32Aは、例えば実施形態1と同様の各クラスにおいて、複数の代替用語とその訳語とを含む。又、本実施形態の代替語辞書32Aは、例えば図10に示すように、代替用語間の優先順位を管理する。優先順位は、本実施形態の語彙置換/復元処理において代替用語として用いる際に優先される順番を示す。本例では、同じクラスの代替用語の間で、優先順位が設定されている。優先順位「1」を有する用語が、最も高い優先順位の代替用語となる。
【0093】
図11は、実施形態2における語彙置換/復元処理を例示するフローチャートである。本実施形態の翻訳装置1は、実施形態1と同様の動作の実行時に、図7のステップS7において図8のフローチャートの代わりに本フローチャートに例示するような処理を実行する。
【0094】
まず、翻訳装置1の制御部22は、本実施形態の代替語辞書32Aにおいて、優先順位が高い代替用語から順番に、1つの代替用語を選択する(S21a)。制御部22は、選択した代替用語を用いて置換部2a及び復元部2bとしての処理を実施形態1と同様に行う(S21b~S25a)。図12に、本実施形態における置換情報33Aの一例を示す。
【0095】
図12は、置換前の用語J11と同じクラスの代替語辞書32Aにおいて優先順位が最も高い用語J23が、ステップS21aで選択された場合におけるステップS22の置換情報33Aを例示している。この場合、制御部22は、発話文中の用語J11を、選択した用語J23に置換して、置換文を生成する(S21b)。用語J23のような代替用語は、翻訳サーバ42における機械翻訳の処理時に、例えば日本語から英語に翻訳される。
【0096】
制御部22は、翻訳サーバ42から置換文の翻訳結果を受信すると(S24)、置換情報33Aおよび代替語辞書32Aを参照して、受信した置換文の翻訳結果の文章において、代替用語の訳語を検知する(S25a)。具体的に、制御部22は、置換情報33Aにおける置換後の用語J23の訳語E23を、代替語辞書32Aから読み出し、機械翻訳の結果の文章において、訳語E23を検索する。
【0097】
上記のような場合、翻訳サーバ42における置換文の翻訳結果の文章に、あらかじめ想定した代替用語の訳語E23が含まれていない場合が考えられる。制御部22は、ステップS25aの検知結果に基づいて、翻訳サーバ42から受信した置換文の翻訳結果の文章中に、代替用語の訳語があるか否かを判断する(S25b)。
【0098】
制御部22は、置換文の翻訳結果に代替用語の訳語がないと判断すると(S25bでNO)、代替語辞書32Aを参照して、代替用語の下位候補があるか否かを判断する(S25c)。代替用語の下位候補は、代替語辞書32Aにおいて、置換文に用いた代替用語と同じクラスの中で、当該代替用語よりも下位の優先順位を有する代替用語である。
【0099】
代替用語の下位候補がある場合(S25cでYES)、制御部22は、代替用語の下位候補の中で最も高い優先順位を有する代替用語を選択し(S21a)、ステップS21b以降の処理を再度、行う。これにより、優先順位が高い順に代替用語を用いて置換文が繰り返し生成され、翻訳サーバ42に送信される(S23)。翻訳エンジン5は順次、受信した置換文の機械翻訳を実行する。
【0100】
制御部22は、置換文の翻訳結果に代替用語の訳語があると判断すると(S25bでYES)、代替用語の訳語を登録用語の訳語に置換して、実施形態1と同様に翻訳文を生成する(S26)。その後、制御部22は、図7のステップS7を終了し、ステップS8に進む。
【0101】
以上の処理によると、代替用語を含めて置換文を生成した際に、翻訳エンジン5による置換文の翻訳結果に、当該代替用語に対して想定した訳語が含まれていなかった場合には(S25bでNO)、別の代替用語を用いて置換文の生成などが再び行われる(S21a~S24)。このような別々の代替用語による複数の置換文に対する機械翻訳の結果のいずれかに、想定した代替用語の訳語が含まれていれば(S25bでYES)、未知語を復元した翻訳文を得ることができる(S26)。又、未知語の復元を失敗して代替用語の訳語E23に類似した訳語が未知語の代わりに含まれた文章が、ユーザに見えてしまう事態を回避し易くすることができる。このように、翻訳文の精度を良くすることができる。
【0102】
なお、置換文の翻訳結果に代替用語の訳語がないとの判断(S25bでNO)が繰り返され、代替用語の下位候補がなくなった場合(S25cでNO)、制御部22は、例えばステップS26の処理を行わず、図7のステップS7を終了する。
【0103】
上記の場合、続くステップS8において、制御部22は、例えば最後に受信した置換文の翻訳結果を翻訳文としてディスプレイ14に表示させてもよい。例えば、代替語辞書32Aにおいて優先順位が最下位の代替用語として、翻訳結果が表示されたとしても、ホスト等のユーザの不快感を招かないと考えられる用語を登録しておく。これにより、最終的に未知語の復元を失敗した文章が表示されたとしてもユーザの不快感を生じにくくすることができる。また、上記翻訳文の表示に代えて、又はこれに加えて、制御部22は、各種のエラー表示を表示させてもよい。
【0104】
以上のように、本実施形態において、翻訳装置1は、第1の言語における入力文を取得し、第1の言語から第2の言語への機械翻訳を実行する翻訳サーバ43等と通信して、入力文の翻訳結果を示す翻訳文を出力する。翻訳装置1は、記憶部20と、制御部22と、通信部18とを備える。記憶部20は、第1の辞書情報の一例である登録語辞書31、及び第2の辞書情報の一例である代替語辞書32Aを記憶する。本実施形態の代替語辞書32Aは、第1の言語において置換対象の用語の代わりに使用される複数の代替用語と、各代替用語に対する第2の言語の訳語とを対応づけて含む。制御部22は、通信部18から取得した置換文の翻訳結果において、代替用語の訳語があるか否かを判断する(S25b)。制御部22は、代替用語の訳語がないと判断した場合(S25bでNO)、代替語辞書32Aにおいて当該訳語に対応付けられた代替用語とは異なる代替用語を用いて再度、置換文を生成して通信部18に出力させる(S25c~S23)。制御部22は、代替用語の訳語があると判断した場合(S25bでYES)、当該訳語を、登録語辞書31において置換対象の用語に対応づけられた訳語に置換して、翻訳文を生成する(S26)。
【0105】
以上の翻訳装置1によると、代替用語を含めた置換文の翻訳結果に、代替語辞書32Aにおいて対応する代替用語の訳語がなかった場合(S25bでNO)、別の代替用語を用いて再度、置換文の機械翻訳が行われる。このように、複数回の置換文を用いることで、1回の置換文のみの場合よりも、翻訳文の復元が最終的に失敗する可能性を低減し、適切に入力文の翻訳結果を示す翻訳文を得易くすることができる。又、未知語の復元を失敗した文章が、ユーザに見えてしまう事態を回避し易くすることができる。
【0106】
本実施形態において、代替語辞書32Aは、複数の代替用語における優先順位を管理してもよい。制御部22は、複数の代替用語において優先順位が高い代替用語から順番に、置換文に用いる(S21a)。例えば、置換文の翻訳結果に訳語が含まれる可能性が高い代替用語の優先順位を高く設定することにより、翻訳文の復元を効率良く成功させることができる。
【0107】
(他の実施形態)
以上のように、本出願において開示する技術の例示として、実施形態1~2を説明した。しかしながら、本開示における技術は、これに限定されず、適宜、変更、置換、付加、省略などを行った実施の形態にも適用可能である。また、上記各実施形態で説明した各構成要素を組み合わせて、新たな実施の形態とすることも可能である。そこで、以下、他の実施形態を例示する。
【0108】
上記の実施形態2における語彙置換/復元処理(図11)では、実施形態1における特定の文字列が用いられてもよい。このような変形例について、図13を用いて説明する。
【0109】
図13は、本変形例における代替語辞書32Bを例示する。例えば実施形態2と同様の代替語辞書32Bにおいて、実施形態1の代替文字列が登録されてもよい。図13の例では、代替語辞書32Bに、文字列W1が代替用語として含まれている。本例の代替語辞書32Bでは、日本語及び英語といった各言語において、同じ文字列W1が記載されている。
【0110】
上記の代替語辞書32Bによると、制御部22は、例えば図11のステップS21bにおいて日本語等の翻訳元の言語の記載を参照して、文字列W1を代替用語として用いる。又、ステップS25aでは、英語等の翻訳先の言語の記載を参照して、同じ文字列W1が代替用語の訳語として用いられる。このように、特殊な文字列W1と他の代替用語とを同様に用いて、語彙置換/復元処理を行うことができる。
【0111】
以上のように、本変形例において、代替語辞書32Bにおける複数の代替用語は、特定の文字列で構成された代替用語を含んでもよい。代替語辞書32Bは、特定の文字列で構成された代替用語の訳語として、当該文字列と同じ文字列を含んでもよい。
【0112】
また、実施形態1の代替語辞書32を用いて、実施形態2と同様の語彙置換/復元処理が行われてもよい。例えば図5の代替語辞書32において、代替文字列間の優先順位は、クラス毎に登録された昇順に設定可能である。
【0113】
上記の代替語辞書32によると、図11と同様の処理時に、制御部22は、ステップS25a,S25bにおいて、代替用語の訳語の代わりに、図8のステップS25と同様に代替文字列の有無を検知する。この際、代替文字列がないことが検知されれば(S25bでNO)、異なる文字列で構成される別の代替文字列を用いて置換文の生成が繰り返され(S21a~S25c)、翻訳文の精度を向上できる。
【0114】
以上のように、本変形例において、代替語辞書32は、互いに異なる文字列で構成された複数の代替用語を含んでもよい。制御部22は、通信部18から取得した置換文の翻訳結果において、置換文に用いた文字列がないことを検知すると(S25bでNO)、当該文字列の代替用語とは異なる代替用語を用いて再度、置換文を生成して通信部18に出力さてもよい(S25c~S23)。
【0115】
上記の各実施形態の翻訳装置1は、発話の言語(例えば、日本語)を他の言語(例えば、英語)に翻訳して得られた翻訳結果である翻訳文を、元の言語(例えば、日本語)に翻訳する逆翻訳機能をさらに有してもよい。この場合、翻訳装置1は、置換された状態の翻訳文を翻訳サーバ4に送信し、翻訳サーバ4から逆翻訳文を取得する。
【0116】
上記の各実施形態では、音声認識を音声認識サーバ41で行い、翻訳を翻訳サーバ42で行い、音声合成を音声合成サーバ5で行ったが、本開示はこれに限定されない。音声認識、翻訳及び音声合成の少なくとも一つの処理を翻訳装置1内で行ってもよい。例えば、翻訳装置1(端末)に、音声認識サーバ41、翻訳サーバ42、及び音声合成サーバ43と同一の機能を全て搭載して、翻訳装置1のみで翻訳に関連する全ての処理を行うようにしてもよい。この場合、翻訳装置1は、通信ネットワーク4に接続するような通信部18を有さなくてもよい。例えば制御部22において翻訳サーバ4の機能である翻訳エンジン5と情報の受け渡しを行う機能が、翻訳エンジン5に対する通信部を構成してもよい。
【0117】
上記の各実施形態では、日本語と英語の間の翻訳の例を示した。しかし、翻訳処理の対象とする言語は、日本語と英語に限定されず、他の言語であってもよく、例えば中国語、独語、仏語、スペイン語、韓国語、タイ語、ベトナム語、インドネシア語等であってもよい。
【0118】
上記の各実施形態において、翻訳装置1は、マイク10で入力した発話文を入力文として翻訳したが、発話以外で入力した入力文を翻訳してもよい。例えば、翻訳装置1は、キーボードやマウスなどで入力した入力文を翻訳してもよい。つまり、本開示の翻訳装置1は、種々の入力文の文章を翻訳するときに、文章中の置換対象の用語を代替用語に置換して翻訳する。そして、翻訳文に含まれる代替用語の訳語を、代替用語により置換された置換対象の用語に対する訳語に復元し、翻訳文を表示する。
【0119】
以上のように、本開示における技術の例示として、実施の形態を説明した。そのために、添付図面および詳細な説明を提供した。
【0120】
したがって、添付図面および詳細な説明に記載された構成要素の中には、課題解決のために必須な構成要素だけでなく、上記技術を例示するために、課題解決のためには必須でない構成要素も含まれ得る。そのため、それらの必須ではない構成要素が添付図面や詳細な説明に記載されていることをもって、直ちに、それらの必須ではない構成要素が必須であるとの認定をするべきではない。
【0121】
また、上述の実施の形態は、本開示における技術を例示するためのものであるから、特許請求の範囲またはその均等の範囲において、種々の変更、置換、付加、省略などを行うことができる。
【産業上の利用可能性】
【0122】
本開示は、種々の場面で各種の言語間における翻訳を行うための翻訳装置に適用可能である。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13