(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024138196
(43)【公開日】2024-10-07
(54)【発明の名称】翻訳管理システム
(51)【国際特許分類】
G06F 40/58 20200101AFI20240927BHJP
【FI】
G06F40/58
【審査請求】有
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2024124781
(22)【出願日】2024-07-31
(62)【分割の表示】P 2019213111の分割
【原出願日】2019-11-26
(71)【出願人】
【識別番号】000003193
【氏名又は名称】TOPPANホールディングス株式会社
(74)【代理人】
【識別番号】100105957
【弁理士】
【氏名又は名称】恩田 誠
(74)【代理人】
【識別番号】100068755
【弁理士】
【氏名又は名称】恩田 博宣
(72)【発明者】
【氏名】名塚 一郎
(72)【発明者】
【氏名】野田 智輝
(72)【発明者】
【氏名】▲高▼木 祐耶
(57)【要約】
【課題】複数の言語への翻訳に関する処理の効率を高めることのできる翻訳管理システムを提供する。
【解決手段】翻訳管理システム50は、第1端末と、第1端末に入力された第1情報の翻訳結果の配信対象である複数の第2端末とが属する翻訳グループを設定するとともに、配信に用いられる言語として第2端末ごとに設定される配信言語の種類に対応させて、当該翻訳グループにおける第1情報の翻訳対象言語を設定する。さらに、翻訳管理システム50は、第1端末から第1情報を受信したとき、第1端末が属する翻訳グループの翻訳対象言語への第1情報の翻訳を指示し、各翻訳対象言語の翻訳結果を、その翻訳対象言語が配信言語として設定されている第2端末に配信する。
【選択図】
図10
【特許請求の範囲】
【請求項1】
観光ツアーのツアーガイドに操作される第1端末と、前記観光ツアーの参加者に操作される第2端末であって、前記第1端末に入力された第1情報の翻訳結果の配信対象である複数の前記第2端末とが属する翻訳グループを設定するとともに、配信に用いられる言語として前記第2端末ごとに設定される配信言語の種類に対応させて、当該翻訳グループにおける前記第1情報の翻訳対象言語を設定するグループ管理部と、
前記第1端末から前記第1情報を受信したとき、前記第1端末が属する前記翻訳グループの前記翻訳対象言語への前記第1情報の翻訳を指示し、各翻訳対象言語の翻訳結果を、その翻訳対象言語が前記配信言語として設定されている前記第2端末に配信する翻訳管理部と、
テキストと、当該テキストに関連する画像とを対応付けた付属情報データであって、観光ツアーの内容に対応する前記付属情報データを記憶する記憶部と、を備え、
前記記憶部は、複数の観光ツアーの各々に対応する前記付属情報データを記憶しており、前記翻訳グループごとに前記付属情報データが設定されており、
前記翻訳管理部は、前記第1端末から前記第1情報を受信したとき、複数の前記付属情報データの中から当該第1端末が属する前記翻訳グループに設定されている前記付属情報データを用いて、前記第1情報に対応するテキストに前記付属情報データにて対応付けられている画像を、前記翻訳結果と共に前記第2端末に配信する
翻訳管理システム。
【請求項2】
第1端末と、前記第1端末に入力された第1情報の翻訳結果の配信対象である複数の第2端末とが属する翻訳グループを設定するとともに、配信に用いられる言語として前記第2端末ごとに設定される配信言語の種類に対応させて、当該翻訳グループにおける前記第1情報の翻訳対象言語を設定するグループ管理部と、
前記第1端末から前記第1情報を受信したとき、前記第1端末が属する前記翻訳グループの前記翻訳対象言語への前記第1情報の翻訳を指示し、各翻訳対象言語の翻訳結果を、その翻訳対象言語が前記配信言語として設定されている前記第2端末に配信する翻訳管理部と、を備え、
前記翻訳管理部は、前記第1端末から受信した前記第1端末の位置情報および前記第2端末から受信した前記第2端末の位置情報に基づいて、前記第2端末への前記翻訳結果の配信前に、前記第2端末の位置を確認し、前記翻訳グループに属する端末において、前記第1端末の位置から所定の範囲内に位置しない前記第2端末があるとき、前記第1端末に通知する
翻訳管理システム。
【請求項3】
前記翻訳グループに前記第2端末を追加可能な期間が、所定の期間に制限されている
請求項1または2に記載の翻訳管理システム。
【請求項4】
前記グループ管理部は、
前記翻訳グループの生成の要求を前記第1端末から受けることに基づき、前記第1端末を属させた新たな前記翻訳グループを設定して当該翻訳グループの識別情報を前記第1端末に送信し、
前記識別情報を取得した前記第2端末から前記識別情報とともに前記翻訳グループへの追加の要求を受けることに基づき、当該識別情報に対応する前記翻訳グループに前記第2端末を追加する
請求項1~3のいずれか一項に記載の翻訳管理システム。
【請求項5】
前記グループ管理部は、複数の前記翻訳グループを設定するとともに、前記翻訳グループごとに1以上の前記翻訳対象言語を設定し、
複数の前記翻訳グループには、同一の前記第1端末が属する複数の前記翻訳グループが含まれ、
前記翻訳管理部は、前記第1端末から前記第1情報を受信したとき、前記第1端末にて選択されている前記翻訳グループの前記翻訳対象言語への前記第1情報の翻訳を指示し、当該翻訳グループに属する前記第2端末を対象として前記翻訳結果の配信を行う
請求項1~4のいずれか一項の翻訳管理システム。
【請求項6】
前記グループ管理部は、前記翻訳グループへの前記第2端末の追加の要求を前記第2端末から受けたとき、前記第1端末の位置から所定の範囲内に前記第2端末が位置することを条件として、前記第2端末を前記翻訳グループに追加する
請求項1~5のいずれか一項に記載の翻訳管理システム。
【請求項7】
テキストと、当該テキストに関連する画像とを対応付けた付属情報データを記憶する記憶部を備え、
前記翻訳管理部は、前記第1情報に対応するテキストに前記付属情報データにて対応付けられている画像を、前記翻訳結果と共に前記第2端末に配信する
請求項2に記載の翻訳管理システム。
【請求項8】
前記第1情報は音声として前記第1端末に入力され、前記第2端末に配信される前記翻訳結果には、音声が含まれる
請求項1~7のいずれか一項に記載の翻訳管理システム。
【請求項9】
前記第1情報を、前記翻訳管理部によって指定された前記翻訳対象言語に翻訳する翻訳部を備える
請求項1~8のいずれか一項に記載の翻訳管理システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、複数の言語への翻訳を管理する翻訳管理システムに関する。
【背景技術】
【0002】
近年、互いに異なる言語を話す人同士のコミュニケーションが活発になることに伴い、携帯可能な音声翻訳装置が開発されている。音声翻訳装置は、第1の言語の音声を認識してテキストに変換し、この第1の言語のテキストを第2の言語のテキストに翻訳する。そして、音声翻訳装置は、第2の言語のテキストから第2の言語の音声を合成して出力する(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、発話者の発話内容を、複数の言語に翻訳することが望まれる機会が増加している。例えば、観光ツアーの多様化に伴い、1つのツアーに、様々な言語の使用者が参加することが増えている。ツアーの参加者には、使用言語が互いに一致する複数の参加者が含まれるとともに、使用言語が互いに異なる複数の参加者が含まれる。
【0005】
こうしたツアーでは、ツアーガイドの発話内容を、参加者の使用言語に応じた複数の言語に翻訳する必要がある。参加者の各々が音声翻訳装置を携帯すれば、こうした翻訳が可能ではあるが、それぞれの音声翻訳装置で音声の認識と翻訳と音声の合成とが行われることは、処理の重複を招くため、無駄が多い。例えば、音声の認識処理は、すべての参加者の音声翻訳装置において重複する。また、翻訳処理および音声の合成処理は、使用言語が一致する参加者の音声翻訳装置において重複する。
【0006】
本発明は、複数の言語への翻訳に関する処理の効率を高めることのできる翻訳管理システムを提供することを目的とする。
【課題を解決するための手段】
【0007】
上記課題を解決する翻訳管理システムは、第1端末と、前記第1端末に入力された第1情報の翻訳結果の配信対象である複数の第2端末とが属する翻訳グループを設定するとともに、配信に用いられる言語として前記第2端末ごとに設定される配信言語の種類に対応させて、当該翻訳グループにおける前記第1情報の翻訳対象言語を設定するグループ管理部と、前記第1端末から前記第1情報を受信したとき、前記第1端末が属する前記翻訳グループの前記翻訳対象言語への前記第1情報の翻訳を指示し、各翻訳対象言語の翻訳結果を、その翻訳対象言語が前記配信言語として設定されている前記第2端末に配信する翻訳管理部と、を備える。
【0008】
上記構成によれば、配信言語ごとに、第2端末への配信のための翻訳の処理がまとめて行われ、共通のデータが同一の配信言語の端末に配信される。したがって、端末ごとに翻訳の処理が行われて別々のデータが生成される場合と比較して、処理の重複が抑えられる。
【0009】
上記構成において、前記翻訳グループに前記第2端末を追加可能な期間が、所定の期間に制限されていてもよい。
上記構成によれば、一時的な活動への参加者が携帯する端末から翻訳グループを構成して、当該翻訳グループでの翻訳結果の配信を利用することができる。したがって、観光ツアーのように、一時的な活動での利用に適した翻訳管理システムが実現される。
【0010】
上記構成において、前記グループ管理部は、前記翻訳グループの生成の要求を前記第1端末から受けることに基づき、前記第1端末を属させた新たな前記翻訳グループを設定して当該翻訳グループの識別情報を前記第1端末に送信し、前記識別情報を取得した前記第2端末から前記識別情報とともに前記翻訳グループへの追加の要求を受けることに基づき、当該識別情報に対応する前記翻訳グループに前記第2端末を追加してもよい。
【0011】
上記構成によれば、第1端末と第2端末との間での識別情報の授受を通じて、翻訳グループに追加される第2端末、すなわち、第1端末に入力された第1情報の翻訳結果の配信対象の端末が決まる。したがって、翻訳グループに追加するべき第2端末の的確な選定が可能であり、また、識別情報が利用されることで、端末が追加される翻訳グループの的確な識別が可能である。
【0012】
上記構成において、前記グループ管理部は、複数の前記翻訳グループを設定するとともに、前記翻訳グループごとに前記翻訳対象言語を設定し、複数の前記翻訳グループには、同一の前記第1端末が属する複数の前記翻訳グループが含まれ、前記翻訳管理部は、前記第1端末から前記第1情報を受信したとき、前記第1端末にて選択されている前記翻訳グループの前記翻訳対象言語への前記第1情報の翻訳を指示し、当該翻訳グループに属する前記第2端末を対象として前記翻訳結果の配信を行ってもよい。
【0013】
上記構成によれば、1つの第1端末が属する翻訳グループとして、翻訳結果の配信対象の端末が異なる複数の翻訳グループの設定が可能であり、第1端末の利用者は、利用の目的に応じて、複数の翻訳グループを使い分けることができる。
【0014】
上記構成において、前記グループ管理部は、前記翻訳グループへの前記第2端末の追加の要求を前記第2端末から受けたとき、前記第1端末の位置から所定の範囲内に前記第2端末が位置することを条件として、前記第2端末を前記翻訳グループに追加してもよい。
【0015】
上記構成によれば、翻訳グループに追加される第2端末を、第1端末から所定の範囲内に位置する端末に制限することができる。したがって、共通の空間に位置する第1端末と第2端末とから翻訳グループを構成したい場合等に、翻訳グループに追加する第2端末が的確に選定される。
【0016】
上記構成において、テキストと、当該テキストに関連する画像とを対応付けた付属情報データを記憶する記憶部を備え、前記翻訳管理部は、前記第1情報に対応するテキストに前記付属情報データにて対応付けられている画像を、前記翻訳結果と共に前記第2端末に配信してもよい。
【0017】
上記構成によれば、翻訳結果と共に、翻訳内容に関連する画像が第2端末に表示されるため、第2端末の利用者の翻訳内容に対する理解が深められる。
上記構成において、前記第1情報は音声として前記第1端末に入力され、前記第2端末に配信される前記翻訳結果には、音声が含まれてもよい。
【0018】
音声翻訳に要する処理の負荷は、テキストでの翻訳に要する処理の負荷と比較して大きい。上記構成によれば、音声翻訳に翻訳管理システムが利用されるため、処理の重複が抑えられることで、処理の負荷が軽減される効果が大きく得られる。
【0019】
上記構成において、前記第1情報を、前記翻訳管理部によって指定された前記翻訳対象言語に翻訳する翻訳部を備えてもよい。
上記構成によれば、翻訳管理システムが翻訳部を備えるため、外部の翻訳エンジンが利用される場合と比較して、データの授受に要する処理の効率化や、翻訳に利用する単語帳等のデータの最適化が可能である。
【発明の効果】
【0020】
本発明によれば、複数の言語への翻訳に関する処理の効率を高めることができる。
【図面の簡単な説明】
【0021】
【
図1】翻訳管理システムの第1実施形態について、翻訳管理システムを含む多言語翻訳システムの構成を示す図。
【
図2】第1実施形態の多言語翻訳システムにて設定される翻訳グループの概念を示す図。
【
図3】第1実施形態の多言語翻訳システムにおける新たな翻訳グループの生成の手順を示すシーケンス図。
【
図4】第1実施形態の多言語翻訳システムにおける入力端末の画面の一例を示す図。
【
図5】第1実施形態の多言語翻訳システムにおける入力端末の画面の一例を示す図。
【
図6】第1実施形態の多言語翻訳システムにおける翻訳グループへの出力端末の追加の手順を示すシーケンス図。
【
図7】第1実施形態の多言語翻訳システムにおける音声翻訳の手順を示すシーケンス図。
【
図8】第1実施形態の多言語翻訳システムにおける入力端末の画面の一例を示す図。
【
図9】(a)は、第1実施形態の多言語翻訳システムにおける入力端末の画面の一例を示す図、(b)は、第1実施形態の多言語翻訳システムにおける出力端末の画面の一例を示す図。
【
図10】第1実施形態の多言語翻訳システムにおけるデータの流れを模式的に示す図。
【
図11】翻訳管理システムの第2実施形態について、第2実施形態の多言語翻訳システムにおける翻訳グループへの出力端末の追加の手順を示すシーケンス図。
【
図12】翻訳管理システムの第3実施形態について、翻訳管理システムを含む多言語翻訳システムの構成を示す図。
【
図13】第3実施形態の翻訳管理システムが備える付属情報データにおけるテキストと画像との対応付けの一例を示す図。
【
図14】第3実施形態の多言語翻訳システムにおける音声翻訳の手順を示すシーケンス図。
【
図15】(a)は、第3実施形態の多言語翻訳システムにおける入力端末の画面の一例を示す図、(b)は、第3実施形態の多言語翻訳システムにおける出力端末の画面の一例を示す図。
【発明を実施するための形態】
【0022】
(第1実施形態)
図1~
図10を参照して、翻訳管理システムの第1実施形態を説明する。
[翻訳管理システムの全体構成]
図1が示すように、多言語翻訳システム100は、入力端末10と、出力端末20と、言語管理サーバ30と、音声翻訳システム40とを含んでいる。このうち、言語管理サーバ30と音声翻訳システム40とから、翻訳管理システム50が構成される。
【0023】
入力端末10および出力端末20の各々と、言語管理サーバ30とは、ネットワークを通じて、相互にデータの送信および受信を行う。また、言語管理サーバ30と音声翻訳システム40とは、ネットワークを通じて、相互にデータの送信および受信を行う。各端末10,20と言語管理サーバ30との通信に利用されるネットワーク、および、言語管理サーバ30と音声翻訳システム40との通信に利用されるネットワークの各々は、インターネット等の汎用通信回線であってもよいし、各装置の通信のための専用通信回線であってもよい。
【0024】
入力端末10は、第1端末の一例であり、通信機能および音声入力機能を有する。入力端末10には、発話者の発話内容が音声で入力される。出力端末20は、第2端末の一例であり、通信機能および音声出力機能を有する。出力端末20からは、上記発話内容の翻訳された音声が出力される。多言語翻訳システム100には、複数の出力端末20が含まれ、複数の出力端末20には、互いに異なる言語の使用者に利用される端末が含まれる。例えば、多言語翻訳システム100が観光ツアーに利用される場合、入力端末10は、ツアーガイドに携帯されて利用され、出力端末20は、ツアー参加者に携帯されて利用される。
【0025】
さらに、入力端末10および出力端末20は、表示機能や撮影機能等を有する。入力端末10および出力端末20は、例えば、スマートフォンやタブレット端末等の汎用端末である。
【0026】
言語管理サーバ30は、入力端末10と、この入力端末10に入力された発話内容の翻訳結果が配信される複数の出力端末20との組み合わせ、および、翻訳対象の言語を管理する。
【0027】
言語管理サーバ30は、通信部31と、制御部32と、記憶部33とを備えている。
通信部31は、ネットワークを通じて、言語管理サーバ30と各端末10,20および音声翻訳システム40との接続処理を実行し、接続された装置間でデータの送信および受信を行う。
【0028】
制御部32は、CPU、および、RAM等の揮発性メモリを含む。制御部32は、記憶部33に記憶されたプログラムやデータに基づいて、通信部31による処理の制御、記憶部33における情報の読み出しや書き込み、各種の演算処理等、言語管理サーバ30が備える各部の制御を行う。
【0029】
多言語翻訳システム100において、制御部32は、グループ管理部32aおよび翻訳管理部32bとして機能する。
グループ管理部32aは、翻訳グループGpを管理する。1つの翻訳グループGpには、1つの入力端末10と、当該入力端末10に入力された発話内容の翻訳結果の配信対象である複数の出力端末20とが属する。翻訳グループGpにおいては、各出力端末20に対して、配信に用いられる言語、すなわち、配信される翻訳結果の使用言語を規定する配信言語が設定されている。そして、翻訳グループGpごとに、翻訳グループGpに属する出力端末20の配信言語に応じて、発話内容が翻訳される言語である翻訳対象言語が設定されている。また、翻訳グループGpには、有効期間が設定されている。有効期間は、当該翻訳グループGpへの出力端末20の追加が許容される期間である。
【0030】
グループ管理部32aは、複数の翻訳グループGpを設定する。各翻訳グループGpの設定処理には、翻訳グループGpに属する入力端末10および出力端末20の登録、出力端末20の配信言語の設定、翻訳グループGpにおける翻訳対象言語の設定、および、翻訳グループGpの有効期間の設定が含まれる。
【0031】
なお、グループ管理部32aにおけるデータの送受信の機能は、通信部31が担う。
翻訳管理部32bは、入力端末10から発話内容の音声データを受信したとき、当該入力端末10が属する翻訳グループGpの翻訳対象言語への音声翻訳の指示を、音声翻訳システム40に対して行う。そして、翻訳管理部32bは、当該翻訳グループGpに属する各出力端末20に対して、出力端末20の配信言語に対応する言語への翻訳結果を送信する。なお、翻訳管理部32bにおけるデータの送受信の機能は、通信部31が担う。
【0032】
記憶部33は、不揮発性メモリを含み、制御部32が実行する処理に必要なプログラムやデータを記憶している。こうしたデータの一部として、記憶部33は、グループデータ33aと翻訳履歴データ33bとを記憶している。グループデータ33aは、翻訳グループGpに関するデータである。グループデータ33aには、例えば、各翻訳グループGpについての、翻訳グループGpに属する入力端末10および出力端末20の識別情報、出力端末20の配信言語、翻訳対象言語、有効期間が含まれる。翻訳履歴データ33bは、翻訳グループGpごとの翻訳の履歴を含む。翻訳履歴データ33bは、例えば、入力端末10に入力された音声の認識結果であるテキストデータ、および、当該テキストデータの翻訳対象言語への翻訳結果であるテキストデータが含まれる。
【0033】
なお、制御部32におけるグループ管理部32aおよび翻訳管理部32bの機能は、複数のCPUや、RAM等からなるメモリ等の各種のハードウェアと、これらを機能させるソフトウェアとによって具体化されてもよく、あるいは、共通する1つのハードウェアに複数の機能を与えるソフトウェアによって具体化されてもよい。
【0034】
音声翻訳システム40は、翻訳部として機能し、音声を認識してテキストに変換する処理と、当該テキストを指定の言語に翻訳する処理と、翻訳されたテキストから音声を合成する処理とを行う。音声翻訳システム40は、1以上のサーバから構成され、上記の各処理に要するプログラムおよびデータを有している。例えば、音声翻訳システム40は、音声認識処理を行う音声認識サーバ41と、翻訳処理を行う翻訳サーバ42と、音声合成処理を行う音声合成サーバ43とから構成される。
【0035】
[翻訳グループの構成]
図2を参照して、翻訳グループGpの詳細について説明する。
図2は、言語管理サーバ30にて構築される翻訳グループGpの例を概念的に示す。
【0036】
言語管理サーバ30においては、複数の翻訳グループGpが設定されている。
図2では、3つの翻訳グループGpが設定されている例を示している。
各翻訳グループGpには、1つの入力端末10と複数の出力端末20とが属する。例えば、翻訳グループGpAには、入力端末10aと、6つの出力端末20a~20fとが属している。なお、互いに異なる翻訳グループGpに、同一の入力端末10が属してもよいし、互いに異なる翻訳グループGpに、同一の出力端末20が属してもよい。言い換えれば、同一の入力端末10が複数の翻訳グループGpに属してもよいし、同一の出力端末20が複数の翻訳グループGpに属してもよい。
【0037】
翻訳グループGpは、上述のように、入力端末10と、当該入力端末10に入力された発話内容の翻訳結果が配信される出力端末20とからなるグループである。例えば、多言語翻訳システム100が観光ツアーに利用される場合、1つの観光ツアーのツアーガイドが携帯する入力端末10と、当該観光ツアーの参加者が携帯する出力端末20とから、1つの翻訳グループGpが構築される。例えば、1人のツアーガイドが複数の観光ツアーにてガイドを行う場合、観光ツアーごとに、ツアーガイドの入力端末10と参加者の出力端末20とから、翻訳グループGpが構築される。
【0038】
各翻訳グループGpにおいては、各出力端末20の配信言語が設定されている。そして、翻訳グループGpに属する出力端末20の配信言語の種類に対応させて、当該翻訳グループGpにおける翻訳対象言語が設定されている。言い換えれば、翻訳グループGpに属する複数の出力端末20の配信言語が分類され、この分類の言語に対応させて、当該翻訳グループGpにおける翻訳対象言語が設定されている。
【0039】
例えば、翻訳グループGpAにおいて、出力端末20a,出力端末20b,出力端末20cに対して、配信言語として英語が設定されており、出力端末20dに対して、配信言語として中国語が設定されており、出力端末20e,出力端末20fに対して、配信言語として韓国語が設定されている。このように、翻訳グループGpAには6つの出力端末20a~20fが属する一方で、これらの出力端末20の配信言語は英語と中国語と韓国語との三種類である。すなわち、翻訳グループGpAに属する出力端末20a~20fの配信言語は3つに分類される。そして、この分類に対応する言語が、翻訳対象言語として設定される。すなわち、翻訳グループGpAには、翻訳対象言語として、英語と中国語と韓国語との3つの言語が設定されている。
【0040】
翻訳対象言語は、翻訳グループGpごとに、出力端末20の配信言語の種類に対応するように設定される。言い換えれば、翻訳グループGpの翻訳対象言語は、音声翻訳システム40によって翻訳可能な言語のうち、翻訳グループGpに属する出力端末20の配信言語に絞られている。それゆえ、互いに異なる翻訳グループGpにおける翻訳対象言語の数およびその内訳は、一致する場合もあれば、一致しない場合もある。例えば、翻訳グループGpAの翻訳対象言語は英語と中国語と韓国語との三種類であるが、翻訳グループGpBの翻訳対象言語は英語とフランス語との二種類である。
【0041】
なお、入力端末10に入力される発話内容の言語、すなわち、翻訳前の言語は、所定の言語に一律に定められていてもよいし、翻訳グループGpごとに設定可能であってもよい。
図2に示した例では、入力端末10への入力言語が、日本語に一律に定められている場合が想定されている。
【0042】
各翻訳グループGpには、有効期間が設定されている。有効期間は、所定の年月日から所定の年月日までの期間であってもよいし、所定の年月日における所定の時刻から所定の時刻までの期間であってもよい。有効期間は、上述のように、当該翻訳グループGpへの出力端末20の追加が許容される期間であり、言い換えれば、当該翻訳グループGpでの音声翻訳が許容される期間である。例えば、多言語翻訳システム100が観光ツアーに利用される場合、観光ツアーが実施される予定の期間が、当該観光ツアーに対応する翻訳グループGpの有効期間として設定される。
【0043】
[翻訳管理システムの動作]
図3~
図9を参照して、翻訳管理システム50を含む多言語翻訳システム100の動作を説明する。なお、多言語翻訳システム100の動作における入力端末10および出力端末20の処理は、ウェブアプリケーションに基づき実行されてもよいし、これらの端末にインストールされたアプリケーションソフトウェアに基づき実行されてもよい。
【0044】
例えば、入力端末10の処理は、出力端末20の処理よりも多く複雑になりやすいため、入力端末10にインストールされたアプリケーションソフトウェアに基づき入力端末10の処理が実行されることで、入力端末10の処理を円滑に進められる効果が高く得られる。一方、入力端末10よりも利用者の多い出力端末20については、ウェブアプリケーションが利用されると、多言語翻訳システム100の利用のために要する出力端末20の設定等の負荷が軽減されるため、利便性が大きく高められる。ウェブアプリケーションが利用される形態であれば、例えば、観光ツアーの参加者が、旅先にて、自身の所有する携帯端末を容易に出力端末20として利用することが可能であるため、多言語翻訳システム100が利用しやすくなる。
【0045】
<翻訳グループの設定>
まず、翻訳グループGpの設定の手順について説明する。
図3が示すように、入力端末10にて所定の操作が行われることに基づき、入力端末10から、新たな翻訳グループGpの生成の要求が、言語管理サーバ30に送信される(ステップS10)。例えば、
図4が示すように、入力端末10におけるアプリケーションソフトウェアの起動等に伴い表示される画面Paにて、新たな翻訳グループGpの生成を指示する領域Raが選択されることに基づき、上記生成の要求が、言語管理サーバ30に送信される。
【0046】
先の
図3にて、新たな翻訳グループGpの生成の要求を受けると、言語管理サーバ30のグループ管理部32aは、新規の翻訳グループGpの生成処理を行う(ステップS11)。具体的には、グループ管理部32aは、グループデータ33aに、新規の翻訳グループGpのデータを追加する。当該新規の翻訳グループGpのデータにおいては、翻訳グループGpに属する入力端末10として、ステップS10における新たな翻訳グループGpの生成の要求の送信元である入力端末10が設定される。また、当該新規の翻訳グループGpのデータにおいては、翻訳グループGpの有効期間も設定される。有効期間は、入力端末10にて任意の期間が指定され、この指定された期間が言語管理サーバ30に通知されることに基づき、当該期間に設定されてもよいし、言語管理サーバ30にて予め定められている期間に設定されてもよい。
【0047】
続いて、グループ管理部32aは、生成した翻訳グループGpの識別情報Idを含む情報を、入力端末10に送信する(ステップS12)。当該情報を受信すると、入力端末10は、入力端末10の表示部に識別情報Idを含む情報を表示する(ステップS13)。
【0048】
翻訳グループGpの識別情報Idは、出力端末20によって機械的に読み取り可能な形態、もしくは、出力端末20の利用者に人為的に伝達可能な形態で、入力端末10に表示される。例えば、翻訳グループGpの識別情報Idは、二次元コードとして入力端末10に表示され、出力端末20によって読み取られることが好ましい。二次元コードは、例えば、識別情報Idを含むとともに言語管理サーバ30のアクセス先を示すURLを、情報として保持する。
【0049】
図5は、翻訳グループGpの識別情報Idを含む二次元コードCdが表示された入力端末10の例を示す。なお、新規の翻訳グループGpの生成後においては、当該翻訳グループGpの識別情報Idは、任意のタイミングで入力端末10に表示可能とされることが好ましい。例えば、先の
図4が示すように、生成済みの翻訳グループGpを選択するための領域Rbが画面Paに含められて入力端末10に表示される。領域Rbが選択されると、入力端末10からの要求に応じて、領域Rbに対応する翻訳グループGpの識別情報Idを含む情報が言語管理サーバ30から入力端末10に送信されて、当該情報が入力端末10に表示される。
【0050】
なお、翻訳グループGpの識別情報Idを含む二次元コードは、入力端末10に表示された状態に限らず、入力端末10の画面の印刷に基づき紙に印刷された状態で、出力端末20の利用者に提供されてもよい。また、翻訳グループGpの識別情報Idが、二次元コードとは異なる形態で入力端末10に表示される場合も同様に、紙面や口頭での伝達を通じて、翻訳グループGpの識別情報Idが出力端末20の利用者に提供され、利用者によって識別情報Idが出力端末20に入力されてもよい。要は、出力端末20が翻訳グループGpの識別情報Idを取得可能であればよい。
【0051】
また、
図5が示すように、入力端末10に表示される画面Pbには、選択されている翻訳グループGpでの音声翻訳の開始を指示するための領域Rcも含まれる。
図6が示すように、出力端末20は、翻訳グループGpの識別情報Idを取得することに基づき、翻訳グループGpへの追加の要求を、言語管理サーバ30に送信する(ステップS20)。例えば、翻訳グループGpの識別情報Idが二次元コードに含まれる場合、出力端末20は、当該二次元コードを読み取り、それによって取得されるURLへアクセスする。これにより、翻訳グループGpの識別情報Idが出力端末20から言語管理サーバ30に通知され、当該翻訳グループGpへの追加の要求として機能する。
【0052】
翻訳グループGpへの追加の要求を受けると、言語管理サーバ30のグループ管理部32aは、出力端末20に対し、言語情報の送信を要求する(ステップS21)。言語情報は、配信言語を指定する情報である。
【0053】
言語管理サーバ30からの要求を受けて、出力端末20は、言語情報を、言語管理サーバ30に送信する(ステップS22)。例えば、出力端末20の画面を通じて利用者が言語を指定することに基づき、指定された言語を示す言語情報が、出力端末20から言語管理サーバ30に送信される。あるいは、出力端末20における使用言語、すなわち、出力端末20にて情報の表示に用いられている言語を示す情報が、言語情報として、出力端末20から言語管理サーバ30に送信されてもよい。
【0054】
言語情報を受信すると、言語管理サーバ30のグループ管理部32aは、上記追加の要求に伴い取得した識別情報Idに対応する翻訳グループGpに、出力端末20を追加する処理を行う(ステップS23)。
【0055】
具体的には、グループ管理部32aは、上記識別情報Idに対応する翻訳グループGpに、当該出力端末20を属させる。すなわち、グループデータ33aの上記識別情報Idに対応する翻訳グループGpのデータにおいて、翻訳グループGpに属する出力端末20として、ステップS20における翻訳グループGpへの追加の要求の送信元である出力端末20が設定される。さらに、グループ管理部32aは、グループデータ33aにおいて、追加された出力端末20の配信言語として、当該出力端末20から受信した言語情報が示す言語を設定する。
【0056】
上記翻訳グループGpの設定においては、例えば、識別情報Idの取得に基づく出力端末20から言語管理サーバ30へのアクセスが、識別情報Idに対応する翻訳グループGpの有効期間内にのみ許容されることによって、翻訳グループGpへ出力端末20を追加可能な期間が上記有効期間内に制限される。例えば、識別情報Idを含む二次元コードが保持するURLとして、上記有効期間内にのみアクセスが可能な期限付きのURLが用いられればよい。
【0057】
あるいは、出力端末20からの翻訳グループGpへの追加の要求を受けたときに、言語管理サーバ30のグループ管理部32aは、その時点が、対象の翻訳グループGpの有効期間内であるか否かを確認し、当該時点が有効期間内である場合にのみ、翻訳グループGpへの出力端末20の追加を行ってもよい。また、グループ管理部32aは、生成済みの翻訳グループGpの識別情報Idを入力端末10に送信する際に、その時点が、当該翻訳グループGpの有効期間内であるか否かを確認し、当該時点が有効期間内である場合にのみ、識別情報Idの入力端末10への送信を行ってもよい。これらの構成によっても、翻訳グループGpへ出力端末20を追加可能な期間が翻訳グループGpの有効期間内に制限される。
【0058】
翻訳グループGpの翻訳対象言語は、その時点で当該翻訳グループGpに属している出力端末20の配信言語の種類に対応させて設定される。すなわち、翻訳グループGpへの出力端末20の追加によって、当該翻訳グループGpに属する出力端末20の配信言語の種類が増えた場合、言い換えれば、追加された出力端末20の配信言語が、既に当該翻訳グループGpに属している出力端末20の配信言語のいずれとも異なる場合には、追加された出力端末20の配信言語が、当該翻訳グループGpの翻訳対象言語に加えられる。つまり、グループデータ33aの当該翻訳グループGpのデータにおいて、翻訳対象言語が更新され、追加された出力端末20の配信言語が翻訳対象言語に加えられる。
【0059】
このように、翻訳グループGpの翻訳対象言語は、翻訳グループGpに属する出力端末20の変化に応じ、配信言語の種類の変化に伴って変わる。
また、出力端末20の配信言語は任意に変更可能であることが好ましい。配信言語の変更は、例えば、以下の手順で行われる。すなわち、出力端末20に表示される画面には、配信言語の変更を指示するための領域が含まれ、当該領域が選択されて新たな言語が指定されることによって、新たな言語情報とともに配信言語の変更の要求が、出力端末20から言語管理サーバ30に送信される。配信言語の変更の要求を受けると、言語管理サーバ30のグループ管理部32aは、当該出力端末20の配信言語を新たな言語情報が示す言語に変更するよう、グループデータ33aを変更する。
【0060】
出力端末20の配信言語の変更に伴って、当該出力端末20が属する翻訳グループGpでの配信言語の種類が変化した場合には、この変化に従って、当該翻訳グループGpの翻訳対象言語が変更される。
【0061】
上記構成において、例えば、多言語翻訳システム100が観光ツアーに用いられる場合、観光ツアーの開始に際して、ツアーガイドが入力端末10に翻訳グループGpの識別情報Idを含む二次元コードを表示させ、ツアー参加者が出力端末20によって二次元コードを読み取る。これにより、翻訳グループGpにツアー参加者の出力端末20が追加され、当該翻訳グループGpでの音声翻訳を利用して観光ツアーを進めることが可能となる。生成済みの翻訳グループGpの識別情報Idが、任意のタイミングで入力端末10に表示可能であれば、観光ツアーの途中で新たなツアー参加者の出力端末20を翻訳グループGpに加えることが可能であるため、翻訳グループGpの構成についての自由度が高められる。
【0062】
<音声翻訳>
続いて、音声翻訳の手順について説明する。
図7が示すように、まず、翻訳グループGpが選択された状態で、入力端末10に対し発話内容を示す音声が入力される(ステップS30)。生成済みの翻訳グループGpの指定、あるいは、新たな翻訳グループの生成が、翻訳グループGpの選択として機能する。例えば、
図8が示すように、翻訳グループGpを選択して音声翻訳の開始を指示すると、入力端末10に音声入力のための画面Pcが表示され、利用者が入力端末10に向かって話すことにより、その音声が入力端末10に入力される。
【0063】
入力端末10に入力された音声を示す第1音声データS1は、入力端末10から言語管理サーバ30に送信される(ステップS31)。第1音声データS1は第1情報の一例である。また、第1音声データS1の送信時あるいはその前に、選択されている翻訳グループGpを示す情報も、入力端末10から言語管理サーバ30に送信される。
【0064】
第1音声データS1を受信すると、言語管理サーバ30の翻訳管理部32bは、音声翻訳の要求を、音声翻訳システム40に送信する(ステップS32)。詳細には、翻訳管理部32bは、グループデータ33aを参照し、入力端末10で選択されている翻訳グループGpの翻訳対象言語を特定する。そして、翻訳管理部32bは、特定された翻訳対象言語への翻訳を、音声翻訳システム40に指示する。第1音声データS1は、言語管理サーバ30から音声翻訳システム40に送信される。
【0065】
言語管理サーバ30からの要求を受けて、音声翻訳システム40は、音声翻訳処理を行う(ステップS33)。すなわち、音声翻訳システム40は、まず、第1音声データS1に対して音声認識処理を行い、第1音声データS1に対応する言語のテキストデータである第1テキストデータT1を生成する。次に、音声翻訳システム40は、第1テキストデータT1を、翻訳対象言語に翻訳し、翻訳対象言語のテキストデータである第2テキストデータT2を生成する。翻訳対象言語が複数の言語であるとき、音声翻訳システム40は、第1テキストデータT1を、翻訳対象言語の各々に翻訳し、各言語の第2テキストデータT2を生成する。そして、音声翻訳システム40は、第2テキストデータT2に基づき音声を合成し、第2テキストデータT2に対応する言語の音声データである第2音声データS2を生成する。これにより、翻訳対象言語の種類および数に応じた言語の種類および数の第2音声データS2が生成される。
【0066】
音声翻訳処理が完了すると、音声翻訳システム40は、処理結果を言語管理サーバ30に送信する(ステップS34)。処理結果には、第2音声データS2と、第1テキストデータT1および第2テキストデータT2とが含まれる。
【0067】
処理結果を受信すると、言語管理サーバ30の翻訳管理部32bは、入力端末10で選択されている翻訳グループGpに属する出力端末20に対し、設定されている配信言語に応じた言語の第2音声データS2を送信する(ステップS35)。このとき、翻訳管理部32bは第2音声データS2に対応する第2テキストデータT2も併せて、出力端末20に送信することが好ましい。また、翻訳管理部32bは、入力端末10に対し、第1テキストデータT1を送信することが好ましい。
【0068】
さらに、翻訳管理部32bは、受信した処理結果のうち、少なくとも第1テキストデータT1および第2テキストデータT2を、翻訳履歴データ33bにおける該当の翻訳グループGpのデータに含めて記憶部33に記憶させる(ステップS36)。
【0069】
第2音声データS2を受信すると、出力端末20は、第2音声データS2に基づく音声を出力する(ステップS37)。これにより、入力端末10に入力された発話内容が翻訳された音声が、出力端末20にて出力される。
【0070】
第2音声データS2と併せて第2テキストデータT2を受信した場合、出力端末20は、出力端末20の表示部に、第2テキストデータT2に基づく文字列を表示する。第1テキストデータT1を受信した場合、入力端末10は、入力端末10の表示部に、第1テキストデータT1に基づく文字列を表示する。
【0071】
図9(a)は、上述した処理の結果、入力端末10に表示される画面Pdの例を示し、
図9(b)は、上述した処理の結果、出力端末20に表示される画面Peの例を示す。入力端末10の画面Pdには、第1テキストデータT1に基づく文字列、すなわち、入力端末10に入力された発話内容の音声認識結果を示す領域Rdが含まれる。画面Pdを見ることによって、入力端末10の利用者は、発話内容が正しく認識されているかを確認することができる。出力端末20の画面Peには、第2テキストデータT2に基づく文字列、すなわち、入力端末10に入力された発話内容の翻訳結果に対応する文章を示す領域Reが含まれる。画面Peを見ることによって、出力端末20に利用者は、音声に加えて文字で翻訳結果を確認できるため、翻訳結果の理解が容易になる。
【0072】
なお、各翻訳対象言語の第2テキストデータT2が言語管理サーバ30から入力端末10に送信され、第2テキストデータT2に基づく文字列が入力端末10に表示されてもよい。こうした構成によれば、入力端末10の利用者は、発話内容の翻訳結果を確認することができるため、翻訳結果が適当であるか否かを把握することができる。
【0073】
また、入力端末10においては、翻訳履歴データ33bの確認が可能とされる。翻訳履歴データ33bの確認は、例えば、以下の手順で行われる。すなわち、翻訳グループGpが選択された状態で、入力端末10から、翻訳履歴データ33bの確認の要求が、言語管理サーバ30に送信される。翻訳履歴データ33bの確認の要求は、例えば、入力端末10の画面内において翻訳履歴の確認を指示する領域が選択されることに基づいて行われる。翻訳履歴データ33bの確認の要求を受けると、言語管理サーバ30の翻訳管理部32bは、翻訳履歴データ33bが含むデータのうち、入力端末10にて選択されている翻訳グループGpのデータを、入力端末10に送信する。入力端末10は、受信したデータを表示する。これにより、入力端末10の利用者は、選択している翻訳グループGpにおける音声翻訳の履歴、すなわち、どのような発話内容に対し、どのような翻訳結果が出力端末20に送信されたかを各翻訳対象言語について確認することができる。
【0074】
図10を参照して、多言語翻訳システム100の作用を説明する。
図10は、先の
図2に示した翻訳グループGpAでの音声翻訳を概念的に示す。翻訳グループGpAにおいて、翻訳対象言語は、英語、中国語、韓国語の三種類であり、入力端末10aには日本語の音声が入力される。
【0075】
入力端末10aから、日本語の音声データが翻訳管理システム50に送信されると、翻訳管理システム50では、当該音声データについて、翻訳対象言語への音声翻訳が行われる。すなわち、日本語から英語への翻訳が行われて英語の音声データが生成され、日本語から中国語への翻訳が行われて中国語の音声データが生成され、日本語から韓国語への翻訳が行われて韓国語の音声データが生成される。
【0076】
そして、英語の音声データが、配信言語が英語に設定されている3つの出力端末20a~20cに配信され、中国語の音声データが、配信言語が中国語に設定されている1つの出力端末20dに配信され、韓国語の音声データが、配信言語が韓国語に設定されている2つの出力端末20e,20fに配信される。
【0077】
このように、配信言語が同一である複数の出力端末20が存在する場合でも、当該配信言語に対応する言語への翻訳に基づき生成される音声データは1つであり、同一の音声データが複数の出力端末20に配信される。言い換えれば、配信言語ごとに、複数の出力端末20への配信のための翻訳および音声合成の処理がまとめて行われる。したがって、出力端末20ごとに翻訳および音声合成の処理が行われて別々の音声データが生成される場合と比較して、処理の重複が抑えられる。
【0078】
また、翻訳前の音声データに対する音声認識によって生成されるテキストデータについては、1つのデータを共通して各言語への翻訳に利用することができる。すなわち、複数の出力端末20への配信のための音声認識の処理をまとめて行うことで、出力端末20ごとに音声認識の処理が行われる場合と比較して、処理の重複が抑えられる。
【0079】
また、音声認識、翻訳、音声合成の各処理が上述のようにまとめて行われるため、こうした処理が配信対象の端末ごとにサーバで繰り返し行われる場合と比較して、翻訳管理システム50の処理の負荷が軽減される。したがって、迅速な音声翻訳および翻訳結果の配信が可能となり、すなわち、発話内容の入力から翻訳結果の配信までに要する時間の短縮が可能である。
【0080】
また、利用者に携帯される入力端末10や出力端末20は翻訳機能を有する必要がないため、端末の構成が簡易になり、汎用端末を入力端末10や出力端末20として用いることが容易に可能となる。したがって、専用端末を利用する場合と比較して、端末の準備や配布に要する労力が軽減され、また、専用端末同士の直接の通信によって音声翻訳を行う形態と比較して、通信環境の整備に要する負担が軽減される。それゆえ多言語翻訳システム100の利用についての利便性が高められる。
【0081】
以上説明したように、第1実施形態によれば、以下の効果を得ることができる。
(1)配信言語ごとに、出力端末20への配信のための翻訳および音声合成の処理がまとめて行われ、共通のデータが同一の配信言語の出力端末20に配信される。したがって、出力端末20ごとに翻訳および音声合成の処理が行われて別々のデータが生成される場合と比較して、処理の重複が抑えられる。また、複数の出力端末20への配信のための音声認識の処理がまとめて行われ、共通のデータが各翻訳対象言語への翻訳に用いられる。したがって、出力端末20ごとに音声認識の処理が行われて別々のデータが生成される場合と比較して、処理の重複が抑えられる。これにより、複数の言語への翻訳に関する処理の効率を高めることができる。
【0082】
(2)有効期間の設定によって、翻訳グループGpへの出力端末20の追加が、所定の期間内に制限されている。そのため、一時的な活動への参加者が携帯する端末から翻訳グループGpを構成して、当該翻訳グループGpでの翻訳結果の配信を利用することができる。したがって、観光ツアーのように、一時的な活動での利用に適したシステムが実現される。
【0083】
(3)言語管理サーバ30は、入力端末10からの翻訳グループGpの生成の要求に応じ、新たな翻訳グループGpを生成して当該翻訳グループGpの識別情報Idを入力端末10に送信する。そして、言語管理サーバ30は、識別情報Idを取得した出力端末20から翻訳グループGpへの追加の要求を受けることに基づき、上記識別情報Idに対応する翻訳グループGpに出力端末20を追加する。このように、入力端末10と出力端末20との間での識別情報Idの授受を通じて、翻訳グループGpに追加される出力端末20、すなわち、翻訳結果の配信対象の端末が決まる。したがって、翻訳グループGpに追加するべき出力端末20の的確な選定が可能であり、また、識別情報Idを用いることで、出力端末20が追加される翻訳グループGpの的確な識別が可能である。
【0084】
(4)言語管理サーバ30は、複数の翻訳グループGpを設定し、これらの翻訳グループGpには、同一の入力端末10が属する複数の翻訳グループGpが含まれる。そして、言語管理サーバ30は、第1音声データS1を受信したとき、入力端末10にて選択されている翻訳グループGpの翻訳対象言語への翻訳を指示し、当該翻訳グループGpに属する出力端末20に翻訳結果の配信を行う。こうした構成によれば、1つの入力端末10が属する翻訳グループGpとして、翻訳結果の配信対象の端末が異なる複数の翻訳グループGpの設定が可能であり、入力端末10の利用者は、利用の目的に応じて、複数の翻訳グループGpを使い分けることができる。
【0085】
(5)音声翻訳に翻訳管理システム50が利用されるため、テキストでの翻訳よりも処理負荷の大きい音声翻訳にて処理の重複が抑えられる。したがって、処理の負荷が軽減される効果が大きく得られる。
【0086】
(6)翻訳管理システム50が、翻訳部として機能する音声翻訳システム40を備える。そのため、外部の翻訳エンジンが利用される場合と比較して、データの授受に要する処理の効率化や、翻訳に利用する単語帳等のデータの最適化が可能である。
【0087】
(第2実施形態)
図11を参照して、翻訳管理システムの第2実施形態を説明する。第2実施形態の翻訳管理システムは、翻訳グループへの出力端末の追加に際して、端末の位置の確認を行う点が、第1実施形態と異なっている。以下では、第2実施形態と第1実施形態との相違点を中心に説明し、第1実施形態と同様の構成については同じ符号を付してその説明を省略する。
【0088】
例えば、多言語翻訳システム100が観光ツアーに利用される場合等には、入力端末10の利用者と、出力端末20の利用者とは、同一の空間に位置する。第2実施形態では、入力端末10から所定の範囲内に出力端末20が位置することを条件として、出力端末20を翻訳グループGpに加える。
【0089】
第2実施形態において、入力端末10および出力端末20の各々は、端末の位置を示す位置情報の取得機能を有する。位置情報は、各端末の絶対的な位置、あるいは、所定の基準に対する各端末の相対的な位置を特定可能な情報であればよく、入力端末10を中心とする所定の範囲内に出力端末20が位置するか否かの判断に用いることが可能な情報であればよい。
【0090】
例えば、位置情報としては、GPS(グローバル・ポジショニング・システム)の利用によって得られる緯度および経度からなる情報、あるいは、Wi-Fi(登録商標)やBluetooth(登録商標)といった近距離無線通信、音波、超音波、光等を用いた相対的な位置を特定可能とする情報が用いられる。必要に応じて、入力端末10および出力端末20が位置し得る場所、例えば、観光ツアーが行われる観光施設内には、位置情報の取得のための電波等の発信機や受信機が設けられる。
【0091】
図11が示すように、第1実施形態と同様に、出力端末20は、翻訳グループGpの識別情報Idを取得することに基づき、翻訳グループGpへの追加の要求を、言語管理サーバ30に送信する(ステップS40)。
【0092】
翻訳グループGpへの追加の要求を受けると、言語管理サーバ30のグループ管理部32aは、出力端末20に対し、言語情報の送信を要求する(ステップS41)。また、グループ管理部32aは、出力端末20、および、上記識別情報Idに対応する翻訳グループGpに属する入力端末10に対し、位置情報の送信を要求する(ステップS42)。
【0093】
言語管理サーバ30からの要求を受けて、出力端末20は、言語情報および出力端末20の位置情報を、言語管理サーバ30に送信する(ステップS43)。また、言語管理サーバ30からの要求を受けて、入力端末10は、入力端末10の位置情報を、言語管理サーバ30に送信する(ステップS44)。
【0094】
入力端末10および出力端末20の各々から位置情報を受信すると、言語管理サーバ30のグループ管理部32aは、受信した位置情報に基づいて、入力端末10から所定の範囲内に出力端末20が位置するか否かを判定する(ステップS45)。
【0095】
入力端末10から所定の範囲内に出力端末20が位置することが確認されると、グループ管理部32aは、上記識別情報Idに対応する翻訳グループGpに出力端末20を追加する処理を行う(ステップS46)。入力端末10から所定の範囲内に出力端末20が位置しないと判定される場合には、翻訳グループGpに出力端末20を追加する処理は行われず、翻訳グループGpへの追加ができないことが出力端末20に通知される。
【0096】
第2実施形態においても、翻訳グループGpでの音声翻訳の処理は、第1実施形態と同様に行われる。第2実施形態では、入力端末10の位置から所定の範囲内に出力端末20が位置することを条件として、出力端末20が翻訳グループGpに追加されるため、翻訳グループGpに追加されるべき出力端末20の識別が的確に行われる。特に、共通の空間に位置する入力端末10と出力端末20とによって翻訳グループGpを構成したい場合に、高い効果が得られる。
【0097】
また、第2実施形態の構成は、翻訳結果の配信についてのセキュリティの向上にも寄与する。例えば、入力端末10に入力される発話内容が、第三者への漏洩が好ましくない情報を含む場合に、第三者が識別情報Idを不正に入手して遠隔地から翻訳グループGpに参加しようとしても、第三者が有する端末の翻訳グループGpへの追加が拒否されるため、発話内容の翻訳結果が第三者に漏れることが抑えられる。
【0098】
なお、翻訳グループGpへの出力端末20の追加に加えて、翻訳結果の出力端末20への配信に際しても、入力端末10の位置から所定の範囲内に出力端末20が位置することが条件とされてもよい。すなわち、出力端末20への第2音声データS2の送信前に、言語管理サーバ30の翻訳管理部32bは、各端末10,20から位置情報を取得して、入力端末10の位置から所定の範囲内に出力端末20が位置する場合に、第2音声データS2を出力端末20に送信する。こうした構成によれば、翻訳結果の配信についてのセキュリティがより高められる。
【0099】
また、上記構成において、翻訳グループGpに属している出力端末20のなかに、翻訳結果の配信に際して、入力端末10の位置から所定の範囲内に位置しない出力端末20があった場合、上記所定の範囲から外れた出力端末20があることが入力端末10に通知されてもよい。こうした構成によれば、例えば、多言語翻訳システム100が観光ツアーに利用される場合、ツアーの集団から逸れた参加者がいると、上記所定の範囲から外れた出力端末20があることが入力端末10に通知される。したがって、入力端末10を利用するツアーガイドは、参加者における迷子の有無等を把握できる。
【0100】
第2実施形態において、入力端末10および出力端末20の位置情報は、必ずしも端末自体から取得される必要はなく、言語管理サーバ30は、入力端末10および出力端末20の付近に設けられた電波の受信機等の装置の出力に基づいて、端末の位置情報を取得してもよい。また、入力端末10および出力端末20が位置する場所が特定の範囲に限られている場合には、入力端末10に対する位置に代えて、上記特定の範囲に出力端末20が位置することが、翻訳グループGpへの出力端末20の追加の条件とされてもよい。
【0101】
以上説明したように、第2実施形態によれば、第1実施形態の(1)~(6)の効果に加えて、以下の効果を得ることができる。
(7)言語管理サーバ30は、翻訳グループGpへの出力端末20の追加の要求を出力端末20から受けたとき、入力端末10の位置から所定の範囲内に出力端末20が位置することを条件として、出力端末20を翻訳グループGpに追加する。したがって、共通の空間に位置する入力端末10と出力端末20とから翻訳グループGpを構成したい場合等に、翻訳グループGpに追加する出力端末20が的確に選定される。また、翻訳結果の配信についてのセキュリティも高められる。
【0102】
(第3実施形態)
図12~
図15を参照して、翻訳管理システムの第3実施形態を説明する。第3実施形態の翻訳管理システムは、翻訳結果に加えて、発話内容に関連する画像が出力端末に配信される点が、第1実施形態と異なっている。以下では、第3実施形態と第1実施形態との相違点を中心に説明し、第1実施形態と同様の構成については同じ符号を付してその説明を省略する。
【0103】
図12が示すように、第3実施形態の言語管理サーバ30は、記憶部33に、付属情報データ33cを記憶している。付属情報データ33cにおいては、単語等のテキストと、当該テキストに関連する画像とが対応付けられている。例えば、多言語翻訳システム100が観光ツアーに利用される場合、観光においてポイントとなる単語と、当該単語に関連する画像とが対応付けられている。
【0104】
図13は、付属情報データ33cにおけるテキストと画像との対応付けの一例を示す。
図13においては、「松之大廊下」というテキストと、江戸城松之大廊下での刃傷沙汰、すなわち、赤穂事件の一場面を示す絵画の画像とが対応付けられている。テキストと画像との関係は、特に限定されない。例えば、テキストが示す物品や人物や場所の絵あるいは写真の画像が、当該テキストと対応付けられていてもよいし、テキストが示す歴史的出来事やイベントの一場面の画像が、当該テキストと対応付けられていてもよい。
【0105】
第3実施形態において、翻訳グループGpの設定は、第1実施形態と同様に行われる。
図14を参照して、第3実施形態における音声翻訳の手順を説明する。
図14が示すように、ステップS50~ステップS53の処理は、第1実施形態のステップS30~ステップS33の処理と同じである。すなわち、入力端末10に対し発話内容を示す音声が入力されると、当該音声を示す第1音声データS1が、入力端末10から言語管理サーバ30に送信される。言語管理サーバ30は、入力端末10で選択されている翻訳グループGpの翻訳対象言語への第1音声データS1の翻訳を、音声翻訳システム40に指示する。音声翻訳システム40は、音声翻訳処理を行い、第1テキストデータT1と、各翻訳対象言語の第2テキストデータT2および第2音声データS2とを、言語管理サーバ30に送信する。
【0106】
第1テキストデータT1、第2テキストデータT2、および、第2音声データS2を含む処理結果を受信すると、言語管理サーバ30の翻訳管理部32bは、第1テキストデータT1が含むテキストに、付属情報データ33cにて対応付けられている画像を特定する(ステップS55)。
【0107】
上記画像が特定される場合、翻訳管理部32bは、出力端末20に、配信言語に応じた言語の第2音声データS2と共に、特定された画像を示す画像データDiを送信する(ステップS56)。付属情報データ33cにおいて、第1テキストデータT1が含むテキストに対応付けられている画像がない場合は、画像データDiの送信は行われず、第1実施形態と同様の処理が進められる。
【0108】
さらに、翻訳管理部32bは、第1実施形態と同様に、翻訳履歴データ33bとして、第1テキストデータT1および第2テキストデータT2を記憶部33に記憶させる(ステップS57)。翻訳履歴データ33bには、画像データDiも含められてもよい。
【0109】
第2音声データS2および画像データDiを受信すると、出力端末20は、第2音声データS2に基づく音声を出力するとともに、画像データDiに基づく画像を表示部に表示する(ステップS58)。これにより、入力端末10に入力された発話内容が翻訳された音声が、出力端末20にて出力されるとともに、発話内容に関連する画像が出力端末20に表示される。
【0110】
なお、出力端末20への第2テキストデータT2の送信、および、入力端末10への第1テキストデータT1の送信は、第1実施形態と同様に行われることが好ましい。
図15(a)は、付属情報データ33cにおいて
図13に例示したテキストと画像との対応付けが為されている場合において、上述した処理の結果、入力端末10に表示される画面Pfの例を示し、
図15(b)は、同様に上述した処理の結果、出力端末20に表示される画面Pgの例を示す。入力端末10の画面Pfには、第1テキストデータT1に基づく文字列を示す領域Rdが含まれる。出力端末20の画面Pgには、第2テキストデータT2に基づく文字列を示す領域Reおよび画像データDiに基づく画像を示す領域Rfが含まれる。
図15に示す例では、入力端末10に入力された発話内容に「松之大廊下」という単語が含まれており、その結果、当該単語と付属情報データ33cにて対応付けられている画像が、出力端末20に表示されている。これにより、出力端末20の利用者は、翻訳結果に関連する画像を見ることができるため、翻訳結果への理解が深められる。
【0111】
なお、付属情報データ33cは、言語管理サーバ30に代えて音声翻訳システム40に記憶されていてもよい。この場合、音声翻訳システム40は、第1テキストデータT1を生成後、第1テキストデータT1が含むテキストに、付属情報データ33cにて対応付けられている画像を特定し、当該画像のデータである画像データDiを、第1テキストデータT1、第2テキストデータT2、および、第2音声データS2と共に処理結果に含めて言語管理サーバ30に送信する。そして、言語管理サーバ30の翻訳管理部32bは、出力端末20に、配信言語に応じた言語の第2音声データS2と共に画像データDiを送信する。
【0112】
音声翻訳システム40が付属情報データ33cを記憶している場合、付属情報データ33cは、第1テキストデータT1から第2テキストデータT2への翻訳のための単語帳データを構成していてもよい。すなわち、翻訳前の言語のテキストと、当該テキストに対応する翻訳後の言語のテキストと、これらのテキストに関連する画像とが対応付けられて単語帳データを構成し、単語帳データを利用した第1テキストデータT1から第2テキストデータT2への翻訳に際して、画像が特定されてもよい。こうした構成によれば、例えば観光ツアーにおいてガイドに使用する専門用語を上記単語帳データに登録しておくことで、専門用語の的確な翻訳が可能となる。
【0113】
要は、翻訳管理システム50に付属情報データ33cが記憶され、入力端末10に入力された発話内容に対応するテキストに付属情報データ33cにて関連付けられている画像が、発話内容の翻訳結果と共に出力端末20に配信されればよい。
【0114】
また、付属情報データ33cでは、単語等のテキストと、当該テキストに関連する画像と、当該テキストや画像についての各言語での説明文とが対応付けられていてもよい。そして、第1テキストデータT1が含むテキストに対応付けられている画像の特定時に、上記説明文も特定され、出力端末20には、第2音声データS2と画像データDiとに加えて、第2音声データS2に対応する言語での上記説明文のデータも送信されてもよい。出力端末20では、画像データDiに基づく画像と共に、上記説明文が表示される。こうした構成によれば、出力端末20の利用者は、翻訳結果に関連する画像に加えて、画像に関連した説明を確認することができるため、翻訳結果への理解がより深められる。
【0115】
なお、出力端末20への画像や説明文の表示の有無が、出力端末20の利用者によって選択可能であってもよい。例えば、出力端末20の画面に含まれる所定の領域を選択することで、画像の表示と非表示とが切り替え可能であってもよい。
【0116】
また、翻訳グループGpごとに、当該翻訳グループGpでの音声翻訳に用いられる付属情報データ33cが設定可能であってもよい。例えば、観光ツアーの内容に応じた付属情報データ33c、すなわち、観光ツアーでツアーガイドが説明する内容に含まれ得る単語と当該単語に関連する画像とが対応付けられた付属情報データ33cが、各観光ツアーについて生成されて言語管理サーバ30に記憶されている。そして、入力端末10からの要求に応じた新たな翻訳グループGpの生成時に、入力端末10にて観光ツアーの種類が選択されることに基づき、複数の付属情報データ33cの中から、選択された観光ツアーに対応する付属情報データ33cが選択されて、当該翻訳グループGpの付属情報データ33cとして設定される。こうした構成によれば、翻訳グループGpでの音声翻訳の利用の目的により適した画像が出力端末20に表示される。
【0117】
なお、付属情報データ33cにてテキストと対応付けられるコンテンツは、静止画に限らず、動画であってもよいし、3DCGであってもよい。また、付属情報データ33cにてテキストと対応付けられるコンテンツは、AR(拡張現実:Augmented Reality)コンテンツであってもよい。すなわち、出力端末20において、翻訳結果と共に配信された静止画、動画、3DCG等は、出力端末20の周囲の現実環境に重ねて表示部に表示されてもよい。
【0118】
特に、多言語翻訳システム100が観光ツアーに利用される場合、ツアーガイドの発話内容には、文化的要素や歴史的要素を含む事項や、専門性の高い事項が含まれることが多い。したがって、翻訳結果と共に、動画や3DCGやARコンテンツが出力端末20に表示されることで、翻訳結果の理解が助けられる。また、ツアーガイドの発話内容は、参加者がいる場所や周囲の展示物等に関連することが多いため、翻訳結果と共に、ARコンテンツが参加者の周囲の現実環境に重ねて表示されることにより、翻訳結果の理解を容易にすることや翻訳結果に対する参加者の関心を高めることが可能である。その結果、ツアーガイドと参加者とのコミュニケーションが円滑に進められる。また、複数の参加者が出力端末20を通じてこうしたコンテンツを共有することができるため、参加者間のコミュニケーションも促進される。
【0119】
以上説明したように、第3実施形態によれば、第1実施形態の(1)~(6)の効果に加えて、以下の効果を得ることができる。
(8)言語管理サーバ30は、第1音声データS1に対応するテキストに付属情報データ33cにて関連付けられている画像等のコンテンツを、翻訳結果と共に出力端末20に配信する。その結果、翻訳結果と共に、翻訳内容に関連するコンテンツが出力端末20に表示されるため、出力端末20の利用者の翻訳内容に対する理解が深められる。
【0120】
(変形例)
上記各実施形態は、以下のように変更して実施することが可能である。また、上記各実施形態および下記各変形例は、互いに組み合わせて実施してもよい。
【0121】
・翻訳グループGpは、複数の入力端末10を含んでいてもよい。また、1つの端末が入力端末10として機能するとともに、他の入力端末10に入力された発話内容の翻訳結果の配信を受ける出力端末20として機能してもよい。すなわち、1つの翻訳グループGpにおいて、各端末に入力された発話内容の翻訳結果が、その端末以外の端末に配信されてもよく、端末の利用者同士による双方向でのコミュニケーションが可能であってもよい。
【0122】
・入力端末10からの要求に応じて、翻訳グループGpを用いた処理の停止が可能であってもよい。翻訳グループGpの処理の停止は、例えば、以下の手順で行われる。すなわち、入力端末10に表示される画面には、翻訳グループGpの処理の停止を指示するための領域が含まれ、当該領域が選択されることによって、翻訳グループGpの処理の停止の要求が、入力端末10から言語管理サーバ30に送信される。この要求を受けると、言語管理サーバ30のグループ管理部32aは、入力端末10にて選択されている翻訳グループGpに対する出力端末20の追加、および、当該翻訳グループGpでの音声翻訳の処理を禁止する。こうした構成によれば、翻訳グループGpの有効期間内であっても、入力端末10の利用者の意志によって、翻訳グループGpを利用した音声翻訳を止めることができる。
【0123】
・出力端末20からの要求に応じて、翻訳グループGpからの出力端末20の削除が可能であってもよい。出力端末20の削除は、例えば、以下の手順で行われる。すなわち、出力端末20に表示される画面には、翻訳グループGpからの削除を指示するための領域が含まれ、当該領域が選択されることによって、翻訳グループGpからの削除の要求が、出力端末20から言語管理サーバ30に送信される。この要求を受けると、言語管理サーバ30のグループ管理部32aは、出力端末20にて選択されている翻訳グループGpから当該出力端末20を削除するよう、グループデータ33aを変更する。翻訳グループGpからの出力端末20の削除によって、翻訳グループGpに属する出力端末20の配信言語の種類に変化があった場合には、その変化に応じて、翻訳対象言語が変更される。
【0124】
・翻訳グループGpへの出力端末20への追加の条件に、パスワードや生体情報を用いた認証の成立が含まれてもよい。認証は、出力端末20に入力されたパスワードや生体情報等の認証情報が、予め言語管理サーバ30に登録されている情報と照合されることにより行われる。こうした構成によれば、翻訳グループGpへの出力端末20の追加についてのセキュリティがより高められる。
【0125】
・上記各実施形態では、音声翻訳システム40にて、音声認識と翻訳と音声合成との処理が連続して行われる形態を例示した。これに代えて、以下のように、音声認識と翻訳と音声合成との処理ごとに、処理結果が言語管理サーバ30に返されてもよい。すなわち、第1音声データS1が言語管理サーバ30から音声翻訳システム40に送信されると、その音声認識結果、すなわち、第1テキストデータT1が音声翻訳システム40から言語管理サーバ30に送信される。これを受けて、言語管理サーバ30は、第1テキストデータT1の各翻訳対象言語への翻訳を、音声翻訳システム40に要求する。音声翻訳システム40は、第1テキストデータT1を指定された言語に翻訳して第2テキストデータT2を生成し、第2テキストデータT2を言語管理サーバ30に送信する。続いて、言語管理サーバ30は、第2テキストデータT2に基づく音声合成を、音声翻訳システム40に要求する。音声翻訳システム40は、第2テキストデータT2に対して音声合成を行って、生成された第2音声データS2を言語管理サーバ30に送信する。これにより、言語管理サーバ30は、第1テキストデータT1、第2テキストデータT2、および、第2音声データS2の各々を取得し、これらのデータを端末10,20に送信する。
【0126】
・音声翻訳の方法は、音声認識と翻訳と音声合成とを順に行う方法に限られない。第1音声データS1から、翻訳された第2音声データS2が生成可能であればよい。
・入力端末10における翻訳内容の修正が可能であってもよい。
【0127】
例えば、音声翻訳の結果、第1テキストデータT1が入力端末10に表示される場合、入力端末10にて第1テキストデータT1の修正が可能とされてもよい。この場合、修正されたテキストデータが言語管理サーバ30に送信され、翻訳管理部32bは、修正後のテキストデータの各翻訳対象言語への翻訳を音声翻訳システム40に指示し、その翻訳結果を出力端末20に配信する。こうした構成によれば、入力端末10の利用者は、自身の発話内容が音声認識処理にて正しく認識されていない場合に、第1テキストデータT1の修正によってその認識結果を修正して、修正を翻訳結果に反映させることができる。したがって、適切な翻訳結果の配信が可能となる。なお、上述のように、音声翻訳システム40における音声認識と翻訳と音声合成との処理ごとに、処理結果が言語管理サーバ30に返される場合には、翻訳対象言語への翻訳処理の前に、第1テキストデータT1が入力端末10に送信されて第1テキストデータT1が修正され、修正後のテキストデータを用いて翻訳および音声合成の処理が進められてもよい。
【0128】
また例えば、音声翻訳の結果、各翻訳対象言語の第2テキストデータT2が入力端末10に表示される場合、入力端末10にて第2テキストデータT2の修正が可能とされてもよい。この場合、修正されたテキストデータが言語管理サーバ30に送信され、翻訳管理部32bは、修正後のテキストデータの音声合成を音声翻訳システム40に指示し、その処理結果を出力端末20に配信する。こうした構成によれば、入力端末10の利用者は、第2テキストデータT2の修正によって翻訳結果を直接に修正することができる。したがって、適切な翻訳結果の配信が可能となる。なお、上述のように、音声翻訳システム40における音声認識と翻訳と音声合成との処理ごとに、処理結果が言語管理サーバ30に返される場合には、音声合成処理の前に、第2テキストデータT2が入力端末10に送信されて第2テキストデータT2が修正され、修正後のテキストデータを用いて音声合成の処理が進められてもよい。
【0129】
・出力端末20に対する第2音声データS2や第2テキストデータT2の送信状況や、出力端末20での第2音声データS2や第2テキストデータT2の出力状況を、言語管理サーバ30が取得し、取得された情報が入力端末10に送信されて、入力端末10にて確認可能であってもよい。こうした構成によれば、入力端末10の利用者は、翻訳結果が出力端末20の利用者に伝わっているかを把握することができる。そして、例えば、出力端末20に対する各データの送信が不調である場合には、各データの再送の指示が入力端末10にて可能であってもよい。
【0130】
・入力端末10が受信した第1テキストデータT1や第2テキストデータT2は、入力端末10に記憶可能であってもよい。同様に、出力端末20が受信した第2テキストデータT2や画像データDiは、出力端末20に記憶可能であってもよい。こうした構成によれば、翻訳グループGpの有効期間の経過後であっても、各端末10,20にて上記各データの内容を確認することができる。例えば、観光ツアーの終了後に、出力端末20の利用者が、画像データDiが示す画像を確認することで、観光ツアーを振り返ることもできる。
【0131】
・翻訳グループGpに、入力端末10に入力された発話内容が翻訳されずに配信される対象の出力端末20が属していてもよい。この出力端末20は、配信言語として、入力端末10に入力される発話内容の言語、すなわち、翻訳前の言語と同一の言語が設定された端末である。この場合、言語管理サーバ30は、未翻訳での発話内容の配信対象の出力端末20に、発話内容の音声認識結果である第1テキストデータT1を送信し、当該出力端末20には、第1テキストデータT1に基づく文字列が表示される。これにより、出力端末20の利用者は、入力端末10の利用者の発話内容を文字で確認することができる。こうした構成によれば、例えば、観光ツアーに、ツアーガイドの使用言語と同一の言語を使用する参加者が参加している場合に、当該参加者が上記出力端末20を利用することでツアーガイドの発話内容を文字で確認できるため、発話内容の理解が補助される。また、ツアーガイドの研修生がガイドの内容を学ぶ際にも、上記出力端末20を利用することで、ガイドの内容を把握しやすくなる。
【0132】
・翻訳グループGpの有効期間は設定されなくてもよい。一方、有効期間として、入力端末10に入力された発話内容の翻訳結果を出力端末20に配信することが許容される期間が設定され、音声翻訳の実施に際して、有効期間の確認が行われてもよい。例えば、音声翻訳の開始に際して入力端末10へ音声入力のための画面Pc等のデータを送信する前、言語管理サーバ30による第1音声データS1の受信時、出力端末20への第2音声データS2の送信前等に、言語管理サーバ30の翻訳管理部32bは、その時点が翻訳グループGpの有効期間内であるか否かを確認する。翻訳管理部32bは、当該時点が有効期間内である場合に処理を進め、当該時点が有効期間外である場合には、処理を停止する。
【0133】
・翻訳履歴データ33bは言語管理サーバ30に記憶されなくてもよい。また、音声翻訳の結果、第1テキストデータT1は、入力端末10に送信されなくてもよいし、第2テキストデータT2は、出力端末20に送信されなくてもよい。すなわち、出力端末20に対しては、第2音声データS2のみが送信されてもよい。第1テキストデータT1および第2テキストデータT2の各々について、端末10,20への送信や言語管理サーバ30への記憶が行われない場合には、当該データは音声翻訳システム40から言語管理サーバ30に送信されなくてもよい。
【0134】
・翻訳管理システム50は、音声翻訳システム40を備えず、外部の汎用の翻訳エンジンが利用されてもよい。すなわち、言語管理サーバ30は、外部の翻訳エンジンに対して、第1音声データS1の各翻訳対象言語への翻訳を指示し、得られた翻訳結果を出力端末20に配信してもよい。
【0135】
・入力端末10における翻訳対象の情報の入力は、テキストによって行われてもよい。すなわち、翻訳対象である第1情報は、音声に限らずテキストであってもよい。この場合、第1情報に対する音声認識処理は不要である。また、出力端末20における翻訳結果の出力がテキストのみによって行われてもよい。すなわち、音声合成は行われず、第2テキストデータT2が翻訳結果として出力端末20に配信されてもよい。
【0136】
・入力端末10および出力端末20は、スマートフォンやタブレット端末に限られず、多言語翻訳システム100に利用される専用の端末であってもよい。例えば、出力端末20は、イヤホンと、イヤホンに有線または無線で接続されてデータの通信を行う本体部とから構成される装置であってもよい。
【0137】
また、入力端末10や出力端末20は、眼鏡型のウェアラブル端末のように、装着可能であってもよい。第3実施形態において、出力端末20が、ARコンテンツの表示に対応した眼鏡型の端末であれば、付属情報データ33cにてテキストとARコンテンツとが対応付けられる場合に、翻訳結果と共に出力端末20に配信されるARコンテンツが、眼鏡のレンズ部に表示される。したがって、出力端末20の利用者はARコンテンツを現実環境と重ねて見ることが可能であり、ARコンテンツを好適に楽しむことができる。
【0138】
・多言語翻訳システム100の用途は、特に限定されない。多言語翻訳システム100は、観光ツアーに限らず、観光とは異なる各種の案内や会合等に用いられてもよい。
【符号の説明】
【0139】
Gp…翻訳グループ、S1…第1音声データ、S2…第2音声データ、T1…第1テキストデータ、T2…第2テキストデータ、10…入力端末、20…出力端末、30…言語管理サーバ、31…通信部、32…制御部、32a…グループ管理部、32b…翻訳管理部、33…記憶部、33a…グループデータ、33b…翻訳履歴データ、33c…付属情報データ、40…音声翻訳システム、41…音声認識サーバ、42…翻訳サーバ、43…音声合成サーバ、50…翻訳管理システム、100…多言語翻訳システム。