(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-09-26
(45)【発行日】2023-10-04
(54)【発明の名称】翻訳結果表示制御システム、翻訳結果表示制御方法及びプログラム
(51)【国際特許分類】
G06F 40/58 20200101AFI20230927BHJP
G06V 30/14 20220101ALI20230927BHJP
G06V 30/413 20220101ALI20230927BHJP
【FI】
G06F40/58
G06V30/14 340K
G06V30/413
(21)【出願番号】P 2019218800
(22)【出願日】2019-12-03
【審査請求日】2022-11-30
(73)【特許権者】
【識別番号】522120576
【氏名又は名称】ポケトーク株式会社
(74)【代理人】
【識別番号】110000154
【氏名又は名称】弁理士法人はるか国際特許事務所
(72)【発明者】
【氏名】川竹 一
【審査官】長 由紀子
(56)【参考文献】
【文献】特開平05-002605(JP,A)
【文献】特開2015-106184(JP,A)
【文献】特表2019-537103(JP,A)
【文献】特開2014-59766(JP,A)
【文献】国際公開第2013/114988(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 40/00-58
G06V 30/14
G06V 30/413
(57)【特許請求の範囲】
【請求項1】
ターゲット画像から、複数行の文字列を抽出する文字列抽出手段と、
前記複数行の文字列を行ごとに翻訳した行別翻訳結果、又は、前記複数行の文字列を結合した文字列を翻訳した結合翻訳結果のいずれか一方が前記ターゲット画像に重畳された翻訳結果画像を生成する翻訳結果画像生成手段と、
前記翻訳結果画像を表示させる表示制御手段と、
前記翻訳結果画像が表示された後に受け付けるユーザの操作に応じて、表示されている前記翻訳結果画像に配置されている前記一方を他方に更新する更新手段と、
を含むことを特徴とする翻訳結果表示制御システム。
【請求項2】
前記ターゲット画像から、それぞれ複数行の文字列が示されている複数の領域を抽出するレイアウト解析手段、をさらに含み、
前記文字列抽出手段は、前記複数の領域のそれぞれについて、当該領域に配置されている複数行の文字列を抽出し、
前記翻訳結果画像生成手段は、前記領域に示されている文字列についての前記行別翻訳結果又は前記結合翻訳結果のいずれか一方が当該領域に重畳された前記翻訳結果画像を生成する、
ことを特徴とする請求項1に記載の翻訳結果表示制御システム。
【請求項3】
前記翻訳結果画像生成手段は、前記複数の領域のすべてについて前記一方が重畳された前記翻訳結果画像を生成し、
前記更新手段は、前記操作に応じて、表示されている前記翻訳結果画像内のすべての前記領域について、当該領域に配置されている前記一方を前記他方に更新する、
ことを特徴とする請求項2に記載の翻訳結果表示制御システム。
【請求項4】
前記更新手段は、表示されている前記翻訳結果画像内の前記複数の領域のうちからユーザに指定される前記領域に配置されている前記一方を前記他方に更新する、
ことを特徴とする請求項2に記載の翻訳結果表示制御システム。
【請求項5】
ターゲット画像から、複数行の文字列を抽出するステップと、
前記複数行の文字列を行ごとに翻訳した行別翻訳結果、又は、前記複数行の文字列を結合した文字列を翻訳した結合翻訳結果のいずれか一方が前記ターゲット画像に重畳された翻訳結果画像を生成するステップと、
前記翻訳結果画像を表示させるステップと、
前記翻訳結果画像が表示された後に受け付けるユーザの操作に応じて、表示されている前記翻訳結果画像に配置されている前記一方を他方に更新するステップと、
を含むことを特徴とする翻訳結果表示制御方法。
【請求項6】
ターゲット画像から、複数行の文字列を抽出する手順、
前記複数行の文字列を行ごとに翻訳した行別翻訳結果、又は、前記複数行の文字列を結合した文字列を翻訳した結合翻訳結果のいずれか一方が前記ターゲット画像に重畳された翻訳結果画像を生成する手順、
前記翻訳結果画像を表示させる手順、
前記翻訳結果画像が表示された後に受け付けるユーザの操作に応じて、表示されている前記翻訳結果画像に配置されている前記一方を他方に更新する手順、
をコンピュータに実行させることを特徴とするプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、翻訳結果表示制御システム、翻訳結果表示制御方法及びプログラムに関する。
【背景技術】
【0002】
特許文献1には、撮影された画像に含まれる文字列を翻訳する翻訳装置が記載されている。特許文献1に記載の翻訳装置は、連続する2つの行が結合条件を満たすと判定された場合、これら2つの行を結合して翻訳し、結合条件を満たさないと判定された場合、これら2つの行をそれぞれ翻訳する。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
例えばメニューや看板などのなかには、複数行のそれぞれに箇条書きで項目が記述されているものもあれば、複数行にわたって連続して説明が記述されているものもある。ここで、複数行のそれぞれに記述されている項目を結合して翻訳したり、複数行にわたって連続して記述されている説明を行ごとに翻訳したりすると、適切な翻訳とはならないことがある。
【0005】
しかし特許文献1に記載の翻訳装置では、複数行を結合して翻訳するかそれぞれ翻訳するかが、予め定められた結合条件によって一律に決定されてしまう。
【0006】
そのため、撮影された画像を見れば複数行の文字列を結合して翻訳することが望ましいとユーザが判断できるような場合でも、結合条件次第では、行ごとに翻訳されてしまうことがある。逆に、複数行の文字列を行ごとに翻訳することが望ましいとユーザが判断できるような場合に複数行が結合された文字列が翻訳されてしまうことがある。
【0007】
上記実情に鑑みて、本開示では、複数行の文字列をそれぞれ翻訳した翻訳結果と複数行の文字列を結合した文字列を翻訳した翻訳結果のうちユーザが所望するいずれかを表示させることができる翻訳結果表示制御システム、翻訳結果表示制御方法及びプログラムを提案する。
【課題を解決するための手段】
【0008】
上記課題を解決するために、本開示に係る翻訳結果表示制御装置は、ターゲット画像から、複数行の文字列を抽出する文字列抽出手段と、前記複数行の文字列を行ごとに翻訳した行別翻訳結果、又は、前記複数行の文字列を結合した文字列を翻訳した結合翻訳結果のいずれか一方が前記ターゲット画像に重畳された翻訳結果画像を生成する翻訳結果画像生成手段と、前記翻訳結果画像を表示させる表示制御手段と、前記翻訳結果画像が表示された後に受け付けるユーザの操作に応じて、表示されている前記翻訳結果画像に配置されている前記一方を他方に更新する更新手段と、を含む。
【0009】
本開示の一態様では、前記ターゲット画像から、それぞれ複数行の文字列が示されている複数の領域を抽出するレイアウト解析手段、をさらに含み、前記文字列抽出手段は、前記複数の領域のそれぞれについて、当該領域に配置されている複数行の文字列を抽出し、前記翻訳結果画像生成手段は、前記領域に示されている文字列についての前記行別翻訳結果又は前記結合翻訳結果のいずれか一方が当該領域に重畳された前記翻訳結果画像を生成する。
【0010】
この態様では、前記翻訳結果画像生成手段は、前記複数の領域のすべてについて前記一方が重畳された前記翻訳結果画像を生成し、前記更新手段は、前記操作に応じて、表示されている前記翻訳結果画像内のすべての前記領域について、当該領域に配置されている前記一方を前記他方に更新してもよい。
【0011】
あるいは、前記更新手段は、表示されている前記翻訳結果画像内の前記複数の領域のうちからユーザに指定される前記領域に配置されている前記一方を前記他方に更新してもよい。
【0012】
また、本開示に係る翻訳結果表示制御方法は、ターゲット画像から、複数行の文字列を抽出するステップと、前記複数行の文字列を行ごとに翻訳した行別翻訳結果、又は、前記複数行の文字列を結合した文字列を翻訳した結合翻訳結果のいずれか一方が前記ターゲット画像に重畳された翻訳結果画像を生成するステップと、前記翻訳結果画像を表示させるステップと、前記翻訳結果画像が表示された後に受け付けるユーザの操作に応じて、表示されている前記翻訳結果画像に配置されている前記一方を他方に更新するステップと、を含む。
【0013】
また、本開示に係るプログラムは、ターゲット画像から、複数行の文字列を抽出する手順、前記複数行の文字列を行ごとに翻訳した行別翻訳結果、又は、前記複数行の文字列を結合した文字列を翻訳した結合翻訳結果のいずれか一方が前記ターゲット画像に重畳された翻訳結果画像を生成する手順、前記翻訳結果画像を表示させる手順、前記翻訳結果画像が表示された後に受け付けるユーザの操作に応じて、表示されている前記翻訳結果画像に配置されている前記一方を他方に更新する手順、をコンピュータに実行させる。
【図面の簡単な説明】
【0014】
【
図1】本開示の一実施形態に係る翻訳システムの全体構成の一例を示す図である。
【
図2】本開示の一実施形態に係る翻訳端末の背面の一例を示す図である。
【
図3】本開示の一実施形態に係る翻訳端末の構成の一例を示す図である。
【
図7】本開示の一実施形態に係る翻訳端末で実装される機能の一例を示す機能ブロック図である。
【
図8】本開示の一実施形態に係る翻訳端末において行われる処理の流れの一例を示すフロー図である。
【
図9】本開示の一実施形態に係る翻訳端末において行われる処理の流れの一例を示すフロー図である。
【発明を実施するための形態】
【0015】
以下、本発明の一実施形態について、図面を参照しながら説明する。
【0016】
図1は、本開示で提案する翻訳システム1の全体構成の一例を示す図である。
図2は、本開示で提案する翻訳端末10の背面の一例を示す図である。
図3は、本開示で提案する翻訳端末10の構成の一例を示す図である。
【0017】
図1に示すように、本開示で提案する翻訳システム1には、翻訳端末10、及び、サーバ12が含まれている。翻訳端末10及びサーバ12は、インターネット等のコンピュータネットワーク14に接続されている。そのため翻訳端末10とサーバ12との間はインターネット等のコンピュータネットワーク14を介して通信可能となっている。
【0018】
本実施形態に係るサーバ12は、翻訳機能を備えたサーバコンピュータ等のコンピュータシステムである。サーバ12は、クラウドサーバであっても構わない。サーバ12は、例えば、翻訳対象である文字列を翻訳端末10から受信する。当該文字列には、当該文字列の言語を示す翻訳前言語データ、及び、当該文字列の翻訳結果の言語を示す翻訳後言語データが関連付けられている。そして、サーバ12は、翻訳端末10から受信する文字列を、当該文字列に関連付けられている翻訳後言語データが示す言語に翻訳する。そして、サーバ12は、翻訳結果の文字列を翻訳端末10に返信する。また、本実施形態に係るサーバ12は、翻訳端末10から受け付ける音声を翻訳した翻訳結果の音声を翻訳端末10に返信することもできる。
【0019】
図3に示すように、本実施形態に係る翻訳端末10には、例えば、プロセッサ10a、記憶部10b、通信部10c、操作部10d、撮影部10e、タッチパネル10f、マイク10g、スピーカ10hが含まれる。
【0020】
プロセッサ10aは、例えば翻訳端末10にインストールされるプログラムに従って動作するマイクロプロセッサ等のプログラム制御デバイスである。記憶部10bは、例えばROMやRAM等の記憶素子などである。記憶部10bには、プロセッサ10aによって実行されるプログラムなどが記憶される。
【0021】
通信部10cは、例えばコンピュータネットワーク14を介してサーバ12との間でデータを授受するための通信インタフェースである。ここで通信部10cに、基地局を含む携帯電話回線を経由してインターネット等のコンピュータネットワーク14と通信を行う無線通信モジュールが含まれていてもよい。また通信部10cに、Wi-Fi(登録商標)ルータ等を経由してインターネット等のコンピュータネットワーク14と通信を行う無線LANモジュールが含まれていてもよい。
【0022】
操作部10dは、例えばユーザが行った操作の内容をプロセッサ10aに出力するボタンやタッチセンサ等の操作部材である。
【0023】
撮影部10eは、例えばデジタルカメラなどの撮影デバイスである。
図2に示すように、撮影部10eは、本実施形態に係る翻訳端末10の背面に設けられている。
【0024】
タッチパネル10fは、例えばタッチセンサと液晶ディスプレイや有機ELディスプレイ等のディスプレイとが一体となったデバイスである。タッチパネル10fは、翻訳端末10の前面に設けられており、プロセッサ10aが生成する画面などを表示させる。
【0025】
マイク10gは、例えば受け付ける音声を電気信号に変換する音声入力デバイスである。ここでマイク10gが、翻訳端末10に内蔵されている、人混みでも人の声が認識しやすいノイズキャンセリング機能を備えたデュアルマイクであってもよい。
【0026】
スピーカ10hは、例えば音声を出力する音声出力デバイスである。ここでスピーカ10hが、翻訳端末10に内蔵されている、騒がしい場所でも使えるダイナミックスピーカーであってもよい。
【0027】
本実施形態に係る翻訳システム1では、第1の話者と第2の話者との間の双方向の会話において、第1の話者が話す音声の翻訳と第2の話者が話す音声の翻訳とを交互に行うことができる。
【0028】
また、本実施形態に係る翻訳システム1では、翻訳端末10の撮影部10eによって撮影される画像から抽出される文字列の翻訳を行うことができる。
【0029】
図4は、本実施形態に係る撮影部10eによって撮影される画像であるターゲット画像20の一例を示す図である。そして本実施形態では、公知のレイアウト解析技術によって、ターゲット画像20から翻訳対象領域22が抽出される。ここで
図4に示すように、複数の翻訳対象領域22(
図4の例では、翻訳対象領域22a、及び、翻訳対象領域22b)が抽出されてもよい。また、1つの翻訳対象領域22には、複数行の文字列が示されていてもよい。
【0030】
そして、複数の翻訳対象領域22のそれぞれについて、当該翻訳対象領域22に配置されている複数行の文字列の抽出、及び、当該文字列の言語の特定が実行される。
図4の例では、翻訳対象領域22aから日本語の2行の文字列が抽出され、翻訳対象領域22bから日本語の4行の文字列が抽出される。
【0031】
そして、本実施形態では、抽出される文字列が、所定の言語設定操作によって予め設定された言語に翻訳される。ここでは例えば、抽出される文字列が英語に翻訳されることとする。なお、本実施形態に係る翻訳システム1では、デフォルトでは、抽出された複数行の文字列が行ごとに翻訳される。
【0032】
そして、
図5に示すように、翻訳対象領域22から抽出される複数行の文字列の行ごとの翻訳結果を示す行別翻訳結果画像24が当該翻訳対象領域22に重畳された翻訳結果画像26aがタッチパネル10fに表示される。ここで、半透明の行別翻訳結果画像24が翻訳対象領域22に重畳された翻訳結果画像26aがタッチパネル10fに表示されてもよい。
【0033】
図5に示す翻訳結果画像26aでは、翻訳対象領域22aから抽出される複数行の文字列の行ごとの翻訳結果を示す行別翻訳結果画像24aが翻訳対象領域22aに配置されている。また、翻訳対象領域22bから抽出される複数行の文字列の行ごとの翻訳結果を示す行別翻訳結果画像24bが翻訳対象領域22bに配置されている。
【0034】
また、翻訳結果画像26aには、操作画像28aが配置される。ここでユーザが操作画像28aに対するタップ操作等の所定の表示モード変更操作を行うと、
図5に示す翻訳結果画像26aは、複数行の文字列を結合した文字列の翻訳結果を示す結合翻訳結果画像30が配置された、
図6に示す翻訳結果画像26bに更新される。ここで、半透明の結合翻訳結果画像30が翻訳対象領域22に重畳された翻訳結果画像26bがタッチパネル10fに表示されてもよい。
【0035】
翻訳結果画像26bでは、行別翻訳結果画像24aが、翻訳対象領域22aから抽出される複数行の文字列を結合した文字列の翻訳結果を示す結合翻訳結果画像30aに更新されている。また、翻訳結果画像26bでは、行別翻訳結果画像24bが、翻訳対象領域22bから抽出される複数行の文字列を結合した文字列の翻訳結果を示す結合翻訳結果画像30bに更新されている。
【0036】
図6に示す翻訳結果画像26bには、操作画像28bが配置されている。ここでユーザが操作画像28bに対するタップ操作等の所定の表示モード変更操作を行うと、
図6に示す翻訳結果画像26bは、
図5に示す翻訳結果画像26aに更新される。
【0037】
例えばメニューや看板などのなかには、複数行のそれぞれに箇条書きで項目が記述されているものもあれば、複数行にわたって連続して説明が記述されているものもある。ここで、複数行のそれぞれに箇条書きで記述されている項目を結合して翻訳したり、複数行にわたって連続して記述されている説明を行ごとに翻訳したりすると、適切な翻訳とはならないことがある。
【0038】
本実施形態では以上で説明したようにして、ユーザは、複数行の文字列をそれぞれ翻訳した翻訳結果が表示される状態と複数行の文字列を結合した文字列を翻訳した翻訳結果が表示される状態とを切り替えることができる。このようにして本実施形態によれば、複数行の文字列をそれぞれ翻訳した翻訳結果と複数行の文字列を結合した文字列を翻訳した翻訳結果のうちユーザが所望するいずれかを表示させることができることとなる。そのため、ユーザは、適切な翻訳結果を目視できることとなる。
【0039】
例えば、ターゲット画像20や翻訳結果を見ることで、ユーザが適切な翻訳結果が表示されていないと判断できることがある。例えば、ユーザは、
図5の行別翻訳結果画像24bを見ると、行別翻訳結果画像24bに適切な翻訳結果が示されていないと判断できる。また例えば、ユーザは、
図6の結合翻訳結果画像30aを見ると、結合翻訳結果画像30aに適切な翻訳結果が示されていないと判断できる。このような場合にユーザが上述の表示モード変更操作を行うことで、適切な翻訳結果が表示されるよう表示される翻訳結果画像26を切り替えることができる。
【0040】
以下、本実施形態に係る翻訳端末10の機能及び翻訳端末10で実行される処理についてさらに説明する。
【0041】
図7は、本実施形態に係る翻訳端末10で実装される機能の一例を示す機能ブロック図である。なお、本実施形態に係る翻訳端末10で、
図7に示す機能のすべてが実装される必要はなく、また、
図7に示す機能以外の機能が実装されていても構わない。
【0042】
図7に示すように、本実施形態に係る翻訳端末10には、機能的には例えば、表示モードデータ記憶部40、ターゲット画像取得部42、レイアウト解析部44、文字列抽出部46、文字列送信部48、翻訳結果受信部50、翻訳結果画像生成部52、表示制御部54、操作受付部56、翻訳結果画像更新部58、が含まれる。
【0043】
表示モードデータ記憶部40は、記憶部10bを主として実装される。ターゲット画像取得部42は、プロセッサ10a及び撮影部10eを主として実装される。レイアウト解析部44、文字列抽出部46、翻訳結果画像生成部52は、プロセッサ10aを主として実装される。文字列送信部48、翻訳結果受信部50は、通信部10cを主として実装される。表示制御部54、翻訳結果画像更新部58は、プロセッサ10a及びタッチパネル10fを主として実装される。操作受付部56は、プロセッサ10a及び操作部10dを主として実装される。
【0044】
以上の機能は、コンピュータである翻訳端末10にインストールされた、以上の機能に対応する指令を含むプログラムをプロセッサ10aで実行することにより実装される。このプログラムは、例えば、光ディスク、磁気ディスク、磁気テープ、光磁気ディスク、フラッシュメモリ等のコンピュータ読み取り可能な情報記憶媒体を介して、あるいは、インターネットなどを介して翻訳端末10に供給される。
【0045】
表示モードデータ記憶部40は、本実施形態では例えば、翻訳システム1における翻訳結果の表示モードを示す表示モードデータを記憶する。本実施形態では例えば、複数行の文字列をそれぞれ翻訳した翻訳結果が表示される行別表示モード、又は、複数行の文字列を結合した文字列を翻訳した翻訳結果が表示される結合表示モードのいずれかの表示モードが設定可能である。ここでは例えば、行別表示モードが設定されている際には、表示モードデータの値は0であり、結合表示モードが設定されている際には、表示モードデータの値は1であることとする。また、初期状態では、表示モードデータ記憶部40には、値が0である表示モードデータが記憶されていることとする。
【0046】
ターゲット画像取得部42は、本実施形態では例えば、撮影部10eによって撮影されるターゲット画像20を取得する。
【0047】
レイアウト解析部44は、本実施形態では例えば、公知のレイアウト解析技術を用いることで、ターゲット画像20から、それぞれ複数行の文字列が示されている複数の翻訳対象領域22を抽出する。
【0048】
文字列抽出部46は、本実施形態では例えば、OCR(Optical character recognition)技術などを用いることで、複数の翻訳対象領域22のそれぞれについて、当該翻訳対象領域22に配置されている複数行の文字列を抽出する。また、文字列抽出部46は、抽出される文字列の言語を特定する。
【0049】
ここで文字列抽出部46は、表示モードデータ記憶部40に記憶されている表示モードデータの値に応じた文字列の抽出を実行する。
【0050】
例えば、表示モードが行別表示モードである際には、文字列抽出部46は、翻訳対象領域22に配置されている複数行の文字列を行ごとに抽出する。そして、表示モードが結合表示モードである際には、文字列抽出部46は、翻訳対象領域22に配置されている複数行の文字列を結合した文字列を抽出する。
【0051】
文字列送信部48は、本実施形態では例えば、抽出される文字列をサーバ12に送信する。
【0052】
翻訳結果受信部50は、本実施形態では例えば、サーバ12から送信される翻訳結果の文字列を受信する。
【0053】
本実施形態では例えば、翻訳端末10からサーバ12に送信される文字列には、当該文字列の言語を示す翻訳前言語データ、及び、当該文字列の翻訳結果の言語を示す翻訳後言語データが関連付けられている。ここでは例えば、翻訳端末10からサーバ12に送信される文字列に、日本語を示す翻訳前言語データ、及び英語を示す翻訳後言語データが関連付けられている。そして、サーバ12は、当該文字列の受信に応じて、受信した文字列を、当該文字列に関連付けられている翻訳後言語データに示されている言語に翻訳する。そして、サーバ12は、翻訳端末10から受信した文字列の翻訳結果の文字列を翻訳端末10に送信する。
【0054】
ここで、表示モードが行別表示モードである際には、例えば、文字列の送信、及び、翻訳結果の受信は、抽出された行単位で実行される。表示モードが結合表示モードである際には、例えば、文字列の送信、及び、翻訳結果の受信は、翻訳対象領域22に配置されている複数行の文字列を結合した文字列単位で実行される。
【0055】
翻訳結果画像生成部52は、本実施形態では例えば、複数行の文字列を行ごとに翻訳した翻訳結果、又は、当該複数行の文字列を結合した文字列を翻訳した翻訳結果のいずれか一方がターゲット画像20に重畳された翻訳結果画像26を生成する。翻訳結果画像生成部52は、例えば、翻訳結果受信部50が受信する翻訳結果の文字列に基づいて、翻訳結果画像26を生成する。以下、複数行の文字列を行ごとに翻訳した翻訳結果を行別翻訳結果と呼び、複数行の文字列を結合した文字列を翻訳した翻訳結果を結合翻訳結果と呼ぶこととする。翻訳結果画像生成部52は、翻訳対象領域22に示されている文字列についての行別翻訳結果又は結合翻訳結果のいずれか一方が当該翻訳対象領域22に重畳された翻訳結果画像26を生成してもよい。また、翻訳結果画像生成部52は、半透明の行別翻訳結果又は半透明の結合翻訳結果のいずれか一方がターゲット画像20に重畳された翻訳結果画像26を生成してもよい。
【0056】
表示制御部54は、本実施形態では例えば、翻訳結果画像生成部52が生成する翻訳結果画像26をタッチパネル10fに表示させる。
【0057】
操作受付部56は、本実施形態では例えば、ユーザによる表示モード変更操作を受け付ける。上述のように、例えば、
図5に示す操作画像28aや
図6に示す操作画像28bに対するタップ操作等の所定の操作が、表示モード変更操作に相当する。
【0058】
翻訳結果画像更新部58は、本実施形態では例えば、翻訳結果画像26が表示された後に受け付けるユーザの操作に応じて、表示されている翻訳結果画像26を更新する。例えば、表示されている翻訳結果画像26に行別翻訳結果が配置されている場合は、翻訳結果画像更新部58は、表示モード変更操作の受付に応じて、当該行別翻訳結果を結合翻訳結果に更新する。また、表示されている翻訳結果画像26に結合翻訳結果が配置されている場合は、翻訳結果画像更新部58は、表示モード変更操作の受付に応じて、当該結合翻訳結果を行別翻訳結果に更新する。
【0059】
ここで、本実施形態に係る翻訳端末10においてターゲット画像20が撮影された際に行われる処理の流れの一例を、
図8に示すフロー図を参照しながら説明する。本処理例では、表示モードデータ記憶部40に、値が0である表示モードデータが記憶されていることとする。
【0060】
まず、ターゲット画像取得部42が、撮影部10eによって撮影されたターゲット画像20を取得する(S101)。
【0061】
そして、レイアウト解析部44が、S101に示す処理で取得されたターゲット画像20から、複数の翻訳対象領域22を抽出する(S102)。
図4に示すターゲット画像20の例では、翻訳対象領域22a、及び、翻訳対象領域22bが抽出される。
【0062】
そして、文字列抽出部46が、複数の翻訳対象領域22のそれぞれについて、当該翻訳対象領域22に配置されている複数行の文字列を抽出し、抽出される文字列の言語を特定する(S103)。以下、S103に示す処理で抽出される文字列をターゲット文字列と呼ぶこととする。
【0063】
上述のように表示モードデータ記憶部40に値が0である表示モードデータが記憶されている場合は、文字列抽出部46は、翻訳対象領域22に配置されている各行の文字列にそれぞれ対応する複数のターゲット文字列を抽出する。
図4の例では、翻訳対象領域22aから2つのターゲット文字列が抽出され、翻訳対象領域22bから4つのターゲット文字列が抽出される。
【0064】
そして、文字列送信部48は、S103に示す処理で抽出された複数のターゲット文字列のうちから、S105及びS106に示す処理が実行されていないものを1つ選択する(S104)。
【0065】
そして、文字列送信部48は、S104に示す処理で選択されたターゲット文字列をサーバ12に送信する(S105)。当該ターゲット文字列には翻訳前言語データ及び翻訳後言語データが関連付けられている。
【0066】
そして、翻訳結果受信部50は、S105に示す処理で送信されたターゲット文字列の受信に応じてサーバ12から送信される、当該ターゲット文字列の翻訳結果の文字列を受信する(S106)。
【0067】
そして、文字列送信部48は、S103に示す処理で抽出されたすべてのターゲット文字列についてS105及びS106に示す処理が実行されたか否かを確認する(S107)。
【0068】
すべてのターゲット文字列についてS105及びS106に示す処理が実行されていない場合は(S107:N)、S104に示す処理に戻る。
【0069】
すべてのターゲット文字列についてS105及びS106に示す処理が実行された場合は(S107:Y)、翻訳結果画像生成部52が、S106に示す処理で受信した翻訳結果の文字列に基づいて、翻訳結果画像26を生成する(S108)。
【0070】
ここでは例えば、複数のターゲット文字列のそれぞれについて、ターゲット画像20において当該ターゲット文字列が配置されている位置に、当該ターゲット文字列の翻訳結果の文字列が重畳された、
図5に示す翻訳結果画像26aが生成される。
【0071】
図5に示す翻訳結果画像26aでは、翻訳対象領域22aから抽出された1行目の文字列の翻訳結果が1行目に配置され、2行目の文字列の翻訳結果が2行目に配置された行別翻訳結果画像24aが翻訳対象領域22aに配置されている。また、翻訳対象領域22bから抽出された1行目から4行目の文字列の翻訳結果がそれぞれ1行目から4行目に配置された行別翻訳結果画像24bが翻訳対象領域22bに配置されている。また、翻訳結果画像26aには、操作画像28aが配置されている。
【0072】
そして、表示制御部54が、S108に示す処理で生成された翻訳結果画像26をタッチパネル10fに表示させて(S109)、本処理例に示す処理は終了される。
【0073】
次に、
図5に示す翻訳結果画像26aがタッチパネル10fに表示される際に行われる処理の流れの一例を、
図9に示すフロー図を参照しながら説明する。
【0074】
まず、操作受付部56が、ユーザによる表示モード変更操作が行われることを監視する(S201)。
【0075】
そして、ユーザによる表示モード変更操作が行われたことが検出されると、操作受付部56は、表示モードデータ記憶部40に記憶されている値が0である表示モードデータを値が1であるものに更新する(S202)。
【0076】
そして、文字列抽出部46が、複数の翻訳対象領域22のそれぞれについて、当該翻訳対象領域22に配置されている複数行の文字列を再抽出する(S203)。
【0077】
上述のようにS202に示す処理で、表示モードデータ記憶部40には値が1である表示モードデータが記憶されることとなる。この場合は、文字列抽出部46は、翻訳対象領域22に配置されている複数行の文字列を結合したターゲット文字列を抽出する。
図4の例では、翻訳対象領域22aから1つのターゲット文字列が抽出され、翻訳対象領域22bからも1つのターゲット文字列が抽出される。
【0078】
図9におけるS204~S207に示す処理では、
図8のS104~S107に示す処理と同様の処理が実行される。そのためS204~S207に示す処理については説明を省略する。なお、S204に示す処理では、翻訳対象領域22aから抽出された1つのターゲット文字列と、翻訳対象領域22bから抽出された1つのターゲット文字列のうちから、S205及びS206に示す処理が実行されていないものが選択される。
【0079】
すべてのターゲット文字列についてS205及びS206に示す処理が実行された場合は(S207:Y)、翻訳結果画像更新部58が、S206に示す処理で受信した翻訳結果の文字列に基づいて、新たな翻訳結果画像26を生成する(S208)。
【0080】
ここでは例えば、複数のターゲット文字列のそれぞれについて、ターゲット画像20において当該ターゲット文字列が配置されている位置に、当該ターゲット文字列の翻訳結果の文字列が重畳された、
図6に示す翻訳結果画像26bが生成される。
【0081】
図6に示す翻訳結果画像26bでは、翻訳対象領域22aに配置されている2行の文字列を結合した文字列の翻訳結果を示す結合翻訳結果画像30aが翻訳対象領域22aに配置されている。また、翻訳対象領域22bに配置されている4行の文字列を結合した文字列の翻訳結果を示す結合翻訳結果画像30bが翻訳対象領域22bに配置されている。また、翻訳結果画像26bには、操作画像28bが配置されている。
【0082】
そして、表示制御部54が、S208に示す処理で生成された翻訳結果画像26をタッチパネル10fに表示させて(S209)、本処理例に示す処理は終了される。このようにして、表示されている翻訳結果画像26に配置されている行別翻訳結果又は結合翻訳結果の一方が他方に更新される。
【0083】
図6に示す翻訳結果画像26bがタッチパネル10fに表示される際に表示モード変更操作を受け付けた際には、S201~S209に示す処理と同様の処理が実行される。この場合は、S202に示す処理で、表示モードデータ記憶部40に記憶されている値が1である表示モードデータを値が0であるものに更新される。また、S203に示す処理で、翻訳対象領域22に配置されている複数行の文字列の各行にそれぞれ対応する複数のターゲット文字列が抽出される。そして、最終的には、
図5に示す翻訳結果画像26aがタッチパネル10fに表示される。
【0084】
以上の例では、翻訳結果画像生成部52は、複数の翻訳対象領域22のすべてについて行別翻訳結果又は結合翻訳結果の一方が重畳された翻訳結果画像26を生成する。そして、翻訳結果画像更新部58は、表示モード変更操作の受付に応じて、表示されている翻訳結果画像26内のすべての翻訳対象領域22について、当該翻訳対象領域22に配置されている行別翻訳結果又は結合翻訳結果の一方を他方に更新する。
【0085】
ここで本実施形態において、翻訳対象領域22ごとに、行別翻訳結果が表示される状態と結合翻訳結果が表示される状態を切り替えることができても構わない。例えば、ユーザが翻訳対象領域22に対するタップ操作等の翻訳対象領域22を指定する操作を行えてもよい。そして、翻訳結果画像更新部58は、当該操作の受付に応じて、表示されている翻訳結果画像26内の複数の翻訳対象領域22のうちからユーザに指定される翻訳対象領域22に配置されている行別翻訳結果又は結合翻訳結果の一方を他方に更新してもよい。
図10には、翻訳対象領域22aに行別翻訳結果画像24aが配置され、翻訳対象領域22bに結合翻訳結果画像30bが配置された翻訳結果画像26cの一例が示されている。
【0086】
なお、この場合、例えば、レイアウト解析部44が、抽出される複数の翻訳対象領域22のそれぞれに対応付けられた表示モードデータを生成してもよい。そしてレイアウト解析部44は、生成された表示モードデータを表示モードデータ記憶部40に記憶させてもよい。そして、翻訳対象領域22を指定する表示モード変更操作を受け付けた際には、操作受付部56が、指定された翻訳対象領域22に対応付けられた表示モードデータを更新してもよい。そして、指定された翻訳対象領域22について、S203~S207に示す処理が実行されてもよい。そして、翻訳結果画像更新部58が、指定された翻訳対象領域22について翻訳結果が更新された新たな翻訳結果画像26を生成してもよい。そして、翻訳結果画像更新部58が、生成された新たな翻訳結果画像26をタッチパネル10fに表示させてもよい。
【0087】
以上のようにすれば、ユーザは、翻訳対象領域22ごとに、当該翻訳対象領域22に行別翻訳結果が表示される状態と当該翻訳対象領域22に結合翻訳結果が表示される状態とを切り替えることができる。そのため、それぞれの翻訳対象領域22について、複数行の文字列をそれぞれ翻訳した翻訳結果と複数行の文字列を結合した文字列を翻訳した翻訳結果のうちユーザが所望するいずれかを表示させることが可能となる。
【0088】
また、以上の説明では、初期状態の表示モードが行別表示モードであった。そのため、翻訳結果画像生成部52は、S108に示す処理で、行別翻訳結果がターゲット画像20に重畳された翻訳結果画像26を生成する。ここで初期状態の表示モードが結合表示モードであっても構わない。この場合は、翻訳結果画像生成部52は、S108に示す処理で、結合翻訳結果がターゲット画像20に重畳された翻訳結果画像26を生成することとなる。
【0089】
なお、本発明は上述の実施形態に限定されるものではない。
【0090】
また、上記の具体的な文字列や数値及び図面中の具体的な文字列や数値は例示であり、これらの文字列や数値には限定されない。
【符号の説明】
【0091】
1 翻訳システム、10 翻訳端末、10a プロセッサ、10b 記憶部、10c 通信部、10d 操作部、10e 撮影部、10f タッチパネル、10g マイク、10h スピーカ、12 サーバ、14 コンピュータネットワーク、20 ターゲット画像、22,22a,22b 翻訳対象領域、24,24a,24b 行別翻訳結果画像、26,26a,26b,26c 翻訳結果画像、28a,28b 操作画像、30,30a,30b 結合翻訳結果画像、40 表示モードデータ記憶部、42 ターゲット画像取得部、44 レイアウト解析部、46 文字列抽出部、48 文字列送信部、50 翻訳結果受信部、52 翻訳結果画像生成部、54 表示制御部、56 操作受付部、58 翻訳結果画像更新部。