(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024080387
(43)【公開日】2024-06-13
(54)【発明の名称】情報処理装置、情報処理方法及びプログラム
(51)【国際特許分類】
G06F 40/58 20200101AFI20240606BHJP
G06T 11/60 20060101ALI20240606BHJP
【FI】
G06F40/58
G06T11/60 100B
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2022193534
(22)【出願日】2022-12-02
(71)【出願人】
【識別番号】517169746
【氏名又は名称】CTW株式会社
(74)【代理人】
【識別番号】100081455
【弁理士】
【氏名又は名称】橘 哲男
(74)【代理人】
【識別番号】100170966
【弁理士】
【氏名又は名称】藤本 正紀
(72)【発明者】
【氏名】廖 威
(72)【発明者】
【氏名】董 浩華
【テーマコード(参考)】
5B050
5B091
【Fターム(参考)】
5B050BA06
5B050BA20
5B050DA10
5B050EA06
5B050EA12
5B050EA19
5B091CD15
(57)【要約】
【課題】ある言語のテキストを含む画像データを容易に他の言語のテキストを含む画像データに翻訳する。
【解決手段】一実施形態に係る情報処理装置は、階層構造を有する第1画像データにおけるテキストレイヤに第1言語で記述された第1テキストのテキストデータを解析することで前記第1テキストの第1属性情報を特定し、前記第1テキストを前記第1言語とは異なる第2言語の第2テキストに翻訳し、前記第1属性情報に基づいて前記第2テキストの第2属性情報を生成しと、前記テキストレイヤにおける前記第1テキストを前記第2属性情報が付与された前記第2テキストで更新し、前記テキストレイヤ中の前記第1テキストの位置及びサイズに基づいて前記第2テキストの前記第2属性情報を調整し、調整後の前記第2属性情報が付与された前記第2テキストを含む前記テキストレイヤを用いて第2画像データを再構成する。
【選択図】
図19
【特許請求の範囲】
【請求項1】
階層構造を有する第1画像データにおけるテキストレイヤに第1言語で記述された第1テキストのテキストデータを解析することで前記第1テキストの第1属性情報を特定する解析部と、
前記第1テキストを前記第1言語とは異なる第2言語の第2テキストに翻訳する翻訳部と、
前記第1属性情報に基づいて前記第2テキストの第2属性情報を生成する生成部と、
前記テキストレイヤにおける前記第1テキストを前記第2属性情報が付与された前記第2テキストで更新する更新部と、
前記テキストレイヤ中の前記第1テキストの位置及びサイズに基づいて前記第2テキストの前記第2属性情報を調整する調整部と、
調整後の前記第2属性情報が付与された前記第2テキストを含む前記テキストレイヤを用いて第2画像データを再構成する再構成部と、
を備える情報処理装置。
【請求項2】
前記第1画像データは、psdファイル形式であり、
前記解析部は、オープンソースソフトウエアを用いて前記第1画像データから前記テキストデータを抽出する
請求項1に記載の情報処理装置。
【請求項3】
前記翻訳部は、ルールベース型、統計ベース型、ニューラルネットワーク型又はハイブリッド型の翻訳マシンである
請求項1に記載の情報処理装置。
【請求項4】
前記第1画像データ中のピクセル画が描画された領域であるイメージ領域を特定する特定部をさらに備え、
前記調整部は、前記第1画像データにおける前記第1テキストと前記イメージ領域との位置関係に基づいて前記第2属性情報を調整する
請求項1に記載の情報処理装置。
【請求項5】
前記調整部は、前記第2属性情報に基づいて前記テキストレイヤ中の前記第2テキストの位置及びサイズを算出し、前記テキストレイヤ中の前記第1テキストの位置及びサイズと前記第2テキストの位置及びサイズとを比較することで、前記第2属性情報を調整する
請求項1に記載の情報処理装置。
【請求項6】
前記調整部は、前記第1テキストのサイズと前記第2テキストのサイズとに差がある場合、前記第2属性情報における少なくとも文字サイズを調整する
請求項5に記載の情報処理装置。
【請求項7】
前記特定部は、前記第1画像データ中に描画された1以上のオブジェクトを認識し、認識された前記オブジェクトごとに優先順位を設定し、
前記調整部は、前記オブジェクトごとに設定された前記優先順位に基づいて前記第2属性情報を調整する
請求項4に記載の情報処理装置。
【請求項8】
前記第1画像データは、ピクセル画が描画された通常レイヤと、前記テキストレイヤとを含み、
前記再構成部は、前記調整後の第2属性情報が付与された前記第2テキストを含む前記テキストレイヤと、前記通常レイヤとを用いて前記第2画像データを再構成する
請求項1に記載の情報処理装置。
【請求項9】
階層構造を有する第1画像データにおけるテキストレイヤに第1言語で記述された第1テキストのテキストデータを解析することで前記第1テキストの第1属性情報を特定し、
前記第1テキストを前記第1言語とは異なる第2言語の第2テキストに翻訳し、
前記第1属性情報に基づいて前記第2テキストの第2属性情報を生成し、
前記テキストレイヤにおける前記第1テキストを前記第2属性情報が付与された前記第2テキストで更新し、
前記テキストレイヤ中の前記第1テキストの位置及びサイズに基づいて前記第2テキストの前記第2属性情報を調整し、
調整後の前記第2属性情報が付与された前記第2テキストを含む前記テキストレイヤを用いて第2画像データを再構成する
ことを含む情報処理方法。
【請求項10】
画像データ中のテキストを翻訳するためのコンピュータを機能させるためのプログラムであって、
階層構造を有する第1画像データにおけるテキストレイヤに第1言語で記述された第1テキストのテキストデータを解析することで前記第1テキストの第1属性情報を特定する工程と、
前記第1テキストを前記第1言語とは異なる第2言語の第2テキストに翻訳する工程と、
前記第1属性情報に基づいて前記第2テキストの第2属性情報を生成する工程と、
前記テキストレイヤにおける前記第1テキストを前記第2属性情報が付与された前記第2テキストで更新する工程と、
前記テキストレイヤ中の前記第1テキストの位置及びサイズに基づいて前記第2テキストの前記第2属性情報を調整する工程と、
調整後の前記第2属性情報が付与された前記第2テキストを含む前記テキストレイヤを用いて第2画像データを再構成する工程と、
を前記コンピュータに実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、情報処理装置、情報処理方法及びプログラムに関する。
【背景技術】
【0002】
近年、スマートフォンや携帯電話機に代表される携帯型情報処理端末の劇的な性能向上に加え、HTML(HyperText Markup Language)5やJavaScript(登録商標)などのウェブブラウザ上における周辺技術の進歩に伴い、ウェブブラウザを用いたゲームやコンテンツ視聴などのサービスをユーザがスムーズに享受できるようになってきている。また、国間を繋ぐ海底ケーブルや衛星通信などの国際ネットワークの発展に伴い、ある国で製作されたゲームやアニメーションなどのコンテンツを用いたサービスを様々な国のユーザが享受できる環境が実現されてきている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】中国特許出願公開第104090871号明細書
【発明の概要】
【発明が解決しようとする課題】
【0004】
ゲームやアニメーションなどのコンテンツに含まれる画像データには、背景イメージやキャラクタイメージの他に、テキストが含まれている場合がある。従来では、画像データ内のテキストを他の国の言語に翻訳する場合、テキストをターゲット言語に翻訳し、それにより得られた訳語又は訳文のテキストで画像データを修正する作業を手作業で行う必要があった。そのため、ある国で製作されたコンテンツを他の国へ展開する場合、コンテンツ内に含まれる多数の画像データを手作業で翻訳する必要が生じ、膨大な時間と手間とコストとを要するという問題が存在した。
【0005】
なお、特許文献1には、ユーザにより選択されたオブジェクトの種別情報を画像データにタグ付けし、タグ付けされた種別情報を多言語に自動翻訳する技術が開示されているが、当該従来技術では、画像データ内のテキストであって画像の一部としてユーザに提示されるテキストを他の言語に翻訳して画像データを修正することはできなかった。
【0006】
そこで、本開示は、ある言語のテキストを含む画像データを容易に他の言語のテキストを含む画像データに翻訳することを可能にする情報処理装置、情報処理方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
本開示の一実施形態に係る情報処理装置は、階層構造を有する第1画像データにおけるテキストレイヤに第1言語で記述された第1テキストのテキストデータを解析することで前記第1テキストの第1属性情報を特定する解析部と、前記第1テキストを前記第1言語とは異なる第2言語の第2テキストに翻訳する翻訳部と、前記第1属性情報に基づいて前記第2テキストの第2属性情報を生成する生成部と、前記テキストレイヤにおける前記第1テキストを前記第2属性情報が付与された前記第2テキストで更新する更新部と、前記テキストレイヤ中の前記第1テキストの位置及びサイズに基づいて前記第2テキストの前記第2属性情報を調整する調整部と、調整後の前記第2属性情報が付与された前記第2テキストを含む前記テキストレイヤを用いて第2画像データを再構成する再構成部と、を備える。
【0008】
本開示の一実施形態に係る情報処理方法は、階層構造を有する第1画像データにおけるテキストレイヤに第1言語で記述された第1テキストのテキストデータを解析することで前記第1テキストの第1属性情報を特定し、前記第1テキストを前記第1言語とは異なる第2言語の第2テキストに翻訳し、前記第1属性情報に基づいて前記第2テキストの第2属性情報を生成し、前記テキストレイヤにおける前記第1テキストを前記第2属性情報が付与された前記第2テキストで更新し、前記テキストレイヤ中の前記第1テキストの位置及びサイズに基づいて前記第2テキストの前記第2属性情報を調整し、調整後の前記第2属性情報が付与された前記第2テキストを含む前記テキストレイヤを用いて第2画像データを再構成することを含む。
【0009】
本開示の一実施形態に係るプログラムは、画像データ中のテキストを翻訳するためのコンピュータを機能させるためのプログラムであって、階層構造を有する第1画像データにおけるテキストレイヤに第1言語で記述された第1テキストのテキストデータを解析することで前記第1テキストの第1属性情報を特定する工程と、前記第1テキストを前記第1言語とは異なる第2言語の第2テキストに翻訳する工程と、前記第1属性情報に基づいて前記第2テキストの第2属性情報を生成する工程と、前記テキストレイヤにおける前記第1テキストを前記第2属性情報が付与された前記第2テキストで更新する工程と、前記テキストレイヤ中の前記第1テキストの位置及びサイズに基づいて前記第2テキストの前記第2属性情報を調整する工程と、調整後の前記第2属性情報が付与された前記第2テキストを含む前記テキストレイヤを用いて第2画像データを再構成する工程と、を前記コンピュータに実行させる。
【図面の簡単な説明】
【0010】
【
図1】本開示の一実施形態において例示されるpsdファイルのファイルフォーマットを概略的に示す図である。
【
図2】本開示の一実施形態において例示されるpsdファイルとして作成された画像データの一例を示す図である。
【
図3】
図2に例示された画像データのレイヤ構造の一例を示す図である。
【
図4】
図2に例示された画像データにおけるテキストレイヤの一例を示す図である。
【
図5】
図2に例示された画像データにおける通常レイヤの一例を示す図である。
【
図6】
図2に例示された画像データにおける通常レイヤの他の一例を示す図である。
【
図7】
図2に例示された画像データにおける背景レイヤの一例を示す図である。
【
図8】本開示の一実施形態において例示される翻訳前の画像データにおけるテキストが記述された領域とピクセル画が描画された領域との位置関係を説明するための図である。
【
図9】本開示の一実施形態において例示される翻訳後の画像データにおけるテキストが記述された領域とピクセル画が描画された領域との位置関係を説明するための図である。
【
図10】本開示の一実施形態に係る日本語で記述された翻訳前のテキストのサイズの一例を説明するための図である。
【
図11】本開示の一実施形態に係る英語で記述された翻訳後のテキストのサイズの一例を説明するための図である。
【
図12】本開示の一実施形態に係る中国語で記述された翻訳後のテキストのサイズの一例を説明するための図である。
【
図13】本開示の一実施形態に係るフォントと文字サイズと飾りとを変化させない場合における翻訳前後でのテキストの幅及び高さの変化を説明するための図である。
【
図14】本開示の一実施形態に係るフォントと飾りとを変化せずに文字サイズを変化させることで翻訳後のテキストの幅が翻訳前のテキストの幅に近づくように調整された場合を説明するための図である。
【
図15】本開示の一実施形態に係る翻訳後のテキストを改行させることで翻訳後のテキストの幅が翻訳前のテキストの幅に近づくように調整された場合を説明するための図である。
【
図16】本開示の一実施形態に係る翻訳後のテキストレイヤの一例を示す図である。
【
図17】本開示の一実施形態に係る翻訳後の画像データのレイヤ構造の一例を示す図である。
【
図18】本開示の一実施形態に係る翻訳後の画像データの一例を示す図である。
【
図19】本開示の一実施形態にかかる画像翻訳装置の概略構成例を示すブロック図である。
【
図20】本開示の一実施形態に係る画像翻訳装置の概略動作例を示すフローチャートである。
【
図21】本開示の一実施形態に係る画像翻訳装置においてユーザに提示される画面の一例を示す図である。
【
図22】本開示の一実施形態に係る画像翻訳装置を用いて翻訳された画像データの例を示す図である(その1)。
【
図23】本開示の一実施形態に係る画像翻訳装置を用いて翻訳された画像データの例を示す図である(その2)。
【
図24】本開示の一実施形態に係る画像翻訳装置の各部の機能を実現する情報処理装置の一例を示すハードウエア構成図である。
【
図25】本開示の一実施形態に係る画像翻訳装置がサーバ・クライアント型で構成された場合のシステム構成例を示す図である。
【発明を実施するための形態】
【0011】
以下、本開示の実施形態について、図面を参照して詳細に説明する。なお、以下では、説明の簡略化のため、画像データ内のテキストを他の言語のテキスト(訳文又は訳語)に翻訳し、この訳文又は訳語のテキストで画像データ内のテキストを差し替える処理を、単に「画像データを翻訳する」と称する。
【0012】
以下の実施形態では、翻訳対象の画像データとして、レイヤ構造を持つファイルを例示する。レイヤ構造を持つファイルは、psdファイル、psbファイル、pmbファイル、clipファイル、saiファイルなどの画像データファイル、pdfファイルなどの文書ファイル、mapファイルなどの地図データファイルなど、文字または文字列(以下、テキストという)を含む1層以上のレイヤから構成された種々のファイルであってよい。すなわち、本説明におけるレイヤ構造とは、テキストレイヤを含む1層以上のレイヤを有する構造であればよい。なお、以下では、明確化のため、テキストレイヤとピクセルレイヤとが分離された階層構造を有するpsdファイルなどの画像データファイル(以下、単に画像データともいう)を例に挙げて説明する。
【0013】
図1は、本実施形態において例示されるpsdファイルのファイルフォーマットを概略的に示す図である。
図1に示すように、psdファイルフォーマットには、ファイルヘッダセクションF1、カラーモードセクションF2、イメージリソースセクションF3、レイヤ及びマスク情報セクションF4、および、イメージデータセクションF5が定義されており、1層以上のレイヤ構造を有する画像データが規定される。
【0014】
なお、ファイルヘッダセクションF1は、例えば、ファイル識別子、バージョン番号、予約領域、チャンネル数、キャンバスサイズ、データビット数、色モードなどの情報を格納する。
【0015】
カラーモードセクションF2は、例えば、カラーデータサイズなどの色に関する種々の情報を格納する。
【0016】
イメージリソースセクションF3は、例えば、イメージリソースサイズ、イメージリソースセクションの識別子、リソースID、解像度情報、レイヤ情報、サムネイル情報など、psdファイルを編集するエディタが使用する設定値などの情報を格納する。
【0017】
レイヤ及びマスク情報セクションF4は、レイヤやマスクのデータを管理するための情報を格納し、例えば、データ構造として、データのサイズ、セクションのサイズ、レイヤ数、レイヤ数繰り返し、上側のY座標、左側のX座標、下側のY座標、右側のX座標、チャンネル数、チャンネル数分繰り返す先頭、チャンネル種別、チャンネルのサイズ、チャンネル数分繰り返す末端などの情報を格納し、レイヤ情報として、レイヤの識別子、モードキー、透明度、クリッピング、フラグ、データサイズ、上側Y座標、左側X座標、下側Y座標、右側X座標、標準職、マスク、マスクデータサイズ、ダミーデータ、マスク上側Y座標、マスク左側X座標、マスク下側Y座標、マスク右側X座標、合成データサイズ、データソース場所、データソースアドレス、レイヤサイズ名、レイヤ名などの情報を格納する。
【0018】
イメージデータセクションF5は、各レイヤのイメージデータやテキストデータを管理するためのセクションであり、各レイヤのイメージデータやテキストデータを格納する。
【0019】
図2は、psdファイルとして作成された画像データの一例を示す図である。
図3は、
図2に例示された画像データのレイヤ構造の一例を示す図であり、
図4~
図7は、各レイヤのイメージデータ又はテキストデータの一例を示す図である。
【0020】
図2に例示するように、本説明で使用される画像データ10には、テキストA1と、ピクセル画B1と、背景画像C1とが含まれている。また、
図3に例示するように、画像データ10は、最上層に位置するテキストレイヤ11と、最下層に位置する背景レイヤ13と、テキストレイヤ11と背景レイヤ13との間に位置する通常レイヤ12との三層レイヤ構造を有している。ただし、後述するように、本実施形態に係る画像データ10のレイヤ構造は、種々変更されてよい。
【0021】
テキストレイヤ11は、ユーザにより選択された言語で作成されたテキスト(文字列)がユーザにより指定された位置、フォント、文字サイズ、文字色、飾り(ボールド、斜体、中抜き、陰影など)等で記述されたレイヤであってよい。以下の説明では、文字色や飾り等をまとめて「装飾」とも称し、テキストに対して付与されたフォント、文字サイズ、装飾などを属性情報と称し、属性情報が付与されたテキストをテキストデータとも称する。
図4に示す例では、テキストレイヤ11における領域R11に、「サッカー」という日本語のテキストA1が、フォント「MS Pゴシック」、文字サイズ「30ポイント」、文字色「黒」、飾り「中抜き6%」で記述されている。
【0022】
通常レイヤ12は、例えば、キャラクタや各種のオブジェクトなど(以下、これらをまとめてオブジェクトという)がピクセル画や線画等で描かれたレイヤ(ピクセルレイヤともいう)であってよい。
図5又は
図6に示す例では、通常レイヤ12における領域R12に、ドリブルをしている第1のフィールドプレイヤと、第1のフィールドプレイヤに対してタックルを仕掛けている第2のフィールドプレイヤとの2人のオブジェクトと、サッカーボールのオブジェクトとからなるピクセル画B1が描画されている。
【0023】
本実施形態において、通常レイヤ12におけるピクセル画B1が描かれた領域R12は、テキストレイヤ11に配置されたテキストA1とピクセル画B1との位置関係(距離や重なり具合など)を調整するうえで重要となる。そこで、本説明では、ピクセル画B1が描画された領域R12を、
図5に例示するような、ピクセル画B1の輪郭で区切られた領域R12と定義する。ただし、本実施形態におけるピクセル画が描画された領域は、
図5に示す例に限定されず、例えば、
図6に示すような、ピクセル画B1を囲む矩形や円形や楕円形などの領域R12Aや、ピクセル画B1のうちの一部のオブジェクトが描かれた領域など、種々変形されてよい。
【0024】
背景レイヤ13は、例えば、背景画像がピクセル画や線画で描かれたレイヤであってよい。
図7に示す例では、背景レイヤ13にサッカーコートが背景画像C1として描画されている。なお、背景画像C1は背景レイヤ13の全体に描かれていてもよいし、背景レイヤ13の一部に描かれていてもよい。
【0025】
上記レイヤ構造において、通常レイヤ12は、1層に限られず、複数の通常レイヤからなるレイヤグループであってもよい。
図5に示す例では、例えば、第1のフィールドプレイヤと第2のフィールドプレイヤとサッカーボールとがそれぞれ異なる通常レイヤに描画され、これらがレイヤグループとしてグループ化されて全体としてのピクセル画B1が描画されていてもよい。
【0026】
また、テキストレイヤ11が最上層に位置することは必須ではなく、テキストレイヤ11よりも上層に通常レイヤなどの他のレイヤが存在してもよい。さらに、画像データ10を構成するレイヤは、テキストレイヤ、通常レイヤ及び背景レイヤに限定されず、調整レイヤや塗りつぶしレイヤやシェイプレイヤなどの他の種類のレイヤが含まれてもよいし、テキストレイヤ、通常レイヤ及び背景レイヤのうちの少なくとも1つが他の種類のレイヤに差し替えられてもよい。すなわち、本実施形態に係る画像データ10は、上述したように、テキストレイヤを含む1層以上のレイヤ構造を有していれば、いかように変形されてよい。
【0027】
さらに、以下の説明では、テキストと背景画像との位置関係については考慮せず、テキストとピクセル画(又はピクセル画に含まれるオブジェクト)との位置関係に基づいて、翻訳後のテキストのサイズや配置等を調整する場合を例示するが、本実施形態ではこれに限定されず、テキストと背景画像との位置関係、若しくは、テキストとピクセル画(又はピクセル画に含まれるオブジェクト)と背景画像(又は背景画像に含まれるオブジェクト)との位置関係に基づいて、翻訳後のテキストのサイズや配置等を調整してもよい。
【0028】
図8は、本実施形態において例示される翻訳前の画像データにおけるテキストが記述された領域とピクセル画が描画された領域との位置関係を説明するための図であり、
図9は、本実施形態において例示される翻訳後の画像データにおけるテキストが記述された領域とピクセル画が描画された領域との位置関係を説明するための図である。なお、
図8から
図9への翻訳では、日本語で「サッカー」と記述されたテキストA1を含む画像データ10が英語で「SOCCER」と記述されたテキストA2を含む画像データ20に翻訳された場合が例示されている。
【0029】
図8に示すように、画像データ10において、ピクセル画B1が描画された領域R12は、画像データ10の表示範囲であるキャンバスの一部に配置され、テキストA1が記述された領域R11は、キャンバスにおける領域R12以外の余白領域R10内に配置されている。
【0030】
すなわち、ユーザにより作成された翻訳前の画像データ10では、ピクセル画B1が配置されていない余白領域R10内にテキストA1が記述されている。ここで、余白領域R10とは、視認できる程度のサイズで1文字以上のテキストを配置可能な領域であってよく、その形状は、矩形(正方形を含む)やその他の多角形や円形や楕円形などであってよい。
図8には、余白領域R10として、ピクセル画B1の領域R12と重畳しない矩形の領域が例示されている。ただし、
図8に示す例では、矩形領域に限定されず、凸形状や凹形状などのような矩形を組み合わせた領域やその他の多角形や円形や楕円形などの領域を余白領域R10として設定することも可能である。
【0031】
図8に例示するように、余白領域R10の幅(図面中横方向の長さ)をW_MAXとした場合、
図9に例示するように、翻訳後のテキストA2の領域R21の幅W2は、余白領域R10の幅W_MAXよりも狭い必要がある。また、翻訳前のテキストA1の幅をW1とした場合、翻訳の前後で画像データ10/20がユーザに与える印象の変化を最小限に抑えるためには、翻訳後のテキストA2の領域R21の幅W2を、翻訳前のテキストA1の領域R11の幅W1と同程度とすることが好ましい。
【0032】
同様に、
図8に例示するように、余白領域R10の高さ(図面中縦方向の長さ)をH_MAXとした場合、
図9に例示するように、翻訳後のテキストA2の領域R21の高さH2は、余白領域R10の高さH_MAXよりも低い必要がある。また、翻訳前のテキストA1の高さをH1とした場合、翻訳の前後で画像データ10/20がユーザに与える印象の変化を最小限に抑えるためには、翻訳後のテキストA2の領域R21の高さH2を、翻訳前のテキストA1の領域R11の高さH1と同程度とすることが好ましい。
【0033】
ここで、「画像データがユーザに与える印象」とは、テキストとピクセル画(背景画像を含んでもよい)との大小関係や位置関係やテキストに対するフォントや文字サイズや装飾などによってこれを目にするユーザに与える印象や心象などであってよい。
【0034】
このように、翻訳の前後で画像データ10/20がユーザに与える印象の変化を抑えるためには、翻訳前後でのテキストの幅及び高さ(以下、単にサイズともいう)の変化を小さく抑える必要がある。なお、翻訳前後でテキストのフォントや飾りを維持又は近いものとすることでも、翻訳の前後で画像データ10/20がユーザに与える印象の変化をより抑えることが可能である。
【0035】
図10は、本実施形態に係る日本語で記述された翻訳前のテキストのサイズの一例を説明するための図であり、
図11は、本実施形態に係る英語で記述された翻訳後のテキストのサイズの一例を説明するための図であり、
図12は、本実施形態に係る中国語で記述された翻訳後のテキストのサイズの一例を説明するための図である。
【0036】
上述及び
図10に示すように、本例では、日本語で「サッカー」と記述するテキストA1が、フォント「MS Pゴシック」、文字サイズ「30ポイント」、文字色「黒」、飾り「中抜き6%」で装飾されている。
【0037】
ここで、テキストA1全体の幅W1は、テキストA1を構成する各文字の文字コードに対してフォントごとに対応付けられた文字画像の形状や大きさ、属性情報として設定された文字サイズ、文字列に対して設定された飾りなどに依存して変化する。例えば、文字コード体系をShift-JISとした場合、「サッカー」というテキストA1の文字コードの配列は、「8354 8362 834A 815B」となり、テキストA1全体の幅W1は、文字コード「8354」に対してフォントごとに対応付けられた文字画像「サ」の横方向の長さL11と、文字コード「8362」に対してフォントごとに対応付けられた文字画像「ッ」の横方向の長さL12と、文字コード「834A」に対してフォントごとに対応付けられた文字画像「カ」の横方向の長さL13と、文字コード「815B」に対してフォントごとに対応付けられた文字画像「ー」の横方向の長さL14とを足し合わせた長さ(W1=L11+L12+L13+L14)となる。なお、テキストの高さH1は、文字サイズによって決定される。
【0038】
このテキストA1を英語のテキストA2に翻訳した場合、
図11に示すように、英語で「SOCCER」と記述するテキストA2全体の幅W2も、テキストA1と同様に、テキストA2を構成する各文字の文字コードに対してフォントごとに対応付けられた文字画像の形状や大きさ、文字サイズ、飾りなどに依存して変化する。したがって、文字コード体系をアスキーコードとした場合、テキストA2全体の幅W2は、「SOCCER」を構成する文字それぞれの文字コード「53」、「4F」、「43」、「43」、「45」、「52」に対してフォントごとに対応付けられた文字画像の横方向の長さL21~L26を足し合わせた長さ(W2=L21+L22+L23+L24+L25+L26)となる。
【0039】
同様に、テキストA1を中国語のテキストA3に翻訳した場合、
図12に示すように、中国語で「足球」と記述するテキストA3全体の幅W3も、テキストA3を構成する各文字の文字コードに対してフォントごとに対応付けられた文字画像の形状や大きさ、文字サイズ、飾りなどに依存して変化する。したがって、文字コード体系をUTF-16とした場合、テキストA3全体の幅W3は、「足球」を構成する文字それぞれの文字コード「8DB3」、「7403」に対してフォントごとに対応付けられた文字画像の横方向の長さL31及びL32を足し合わせた長さ(W3=L31+L32)となる。
【0040】
ここで、フォントと文字サイズと飾りとを変化させない場合における翻訳前後でのテキストの幅及び高さの変化を、
図13に示す例を用いて説明する。
図13の(A)及び(B)に例示するように、フォント、文字サイズ及び飾りを変化させずに「サッカー」という日本語のテキストA1を「SOCCER」という英語のテキストA2に翻訳すると、主として文字数の増加に起因して、翻訳後のテキストA2の幅W2が翻訳前のテキストA1の幅W1よりも差D2分広くなる。そして、テキストA2の幅が余白領域R10の幅W_MAXよりも広い場合、テキストA2をそのままテキストレイヤに配置すると、テキストA2の一部がキャンバス外にはみ出してしまい、テキストA2全体を画像データに含めることができなくなる。
【0041】
一方で、
図13の(A)及び(C)に例示するように、フォント、文字サイズ及び飾りを変化させずに「サッカー」という日本語のテキストA1を「足球」という中国語のテキストA3に翻訳すると、主として文字数の減少に起因して、翻訳後のテキストA3の幅W3が翻訳前のテキストA1の幅W1よりも幅D3分短くなる。そのため、テキストA3をそのままテキストレイヤに配置すると、翻訳前の画像データ10におけるテキストA1とピクセル画B1とのバランスと、翻訳後の画像データにおけるテキストA3とピクセル画B1とのバランスとが大幅に変化してしまい、翻訳前後で画像データがユーザに与える印象が大幅に変化してしまう。
【0042】
そこで、本実施形態では、翻訳前後で画像データがユーザに与える印象の変化を最小限に抑えるために、翻訳後のテキストの幅が翻訳前のテキストの幅に近づくように、翻訳後のテキストのフォントや文字サイズや飾りを自動的に調整する。
図14には、フォントと飾りとを変化せずに文字サイズを変化することで、翻訳後のテキストの幅が翻訳前のテキストの幅に近づくように調整した場合が例示されている。
【0043】
図14の(A)及び(B)に示される例では、
図13の(A)及び(B)に示される例において、日本語のテキストA1では30ポイントであった文字サイズが英語のテキストA2では文字サイズが28ポイントに変更されている。これにより、翻訳により文字数が増加するテキストA2の幅W2が翻訳前のテキストA1の幅W1と同程度に維持される。
【0044】
一方、
図14の(A)及び(C)に示される例では、
図13の(A)及び(C)に示される例において、日本語のテキストA1では30ポイントであった文字サイズが中国語のテキストA3では文字サイズが55ポイントに変更されている。これにより、翻訳により文字数が減少するテキストA3の幅W3が翻訳前のテキストA1の幅W1と同程度に維持される。
【0045】
ただし、翻訳後のテキストA3の高さH3は、余白領域R10の高さH_MAXよりも低いものの、翻訳前のテキストA1の高さH1から大幅に増加(約2倍)している。このような場合、テキストA3の高さH3が適切な高さとなるように、文字サイズや飾りが調整されてもよい。例えば、テキストA1の高さH1に対するテキストA3の高さH1の増加率と、テキストA1の幅W1に対するテキストA3の幅W3の減少率との和が所定値(例えば0%)に近づくように、テキストA3の文字サイズが調整されてもよい。または、テキストA3が記述される領域の面積がテキストA1が記述される領域R11の面積に近づくように、テキストA3の文字サイズが調整されてもよい。
【0046】
また、
図15の(A)及び(B)に例示するように、翻訳後のテキストA4の文字数によってはその幅W41が大幅に余白領域R10の幅W_MAXを超えてしまう場合がある。しかしながら、
図15の(C)に例示するように、テキストA4の幅W42を翻訳前のテキストA1の幅W1に近づくよう文字サイズを調整した場合(30ポイント→9ポイント)、一文字一文字が非常に小さくなり、翻訳前後でユーザに与える印象が大幅に変化してしまうだけでなく、文字そのものを視認しづらくなってしまう可能性がある。
【0047】
そのような場合、
図15の(D)に示すように、テキストA4を2行以上の複数行に改行し、この状態で幅W43がテキストA1の幅W1と同程度となるように文字サイズが調整されてもよい。例えば、文字サイズがオリジナルのテキストA1の文字サイズの半分以下となるような場合や、あらかじめ設定しておいた文字サイズに対する閾値以下となるような場合には、翻訳後のテキストを改行したうえで文字サイズを調整するように構成されてもよい。その際、翻訳後のテキストA4の高さH43が余白領域R10の高さH_MAXを超えてしまう場合がある。そのような場合、テキストA4の高さH43が余白領域R10の高さH_MAX以下となるように、若しくは、翻訳前のテキストA1の高さH1に近づくように、テキストA4の文字サイズを調整してもよい。
【0048】
図16は、本実施形態に係る翻訳後のテキストレイヤの一例を示す図であり、
図17は、本実施形態に係る翻訳後の画像データのレイヤ構造の一例を示す図であり、
図18は、本実施形態に係る翻訳後の画像データの一例を示す図である。
【0049】
図16に示すように、翻訳後のテキストレイヤ21では、日本語で「サッカー」と記述されていたテキストA1が英語で「SOCCER」と記述されたテキストA2に翻訳されている。
図17に示すように、翻訳後の画像データ20の再構成では、翻訳前の画像データ10におけるテキストレイヤ11が翻訳後のテキストレイヤ21に差し替えられる。これにより、
図18に示すように、翻訳前の画像データ10における日本語のテキストA1が英語のテキストA2に置き換えられた翻訳後の画像データ20が生成される。
【0050】
次に、本実施形態に情報処理装置としての画像翻訳装置について、図面を参照して詳細に説明する。
【0051】
図19は、本実施形態にかかる画像翻訳装置の概略構成例を示すブロック図である。
図19に示すように、画像翻訳装置100は、画像データ入力部101と、レイヤ構造解析部102と、イメージ領域特定部103と、テキストデータ解析部104と、テキスト領域特定部105と、翻訳元言語特定部106と、翻訳先言語設定部107と、翻訳部108と、テキストレイヤ更新部109と、テキスト領域調整部111と、画像データ再構成部112と、画像データ出力部113とを備える。
【0052】
次に、
図19に示す各部の動作を
図20を用いて説明する。
図20は、本実施形態に係る画像翻訳装置の概略動作例を示すフローチャートである。
図21は、本実施形態に係る画像翻訳装置においてユーザに提示される画面の一例を示す図である。なお、以下の説明では、明確化のため、日本語の画像データ10(
図2参照)を英語の画像データ20(
図18参照)に翻訳する場合を例示する。
【0053】
図20に示すように、本動作では、まず、画像データ入力部101が翻訳前の画像データ10を入力する(ステップS101)。
図21に例示するように、画像データ10の入力は、例えば、ディスプレイなどに表示された画像翻訳ウィンドウ200における翻訳前画像表示エリア210がドロップエリアとして機能し、この翻訳前画像表示エリア210にユーザがマウス等の入力デバイスを用いて翻訳対象の画像データ10のファイルをドラッグアンドドロップする手法や、翻訳対象の画像データ10の保存先であるアドレスパスをユーザが指定する手法など、種々の手法が採用されてよい。また、翻訳前画像表示エリア210には、ユーザにより指定された翻訳前の画像データ10が表示されてよい。
【0054】
次に、レイヤ構造解析部102が、入力された画像データ10のファイルフォーマット(
図1参照)を参照することで、画像データ10のレイヤ構造を解析する(ステップS102)。本説明では、
図3等を用いて説明したように、画像データ10が、テキストレイヤ11と、通常レイヤ12と、背景レイヤ13とからなるレイヤ構造を有する場合を例示する。
【0055】
次に、イメージ領域特定部(特定部ともいう)103が、レイヤ構造におけるテキストレイヤ11以外のレイヤに描画されたピクセル画の位置及びサイズ(以下、領域という)を特定する(ステップS103)。ここで、「ピクセル画の領域を特定する」とは、例えば、
図5又は
図6に示す例では、通常レイヤ12におけるピクセル画B1が描画された領域R12又はR12Aと、その領域R12/R12Aの通常レイヤ12(又は、キャンバスであってもよい)内における位置(例えば、領域R12/R12Aに設定された基準点の座標等)とを特定することであってよい。なお、ピクセル画が複数存在する場合には、それぞれの領域が特定されてよい。また、背景画像とテキストとの重なりも制御する場合、イメージ領域特定部103は、背景レイヤにおける背景画像としてのピクセル画の領域を特定してもよい。
【0056】
ピクセル画が描画された領域(イメージ領域)の特定には、例えば、パターン認識技術や、エッジを認識してオブジェクト(ピクセル画)の領域を特定する画像認識又はオブジェクト認識などが用いられてもよい。又は、セマンティックセグメンテーションなどのAI(Artificial Intelligence)技術を用いた物体認識が用いられてもよい。
【0057】
また、イメージ領域特定部103は、認識処理により特定されたオブジェクトごとに優先順位を設定してもよい。この優先順位は、テキストとの重畳をどの程度許容するかを示す指標として使用されてもよい。例えば、認識されたオブジェクトがキャラクタやキャラクタにおける顔や胴体などである場合には、テキストとの重畳をできる限り許容しない優先順位が設定されてもよく、また、認識されたオブジェクトが建物やキャラクタの腕などである場合には、テキストとの重畳をあまり制限しない(すなわち、許容し易い)優先順位が設定されてもよい。その際、翻訳前の画像データにおけるテキストと各オブジェクトとの重畳具合に基づいて、各オブジェクトに対する優先順位が設定されてもよい。
【0058】
次に、テキストデータ解析部(解析部ともいう)104が、画像データ10におけるテキストレイヤ11からテキストデータを抽出し、抽出されたテキストデータを解析することで、テキストデータの文字コード体系や文字コード列(改行などの一部の制御情報を含んでもよい)、フォントや文字サイズ、テキストに付加された装飾等(属性情報)を特定する(ステップS104)。テキストデータの抽出には、例えば、オープンソースソフトウエアが用いられてもよい。例えば、画像データ10がpsdファイルである場合、Photoshop(登録商標)用に提供されているオープンソースソフトウエアを用いて画像データ10からテキストデータを抽出することが可能である。その際、テキストデータ解析部104は、特定された文字コード体系、文字コード列及び属性情報から、画像データ10(テキストレイヤ11)におけるテキストA1の領域(すなわち、領域R11の位置及びサイズ)を特定してもよい。
【0059】
なお、テキストレイヤに組み込むことができるテキストの形式としては、表示可能な文字列と一部の制御情報とから構成されるプレーンテキスト形式、これらに加え、フォントや文字サイズ、フォントの色や下線や強調(ボールドや陰影等)などの装飾を属性情報として含むリッチテキスト形式(HTML(Hyper Text Markup Language)形式を含む)などが存在する。本説明では、画像データ10中のテキストA1が装飾されている場合を例示するため、テキストA1はリッチテキスト形式で記述されている場合を例示するが、プレーンテキスト形式など、他の形式であってもよい。
【0060】
次に、テキスト領域特定部105が、テキストレイヤ11に記述されたテキストA1の領域を特定する(ステップS105)。ここで、「テキストの領域を特定する」とは、例えば、
図4に示す例では、テキストレイヤ11におけるテキストA1が記述された領域R11と、その領域R11のテキストレイヤ11(又は、キャンバスであってもよい)内における位置(例えば、領域R11に設定された基準点の座標等)とを特定することであってよい。テキストの領域は、例えば、上述において
図10から
図15等を用いて説明したように、フォントや文字サイズや装飾に基づいて特定することが可能である。なお、テキストが複数存在する場合には、それぞれの領域が特定されてよい。
【0061】
次に、翻訳元言語特定部106が、翻訳対象であるテキストA1の言語を特定する(ステップS106)。テキストA1の言語は、例えば、テキストデータ解析部104の解析により特定された文字コード体系から特定することが可能である。ただし、これに限定されず、例えば、テキストデータに言語の指定が属性情報として含まれている場合など、他の特定手段が存在する場合には、この手段を用いて特定されてもよい。また、例えば、
図21に例示する画像翻訳ウィンドウ200のように、プルダウンメニュー212等をユーザに提供することで、ユーザによりテキストA1の言語が設定されてもよい。
【0062】
次に、翻訳先言語設定部107が、翻訳先の言語を設定する(ステップS107)。翻訳先の言語は、例えば、
図21に例示する画像翻訳ウィンドウ200のように、プルダウンメニュー222等をユーザに提供することで、ユーザにより設定されるように構成されてもよい。ただし、このような手法に限定されず、種々変形することが可能である。
【0063】
次に、翻訳部108が、テキストA1を翻訳先言語設定部107で設定された言語の文字列(テキストA2)に翻訳する(ステップS108)。翻訳部108に採用可能な翻訳マシンとしては、ルールベース型や統計ベース型やニューラルネットワーク型や2種以上の型を組み合わせたハイブリッド型などが存在するが、本実施形態では、何れの翻訳マシンが採用されてもよい。また、翻訳部108は、画像翻訳装置100内に実装された処理部であってもよいし、例えばインターネット上に配置された翻訳サイトなどの外部処理部であってもよい。外部の翻訳サイトを使用する場合、数ある翻訳サイトのうちのいずれを使用するかをユーザが選択可能に構成されてもよい。
【0064】
次に、テキストレイヤ更新部(生成部及び更新部ともいう)109が、翻訳されたテキストA2でテキストレイヤ11におけるテキストA1を更新することで、テキストレイヤ21を生成する(ステップS109)。このステップS109では、例えば、ステップS104においてテキストデータ解析部104により特定された属性情報に基づき、翻訳後のテキストA2のフォント、文字サイズ、装飾などの属性情報が生成され、リッチテキスト形式によりテキストA2のテキストデータを生成することで、テキストレイヤ21が生成されてもよい。
【0065】
次に、テキスト領域調整部(調整部ともいう)111が、テキストレイヤ21におけるテキストA2の領域(すなわち、領域R21の位置及びサイズ)を特定し、テキストA2が適正な領域内に収まっているか否かが判定される(ステップS110)。なお、適正な領域とは、例えば、余白領域R10や、翻訳前のテキストA1の領域R11を基準として幅及び高さ共に所定割合(例えば、±20%)以内の領域や、画像データ10中の各オブジェクトとの位置関係に基づいて決定される領域など、翻訳の前後で画像データがユーザに与える印象の変化を抑え得る領域であれば、種々変更されてよい。
【0066】
テキストA2が適正な領域に収まっている場合(ステップS110のYES)、本動作はステップS112へ進む。一方、テキストA2が適正な領域に収まっていない場合(ステップS110のNO)、テキスト領域調整部111は、翻訳後のテキストA2に付与された属性情報から、フォント、文字サイズ及び装飾(改行等を含み得る)のうちのいずれか1つ以上を調整することで、テキストA2の領域を調整する(ステップS111)。テキストA2の領域は、ステップS105と同様に、上述において
図10から
図15等を用いて説明した手法が用いられてよい。また、テキストA2の領域調整には、訳文又は訳語の変更が含まれてもよい。例えば、日本語の「サッカー」に対する英語の「SOCCER」や「ASSOCIATION FOOTBALL」のように、訳語又は訳文が複数存在する場合には、翻訳前のテキストA1の領域により近づくように、訳語又は訳文が変更されてもよい。
【0067】
以上のようにして、翻訳後のテキストレイヤ21におけるテキストA2の領域が調整されると、次に、画像データ再構成部(再構成部ともいう)112が、翻訳前の画像データ10におけるテキストレイヤ11を翻訳後のテキストレイヤ21に差し替えることで、翻訳後の画像データ20を再構成する(ステップS112)。再構成された翻訳後の画像データ20は、例えば、
図21に示すように、画像翻訳ウィンドウ200において翻訳前画像表示エリア210に隣接する翻訳後画像表示エリア220に表示されてもよい。このように、翻訳前の画像データ10と翻訳後の画像データ20とを並べて表示することで、ユーザが翻訳前後の画像データ10/20を目視により比較することが可能となるため、翻訳の前後で画像データ10/20が与える印象がどの程度変化したかを容易に特定することが可能となる。
【0068】
次に、画像データ出力部113が、翻訳後の画像データ20を出力する(ステップS113)。出力された画像データ20は、ユーザにより指定された保存先へ画像ファイルとして保存されてよい。
【0069】
その後、例えば、画像翻訳装置100全体を制御する制御部(CPU(Central Processing Unit)やGPU(Graphics Processing Unit)等)により本動作を終了するか否かが判断され(ステップS114)、終了する場合(ステップS114のYES)、本動作が終了される。
【0070】
一方、終了しない場合(ステップS114のNO)、例えば、制御部により、同一の画像データ10を他の言語に翻訳するか、もしくは、他の画像データを翻訳するかが判断される(ステップS115)。なお、この判断は、ユーザからの指示に基づいて実行されてもよい。
【0071】
翻訳対象の画像データを変更する場合(ステップS115のNO)、本動作がステップS101へ戻り、以降の動作が実行される。一方、同一の画像データをステップS107で設定された言語とは異なる言語に翻訳する場合(ステップS115のYES)、本動作がステップS107へ戻り、以降の動作が実行される。
【0072】
以上のような構成及び動作を備えることで、本実施形態によれば、ユーザへ与える印象の変化を抑制しつつ、ある言語のテキストを含む画像データを他の言語のテキストを含む画像データに自動翻訳することが可能となる。それにより、画像データを容易に複数の言語に翻訳することが可能となるため、ある国で製作されたコンテンツを他の国へ展開する際の時間や手間やコストを大幅に削減することが可能となる。
【0073】
図22及び
図23は、本実施形態に係る画像翻訳装置を用いて翻訳された画像データの例を示す図である。
図22に示す例では、(A)に示す翻訳前の画像データ30は、(B)に示すように、「初回購入報酬」というテキストを含むテキストレイヤ31と、ラッピングされたプレゼントのピクセル画を含む通常レイヤ32と、2人のフィールドプレイヤのピクセル画を含む通常レイヤ33とが重ねられたレイヤ構造を備えている。
【0074】
この重ね合わせにおいて、テキスト「初回購入報酬」は、2人のフィールドプレイヤのピクセル画とは重畳しないように配置されているものの、ラッピングされたプレゼントのピクセル画との重畳は許容されている。したがって、(C)に示すように、翻訳後のテキストレイヤ41では、「初回購入報酬」の訳文である「First Purchase Pack」が、2人のフィールドプレイヤのピクセル画と重畳しないように2行に改行される。それにより、(D)に示すように、ラッピングされたプレゼントのピクセル画とは重畳し且つ2人のフィールドプレイヤのピクセル画とは重畳しないように配置された翻訳後のテキスト「First Purchase Pack」を含む画像データ40が生成される。
【0075】
また、
図23に示す例では、(A)に示す翻訳前の画像データ50は、(B)に示すように、「ダイヤパス」というテキストを含むテキストレイヤ51と、複数のダイヤモンドのピクセル画を含む通常レイヤ52と、2人のフィールドプレイヤのピクセル画を含む通常レイヤ53とが重ねられたレイヤ構造を備えている。このうち、複数のダイヤモンドのピクセル画を含む通常レイヤ52は、それぞれ1つ以上のダイヤモンドのピクセル画を含む複数の通常レイヤで構成されたレイヤグループであってもよい。
【0076】
この重ね合わせにおいて、テキスト「ダイヤパス」は、2人のフィールドプレイヤのピクセル画とは重畳しないように配置されているものの、複数のダイヤモンドのピクセル画との重畳は許容されている。また、「ダイヤパス」とその訳文である「Gem Pass」とは、文字数の変化が小さい。そこで、(C)に示すように、翻訳後のテキストレイヤ61では、「ダイヤパス」の訳文である「Gem Pass」の領域が、翻訳前のテキスト「ダイヤパス」の領域と同程度となるように、「Gem Pass」のフォント、文字サイズ及び装飾のうちの1つ以上が調整される。それにより、(D)に示すように、翻訳前の画像データ50における「ダイヤパス」と同程度の領域に「Gem Pass」が配置された画像データ60が生成される。
【0077】
上述してきた実施形態に係る画像翻訳装置100は、例えば
図24に示すような構成の情報処理装置1000によって実現され得る。
図24は、本実施形態に係る画像翻訳装置の各部の機能を実現する情報処理装置の一例を示すハードウエア構成図である。情報処理装置1000は、CPU1100、GPU1150、ROM(Read Only Memory)1200、RAM(Random Access Memory)1300、記録装置1400、入出力インタフェース(I/F)1500、及び、通信部1600を有する。情報処理装置1000の各部は、バス1700によって接続される。
【0078】
CPU1100は、ROM1200又は記録装置1400に格納されたプログラムに基づいて動作し、各部の制御を行う。例えば、CPU1100は、ROM1200又は記録装置1400に格納されたプログラムをRAM1300に展開し、各種プログラムに対応した処理を実行する。
【0079】
GPU1150は、CPU1100と同様に、ROM1200又は記録装置1400に格納されたプログラムに基づいて動作し、各部の制御を行う。例えば、GPU1150は、ROM1200又は記録装置1400に格納されたプログラムをRAM1300に展開し、各種プログラムに対応した処理を実行する。その際、GPU1150は、CPU1100と連携して各部の制御を実行してもよい。
【0080】
ROM1200は、情報処理装置1000の起動時にCPU1100によって実行されるBIOS(Basic Input Output System)等のブートプログラムや、情報処理装置1000のハードウエアに依存するプログラム等を格納する。
【0081】
記録装置1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を非一時的に記録する、コンピュータが読み取り可能な記録媒体である。具体的には、記録装置1400は、プログラムデータの一例である本開示に係る各動作を実行するためのプログラムを記録する記録媒体である。
【0082】
通信部1600は、情報処理装置1000が外部ネットワーク1650(例えばインターネット)と接続するためのインタフェースである。例えば、CPU1100は、通信部1600を介して、他の機器からデータを受信したり、CPU1100が生成したデータを他の機器へ送信したりする。
【0083】
入出力I/F1500は、入出力デバイス1650と情報処理装置1000とを接続するためのインタフェースである。例えば、CPU1100は、入出力I/F1500を介して、キーボードやマウス等の入力デバイスからデータを受信する。また、CPU1100は、入出力I/F1500を介して、ディスプレイやスピーカやプリンタ等の出力デバイスにデータを送信する。また、入出力I/F1500は、所定の記録媒体に記録されたプログラム等を読み取るメディアインタフェースとして機能してもよい。
【0084】
例えば、情報処理装置1000が上述の実施形態に係る画像翻訳装置100として機能する場合、情報処理装置1000のCPU1100は、RAM1300上にロードされたプログラムを実行することにより、画像データ入力部101、レイヤ構造解析部102、イメージ領域特定部103、テキストデータ解析部104、テキスト領域特定部105、翻訳元言語特定部106、翻訳先言語設定部107、翻訳部108、テキストレイヤ更新部109、テキスト領域調整部111、画像データ再構成部112、画像データ出力部113及び制御部の機能を実現してもよい。また、記録装置1400には、本開示に係るプログラム等が格納されてもよい。なお、CPU1100は、プログラムデータを記録装置1400から読み取って実行するが、他の例として、外部ネットワーク1650を介して、他の装置からこれらのプログラムを取得してもよい。
【0085】
また、本実施形態に係る画像翻訳装置100は、ユーザ側においてスタンドアローンで動作する構成であってもよいし、
図25に例示するように、その機能(画像データ入力部101、レイヤ構造解析部102、イメージ領域特定部103、テキストデータ解析部104、テキスト領域特定部105、翻訳元言語特定部106、翻訳先言語設定部107、翻訳部108、テキストレイヤ更新部109、テキスト領域調整部111、画像データ再構成部112、画像データ出力部113、制御部等)の一部又は全部がネットワーク2300上のサーバ2100に配置されたサーバ・クライアント型のシステム構成であってもよい。その場合、ユーザは、ネットワーク2300に接続されたクライアント2200A、2200B、…からサーバ2100へアクセスし、対象の画僧データを翻訳する。なお、サーバ2100は、単一のサーバで構成された集中型システムであってもよし複数のサーバで構成された分散型システムであってもよいしクラウドサーバなどであってもよい。
【0086】
以上、本開示の実施形態及びその変形例について説明したが、本開示の技術的範囲は、上述の実施形態又はその変形例そのままに限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。また、異なる実施形態及び変形例にわたる構成要素を適宜組み合わせてもよい。
【0087】
また、本明細書に記載された実施形態及びその変形例における効果はあくまで例示であって限定されるものでは無く、他の効果があってもよい。
【符号の説明】
【0088】
100 画像翻訳装置
101 画像データ入力部
102 レイヤ構造解析部
103 イメージ領域特定部
104 テキストデータ解析部
105 テキスト領域特定部
106 翻訳元言語特定部
107 翻訳先言語設定部
108 翻訳部
109 テキストレイヤ更新部
111 テキスト領域調整部
112 画像データ再構成部
113 画像データ出力部