特開2024-80387 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ＣＴＷ株式会社の特許一覧

特開2024-80387情報処理装置、情報処理方法及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024080387

(43)【公開日】2024-06-13

(54)【発明の名称】情報処理装置、情報処理方法及びプログラム

(51)【国際特許分類】

G06F 40/58 20200101AFI20240606BHJP

G06T 11/60 20060101ALI20240606BHJP

【ＦＩ】

G06F40/58

G06T11/60 100B

【審査請求】未請求

【請求項の数】10

【出願形態】ＯＬ

(21)【出願番号】P 2022193534

(22)【出願日】2022-12-02

(71)【出願人】

【識別番号】517169746

【氏名又は名称】ＣＴＷ株式会社

(74)【代理人】

【識別番号】100081455

【弁理士】

【氏名又は名称】橘哲男

(74)【代理人】

【識別番号】100170966

【弁理士】

【氏名又は名称】藤本正紀

(72)【発明者】

【氏名】廖威

(72)【発明者】

【氏名】董浩華

【テーマコード（参考）】

5B050

5B091

【Ｆターム（参考）】

5B050BA06

5B050BA20

5B050DA10

5B050EA06

5B050EA12

5B050EA19

5B091CD15

(57)【要約】

【課題】ある言語のテキストを含む画像データを容易に他の言語のテキストを含む画像データに翻訳する。
【解決手段】一実施形態に係る情報処理装置は、階層構造を有する第１画像データにおけるテキストレイヤに第１言語で記述された第１テキストのテキストデータを解析することで前記第１テキストの第１属性情報を特定し、前記第１テキストを前記第１言語とは異なる第２言語の第２テキストに翻訳し、前記第１属性情報に基づいて前記第２テキストの第２属性情報を生成しと、前記テキストレイヤにおける前記第１テキストを前記第２属性情報が付与された前記第２テキストで更新し、前記テキストレイヤ中の前記第１テキストの位置及びサイズに基づいて前記第２テキストの前記第２属性情報を調整し、調整後の前記第２属性情報が付与された前記第２テキストを含む前記テキストレイヤを用いて第２画像データを再構成する。
【選択図】図１９

【特許請求の範囲】

【請求項1】

階層構造を有する第１画像データにおけるテキストレイヤに第１言語で記述された第１テキストのテキストデータを解析することで前記第１テキストの第１属性情報を特定する解析部と、
前記第１テキストを前記第１言語とは異なる第２言語の第２テキストに翻訳する翻訳部と、
前記第１属性情報に基づいて前記第２テキストの第２属性情報を生成する生成部と、
前記テキストレイヤにおける前記第１テキストを前記第２属性情報が付与された前記第２テキストで更新する更新部と、
前記テキストレイヤ中の前記第１テキストの位置及びサイズに基づいて前記第２テキストの前記第２属性情報を調整する調整部と、
調整後の前記第２属性情報が付与された前記第２テキストを含む前記テキストレイヤを用いて第２画像データを再構成する再構成部と、
を備える情報処理装置。

【請求項2】

前記第１画像データは、ｐｓｄファイル形式であり、
前記解析部は、オープンソースソフトウエアを用いて前記第１画像データから前記テキストデータを抽出する
請求項１に記載の情報処理装置。

【請求項3】

前記翻訳部は、ルールベース型、統計ベース型、ニューラルネットワーク型又はハイブリッド型の翻訳マシンである
請求項１に記載の情報処理装置。

【請求項4】

前記第１画像データ中のピクセル画が描画された領域であるイメージ領域を特定する特定部をさらに備え、
前記調整部は、前記第１画像データにおける前記第１テキストと前記イメージ領域との位置関係に基づいて前記第２属性情報を調整する
請求項１に記載の情報処理装置。

【請求項5】

前記調整部は、前記第２属性情報に基づいて前記テキストレイヤ中の前記第２テキストの位置及びサイズを算出し、前記テキストレイヤ中の前記第１テキストの位置及びサイズと前記第２テキストの位置及びサイズとを比較することで、前記第２属性情報を調整する
請求項１に記載の情報処理装置。

【請求項6】

前記調整部は、前記第１テキストのサイズと前記第２テキストのサイズとに差がある場合、前記第２属性情報における少なくとも文字サイズを調整する
請求項５に記載の情報処理装置。

【請求項7】

前記特定部は、前記第１画像データ中に描画された１以上のオブジェクトを認識し、認識された前記オブジェクトごとに優先順位を設定し、
前記調整部は、前記オブジェクトごとに設定された前記優先順位に基づいて前記第２属性情報を調整する
請求項４に記載の情報処理装置。

【請求項8】

前記第１画像データは、ピクセル画が描画された通常レイヤと、前記テキストレイヤとを含み、
前記再構成部は、前記調整後の第２属性情報が付与された前記第２テキストを含む前記テキストレイヤと、前記通常レイヤとを用いて前記第２画像データを再構成する
請求項１に記載の情報処理装置。

【請求項9】

階層構造を有する第１画像データにおけるテキストレイヤに第１言語で記述された第１テキストのテキストデータを解析することで前記第１テキストの第１属性情報を特定し、
前記第１テキストを前記第１言語とは異なる第２言語の第２テキストに翻訳し、
前記第１属性情報に基づいて前記第２テキストの第２属性情報を生成し、
前記テキストレイヤにおける前記第１テキストを前記第２属性情報が付与された前記第２テキストで更新し、
前記テキストレイヤ中の前記第１テキストの位置及びサイズに基づいて前記第２テキストの前記第２属性情報を調整し、
調整後の前記第２属性情報が付与された前記第２テキストを含む前記テキストレイヤを用いて第２画像データを再構成する
ことを含む情報処理方法。

【請求項10】

画像データ中のテキストを翻訳するためのコンピュータを機能させるためのプログラムであって、
階層構造を有する第１画像データにおけるテキストレイヤに第１言語で記述された第１テキストのテキストデータを解析することで前記第１テキストの第１属性情報を特定する工程と、
前記第１テキストを前記第１言語とは異なる第２言語の第２テキストに翻訳する工程と、
前記第１属性情報に基づいて前記第２テキストの第２属性情報を生成する工程と、
前記テキストレイヤにおける前記第１テキストを前記第２属性情報が付与された前記第２テキストで更新する工程と、
前記テキストレイヤ中の前記第１テキストの位置及びサイズに基づいて前記第２テキストの前記第２属性情報を調整する工程と、
調整後の前記第２属性情報が付与された前記第２テキストを含む前記テキストレイヤを用いて第２画像データを再構成する工程と、
を前記コンピュータに実行させるためのプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本開示は、情報処理装置、情報処理方法及びプログラムに関する。

【背景技術】

【0002】

近年、スマートフォンや携帯電話機に代表される携帯型情報処理端末の劇的な性能向上に加え、ＨＴＭＬ（HyperText Markup Language）５やＪａｖａＳｃｒｉｐｔ（登録商標）などのウェブブラウザ上における周辺技術の進歩に伴い、ウェブブラウザを用いたゲームやコンテンツ視聴などのサービスをユーザがスムーズに享受できるようになってきている。また、国間を繋ぐ海底ケーブルや衛星通信などの国際ネットワークの発展に伴い、ある国で製作されたゲームやアニメーションなどのコンテンツを用いたサービスを様々な国のユーザが享受できる環境が実現されてきている。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】中国特許出願公開第１０４０９０８７１号明細書

【発明の概要】

【発明が解決しようとする課題】

【0004】

ゲームやアニメーションなどのコンテンツに含まれる画像データには、背景イメージやキャラクタイメージの他に、テキストが含まれている場合がある。従来では、画像データ内のテキストを他の国の言語に翻訳する場合、テキストをターゲット言語に翻訳し、それにより得られた訳語又は訳文のテキストで画像データを修正する作業を手作業で行う必要があった。そのため、ある国で製作されたコンテンツを他の国へ展開する場合、コンテンツ内に含まれる多数の画像データを手作業で翻訳する必要が生じ、膨大な時間と手間とコストとを要するという問題が存在した。

【0005】

なお、特許文献１には、ユーザにより選択されたオブジェクトの種別情報を画像データにタグ付けし、タグ付けされた種別情報を多言語に自動翻訳する技術が開示されているが、当該従来技術では、画像データ内のテキストであって画像の一部としてユーザに提示されるテキストを他の言語に翻訳して画像データを修正することはできなかった。

【0006】

そこで、本開示は、ある言語のテキストを含む画像データを容易に他の言語のテキストを含む画像データに翻訳することを可能にする情報処理装置、情報処理方法及びプログラムを提供することを目的とする。

【課題を解決するための手段】

【0007】

本開示の一実施形態に係る情報処理装置は、階層構造を有する第１画像データにおけるテキストレイヤに第１言語で記述された第１テキストのテキストデータを解析することで前記第１テキストの第１属性情報を特定する解析部と、前記第１テキストを前記第１言語とは異なる第２言語の第２テキストに翻訳する翻訳部と、前記第１属性情報に基づいて前記第２テキストの第２属性情報を生成する生成部と、前記テキストレイヤにおける前記第１テキストを前記第２属性情報が付与された前記第２テキストで更新する更新部と、前記テキストレイヤ中の前記第１テキストの位置及びサイズに基づいて前記第２テキストの前記第２属性情報を調整する調整部と、調整後の前記第２属性情報が付与された前記第２テキストを含む前記テキストレイヤを用いて第２画像データを再構成する再構成部と、を備える。

【0008】

本開示の一実施形態に係る情報処理方法は、階層構造を有する第１画像データにおけるテキストレイヤに第１言語で記述された第１テキストのテキストデータを解析することで前記第１テキストの第１属性情報を特定し、前記第１テキストを前記第１言語とは異なる第２言語の第２テキストに翻訳し、前記第１属性情報に基づいて前記第２テキストの第２属性情報を生成し、前記テキストレイヤにおける前記第１テキストを前記第２属性情報が付与された前記第２テキストで更新し、前記テキストレイヤ中の前記第１テキストの位置及びサイズに基づいて前記第２テキストの前記第２属性情報を調整し、調整後の前記第２属性情報が付与された前記第２テキストを含む前記テキストレイヤを用いて第２画像データを再構成することを含む。

【0009】

本開示の一実施形態に係るプログラムは、画像データ中のテキストを翻訳するためのコンピュータを機能させるためのプログラムであって、階層構造を有する第１画像データにおけるテキストレイヤに第１言語で記述された第１テキストのテキストデータを解析することで前記第１テキストの第１属性情報を特定する工程と、前記第１テキストを前記第１言語とは異なる第２言語の第２テキストに翻訳する工程と、前記第１属性情報に基づいて前記第２テキストの第２属性情報を生成する工程と、前記テキストレイヤにおける前記第１テキストを前記第２属性情報が付与された前記第２テキストで更新する工程と、前記テキストレイヤ中の前記第１テキストの位置及びサイズに基づいて前記第２テキストの前記第２属性情報を調整する工程と、調整後の前記第２属性情報が付与された前記第２テキストを含む前記テキストレイヤを用いて第２画像データを再構成する工程と、を前記コンピュータに実行させる。

【図面の簡単な説明】

【0010】

【図1】本開示の一実施形態において例示されるｐｓｄファイルのファイルフォーマットを概略的に示す図である。

【図2】本開示の一実施形態において例示されるｐｓｄファイルとして作成された画像データの一例を示す図である。

【図3】図２に例示された画像データのレイヤ構造の一例を示す図である。

【図4】図２に例示された画像データにおけるテキストレイヤの一例を示す図である。

【図5】図２に例示された画像データにおける通常レイヤの一例を示す図である。

【図6】図２に例示された画像データにおける通常レイヤの他の一例を示す図である。

【図7】図２に例示された画像データにおける背景レイヤの一例を示す図である。

【図8】本開示の一実施形態において例示される翻訳前の画像データにおけるテキストが記述された領域とピクセル画が描画された領域との位置関係を説明するための図である。

【図9】本開示の一実施形態において例示される翻訳後の画像データにおけるテキストが記述された領域とピクセル画が描画された領域との位置関係を説明するための図である。

【図10】本開示の一実施形態に係る日本語で記述された翻訳前のテキストのサイズの一例を説明するための図である。

【図11】本開示の一実施形態に係る英語で記述された翻訳後のテキストのサイズの一例を説明するための図である。

【図12】本開示の一実施形態に係る中国語で記述された翻訳後のテキストのサイズの一例を説明するための図である。

【図13】本開示の一実施形態に係るフォントと文字サイズと飾りとを変化させない場合における翻訳前後でのテキストの幅及び高さの変化を説明するための図である。

【図14】本開示の一実施形態に係るフォントと飾りとを変化せずに文字サイズを変化させることで翻訳後のテキストの幅が翻訳前のテキストの幅に近づくように調整された場合を説明するための図である。

【図15】本開示の一実施形態に係る翻訳後のテキストを改行させることで翻訳後のテキストの幅が翻訳前のテキストの幅に近づくように調整された場合を説明するための図である。

【図16】本開示の一実施形態に係る翻訳後のテキストレイヤの一例を示す図である。

【図17】本開示の一実施形態に係る翻訳後の画像データのレイヤ構造の一例を示す図である。

【図18】本開示の一実施形態に係る翻訳後の画像データの一例を示す図である。

【図19】本開示の一実施形態にかかる画像翻訳装置の概略構成例を示すブロック図である。

【図20】本開示の一実施形態に係る画像翻訳装置の概略動作例を示すフローチャートである。

【図21】本開示の一実施形態に係る画像翻訳装置においてユーザに提示される画面の一例を示す図である。

【図22】本開示の一実施形態に係る画像翻訳装置を用いて翻訳された画像データの例を示す図である（その１）。

【図23】本開示の一実施形態に係る画像翻訳装置を用いて翻訳された画像データの例を示す図である（その２）。

【図24】本開示の一実施形態に係る画像翻訳装置の各部の機能を実現する情報処理装置の一例を示すハードウエア構成図である。

【図25】本開示の一実施形態に係る画像翻訳装置がサーバ・クライアント型で構成された場合のシステム構成例を示す図である。

【発明を実施するための形態】

【0011】

以下、本開示の実施形態について、図面を参照して詳細に説明する。なお、以下では、説明の簡略化のため、画像データ内のテキストを他の言語のテキスト（訳文又は訳語）に翻訳し、この訳文又は訳語のテキストで画像データ内のテキストを差し替える処理を、単に「画像データを翻訳する」と称する。

【0012】

以下の実施形態では、翻訳対象の画像データとして、レイヤ構造を持つファイルを例示する。レイヤ構造を持つファイルは、ｐｓｄファイル、ｐｓｂファイル、ｐｍｂファイル、ｃｌｉｐファイル、ｓａｉファイルなどの画像データファイル、ｐｄｆファイルなどの文書ファイル、ｍａｐファイルなどの地図データファイルなど、文字または文字列（以下、テキストという）を含む１層以上のレイヤから構成された種々のファイルであってよい。すなわち、本説明におけるレイヤ構造とは、テキストレイヤを含む１層以上のレイヤを有する構造であればよい。なお、以下では、明確化のため、テキストレイヤとピクセルレイヤとが分離された階層構造を有するｐｓｄファイルなどの画像データファイル（以下、単に画像データともいう）を例に挙げて説明する。

【0013】

図１は、本実施形態において例示されるｐｓｄファイルのファイルフォーマットを概略的に示す図である。図１に示すように、ｐｓｄファイルフォーマットには、ファイルヘッダセクションＦ１、カラーモードセクションＦ２、イメージリソースセクションＦ３、レイヤ及びマスク情報セクションＦ４、および、イメージデータセクションＦ５が定義されており、１層以上のレイヤ構造を有する画像データが規定される。

【0014】

なお、ファイルヘッダセクションＦ１は、例えば、ファイル識別子、バージョン番号、予約領域、チャンネル数、キャンバスサイズ、データビット数、色モードなどの情報を格納する。

【0015】

カラーモードセクションＦ２は、例えば、カラーデータサイズなどの色に関する種々の情報を格納する。

【0016】

イメージリソースセクションＦ３は、例えば、イメージリソースサイズ、イメージリソースセクションの識別子、リソースＩＤ、解像度情報、レイヤ情報、サムネイル情報など、ｐｓｄファイルを編集するエディタが使用する設定値などの情報を格納する。

【0017】

レイヤ及びマスク情報セクションＦ４は、レイヤやマスクのデータを管理するための情報を格納し、例えば、データ構造として、データのサイズ、セクションのサイズ、レイヤ数、レイヤ数繰り返し、上側のＹ座標、左側のＸ座標、下側のＹ座標、右側のＸ座標、チャンネル数、チャンネル数分繰り返す先頭、チャンネル種別、チャンネルのサイズ、チャンネル数分繰り返す末端などの情報を格納し、レイヤ情報として、レイヤの識別子、モードキー、透明度、クリッピング、フラグ、データサイズ、上側Ｙ座標、左側Ｘ座標、下側Ｙ座標、右側Ｘ座標、標準職、マスク、マスクデータサイズ、ダミーデータ、マスク上側Ｙ座標、マスク左側Ｘ座標、マスク下側Ｙ座標、マスク右側Ｘ座標、合成データサイズ、データソース場所、データソースアドレス、レイヤサイズ名、レイヤ名などの情報を格納する。

【0018】

イメージデータセクションＦ５は、各レイヤのイメージデータやテキストデータを管理するためのセクションであり、各レイヤのイメージデータやテキストデータを格納する。

【0019】

図２は、ｐｓｄファイルとして作成された画像データの一例を示す図である。図３は、図２に例示された画像データのレイヤ構造の一例を示す図であり、図４～図７は、各レイヤのイメージデータ又はテキストデータの一例を示す図である。

【0020】

図２に例示するように、本説明で使用される画像データ１０には、テキストＡ１と、ピクセル画Ｂ１と、背景画像Ｃ１とが含まれている。また、図３に例示するように、画像データ１０は、最上層に位置するテキストレイヤ１１と、最下層に位置する背景レイヤ１３と、テキストレイヤ１１と背景レイヤ１３との間に位置する通常レイヤ１２との三層レイヤ構造を有している。ただし、後述するように、本実施形態に係る画像データ１０のレイヤ構造は、種々変更されてよい。

【0021】

テキストレイヤ１１は、ユーザにより選択された言語で作成されたテキスト（文字列）がユーザにより指定された位置、フォント、文字サイズ、文字色、飾り（ボールド、斜体、中抜き、陰影など）等で記述されたレイヤであってよい。以下の説明では、文字色や飾り等をまとめて「装飾」とも称し、テキストに対して付与されたフォント、文字サイズ、装飾などを属性情報と称し、属性情報が付与されたテキストをテキストデータとも称する。図４に示す例では、テキストレイヤ１１における領域Ｒ１１に、「サッカー」という日本語のテキストＡ１が、フォント「ＭＳＰゴシック」、文字サイズ「３０ポイント」、文字色「黒」、飾り「中抜き６％」で記述されている。

【0022】

通常レイヤ１２は、例えば、キャラクタや各種のオブジェクトなど（以下、これらをまとめてオブジェクトという）がピクセル画や線画等で描かれたレイヤ（ピクセルレイヤともいう）であってよい。図５又は図６に示す例では、通常レイヤ１２における領域Ｒ１２に、ドリブルをしている第１のフィールドプレイヤと、第１のフィールドプレイヤに対してタックルを仕掛けている第２のフィールドプレイヤとの２人のオブジェクトと、サッカーボールのオブジェクトとからなるピクセル画Ｂ１が描画されている。

【0023】

本実施形態において、通常レイヤ１２におけるピクセル画Ｂ１が描かれた領域Ｒ１２は、テキストレイヤ１１に配置されたテキストＡ１とピクセル画Ｂ１との位置関係（距離や重なり具合など）を調整するうえで重要となる。そこで、本説明では、ピクセル画Ｂ１が描画された領域Ｒ１２を、図５に例示するような、ピクセル画Ｂ１の輪郭で区切られた領域Ｒ１２と定義する。ただし、本実施形態におけるピクセル画が描画された領域は、図５に示す例に限定されず、例えば、図６に示すような、ピクセル画Ｂ１を囲む矩形や円形や楕円形などの領域Ｒ１２Ａや、ピクセル画Ｂ１のうちの一部のオブジェクトが描かれた領域など、種々変形されてよい。

【0024】

背景レイヤ１３は、例えば、背景画像がピクセル画や線画で描かれたレイヤであってよい。図７に示す例では、背景レイヤ１３にサッカーコートが背景画像Ｃ１として描画されている。なお、背景画像Ｃ１は背景レイヤ１３の全体に描かれていてもよいし、背景レイヤ１３の一部に描かれていてもよい。

【0025】

上記レイヤ構造において、通常レイヤ１２は、１層に限られず、複数の通常レイヤからなるレイヤグループであってもよい。図５に示す例では、例えば、第１のフィールドプレイヤと第２のフィールドプレイヤとサッカーボールとがそれぞれ異なる通常レイヤに描画され、これらがレイヤグループとしてグループ化されて全体としてのピクセル画Ｂ１が描画されていてもよい。

【0026】

また、テキストレイヤ１１が最上層に位置することは必須ではなく、テキストレイヤ１１よりも上層に通常レイヤなどの他のレイヤが存在してもよい。さらに、画像データ１０を構成するレイヤは、テキストレイヤ、通常レイヤ及び背景レイヤに限定されず、調整レイヤや塗りつぶしレイヤやシェイプレイヤなどの他の種類のレイヤが含まれてもよいし、テキストレイヤ、通常レイヤ及び背景レイヤのうちの少なくとも１つが他の種類のレイヤに差し替えられてもよい。すなわち、本実施形態に係る画像データ１０は、上述したように、テキストレイヤを含む１層以上のレイヤ構造を有していれば、いかように変形されてよい。

【0027】

さらに、以下の説明では、テキストと背景画像との位置関係については考慮せず、テキストとピクセル画（又はピクセル画に含まれるオブジェクト）との位置関係に基づいて、翻訳後のテキストのサイズや配置等を調整する場合を例示するが、本実施形態ではこれに限定されず、テキストと背景画像との位置関係、若しくは、テキストとピクセル画（又はピクセル画に含まれるオブジェクト）と背景画像（又は背景画像に含まれるオブジェクト）との位置関係に基づいて、翻訳後のテキストのサイズや配置等を調整してもよい。

【0028】

図８は、本実施形態において例示される翻訳前の画像データにおけるテキストが記述された領域とピクセル画が描画された領域との位置関係を説明するための図であり、図９は、本実施形態において例示される翻訳後の画像データにおけるテキストが記述された領域とピクセル画が描画された領域との位置関係を説明するための図である。なお、図８から図９への翻訳では、日本語で「サッカー」と記述されたテキストＡ１を含む画像データ１０が英語で「ＳＯＣＣＥＲ」と記述されたテキストＡ２を含む画像データ２０に翻訳された場合が例示されている。

【0029】

図８に示すように、画像データ１０において、ピクセル画Ｂ１が描画された領域Ｒ１２は、画像データ１０の表示範囲であるキャンバスの一部に配置され、テキストＡ１が記述された領域Ｒ１１は、キャンバスにおける領域Ｒ１２以外の余白領域Ｒ１０内に配置されている。

【0030】

すなわち、ユーザにより作成された翻訳前の画像データ１０では、ピクセル画Ｂ１が配置されていない余白領域Ｒ１０内にテキストＡ１が記述されている。ここで、余白領域Ｒ１０とは、視認できる程度のサイズで１文字以上のテキストを配置可能な領域であってよく、その形状は、矩形（正方形を含む）やその他の多角形や円形や楕円形などであってよい。図８には、余白領域Ｒ１０として、ピクセル画Ｂ１の領域Ｒ１２と重畳しない矩形の領域が例示されている。ただし、図８に示す例では、矩形領域に限定されず、凸形状や凹形状などのような矩形を組み合わせた領域やその他の多角形や円形や楕円形などの領域を余白領域Ｒ１０として設定することも可能である。

【0031】

図８に例示するように、余白領域Ｒ１０の幅（図面中横方向の長さ）をＷ＿ＭＡＸとした場合、図９に例示するように、翻訳後のテキストＡ２の領域Ｒ２１の幅Ｗ２は、余白領域Ｒ１０の幅Ｗ＿ＭＡＸよりも狭い必要がある。また、翻訳前のテキストＡ１の幅をＷ１とした場合、翻訳の前後で画像データ１０／２０がユーザに与える印象の変化を最小限に抑えるためには、翻訳後のテキストＡ２の領域Ｒ２１の幅Ｗ２を、翻訳前のテキストＡ１の領域Ｒ１１の幅Ｗ１と同程度とすることが好ましい。

【0032】

同様に、図８に例示するように、余白領域Ｒ１０の高さ（図面中縦方向の長さ）をＨ＿ＭＡＸとした場合、図９に例示するように、翻訳後のテキストＡ２の領域Ｒ２１の高さＨ２は、余白領域Ｒ１０の高さＨ＿ＭＡＸよりも低い必要がある。また、翻訳前のテキストＡ１の高さをＨ１とした場合、翻訳の前後で画像データ１０／２０がユーザに与える印象の変化を最小限に抑えるためには、翻訳後のテキストＡ２の領域Ｒ２１の高さＨ２を、翻訳前のテキストＡ１の領域Ｒ１１の高さＨ１と同程度とすることが好ましい。

【0033】

ここで、「画像データがユーザに与える印象」とは、テキストとピクセル画（背景画像を含んでもよい）との大小関係や位置関係やテキストに対するフォントや文字サイズや装飾などによってこれを目にするユーザに与える印象や心象などであってよい。

【0034】

このように、翻訳の前後で画像データ１０／２０がユーザに与える印象の変化を抑えるためには、翻訳前後でのテキストの幅及び高さ（以下、単にサイズともいう）の変化を小さく抑える必要がある。なお、翻訳前後でテキストのフォントや飾りを維持又は近いものとすることでも、翻訳の前後で画像データ１０／２０がユーザに与える印象の変化をより抑えることが可能である。

【0035】

図１０は、本実施形態に係る日本語で記述された翻訳前のテキストのサイズの一例を説明するための図であり、図１１は、本実施形態に係る英語で記述された翻訳後のテキストのサイズの一例を説明するための図であり、図１２は、本実施形態に係る中国語で記述された翻訳後のテキストのサイズの一例を説明するための図である。

【0036】

上述及び図１０に示すように、本例では、日本語で「サッカー」と記述するテキストＡ１が、フォント「ＭＳＰゴシック」、文字サイズ「３０ポイント」、文字色「黒」、飾り「中抜き６％」で装飾されている。

【0037】

ここで、テキストＡ１全体の幅Ｗ１は、テキストＡ１を構成する各文字の文字コードに対してフォントごとに対応付けられた文字画像の形状や大きさ、属性情報として設定された文字サイズ、文字列に対して設定された飾りなどに依存して変化する。例えば、文字コード体系をＳｈｉｆｔ－ＪＩＳとした場合、「サッカー」というテキストＡ１の文字コードの配列は、「８３５４８３６２８３４Ａ８１５Ｂ」となり、テキストＡ１全体の幅Ｗ１は、文字コード「８３５４」に対してフォントごとに対応付けられた文字画像「サ」の横方向の長さＬ１１と、文字コード「８３６２」に対してフォントごとに対応付けられた文字画像「ッ」の横方向の長さＬ１２と、文字コード「８３４Ａ」に対してフォントごとに対応付けられた文字画像「カ」の横方向の長さＬ１３と、文字コード「８１５Ｂ」に対してフォントごとに対応付けられた文字画像「ー」の横方向の長さＬ１４とを足し合わせた長さ（Ｗ１＝Ｌ１１＋Ｌ１２＋Ｌ１３＋Ｌ１４）となる。なお、テキストの高さＨ１は、文字サイズによって決定される。

【0038】

このテキストＡ１を英語のテキストＡ２に翻訳した場合、図１１に示すように、英語で「ＳＯＣＣＥＲ」と記述するテキストＡ２全体の幅Ｗ２も、テキストＡ１と同様に、テキストＡ２を構成する各文字の文字コードに対してフォントごとに対応付けられた文字画像の形状や大きさ、文字サイズ、飾りなどに依存して変化する。したがって、文字コード体系をアスキーコードとした場合、テキストＡ２全体の幅Ｗ２は、「ＳＯＣＣＥＲ」を構成する文字それぞれの文字コード「５３」、「４Ｆ」、「４３」、「４３」、「４５」、「５２」に対してフォントごとに対応付けられた文字画像の横方向の長さＬ２１～Ｌ２６を足し合わせた長さ（Ｗ２＝Ｌ２１＋Ｌ２２＋Ｌ２３＋Ｌ２４＋Ｌ２５＋Ｌ２６）となる。

【0039】

同様に、テキストＡ１を中国語のテキストＡ３に翻訳した場合、図１２に示すように、中国語で「足球」と記述するテキストＡ３全体の幅Ｗ３も、テキストＡ３を構成する各文字の文字コードに対してフォントごとに対応付けられた文字画像の形状や大きさ、文字サイズ、飾りなどに依存して変化する。したがって、文字コード体系をＵＴＦ－１６とした場合、テキストＡ３全体の幅Ｗ３は、「足球」を構成する文字それぞれの文字コード「８ＤＢ３」、「７４０３」に対してフォントごとに対応付けられた文字画像の横方向の長さＬ３１及びＬ３２を足し合わせた長さ（Ｗ３＝Ｌ３１＋Ｌ３２）となる。

【0040】

ここで、フォントと文字サイズと飾りとを変化させない場合における翻訳前後でのテキストの幅及び高さの変化を、図１３に示す例を用いて説明する。図１３の（Ａ）及び（Ｂ）に例示するように、フォント、文字サイズ及び飾りを変化させずに「サッカー」という日本語のテキストＡ１を「ＳＯＣＣＥＲ」という英語のテキストＡ２に翻訳すると、主として文字数の増加に起因して、翻訳後のテキストＡ２の幅Ｗ２が翻訳前のテキストＡ１の幅Ｗ１よりも差Ｄ２分広くなる。そして、テキストＡ２の幅が余白領域Ｒ１０の幅Ｗ＿ＭＡＸよりも広い場合、テキストＡ２をそのままテキストレイヤに配置すると、テキストＡ２の一部がキャンバス外にはみ出してしまい、テキストＡ２全体を画像データに含めることができなくなる。

【0041】

一方で、図１３の（Ａ）及び（Ｃ）に例示するように、フォント、文字サイズ及び飾りを変化させずに「サッカー」という日本語のテキストＡ１を「足球」という中国語のテキストＡ３に翻訳すると、主として文字数の減少に起因して、翻訳後のテキストＡ３の幅Ｗ３が翻訳前のテキストＡ１の幅Ｗ１よりも幅Ｄ３分短くなる。そのため、テキストＡ３をそのままテキストレイヤに配置すると、翻訳前の画像データ１０におけるテキストＡ１とピクセル画Ｂ１とのバランスと、翻訳後の画像データにおけるテキストＡ３とピクセル画Ｂ１とのバランスとが大幅に変化してしまい、翻訳前後で画像データがユーザに与える印象が大幅に変化してしまう。

【0042】

そこで、本実施形態では、翻訳前後で画像データがユーザに与える印象の変化を最小限に抑えるために、翻訳後のテキストの幅が翻訳前のテキストの幅に近づくように、翻訳後のテキストのフォントや文字サイズや飾りを自動的に調整する。図１４には、フォントと飾りとを変化せずに文字サイズを変化することで、翻訳後のテキストの幅が翻訳前のテキストの幅に近づくように調整した場合が例示されている。

【0043】

図１４の（Ａ）及び（Ｂ）に示される例では、図１３の（Ａ）及び（Ｂ）に示される例において、日本語のテキストＡ１では３０ポイントであった文字サイズが英語のテキストＡ２では文字サイズが２８ポイントに変更されている。これにより、翻訳により文字数が増加するテキストＡ２の幅Ｗ２が翻訳前のテキストＡ１の幅Ｗ１と同程度に維持される。

【0044】

一方、図１４の（Ａ）及び（Ｃ）に示される例では、図１３の（Ａ）及び（Ｃ）に示される例において、日本語のテキストＡ１では３０ポイントであった文字サイズが中国語のテキストＡ３では文字サイズが５５ポイントに変更されている。これにより、翻訳により文字数が減少するテキストＡ３の幅Ｗ３が翻訳前のテキストＡ１の幅Ｗ１と同程度に維持される。

【0045】

ただし、翻訳後のテキストＡ３の高さＨ３は、余白領域Ｒ１０の高さＨ＿ＭＡＸよりも低いものの、翻訳前のテキストＡ１の高さＨ１から大幅に増加（約２倍）している。このような場合、テキストＡ３の高さＨ３が適切な高さとなるように、文字サイズや飾りが調整されてもよい。例えば、テキストＡ１の高さＨ１に対するテキストＡ３の高さＨ１の増加率と、テキストＡ１の幅Ｗ１に対するテキストＡ３の幅Ｗ３の減少率との和が所定値（例えば０％）に近づくように、テキストＡ３の文字サイズが調整されてもよい。または、テキストＡ３が記述される領域の面積がテキストＡ１が記述される領域Ｒ１１の面積に近づくように、テキストＡ３の文字サイズが調整されてもよい。

【0046】

また、図１５の（Ａ）及び（Ｂ）に例示するように、翻訳後のテキストＡ４の文字数によってはその幅Ｗ４１が大幅に余白領域Ｒ１０の幅Ｗ＿ＭＡＸを超えてしまう場合がある。しかしながら、図１５の（Ｃ）に例示するように、テキストＡ４の幅Ｗ４２を翻訳前のテキストＡ１の幅Ｗ１に近づくよう文字サイズを調整した場合（３０ポイント→９ポイント）、一文字一文字が非常に小さくなり、翻訳前後でユーザに与える印象が大幅に変化してしまうだけでなく、文字そのものを視認しづらくなってしまう可能性がある。

【0047】

そのような場合、図１５の（Ｄ）に示すように、テキストＡ４を２行以上の複数行に改行し、この状態で幅Ｗ４３がテキストＡ１の幅Ｗ１と同程度となるように文字サイズが調整されてもよい。例えば、文字サイズがオリジナルのテキストＡ１の文字サイズの半分以下となるような場合や、あらかじめ設定しておいた文字サイズに対する閾値以下となるような場合には、翻訳後のテキストを改行したうえで文字サイズを調整するように構成されてもよい。その際、翻訳後のテキストＡ４の高さＨ４３が余白領域Ｒ１０の高さＨ＿ＭＡＸを超えてしまう場合がある。そのような場合、テキストＡ４の高さＨ４３が余白領域Ｒ１０の高さＨ＿ＭＡＸ以下となるように、若しくは、翻訳前のテキストＡ１の高さＨ１に近づくように、テキストＡ４の文字サイズを調整してもよい。

【0048】

図１６は、本実施形態に係る翻訳後のテキストレイヤの一例を示す図であり、図１７は、本実施形態に係る翻訳後の画像データのレイヤ構造の一例を示す図であり、図１８は、本実施形態に係る翻訳後の画像データの一例を示す図である。

【0049】

図１６に示すように、翻訳後のテキストレイヤ２１では、日本語で「サッカー」と記述されていたテキストＡ１が英語で「ＳＯＣＣＥＲ」と記述されたテキストＡ２に翻訳されている。図１７に示すように、翻訳後の画像データ２０の再構成では、翻訳前の画像データ１０におけるテキストレイヤ１１が翻訳後のテキストレイヤ２１に差し替えられる。これにより、図１８に示すように、翻訳前の画像データ１０における日本語のテキストＡ１が英語のテキストＡ２に置き換えられた翻訳後の画像データ２０が生成される。

【0050】

次に、本実施形態に情報処理装置としての画像翻訳装置について、図面を参照して詳細に説明する。

【0051】

図１９は、本実施形態にかかる画像翻訳装置の概略構成例を示すブロック図である。図１９に示すように、画像翻訳装置１００は、画像データ入力部１０１と、レイヤ構造解析部１０２と、イメージ領域特定部１０３と、テキストデータ解析部１０４と、テキスト領域特定部１０５と、翻訳元言語特定部１０６と、翻訳先言語設定部１０７と、翻訳部１０８と、テキストレイヤ更新部１０９と、テキスト領域調整部１１１と、画像データ再構成部１１２と、画像データ出力部１１３とを備える。

【0052】

次に、図１９に示す各部の動作を図２０を用いて説明する。図２０は、本実施形態に係る画像翻訳装置の概略動作例を示すフローチャートである。図２１は、本実施形態に係る画像翻訳装置においてユーザに提示される画面の一例を示す図である。なお、以下の説明では、明確化のため、日本語の画像データ１０（図２参照）を英語の画像データ２０（図１８参照）に翻訳する場合を例示する。

【0053】

図２０に示すように、本動作では、まず、画像データ入力部１０１が翻訳前の画像データ１０を入力する（ステップＳ１０１）。図２１に例示するように、画像データ１０の入力は、例えば、ディスプレイなどに表示された画像翻訳ウィンドウ２００における翻訳前画像表示エリア２１０がドロップエリアとして機能し、この翻訳前画像表示エリア２１０にユーザがマウス等の入力デバイスを用いて翻訳対象の画像データ１０のファイルをドラッグアンドドロップする手法や、翻訳対象の画像データ１０の保存先であるアドレスパスをユーザが指定する手法など、種々の手法が採用されてよい。また、翻訳前画像表示エリア２１０には、ユーザにより指定された翻訳前の画像データ１０が表示されてよい。

【0054】

次に、レイヤ構造解析部１０２が、入力された画像データ１０のファイルフォーマット（図１参照）を参照することで、画像データ１０のレイヤ構造を解析する（ステップＳ１０２）。本説明では、図３等を用いて説明したように、画像データ１０が、テキストレイヤ１１と、通常レイヤ１２と、背景レイヤ１３とからなるレイヤ構造を有する場合を例示する。

【0055】

次に、イメージ領域特定部（特定部ともいう）１０３が、レイヤ構造におけるテキストレイヤ１１以外のレイヤに描画されたピクセル画の位置及びサイズ（以下、領域という）を特定する（ステップＳ１０３）。ここで、「ピクセル画の領域を特定する」とは、例えば、図５又は図６に示す例では、通常レイヤ１２におけるピクセル画Ｂ１が描画された領域Ｒ１２又はＲ１２Ａと、その領域Ｒ１２／Ｒ１２Ａの通常レイヤ１２（又は、キャンバスであってもよい）内における位置（例えば、領域Ｒ１２／Ｒ１２Ａに設定された基準点の座標等）とを特定することであってよい。なお、ピクセル画が複数存在する場合には、それぞれの領域が特定されてよい。また、背景画像とテキストとの重なりも制御する場合、イメージ領域特定部１０３は、背景レイヤにおける背景画像としてのピクセル画の領域を特定してもよい。

【0056】

ピクセル画が描画された領域（イメージ領域）の特定には、例えば、パターン認識技術や、エッジを認識してオブジェクト（ピクセル画）の領域を特定する画像認識又はオブジェクト認識などが用いられてもよい。又は、セマンティックセグメンテーションなどのＡＩ（ＡｒｔｉｆｉｃｉａｌＩｎｔｅｌｌｉｇｅｎｃｅ）技術を用いた物体認識が用いられてもよい。

【0057】

また、イメージ領域特定部１０３は、認識処理により特定されたオブジェクトごとに優先順位を設定してもよい。この優先順位は、テキストとの重畳をどの程度許容するかを示す指標として使用されてもよい。例えば、認識されたオブジェクトがキャラクタやキャラクタにおける顔や胴体などである場合には、テキストとの重畳をできる限り許容しない優先順位が設定されてもよく、また、認識されたオブジェクトが建物やキャラクタの腕などである場合には、テキストとの重畳をあまり制限しない（すなわち、許容し易い）優先順位が設定されてもよい。その際、翻訳前の画像データにおけるテキストと各オブジェクトとの重畳具合に基づいて、各オブジェクトに対する優先順位が設定されてもよい。

【0058】

次に、テキストデータ解析部（解析部ともいう）１０４が、画像データ１０におけるテキストレイヤ１１からテキストデータを抽出し、抽出されたテキストデータを解析することで、テキストデータの文字コード体系や文字コード列（改行などの一部の制御情報を含んでもよい）、フォントや文字サイズ、テキストに付加された装飾等（属性情報）を特定する（ステップＳ１０４）。テキストデータの抽出には、例えば、オープンソースソフトウエアが用いられてもよい。例えば、画像データ１０がｐｓｄファイルである場合、Ｐｈｏｔｏｓｈｏｐ（登録商標）用に提供されているオープンソースソフトウエアを用いて画像データ１０からテキストデータを抽出することが可能である。その際、テキストデータ解析部１０４は、特定された文字コード体系、文字コード列及び属性情報から、画像データ１０（テキストレイヤ１１）におけるテキストＡ１の領域（すなわち、領域Ｒ１１の位置及びサイズ）を特定してもよい。

【0059】

なお、テキストレイヤに組み込むことができるテキストの形式としては、表示可能な文字列と一部の制御情報とから構成されるプレーンテキスト形式、これらに加え、フォントや文字サイズ、フォントの色や下線や強調（ボールドや陰影等）などの装飾を属性情報として含むリッチテキスト形式（ＨＴＭＬ（Hyper Text Markup Language）形式を含む）などが存在する。本説明では、画像データ１０中のテキストＡ１が装飾されている場合を例示するため、テキストＡ１はリッチテキスト形式で記述されている場合を例示するが、プレーンテキスト形式など、他の形式であってもよい。

【0060】

次に、テキスト領域特定部１０５が、テキストレイヤ１１に記述されたテキストＡ１の領域を特定する（ステップＳ１０５）。ここで、「テキストの領域を特定する」とは、例えば、図４に示す例では、テキストレイヤ１１におけるテキストＡ１が記述された領域Ｒ１１と、その領域Ｒ１１のテキストレイヤ１１（又は、キャンバスであってもよい）内における位置（例えば、領域Ｒ１１に設定された基準点の座標等）とを特定することであってよい。テキストの領域は、例えば、上述において図１０から図１５等を用いて説明したように、フォントや文字サイズや装飾に基づいて特定することが可能である。なお、テキストが複数存在する場合には、それぞれの領域が特定されてよい。

【0061】

次に、翻訳元言語特定部１０６が、翻訳対象であるテキストＡ１の言語を特定する（ステップＳ１０６）。テキストＡ１の言語は、例えば、テキストデータ解析部１０４の解析により特定された文字コード体系から特定することが可能である。ただし、これに限定されず、例えば、テキストデータに言語の指定が属性情報として含まれている場合など、他の特定手段が存在する場合には、この手段を用いて特定されてもよい。また、例えば、図２１に例示する画像翻訳ウィンドウ２００のように、プルダウンメニュー２１２等をユーザに提供することで、ユーザによりテキストＡ１の言語が設定されてもよい。

【0062】

次に、翻訳先言語設定部１０７が、翻訳先の言語を設定する（ステップＳ１０７）。翻訳先の言語は、例えば、図２１に例示する画像翻訳ウィンドウ２００のように、プルダウンメニュー２２２等をユーザに提供することで、ユーザにより設定されるように構成されてもよい。ただし、このような手法に限定されず、種々変形することが可能である。

【0063】

次に、翻訳部１０８が、テキストＡ１を翻訳先言語設定部１０７で設定された言語の文字列（テキストＡ２）に翻訳する（ステップＳ１０８）。翻訳部１０８に採用可能な翻訳マシンとしては、ルールベース型や統計ベース型やニューラルネットワーク型や２種以上の型を組み合わせたハイブリッド型などが存在するが、本実施形態では、何れの翻訳マシンが採用されてもよい。また、翻訳部１０８は、画像翻訳装置１００内に実装された処理部であってもよいし、例えばインターネット上に配置された翻訳サイトなどの外部処理部であってもよい。外部の翻訳サイトを使用する場合、数ある翻訳サイトのうちのいずれを使用するかをユーザが選択可能に構成されてもよい。

【0064】

次に、テキストレイヤ更新部（生成部及び更新部ともいう）１０９が、翻訳されたテキストＡ２でテキストレイヤ１１におけるテキストＡ１を更新することで、テキストレイヤ２１を生成する（ステップＳ１０９）。このステップＳ１０９では、例えば、ステップＳ１０４においてテキストデータ解析部１０４により特定された属性情報に基づき、翻訳後のテキストＡ２のフォント、文字サイズ、装飾などの属性情報が生成され、リッチテキスト形式によりテキストＡ２のテキストデータを生成することで、テキストレイヤ２１が生成されてもよい。

【0065】

次に、テキスト領域調整部（調整部ともいう）１１１が、テキストレイヤ２１におけるテキストＡ２の領域（すなわち、領域Ｒ２１の位置及びサイズ）を特定し、テキストＡ２が適正な領域内に収まっているか否かが判定される（ステップＳ１１０）。なお、適正な領域とは、例えば、余白領域Ｒ１０や、翻訳前のテキストＡ１の領域Ｒ１１を基準として幅及び高さ共に所定割合（例えば、±２０％）以内の領域や、画像データ１０中の各オブジェクトとの位置関係に基づいて決定される領域など、翻訳の前後で画像データがユーザに与える印象の変化を抑え得る領域であれば、種々変更されてよい。

【0066】

テキストＡ２が適正な領域に収まっている場合（ステップＳ１１０のＹＥＳ）、本動作はステップＳ１１２へ進む。一方、テキストＡ２が適正な領域に収まっていない場合（ステップＳ１１０のＮＯ）、テキスト領域調整部１１１は、翻訳後のテキストＡ２に付与された属性情報から、フォント、文字サイズ及び装飾（改行等を含み得る）のうちのいずれか１つ以上を調整することで、テキストＡ２の領域を調整する（ステップＳ１１１）。テキストＡ２の領域は、ステップＳ１０５と同様に、上述において図１０から図１５等を用いて説明した手法が用いられてよい。また、テキストＡ２の領域調整には、訳文又は訳語の変更が含まれてもよい。例えば、日本語の「サッカー」に対する英語の「ＳＯＣＣＥＲ」や「ＡＳＳＯＣＩＡＴＩＯＮＦＯＯＴＢＡＬＬ」のように、訳語又は訳文が複数存在する場合には、翻訳前のテキストＡ１の領域により近づくように、訳語又は訳文が変更されてもよい。

【0067】

以上のようにして、翻訳後のテキストレイヤ２１におけるテキストＡ２の領域が調整されると、次に、画像データ再構成部（再構成部ともいう）１１２が、翻訳前の画像データ１０におけるテキストレイヤ１１を翻訳後のテキストレイヤ２１に差し替えることで、翻訳後の画像データ２０を再構成する（ステップＳ１１２）。再構成された翻訳後の画像データ２０は、例えば、図２１に示すように、画像翻訳ウィンドウ２００において翻訳前画像表示エリア２１０に隣接する翻訳後画像表示エリア２２０に表示されてもよい。このように、翻訳前の画像データ１０と翻訳後の画像データ２０とを並べて表示することで、ユーザが翻訳前後の画像データ１０／２０を目視により比較することが可能となるため、翻訳の前後で画像データ１０／２０が与える印象がどの程度変化したかを容易に特定することが可能となる。

【0068】

次に、画像データ出力部１１３が、翻訳後の画像データ２０を出力する（ステップＳ１１３）。出力された画像データ２０は、ユーザにより指定された保存先へ画像ファイルとして保存されてよい。

【0069】

その後、例えば、画像翻訳装置１００全体を制御する制御部（ＣＰＵ（Central Processing Unit）やＧＰＵ（Graphics Processing Unit）等）により本動作を終了するか否かが判断され（ステップＳ１１４）、終了する場合（ステップＳ１１４のＹＥＳ）、本動作が終了される。

【0070】

一方、終了しない場合（ステップＳ１１４のＮＯ）、例えば、制御部により、同一の画像データ１０を他の言語に翻訳するか、もしくは、他の画像データを翻訳するかが判断される（ステップＳ１１５）。なお、この判断は、ユーザからの指示に基づいて実行されてもよい。

【0071】

翻訳対象の画像データを変更する場合（ステップＳ１１５のＮＯ）、本動作がステップＳ１０１へ戻り、以降の動作が実行される。一方、同一の画像データをステップＳ１０７で設定された言語とは異なる言語に翻訳する場合（ステップＳ１１５のＹＥＳ）、本動作がステップＳ１０７へ戻り、以降の動作が実行される。

【0072】

以上のような構成及び動作を備えることで、本実施形態によれば、ユーザへ与える印象の変化を抑制しつつ、ある言語のテキストを含む画像データを他の言語のテキストを含む画像データに自動翻訳することが可能となる。それにより、画像データを容易に複数の言語に翻訳することが可能となるため、ある国で製作されたコンテンツを他の国へ展開する際の時間や手間やコストを大幅に削減することが可能となる。

【0073】

図２２及び図２３は、本実施形態に係る画像翻訳装置を用いて翻訳された画像データの例を示す図である。図２２に示す例では、（Ａ）に示す翻訳前の画像データ３０は、（Ｂ）に示すように、「初回購入報酬」というテキストを含むテキストレイヤ３１と、ラッピングされたプレゼントのピクセル画を含む通常レイヤ３２と、２人のフィールドプレイヤのピクセル画を含む通常レイヤ３３とが重ねられたレイヤ構造を備えている。

【0074】

この重ね合わせにおいて、テキスト「初回購入報酬」は、２人のフィールドプレイヤのピクセル画とは重畳しないように配置されているものの、ラッピングされたプレゼントのピクセル画との重畳は許容されている。したがって、（Ｃ）に示すように、翻訳後のテキストレイヤ４１では、「初回購入報酬」の訳文である「ＦｉｒｓｔＰｕｒｃｈａｓｅＰａｃｋ」が、２人のフィールドプレイヤのピクセル画と重畳しないように２行に改行される。それにより、（Ｄ）に示すように、ラッピングされたプレゼントのピクセル画とは重畳し且つ２人のフィールドプレイヤのピクセル画とは重畳しないように配置された翻訳後のテキスト「ＦｉｒｓｔＰｕｒｃｈａｓｅＰａｃｋ」を含む画像データ４０が生成される。

【0075】

また、図２３に示す例では、（Ａ）に示す翻訳前の画像データ５０は、（Ｂ）に示すように、「ダイヤパス」というテキストを含むテキストレイヤ５１と、複数のダイヤモンドのピクセル画を含む通常レイヤ５２と、２人のフィールドプレイヤのピクセル画を含む通常レイヤ５３とが重ねられたレイヤ構造を備えている。このうち、複数のダイヤモンドのピクセル画を含む通常レイヤ５２は、それぞれ１つ以上のダイヤモンドのピクセル画を含む複数の通常レイヤで構成されたレイヤグループであってもよい。

【0076】

この重ね合わせにおいて、テキスト「ダイヤパス」は、２人のフィールドプレイヤのピクセル画とは重畳しないように配置されているものの、複数のダイヤモンドのピクセル画との重畳は許容されている。また、「ダイヤパス」とその訳文である「ＧｅｍＰａｓｓ」とは、文字数の変化が小さい。そこで、（Ｃ）に示すように、翻訳後のテキストレイヤ６１では、「ダイヤパス」の訳文である「ＧｅｍＰａｓｓ」の領域が、翻訳前のテキスト「ダイヤパス」の領域と同程度となるように、「ＧｅｍＰａｓｓ」のフォント、文字サイズ及び装飾のうちの１つ以上が調整される。それにより、（Ｄ）に示すように、翻訳前の画像データ５０における「ダイヤパス」と同程度の領域に「ＧｅｍＰａｓｓ」が配置された画像データ６０が生成される。

【0077】

上述してきた実施形態に係る画像翻訳装置１００は、例えば図２４に示すような構成の情報処理装置１０００によって実現され得る。図２４は、本実施形態に係る画像翻訳装置の各部の機能を実現する情報処理装置の一例を示すハードウエア構成図である。情報処理装置１０００は、ＣＰＵ１１００、ＧＰＵ１１５０、ＲＯＭ（Read Only Memory）１２００、ＲＡＭ（Random Access Memory）１３００、記録装置１４００、入出力インタフェース（Ｉ／Ｆ）１５００、及び、通信部１６００を有する。情報処理装置１０００の各部は、バス１７００によって接続される。

【0078】

ＣＰＵ１１００は、ＲＯＭ１２００又は記録装置１４００に格納されたプログラムに基づいて動作し、各部の制御を行う。例えば、ＣＰＵ１１００は、ＲＯＭ１２００又は記録装置１４００に格納されたプログラムをＲＡＭ１３００に展開し、各種プログラムに対応した処理を実行する。

【0079】

ＧＰＵ１１５０は、ＣＰＵ１１００と同様に、ＲＯＭ１２００又は記録装置１４００に格納されたプログラムに基づいて動作し、各部の制御を行う。例えば、ＧＰＵ１１５０は、ＲＯＭ１２００又は記録装置１４００に格納されたプログラムをＲＡＭ１３００に展開し、各種プログラムに対応した処理を実行する。その際、ＧＰＵ１１５０は、ＣＰＵ１１００と連携して各部の制御を実行してもよい。

【0080】

ＲＯＭ１２００は、情報処理装置１０００の起動時にＣＰＵ１１００によって実行されるＢＩＯＳ（Basic Input Output System）等のブートプログラムや、情報処理装置１０００のハードウエアに依存するプログラム等を格納する。

【0081】

記録装置１４００は、ＣＰＵ１１００によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を非一時的に記録する、コンピュータが読み取り可能な記録媒体である。具体的には、記録装置１４００は、プログラムデータの一例である本開示に係る各動作を実行するためのプログラムを記録する記録媒体である。

【0082】

通信部１６００は、情報処理装置１０００が外部ネットワーク１６５０（例えばインターネット）と接続するためのインタフェースである。例えば、ＣＰＵ１１００は、通信部１６００を介して、他の機器からデータを受信したり、ＣＰＵ１１００が生成したデータを他の機器へ送信したりする。

【0083】

入出力Ｉ／Ｆ１５００は、入出力デバイス１６５０と情報処理装置１０００とを接続するためのインタフェースである。例えば、ＣＰＵ１１００は、入出力Ｉ／Ｆ１５００を介して、キーボードやマウス等の入力デバイスからデータを受信する。また、ＣＰＵ１１００は、入出力Ｉ／Ｆ１５００を介して、ディスプレイやスピーカやプリンタ等の出力デバイスにデータを送信する。また、入出力Ｉ／Ｆ１５００は、所定の記録媒体に記録されたプログラム等を読み取るメディアインタフェースとして機能してもよい。

【0084】

例えば、情報処理装置１０００が上述の実施形態に係る画像翻訳装置１００として機能する場合、情報処理装置１０００のＣＰＵ１１００は、ＲＡＭ１３００上にロードされたプログラムを実行することにより、画像データ入力部１０１、レイヤ構造解析部１０２、イメージ領域特定部１０３、テキストデータ解析部１０４、テキスト領域特定部１０５、翻訳元言語特定部１０６、翻訳先言語設定部１０７、翻訳部１０８、テキストレイヤ更新部１０９、テキスト領域調整部１１１、画像データ再構成部１１２、画像データ出力部１１３及び制御部の機能を実現してもよい。また、記録装置１４００には、本開示に係るプログラム等が格納されてもよい。なお、ＣＰＵ１１００は、プログラムデータを記録装置１４００から読み取って実行するが、他の例として、外部ネットワーク１６５０を介して、他の装置からこれらのプログラムを取得してもよい。

【0085】

また、本実施形態に係る画像翻訳装置１００は、ユーザ側においてスタンドアローンで動作する構成であってもよいし、図２５に例示するように、その機能（画像データ入力部１０１、レイヤ構造解析部１０２、イメージ領域特定部１０３、テキストデータ解析部１０４、テキスト領域特定部１０５、翻訳元言語特定部１０６、翻訳先言語設定部１０７、翻訳部１０８、テキストレイヤ更新部１０９、テキスト領域調整部１１１、画像データ再構成部１１２、画像データ出力部１１３、制御部等）の一部又は全部がネットワーク２３００上のサーバ２１００に配置されたサーバ・クライアント型のシステム構成であってもよい。その場合、ユーザは、ネットワーク２３００に接続されたクライアント２２００Ａ、２２００Ｂ、…からサーバ２１００へアクセスし、対象の画僧データを翻訳する。なお、サーバ２１００は、単一のサーバで構成された集中型システムであってもよし複数のサーバで構成された分散型システムであってもよいしクラウドサーバなどであってもよい。

【0086】

以上、本開示の実施形態及びその変形例について説明したが、本開示の技術的範囲は、上述の実施形態又はその変形例そのままに限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。また、異なる実施形態及び変形例にわたる構成要素を適宜組み合わせてもよい。

【0087】

また、本明細書に記載された実施形態及びその変形例における効果はあくまで例示であって限定されるものでは無く、他の効果があってもよい。

【符号の説明】

【0088】

１００画像翻訳装置
１０１画像データ入力部
１０２レイヤ構造解析部
１０３イメージ領域特定部
１０４テキストデータ解析部
１０５テキスト領域特定部
１０６翻訳元言語特定部
１０７翻訳先言語設定部
１０８翻訳部
１０９テキストレイヤ更新部
１１１テキスト領域調整部
１１２画像データ再構成部
１１３画像データ出力部

【図1】