特許5712612 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 凸版印刷株式会社の特許一覧

特許5712612電子文書変換装置及び電子文書変換方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】5712612

(24)【登録日】2015年3月20日

(45)【発行日】2015年5月7日

(54)【発明の名称】電子文書変換装置及び電子文書変換方法

(51)【国際特許分類】

G06F 17/21 20060101AFI20150416BHJP

G06F 3/12 20060101ALI20150416BHJP

【ＦＩ】

G06F17/21 670

G06F3/12 V

【請求項の数】11

【全頁数】16

(21)【出願番号】特願2010-292849(P2010-292849)

(22)【出願日】2010年12月28日

(65)【公開番号】特開2012-141703(P2012-141703A)

(43)【公開日】2012年7月26日

【審査請求日】2013年11月21日

(73)【特許権者】

【識別番号】000003193

【氏名又は名称】凸版印刷株式会社

(74)【代理人】

【識別番号】110001243

【氏名又は名称】特許業務法人谷・阿部特許事務所

(74)【復代理人】

【識別番号】100115624

【弁理士】

【氏名又は名称】濱中淳宏

(74)【復代理人】

【識別番号】100173749

【弁理士】

【氏名又は名称】山下真由美

(72)【発明者】

【氏名】佐藤利隆

(72)【発明者】

【氏名】檀上英利

(72)【発明者】

【氏名】江幡雅紀

(72)【発明者】

【氏名】上沢英臣

(72)【発明者】

【氏名】赤秀有為

【審査官】長由紀子

(56)【参考文献】

【文献】特開２０１０−２５０５８５（ＪＰ，Ａ）

【文献】特開平０８−０９５９６２（ＪＰ，Ａ）

【文献】田中秀明，電子書籍・スマートフォン技術解説電子書籍フォーマットＸＭＤＦｖ３．０について，シャープ技報，日本，シャープ株式会社，２０１１年２月１０日，第102号，p.17-21

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ０６Ｆ１７／２０−２８

Ｇ０６Ｆ３／１２

(57)【特許請求の範囲】

【請求項1】

電子文書と、該電子文書に関連する関連画像とを含む文書データを取得する電子文書データ取得手段と、
前記電子文書を表示する表示手段の表示画面領域を示すデータを含む表示領域プロファイル・データを取得するプロファイル・データ取得手段と、
前記表示領域プロファイル・データに基づいて前記文書データを前記表示手段に適した複数のページに変換し、前記電子文書を表示する前記変換された複数のページの各々に前記関連画像を配置するページ変換手段と
を備えたことを特徴とする電子文書変換装置。

【請求項2】

前記ページ変換手段は、前記電子文書を表示する前記変換された複数のページの各々のページの中の同じ位置に前記関連画像を配置することを特徴とする請求項１に記載の電子文書変換装置。

【請求項3】

前記ページ変換手段は、
前記文書データのオリジナルの誌面における前記関連画像が配置されるページ範囲を決定する手段と、
前記決定したオリジナルの誌面におけるページ範囲を複数の領域に分割する手段と、
前記複数の領域の中から前記関連画像の中心点が位置する領域を識別する手段と、
１ページ分の変換領域を、前記ページ範囲を分割するのと同様に複数の領域に分割する手段と、
前記変換領域の各々のページにおいて、前記関連画像の中心点が位置する領域に対応する領域に前記関連画像を配置する手段と
を備えたことを特徴とする請求項１又は２に記載の電子文書変換装置。

【請求項4】

前記ページ変換手段は、前記表示手段において２ページ目以降に表示されるページに、最初のページとは異なるサイズの前記関連画像を配置することを特徴とする請求項１から３のいずれかに記載の電子文書変換装置。

【請求項5】

前記ページ変換手段は、前記電子文書データに複数の関連画像が含まれている場合に、ページごとに関連画像を切り替えて配置することを特徴とする請求項１から４のいずれかに記載の電子文書変換装置。

【請求項6】

前記ページ変換手段は、変換領域のうちの最後のページを起点として、前記電子文書を構成する最後のコンテンツ要素から最初のコンテンツ要素に向けて該電子文書のコンテンツ要素を、前記関連画像が配置された前記変換領域に配置すること、および、前記変換領域のうちの最初のページにおいて、前記電子文書が配置されていない領域に応じて前記関連画像を拡大することを特徴とする請求項１から５のいずれかに記載の電子文書変換装置。

【請求項7】

前記関連画像は、前記電子文書についてのテーマを表すテーマ画像であることを特徴とする請求項１から６のいずれかに記載の電子文書変換装置。

【請求項8】

前記関連画像は、前記電子文書のコンテンツを表すコンテンツ画像であることを特徴とする請求項１から６のいずれかに記載の電子文書変換装置。

【請求項9】

電子文書変換装置が実行する方法であって、
電子文書と、該電子文書に関連する関連画像とを含む文書データを取得する電子文書データ取得ステップと、
前記電子文書を表示する表示手段の表示画面領域を示すデータを含む表示領域プロファイル・データを取得するプロファイル・データ取得ステップと、
前記表示領域プロファイル・データに基づいて前記文書データを前記表示手段に適した複数のページに変換し、前記電子文書を表示する前記変換された複数のページの各々に前記関連画像を配置するページ変換ステップと
を備えることを特徴とする電子文書変換方法。

【請求項10】

前記ページ変換ステップは、
前記文書データのオリジナルの誌面における前記関連画像が配置されるページ範囲を決定するステップと、
前記決定したオリジナルの誌面におけるページ範囲を複数の領域に分割するステップと、
前記複数の領域の中から前記関連画像の中心点が位置する領域を識別するステップと、
１ページ分の変換領域を、前記ページ範囲を分割するのと同様に複数の領域に分割するステップと、
前記変換領域の各々のページにおいて、前記関連画像の中心点が位置する領域に対応する領域に前記関連画像を配置するステップと
を備えることを特徴とする請求項９に記載の電子文書変換方法。

【請求項11】

請求項９又は１０に記載の電子文書変換方法をコンピュータに実行させるためのプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、雑誌記事や書籍記事などの電子文書についての電子文書変換装置及び電子文書変換方法に関し、より詳細には、例えば雑誌向けなどのように比較的大きい誌面の領域で表示されるように作成された文書データを、より狭い領域の表示領域を有する電子機器で表示するように変換する電子文書変換装置及び電子文書変換方法に関する。

【背景技術】

【0002】

携帯用の電子機器として、スマートフォンやタブレット型コンピュータの普及が進んでいる。そしてこのような電子機器を用いて電子書籍を閲覧するサービスが提供されている。電子機器で電子書籍の各ページを閲覧する際には、表示画面に組み込まれたタッチセンサを用いてユーザが操作指示を行う。例えばタッチセンサ上にユーザがタッチして電子機器に対してページめくりの指示をすると、次のページが電子機器の画面上に表示されることになる。

【0003】

電子書籍のデータを作成するためのアプリケーション・ソフトウェアも普及しつつあり、ＤＴＰ（Desktop publishing）用に作成されたデータや、他のドキュメント形式で作成されたデータを用いて電子書籍のデータを作成することが行われている。

【0004】

また、電子書籍用のデータ形式としては、ｅＰｕｂ、ＰＤＦ（Portable Document Format）、ｘｍｄｆ、ｂｏｏｋなどの拡張子を用いる形態が広まっている。

【0005】

上記のような電子機器は、一般的な雑誌の誌面と比較して表示領域が狭いので、雑誌向けなどに作成された記事を携帯用の電子機器の画面上に表示させる場合には、その記事の文書データを電子機器の表示領域に合わせて変換する処理が行われている。

【0006】

この種の変換としては従来２通りの方法が用いられている。第１の方法では、オリジナルの記事ページをそのまま縮小して表示するように変換する。例えば、非特許文献１に開示されているＭＡＧＡＳＴＯＲＥ（登録商標）というアプリケーション・ソフトウェアでは、オリジナルの記事のそのままデジタル化して拡大したり縮小したりして表示する。第２の方法では、テキスト・データや画像データを、電子機器の画面上で視認可能なフォントサイズに変換して表示する。例えば、特許文献１では携帯用の電子機器用にＨＴＭＬ（HyperText Markup Language）ページを分割変換することで携帯用の電子機器では表示できなかったページを閲覧する方法が開示されている。

【先行技術文献】

【特許文献】

【0007】

【特許文献1】特開２００１−１９５３９１号公報

【非特許文献】

【0008】

【非特許文献1】“ＭＡＧＡＳＴＯＲＥの使い方”、［online］、［平成２２年１１月１７日検索］、インターネット＜URL：http://www.magastore.jp/help/howto＞

【発明の概要】

【発明が解決しようとする課題】

【0009】

電子機器の表示領域は狭いので、上記の第１の方法のように雑誌などの記事の電子文書をそのまま縮小して表示する場合には、記事に含まれるテキスト・データや画像データがそのまま縮小されてしまう。このため、拡大処理をその都度行わなければ記事の中身を確認することができないという問題がある。そこで、上記の第２の方法のようにデータを電子機器の画面上で視認可能なフォントサイズで表示するように変換することが考えられる。

【0010】

しかしながら、上記の第２の方法は、視認可能なフォントサイズで、記事を単に電子機器の表示領域に合わせて嵌め込んでいくに過ぎず、元の１ページの記事は複数ページに分割されて表示されることとなる。従って、雑誌などの記事を作成した作者の意図を正確に反映することができないという課題がある。

【0011】

雑誌などの記事には、記事本文とは直接的に関係ないが、その記事のイメージを読者に想起させるためのイラストや写真などの画像が含まれている場合がある。これらの画像のことを本明細書では「テーマ画像」と称する。このテーマ画像は、概ね記事の中の見やすい部分に配置されており、記事の作者は、読者がこのテーマ画像を一瞥しながら記事の内容を読んでくれるだろうという意図で用いている。従って、テーマ画像というものは読者がその記事を読んでいる間は何かしらの形で参照できるような状態であることが作者の意図に即している。

【0012】

また、雑誌などの記事には記事本文と直接的に関係するイラストや写真などの画像が含まれている場合がある。例えば、記事本文から参照される画像や記事本文を説明する画像である。これらの画像のことを本明細書では「コンテンツ画像」と称する。通常、このコンテンツ画像は記事全体の中で関係する文章の箇所に近接した場所に配置される。つまり、このコンテンツ画像を参照しながら記事中の対応する箇所の文章を読者が読んでくれるだろうという意図で、記事の作者はコンテンツ画像を配置している。従って、コンテンツ画像というものは、読者が記事本文の中で対応する文章を読んでいる間は何かしらの形で参照できるような状態であることが作者の意図に即している。

【0013】

これらのテーマ画像とコンテンツ画像は、電子文書に関連する画像であるので、以下ではこれらを「関連画像」と総称する。

【0014】

ここで、上記の第２の方法では、単に複数ページに分割されて表示されることとなるに過ぎず、変換された複数ページの中の１つのページにのみにしか関連画像を表示することができないという問題がある。

【0015】

本発明は、関連画像と共に視認されることが意図された電子文書を含む文書データをその意図を反映した形で変換する電子文書変換装置及び電子文書変換方法を提供することを目的とする。

【課題を解決するための手段】

【0016】

上記の課題を解決するために、本発明に係る電子文書変換装置は、電子文書と、該電子文書に関連する関連画像とを含む文書データを取得する電子文書データ取得手段と、前記電子文書を表示する表示手段の表示画面領域を示すデータを含む表示領域プロファイル・データを取得するプロファイル・データ取得手段と、前記表示領域プロファイル・データに基づいて前記文書データを前記表示手段に適した複数のページに変換し、前記電子文書を表示する複数のページの各々に前記関連画像を配置するページ変換手段とを備えたことを特徴とする。

【発明の効果】

【0017】

本発明によれば、複数のページの各々に関連画像が配置され得るので、記事のような電子文書をその意図を反映した状態で電子機器での表示に適したデータに変換することができる。

【図面の簡単な説明】

【0018】

【図1】本発明に係るシステム構成例を示す図である。

【図2】本発明に係る電子文書変換装置のブロックを示す図である。

【図3】本発明に係るオリジナルの誌面のレイアウトを示す図である。

【図4】本発明に係る変換処理の流れを示すフローチャートである。

【図5】本発明に係るテーマ画像の配置位置の決定方法を説明するための図である。

【図6】本発明に係る変換領域における変換の遷移の例を示す図である。

【図7】本発明に係る変換領域における変換の遷移の他の例を示す図である。

【発明を実施するための形態】

【0019】

本発明に係る実施形態を説明する前に、まず本明細書における「関連画像」に含まれる「テーマ画像」と「コンテンツ画像」の定義について説明する。

【0020】

「テーマ画像」とは雑誌記事や書籍記事の電子文書に含まれる写真やイラスト等の画像のことであり、電子文書についてのテーマを表す画像のことである。このテーマ画像は、本明細書では、記事本文などのような電子文書のコンテンツを構成する「コンテンツ画像」とは明確に区別される。コンテンツ画像は電子文書のコンテンツの一要素として読者に視覚認識されるべきものである。一方、テーマ画像は記事本文などのような電子文書のコンテンツの印象やイメージを象徴する補完的役割を担うものである。テーマ画像の定義としては例えば次の２つが挙げられる。
（１）その画像に対してキャプションが無いこと
（２）その画像に対して電子文書のコンテンツから参照が無いこと
なお、画像中にクレジットが付されているものについては、テーマ画像として扱うものとすることができる。

【0021】

これに対して、「コンテンツ画像」の定義としては、例えば「テーマ画像」とは逆に、
（１）その画像に対してキャプションがあること
（２）その画像に対して電子文書のコンテンツから参照があること
とすることができる。

【0022】

以降で説明する実施形態においては、文書データに含まれるデータの中で、関連画像を除いたものを「電子文書」として説明する。また、テーマ画像との区別を明確にする目的で、文書データに含まれるデータの中でテーマ画像を除いたものを「電子文書のコンテンツ」として説明する場合もある。「電子文書のコンテンツ」には電子文書のコンテンツ画像も含まれ得る。

【0023】

以下に、本発明の実施の形態を説明する。なお、本発明はこれら実施の形態に何ら限定されるものではなく、その要旨を逸脱しない範囲において、種々なる態様で実施し得る。

【0024】

＜実施形態１＞
以下図面を参照しながら実施形態１について説明する。なお、実施形態１においては、関連画像はテーマ画像であるものとして説明する。関連画像がコンテンツ画像である場合の例については、後述する実施形態５において説明する。

【0025】

図１は電子機器１１と電子文書変換装置１２とを含むシステムを示す図である。図１（ａ）では、電子文書変換装置１２は出版社側システム（出版社のサーバなどを含むシステム）１５に含まれており、データベース（ＤＢ）１３から雑誌記事や書籍記事などのオリジナルの誌面に用いられる文書データが入力される。電子文書変換装置１２は入力された文書データを用いて文書データを電子機器１１用のデータ・ファイルに変換する。そして、変換された電子機器１１用のデータ・ファイルは、電子書籍販売サイト１４に格納される。電子機器１１のユーザはネットワーク１０を介してこのデータ・ファイルをダウンロードして、テーマ画像と電子文書とを電子機器１１のディスプレイに表示する。

【0026】

図１（ｂ）は図１（ａ）の変形例であり、電子文書変換装置１２が電子書籍販売サイト１４に含まれる例を示している。この場合、出版社側システム１５のＤＢ１３から文書データが電子書籍販売サイト１４に送られ、この電子書籍販売サイト１４において後述する変換処理が行われる。図１（ｃ）は図１（ａ）の別の変形例であり、電子文書変換装置が電子機器１１内に含まれる例を示している。この場合、電子書籍販売サイト１４からは通常の文書データがネットワーク１０を介して電子機器１１に送られ、電子機器１１にて後述する変換処理が行われることになる。

【0027】

図２は、電子文書変換装置１２のブロック図である。電子文書変換装置１２は、電子文書データ取得部２０１と、画像識別部２０２と、プロファイル・データ取得部２０３と、変換規則データ取得部２０４と、ページ変換部２０５とを含む。電子文書変換装置１２には、関連画像としてのテーマ画像を含む文書データ２０ａが入力される。また、電子文書変換装置１２からは、電子機器１１に適したページに変換されたデータ・ファイル２０ｂが出力される。

【0028】

図２に示す各部は、ハードウエア、ソフトウエア、ハードウエアとソフトウエアの両者、のいずれかによって構成される。例えば、これらを実現する一例として、コンピュータを利用する場合には、ＣＰＵ、メモリ、バス、インターフェイス、周辺装置などから構成されるハードウエアと、これらのハードウエア上にて実行可能なソフトウエアを挙げることができる。具体的には、ＣＰＵがメモリ上に展開されたプログラムを順次実行することで、メモリ上のデータや、インターフェイスを介して入力されるデータの加工、蓄積、出力などにより各部の機能が実現される（本明細書の全体を通じて同様である）。

【0029】

電子文書データ取得部２０１は、電子文書変換装置１２に入力された文書データ２０ａを取得する。例えば、電子文書データ取得部２０１は、ネットワークインタフェースを介して外部の装置から文書データを取得したり、バスインタフェースを介して電子文書変換装置１２内のハードディスクから文書データを取得したりする。

【0030】

図３に、文書データ２０ａによって表されるオリジナルの雑誌記事の誌面の一例を示す。３０１は１ページで構成された記事を示し、かつその記事３０１の中に１つのテーマ画像３０２が含まれている。３０３は２ページに跨って構成された記事を示し、かつその記事３０３の中に１つのテーマ画像３０４が含まれている。

【0031】

次に、文書データ２０ａの中に含まれるテーマ画像を識別する方法について説明する。この識別処理は、画像識別部２０２において行われる。文書データ２０ａの形態としては、例えば（１）ＸＭＬ形式で記述された構造化データ、（２）雑誌用に作成されたＤＴＰデータ、（３）スキャナで読み込んだ文書画像データが考えられる。

【0032】

ＸＭＬ形式で記述された構造化データは、タグを用いることで要素に意味付けを行うことが可能である。従って、データ構造を参照して例えば「theme image」というタグが付された画像をテーマ画像として識別することができる。または、画像近傍にキャプションを示すタグが付されていない画像をテーマ画像として識別することができる。

【0033】

雑誌用に作成されたＤＴＰデータは、上記のような要素の意味付けがなされていないデータである。そこで、ＤＴＰデータによって表されるオリジナルの雑誌誌面の画面イメージをユーザに表示する。そして、ユーザからどの画像がテーマ画像であるかを指定されることによって、その画像をテーマ画像として識別することができる。あるいは、画像オブジェクトの近傍に他の文章のフォントとは異なるフォントで記述された文章が配置されている場合には、その文章をキャプションと判断し、その画像オブジェクトはキャプションが付された画像であると判定して、その画像オブジェクトについてはテーマ画像として識別しないこともできる。さらには、電子文書のコンテンツから参照されていない画像オブジェクトをテーマ画像として識別することができる。例えば、文書データに含まれるテキストオブジェクトの中のテキスト・データを検索して「写真は」という文言や、「（写真参照）」といった画像を参照する文字が含まれておらず、かつ、画像オブジェクトが存在する場合には、その画像をテーマ画像と識別することもできる。

【0034】

スキャナで読み込んだ文書画像データについては、ＯＣＲ（Optical Character Reader）を用いることで文書の内容を取得することができる。また、読み取った文書データの濃度を参照するなどして文書領域と画像領域とを特定することができる。特定した領域について、上記のＤＴＰデータの場合と同様にユーザからの指定によって、あるいは、画像領域の近傍のフォントを参照するなどして、ある画像領域の画像をテーマ画像として識別することができる。

【0035】

以上の説明は例示であり、他の手法によってテーマ画像を識別してもよいことはもちろんである。

【0036】

表示領域プロファイル・データ取得部２０３は、電子文書を表示する表示手段の表示画面領域を示すデータを含む表示領域プロファイル・データを取得する。表示領域プロファイル・データは、例えば電子機器１１のディスプレイのサイズや、解像度などを規定するデータである。表示領域プロファイル・データは電子文書変換装置１２のハードディスクに記憶されていたものを取得してもよいし、ネットワークインタフェースを介して外部の装置から取得してもよい。ここでいう表示手段は、例えばスマートフォンやタブレット型コンピュータなどの電子機器１１のディスプレイである。電子機器１１の表示領域の一例としては、画面面積が約３８ｃｍ²のサイズが挙げられる。このサイズは雑誌などのＡ４サイズの誌面の面積約６２４ｃｍ²の面積比約１／１６の小さいサイズとなる。

【0037】

変換規則データ取得部２０４は、電子機器１１の表示領域に変換する際に人間の視認特性を元にした変換規則データを取得する。変換規則データは、変換される記事のフォントや関連画像の配置位置を規定するものである。変換規則データは電子文書変換装置１２のハードディスクに記憶されていたものを取得してもよいし、ネットワークインタフェースを介して外部の装置から取得してもよい。

【0038】

ページ変換部２０５は、表示領域プロファイル・データに基づいて文書データ２０ａを電子機器１１の表示手段に適したデータ・ファイル２０ｂに変換する処理を行う。上述したように電子機器１１は、表示可能な領域が限られるので、雑誌などの誌面領域よりも小さい表示領域で電子文書のコンテンツが複数のページに跨って表示されることになる。ページ変換部２０５においては、表示領域プロファイル・データに基づいて文書データを表示手段に適した複数のページに変換し、電子文書のコンテンツを表示する複数のページのそれぞれにテーマ画像を配置する処理が行われる。

【0039】

ページ変換部２０５における変換後に出力されるファイル形式は、ｅＰｕｂ、ＰＤＦ、ｘｍｄｆ、ｂｏｏｋなどである。これらはページ単位でデータが構成されているものとする。ｅＰｕｂやｘｍｄｆなどの構造化データ形式においてはページ区切りをすることで複数のページを有するデータに変換することができる。例えば、ｅＰｕｂ形式のものでは、実際のコンテンツを表すＨＴＭＬファイルを１ページ毎のファイルに分割して、各ページを表すＨＴＭＬファイルの関係をｏｐｆファイルで定義し、これらのファイルを含むｅＰｕｂファイルを作成することでページ単位のデータ変換を実現することができる。ＰＤＦデータの場合には例えば上記のｅＰｕｂファイルで表示されるデータをＰＤＦデータに変換する処理を行うことができる。

【0040】

次に、ページ変換部２０５における処理について、図４のフローチャートを参照しながら説明する。図４のフローチャートは、例えば、電子文書変換装置１２のメモリに展開されたプログラムをＣＰＵが実行することによって行われる。

【0041】

まず、文書データ２０ａに含まれ、かつ画像識別部２０２によって識別されたテーマ画像のページ範囲を決定する（Ｓ４０１）。この処理は、Ａ４サイズの誌面のようなオリジナルの雑誌の誌面上において、テーマ画像が１ページ内に配置されるのか、または複数のページに跨って配置されるのかを決定する。このため、まず、文書データ２０ａを展開して、図３で示すようなオリジナルの誌面レイアウトを再現する。そして、テーマ画像が複数のページに跨るのか否かを決定する。この結果はメモリに一時的に保存される。図３に示したようにオリジナルの誌面において、図３（ａ）に示すようにテーマ画像は１つのページ内に配置されている場合もあれば、図３（ｂ）に示すように２ページに跨って配置されている場合もある。

【0042】

次に、Ｓ４０１で識別したテーマ画像のページ範囲の中のコンテンツ範囲を決定する（Ｓ４０２）。コンテンツ範囲とは、電子文書のコンテンツがどこから始まって、どこで終了するかを示す範囲である。このコンテンツ範囲内に記載されている電子文書のコンテンツが含まれる全てのページにテーマ画像が配置されることになる。文書データ２０ａが１つの電子文書（例えば１つの記事）に対して１つのファイルで構成されている場合には、そのファイルで表される範囲がテーマ画像のコンテンツ範囲となる。また、文書データ２０ａが構造化データ形式の電子文書データの場合には、タグによって表されるテーマ画像が含まれる電子文書の開始部分と終了部分とに囲まれる部分がテーマ画像のコンテンツ範囲となる。文書データ２０ａが構造化データ形式でない場合には、ユーザ入力によってどの部分までがテーマ画像のコンテンツ範囲であるかを決定する。決定されたコンテンツ範囲内に記載されている電子文書のコンテンツはメモリに一時的に格納される。

【0043】

次に、図３のオリジナルの誌面におけるテーマ画像のコンテンツ範囲の中で、最初のコンテンツ要素と最後のコンテンツ要素とを決定する。コンテンツ要素は、基本的には本文の文字となるが、図表や写真などの画像についてもコンテンツ要素となり得る。コンテンツ要素の単位としては、文字の場合には１文字とし、画像の場合には１画像とすることができる。すなわち、取り扱うことのできる最小単位とすることができる。図３の例では、３ａが最初のコンテンツ要素であり、３ｂが最後のコンテンツ要素である。識別された最初のコンテンツ要素３ａと最後のコンテンツ要素３ｂを示す情報についてもメモリに一時的に格納される。

【0044】

次に、オリジナルの誌面におけるテーマ画像の配置位置を識別する（Ｓ４０３）。本実施形態においては、オリジナルの誌面におけるテーマ画像の配置位置と、変換後の各ページにおけるテーマ画像の配置位置とが全体として対応する位置になるようにする。これは、オリジナルの誌面レイアウトを考えて適切な位置に配置したテーマ画像を全体として対応する位置に配置することで作者の意図を適切に反映するためである。そこで、まず、Ｓ４０３においてはオリジナルの誌面の状態でテーマ画像がどの位置に配置されているのかを識別する処理が行われる。

【0045】

図５はオリジナルの誌面におけるテーマ画像の配置位置を識別する方法を説明するための図である。本実施形態においては、まず、オリジナルの誌面におけるページ範囲内で、上下に２等分割し、左右に２等分割する。すなわち、オリジナルの誌面を４つの領域に分割する。次に、テーマ画像の中心点を識別し、その中心点が上記４つの領域のどこに位置するかを識別する。中心点は、画像の矩形の２本の対角線の交点とする。図５（ａ）のオリジナルの誌面５０１はテーマ画像のページ範囲が１ページの場合を示しており、テーマ画像の中心点５０２は右上の領域に位置している。図５（ｂ）のオリジナルの誌面５０３はテーマ画像のページ範囲が２ページに跨っている場合を示している。この場合においても２ページ全体を４つの領域に分割した場合には、テーマ画像の中心点５０４は左上の領域に位置していると識別することができる。中心点の位置は、メモリに一時的に格納される。

【0046】

なお、図５に示す例においては、テーマ画像の中心点が４つの領域のいずれかに位置していることが識別できている。しかしながら、中心点が分割線上に位置する場合も想定される。このような場合には、変換規則データ取得部２０４にて取得した変換規則データに従って配置位置を決定することができる。例えば、記事を読まれる順に優先度を設ける規則とする。すなわち、縦書きの場合には、右上、左上、右下、左下の順に優先度を設け、横書きの場合には、左上、右上、左下、右下の順に優先度を設けることができる。

【0047】

次に、変換領域を確保する（Ｓ４０４）。この処理は、表示領域プロファイル・データに含まれる表示画面領域をメモリ上に確保する処理に相当する。

【0048】

次に、Ｓ４０４で確保した変換領域にテーマ画像を配置する（Ｓ４０５）。図６は、変換領域における変換の遷移を示す図である。図６においては、テーマ画像がオリジナル誌面の１ページに含まれる場合の例を示している。図６（ａ）は１ページ分の変換領域６０１を示す。オリジナルの誌面の時と同様に、変換領域についても上下に２等分割、左右に２等分割をして、４つの領域に分割する。そして、図６（ｂ）に示すように、Ｓ４０３で識別したオリジナルの電子文書の誌面における配置位置に対応する領域６０２にテーマ画像を配置する。図６（ｂ）は図５（ａ）と同様に右上の領域にテーマ画像が配置される例を示している。

【0049】

なお、テーマ画像を配置する場合には、縦横比を維持したまま、配置される領域内で横幅いっぱいに調整した状態でテーマ画像を配置する。そして、領域の縦幅内にテーマ画像が収まった場合は、領域内の上下方向の中央にテーマ画像を配置する。領域の縦幅内にテーマ画像が収まらなかった場合は、縦横比を維持したまま領域内で縦幅いっぱいにテーマ画像を調整して配置する。このようにして、変換領域におけるテーマ画像の配置位置とサイズが決定される。

【0050】

次に、Ｓ４０５でテーマ画像が配置された変換領域６０１に電子文書のコンテンツを配置する（Ｓ４０６）。この処理は、テーマ画像を配置した各ページの残りの領域に、電子文書のコンテンツをいわば流し込む処理である。図６（ｃ）は複数のページに跨ってテーマ画像６０２が配置されると共に、電子文書のコンテンツが配置された例を示している。このコンテンツは、テーマ画像を配置した変換領域においてテーマ画像を回り込む形で、Ｓ４０２で決定した最初のコンテンツ要素３ａから最後のコンテンツ要素３ｂまで順次配置される。ここでコンテンツ要素に対して設定する文字フォント属性は、変換規則データ取得部２０４にて取得した変換規則データに従って設定される。例えば、フォントとして一律８ｐｔの文字サイズを設定することができる。

【0051】

図７は、テーマ画像がオリジナル誌面の２ページに跨って含まれる場合の例を示している。図７（ａ）は図６（ａ）と同様に１ページ分の変換領域７０１を示している。図７（ｂ）では、図５（ｂ）のテーマ画像の中心点５０４が全体として左上の領域に位置しているので、テーマ画像７０２が左上の領域に配置される例を示している。なお、２ページに跨っていたテーマ画像を縦横比を維持したまま縮小しているので、図６（ｂ）の場合よりも画像サイズが小さくなっている。図７（ｃ）は、図６（ｃ）と同様に複数のページに跨ってテーマ画像が配置されると共に、電子文書のコンテンツが配置された例を示している。

【0052】

なお、最後のコンテンツ要素３ｂが配置されるページにおいては、その最後のコンテンツ要素３ｂの後に余白が存在する場合が多々ある。そのような場合には、そのまま余白を設定してもよいし、あるいは、続きの別の電子文書のコンテンツがある場合には、その最後のコンテンツ要素の後に、続きの別の電子文書のコンテンツを配置することもできる。その別の電子文書のコンテンツが次ページに続く場合には、内容的にも完全に別の電子文書コンテンツになるのでテーマ画像を配置しないようにしてもよい。

【0053】

次に、このようにして変換領域にテーマ画像と電子文書のコンテンツとが配置されたデータからデータ・ファイルを生成して、作業領域のメモリ領域を開放する（Ｓ４０７）。生成されるデータ・ファイルは、前述したように、ｅＰｕｂ、ＰＤＦ、ｘｍｄｆ、ｂｏｏｋなどのファイルである。そして、各ページ単位でのデータが含まれる。ｅＰｕｂやｘｍｄｆなどの構造化データ形式においてはページ区切りをして、各ページにテーマ画像が配置されるように規定して複数のページを有するファイルを作成する。例えば、ｅＰｕｂ形式のものでは、変換後の１ページ分を表すＨＴＭＬファイルをページ分作成して、各ページを表すＨＴＭＬファイルの関係をｏｐｆファイルで定義し、これらのファイルを含むｅＰｕｂファイルを作成することでファイル生成が行われる。

【0054】

以上説明したように、本実施形態においては文書データを電子機器の表示領域に適したデータに変換する際に、テーマ画像を全てのページに配置することにより、作者の意図を反映した形で電子機器用のデータを提供することが可能となる。

【0055】

＜実施形態２＞
実施形態１においては、変換領域に配置するテーマ画像については全て同じ大きさのテーマ画像を配置している例を説明した。実施形態２においては、電子機器のディスプレイの２ページ目以降に表示されるテーマ画像を１ページ目に表示されるテーマ画像とは別の大きさのテーマ画像とする例について説明する。具体的には、変換領域の２ページ目以降の領域に配置されるテーマ画像は、１ページ目に配置されるテーマ画像よりも縮小した画像とする。１ページ目において読者にある程度の印象を与えているので、２ページ目以降では縮小した画像を表示させてもそれほど読者に対する影響はないからである。また、２ページ目以降に表示させるテーマ画像を縮小することで、２ページ目以降に表示させる電子文書のコンテンツの量を増やすことができる。

【0056】

ここで、変換領域の１ページ目に配置されるテーマ画像は図４のＳ４０５の処理と同様に行われる。変換領域の２ページ目以降に配置されるテーマ画像については、例えば１ページ目のテーマ画像の１／２のサイズとすることができる。なお、２ページ目以降に配置されるテーマ画像にリンクを張ることで、電子機器で表示された場合にユーザによってテーマ画像がクリックされたり、タッチされたりした場合に、１ページ目のテーマ画像を表示してテーマ画像を拡大表示することも可能である。また、２ページ目以降のテーマ画像をサムネイル画像としてアイコン表示して、各ページの余白部分に表示させてもよい。

【0057】

以上の例においては、２ページ目以降に配置されるテーマ画像が１ページ目に配置されるテーマ画像よりも縮小した画像とする例について説明したが、以上の例とは逆にテーマ画像を順次に拡大することもできる。

【0058】

＜実施形態３＞
実施形態３においては、１つの記事の中にテーマ画像が複数存在する例について説明する。テーマ画像が複数存在する場合には、複数のテーマ画像を１つのページ内に表示させてもよいが、実施形態３ではページ毎にテーマ画像を切り換えて表示させるように配置する。この処理は、図４のＳ４０５の処理において、各ページに配置するテーマ画像をページ毎に切り換えて配置することで実現できる。なお、実施形態３を実施形態２と組み合わせることも可能である。すなわち、テーマ画像を最初に表示させるページにおいては実施形態１で説明したように通常通りの大きさで表示させるように配置し、２回目以降に表示させるページにおいては、実施形態２で説明したように縮小した画像を配置したり、アイコン化して各ページの余白部分に配置するということも可能である。

【0059】

＜実施形態４＞
実施形態１では、テーマ画像を配置した後に、コンテンツ要素を最初のコンテンツ要素３ａから最後のコンテンツ要素３ｂにかけて配置する例を説明した。しかしながら、実施形態１でも説明したように、この処理では最後のページに余白ができてしまう可能性が高い。そこで、最後のページに余白が生じないように、実施形態４では最後のページにおいて最後のコンテンツ要素３ｂから最初のコンテンツ３ａに向けて逆順にコンテンツ要素を配置していくことで最後のページの最後の部分に電子文書の最後のコンテンツ要素３ｂが配置されるように調整することも可能である。

【0060】

この処理は、図４のＳ４０６の処理において、最後のコンテンツ要素３ｂから最初のコンテンツ要素３ａにかけてテーマ画像を回り込む形で逆順に電子文書のコンテンツを配置することで実現できる。そして、最初のページについては空き領域が発生することになるので、その空き領域を埋めるようにテーマ画像を拡大することで最初のページの余白部分を少なくすることができる。また、このように最初のページのテーマ画像を大きく表示させるように配置することで、その記事のテーマを読者により一層印象付けすることができる。

【0061】

＜実施形態５＞
上記の実施形態１から４においては、関連画像としてテーマ画像を用いる例について説明した。実施形態５では、関連画像としてコンテンツ画像を用いる例について説明する。雑誌記事などの作者は、読者がコンテンツ画像に関係する記事中の文章を読む際に、対応するコンテンツ画像を参照しながら読んでくれるだろうという意図で雑誌記事などを作成している。従って、雑誌記事などの電子文書の文書データを電子機器の表示領域に適したデータに変換する際に、コンテンツ画像に関係する文章が表示される各ページには、対応するコンテンツ画像が表示されるように変換されることが望ましい。従って、実施形態５においてはコンテンツ画像が複数のページに配置されるように変換される例について説明する。

【0062】

なお、実施形態５における電子文書変換装置の構成や処理の流れについては実施形態１で説明したものと概ね同じであるので、共通する部分の説明は省略し、相違点について説明をする。

【0063】

まず、文書データ２０ａの中に含まれるコンテンツ画像を識別する方法について説明する。この識別処理は、画像識別部２０２において行われる。コンテンツ画像の識別も実施形態１で説明したテーマ画像と同様に行うことができる。例えば、ＸＭＬ形式で記述された構造化データでは、例えばコンテンツ画像に「content image」といったタグが付された画像をコンテンツ画像として識別することができる。あるいはまた、実施形態１で説明したような「theme image」といったテーマ画像を示すタグが付されていない画像をコンテンツ画像として識別してもよい。また、雑誌用に作成されたＤＴＰデータの場合には、ＤＴＰデータによって表されるオリジナルの雑誌誌面の画面イメージをユーザに表示し、ユーザからどの画像がコンテンツ画像であるかを指定されることによって、その画像をテーマ画像として識別することができる。あるいは、画像オブジェクトの近傍に他の文章のフォントとは異なるフォントで記述された文章が配置されている場合には、その文章をキャプションと判断し、その画像オブジェクトはキャプションが付された画像であると判定して、その画像オブジェクトについてコンテンツ画像として識別することもできる。スキャナで読み込んだ文書画像データについても、実施形態１で説明した場合と同様にコンテンツ画像として識別することができる。あるいはまた、実施形態１で説明したようなテーマ画像以外の画像をコンテンツ画像として識別してもよい。

【0064】

次に、コンテンツ画像が適用される範囲を決定する方法について説明する。この処理は、Ｓ４０２の処理に相当する。実施形態１で説明したテーマ画像の場合には、雑誌記事などの電子文書のコンテンツがどこから始まって、どこで終了するかを示す範囲であるコンテンツ範囲を決定し、そのコンテンツ範囲内に含まれているコンテンツが含まれる全てのページにテーマ画像が配置されることについて説明した。コンテンツ画像の場合にも同様に、コンテンツ範囲内に記載されている電子文書のコンテンツが含まれる全てのページにコンテンツ画像を配置してもよい。この場合の処理については、実施形態１と同様であるので、説明は省略する。

【0065】

一方で、コンテンツ画像が適用される範囲は、あるコンテンツの中の特定の部分だけである場合が想定される。例えば、電子文書がサッカーの記事である場合を想定する。記事の中に、ある試合Ａの得点シーンを表すコンテンツ画像が含まれている場合には、その試合Ａに関する文章などがそのコンテンツ画像に関係するものであり、一方で、他の試合Ｂに関する文章などはそのコンテンツ画像に関係するものではないと考えられ得る。従って、このような場合には、ある試合Ａに関する文章の部分が表示される複数のページには、そのコンテンツ画像を配置するように処理することが記事の作者の意図に沿ったものと考えることができる。

【0066】

そこで、コンテンツ画像が、電子文書の一部分に対応する場合には、そのコンテンツ画像が適用される範囲を、電子文書のコンテンツの中から決定する必要がある。ここで、文書データ２０ａがＸＭＬ形式のような構造化されたデータ構造である場合には、そのデータ構造を参照してコンテンツ画像が適用される範囲を決定することができる。例えば、あるコンテンツ画像あるいはコンテンツ画像を示すタグに対して「id="content image"」というように識別子が付加されており、そのコンテンツ画像を説明する文章の開始部分と終了部分とがその識別子に関連付けられている場合（例えば、コンテンツ画像を説明する文章の開始部分に「<image_identifier id= content image＞」というコンテンツ画像の識別子と結び付けられたタグが付され、コンテンツ画像を説明する文章の終了部分に「</image_identifier id= content image＞」というタグが付されている場合）には、これらのデータ構造を参照してコンテンツ画像について説明されている範囲を特定することができる。

【0067】

また、オリジナルの雑誌誌面の画面イメージをユーザに表示して、ユーザから指示によって、コンテンツ画像が適用される範囲を決定してもよい。

【0068】

このようにして決定されたコンテンツ範囲に対する以降の処理は実施形態１で説明したものと同様であるので説明は省略する。また、コンテンツ画像の場合にも、実施形態２から４で説明した技術を適用することも可能である。

【0069】

なお、テーマ画像とコンテンツ画像とが混在する電子文書の場合には、どちらの画像を優先的に複数のページ上に表示させるかをユーザからの選択に基づいて行っても良い。あるいは、これらの優先度については、変換規則データに予め規定してあり、この変換規則データに基づいて優先的に表示させる画像を決定してもよい。

【0070】

このように、雑誌記事などの電子文書の文書データを電子機器の表示領域に適したデータに変換する際に、コンテンツ画像に関係する文章が表示される各ページには、対応するコンテンツ画像が表示されるように変換することが可能となり、作者の意図に沿った形で電子文書を変換することができる。

【0071】

＜その他の形態＞
以上説明した各実施形態においては、電子機器１１と電子文書変換装置１２とを別個の機器として例示した。しかしながら、図１（ｃ）で示したように上記で説明した電子文書変換装置１２の機能を電子機器１１に組み込んで、両者を一体化した形態を採用してもよい。この場合、表示領域プロファイル・データは各電子機器１１に固有の情報を用いることができるので、電子文書変換装置１２内に各小型電子機器用の各表示領域プロファイル・データを記憶する必要が無くなる。

【0072】

また、電子書籍のデータ形式についても、ｅＰｕｂ、ＰＤＦ、ｘｍｄｆ、ｂｏｏｋなどを例に挙げて説明したが、これ以外の形式を用いても良いのはもちろんである。また、ページ区切りについても、他の手法を用いて行っても良い。

【0073】

また、テーマ画像は電子文書のコンテンツと重複して表示される画像であってもよい。例えば、背景として埋め込まれている画像もテーマ画像として扱うことも可能である。

【0074】

また、本発明は上述した各実施形態の機能を実現するソフトウエアのプログラムを、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ、またはＣＰＵやＭＰＵ等がプログラムを実行することで実現することができる。この場合、プログラム自身及びプログラムを記録したコンピュータ読み取り可能な記録媒体についても本発明の範囲に含まれることはもちろんである。

【符号の説明】

【0075】

１２電子文書変換装置
２０１電子文書データ取得部
２０２画像識別部
２０３プロファイル・データ取得部
２０４変換規則データ取得部
２０５ページ変換部

【図1】