(58)【調査した分野】(Int.Cl.,DB名)
前記フォーマット手段から出力された前記目次の要約の文書データと、前記文書データ取得手段で取得した前記文書データに含まれる目次ページのいずれかを選択して表示する選択手段をさらに備えたことを特徴とする請求項1、2または3に記載の電子文書変換装置。
【背景技術】
【0002】
スマートフォン、タブレット型コンピュータなどの携帯端末の普及に伴って、携帯端末を利用して電子書籍を閲覧するサービスが提供されている。電子書籍には、小説などの文字を中心とした書籍ばかりでなく、画像、写真、イラストを多用した雑誌などの書籍も配信されている。また、このような電子書籍の文書データを作成するための様々なアプリケーション・ソフトウェアが普及している。
【0003】
従来、書籍の編集・製本向けには、DTP(Desktop publishing)ソフトウェア(例えば、Adobe社のIndesign(登録商標)など)が用いられていた。一般的なパーソナルコンピュータの画面上で記事を編集し、編集が終了した文書データを、印刷機に入力して、製本作業を行っていた。また、ワードプロセッサなどで作成された電子文書を、ネットワークを介して配信するための共通フォーマットとして、PDF(Portable Document Format)が用いられている。さらに、パーソナルコンピュータ上のブラウザによって電子文書の閲覧を可能にし、操作性を用意にするめの電子文書作成言語として、HTML(Hipper Text Markup Language)、XML(Extensible Markup Language)が知られている。
【0004】
文字、画像、写真、イラストなど様々なオブジェクトを用いる雑誌などの書籍は、ブラウザを介して閲覧するウェブページと、ページの構成が類似していることから、HTML形式またはXML形式の電子文書を利用することができる。これにより、ページの編集が容易となり、リンクの設定など紙媒体にはない機能も実現することができる。
【0005】
一方、小説などの文字を中心とした書籍は、パーソナルコンピュータのディスプレイを介した閲覧であっても、紙媒体に近い視認性と、ページめくりなどの操作性が求められている。そこで、これらの機能を実現するための電子書籍向けフォーマットが策定されている。例えば、XML形式と類似したフォーマットであるePub形式(例えば、非特許文献1参照)、xmdf形式、book形式などが知られている。上述したアプリケーション・ソフトウェアで作成された文書データを、電子書籍向けフォーマットに変換し(例えば、特許文献1参照)、ネットワーク上のサーバから、携帯端末、パーソナルコンピュータに配信することも行われている。
【発明の概要】
【発明が解決しようとする課題】
【0008】
上述したアプリケーション・ソフトウェアで作成された文書データを、比較的表示領域の大きなパーソナルコンピュータのディスプレイ上で閲覧する場合と比較して、携帯端末のような表示領域のより小さなディスプレイ上で閲覧する場合には、以下のような問題点があった。
【0009】
小説などの文字を中心とした書籍の場合は、上述した電子書籍向けフォーマットに変換することにより、より小さなディスプレイでも閲覧が可能であった。すなわち、電子書籍向けフォーマットでは、電子文書を表示するディスプレイの属性に合わせて、すなわち、ディスプレイの大きさ、縦横比、解像度等にあわせて、文字のフォント、サイズを決定している。視認性を確保する上で必要な文字サイズとすることで、一画面で表示できる文字数は減るものの、ディスプレイの大小にかかわらず、視認性、操作性を確保することができる。
【0010】
しかしながら、画像、写真、イラストを多用した雑誌の場合は、より小さなディスプレイに適したフォーマットに変換することが難しい。これは、テキスト文字であっても、タイトル、小見出し、本文など、様々なフォント、サイズ、色の文字が使用されること。写真、イラスト、図表など解像度が大きく異なり、サイズも異なる画像データが使用されることから、一律の拡大、縮小ができないことによる。特に、雑誌の目次ページは、タイトル、記事要約などの文字データ、イラスト、サムネイル画像などが多用され、記事へのアクセスを容易にするために、レイアウトにも工夫が凝らしてあることから、表示領域の小さなディスプレイ上でも視認性、操作性を確保することが難しいという問題があった。
【0011】
また、表示領域が小さくなると、画面上に表示できる文字や画像の情報量が減るため、ページめくりや画面スクロールの回数が増えてしまい、ユーザの文書閲覧意欲を減退させてしまうという問題があった。
【0012】
本発明の目的は、携帯端末のような表示領域の小さなディスプレイ上でも、判読が容易で、操作性が良い目次ページを編集するための電子文書変換装置及び電子文書変換方法を提供することにある。
【課題を解決するための手段】
【0013】
このような目的を達成するために、本発明の一実施態様において、端末に表示する電子文書の目次の要約を作成するための電子文書変換装置は、前記電子文書についての文書データを取得し、前記目次を構成する
記事タイトルごとに、前記
記事タイトルに含まれる目次項目を、前記文書データから取得する文書データ取得手段
であって、前記目次項目は、画像データ、文字データおよび数字データと、これらを修飾する属性とを含むことと、前記目次の要約に表示する目次項目の配列順位を決定するための、前記目次項目の属性ごとの並び替えルールを格納する変換レギュレーション格納手段と、前記文書データ取得手段で取得した前記目次項目の属性に基づいて、前記変換レギュレーション格納手段に格納された並び替えルールを検索し、該並び替えルールに基づいて前記目次を構成する目次項目の配列順位を決定し、該配列順位に従って並び替えられた編集データに変換する変換手段と、前記端末の表示装置に
応じたレイアウトルールを格納するデバイスプロファイル格納手段と、指定された端末のレイアウトルールを前記デバイスプロファイル格納手段から抽出し、前記
変換手段で変換された編集デー
タを、前記指定された端末のレイアウトルールに基づいて変更し、前記目次の要約の文書データとして出力するフォーマット手段とを備えたことを特徴とする。
【発明の効果】
【0014】
以上説明したように、本発明によれば、所定の並び替えルールに従って、目次を構成する目次項目の配列順位を決定し、端末の表示装置にかかる属性に基づいたレイアウトルールに基づいて目次項目の属性を変更することにより、携帯端末のような表示領域の小さなディスプレイ上でも、判読が容易で、操作性が良い目次ページを編集するが可能となる。
【発明を実施するための形態】
【0016】
以下、図面を参照しながら本発明の実施形態について詳細に説明する。
【0017】
図1に、本発明の一実施形態にかかるシステム構成を示す。
図1(a)のサーバ101は、PDFファイル、DTPソフトウェア、電子書籍向けフォーマットなどで作成された文書データが格納されたデータベース111と、この文書データから目次ページを取得し、携帯端末のような表示領域の小さなディスプレイ上でも判読が容易な目次要約版を作成する電子文書変換装置であるコンバータ112とを備えている。例えば、サーバ101は、出版社のサーバであり、文書データおよび目次要約版をセットにして書店に販売し、電子書店のサーバ104に格納される。携帯端末103は、ネットワーク102を介して電子書店のサーバ104にアクセスし、所望の文書データとこの文書データから作成された目次要約版とを入手することができる。
【0018】
図1(b)の構成は変形例であり、サーバ105は、文書データが格納されたデータベース111のみを備えており、コンバータ112は、電子書店のサーバ106に設置され、ネットワーク102に接続されている形態である。また、コンバータ112を独立した装置として、ネットワーク102に接続してもよい。
図1(c)の構成も変形例であり、サーバ105は、文書データが格納されたデータベース111のみを備えており、コンバータを携帯端末107に内蔵した構成である。
【0019】
図2に、本発明の一実施形態にかかる電子文書変換装置を示す。コンバータ200は、入力文書データとして、例えば、PDFファイル211、DTPソフトウェアにより作成された電子文書(以下、DTPファイルという)212、電子書籍向けフォーマットにより作成された電子文書(以下、電子書籍ファイルという)213を入力し、目次要約版214を出力する(
図2(a))。目次要約版は、入力文書データと同じフォーマットの出力文書データとして出力する場合と、例えば、PDFファイルおよびDTPファイルを電子書籍ファイルに変換することにより、電子書籍ファイルに統一してから出力する場合とがある。
【0020】
図2(b)に、電子文書変換装置の詳細な構成を示す。文書データ取得部201は、入力文書データを取得し、目次ページの文書データの中から、目次を構成する記事タイトルに含まれる目次項目ごとに、目次要約版の作成に必要な属性を、入力文書データから取得する。変換部202は、取得した属性と、変換レギュレーション204およびデバイスプロファイル205とを参照して、目次ページの文書データを目次要約版の文書データに変換する。フォーマット部203は、目次要約版の文書データを、デバイスプロファイル205を参照して、携帯端末の液晶ディスプレイ等の表示装置に表示可能な出力文書データとして出力する。
【0021】
本発明の実施形態によれば、携帯端末のような表示領域のより小さなディスプレイの場合、すなわち一画面で表示できる文字数が少ない場合であっても、目次の体裁を保ったまま視認性を確保するとともに、記事へのアクセスなど操作性も確保した目次要約版を提供する。詳細な処理の流れは、
図7のフローチャートを参照して後述する。
【0022】
図2(b)に示す各部は、ハードウェア、ソフトウェア、ハードウェアとソフトウェアの両者、のいずれかによって構成される。例えば、これらを実現する一例として、サーバ型コンピュータ、タブレット型コンピュータを利用する場合には、CPU、メモリ、バス、インターフェイス、周辺装置などから構成されるハードウェアと、これらのハードウェア上にて実行可能なソフトウェアを挙げることができる。具体的には、CPUがメモリ上に展開されたプログラムを順次実行することで、メモリ上のデータや、インターフェイスを介して入力されるデータの加工、蓄積、出力などにより各部の機能が実現される。このような構成は、本明細書の全体を通じて同様である。
【0023】
図3に、従来の雑誌の目次ページの一例を示す。目次ページ300が、PDFファイルによってイメージデータとして表示されている状態を示す。目次ページ300の上段には、雑誌名「A」、号数「B」などがイラストとして表示されている。特集記事の記事タイトル311,312は、サムネイル画像(例えば、著者の顔写真など)「C」、「D」、タイトル(太線)、記事要約などの文字データ(点線)、記事の開始ページ(数字)などの目次項目から構成されている。解説記事の記事タイトル321〜323は、タイトル(太線)及び小見出しの文字データ(点線)と、記事の開始ページ(数字)とから構成されている。連載記事の記事タイトル331〜333は、タイトルイラスト「E」、「F」、「G」、タイトルの文字データ(細線)、記事の開始ページ(数字)とから構成されている。
【0024】
これら目次ページに列挙されている記事タイトルを構成する目次項目が、所定のサイズのページ上に配置され、ビットマップイメージと同様にして、表示されている。
【0025】
図4に、従来のDTPソフトウェアで作成された文書データの構造を示す。
図3に示した目次ページを有する文書データの一例である。DTPファイルは、原本である書籍の書誌情報、著作権情報などが記録されたメタ情報401、表紙、目次、本文などのページ設定、段組などを規定するレイアウト情報402、文書データを構成するテキスト、画像を部品として捉え、各々を格納するテキスト情報403、画像情報404を備えている。
【0026】
例えば、目次ページを構成する要素である目次項目を部品として捉え、特集記事の記事タイトル311のタイトル431、記事要約432などの文字データは、テキスト情報403に格納されている。テキスト情報には、さらにこのテキストを修飾する属性、例えば、フォント、サイズ、色、斜字、太字、下線、陰影などの情報を格納している。記事タイトル311のサムネイル画像「C」は、画像情報404に、この画像を修飾する属性、例えば、サイズ、解像度などの情報とともに格納されている。
【0027】
DTPソフトウェアは、メタ情報401、レイアウト情報402を読み込んで目次ページ、本文などのレイアウトを決定し、テキスト情報403、画像情報404に格納された部品を配置して、出力文書データを構成する。
【0028】
図5に、従来の電子書籍向けフォーマットで作成された文書データのファイル構成を示す。電子書籍ファイルにおいては、携帯端末、パーソナルコンピュータ上での操作性を向上させるために、文書データを予め複数のファイルに分割している。例えば、ePub形式のファイルには、目次ファイル501、原本である書籍の書誌情報、著作権情報などが記録されたメタ情報ファイル502、文書ファイル503が含まれている。さらに、文書ファイル503には、文書本体のファイル531、文書本体を修飾するファイル532a〜532cなどに分割されている。
【0029】
図6に、従来の電子書籍向けフォーマットで作成された文書データの構造を示す。目次ファイル501は、XML形式で記述されており、例えば、
図3に示した目次ページが、タグを用いたツリー構造として表わされている。例えば、特集記事の記事タイトル311のタイトル501、記事要約502などの文字データは、テキストとしてタグ付けされ、CSS(Cascading Style Sheet)ファイル(
図5の532a)、フォントファイル(
図5の532b)などにより、例えば、フォント、サイズ、色、斜字、太字、下線、陰影などの属性が与えられる。記事タイトル311のサムネイル画像「C」は、画像としてタグ付けされ、画像ファイル(
図5の532c)に格納されている。
【0030】
図7に、本発明の一実施形態にかかる電子文書変換方法を示す。
図2(b)に示した電子文書変換装置の詳細な処理について説明する。ステップS102において、文書データ取得部201は、入力文書データを取得し、文書データの中から目次ページを取得する。PDFファイルの場合は、例えば、ポインティングデバイスなどの周辺装置を介して、ユーザ入力により目次ページが指定される。DTPファイル400の場合も、ユーザ入力により目次ページが指定され、目次ページに列挙されている記事タイトルを構成する目次項目に関するレイアウト情報402、テキスト情報403および画像情報404が抽出される(
図4参照)。電子書籍ファイル500の場合は、ファイル名称をキー(例えば、拡張子.ncx)として目次ファイル501を抽出する(
図5参照)。
【0031】
ステップS104において、文書データ取得部201は、取得した目次ページの中の目次項目を記事タイトルごとに抽出する。すなわち
図3に示した雑誌の目次ページ300において、特集記事の記事タイトル311,312(以下、記事「AA」、「AB」という)、解説記事の記事タイトル321〜323(以下、記事「Aa」、「Ab」、「Ac」という)、連載記事の記事タイトル331〜333(以下、記事「aa」、「ab」、「ac」という)を順次抽出する。
【0032】
図8に、ステップS104における目次項目の抽出方法を示す。ステップS202において、文書データ取得部201は、取得した目次ページの中から記事タイトルを取得する。PDFファイルの場合は、例えば、ポインティングデバイスなどの周辺装置を介して、ユーザ入力により記事タイトルの範囲が指定される。例えば、
図3に示した雑誌の目次ページ300において、特集記事の記事タイトル311のサムネイル画像「C」、タイトル、記事要約などの文字データ、記事の開始ページなどが範囲指定される。DTPファイル400の場合も、ユーザ入力により記事タイトルが指定され、記事タイトルを構成する目次項目に関するレイアウト情報402、テキスト情報403および画像情報404が抽出される(
図4参照)。電子書籍ファイル500の場合は、抽出された目次ファイルの中のタグを解析し、記事タイトルを抽出する。例えば、
図6に示したXML形式の文書データの中から<doc title> … </doc title>タグを抽出する。
【0033】
ステップS204において、文書データ取得部201は、取得した記事タイトルごとに目次項目の属性を取得する。PDFファイルの場合は、例えば、周辺装置を介して、ユーザ入力により属性が入力される。例えば、
図3に示した特集記事の記事タイトル311の場合、サムネイル画像「C」のサイズ、解像度など、タイトルのデータ種別、サイズなど、記事要約のフォント、サイズ、色などを入力する。DTPファイルの場合は、画像情報404の中からサムネイル画像「C」の属性を抽出し、テキスト情報403からタイトル、記事要約の属性を抽出する(
図4参照)。電子書籍ファイル500の場合は、抽出された目次ファイルの中の記事タイトルにかかるタグに指定された属性を抽出し、記事タイトルにかかるタグに規定された属性、タグに関連付けられたCSSファイル532a、フォントファイル532b、画像ファイル532cを解析し、属性を抽出する。
【0034】
ステップS206において、文書データ取得部201は、取得した記事タイトルの配置を判別する。特定の記事タイトルが目次ページの何番目に配置されているか、特集記事の中の何番目に配置されているかなどを判別する。PDFファイルの場合は、例えば、周辺装置を介して、ユーザ入力により記事タイトルの配列順位が入力される。例えば、
図3に示した特集記事の記事「AA」が1番目であり、解説記事の記事「Aa」が3番目となる。DTPファイルの場合も、ユーザ入力により目次項目の配列順位が指定される。電子書籍ファイルの場合は、抽出された目次ファイルの中の記事タイトルにかかるタグのツリー構造から、記事タイトルの配列順位を判別する(
図6参照)。
【0035】
図9に、電子文書変換方法における編集用中間ファイルの一例を示す。ステップS204とS206とを繰り返して、目次ページの中の全ての記事タイトルについて、目次項目を抽出する。
図9は、抽出した目次項目が記事タイトルごとに列挙された編集用中間ファイル600の構造を示している。例えば、「記事AA」のブロック601は、
図3に示した特集記事の記事タイトル311に相当し、記事の開始ページ、記事タイトルの配列順位などの配置情報611、タイトル、記事要約などの文字データとその属性情報612、サムネイル画像「C」とその属性情報613から構成されている。
【0036】
図7に戻り、ステップS106において、変換部202は、文書データ取得部201が作成した編集用中間ファイル600を、目次要約版を表示するためのレイアウト用中間ファイルに変換する。変換部202は、変換レギュレーション204に格納されている並び替えルールに従って、編集用中間ファイルの記事タイトルごとのブロック601,602,603,・・の並び替えを行う。タイトルの文字データの属性に着目して、例えば、文字サイズの大きさの大きい順に並び替えを行う。
【0037】
並び替えルールは、例えば、(1)文字サイズの大きい記事ほど注目度が高い、(2)文字修飾(例えば、太字)がなされているタイトルほど注目度が高い、(3)配列順位が高いほど注目度が高いというルールを設定することができる。その他にも、(4)記事の開始ページ、(5)サムネイル画像の有無、(6)お気に入りファイル、過去ログに記録されているキーワードに一致する用語を含むか否かなど、様々な並び替えルールを設定することができる。複数の並び替えルールを用いる場合には、優先順位を設定し、優先順位に従って並び替えを行うようにしてもよい。変換部202は、文書データ取得部201で取得した属性をキーにして、変換レギュレーション204に格納されている並び替えルールを検索し、優先順位の最も高い属性を基に並び替えを行う。次に優先順位の低い属性を基に並び替えを行い、順次、優先順位の低い属性に従って、並び替えを行う。
【0038】
お気に入りファイルとは、例えば、過去に雑誌を閲覧した際に、ユーザが「お気に入り」の記事として、記事タイトルを登録したファイルであり、過去ログとは、例えば、閲覧履歴が格納されたファイルである。例えば、著者名を並び替えルールの優先順位のいずれかに設定し、「お気に入り」ファイルに記録されている著者名と一致する記事タイトルが検出されたら、この記事タイトルを優先順位にしたがって並び替える。ここでは、特集記事「AA」、「AB」、連載記事「aa」、解説記事「Ab」の順に、並び替えたとする。
【0039】
ステップS108において、変換部202は、デバイスプロファイル205に格納されているレイアウトルールに従って、編集用中間ファイルの目次項目の属性を変換する。例えば、携帯端末のディスプレイの解像度に基づいて、表示する文字サイズが決定され、ディスプレイのサイズから一画面に表示できる文字数が決めら、縦書き/横書きかによって文字のフォントが決定される。本実施形態では、一例として、イラスト、画像の表示は省略し、タイトルの文字データのみを一画面に表示できる文字数に合わせて表示する。具体的には、1行に1記事タイトルとし、目次項目のタイトルの文字データを、ディスプレイの横方向に表示できる文字数だけ表示する。ディスプレイの縦方向には、表示できる行数だけ、上記の並び替えた順に記事タイトルを表示する。このとき、目次項目の属性は、全ての記事タイトルについて、同一の属性を設定する。このようにして、目次要約版を表示するためのレイアウト用中間ファイルに変換する。
【0040】
なお、レイアウトルールは、例えば、一画面に表示する記事タイトルの数、1行に表示するタイトルの文字数を決めてから、文字サイズ、フォントを決定してもよい。また、目次ページの全ての記事タイトルを一画面で表示するようにしたり、指定されたページ数に収まるように表示するように設定してもよい。
【0041】
図10に、電子文書変換方法におけるレイアウト用中間ファイルの一例を示す。編集用中間ファイルの各々の記事について設定されている属性が、変換部202により変換された結果を示しており、抽出した目次項目が記事タイトルごとに列挙されている。目次要約版であることから、フォント、サイズは統一され、上述したレイアウトルールに従って、携帯端末のディスプレイに表示可能な値に設定されている。記事タイトルの配列は、上述した並び替えルールによる優先順位にしたがって変換部202により並び替えられた順番に格納されている。
【0042】
再び
図7に戻り、ステップS110において、フォーマット部203は、変換部202が作成したレイアウト用中間ファイルを、目次要約版を表示するための出力文書データに変換する。出力文書データは、入力文書データと同じフォーマットの出力文書データとして出力してもよいし、PDFファイルおよびDTPソフトウェアを電子書籍向けフォーマットに変換することにより、電子書籍向けフォーマットに統一してもよい。なお、
図2(a)に示した目次全体版は、文書データ取得部201で取得した入力文書データを、そのまま出力文書データとして出力する。
【0043】
図11に、本発明の一実施形態にかかる目次要約版の一例を示す。目次要約版の出力文書データを携帯端末のディスプレイに表示した状態を示している。各々の記事タイトルは、レイアウト用中間ファイルで定義された属性で表示されている。例えば、記事「AA」は、
図3に示した元の目次ページと比較すると、サムネイル画像「C」は削除され、タイトルはフォント、サイズが変更されて表示される。タイトルが長い場合は、ディスプレイの属性に合わせて、すなわちデバイスプロファイル205に格納されているレイアウトルールに従って、所定の文字数だけタイトルが表示される。また、記事要約などの文字データも省略される。記事の開始ページも省略され、表示されているタイトルが記事本文へのリンクが設定されたボタンとして機能する。
【0044】
また、目次要約版には、記事タイトルの目次項目の全てを閲覧した場合に、詳細画面に遷移するリンクが設定された「詳しく」ボタンを設けたり、
図3に示したように目次ページをそのままビットマップイメージで表示する目次全体版に遷移するボタンも設けることができる。このようにして、サムネイル画像、記事要約などの詳細、元の記事タイトルを参照することができる。
【0045】
図12に、目次要約版の他の実施例を示す。
図11に示した「詳しく」ボタンを押下した状態の画面900を示す。目次要約版で省略されていたサムネイル画像「C」、省略されたタイトル、記事要約の文字データがポップアップ画面901の中に表示される。
【0046】
図13に、目次要約版の他の実施例を示す。上記実施例と同じく、
図11に示した「詳しく」ボタンを押下した状態の画面1000を示す。新たな1ページの画面に、1つの記事タイトルが表示され、目次要約版で省略されていた画像、文字データなどの目次項目が、再構成されて表示される。この画面には、目次要約版に戻るボタン1012、目次全体版に遷移するボタン1011も表示される。