【文献】
田原 恭二,電子書籍を支えるIT技術,印刷雑誌,日本,株式会社印刷学会,2011年 9月15日,第94巻第9号,p.15-19
(58)【調査した分野】(Int.Cl.,DB名)
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところで、電子書籍を読み取るのを汎用パソコンで行う場合には、電子書籍データのデータ形式は一般的な画像データでも良いかもしれないが、専用の電子書籍リーダーを用いる場合には、電子書籍リーダーの種類に適合したデータ形式が必要とされる。
電子書籍リーダーの種類ごとの電子書籍データのデータ形式としては、XMDF、ドットブック、EPUBなど、様々な種類のデータ形式が存在する。
【0006】
上述した従来の特許文献1及び特許文献2に示されている電子書籍データの作成方法では、電子書籍データのデータ形式については特に記載がない。
電子書籍リーダーを製造販売するメーカーでは自社の電子書籍リーダーに適合するデータ形式であればよいので、どのようなデータ形式の電子書籍データを作成すべきかについては検討の必要性がないためであると考えられる。また、汎用パソコンで読み取る場合には、一般に普及しているデータ形式で作成すればよいためと考えられる。
【0007】
しかし、出版会社や印刷会社において電子書籍データを提供する場合には、特定のデータ形式の電子書籍データだけではなく、様々な電子書籍リーダーで読み取れるように、複数種類のデータ形式の電子書籍データを作成しなくてはならない。
【0008】
また、上述した特許文献1及び特許文献2においては、電子書籍データの元となるデータについては、テキストデータと画像データであるとの記載しかない。しかし、テキストデータだけでは、インデント、文字サイズ、ルビなどのレイアウト情報が不足しているので、書籍として体裁の整った電子書籍データを作成することができない。
【0009】
なお、印刷会社には、書籍の元となるデータとして組版データが存在している。組版データといっても組版ソフトの種類によってさまざまなデータ形式が存在する。従来は、これらの組版データをそれぞれのデータ形式の電子書籍データに変換し、変換された電子書籍データを作業者が編集して書籍としての体裁を整える方法を採用していた。
【0010】
しかし、同一内容の書籍であっても、元々の組版データのデータ形式が異なっており、しかもこれらを様々なデータ形式の電子書籍データに変換し、変換後の電子書籍データごとに作業者が手作業で編集作業を行わなくてはならないため、電子書籍データの作成効率が非常に悪いという課題があった。
また、作業者は、電子書籍データのデータ構造やタグ仕様を熟知していないと作業ができないため、データ形式ごとに専門の作業者が必要となってしまうという課題もあった。
【0011】
また、電子書籍では、文書内の該当箇所へのリンク、画像データへのリンク、又は文書中の字句の編集(“100頁を参照”のような部分を“こちらを参照”という字句に置き換える。)等、電子書籍特有の編集が必要になる。これらの情報を電子書籍データに付加又は編集する際も、電子書籍データのデータ構造やタグ仕様を熟知した作業者が、手作業で行う必要があり、作成効率が非常に悪いという課題があった。
【0012】
なお、組版データをデータ変換プログラムを用いて電子書籍データに変換する場合は、データ変換プログラムのインプットである組版データと、アウトプットである電子書籍データの組み合わせ毎にプログラムの開発が必要となるという課題がある。
これに対し、上述した特許文献1及び特許文献2でもみられるように、XML形式などを用いた汎用的な中間データ形式を策定し、各組版データから汎用的な中間データ形式に変換し、汎用的な中間データ形式から各電子書籍データ形式に変換とすることで、課題を解決しようという試みがなされている。
しかしながら、前述したようなリンク情報の付加や編集においては、データ固有の構造やタグ仕様を熟知する必要があることに変わりはなく、作業効率の課題の解決には至らない。
電子書籍データの編集は、容易に行うことができ、かつ必要に応じて、各種データ形式に変換できることが可能であることが理想である。
【0013】
そこで本発明は上記課題を解決すべくなされ、その目的とするところは、組版データから複数種類のデータ形式の電子書籍データを容易に効率よく作成することができ、また電子書籍データに詳しくなくても作業可能な電子書籍データ作成方法、及びマークアップ言語データを容易に効率よく作成することができ、また電子書籍データに詳しくなくても作業可能なマークアップ言語データ作成方法を提供することにある。
【課題を解決するための手段】
【0014】
本発明にかかる電子書籍データ作成方法によれば、組版データから電子書籍データを作成する電子書籍データ作成方法において、
コンピュータの記憶装置には、コンピュータが実行可能なプログラムとして第1の変換手段、第2の変換手段及び第3の変換手段が記憶されており、第1の変換手段は、作業者が指定する組版データ用フォルダに記憶されている組版データを全て読み出し、段落情報及びインライン情報を含み組版データの体裁を制御するためのレイアウト情報をワープロデータに変換し、次に組版データのテキストデータをワープロデータに変換し、作業者が指定するワープロデータ用フォルダに全てのワープロデータを記憶し、第2の変換手段は、前記ワープロデータ用フォルダに記憶されているワープロデータを全て読み込み、外字と、文字エンコーディングできない文字とを検出し、検出された外字を、あらかじめ記憶されている外字置換用ファイルに基づいて置換文字に置き換え、文字エンコーディングできない文字を、あらかじめ記憶されている画像ファイルに置き換えるか又は代替文字に置き換え、第3の変換手段は、作業者が指定するワープロデータ用フォルダに記憶されているワープロデータを読み込み、テキストデータ・段落情報を電子書籍データの形式に変換し、作業者が指定する電子書籍データ用フォルダに変換した電子書籍データを記憶し、前記第1の変換手段は、組版データをワープロデータに変換する際に、組版データに含まれる柱及びノンブルのデータをワープロデータに変換しないことを特徴としている。
この方法によれば、まず組版データをワープロデータに変換することで、作業者は異なるデータ形式の電子書籍データを整形するのではなく、ワープロソフトで整形を行え、整形後のワープロデータを、電子書籍データに変換すればよいので、効率よく整形作業が行える。また、整形をワープロデータで行うので、電子書籍データに詳しくなくても作業が行える。
【0016】
また、
第1の変換手段は、組版データに画像が存在する場合には、画像のファイル名を文字列に変換してから画像が所在する位置に配置し、組版データに罫表が存在する場合には、罫表を表示する画像又は罫表内のテキストを特定の文字列で囲んで罫表が所在する位置に配置し、第2の変換手段は、ワープロデータの画像又は罫表を示す文字列に対し、別ファイルとして用意されたイメージデータをワープロデータに対して自動的に取り込み、
第3の変換手段は、取り込まれたイメージデータの情報
を電子書籍データに変換
し、且つワープロデータに含まれるハイパーリンク情報を電子書籍のリンク情報に変換することを特徴としてもよい。
【0018】
また、第1の変換手段は、複数種類の組版データを1種類のワープロデータに変換可能であることを特徴としてもよい。
この方法によれば、複数種類の組版データが存在していても、すべて同じワープロソフトで整形することができ、作業効率を上げることができる。
【0020】
本発明にかかるマークアップ言語データ作成方法によれば、組版データから、電子書籍データに変換可能なマークアップ言語データを作成するマークアップ言語データ作成方法において、
コンピュータの記憶装置には、コンピュータが実行可能なプログラムとして第1の変換手段、第2の変換手段及び第4の変換手段が記憶されており、第1の変換手段は、作業者が指定する組版データ用フォルダに記憶されている組版データを全て読み出し、段落情報及びインライン情報を含み組版データの体裁を制御するためのレイアウト情報をワープロデータに変換し、次に組版データのテキストデータをワープロデータに変換し、作業者が指定するワープロデータ用フォルダに全てのワープロデータを記憶し、第2の変換手段は、前記ワープロデータ用フォルダに記憶されているワープロデータを全て読み込み、外字と、文字エンコーディングできない文字とを検出し、検出された外字を、あらかじめ記憶されている外字置換用ファイルに基づいて置換文字に置き換え、文字エンコーディングできない文字を、あらかじめ記憶されている画像ファイルに置き換えるか又は代替文字に置き換え、第4の変換手段は、作業者が指定するワープロデータ用フォルダに記憶されているワープロデータを読み込み、テキストデータ・段落情報をマークアップ言語データの形式に変換し、作業者が指定するマークアップ言語データ用フォルダに変換したマークアップ言語データを記憶し、前記第1の変換手段は、組版データをワープロデータに変換する際に、組版データに含まれる柱及びノンブルのデータをワープロデータに変換しないことを特徴としている。
この方法によれば、まず組版データをワープロデータに変換することで、作業者はワープロソフトで整形を行え、整形後のワープロデータを、マークアップ言語データに変換すればよいので、効率よく整形作業が行える。また、整形をワープロデータで行うので、最終的なデータである電子書籍データやその他のマルチメディアデータに詳しくなくても作業が行える。
【0022】
また、
第1の変換手段は、組版データに画像が存在する場合には、画像のファイル名を文字列に変換してから画像が所在する位置に配置し、組版データに罫表が存在する場合には、罫表を表示する画像又は罫表内のテキストを特定の文字列で囲んで罫表が所在する位置に配置し、第2の変換手段は、ワープロデータの画像又は罫表を示す文字列に対し、別ファイルとして用意されたイメージデータをワープロデータに対して自動的に取り込み、
第4の変換手段は、取り込まれたイメージデータの情報
をマークアップ言語データに変換
し、且つワープロデータに含まれるハイパーリンク情報をマークアップ言語のリンク情報に変換することを特徴としてもよい。
【0024】
さらに、第1の変換手段は、複数種類の組版データを1種類のワープロデータに変換可能であることを特徴としてもよい。
【発明の効果】
【0026】
本発明にかかる電子書籍データ作成方法によれば、組版データから複数種類のデータ形式の電子書籍データを容易に効率よく作成することができ、また電子書籍データに詳しくなくても作業が行える。
また、本発明にかかるマークアップ言語データ作成方法によれば、マークアップ言語データを容易に効率よく作成することができ、また最終的な電子書籍データやその他のマルチメディアデータに詳しくなくても作業が行える。
【発明を実施するための形態】
【0028】
以下、本発明の好適な実施の形態を添付図面を用いて説明する。
図1には、電子書籍データ作成方法及びマークアップ言語データ作成方法全体の流れを図示している。
電子書籍データ及びマークアップ言語データの作成は、作業者が各変換プログラムを用いてコンピュータ上でデータを自動的に変換し、変換プログラムで対応できない箇所や調整が必要となる箇所は作業者が手作業で整形することによって行われる。
【0029】
本実施形態で使用されるコンピュータの構成を
図2に示す。
コンピュータ30は、汎用的なパーソナルコンピュータなどを採用することができる。
コンピュータ30は、CPU及びメモリを含み、ソフトウェアプログラムを実行することによって各制御を行うことが可能な制御部32と、キーボードおよびマウス等のポインティングデバイスから構成され、操作者が制御部32に対して、情報を入力する入力手段34と、液晶ディスプレイやCRT等の制御部32からの信号に応じて情報を表示可能なモニタ36と、ソフトウェアプログラムや各種データを記憶する記憶装置38とを備えている。
記憶手段38の記憶媒体は、主にハードディスク等が挙げられる。
【0030】
また、コンピュータ30は、LAN(Local Area Network)等のネットワークを介して他のコンピュータや電子機器等と通信可能に接続されていてもよい。
【0031】
コンピュータ30の記憶装置38には、作業者が読み出して実行可能なプログラムである第1の変換手段P1、第2の変換手段P2、第3の変換手段P3、及び第4の変換手段P4が記憶されている。作業者は、各工程において必要な変換手段を読み出して実行させることができる。
また、記憶装置38には、組版データ用フォルダ10、ワープロデータ用フォルダ12、電子書籍データ用フォルダ14、画像データ用フォルダ16、マークアップ言語データ用フォルダ18が構築されている。
【0032】
本実施形態の組版データは、異なるデータ形式のものを用いることができる。
図1では、例として3種類の組版ソフトA,B,Cが図示され、3種類の組版データの形式から電子書籍に変換可能であるところを図示している。
【0033】
複数の組版ソフトA,B,Cから生成された組版データを第1の変換手段を用いて自動的に、汎用的なワープロソフトで読み書き可能なワープロデータに変換する。
なお、汎用的なワープロソフトの例としては、マイクロソフト社のWORDなどが挙げられる。
【0034】
第1の変換手段P1は、組版データをワープロデータに変換する変換プログラムである。この変換プログラムは、複数の組版データの種類に対応しており、異なる種類の組版データであっても、同一のワープロデータ形式に変換する。
【0035】
第1の変換手段P1は、組版データをワープロデータに変換する際、組版データのテキストと共にインデント・文字サイズ・ルビなどのレイアウト情報もワープロデータに変換する。
また、第1の変換手段P1は、ワープロデータに直接取り込めない画像やワープロデータ上で表示できない外字については、所在位置と情報を文字列に変換してワープロデータに配置する。なお、画像はファイル名を文字列に変換してから画像が所在する位置に配置し、外字は文字コードを文字列に変換してから所在する位置に配置する。
さらに、組版データに罫表が存在する場合、第1の変換手段P1は、ワープロデータ上で罫表を再現することが可能であるが、大多数の電子書籍は罫表を画像で表示するため、罫表は画像または罫表内のテキストを特定の文字列で囲んで罫表の所在位置に配置する。
【0036】
図3に、第1の変換手段の変換内容について示している。
第1の変換手段P1である変換プログラムは、作業者が指定する組版データ用フォルダ10に記憶されている組版データを全て読み出し、変換処理によってワープロデータに変換した後、作業者が指定したワープロデータ用フォルダ12に全てのワープロデータを記憶する。
なお、組版データ用フォルダ10、及びワープロデータ用フォルダ12は、作業者のコンピュータ30内の記憶装置38に構成されていることに限定されず、ネットワークを介して接続された、他の記憶装置にそれぞれが構成されていてもよい。
【0037】
図4には、組版データからワープロデータに変換する情報を示している。
第1の変換手段P1は、組版データのテキストデータと共に書籍体裁を制御するためのレイアウト情報もワープロデータに変換している。
このレイアウト情報は、段落スタイル名・行揃え・改行・改ページ等の段落情報と、テキストスタイル名、文字サイズ・文字色・フォント・イタリック・下線・上付き文字・下付き文字・ルビ・傍点等のインライン情報で構成されている。
【0038】
なお、段落情報およびインライン情報は、組版データ内でタグ又は組版制御用の特殊な文字を使って表現されており、第1の変換手段P1はこの情報(タグ又は組版制御用の特殊な文字)を解析してレイアウト情報をワープロデータのデータ形式に変換している。
【0039】
また、
図4は組版データをワープロデータへ変換するにあたり、ワープロデータ上で表現できない情報も図示している。
第1の変換手段P1は、これらのワープロデータ上で表現できない情報をワープロデータにそのまま変換することができないため、文字列に置き換えてワープロデータに配置する。文字列に置き換えることで、情報が欠落することを防ぎ、その後の整形作業や変換処理によって、適切な情報に置き換えられる。
【0040】
ワープロデータ上で表現できず、文字列に置き換える情報は、画像・罫表・外字・合成文字・縦中横などが挙げられる。
第1の変換手段P1は、ワープロデータに取り込めない画像があった場合、画像のファイル名を取得し、
図4に示す文字列に変換してワープロデータの所定の位置に配置する。
また、第1の変換手段P1は、罫表があった場合は、罫表内のテキストのみを抽出し、
図4に示す所定の文字列で罫表内のテキストを囲んでからワープロデータの所定の位置に配置する。
さらに、第1の変換手段P1は、外字があった場合は、使用されている外字の文字コードを
図4の例のような文字列に変換し、ワープロデータの所定の位置に配置する。
さらに、第1の変換手段P1は、合成文字・縦中横があった場合は、ワープロソフト上での表現が困難であるため、該当するテキストデータを
図4で示す文字列で囲み、ワープロデータの所定の位置に配置する。
【0041】
第1の変換手段P1は、電子書籍に不要となる柱やノンブルなどのテキストデータをワープロデータに変換しない。
これは、一般的な電子書籍が、柱として表示する文字列をテキストデータとして保持しないためであり、組版データ内のテキストデータを必要としないためである。また、電子書籍には頁の概念が存在しないため、同様にノンブルのテキストデータもワープロデータには変換しない。
【0042】
図5に、組版データからワープロデータへの段落情報の変換例を示す。
一般的に組版データは、段落情報の定義部分とテキストデータの定義部分が分かれている。この例では、組版データの最初に段落情報が定義され、その後にテキストデータが定義されている。
段落情報は、それぞれ段落スタイル名と段落情報が設定されている。この例では、行頭の「DM」の後の番号「1」・「30」がスタイル名に該当しており、番号以降に文字サイズ、フォント、段落インデントの段落情報が設定されている。
テキストデータでは、段落の先頭で段落スタイル名が呼び出されており、この呼び出しによって段落情報が各段落に適用される。この例では、「CM」の後の番号「30」・「1」が呼び出されている段落スタイル名であり、それぞれの段落情報が適用されることで組版データのレイアウトがワープロソフト上でも再現される。
【0043】
第1の変換手段P1は、初めに、組版データから段落情報の定義箇所を読み込み、段落情報毎に段落スタイル名と段落情報を記憶領域に記憶する。次にテキストデータを読み込むが、段落情報を呼び出している場合は、まず記憶領域に記憶している段落情報から対応する段落スタイル名を呼び出し、段落情報をワープロデータに変換した後、テキストデータをワープロデータに変換する。
【0044】
図6に組版データからワープロデータへのインライン情報の変換例を示す。
インライン情報はテキストデータ内で定義されており、タグまたは組版制御用の特殊な文字によってインライン情報が設定されている。
この例では、組版制御用の特殊文字によってフォント・下線・文字サイズが設定されており、該当する文字列の開始位置と終了位置が特殊文字によって囲まれている。
第1の変換手段P1は、テキストデータをワープロデータに変換する際、このインライン情報も読み込み、ワープロデータ形式のインライン情報に変換し、組版データでのレイアウトをワープロデータで再現している。
【0045】
次に、
図1に戻り、全体の流れの続きを説明する。
第2の変換手段P2は、ワープロデータから外字を検出する機能を有している。
図7に示すように、外字検出は、作業者が指定するワープロデータ用フォルダ12に記憶されているワープロデータ(第1の変換手段によって組版データから変換されたワープロデータ)を全て読み込み、第2の変換手段の外字検出を実行することで、ワープロデータ内の外字を検出する。
【0046】
また、第2の変換手段P2は、外字検出機能以外に、文字エンコーディング変換できない文字の検出機能も有している。
電子書籍では、データ形式によって文字エンコーディングが異なっており、組版データで使用されているテキストデータの文字がそのまま利用できるとは限らない。このため、事前に文字エンコーディング変換できない文字を検出し、代替文字または画像に置き換える必要がある。
作業者は、外字検出の実行時に、変換する文字エンコーディングを指定すると、外字検出は指定された文字エンコーディングに変換できない文字をワープロデータ内から検出する。すなわち、第2の変換手段P2では、外字検出と同時に文字エンコーディング変換できない文字の検出を実行することができる。
【0047】
図8に外字の検出例を示す。
この例では、ワープロデータの文字エンコーディングをUTF8からJIS X 0208に変換する場合の外字検出を示している。
第2の変換手段P2の外字検出機能は、ワープロデータ内の外字用文字列[GAI code="MA29B2"]を外字として検出し、機種依存文字である「丸付き数字1」「丸付き数字2」「〜」をJIS X 0208に変換できない文字として検出している。なお、外字検出の結果は、
図8に示す例のような一覧形式で表示される。
【0048】
また、
図9に示すように、第2の変換手段P2は、ワープロデータ内の外字を置き換える機能(外字置換機能)も有する。
第2の変換手段P2の外字置換機能は、作業者があらかじめ作成した外字置換用ファイル19と作業者が指定するワープロデータ用フォルダ12に記憶されているワープロデータを読み込み、外字置換用ファイル19で設定された置換対象文字をワープロデータ内から検索して置換文字に置き換える。
外字置換用ファイル19は、作業者があらかじめ作成し、コンピュータ30の記憶装置38内の任意のフォルダに記憶させておく。
【0049】
図10に示す例では、ワープロデータ中の外字「[GAI code="MA29B2"]」とJIS X 0208に文字エンコーディング変換できない文字「丸付き数字1」、「丸付き数字2」をそれぞれ代替文字に置き換えている。また、JIS X 0208に文字エンコーディング変換できない文字「〜」は、該当する代替文字が無いため、作成した画像データに置き換える。
なお、外字を画像データに置き換える場合、
図10の例に定義した画像指定用の文字列を置換文字に設定する。また、画像ファイル名を保持することで、第3または第4の変換手段(後述する)を用いて、後の工程で設定したファイル名の画像に置き換えることができるようになる。
【0050】
外字をどの代替文字、または画像に置き換えるかは、作成する電子書籍データによって異なるため、作業者がその必要に応じて外字置換用ファイル19を手作業で作成する。
また、外字置換用ファイル19を作成する際、置換対象となる外字は前述の外字検出機能によって一覧表示されるため、この検出結果に基づいて外字置換用ファイル19を作成してもよい。
【0051】
第2の変換手段P2は、別途作成した画像データを読み込み、ワープロデータに取り込む機能も有する。
図11で示すように、画像取り込み機能は、作業者が指定する画像データ用フォルダ14に記憶された画像データと、ワープロデータ用フォルダ12に記憶されているワープロデータを読み込み、ワープロデータ中の画像指定用の文字列を検索し、文字列で設定されている画像ファイル名から対象となる画像データを抽出して、ワープロデータの画像用文字列の所在位置に抽出した画像データを埋め込む。
【0052】
第2の変換手段P2による、外字検出、文字エンコーディング変換できない文字の検出、外字置換、画像データの取り込み等が完了した後、ワープロデータに対して作業者が手作業で整形を行う。
整形内容としては、字句の修正、段落・テキストのスタイル設定、レイアウト調整、画像の貼り付け、リンク設定などがある。
この整形作業は、それぞれ形式が異なる電子書籍データ上で整形を行うのではなく、一般的なワープロデータ上で整形を行うことで、電子書籍データに詳しくなくても作業が行え、効率よく整形作業が行える。
また、検索・文書比較・変更履歴・ハイパーリンクなどのワープロソフトの機能を利用することで、整形した内容を簡単に確認できることも、整形作業の特徴の1つとして挙げられる。
【0053】
整形作業では、修正指示の原稿に基づき、ワープロデータに対して、作業者が手作業で字句の修正や空行や改頁等のレイアウト調整を行う。
字句修正やレイアウト調整は、ワープロソフトで作業を行うため、検索や文書比較、変更履歴などのワープロ機能を使って、整形内容の検出、確認を行う。
【0054】
スタイル設定では、事前に作成したレイアウト定義に基づいて、段落またはテキストにスタイルを設定する。ここでのスタイルとは、行揃え・インデント・文字サイズ・文字色等のレイアウト情報の組み合わせを名前を付けて個別に登録したものであり、この登録したスタイルを段落またはテキストに適用することで、ワープロデータに均一なレイアウトを容易に設定することが可能になる。なお、スタイル機能の代表的なものとしては、WORDのスタイルシート機能が挙げられる。
【0055】
リンクの設定では、ワープロソフトの機能を利用して、ワープロデータ上でのリンク設定を可能にする。具体的な作業としては、参照先の文字列に対してブックマークを設定し、参照元に文字列に設定したハイパーリンクで参照先のブックマークを選択することでリンクが設定される。
【0056】
後述するように第3または第4の変換手段は、このワープロデータのブックマークとハイパーリンクの情報を解析・変換することで、電子書籍データまたはマークアップ言語データでのリンクを実現する。
【0057】
画像の貼り付けでは、作業者が新たに追加する画像などをワープロデータに手作業で貼り付ける。また、書籍とは異なる位置に画像を配置する場合は、ワープロソフトのカット&ペースト機能を使い、画像を任意の位置に移動する。
【0058】
作業者の手作業による整形作業終了後、第3の変換手段P3によってワープロデータを電子書籍データに変換する。
図12で示すように、第3の変換手段P3は、作業者によって指定されたワープロデータ用フォルダ12に記憶されているワープロデータを読み込み、テキストデータ・段落情報・インライン情報等を電子書籍データの形式に変換し、作業者が指定する電子書籍データ用フォルダ16に、変換した電子書籍データを記憶する。
【0059】
第3の変換手段P2は、テキストデータと段落スタイル・行揃え・改行・改ページ等からなる段落情報とテキストスタイル・文字サイズ・フォント・イタリック・下線・上付き文字・下付き文字・ルビ・傍点・リンク等からなるインライン情報をワープロデータから読み込み、電子書籍データのデータ形式に応じて変換を実行する。
【0060】
また、第3の変換手段P3は、ワープロデータに取り込んだ画像データを解析・抽出し、電子書籍データ用フォルダ16内に配置された画像データ用フォルダ17に、ワープロデータから抽出した画像データを記憶する。これにより、ワープロデータに取り込んだ画像データが電子書籍データからも閲覧できる。なお、第3の変換手段P3を用いた変換工程の実行時に用いる画像データ用フォルダ17は、電子書籍データ用フォルダ16内に配置されたものであり、上述した第2の変換手段P2の変換工程で用いた画像データ用フォルダ16とは異なるフォルダである。
【0061】
第3の変換手段P3は、作業者が変換する電子書籍のデータ形式を選択することで、ワープロデータから複数種類の電子書籍データを作成する。作成される電子書籍データの例としては、XMDF、EPUB、ドットブックなどが挙げられる。
【0062】
次に、マークアップ言語データの作成方法について説明する。
マークアップ言語データの作成については、組版データから、第2の変換手段P2を用いた変換後に作業者が手作業で整形するまでは、電子書籍データ作成方法と共通である。したがって、組版データから、第2の変換手段P2を用いた変換後に作業者が手作業で整形するまでは、説明を省略する。
【0063】
作業者の手作業による整形作業終了後、第4の変換手段P4によってワープロデータをマークアップ言語データに変換する。ここでいうマークアップ言語データとは、電子書籍以外のHTMLやXMLなどのデータのことを指している。
図13で示すように、第4の変換手段P4は、作業者によって指定されたワープロデータ用フォルダ12に記憶されているワープロデータを読み込み、テキストデータ・段落情報・インライン情報等をマークアップ言語データの形式に変換し、作業者が指定するマークアップ言語データ用フォルダ18に、変換したマークアップデータを記憶する。
この第4の変換手段P4を用いることで、電子書籍以外のマルチメディアデータの提供にも対応することが可能である。
【0064】
第4の変換手段P4は、テキストデータと段落スタイル・行揃え・改行・改ページ等からなる段落情報とテキストスタイル・文字サイズ・フォント・イタリック・下線・上付き文字・下付き文字・ルビ・傍点・リンク等からなるインライン情報をワープロデータから読み込み、マークアップ言語データの形式に変換する。
【0065】
また、第4の変換手段P4は、ワープロデータに取り込んだ画像データをプログラムによって取り出し、マークアップ言語データ用フォルダ18内に配置された画像データ用フォルダ13に取り出した画像データを記憶する。これにより、ワープロデータに取り込んだ画像データをマークアップ言語データからも閲覧できる。なお、第4の変換手段P4を用いた変換工程の実行時に用いる画像データ用フォルダ13は、マークアップ言語データ用フォルダ18内に配置されたものであり、上述した第2の変換手段P2の変換工程で用いた画像データ用フォルダ16とは異なるフォルダである。
【0066】
また、第4の変換手段P4は、電子書籍用に作成したワープロデータをHTMLに変換することが可能であり、ワープロデータを電子書籍データに変換せずともWEBブラウザを使って内容を確認できることも特徴の1つとして挙げられる。
【0067】
また、第4の変換手段P4は、特定のデータ形式に捉われずにマークアップ言語データに変換するようにしてもよい。
例えば、経済産業省「コンテンツ緊急電子化事業」等にて、データ形式の差を吸収するために汎用的なフォーマットが策定されたならば、そのデータ形式に変換することで、編集の容易さと、データ形式の統一が両立する。