(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022191781
(43)【公開日】2022-12-28
(54)【発明の名称】資料編集装置及びプログラム
(51)【国際特許分類】
G06F 40/103 20200101AFI20221221BHJP
G06F 40/109 20200101ALI20221221BHJP
【FI】
G06F40/103
G06F40/109
【審査請求】未請求
【請求項の数】11
【出願形態】OL
(21)【出願番号】P 2021100223
(22)【出願日】2021-06-16
(71)【出願人】
【識別番号】000002897
【氏名又は名称】大日本印刷株式会社
(74)【代理人】
【識別番号】100106002
【弁理士】
【氏名又は名称】正林 真之
(74)【代理人】
【識別番号】100165157
【弁理士】
【氏名又は名称】芝 哲央
(74)【代理人】
【識別番号】100120891
【弁理士】
【氏名又は名称】林 一好
(72)【発明者】
【氏名】田中 隆寛
(72)【発明者】
【氏名】生駒 拓也
【テーマコード(参考)】
5B109
【Fターム(参考)】
5B109NA04
5B109RA11
(57)【要約】
【課題】デザイン性を有する資料を簡単に作成することが可能な資料編集装置及びプログラムを提供する。
【解決手段】資料編集サーバ1は、端末5から受け付けた資料データが含むページを構成する各要素の構造情報に基づき、各要素の配置を変更する配置変更部12と、ページのテキストフォントを変更及び/又は装飾するテキスト装飾部15と、配置変更部12及び/又はテキスト装飾部15による処理後のページを含む資料データを、端末5に出力する処理後資料出力部18と、を備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
資料を構成する各要素の構造情報に基づき、各要素の配置を変更する配置変更手段と、
前記資料のテキストフォントを変更及び/又は装飾する装飾手段と、
前記配置変更手段及び/又は前記装飾手段による処理後の前記資料を出力する処理後資料出力手段と、
を備える、資料編集装置。
【請求項2】
請求項1に記載の資料編集装置において、
前記資料に含まれるテキストから単語を抽出する単語抽出手段を備え、
前記装飾手段は、前記単語抽出手段が抽出した所定の構造情報内の単語と、前記単語抽出手段が抽出した他の単語との関連性に基づいて単語を装飾する、資料編集装置。
【請求項3】
請求項1に記載の資料編集装置において、
前記資料に含まれるテキストから単語を抽出する単語抽出手段と、
前記単語抽出手段が抽出した前記単語をカテゴリに分類する分類手段と、
カテゴリごとに対応する装飾を記憶する記憶手段と、
を備え、
前記装飾手段は、前記分類手段による分類に基づいて、前記単語を装飾する、資料編集装置。
【請求項4】
請求項2又は請求項3に記載の資料編集装置において、
前記装飾手段は、前記単語を連接語として装飾する、資料編集装置。
【請求項5】
請求項1に記載の資料編集装置において、
前記資料の各要素のテキストをカテゴリに分類する分類手段と、
カテゴリごとに対応する装飾を記憶する記憶手段と、
を備え、
前記装飾手段は、前記分類手段による分類に基づいて、前記テキストを装飾する、資料編集装置。
【請求項6】
請求項1に記載の資料編集装置において、
構造情報ごとに対応する装飾を記憶する記憶手段を備え、
前記装飾手段は、前記構造情報に基づいて、各要素のテキストを装飾する、資料編集装置。
【請求項7】
請求項1から請求項6までのいずれかに記載の資料編集装置において、
前記装飾手段による装飾は、文字色の付与、書体の変更、文字飾りの付与及びハイライトの付与のうち少なくともいずれかを含む、資料編集装置。
【請求項8】
請求項1から請求項7までのいずれかに記載の資料編集装置において、
前記資料の各要素から前記構造情報を推定する構造推定手段を備える、資料編集装置。
【請求項9】
請求項1から請求項8までのいずれかに記載の資料編集装置において、
前記資料に含まれる各要素の前記構造情報に基づく、前記構造情報を規定したレイアウト情報を生成するレイアウト生成手段を備え、
前記配置変更手段は、前記レイアウト生成手段が生成した前記レイアウト情報に基づいて、各要素の配置を変更する、資料編集装置。
【請求項10】
請求項1から請求項9までのいずれかに記載の資料編集装置において、
前記処理後資料出力手段は、各要素の配置が異なる複数の前記資料を出力する、資料編集装置。
【請求項11】
請求項1から請求項10までのいずれかに記載の資料編集装置としてコンピュータを機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、資料編集装置及びプログラムに関する。
【背景技術】
【0002】
従来、プレゼンテーション資料の作成に不慣れな人であっても資料を作成可能な技術が開示されている(例えば、特許文献1)。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1に記載の技術を用いれば、資料を作成する際に評価が出力されるので、出力された評価にしたがってユーザが部品等を移動させて資料を作成することができる。
しかし、ユーザによる様々な操作が必要であるため、作業が煩雑であった。
【0005】
本発明は、デザイン性を有する資料を簡単に作成することが可能な資料編集装置及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明は、以下のような解決手段により、前記課題を解決する。
第1の発明は、資料を構成する各要素の構造情報に基づき、各要素の配置を変更する配置変更手段と、前記資料のテキストフォントを変更及び/又は装飾する装飾手段と、前記配置変更手段及び/又は前記装飾手段による処理後の前記資料を出力する処理後資料出力手段と、を備える、資料編集装置である。
第2の発明は、第1の発明の資料編集装置において、前記資料に含まれるテキストから単語を抽出する単語抽出手段を備え、前記装飾手段は、前記単語抽出手段が抽出した所定の構造情報内の単語と、前記単語抽出手段が抽出した他の単語との関連性に基づいて単語を装飾する、資料編集装置である。
第3の発明は、第1の発明の資料編集装置において、前記資料に含まれるテキストから単語を抽出する単語抽出手段と、前記単語抽出手段が抽出した前記単語をカテゴリに分類する分類手段と、カテゴリごとに対応する装飾を記憶する記憶手段と、を備え、前記装飾手段は、前記分類手段による分類に基づいて、前記単語を装飾する、資料編集装置である。
第4の発明は、第2の発明又は第3の発明の資料編集装置において、前記装飾手段は、前記単語を連接語として装飾する、資料編集装置である。
第5の発明は、第1の発明の資料編集装置において、前記資料の各要素のテキストをカテゴリに分類する分類手段と、カテゴリごとに対応する装飾を記憶する記憶手段と、を備え、前記装飾手段は、前記分類手段による分類に基づいて、前記テキストを装飾する、資料編集装置である。
第6の発明は、第1の発明の資料編集装置において、構造情報ごとに対応する装飾を記憶する記憶手段を備え、前記装飾手段は、前記構造情報に基づいて、各要素のテキストを装飾する、資料編集装置である。
第7の発明は、第1の発明から第6の発明までのいずれかの資料編集装置において、前記装飾手段による装飾は、文字色の付与、書体の変更、文字飾りの付与及びハイライトの付与のうち少なくともいずれかを含む、資料編集装置である。
第8の発明は、第1の発明から第7の発明までのいずれかの資料編集装置において、前記資料の各要素から前記構造情報を推定する構造推定手段を備える、資料編集装置である。
第9の発明は、第1の発明から第8の発明までのいずれかの資料編集装置において、前記資料に含まれる各要素の前記構造情報に基づく、前記構造情報を規定したレイアウト情報を生成するレイアウト生成手段を備え、前記配置変更手段は、前記レイアウト生成手段が生成した前記レイアウト情報に基づいて、各要素の配置を変更する、資料編集装置である。
第10の発明は、第1の発明から第9の発明までのいずれかの資料編集装置において、前記処理後資料出力手段は、各要素の配置が異なる複数の前記資料を出力する、資料編集装置である。
第11の発明は、第1の発明から第10の発明までのいずれかの資料編集装置としてコンピュータを機能させるためのプログラムである。
【発明の効果】
【0007】
本発明によれば、デザイン性を有する資料を簡単に作成することが可能な資料編集装置及びプログラムを提供することができる。
【図面の簡単な説明】
【0008】
【
図1】第1実施形態に係る資料編集システムの全体概要図及び資料編集サーバの機能ブロック図である。
【
図2】第1実施形態に係る資料編集サーバの記憶部の例を示す図である。
【
図3】第1実施形態に係る資料編集サーバの資料データ処理を示すフローチャートである。
【
図4】第1実施形態に係る資料編集サーバの配置変更処理を示すフローチャートである。
【
図5】第1実施形態に係る資料編集サーバで編集するページの具体例を示す図である。
【
図6】第1実施形態に係る資料編集サーバが生成したレイアウト画像の例を示す図である。
【
図7】第1実施形態に係る資料編集サーバのテキスト装飾処理を示すフローチャートである。
【
図8】第1実施形態に係る単語の関連性を説明するための具体例を示す図である。
【
図9】第1実施形態に係る資料編集サーバの資料データ処理により生成されたページの具体例を示す図である。
【
図10】第2実施形態に係る資料編集システムの全体概要図及び資料編集サーバの機能ブロック図である。
【
図11】第2実施形態に係る資料編集サーバの配置ルール記憶部の例を示す図である。
【
図12】第2実施形態に係る資料編集サーバの配置変更処理を示すフローチャートである。
【
図13】第2実施形態に係る資料編集サーバのテキスト装飾処理を示すフローチャートである。
【
図14】第2実施形態に係る単語の関連性を説明するための具体例を示す図である。
【発明を実施するための形態】
【0009】
以下、本発明を実施するための形態について、図を参照しながら説明する。なお、これは、あくまでも一例であって、本発明の技術的範囲はこれに限られるものではない。
(第1実施形態)
<資料編集システム100>
図1は、第1実施形態に係る資料編集システム100及び資料編集サーバ1の機能ブロック図である。
図2は、第1実施形態に係る資料編集サーバ1の記憶部20の例を示す図である。
【0010】
図1に示す資料編集システム100は、編集対象とする資料データを、端末5が資料編集サーバ1(資料編集装置)に送信すると、資料編集サーバ1が、受信した資料データを用いて、ページ(資料)に含まれる各要素の配置を変更し、テキストフォントを変更及び/又は装飾した、編集後のページからなる処理後資料データを端末5に送信するシステムである。
資料編集システム100は、資料編集サーバ1と、端末5とを備える。資料編集サーバ1と、端末5とは、通信ネットワークNを介して通信可能に接続されている。通信ネットワークNは、例えば、インターネット回線等であり、有線であるか無線であるかを問わない。
【0011】
以下において、資料データは、例えば、マイクロソフト社のPowerPoint(登録商標)等のプレゼンテーションソフトにより作成されたプレゼンテーション資料に係るデータであり、プレゼンテーション資料は、1ページ以上あるものとする。そして、以下においては、1ページ分の編集を例に説明するが、複数ページある場合には、各ページにおいて同様の編集を行うものとする。
【0012】
<資料編集サーバ1>
資料編集サーバ1は、端末5から受信した資料データのページに対して、各要素の配置変更及びテキストフォントの変更及び/又は装飾を行う。各要素の配置変更及びテキストフォントの変更及び/又は装飾により、ページは、デザイン性が向上した、見栄えのよいものになる。そして、資料編集サーバ1は、編集後ページ(配置変換後かつ装飾後のページ)を含む処理後資料データを、端末5に送信する。
資料編集サーバ1は、制御部10と、記憶部20と、通信インタフェース部29とを備える。
【0013】
制御部10は、資料編集サーバ1の全体を制御する中央処理装置(CPU)である。制御部10は、記憶部20に記憶されているオペレーティングシステム(OS)やアプリケーションプログラムを適宜読み出して実行することにより、上述したハードウェアと協働し、各種機能を実行する。
制御部10は、資料受付部11と、配置変更部12(配置変更手段)と、テキスト装飾部15(装飾手段)と、処理後資料出力部18(処理後資料出力手段)とを備える。
【0014】
資料受付部11は、端末5から資料データを受け付ける。資料受付部11が受け付ける資料データのページ数やデータ形式等は、特に限定されない。また、資料受付部11が受け付ける資料データのページには、テキストや画像等の各要素がユーザによって配置されている。しかし、テキストの配置位置は、整列されていなくてよい。また、各テキストには、装飾が施されていなくてよい。
【0015】
配置変更部12は、ページを構成する各要素の配置を変更する。
配置変更部12は、構造推定部13(構造推定手段)と、レイアウト生成部14(レイアウト生成手段)とを備える。
構造推定部13は、ページに含まれる各要素から構造情報を推定する。ここで、構造情報とは、例えば、見出し、本文、画像のキャプション等をいう。
構造推定部13は、ページから各要素を抽出し、各要素の書式、レイアウト等の特徴を抽出する。そして、構造推定部13は、予め設定したルールに基づいて、各要素の書式、レイアウト等に対応するタグ情報を推定する。具体的には、構造推定部13は、例えば、見出しに相当するテキスト箇所を抽出し、当該テキストのフォント、文字サイズ、レイアウト等に基づき、当該テキストが、例えば、見出しであることを推定する。
【0016】
レイアウト生成部14は、ページから各要素の構造情報を規定したレイアウト画像(レイアウト情報)を生成する。レイアウト生成部14は、レイアウト画像を手動で生成してもよい。また、レイアウト生成部14は、レイアウト画像を自動生成してもよい。
レイアウト画像を自動生成する場合、レイアウト生成部14は、例えば、画像自体を生成するAIにより、複数通りのレイアウト画像を生成してもよい。AIによるレイアウト画像の生成の場合、レイアウト変更前の画像と、レイアウト変更後の画像との対応関係を学習した学習モデルを用いる。なお、学習モデルに、構造推定部13が推定した構造情報を補足情報として入力データに加えてもよい。
【0017】
また、レイアウト生成部14は、例えば、レイアウト情報を生成し、レイアウト画像を生成し、生成したレイアウト画像を評価して、評価の高いレイアウト画像を採用する、といった処理を行うものであってもよい。
この処理の場合、レイアウト生成部14は、最低限の規定(例えば、グリッドを揃える、各要素が被らないようにする等)を設けた上で、当該規定に反しないように各要素の構造情報を所定の領域内に配置する配置座標又は各要素のサイズをランダムに決定する。そして、レイアウト生成部14は、複数通りのレイアウト情報を生成する。
次に、レイアウト生成部14は、生成した各レイアウト情報に従い、各要素の構造情報を所定の領域内に配置した各レイアウト画像を生成する。
【0018】
その後、レイアウト生成部14は、生成された各レイアウト画像について、既存の資料のレイアウトを機械学習によって学習済みの学習済みモデルを用い、評価スコアを算出する。そして、レイアウト生成部14は、評価スコアの高いものから、例えば、3つ等、複数のレイアウト画像を採用する。なお、レイアウト生成部14が生成するレイアウト画像の数は、任意であるが、後からユーザが選択可能なように、3つ程度あるのが望ましい。
【0019】
なお、レイアウト生成部14は、レイアウト画像を生成するものに限定せず、レイアウトを数値で表したレイアウト情報を生成するものであってもよい。
【0020】
そして、配置変更部12は、レイアウト生成部14によって生成された複数のレイアウト画像を基に、各要素の配置を変更し、必要に応じてリサイズを行う。配置変更部12では、複数のレイアウト画像を用いて、複数の配置変更後のページを生成できる。
【0021】
テキスト装飾部15は、複数の配置変更後のページの各々について、テキストフォントを変更及び/又は装飾する。装飾するテキストフォントとしては、要素を構成するテキストへの装飾や、要素内の単語への装飾がある。また、装飾としては、文字色の付与、書体の変更、文字飾りやマーカ(ハイライト)等の付与等がある。
テキスト装飾部15は、単語抽出部16(単語抽出手段)と、テキスト分類部17(分類手段)とを備える。
【0022】
単語抽出部16は、ページに含まれている各要素のうち、例えば、テキストから単語を抽出する。単語抽出部16は、テキストから単語を抽出する際に、例えば、形態素解析を行って、名詞を単語として抽出してもよい。そして、単語抽出部16は、抽出した単語を、当該要素の構造情報に対応付けてもよい。
テキスト分類部17は、ページに含まれる各要素のテキストをカテゴリに分類する。ここで、テキスト分類部17は、文章をカテゴリに分類する公知の手法を用いて、テキストをカテゴリに分類できる。公知の手法としては、例えば、Yoon Kim、“Convolutional Neural Networks for Sentence Classification”、[online]、[令和3年5月27日検索]、インターネット〈URL:https://www.aclweb.org/anthology/D14-1181.pdf〉等がある。
【0023】
そして、テキスト装飾部15は、例えば、単語抽出部16が抽出した、構造情報が見出しの単語(所定の構造情報内の単語)と、見出しを除いた他の単語との関連性に基づいて、他の単語に色を付与する。ここで、テキスト装飾部15は、単語同士の関連性を、例えば、後述する関連語記憶部22に記憶された知識グラフを用いて判断してもよい。その場合、テキスト装飾部15は、知識グラフを基に見出しの単語と他の単語との類似度を算出し、所定の閾値以上である高い類似度の他の単語を、関連性があるとして着色する。
【0024】
また、テキスト装飾部15は、テキスト分類部17が分類したカテゴリに基づいて、テキストフォントを変更及び/又は装飾する。より具体的には、テキスト装飾部15は、後述する書体変更用テーブル23を参照し、当該テキストの書体を、テキストのカテゴリに対応する書体に変更する。
さらに、テキスト装飾部15は、ページの各要素の構造情報に基づいて、各要素のテキストフォントを変更及び/又は装飾する。より具体的には、テキスト装飾部15は、後述する装飾付加用テーブル24を参照し、テキストの構造情報に対応する文字飾りやマーカ等の装飾の付与を、当該テキストフォントに行う。
【0025】
処理後資料出力部18は、テキスト装飾部15による編集後ページを含む処理後資料データを、端末5に送信する。処理後資料出力部18は、配置の異なる複数の編集後ページを、各処理後資料データとし、複数の処理後資料データを、端末5に送信する。
そうすることで、端末5では、それぞれ異なる配置の複数のページを、ユーザが案として見比べることができる。
【0026】
記憶部20は、制御部10が各種の処理を実行するために必要なプログラム、データ等を記憶するためのハードディスク、半導体メモリ素子等の記憶領域である。
記憶部20は、プログラム記憶部21と、関連語記憶部22と、書体変更用テーブル23(記憶手段)と、装飾付加用テーブル24(記憶手段)とを備える。
プログラム記憶部21は、各種のプログラムを記憶する記憶領域である。プログラム記憶部21は、資料編集プログラム21aを記憶している。資料編集プログラム21aは、資料編集サーバ1の制御部10が実行する各種機能を行うためのプログラムである。なお、資料編集プログラム21aは、1つのプログラムでなくても、機能ごとに別プログラム(モジュール)としてもよい。
【0027】
関連語記憶部22は、単語同士の関連性を記憶する記憶領域である。
図2(A)に示すように、関連語記憶部22は、単語同士の関連性を、例えば、知識グラフを記憶していてもよい。知識グラフは、特定の単語とその関連性をもとに構築されたグラフである。知識グラフは、単語をノードとし、単語同士の関係性をエッジとして、エッジを介して各ノードが結合される。関連性が高いほど、2つのノードの距離が短くなる。
なお、関連語記憶部22は、知識グラフを記憶するものを例示したが、これに限定されない。複数の単語の関連性(類似度)が分かるものであれば、他のものであってもよい。
【0028】
書体変更用テーブル23は、
図2(B)に示すように、カテゴリと書体とを関連づけたテーブルである。
図2(B)の例では、カテゴリとして、「宗教」、「日本史」、「サブカル」といったものがあり、それに対応する書体が関連付けられている。なお、カテゴリには、いずれのカテゴリにも含まれない場合の「その他」を有し、「その他」に対応する書体が関連付けられているのが望ましい。
装飾付加用テーブル24は、
図2(C)に示すように、構造情報と付加する装飾とを関連づけたテーブルである。
図2(C)の例では、構造情報として、「見出し」、「本文」といったものがあり、それに対応する付加する装飾が関連付けられている。付加する装飾としては、文字スタイル(太字、斜体等)や、下線といった文字飾りや、マーカといったものがある。
なお、上記した書体変更用テーブル23及び装飾付加用テーブル24は、一例であり、他のテーブルを有してももちろんよいし、各項目の内容についても異なるものであってよい。
【0029】
通信インタフェース部29は、通信ネットワークNを介して端末5との通信を行うためのインタフェースである。
ここで、コンピュータとは、制御部、記憶装置等を備えた情報処理装置をいい、資料編集サーバ1は、制御部、記憶部等を備えた情報処理装置であり、コンピュータの概念に含まれる。
【0030】
<端末5>
端末5は、ユーザが操作する装置であり、資料データを資料編集サーバ1に送信し、処理後資料データを資料編集サーバ1から受信する。そして、端末5は、資料編集サーバ1による編集後の各ページを表示する。端末5は、例えば、PC等である。端末5は、その他、タブレットに代表されるコンピュータの機能を併せ持った携帯型の装置であってもよく、例えば、スマートフォンや携帯電話機等でもよい。
端末5は、図示しないが、制御部、記憶部、入力部、出力部、通信インタフェース部等を備える。
【0031】
<資料編集サーバ1の処理>
次に、資料編集サーバ1での処理について説明する。
図3は、第1実施形態に係る資料編集サーバ1の資料データ処理を示すフローチャートである。
図4は、第1実施形態に係る資料編集サーバ1の配置変更処理を示すフローチャートである。
図5は、第1実施形態に係る資料編集サーバ1で編集するページ40の具体例を示す図である。
図6は、第1実施形態に係る資料編集サーバ1が生成したレイアウト画像60a~60cの例を示す図である。
図7は、第1実施形態に係る資料編集サーバ1のテキスト装飾処理を示すフローチャートである。
図8は、第1実施形態に係る単語の関連性を説明するための具体例を示す図である。
図9は、第1実施形態に係る資料編集サーバ1の資料データ処理により生成された編集後ページ90a~90cの具体例を示す図である。
【0032】
図3のステップS(以下、「ステップS」を単に「S」という。)11において、資料編集サーバ1の制御部10(資料受付部11)は、端末5から編集前の資料データを受信する。
S12において、制御部10(配置変更部12)は、資料データのページに対して配置変更処理を行う。
【0033】
ここで、配置変更処理について、
図4に基づき説明する。
図4のS21において、制御部10(構造推定部13)は、ページに含まれる各要素の構造情報を推定する。
図5は、横方向Xを長辺とするページ40の各要素に対して構造情報を推定した例である。
ページ40は、構造情報を見出しと推定した要素41と、構造情報を本文と推定した要素42と、構造情報をリストと推定した3つの要素43-1~43-3と、構造情報をキャプションと推定した3つの要素44-1~44-3と、構造情報を画像と推定した3つの要素45-1~45-3とを含む。
なお、ページ40は、端末5から受信した編集前の資料データに基づくページである。そのため、例えば、リストであると推定した3つの要素43-1~43-3は、整列がされていない状態である。
【0034】
図4のS22において、制御部10(レイアウト生成部14)は、各要素の構造情報を規定したレイアウト画像60a~60cを生成する。
図6は、制御部10が生成した3つの異なるレイアウト画像60a~60cを示す。
レイアウト画像60a(図示しないが、60b及び60cも同様)は、見出し領域61と、本文領域62と、3つのリスト領域63-1~63-3と、3つのキャプション領域64-1~64-3と、3つの画像領域65-1~65-3とを含む。
レイアウト画像60aは、見出し領域61、本文領域62及び3つのリスト領域63-1~63-3が中央揃えになっている。また、3つのキャプション領域64-1~64-3が横に一列に並んで配置され、各キャプション領域64-1~64-3の下方向(
図5におけるY方向)に、画像領域65-1~65-3が横に並んで配置されている。
レイアウト画像60b及びレイアウト画像60cも、それぞれの位置が異なるレイアウト画像である。
【0035】
図4のS23において、制御部10(配置変更部12)は、生成した各レイアウト画像60a~60cに各要素を配置する。制御部10は、例えば、
図6に示すレイアウト画像60aにおいて、見出し領域61に、
図5に示す要素41を配置する。また、制御部10は、
図6に示すレイアウト画像60aにおいて、同様に、本文領域62に、
図5に示す要素42を配置する。制御部10は、
図6に示すレイアウト画像60b及び60cにも同様に行う。
S24において、制御部10(配置変更部12)は、必要に応じて、配置した各要素をリサイズする。そして、各要素41~45がレイアウト画像60(60a~60c)の各領域61~65に収まるようにする。その後、制御部10は、処理を
図3のS13に移す。
【0036】
図3のS13において、制御部10(テキスト装飾部15)は、S12の処理における配置変更後の各ページに対してテキスト装飾処理を行う。
ここで、テキスト装飾処理について、
図7に基づき説明する。
図7のS31において、制御部10(単語抽出部16)は、ページに含まれるテキストから単語を抽出する。
S32において、制御部10(テキスト装飾部15)は、関連語記憶部22を参照し、見出しの単語と、見出しの単語を除く他の単語との関連性に基づいて、他の単語を着色する。
【0037】
単語間の関連性に関する例を、
図8に基づいて説明する。
図8に示す単語群70は、ページ40(
図5参照)に含まれるテキストから、制御部10が抽出した単語である。単語群70は、抽出された単語に対して構造情報が対応付けられている。例えば、抽出単語71は、構造情報が「見出し」の要素41(
図5参照)から抽出された、「日本」と「文化」との単語である。同様に、抽出単語72は、構造情報が「本文」の要素42から抽出された単語であり、抽出単語73-1は、構造情報が「リスト」の要素43-1から抽出された単語であり、抽出単語73-2は、構造情報が「リスト」の要素43-2から抽出された単語である。
【0038】
次に、制御部10は、関連語記憶部22に記憶された知識グラフから、見出しに含まれる単語と、他の単語との間の関連性を求めるため、両単語の類似度を計算する。
知識グラフ22aは、見出しに含まれる単語「日本」に関して関連性を基に構築されたグラフである。また、知識グラフ22bは、見出しに含まれる単語「文化」に関して関連性を基に構築されたグラフである。
また、見出しの単語と、他の単語とにおける2つの単語間の類似度Nは、事前に設定した最大値を10とし、2つの単語間の移動量をMとした場合に、以下の(式1)によって算出する。
【0039】
【0040】
なお、単語間の移動量Mは、単語間にあるエッジの数である。また、(式1)では、最大値を10にしたが、任意の値であってよい。
そして、制御部10は、(式1)によって算出された単語の類似度Nが、閾値(例えば、5)以上の場合に、当該単語を着色するものに決定する。
【0041】
具体例で説明すると、抽出単語72に含まれる単語「神社」と単語「日本」とについて、知識グラフ22aを参照すると、「神社」と「日本」との移動量Mが2である。そこで、上記の(式1)に当てはめると、単語「神社」と単語「日本」との類似度は、8と算出できる。そのため、制御部10は、単語「神社」を着色対象に決定する。
また、抽出単語73-1に含まれる単語「浅草寺」と単語「日本」とについて、知識グラフ22aを参照すると、「浅草寺」と「日本」との移動量Mが2である。そこで、上記の(式1)に当てはめると、単語「浅草寺」と単語「日本」との類似度は、8と算出でき、制御部10は、単語「浅草寺」を着色対象に決定する。
他方、抽出単語73-2に含まれる単語「石」と単語「日本」とについて、知識グラフ22aを参照し、図示していないが、「石」と「日本」との移動量Mが8であるとする。そこで、上記の(式1)に当てはめると、単語「石」と単語「日本」との類似度は、2と算出でき、閾値未満であるので、制御部10は、単語「石」を着色対象にしない。
【0042】
そして、制御部10(テキスト装飾部15)は、着色対象の単語を、例えば、予め決められた色に着色する。
なお、制御部10は、例えば、類似度に応じて異なる色に着色するようにしてもよい。例えば、類似度がより高ければ、明度や彩度をより高くして、より鮮明な色にしてもよい。また、制御部10は、予め決められた色ではなく、ページの背景色と補色の関係の色に着色してもよい。
【0043】
図7のS33において、制御部10(テキスト分類部17)は、各要素のテキストをカテゴリに分類する。制御部10は、上記したように、公知の方法によって、テキストをカテゴリに分類できる。
S34において、制御部10(テキスト装飾部15)は、書体変更用テーブル23を参照し、テキストのカテゴリに基づいて、テキストの書体を変更する。
例えば、要素43-2(
図5参照)に含まれるテキスト「城:敵を防ぐために土や石で堅固に築いた建物(姫路城など)」の場合、
図2(B)の書体変更用テーブル23に示すカテゴリでは、「日本史」に分類される。そこで、制御部10は、当該テキストの書体を、楷書体に決定する。
【0044】
S35において、制御部10(テキスト装飾部15)は、装飾付加用テーブル24を参照し、各要素の構造情報に基づいてテキストフォントに装飾を付加する。
例えば、要素41(
図5参照)は、構造情報が「見出し」である。
図2(C)の装飾付加用テーブル24を参照すると、構造情報の「見出し」は、付加する装飾として太線及び下線が対応する。そこで、制御部10は、当該テキストを太線にし、下線を付す。
その後、制御部10は、処理を
図3のS14に移す。
【0045】
図9(A)から(C)は、ページ40(
図5参照)に対して配置変更及び装飾を行った編集後ページ90aから90cを示す。
図9(A)に示す編集後ページ90aは、
図6のレイアウト画像60aに対応する。また、
図9(B)に示す編集後ページ90bは、
図6のレイアウト画像60bに対応し、
図9(C)に示す編集後ページ90cは、
図6のレイアウト画像60cに対応する。
編集後ページ90(90a~90c)は、ページに含まれる各要素の構造情報を考慮した配置がされ、各要素に含まれるテキストの意味情報を考慮した装飾がされたものになっている。その結果、編集後ページ90は、デザイン性を有するものになる。
【0046】
図3のS14において、制御部10(処理後資料出力部18)は、S13の処理における装飾処理後の各ページに対応する各処理後資料データを、依頼のあった端末5に送信する。なお、処理後資料データは、端末5が送信した資料データと同じデータ形式のものである。そして、制御部10は、本処理を終了する。
【0047】
このように、第1実施形態の資料編集システム100によれば、以下のような効果がある。
(1)資料編集サーバ1は、端末5から受け付けた編集元の資料データのページについて、各要素の構造情報に基づいて各要素の配置を変更し、配置変更後のテキストフォントを変更及び/又は装飾する。そして、資料編集サーバ1は、編集後ページを含む処理後資料データを、端末5に送信する。
よって、元の資料データのページの内容であり、配置や装飾を含む編集後ページを生成することができる。各要素の構造情報に基づいて配置をするので、構造情報を加味した最適な配置にすることができる。また、テキストフォントを変更及び/又は装飾するので、見栄えのよいものにできる。
【0048】
(2)資料編集サーバ1は、ページに含まれる各要素のテキストから単語を抽出し、構造情報が見出しの単語と他の単語との関連性に基づいて他の単語を装飾する。
また、資料編集サーバ1は、関連性が閾値以上である場合に、他の単語を装飾する。
よって、装飾する単語を、見出しと関連性の高いものにでき、重要な単語を強調して見せることができる。
【0049】
(3)資料編集サーバ1は、ページに含まれる各要素のテキストをカテゴリに分類し、当該分類に基づいてテキストフォントを変更及び/又は装飾するので、予め決めたカテゴリのテキストフォントに装飾を付加することができる。
(4)資料編集サーバ1は、ページに含まれる各要素の構造情報に基づいてテキストフォントを変更及び/又は装飾するので、予め決めた構造情報のテキストフォントに装飾を付加することができる。
(5)付加する装飾を、文字色の付与、書体の変更、文字飾りの付与及びマーカの付与のうち少なくともいずれかを含むものにすることで、装飾を付加したテキストフォント(単語及び文字列を含む)を強調させることができる。
【0050】
(6)資料編集サーバ1は、ページの各要素から構造情報を推定するので、各要素に構造情報が関連付けられていなくても、各要素の特徴から構造情報を推定できる。
(7)資料編集サーバ1は、ページに含まれる各要素の構造情報に基づく構造情報を規定したレイアウト画像を生成し、生成したレイアウト画像に基づいて各要素の配置を変更する。
よって、レイアウト画像は、ページの各要素の構造情報に対応したものにできる。また、レイアウト画像を基に、各要素の配置を自動的に変更できる。
(8)資料編集サーバ1は、各要素の配置が異なる、複数の編集後ページを生成して端末5に出力する。よって、端末5のユーザは、複数の編集後ページからユーザの好みに合ったものを選択できる。
【0051】
(第2実施形態)
第2実施形態では、第1実施形態とは異なる方法による配置変更及び装飾をするものについて説明する。なお、以降の説明において、上述した第1実施形態と同様の機能を果たす部分には、同一の符号又は末尾に同一の符号を付して、重複する説明を適宜省略する。
【0052】
<資料編集システム200>
図10は、第2実施形態に係る資料編集システム200及び資料編集サーバ201の機能ブロック図である。
図11は、第2実施形態に係る資料編集サーバ201の配置ルール記憶部225の例を示す図である。
図10に示す資料編集システム200は、資料編集サーバ201と、端末5とを備える。
【0053】
<資料編集サーバ201>
資料編集サーバ201は、制御部210と、記憶部220と、通信インタフェース部29とを備える。
制御部210は、資料受付部11と、配置変更部212(配置変更手段)と、テキスト装飾部215(装飾手段)と、処理後資料出力部18とを備える。
配置変更部212は、ページを構成する各要素の配置を変更する。
配置変更部212は、構造推定部13を備える。
配置変更部212は、構造推定部13が推定した構造情報と、配置ルール記憶部225の配置ルールとを基に、各要素の配置を変更し、必要に応じてリサイズを行う。配置変更部212では、複数の配置ルールを用いて、複数の配置変更後のページを生成できる。
【0054】
テキスト装飾部215は、複数の配置変更後のページの各々について、テキストフォントを変更及び/又は装飾する。
テキスト装飾部215は、単語抽出部16と、単語分類部217(分類手段)とを備える。
単語分類部217は、単語抽出部16により抽出されたページに含まれている各単語をカテゴリに分類する。ここで、カテゴリは、予め複数設定してあり、例えば、公知のカテゴリ分類手法を用いてクラスタリングしてもよい。公知のカテゴリ分類手法としては、例えば、Word2Vecを利用して各単語のスコアからカテゴリにクラスタリングをするものがある。
【0055】
そして、テキスト装飾部215は、例えば、単語抽出部16が抽出した、構造情報が見出しの単語(所定の構造情報内の単語)と、見出し以外の他の単語との関連性に基づいて、他の単語に色を付与する。ここで、テキスト装飾部215は、単語同士の関連性を、例えば、単語間の関係性を学習したニューラルネットワークにより、単語を数値ベクトル化して判断してもよい。その場合、テキスト装飾部215は、数値ベクトルを基に見出しの単語と他の単語との類似度を算出し、所定の閾値以上である高い類似度の他の単語を、関連性があるとして着色する。
【0056】
また、テキスト装飾部215は、単語分類部217が分類したカテゴリに基づいて、当該単語を装飾する。より具体的には、テキスト装飾部215は、書体変更用テーブル23を参照し、単語のカテゴリに対応する書体に、当該単語の書体を変更する。
さらに、テキスト装飾部215は、ページの各要素の構造情報に基づいて、各要素のテキストフォントを変更及び/又は装飾する。より具体的には、テキスト装飾部215は、装飾付加用テーブル24を参照し、テキストの構造情報に対応する装飾を、当該テキストフォントに付加する。
【0057】
記憶部220は、プログラム記憶部221と、関連語記憶部222と、書体変更用テーブル23と、装飾付加用テーブル24と、配置ルール記憶部225とを備える。
プログラム記憶部221は、各種のプログラムを記憶する記憶領域である。プログラム記憶部221は、資料編集プログラム221aを記憶している。資料編集プログラム221aは、資料編集サーバ201の制御部210が実行する各種機能を行うためのプログラムである。
関連語記憶部222は、単語同士の関連性を記憶する記憶領域であり、例えば、上記したように、単語間の関係性を学習したニューラルネットワークを記憶していてもよい。
【0058】
配置ルール記憶部225は、構造情報についてのページ上の配置を示す配置ルールを記憶する記憶領域である。
図11は、配置ルール記憶部225に記憶される配置ルール267x、267y、・・・の例を示す。ここで、以降の説明において、個々の配置ルール267x等を特に指定しない場合には、単に配置ルール267という。配置ルール267は、構造情報に対応付けて配置座標とフォントサイズとを指定したものである。配置ルール記憶部225は、複数の異なる配置ルール267を記憶する。
【0059】
<資料編集サーバ201の処理>
次に、資料編集サーバ201での処理について説明する。
図12は、第2実施形態に係る資料編集サーバ201の配置変更処理を示すフローチャートである。
図13は、第2実施形態に係る資料編集サーバ201のテキスト装飾処理を示すフローチャートである。
図14は、第2実施形態に係る単語の関連性を説明するための具体例を示す図である。
【0060】
資料編集サーバ201における資料データ処理については、第1実施形態(
図3)と同様である。
ここで、配置変更処理について、
図12に基づき説明する。
図12のS221の処理は、第1実施形態(
図4)のS21の処理と同様である。
S222において、制御部210(配置変更部212)は、配置ルール記憶部225に記憶された配置ルール267に基づいて、各要素を配置する。その際、制御部210は、複数の配置ルール267に基づいて、異なる配置をした複数の配置後ページを生成する。
S223において、制御部210(配置変更部212)は、必要に応じて、配置した各要素をリサイズする。そして、各要素が重ならないようにする。その後、制御部210は、処理を
図3のS13に移す。
【0061】
次に、テキスト装飾処理について、
図13に基づき説明する。
図13のS331の処理は、第1実施形態(
図7)のS31の処理と同様である。
S332において、制御部210(テキスト装飾部215)は、関連語記憶部222のニューラルネットワークを用いて、見出しの単語と、他の単語との類似度を算出し、類似度の高い他の単語を着色する。
【0062】
単語間の関連性に関する例を、
図14に基づいて説明する。
図14(A)に示す文章280は、ニューラルネットワーク281を学習させるために用いられた文章の一例である。
ニューラルネットワーク281の学習において、単語を数値ベクトルとして表現する手法が用いられる。これは、意味が近い単語は、ベクトル間の距離も小さくなるように学習される。つまり、単語の出現頻度と、単語間の距離関係を基に、単語間の関係性を学習することで、ニューラルネットワーク281を学習する。
【0063】
グラフ282は、ニューラルネットワーク281での学習結果として、各単語を数値ベクトル化したものである。グラフ282では、文章の中で、単語間の距離が近く、頻出である単語は、数値ベクトルにおいても近い値になる。
この数値ベクトル化したグラフ282を用いて、見出しに含まれる単語と、他の単語との間の関連性を求めるため、両単語間の類似度を計算する。
2つの単語間の類似度Nは、見出しの単語のベクトルを(Hx,Hy)とし、他の単語のベクトルを(Wx,Wy)とした場合に、以下の(式2)によって算出する。
【0064】
【0065】
そして、制御部210は、(式2)によって算出された単語の類似度Nが、閾値(例えば、0)以上の場合に、当該単語を着色するものに決定する。なお、(式2)の“1”や、閾値の0は、任意の値であってよい。
図14(B)は、単語群70を示し、ページ40(
図5参照)に含まれるテキストから、制御部210が抽出した単語である。
【0066】
具体例で説明すると、抽出単語72に含まれる単語「神社」と単語「日本」との類似度Nは、上記の(式2)に当てはめて、N=0.78と算出できる。そのため、制御部210は、単語「神社」を着色対象に決定する。
また、抽出単語73-1に含まれる単語「浅草寺」と単語「日本」との類似度Nは、上記の(式2)に当てはめると、N=0.64と算出できるので、制御部210は、単語「浅草寺」を着色対象に決定する。
他方、抽出単語73-2に含まれる単語「石」と単語「日本」との類似度Nは、単語「石」のベクトルが(0.9,0.8)であったとして上記の(式2)に当てはめると、N=-0.078と算出でき、閾値未満である。そこで、制御部210は、単語「石」を着色対象にしない。
【0067】
そして、制御部210(テキスト装飾部215)は、着色対象の単語を、例えば、予め決められた色に着色する。
図13のS333において、制御部210(単語分類部217)は、S331で抽出した単語をカテゴリに分類する。カテゴリは、グラフ282(
図14(A)参照)にプロットされた各単語のベクトルを、所定の数のクラスにクラスタリングすることで決定してもよい。
S334において、制御部210(テキスト装飾部215)は、書体変更用テーブル23を参照し、単語のカテゴリに基づいて、単語の書体を変更する。
S335の処理は、第1実施形態(
図7)のS35の処理と同様である。
【0068】
このように、第2実施形態の資料編集システム200によれば、以下のような効果がある。
(1)資料編集サーバ201は、ページに含まれる各要素のテキストから単語を抽出し、抽出した単語のカテゴリに分類し、当該分類に基づいて単語を装飾するので、予め決めたカテゴリの単語に装飾を付加することができる。
(2)資料編集サーバ201は、ページに含まれる各要素の構造情報に対応した配置位置及び大きさを規定した配置ルール267に基づいて、各要素の配置を変更するので、配置ルール267を基に、各要素の配置を自動的に変更できる。
【0069】
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限定されるものではない。また、実施形態に記載した効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、実施形態に記載したものに限定されない。なお、上述した実施形態及び後述する変形形態は、適宜組み合わせて用いることもできるが、詳細な説明は省略する。
【0070】
(変形形態)
(1)各実施形態では、端末に複数の処理後資料データを送信し、端末側で選択できるものを例に説明したが、これに限定されない。さらに処理後資料データを、端末側で編集してもよい。そのようにすれば、ユーザの要望により合致したデザインのページを、容易に作成できる。
(2)各実施形態では、ページに含まれる各要素から構造情報を推定するものを例に説明したが、これに限定されない。端末から受け付けた資料データが、メタ情報に見出しや本文等の構造情報を有するものであれば、当該メタ情報を用いればよい。その場合、ページに含まれる各要素から構造情報を推定する処理は、不要になる。
【0071】
(3)各実施形態では、単語の着色、単語又はテキストの書体変更、テキストへの装飾の付加について説明したが、これに限定されない。例えば、テキストに着色をしてもよいし、単語に装飾を付加してもよく、着色する色や付加する態様についてもどのようなものであってもよい。
(4)各実施形態では、単語に対して装飾をするものを例に説明したが、これに限定されない。単語の連接語に対して装飾をしてもよい。例えば、単語「日本」が装飾の対象である場合に、連接語である「日本の文化」に対して装飾をしてもよい。
【0072】
(5)第1実施形態では、テキストをカテゴリに分類するものを説明し、第2実施形態では、単語をカテゴリに分類するものを説明したが、手法について、上記のものに限定されない。例えば、単語をカテゴリに分類したものを用いて、テキストをカテゴリに分類するといった、テキストに含まれる各単語の分類結果を集約する方法によるものであってもよい。具体的には、まず、テキスト内の各単語をカテゴリ分類して、各カテゴリの単語の数をカウントする。例えば、「宗教」カテゴリの単語数が2、「日本史」カテゴリの単語数が3、・・・のように算出する。そして、最も単語数が多いカテゴリを、当該テキストのカテゴリにする。
【0073】
(6)各実施形態では、各要素の配置を変更後にテキストフォントを変更及び/又は装飾をするものを例に説明したが、これに限定されない。テキストフォントを変更及び/又は装飾をした後に、各要素の配置を変更してもよい。また、各要素の配置を変更するか、又は、テキストフォントを変更及び/又は装飾するものであってもよい。
【0074】
(7)各実施形態では、資料データをプレゼンテーションソフトにより作成されたものを例に説明したが、これに限定されない。例えば、文書作成ソフトにより作成されたものや、文字、図形、表等を紙に印刷するようにレイアウト(配置)したページの状態を保存するためのファイル形式であるPDF形式のものであってもよい。なお、いずれの場合であっても、資料編集サーバは、入力の資料データの形式のものを出力する。
【符号の説明】
【0075】
1 資料編集サーバ
5 端末
10,210 制御部
11 資料受付部
12,212 配置変更部
13 構造推定部
14 レイアウト生成部
15,215 テキスト装飾部
16 単語抽出部
17 テキスト分類部
18 処理後資料出力部
20,220 記憶部
21a,221a 資料編集プログラム
22,222 関連語記憶部
23 書体変更用テーブル
24 装飾付加用テーブル
40 ページ
41,42,43-1~43-3,44-1~44-3,45-1~45-3 要素
60a,60b,60c レイアウト画像
70 単語群
90a,90b,90c 処理後ページ
100,200 資料編集システム
217 単語分類部
225 配置ルール記憶部
267x,267y 配置ルール
282 グラフ