(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024058618
(43)【公開日】2024-04-25
(54)【発明の名称】支援装置、支援方法及びプログラム
(51)【国際特許分類】
G06F 40/166 20200101AFI20240418BHJP
【FI】
G06F40/166
【審査請求】未請求
【請求項の数】14
【出願形態】OL
(21)【出願番号】P 2023174236
(22)【出願日】2023-10-06
(31)【優先権主張番号】P 2022164458
(32)【優先日】2022-10-13
(33)【優先権主張国・地域又は機関】JP
(71)【出願人】
【識別番号】399021943
【氏名又は名称】アイビーリサーチ株式会社
(74)【代理人】
【識別番号】110004222
【氏名又は名称】弁理士法人創光国際特許事務所
(72)【発明者】
【氏名】田村 博志
【テーマコード(参考)】
5B109
【Fターム(参考)】
5B109NB07
(57)【要約】
【課題】ユーザが文書データ中に記載された式や表を画像データに変換するための労力を削減できるようにする。
【解決手段】本発明の一実施形態に係る支援装置1は、ユーザによって入力された文字を含むテキスト文と、ユーザによって入力された式、表、画像又は文字列であるコンテンツを保持するオブジェクトと、を含む文書データを取得する取得部111と、オブジェクトを含む一時データを生成し、一時データからコンテンツを表す画像データを生成する生成部112と、文書データからオブジェクトを除去するとともに、文書データ中でオブジェクトが配置されていた位置に画像データを配置する配置部113と、を有する。
【選択図】
図2
【特許請求の範囲】
【請求項1】
ユーザによって入力された文字を含むテキスト文と、前記ユーザによって入力された式、表、画像又は文字列であるコンテンツを保持するオブジェクトと、を含む文書データを取得する取得部と、
前記オブジェクトを含む一時データを生成し、前記一時データから前記コンテンツを表す画像データを生成する生成部と、
前記文書データから前記オブジェクトを除去するとともに、前記文書データ中で前記オブジェクトが配置されていた位置に前記画像データを配置する配置部と、
を有する、支援装置。
【請求項2】
前記生成部は、前記一時データから前記コンテンツを表す領域を切り出すことによって、前記画像データを生成する、
請求項1に記載の支援装置。
【請求項3】
前記生成部は、前記画像データを生成するための複数の処理のうち、前記オブジェクトの種類に対応する処理を実行することによって前記画像データを生成する、
請求項1又は2に記載の支援装置。
【請求項4】
前記生成部は、前記オブジェクトが前記コンテンツの全体を表す内部画像を含む場合に、前記オブジェクトから前記内部画像を抽出する処理を実行することによって、前記内部画像を前記画像データとして生成する、
請求項3に記載の支援装置。
【請求項5】
前記生成部は、前記文書データ中で互いに隣接する複数の前記オブジェクトが保持する複数の前記コンテンツを表す1つの前記画像データを生成する、
請求項1又は2に記載の支援装置。
【請求項6】
前記生成部は、前記文書データ中で2つの前記テキスト文の間に位置する複数の前記オブジェクトが保持する複数の前記コンテンツを表す1つの前記画像データを生成する、
請求項1又は2に記載の支援装置。
【請求項7】
前記生成部は、前記文書データ中で指定された範囲内に位置する複数の前記オブジェクトが保持する複数の前記コンテンツを表す1つの前記画像データを生成する、
請求項1又は2に記載の支援装置。
【請求項8】
前記生成部は、前記文書データ中で互いに隣接する前記テキスト文と前記オブジェクトが保持する前記コンテンツとを表す1つの前記画像データを生成する、
請求項1又は2に記載の支援装置。
【請求項9】
前記生成部は、前記文書データ中で互いに重なった複数の前記オブジェクトが保持する複数の前記コンテンツを表す1つの前記画像データを生成する、
請求項1又は2に記載の支援装置。
【請求項10】
前記配置部は、前記文書データ中で前記画像データを配置した位置の前又は後に、所定の文字列を付加する、
請求項1又は2に記載の支援装置。
【請求項11】
前記生成部は、前記コンテンツの前又は後の少なくとも一方に余白領域を付加した前記画像データを生成する、
請求項1又は2に記載の支援装置。
【請求項12】
前記生成部は、前記コンテンツが所定の種類であることを条件として、前記コンテンツの色彩をグレースケールに変換し、色彩がグレースケールに変換された前記コンテンツを表す前記画像データを生成する、
請求項1又は2に記載の支援装置。
【請求項13】
プロセッサが実行する、
ユーザによって入力された文字を含むテキスト文と、前記ユーザによって入力された式、表、画像又は文字列であるコンテンツを保持するオブジェクトと、を含む文書データを取得するステップと、
前記オブジェクトを含む一時データを生成するステップと、
前記一時データから前記コンテンツを表す画像データを生成するステップと、
前記文書データから前記オブジェクトを除去するとともに、前記文書データ中で前記オブジェクトが配置されていた位置に前記画像データを配置するステップと、
を有する、支援方法。
【請求項14】
プロセッサを、
ユーザによって入力された文字を含むテキスト文と、前記ユーザによって入力された式、表、画像又は文字列であるコンテンツを保持するオブジェクトと、を含む文書データを取得する取得部、
前記オブジェクトを含む一時データを生成し、前記一時データから前記コンテンツを表す画像データを生成する生成部、及び
前記文書データから前記オブジェクトを除去するとともに、前記文書データ中で前記オブジェクトが配置されていた位置に前記画像データを配置する配置部、
として機能させる、プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文書データの編集を支援する支援装置、支援方法及びプログラムに関する。
【背景技術】
【0002】
特許文献1には、ユーザが特許文書においてテキスト文を入力する際に、特定のキーワードを自動的に置換することにより、特許文書の作成を支援するシステムが開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
文書データを用いて特許出願を行う際に、文書データ中に記載された式や表を、所定の形式の画像データにすることが求められる場合がある。従来、ユーザが手作業で文書データ中に記載された式や表を画像データに変換し、変換後の画像を文書データ中の元の位置に挿入するために大きな労力が掛かっていた。
【0005】
本発明は上述の点に鑑みてなされたものであり、ユーザが文書データ中に記載された式や表を画像データに変換するための労力を削減できるようにすることを目的とする。
【課題を解決するための手段】
【0006】
本発明の第1の態様の支援装置は、ユーザによって入力された文字を含むテキスト文と、前記ユーザによって入力された式、表、画像又は文字列であるコンテンツを保持するオブジェクトと、を含む文書データを取得する取得部と、前記オブジェクトを含む一時データを生成し、前記一時データから前記コンテンツを表す画像データを生成する生成部と、前記文書データから前記オブジェクトを除去するとともに、前記文書データ中で前記オブジェクトが配置されていた位置に前記画像データを配置する配置部と、を有する。
【0007】
前記生成部は、前記一時データから前記コンテンツを表す領域を切り出すことによって、前記画像データを生成してもよい。
【0008】
前記生成部は、前記画像データを生成するための複数の処理のうち、前記オブジェクトの種類に対応する処理を実行することによって前記画像データを生成してもよい。
【0009】
前記生成部は、前記オブジェクトが前記コンテンツの全体を表す内部画像を含む場合に、前記オブジェクトから前記内部画像を抽出する処理を実行することによって、前記内部画像を前記画像データとして生成してもよい。
【0010】
前記生成部は、前記文書データ中で互いに隣接する複数の前記オブジェクトが保持する複数の前記コンテンツを表す1つの前記画像データを生成してもよい。
【0011】
前記生成部は、前記文書データ中で2つの前記テキスト文の間に位置する複数の前記オブジェクトが保持する複数の前記コンテンツを表す1つの前記画像データを生成してもよい。
【0012】
前記生成部は、前記文書データ中で指定された範囲内に位置する複数の前記オブジェクトが保持する複数の前記コンテンツを表す1つの前記画像データを生成してもよい。
【0013】
前記生成部は、前記文書データ中で互いに隣接する前記テキスト文と前記オブジェクトが保持する前記コンテンツとを表す1つの前記画像データを生成してもよい。
【0014】
前記生成部は、前記文書データ中で互いに重なった複数の前記オブジェクトが保持する複数の前記コンテンツを表す1つの前記画像データを生成してもよい。
【0015】
前記配置部は、前記文書データ中で前記画像データを配置した位置の前又は後に、所定の文字列を付加してもよい。
【0016】
前記生成部は、前記コンテンツの前又は後の少なくとも一方に余白領域を付加した前記画像データを生成してもよい。
【0017】
前記生成部は、前記コンテンツが所定の種類であることを条件として、前記コンテンツの色彩をグレースケールに変換し、色彩がグレースケールに変換された前記コンテンツを表す前記画像データを生成してもよい。
【0018】
本発明の第2の態様の支援方法は、プロセッサが実行する、ユーザによって入力された文字を含むテキスト文と、前記ユーザによって入力された式、表、画像又は文字列であるコンテンツを保持するオブジェクトと、を含む文書データを取得するステップと、前記オブジェクトを含む一時データを生成するステップと、前記一時データから前記コンテンツを表す画像データを生成するステップと、前記文書データから前記オブジェクトを除去するとともに、前記文書データ中で前記オブジェクトが配置されていた位置に前記画像データを配置するステップと、を有する。
【0019】
本発明の第3の態様のプログラムは、プロセッサを、ユーザによって入力された文字を含むテキスト文と、前記ユーザによって入力された式、表、画像又は文字列であるコンテンツを保持するオブジェクトと、を含む文書データを取得する取得部、前記オブジェクトを含む一時データを生成し、前記一時データから前記コンテンツを表す画像データを生成する生成部、及び前記文書データから前記オブジェクトを除去するとともに、前記文書データ中で前記オブジェクトが配置されていた位置に前記画像データを配置する配置部、として機能させる。
【発明の効果】
【0020】
本発明によれば、ユーザが文書データ中に記載された式や表を画像データに変換するための労力を削減できるという効果を奏する。
【図面の簡単な説明】
【0021】
【
図1】第1実施形態に係る支援システムの模式図である。
【
図2】第1実施形態に係る支援システムのブロック図である。
【
図3】取得部が取得する例示的な文書データを説明するための模式図である。
【
図5】生成部が画像データを生成する処理を説明するための模式図である。
【
図6】配置部が文書データ中に画像データを配置する処理を説明するための模式図である。
【
図7】第1実施形態に係る支援システムが実行する例示的な支援方法のシーケンス図である。
【
図8】第2実施形態に係る支援システムのブロック図である。
【
図11】第2実施形態に係る支援システムが実行する支援方法のシーケンス図である。
【発明を実施するための形態】
【0022】
<第1実施形態>
[支援システムSの概要]
図1は、本実施形態に係る支援システムSの模式図である。支援システムSは、文書データの編集を支援するシステムである。支援システムSが対象とする文書データは、例えば、特許明細書等の特許文書である。支援システムSは、支援装置1と、情報端末2と、を含む。支援システムSは、その他のサーバ、端末等の機器を含んでもよい。
【0023】
支援装置1は、文書データの編集を支援する情報処理装置である。支援装置1は、文書データ中に記載された式、表又は文字列のコンテンツを画像データに変換するための処理を実行する。支援装置1は、単一のコンピュータ、又は複数のコンピュータである。また、支援装置1は、コンピュータ資源の集合であるクラウド上で動作する一又は複数の仮想的なサーバであってもよい。
【0024】
情報端末2は、ユーザに対して情報を表示するとともに、ユーザによる入力を受け付けるコンピュータである。情報端末2は、例えばパーソナルコンピュータ、スマートフォン、タブレット端末等である。情報端末2は、情報を表示可能な液晶ディスプレイ等の表示部と、ユーザによる入力を受け付けるためのタッチパネルやキーボード等の操作部と、を有する。情報端末2は、インターネットやローカルエリアネットワーク等のネットワークを介して、支援装置1と通信可能である。
【0025】
支援システムSが実行する処理の概要を以下に説明する。支援装置1は、編集対象の文書データを情報端末2から取得する(
図1の(1))。文書データは、ユーザによって入力された文字を含むテキスト文と、ユーザによって入力された式、表、画像又は文字列であるコンテンツを保持するオブジェクトと、を含む。オブジェクトは、テキスト文及び画像データとは異なる形式で文書データ中に記録されている。例えば文書データを所定の官庁(例えば特許庁)に提出する場合、式、表、画像又は文字列であるコンテンツは、所定の形式の画像データに変換することが求められる。
【0026】
支援装置1は、文書データに含まれているオブジェクトを含む一時データを生成する(
図1の(2))。一時データは、例えば、文書データを紙に印刷された場合のレイアウトに変換したデータである。支援装置1は、生成した一時データから、元の文書データにおいてオブジェクトが保持していたコンテンツを表す画像データを生成する(
図1の(3))。支援装置1は、例えば、一時データから、元の文書データにおいてオブジェクトが保持していたコンテンツを表す領域を切り出すことによって、画像データを生成する。
【0027】
支援装置1は、文書データからオブジェクトを除去するとともに、文書データ中でオブジェクトが配置されていた位置に、生成した画像データを配置する(
図1の(4))。
【0028】
このように支援システムSは、文書データから式、表、画像又は文字列であるコンテンツを保持するオブジェクトを含む一時データを生成し、生成した一時データからコンテンツを表す画像データを生成する。そして支援システムSは、生成した画像データを文書データ中で元のオブジェクトの位置に配置する。これにより、支援システムSは、ユーザが文書データ中に記載されたコンテンツを画像データに変換するための労力を削減できる。
【0029】
[支援システムSの構成]
図2は、本実施形態に係る支援システムSのブロック図である。
図2において、矢印は主なデータの流れを示しており、
図2に示したもの以外のデータの流れがあってもよい。
図2において、各ブロックはハードウェア(装置)単位の構成ではなく、機能単位の構成を示している。そのため、
図2に示すブロックは単一の装置内に実装されてもよく、あるいは複数の装置内に分かれて実装されてもよい。ブロック間のデータの授受は、データバス、ネットワーク、可搬記憶媒体等、任意の手段を介して行われてよい。
【0030】
支援装置1は、制御部11と、記憶部12と、通信部13とを有する。通信部13は、情報端末2との間で通信をするための通信インタフェースである。通信部13は、通信を行うためのプロセッサ、コネクタ、アンテナ等を含む。通信部13は、情報端末2から受信した通信信号に所定の処理を行ってデータを取得する。また、通信部13は、外部に送信すべきデータに所定の処理を行って通信信号を生成し、生成した通信信号を情報端末2に送信する。
【0031】
記憶部12は、ROM(Read Only Memory)、RAM(Random Access Memory)、ハードディスクドライブ等を含む記憶媒体である。記憶部12は、制御部11が実行するプログラムを予め記憶している。記憶部12は、支援装置1の外部に設けられてもよく、その場合にネットワークを介して制御部11との間でデータの授受を行ってもよい。
【0032】
制御部11は、取得部111と、生成部112と、配置部113と、送信部114と、を有する。制御部11は、例えばCPU(Central Processing Unit)等のプロセッサであり、記憶部12に記憶されたプログラムを実行することにより、取得部111、生成部112、配置部113及び送信部114として機能する。
【0033】
以下、支援装置1が実行する処理について詳細に説明する。取得部111は、ユーザによって入力された文字を含むテキスト文と、ユーザによって入力された式、表、画像又は文字列であるコンテンツを保持するオブジェクトと、を含む文書データを取得する。
【0034】
ユーザは、例えば、情報端末2において、内部に含まれているコンテンツを画像データに変換することを希望する文書データを指定する操作を行う。情報端末2は、ユーザにより指定された文書データを、ネットワークを介して支援装置1に送信する。情報端末2を操作するユーザは、文書データ内のテキスト文及びオブジェクトを入力したユーザと同じであってもよく、異なってもよい。支援装置1において、取得部111は、情報端末2が送信した文書データを取得する。また、取得部111は、記憶部12に予め記憶された文書データを取得してもよい。
【0035】
図3は、取得部111が取得する例示的な文書データDを説明するための模式図である。文書データDは、一又は複数のテキスト文TXと、一又は複数のオブジェクトOBと、を含む。
【0036】
テキスト文TXは、ユーザによって入力された文字列である。また、テキスト文TXは、文字列に対して設定された大きさや色等の書式を示す情報を含んでもよい。
【0037】
オブジェクトOBは、文書データD中で、ユーザによって入力された式、表、画像又は文字列であるコンテンツを保持するデータである。オブジェクトOBは、テキスト文TXとは異なる形式で管理されている。コンテンツが式(数式等)である場合に、オブジェクトOBは、例えば、入力された記号及び数の関係を、指定された表示態様で表示する数式ボックスである。コンテンツが表である場合に、オブジェクトOBは、例えば、入力された複数の情報を、指定された表示態様の行列として表示する表ボックスである。コンテンツが画像である場合に、オブジェクトOBは、例えば、JPEG(Joint Photographic Experts Group)形式等の所定の形式の画像を保持する画像ボックスである。コンテンツが文字列である場合に、オブジェクトOBは、例えば、入力された文字列を、指定された表示態様で表示するテキストボックスである。
【0038】
オブジェクトOBは、文書データD中でテキスト文TXの前又は後に配置される。また、オブジェクトOBは、他のオブジェクトOBに重ねて配置されてもよい。また、オブジェクトOBは、コンテンツとともに、当該コンテンツの全体を所定の形式の画像として表した内部画像を含んでもよい。
【0039】
生成部112は、文書データDに含まれているオブジェクトOBが保持するコンテンツを所定の形式の画像として表した画像データを生成する。生成部112は、例えば、画像データを生成するための複数の生成処理のうち、オブジェクトOBの種類に対応する生成処理を実行することによって画像データを生成する。文書データDが複数のオブジェクトOBを含む場合に、生成部112は複数のオブジェクトOBそれぞれに対して、当該オブジェクトOBの種類に対応する生成処理を実行する。
【0040】
生成部112は、例えば、オブジェクトOBがコンテンツの全体を表す内部画像を含まない種類である場合に、一時データを用いてコンテンツを表す画像データを生成する第1生成処理を実行する。一方、生成部112は、例えば、オブジェクトOBがコンテンツを表す内部画像を含む種類である場合に、オブジェクトOBから内部画像を抽出することによってコンテンツを表す画像データを生成する第2生成処理を実行する。支援装置1は、オブジェクトOBの種類に応じて複数の生成処理を切り替えて実行することにより、オブジェクトOBごとに適した方法でコンテンツを表す画像データを生成できる。
【0041】
図4(a)は、第1生成処理を説明するための模式図である。生成部112は、文書データDに含まれているオブジェクトOBを含む一時データTを生成する。一時データTは、例えば、文書データDを紙に印刷された場合のレイアウトに変換したデータである。一時データTは、紙に印刷された状態の文書データDを模した仮想的な印刷物データともいう。生成部112は、文書データDの全体から一時データTを生成してもよく、文書データDのうちオブジェクトOBを含む一部の領域のみから一時データTを生成してもよい。
【0042】
生成部112は、例えば、文書データDを所定の変換ソフトウェアに入力することにより、一時データTを生成する。ここで生成部112は、ユーザ又は支援装置1の管理者により指定された解像度の一時データTを生成してもよい。これにより、支援装置1は、生成される画像を高品質にし、又は生成される画像のデータ容量を小さくするように調整できる。
【0043】
生成部112は、生成した一時データTから、元の文書データDにおいてオブジェクトOBが保持していたコンテンツを表す画像データを生成する。生成部112は、例えば、一時データTにおいて、オブジェクトOBが保持していたコンテンツを表す一部の領域Rを特定する。生成部112は、例えば、文書データD中の位置と一時データT中の位置との対応関係に基づいて、文書データD中でオブジェクトOBが配置されている位置に対応する領域Rを特定する。文書データD中の位置と一時データT中の位置との対応関係は、例えば、文書データDから一時データTを生成するための変換ソフトウェアから出力される。
【0044】
生成部112は、例えば、一時データTから領域Rをトリミング処理等によって切り出し、切り出した領域Rの画像データを、コンテンツを表す画像データとして生成する。文書データDが複数のオブジェクトOBを含む場合に、生成部112は、一時データTから複数のオブジェクトOBそれぞれに対応する領域Rを切り出す。
【0045】
生成部112は、例えば、文書データDが含む複数のページのうちいずれか1つのページを変換することにより一時データTを生成してもよい。生成部112は、1つのページに対応する一時データTにおいて画像データの生成対象とする一又は複数のオブジェクトOBに対応する領域の画像データを、コンテンツを表す画像データとして生成する。これにより、支援装置1は、文書データDが互いに重なった複数のオブジェクトOBを含む場合であっても、元の文書データDにおける複数のオブジェクトOBの位置関係を維持したまま複数のオブジェクトOBを画像データにすることができる。
【0046】
別の方法として、生成部112は、例えば、内容が空である一時的な文書データ(作業用の文書データ)を生成し、文書データDから画像データの生成対象とする一又は複数のオブジェクトOBを当該一時的な文書データ上にコピーしてもよい。その結果、一時的な文書データは一又は複数のオブジェクトOBのみを含む。生成部112は、一又は複数のオブジェクトOBを含む一時的な文書データを変換することにより一時データTを生成する。生成部112は、一時データTにおいて一又は複数のオブジェクトOBに対応する領域の画像データを、コンテンツを表す画像データとして生成する。これにより、支援装置1は、文書データDの中で一又は複数のオブジェクトOBが複数のページに分かれている場合であっても、一時的な文書データの中で一又は複数のオブジェクトOBを1つのページ内に収めることができるため、一又は複数のオブジェクトOBをまとめて1つの画像データにしやすくすることができる。
【0047】
このように、支援装置1は、文書データDからオブジェクトOBを含む一時データTを生成し、生成した一時データTからコンテンツを表す画像データを切り出すことにより、様々な種類のオブジェクトOBそれぞれを画像データに変換する処理を実装する必要がなく、容易にコンテンツを表す画像データを生成することができる。また、支援装置1は、紙に印刷された状態の文書データDを模した仮想的な印刷物データである一時データTを用いることにより、オブジェクトOBを画像に変換する際にコンテンツに文字化けが発生するおそれを低減することができる。
【0048】
図4(b)は、第2生成処理を説明するための模式図である。オブジェクトOBは、コンテンツとともに、当該コンテンツの全体を所定の形式の画像として表した内部画像データを保持している。内部画像データは、オブジェクトOBを管理するソフトウェアによって自動的に生成される。生成部112は、例えば、オブジェクトOBから内部画像データを抽出し、抽出した内部画像データを、コンテンツを表す画像データとして生成する。
【0049】
このように、支援装置1は、内部画像データを予め保持しているオブジェクトOBから内部画像データを抽出することにより、一時データから画像データを生成するための計算コストを削減できる。
【0050】
生成部112は、オブジェクトOBと他のオブジェクトOB又はテキスト文TXとを併せて1つの画像データを生成してもよい。
図5(a)は、生成部112が互いに隣接する複数のオブジェクトOBを併せて1つの画像データを生成する処理を説明するための模式図である。生成部112は、例えば、文書データD中で2つのテキスト文TXの間に位置する、互いに隣接する複数のオブジェクトOBが保持する複数のコンテンツを表す1つの画像データを生成する。これにより、支援装置1は、式、表又は文字列が複数のオブジェクトOBに分かれている場合であっても、1つの画像データにすることができる。
【0051】
また、生成部112は、文書データD中で指定された範囲内に位置する、互いに隣接する複数のオブジェクトOBが保持する複数のコンテンツを表す1つの画像データを生成してもよい。この場合に、生成部112は、情報端末2においてユーザによる文書データD中の範囲を指定する操作を受け付け、指定された範囲内の複数のオブジェクトOBを用いて1つの画像データを生成する。これにより、支援装置1は、1つの画像データにする複数のオブジェクトOBの範囲に、ユーザの意向を反映することができる。
【0052】
図5(b)は、生成部112が互いに重なった複数のオブジェクトOBを併せて1つの画像データを生成する処理を説明するための模式図である。生成部112は、例えば、文書データD中で互いに重なった複数のオブジェクトOBが保持する複数のコンテンツを表す1つの画像データを生成する。これにより、支援装置1は、式、表又は文字列が複数のオブジェクトOBに分かれている場合であっても、1つの画像データにすることができる。
【0053】
図5(c)は、生成部112が互いに隣接するテキスト文TX及びオブジェクトOBを併せて1つの画像データを生成する処理を説明するための模式図である。生成部112は、例えば、文書データD中で1行の中に位置する、互いに隣接するテキスト文TXとオブジェクトOBが保持するコンテンツとを表す1つの画像データを生成する。これにより、支援装置1は、式、表又は文字列がテキスト文TX及びオブジェクトOBに分かれている場合であっても、1つの画像データにすることができる。
【0054】
生成部112は、オブジェクトOBが保持するコンテンツの前又は後の少なくとも一方に余白領域を付加した画像データを生成してもよい。この場合に、生成部112は、オブジェクトOBが保持するコンテンツを表す画像データ(例えば、一時データTから切り出した画像データ)の前又は後に少なくとも一方に、余白領域(例えば、白色のみの画像)を表す画像データを結合する。
【0055】
そして生成部112は、コンテンツを表す画像データと余白領域を表す画像データとの結合データから、所定の大きさの部分を切り出すことにより得られた画像データを、コンテンツの前又は後の少なくとも一方に余白領域を付加した画像データとして生成する。余白領域を付加した画像データの大きさは、ユーザによって指定された値であってもよく、支援システムSに予め設定された値であってもよい。
【0056】
オブジェクトOBが保持するコンテンツをそのまま変換した画像データを特許出願の図面として用いると、当該画像データの大きさに応じて図面ごとに解像度が変わってしまう場合がある。これに対して、支援システムSは、コンテンツの前又は後の少なくとも一方に余白領域を付加した画像データを生成することによって、画像データの大きさを一定に調整することができる。
【0057】
生成部112は、オブジェクトOBが保持するコンテンツの色彩をグレースケールに変換してもよい。グレースケールは、黒、白及びその中間の灰色のみで表された色彩である。生成部112は、例えば、既知の画像変換処理により、オブジェクトOBが保持するコンテンツを表す画像データの色彩を、グレースケール(8ビットグレースケール等)に変換する。そして生成部112は、色彩がグレースケールに変換されたコンテンツを表す画像データを生成する。
【0058】
生成部112は、コンテンツが所定の種類(例えば、JPEG形式)であることを条件として、コンテンツの色彩をグレースケールに変換してもよい。また、生成部112は、ユーザがコンテンツの色彩をグレースケールに変換することを示す操作を行ったことを条件として、コンテンツの色彩をグレースケールに変換してもよい。
【0059】
オブジェクトOBが保持するコンテンツが多色画像(フルカラー画像等)である場合に、当該コンテンツを表す画像データを特許出願の図面として用いる際に当該コンテンツが自動的に白黒画像に変換されることにより、視認性の悪い図面になる場合がある。これに対して、支援システムSは、コンテンツの色彩をグレースケールに変換した上で画像データを生成することによって、コンテンツが自動的に白黒画像に変換されないようにすることができる。
【0060】
配置部113は、生成部112が生成した画像データを、文書データD中に配置する。
図6は、配置部113が文書データD中に画像データを配置する処理を説明するための模式図である。配置部113は、例えば、文書データDから画像データに対応するオブジェクトOBを除去するとともに、文書データD中で当該オブジェクトOBが配置されていた位置Lに生成部112が生成した画像データを配置する。生成部112が複数の画像データを生成した場合に、配置部113は複数の画像データそれぞれに対して、当該画像データに対応するオブジェクトOBを除去するとともに、当該オブジェクトOBが配置されていた位置Lに当該画像データを配置する。
【0061】
これにより、支援装置1は、オブジェクトOBから生成した画像データを元のオブジェクトOBの位置Lに自動的に配置できるため、ユーザが文書データD中でオブジェクトOBに対応する画像データを配置する位置を探す労力を削減することができる。
【0062】
また、配置部113は、文書データD中で画像データを配置した位置Lの前又は後に、所定の文字列CHを付加してもよい。文字列CHは、例えば、所定の見出しを表す文字列である。これにより、支援装置1は、画像データの前後に必要な見出し等の文字列を自動的に付加することができ、ユーザが手作業で文書データDを修正する労力を削減できる。
【0063】
送信部114は、配置部113が文書データD中にオブジェクトOBに対応する画像データを配置した後に、文書データDを情報端末2に送信する。情報端末2は、支援装置1から受信した文書データDを記憶部に記憶させ、又は表示部上に表示させる。これにより、支援システムSは、ユーザが文書データD中に記載されたコンテンツを画像データに変換し、さらに変換後の画像データを文書データD中に配置するための労力を削減できる。
【0064】
[支援方法のシーケンス]
図7は、本実施形態に係る支援システムSが実行する例示的な支援方法のシーケンス図である。情報端末2は、ユーザにより指定された文書データDを、ネットワークを介して支援装置1に送信する(S11)。支援装置1において、取得部111は、情報端末2が送信した文書データDを取得する(S12)。
【0065】
生成部112は、文書データDに含まれているオブジェクトOBが保持するコンテンツを表す画像データを生成する(S13)。オブジェクトOBがコンテンツを表す内部画像データを含まない種類である場合に、生成部112は、例えば、文書データDに含まれているオブジェクトOBを含む一時データTを生成し、生成した一時データTから元の文書データDにおいてオブジェクトOBが保持していたコンテンツを表す画像データを生成する。
【0066】
一方、オブジェクトOBがコンテンツを表す内部画像を含む種類である場合に、生成部112は、例えば、オブジェクトOBから内部画像を抽出し、抽出した内部画像を、コンテンツを表す画像データとして生成する。
【0067】
配置部113は、生成部112が生成した画像データを、文書データD中に配置する(S14)。配置部113は、例えば、文書データDから画像データに対応するオブジェクトOBを除去するとともに、文書データD中で当該オブジェクトOBが配置されていた位置Lに生成部112が生成した画像データを配置する。
【0068】
送信部114は、配置部113が文書データD中にオブジェクトOBに対応する画像データを配置した後に、文書データDを情報端末2に送信する(S15)。情報端末2は、支援装置1から受信した文書データDを記憶部に記憶させ、又は表示部上に表示させる。
【0069】
[第1実施形態の効果]
本実施形態に係る支援システムSは、文書データDからコンテンツを保持するオブジェクトOBを含む一時データTを生成し、生成した一時データTからコンテンツを表す画像データを生成し、生成した画像データを文書データD中で元のオブジェクトOBの位置に配置する。これにより、ユーザは、オブジェクトOBごとに手作業で画像データを生成する必要がなくなるとともに、文書データD中で生成した画像データを配置する位置を探す必要がなくなる。したがって、支援システムSは、ユーザが文書データD中に記載されたコンテンツを画像データに変換するための労力を削減できる。
【0070】
[第1変形例]
情報端末2は、支援装置1の機能の一部又は全部を実施することにより、支援装置1として機能してもよい。この場合に、情報端末2のプロセッサは、取得部111、生成部112、配置部113及び送信部114の少なくとも一部として機能する。これにより、文書データ中に記載されたコンテンツを画像データに変換する処理の計算コストを支援装置1及び情報端末2の間で分散することができる。
【0071】
[第2変形例]
文書データDが含む複数のページのうち一部のページは、横長(横方向の長さが縦方向の長さより大きいこと)のオブジェクトOBの形状にあわせて横長のページである場合がある。一方、特許文書の全てのページは縦長(縦方向の長さが横方向の長さより大きいこと)のページであることが求められる。そこで、本変形例に係る支援装置1は、横長のオブジェクトOBに対応する画像データを縦長ページに合うように出力する。
【0072】
上述の配置部113が文書データD中にオブジェクトOBに対応する画像データを配置した後、生成部112は、文書データD中に配置された一又は複数のオブジェクトOBそれぞれが回転対象であるか否かを判定する。
【0073】
生成部112は、例えば、文書データDが含む複数のページのうちオブジェクトOBを含むページが横長である場合には当該オブジェクトOBを回転対象であると判定し、オブジェクトOBを含むページが縦長である場合には当該オブジェクトOBを回転対象でないと判定する。生成部112は、例えば、文書データDが含む設定情報を参照することにより、各ページが横長又は縦長のどちらであるか否かを判定する。
【0074】
生成部112は、文書データDの内容を含む出力データDDを生成する。出力データDDは、例えば、文書データDの内容を含むデータであって、文書データDと異なる形式のデータである。また、出力データDDは、文書データD自体であってもよい。
【0075】
生成部112は、出力データDDを生成する際に、文書データD中に配置された一又は複数のオブジェクトOBのうち、回転対象であると判定した一又は複数のオブジェクトOBを縦長になるように回転させて出力データDDに配置する。ここで生成部112は、例えば、回転対象であると判定したオブジェクトOBを反時計回りに90度回転させることにより、当該オブジェクトOBを縦長にする。また、生成部112は、文書データD中に配置された一又は複数のオブジェクトOBのうち、回転対象でないと判定した一又は複数のオブジェクトOBを回転させずに出力データDDに配置する。
【0076】
送信部114は、生成部112が生成した出力データDDを情報端末2に送信する。情報端末2は、支援装置1から受信した出力データDDを記憶部に記憶させ、又は表示部上に表示させる。これにより、支援システムSは、横長のオブジェクトOBに対応する画像データを自動的に回転させることにより縦長ページに合うようにして出力することができる。
【0077】
<第2実施形態>
[支援システムSの構成]
本実施形態に係る支援システムSは、第1実施形態に係る支援システムSの機能のほかに、文書データDを整形及び検査する機能を有する。以下、第1実施形態とは異なる点を主に説明する。
【0078】
図8は、本実施形態に係る支援システムSのブロック図である。支援装置1の制御部11は、
図2に示した取得部111、生成部112、配置部113及び送信部114に加えて、整形部115と、検査部116と、を有する。
【0079】
整形部115は、取得部111が取得した文書データDが含むテキスト文TXに対して整形処理を実行する。
図9は、整形処理を説明するための模式図である。
【0080】
整形部115が実行する整形処理は、所定の変換規則Cに従って、文書データDに対して文字列の付加又は置換をすることを含む。整形部115は、例えば、変換規則Cに従って、整形前の文書データD1において文字列を付加又は置換することにより、整形後の文書データD2を生成する。
【0081】
図9の例では、例えば、文書データD2の冒頭に「[書類名]明細書」及び「[発明の名称]」の文字列が付加されている。また、
図9の例では、例えば、文書データD1の「発明の背景」の文字列が、文書データD2の「[背景技術]」の文字列に置換されている。
【0082】
図10は、例示的な変換規則Cの模式図である。変換規則Cは、例えば、付加又は置換される前の整形前文字列と、付加又は置換された後の整形後文字列と、の関係を示すテーブル等の情報である。整形前文字列は、整形後文字列で置換する文字列を示す。整形部115は、例えば、
図10中の整形前文字列「発明の背景」の文字列を、整形後文字列「[背景技術]」に置換する。整形部115は、整形前文字列と同一の文字列のみを対象としてもよく、整形前文字列と同一又は類似の文字列を対象としてもよい。
【0083】
また、整形前文字列は、整形後文字列を付加する文書データD中の位置を示してもよい。整形部115は、例えば、
図10中の整形前文字列「(冒頭)」に基づいて、文書データDの冒頭に、整形後文字列「[書類名]明細書」及び「[発明の名称]」を付加する。
【0084】
整形部115は、記憶部12に予め記憶された変換規則Cを取得し、又は支援装置1とは異なる装置から変換規則Cを取得し、取得した変換規則Cを用いて文書データDを整形する。これにより、支援装置1は、例えば外国語から自国語に翻訳した翻訳文等の文書データDに対して、ユーザが手作業で見出し等の文字列を付加又は置換する労力を削減できる。
【0085】
変換規則Cは、ユーザによって指定されてもよい。この場合に、取得部111は、情報端末2からユーザによって指定された変換規則Cを取得し、変換規則Cを指定したユーザを識別するためのユーザID(Identification)と関連付けて記憶部12に記憶させる。ユーザは、変換規則Cの一部のみを指定してもよく、変換規則Cの全部を指定してもよい。整形部115は、整形対象の文書データDを指定したユーザのユーザIDに関連付けられた変換規則Cを記憶部12から取得し、取得した変換規則Cを用いて文書データDを整形する。これにより、支援装置1は、ユーザごとにカスタマイズされた変換規則Cを用いて文書データDを整形することができる。
【0086】
整形部115は、文書データDにおける整形対象の文字列の場所を考慮して整形してもよい。整形部115は、例えば、変換規則Cが示す整形前文字列が文書データD中に複数存在する場合に、文書データD中で最初に出現した整形前文字列のみを整形後文字列に置換する。これにより、支援装置1は、たまたま文書データDに複数の置換対象の文字列が存在する場合であっても、無制限に全てを置換することを防ぐことができる。
【0087】
整形部115は、文書データDにおける整形対象の複数の文字列の順序を考慮して整形してもよい。整形部115は、例えば、
図10中の整形前文字列「要約」を、整形前文字列「請求項」の後に出現したことを条件として、整形後文字列に置換する。これにより、支援装置1は、予め想定された順序で文字列が出現したことを条件として文字列を付加又は置換し、整形の精度を向上させることができる。
【0088】
整形部115は、整形後の文書データDを生成部112に入力してもよい。生成部112は、整形後の文書データDからコンテンツを表す画像データを生成し、配置部113は、整形後の文書データDに生成部112が生成した画像データを配置する。
【0089】
検査部116は、整形部115が整形した後の文書データDにおいて、所定の一又は複数の文字列(見出し等)が含まれているか否かを検査する。検査部116が検査する一又は複数の文字列は、変換規則Cが示す整形後文字列であってもよく、予め定義されたその他の文字列であってもよい。
【0090】
送信部114は、整形部115が整形した後の文書データD(又は配置部113が画像データを配置した文書データD)と、当該文書データDに検査部116が検査した一又は複数の文字列それぞれが含まれているか否かを示す検査結果と、を情報端末2に送信する。情報端末2は、支援装置1から受信した情報を記憶部に記憶させ、又は表示部上に表示させる。これにより、支援装置1は、ユーザが文書データDに不足している見出し等を認識しやすくすることができる。
【0091】
[支援方法のシーケンス]
図11は、本実施形態に係る支援システムSが実行する支援方法のシーケンス図である。情報端末2は、ユーザにより指定された文書データDを、ネットワークを介して支援装置1に送信する(S21)。支援装置1において、取得部111は、情報端末2が送信した文書データDを取得する(S22)。
【0092】
整形部115は、取得部111が取得した文書データDが含むテキスト文TXに対して整形処理を実行する(S23)。整形部115は、例えば、所定の変換規則Cに従って、整形前の文書データD1において文字列を付加又は置換することにより、整形後の文書データD2を生成する。
【0093】
検査部116は、整形部115が整形した後の文書データDにおいて、所定の一又は複数の文字列が含まれているか否かを検査する(S24)。
【0094】
送信部114は、整形部115が整形した後の文書データD(又は配置部113が画像データを配置した文書データD)と、当該文書データDに検査部116が検査した一又は複数の文字列それぞれが含まれているか否かを示す検査結果と、を情報端末2に送信する(S25)。情報端末2は、支援装置1から受信した情報を記憶部に記憶させ、又は表示部上に表示させる。
【0095】
[第2実施形態の効果]
本実施形態に係る支援システムSは、ユーザが指定した文書データDに対して自動的に文字列を付加又は置換することにより、ユーザが手作業で見出し等の文字列を付加又は置換する労力を削減できる。また、支援システムSは、所定の一又は複数の文字列が含まれているか否かを検査することにより、ユーザが文書データDに不足している見出し等を認識しやすくすることができる。
【0096】
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を併せ持つ。
【0097】
支援装置1及び情報端末2のプロセッサは、
図7、
図11に示す支援方法に含まれる各ステップ(工程)を実行する。すなわち、支援装置1及び情報端末2のプロセッサは、
図7、
図11に示す支援方法を実行するためのプログラムを実行することによって、
図7、
図11に示す支援方法を実行する。
図7、
図11に示す支援方法に含まれるステップは一部省略されてもよく、ステップ間の順番が変更されてもよく、複数のステップが並行して行われてもよい。
【符号の説明】
【0098】
S 支援システム
1 支援装置
11 制御部
12 記憶部
13 通信部
111 取得部
112 生成部
113 配置部
114 送信部
115 整形部
116 検査部
2 情報端末