特許第6797610号(P6797610)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ キヤノン株式会社の特許一覧

<>
  • 特許6797610-装置、方法、及びプログラム 図000002
  • 特許6797610-装置、方法、及びプログラム 図000003
  • 特許6797610-装置、方法、及びプログラム 図000004
  • 特許6797610-装置、方法、及びプログラム 図000005
  • 特許6797610-装置、方法、及びプログラム 図000006
  • 特許6797610-装置、方法、及びプログラム 図000007
  • 特許6797610-装置、方法、及びプログラム 図000008
  • 特許6797610-装置、方法、及びプログラム 図000009
  • 特許6797610-装置、方法、及びプログラム 図000010
  • 特許6797610-装置、方法、及びプログラム 図000011
  • 特許6797610-装置、方法、及びプログラム 図000012
  • 特許6797610-装置、方法、及びプログラム 図000013
  • 特許6797610-装置、方法、及びプログラム 図000014
  • 特許6797610-装置、方法、及びプログラム 図000015
  • 特許6797610-装置、方法、及びプログラム 図000016
  • 特許6797610-装置、方法、及びプログラム 図000017
  • 特許6797610-装置、方法、及びプログラム 図000018
  • 特許6797610-装置、方法、及びプログラム 図000019
  • 特許6797610-装置、方法、及びプログラム 図000020
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6797610
(24)【登録日】2020年11月20日
(45)【発行日】2020年12月9日
(54)【発明の名称】装置、方法、及びプログラム
(51)【国際特許分類】
   G06T 11/60 20060101AFI20201130BHJP
   H04N 1/387 20060101ALI20201130BHJP
   G06F 16/53 20190101ALI20201130BHJP
   G06F 16/58 20190101ALI20201130BHJP
   G06F 16/903 20190101ALI20201130BHJP
【FI】
   G06T11/60 100A
   H04N1/387
   G06F16/53
   G06F16/58
   G06F16/903
【請求項の数】11
【全頁数】24
(21)【出願番号】特願2016-169353(P2016-169353)
(22)【出願日】2016年8月31日
(65)【公開番号】特開2018-36843(P2018-36843A)
(43)【公開日】2018年3月8日
【審査請求日】2019年8月8日
(73)【特許権者】
【識別番号】000001007
【氏名又は名称】キヤノン株式会社
(74)【代理人】
【識別番号】110001243
【氏名又は名称】特許業務法人 谷・阿部特許事務所
(72)【発明者】
【氏名】山道 雅樹
【審査官】 山▲崎▼ 雄介
(56)【参考文献】
【文献】 米国特許出願公開第2008/0204788(US,A1)
【文献】 米国特許出願公開第2015/0378973(US,A1)
【文献】 米国特許出願公開第2007/0174766(US,A1)
【文献】 米国特許出願公開第2009/0164881(US,A1)
【文献】 特開2009−194562(JP,A)
【文献】 特開2011−018201(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 1/00
G06T 11/00−11/80
G06F 16/00−16/958
H04N 1/387
(57)【特許請求の範囲】
【請求項1】
ページ内にテキストオブジェクトと画像オブジェクトとを含む文書データに基づいて、ページ全体が1つの画像オブジェクトで構成される画像化文書データを作成する作成手段と、
前記テキストオブジェクトの各々が、前記画像化文書データに埋め込まれるべきテキストオブジェクトであるか判定する判定手段と、
前記画像化文書データに埋め込まれるべきと判定されたテキストオブジェクトに対応する文字列のデータを、前記画像化文書データに埋め込む埋め込み手段と、
を有し、
前記判定手段は、前記テキストオブジェクトの各々に対し、
テキストオブジェクトが透明であるか判定し、
透明であると判定されたテキストオブジェクトの領域に重なっている画像オブジェクトがある場合、該画像オブジェクトにOCR処理を行って、該画像オブジェクトに対応する文字列を取得し、
前記透明であると判定されたテキストオブジェクトの文字列が、前記画像オブジェクトに対応する前記取得された文字列と同じである場合、該テキストオブジェクトは前記画像化文書データに埋め込まれるべきテキストオブジェクトである、と判定し、
前記透明であると判定されたテキストオブジェクトの文字列が、前記画像オブジェクトに対応する前記取得された文字列と同じでない場合、該テキストオブジェクトは前記画像化文書データに埋め込まれるべきでないテキストオブジェクトである、と判定する、
ことを特徴とする装置。
【請求項2】
前記埋め込み手段は、
前記画像化文書データに埋め込まれるべきと判定されたテキストオブジェクトを複製し、
前記複製したテキストオブジェクトに対応する文字列のデータを、非表示の状態で前記画像化文書データに埋め込む、
ことを特徴とする請求項1に記載の装置。
【請求項3】
前記判定手段は、前記テキストオブジェクトの存在領域内にあり、かつ、当該テキストオブジェクトに重なって配置される上位オブジェクトがあるか判定し、
前記上位オブジェクトがある場合、当該上位オブジェクトが透明か判定する
ことを特徴とする請求項1または2に記載の装置。
【請求項4】
前記判定手段は、前記上位オブジェクトがない場合、または、前記上位オブジェクトが透明の場合、前記テキストオブジェクトの背景色と、前記テキストオブジェクトの文字の色とが同一か判定し、
前記テキストオブジェクトの背景色と、当該テキストオブジェクトの文字の色とが同一の場合、当該テキストオブジェクトは、前記画像化文書データに埋め込まれるべきでないテキストオブジェクトであると判定する
ことを特徴とする請求項3に記載の装置。
【請求項5】
前記上位オブジェクトが透明ではない場合、前記テキストオブジェクトと前記上位オブジェクトが重なるために表示されない重なり文字を導出する導出手段をさらに有する
ことを特徴とする請求項3に記載の装置。
【請求項6】
前記テキストオブジェクトと前記上位オブジェクトとが重ならないために表示される非重なり文字列、および、当該非重なり文字列の座標の情報、を生成する生成手段さらに有する
ことを特徴とする請求項3乃至5の何れか1項に記載の装置。
【請求項7】
前記画像化文書データと対応付けされる検索用情報であって、当該画像化文書データに埋め込まれるべきと判定された前記テキストオブジェクトに対応する情報を含む前記検索用情報を作成する作成手段をさらに有する
ことを特徴とする請求項1乃至6の何れか1項に記載の装置。
【請求項8】
前記検索用情報は、
画像化文書データについて、文字列を用いた検索が可能であるか示す情報と、
テキストオブジェクトのうち原稿オブジェクトが、画像化文書データに埋め込まれるか示す情報と、
テキストオブジェクトのうち注釈オブジェクトが、画像化文書データに埋め込まれるか示す情報と
をさらに含む
ことを特徴とする請求項7に記載の装置。
【請求項9】
前記画像化文書データが更新された場合、前記画像化文書データと対応付けされた前記検索用情報も更新される
ことを特徴とする請求項7または8に記載の装置。
【請求項10】
ページ内にテキストオブジェクトと画像オブジェクトとを含む文書データに基づいて、ページ全体が1つの画像オブジェクトで構成される画像化文書データを作成する作成ステップと、
前記テキストオブジェクトの各々が、前記画像化文書データに埋め込まれるべきテキストオブジェクトであるか判定する判定ステップと、
前記画像化文書データに埋め込まれるべきと判定されたテキストオブジェクトに対応する文字列のデータを、前記画像化文書データに埋め込む埋め込みステップと、
を有し、
前記判定ステップにおいて、前記テキストオブジェクトの各々に対し、
テキストオブジェクトが透明であるか判定し、
透明であると判定されたテキストオブジェクトの領域に重なっている画像オブジェクトがある場合、該画像オブジェクトにOCR処理を行って、該画像オブジェクトに対応する文字列を取得し、
前記透明であると判定されたテキストオブジェクトの文字列が、前記画像オブジェクトに対応する前記取得された文字列と同じである場合、該テキストオブジェクトは前記画像化文書データに埋め込まれるべきテキストオブジェクトである、と判定し、
前記透明であると判定されたテキストオブジェクトの文字列が、前記画像オブジェクトに対応する前記取得された文字列と同じでない場合、該テキストオブジェクトは前記画像化文書データに埋め込まれるべきでないテキストオブジェクトである、と判定する、
ことを特徴とする方法。
【請求項11】
コンピュータに、請求項10に記載の方法を実行させるための、プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文書データの画像化処理において、文書画像の表示内容に応じた検索を可能にする技術に関する。
【背景技術】
【0002】
Microsoft社のWord等の文書編集アプリケーションが扱う文書データは、描画オブジェクトとして、ビットマップなどの画像データ、文字列などのテキストデータ、四角形などのグラフィックデータなど様々なデータを含むことが可能である。ユーザーは、文書編集アプリケーションを用いて、文書の各ページに対し、画像、文字、図形を付加することができる。
【0003】
また、上記の文書データを文書編集アプリケーション独自のフォーマットから他のアプリケーションでも利用可能なフォーマットに変換する技術が知られている。このような技術として例えば、文書データに含まれる描画オブジェクトを画像データのみにする技術(文書データの画像化)が知られている。このような技術を用いて文書データを変換することで、文書データを容易に共有することが可能となり、また、文字や図形などの編集が容易に行えないようになる。
【0004】
一方、文書管理システムにおいて、複数の文書データそれぞれに対するテキスト情報を保存しておくことで、このテキスト情報を用いて文書データを検索可能にする技術が知られている。
【0005】
特許文献1は、文書データに基づき作成した文書画像をデータベースに保存する技術について開示している。具体的には、文書データの描画コードに基づきテキスト情報を作成するとともに、該描画コードに基づき文書画像を作成し、テキスト情報と文書画像とを関連付けてデータベースに保存する。特許文献1により、テキスト情報を検索し、所定の文字列を含むテキスト情報と関連付けられた文書画像をユーザーに提示することが可能となる。しかし、特許文献1には以下の課題がある。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開平8−212331号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
文書編集アプリケーションを用いて文書データを作成する際、テキストオブジェクトの上に図形オブジェクト等の他のオブジェクトを配置すると、当該テキストオブジェクトは隠れた状態となる。このような文書データの画像化により作成された文書画像において、このテキストオブジェクトの文字列は表示されず、ユーザーは該文字列を視認することができない。一方、この文書データの描画コードに基づきテキスト情報(検索用情報)を作成、すなわち、文字コードを抽出すると、他のオブジェクトで隠されているテキストオブジェクトの文字列に関する文字コードも抽出されてしまう。従って、文書画像に表示されない文字列まで、検索可能な対象に含まれてしまうという課題があった。特に、他のオブジェクトで隠されているテキストオブジェクトの文字列が共有するべきではない情報を示す場合、セキュリティ上の問題にもなり得る。
【0008】
そこで本発明は、文書データに対する画像化処理を実行して画像化文書データを作成する際、ユーザーにとって視認可能に表示されない文字列を検索可能な対象から除外することを目的とする。
【課題を解決するための手段】
【0009】
本発明は、ページ内にテキストオブジェクトと画像オブジェクトとを含む文書データに基づいて、ページ全体が1つの画像オブジェクトで構成される画像化文書データを作成する作成手段と、前記テキストオブジェクトの各々が、前記画像化文書データに埋め込まれるべきテキストオブジェクトであるか判定する判定手段と、前記画像化文書データに埋め込まれるべきと判定されたテキストオブジェクトに対応する文字列のデータを、前記画像化文書データに埋め込む埋め込み手段と、を有し、前記判定手段は、前記テキストオブジェクトの各々に対し、テキストオブジェクトが透明であるか判定し、透明であると判定されたテキストオブジェクトの領域に重なっている画像オブジェクトがある場合、該画像オブジェクトにOCR処理を行って、該画像オブジェクトに対応する文字列を取得し、前記透明であると判定されたテキストオブジェクトの文字列が、前記画像オブジェクトに対応する前記取得された文字列と同じである場合、該テキストオブジェクトは前記画像化文書データに埋め込まれるべきテキストオブジェクトである、と判定し、前記透明であると判定されたテキストオブジェクトの文字列が、前記画像オブジェクトに対応する前記取得された文字列と同じでない場合、該テキストオブジェクトは前記画像化文書データに埋め込まれるべきでないテキストオブジェクトである、と判定する、ことを特徴とする装置である。
【発明の効果】
【0010】
本発明により、文書データに対する画像化処理を実行して画像化文書データを作成する際、ユーザーにとって視認可能に表示されない文字列を検索可能な対象から除外することが可能となる。
【図面の簡単な説明】
【0011】
図1】実施例1におけるPCのハードウェア構成を示すブロック図
図2】実施例1におけるPCのソフトウェア構成を示すブロック図
図3】実施例1における文書編集装置のGUI画面
図4】実施例1における文書管理装置のGUI画面
図5】文書データのデータ構造
図6】原稿オブジェクトのデータ構造
図7】注釈オブジェクトのデータ構造
図8】文書データの層構造
図9】文書検索用情報のデータ構造
図10】原稿オブジェクトの解析処理の説明図
図11】文書データの内部フォーマットからのデータの読み出し例
図12】実施例1における文書データの画像化処理のフローチャート
図13】実施例1におけるテキストオブジェクトリスト
図14】実施例1の画像化処理における一部のプロセスの詳細なフローチャート
図15】実施例1におけるテキストオブジェクトの各文字の解析処理の説明図
図16】実施例2におけるGUIのダイアログ
図17】実施例2における文書検索用情報のデータ構造
図18】実施例2における文書データの画像化処理のフローチャート
図19】実施例3における文書検索用情報の更新処理のフローチャート
【発明を実施するための形態】
【0012】
以下、図面を参照して、本発明の好適な実施形態を例示的に説明する。但し、以下に記載されているコンポーネントの相対配置、GUI画面、フロー等は、あくまで例示であり、この発明の範囲をそれらのみに限定する趣旨のものではない。その趣旨を逸脱しない範囲で、当業者の通常の知識に基づいて、以下に記載する実施形態に対して適宜変更、改良が加えられたものについても本発明の範囲に入ることが理解されるべきである。
【0013】
[実施例1]
<PCのハードウェア構成について>
図1は、本実施例における情報処理装置(以下、PC)10のハードウェア構成を示すブロック図である。本実施例では、PC10によって、文書を編集するための装置(以下、文書編集装置)、および、文書を管理するための装置(以下、文書管理装置)を実現する。
【0014】
CPU100は、RAM101に記憶されているプログラムに従って、システムバス110に接続される各デバイスを総括的に制御する。RAM101はデータを一時的に記憶する記憶媒体であり、CPU100のメインメモリ、ワークエリア等としても機能する。ROM102は、各種プログラム及びデータを格納しており、ブートプログラムやBIOS等を記憶するプログラムROM102aと、各種データを記憶するデータROM102bとに区分けして構成される。なお本実施例では、ROM102の領域を内部で区分けして用いるが、プログラムROM102aとデータROM102bとを物理的に別個の記憶手段として構成しても良い。キーボードコントローラ103は、キーボード108や不図示のポインティングデバイス(例えばマウス)などを介するユーザーによる入力を制御する。ディスプレイコントローラ104は、ディスプレイ107への表示を制御する。ディスクコントローラ105は、各種データを記憶する外部メモリ109(例えばハードディスクやフロッピーディスク等)におけるデータアクセス、及び、外部メモリ109へのデータの書き込みおよび外部メモリ109からのデータの読み出しを制御する。ネットワークコントローラ(以下、NC)106はLAN等のネットワークに接続されており、PC10とネットワークを介して接続されている他の機器との間のデータ通信を制御する。
【0015】
<PC(文書編集装置)のソフトウェア構成について>
図2は、本実施例におけるPC10のソフトウェア構成を示すブロック図である。図2に示す各コンポーネントは、プログラムROM102aや外部メモリ109に記憶されているプログラムがRAM101に展開され、CPU100が該展開されたプログラムを実行することで、実現される。
【0016】
PC10は、文書データを読み込み、文書を編集する機能をユーザーに提供する文書編集装置として機能する。図2(a)は、PC10が文書編集装置200として機能する際のソフトウェア構成を示す。文書編集装置200が取り扱う文書データとして、画像データ及びテキストデータを保持可能なものであれば、任意のフォーマットの文書データを用いてよい。この任意のフォーマットの文書データには、文書編集装置200独自のフォーマットの文書データや、一般的なアプリケーションで用いられる文書データを文書編集装置200で取り扱えるように変換したもの等が含まれる。図2(a)に示すように、文書編集装置200は、入出力制御部201と、編集部202と、保存部203と、解析部204とを備える。入出力制御部201は、ディスプレイ107に表示されるGUI画面を介するユーザーからの入力およびユーザーへの出力を制御する。なお、文書編集装置200のGUI画面については、図3(a)を用いて後述する。編集部202は、入出力制御部201から入力された編集指示に従い、文書データに対する各種編集処理を実行する。保存部203は、編集部202から入力された保存指示に従い、文書データを保存する。この保存指示は、文書編集装置200のGUI画面を介するユーザー入力に基づくものであっても良いし、ユーザーが文書を編集する際に行われる自動保存によるものであっても良い。また、ここで保存する文書データには、文書編集装置200により更新中の文書データや更新完了した文書データ等が含まれる。解析部204は、文書データを解析するとともに、該解析した文書データに基づく1または複数の描画オブジェクトを生成する。
【0017】
図3(a)に、文書編集装置200のGUI画面を示す。文書編集装置200のGUI画面は、メインウインドウ300と、メニュー/ツールバー310と、プレビューペイン320とを有する。メニュー/ツールバー310には、文書編集装置200が提供可能な機能をユーザーが選択するためのメニュー項目、および、ボタンが配置されている。このボタンには、図示するように、文書データに注釈を付与するための注釈ボタン311や、文書データを異なるフォーマットに変換して保存するためのExportボタン312などが含まれる。プレビューペイン320には、編集中の文書データの各ページの描画内容が表示される。表示する描画内容は、文書データを構成する原稿データ、および、注釈データに基づき決定される。なお、原稿データおよび注釈データについては、図6及び図7を用いて後述する。
【0018】
図3(a)は、3つのテキストオブジェクトに対応する文字列、即ち、文字列abcde、文字列αβγ、文字列12345が表示されることを示す。一方、図3(b)は、文字列αβγに対応するテキストオブジェクトの上に矩形の図形オブジェクトが置かれているため、文字列αβγが表示されないことを示す。
【0019】
<PC(文書管理装置)のソフトウェア構成について>
PC10は、1または複数の文書データを管理し、管理する文書データに関する情報(名称など)をユーザーに提示する文書管理装置としても機能する。図2(b)は、PC10が文書管理装置210として機能する際のソフトウェア構成を示す。ユーザーは、文書管理装置210を介して、文書データを管理する(文書データ自体の複製や削除など)管理機能、および、文書データを検索する検索機能を利用可能である。図2(b)に示すように、文書管理装置210は、入出力制御部211と、管理部212と、検索部213とを備える。入出力制御部211は、ディスプレイ107に表示されるGUI画面を介するユーザーからの入力およびユーザーへの出力(文書データの一覧表示など)を制御する。文書管理装置210のGUI画面については、図4を用いて後述する。管理部212は、入出力制御部211から入力された管理指示に従い、文書データに対する管理処理、すなわち、文書データの複製、削除などの各種処理を実行する。検索部213は、管理部212から入力された検索指示に従い、文書データを検索する。この検索指示は、文書管理装置210のGUI画面を介するユーザー入力に基づく。検索の結果は、入出力制御部211によって、GUI画面に表示される。
【0020】
図4に、文書管理装置210のGUI画面を示す。文書管理装置210のGUI画面は、メインウインドウ400と、メニュー/ツールバー410と、フォルダー表示ペイン420と、文書データ表示ペイン430と、検索ペイン440とを有する。メニュー/ツールバー410には、文書管理装置210が提供可能な機能をユーザーが選択するためのメニュー項目、および、ボタンが配置されている。フォルダー表示ペイン420には、文書管理装置210が管理しているフォルダー421が表示される。
【0021】
文書データ表示ペイン430には、文書データ431が、サムネイルとファイル名とによって表示されている。例えば、検索ペイン440を介しての検索が実行されない場合、文書データ表示ペイン430には、フォルダー表示ペイン420で選択されているフォルダーに存在する全ての文書データが表示される。或いは、検索ペイン440を介しての検索が実行された場合、文書データ表示ペイン430には、フォルダー表示ペイン420で選択されているフォルダーに存在し、かつ、検索条件を満たす文書データが表示される。
【0022】
検索ペイン440には、文書管理装置210が管理しているフォルダーに存在する文書データの中から検索条件を満たす文書データを検索する機能をユーザーに提供するための、検索ボックス441と、検索実行ボタン442とが配置されている。検索ボックス441では、検索条件を指定可能であり、例えば文書データのファイル名や文書データに含まれる注釈の文字列などを指定可能である。検索実行ボタン442がユーザーによって押下されると、検索ボックス441に入力された検索条件に基づく文書データの検索が実行され、検索結果が文書データ表示ペイン430に表示される。
【0023】
<文書データのデータ構造について>
本実施例で取り扱う文書データのデータ構造について、図5を用いて説明する。図5は、文書データのデータ構造の一例を模式的に示す図である。図示するように、文書データ500は紙媒体の書物に類似した、複数ノードから成るツリー構造を有し、上位層である1つの文書501と、下位層であるページ502a、502b、502c、502dとから構成される。このように文書データは複数のページを含むことができるが、文書データが1つのページのみを含む構成であっても良い。文書501は、文書全般に係る属性(文書属性)が定義されており、定義された属性値、および、ページ502a、502b、502c、502dとのリンクを有する。ページ502a、502b、502c、502dは夫々、文書編集装置200で定義される各ページに相当し、ページ毎に属性(ページ属性)が定義されており、各ページに対応する実体(すなわち、原稿データおよび注釈データ)を持つ。なお、ここで用いている用語「文書」および「ページ」について、これらは文書データのデータ構造(複数ノードから成るツリー構造)を説明するために便宜的に用いた用語であり、同等の構成を成していれば他の用語であっても構わない。検索のために文書管理装置210が用いるデータとして、文書データ500に対応付けされた文書検索用情報510が存在する。なお、文書検索用情報510については、図9を用いて後述する。
【0024】
<原稿オブジェクトのデータ構造について>
図6は、文書データの各ページの原稿データとして用いられる原稿オブジェクトのデータ構造を説明するための図であり、各ページに配置される原稿オブジェクトに関する情報を管理するためのリスト(以下、原稿オブジェクトリスト)600を示す。図示するように、各原稿オブジェクトは、符号601〜607に示す項目の情報を持つ。
【0025】
原稿オブジェクトID601は、原稿オブジェクトを識別するための識別子(以下、ID)である。原稿オブジェクト種類602は、原稿オブジェクトの種類を示す情報である。左上座標603は、原稿オブジェクトの矩形の左上の座標の情報(値)である。右下座標604は、原稿オブジェクトの矩形の右下の座標の情報(値)である。重なり順序605は、原稿オブジェクト同士が重なる場合に描画する順番(すなわち、原稿オブジェクトが、該原稿オブジェクトと重なる他の原稿オブジェクトの上または下の何れに描画されるか)を示す情報である。ページ番号606は、原稿オブジェクトが配置されるページ番号である。
【0026】
原稿オブジェクト固有情報607は、原稿オブジェクト毎の固有情報である。例えば、原稿オブジェクトが長方形のオブジェクトの場合、図示するように、原稿オブジェクト固有情報607には、符号611〜613に示す項目の情報が含まれる。線の種類611は、長方形の線の種類を示す情報である。線の色612は、長方形の線の色を示す情報(以下、色情報)である。色情報とは具体的に、色を指定するRGBチャンネルと透明度を指定するアルファチャンネルとの画素値である。塗りつぶし色613は、長方形内の塗りつぶしの色情報である。また例えば、原稿オブジェクトがテキストオブジェクトの場合、図示するように、原稿オブジェクト固有情報607には、符号621〜623に示す項目の情報が含まれる。文字列621は、テキストオブジェクトの文字列である。フォント名622は、指定のフォントを示す情報である。文字色623は、文字の色情報である。
【0027】
このように、各原稿オブジェクトに対応するデータ群(以下、原稿オブジェクト情報)610が、原稿オブジェクトリスト600に保持されている。
【0028】
<注釈オブジェクトのデータ構造について>
図7は、文書データの各ページの注釈データとして用いられる注釈オブジェクトのデータ構造を説明するための図であり、各ページに配置される注釈オブジェクトに関する情報を管理するためのリスト(以下、注釈オブジェクトリスト)700を示す。図示するように、各注釈オブジェクトは、符号701〜707に示す項目の情報を持つ。
【0029】
注釈オブジェクトID701は、注釈オブジェクトを識別するためのIDである。注釈オブジェクト種類702は、注釈オブジェクトの種類を示す情報である。左上座標703は、注釈オブジェクトの矩形の左上の座標の情報(値)である。右下座標704は、注釈オブジェクトの矩形の右下の座標の情報(値)である。重なり順序705は、注釈オブジェクト同士が重なる場合に描画する順番(すなわち、注釈オブジェクトが、該注釈オブジェクトと重なる他の注釈オブジェクトの上または下の何れに描画されるか)を示す情報である。ページ番号706は、注釈オブジェクトが配置されるページ番号である。
【0030】
注釈オブジェクト固有情報707は、注釈オブジェクト毎の固有情報である。例えば、注釈オブジェクトが長方形のオブジェクトの場合、図示するように、注釈オブジェクト固有情報707には、符号711〜713に示す項目の情報が含まれる。線の種類711は、長方形の線の種類を示す情報である。線の色712は、長方形の線の色情報である。塗りつぶし色713は、長方形内の塗りつぶしの色情報である。また例えば、注釈オブジェクトがテキストオブジェクトの場合、図示するように、注釈オブジェクト固有情報707には、符号721〜723に示す項目の情報が含まれる。文字列721は、テキストオブジェクトの文字列である。フォント名722は、指定のフォントを示す情報である。文字色723は、文字の色情報である。
【0031】
このように、各注釈オブジェクトに対応するデータ群(以下、注釈オブジェクト情報)710が、注釈オブジェクトリスト700に保持されている。なお、注釈オブジェクトリスト700について、全ての注釈オブジェクトデータに対して1つのリストを持つように構成しても良いし、ページごとに1つのリストを持つように構成しても良い。
【0032】
<文書データの層構造について>
図8は、文書データの層構造について模式的に示す図である。図示するように、文書データは、描画キャンパスと、原稿オブジェクトを描画する原稿オブジェクト描画層と、注釈オブジェクトを描画する注釈オブジェクト描画層とから構成され、原稿オブジェクト描画層の上に注釈オブジェクト描画層が存在する。つまり、注釈オブジェクトが原稿オブジェクトより上位に描画されることとなる。従って、原稿オブジェクトと同一座標に注釈オブジェクトが存在する場合、原則的に、上位層に描画される注釈オブジェクトが優先的に表示され、原稿オブジェクトが表示されない。
【0033】
<文書検索用情報のデータ構造について>
図9は、文書データを検索するために用いられる文書検索用情報510(図5参照)の一例を示す図である。図示するように、文書検索用情報510は、符号900,901、910〜913に示す項目の情報を持つ。
【0034】
文書データパス900は、文書データ500へのパスである。画像化情報901は、文書データ500が画像化されているか否かを示す情報である。種類910は、テキストオブジェクトの種類を示す情報(即ち、テキストオブジェクトが原稿オブジェクトと注釈オブジェクトとの何れであるかを示す情報)である。文字列911は、テキストオブジェクトの文字列である。位置情報912は、テキストオブジェクトの位置を示す情報(具体的にはページ番号および座標値)である。実在情報913は、テキストオブジェクトが文書データ500に存在しているか否かを示す情報である。例えば、文書データの画像化処理を行う際にテキストオブジェクトの文書データへの埋め込みを行わなかった場合、このテキストオブジェクトは、画像化された文書データに存在していない状態となる。従って、この場合、画像化された文書データに対応する文書検索用情報510において、このテキストオブジェクトの実在情報913は、テキストオブジェクトが文書データに存在しないことを示す値となる。このような各テキストオブジェクトに対応するデータ群(以下、テキストオブジェクト情報)920が、文書検索用情報510に含まれる。
【0035】
文書管理装置210は、文書検索用情報510を用いて検索処理を行う。具体的には、文書管理装置210は、GUI画面の検索ボックス441(図4参照)を用いて入力された検索条件に従い、ユーザーによって指定された文字列と、文書検索用情報510に含まれる文字列911とが一致するかを判定する。この判定の結果、一致するテキストオブジェクト情報920が存在する場合、文書データパス900が示す文書データ500を、文書データ表示ペイン430に表示してユーザーに提示する。なお、文書データを検索する際、ユーザーは、検索ボックス441を用いてテキストオブジェクトの種類(原稿オブジェクトと注釈オブジェクトとの何れか)を指定することも可能である。この場合、文字列911の情報に加えて、種類910の情報も考慮された検索結果が、文書データ表示ペイン430に表示される。つまり、ユーザー指定の文字列と文字列911とが一致し、かつ、ユーザー指定のテキストオブジェクトの種類と種類910とが一致するテキストオブジェクト情報920が存在する場合、文書データパス900が示す文書データ500が表示される。なお、ここでは、文書検索用情報510を用いて検索を実行する場合について説明しているが、検索は、後述の画像化文書データに埋め込まれるテキストオブジェクトを用いて実行しても良い。
【0036】
<原稿オブジェクトおよび注釈オブジェクトの解析について>
原稿オブジェクトを解析し、該解析によって得た情報を原稿オブジェクトリストに保持する処理、および、注釈オブジェクトを解析し、該解析によって得た情報を注釈オブジェクトリストに保持する処理について説明する。これらの処理は、編集部202から入力された指示に従い、解析部204が外部メモリ109等のメモリに格納されている文書データにアクセスして実行する。
【0037】
図10は、原稿オブジェクトの解析処理を説明するための図であり、図10(a)は2つの原稿オブジェクトを示す。図示するように、長方形のオブジェクトである原稿オブジェクト1001の上に、テキストオブジェクトである原稿オブジェクト1002が存在する。
【0038】
図10(b)および図10(c)は、これらの原稿オブジェクトの解析によって得られる情報を示す図である。図10(b)は、原稿オブジェクトリストに保持される情報のうち原稿オブジェクト1001に関する情報を示し、図10(c)は、原稿オブジェクト1002に関する情報を示す。図10(a)及び図10(b)に示すように、左上座標(20,34)と右下座標(81,65)とにより表現される矩形領域が、原稿オブジェクト1001の存在する領域であり、このような矩形領域を「存在領域」と定義する。また、原稿オブジェクト1001の上に原稿オブジェクト1002が配されていることから、原稿オブジェクト1001の重なり順序の値は、原稿オブジェクト1001が原稿オブジェクト1002の下に描画されることを示す値0となる。一方、原稿オブジェクト1002の重なり順序の値は、図10(c)に示すように、原稿オブジェクト1002が原稿オブジェクト1001の上に描画されることを示す値1となる。なお仮に、原稿オブジェクト1001の重なり順序の値が1、原稿オブジェクト1002の重なり順序の値が0の場合、原稿オブジェクト1001が原稿オブジェクト1002の上に描画されることとなるので、文字列ABCDEは表示されないこととなる。
【0039】
図11は、文書データの内部フォーマットから、図10(a)の原稿オブジェクト1001と同様の原稿オブジェクトが読み込まれ、情報が取り出される例を示す図である。この図では、内部フォーマットとしてバイナリーデータが示されているが、XML(Extensible Markup Language)のようなテキスト形式のデータであっても良い。
【0040】
なお、上述の説明では、原稿オブジェクトの解析によって得た情報を原稿オブジェクトリストに保持する場合について説明しているが、注釈オブジェクトの解析によって得た情報を注釈オブジェクトリスト保持する場合についても同様である。すなわち、解析部204がメモリに格納されている文書データにアクセスし、注釈オブジェクトを解析し、該解析によって得た情報を注釈オブジェクトリストに保持する。これ以降、原稿オブジェクトと注釈オブジェクトとをまとめて表現する場合に、これらをまとめて「オブジェクト」と総称する。
【0041】
<文書データの画像化処理について>
図12は、本実施例における文書データの画像化処理の流れを示すフローチャートである。ここで文書データの画像化処理とは、文書データのページ毎に各ページのオブジェクトに基づくページ画像オブジェクトを生成、及び、該生成したページ画像オブジェクトから成る文書データ(画像化文書データ)の作成を伴う処理を意味する。なお、以下に示す文書データの画像化処理は、文書編集装置200のGUI画面(図3(a)参照)でユーザーがExportボタン312を押下することで、開始する。
【0042】
ステップS1201において、編集部202は、文書データのページ毎に、ページ内の1または複数の描画オブジェクトに基づき、ページ全体を表す1つのページ画像オブジェクトを生成する。ページ画像オブジェクトは、原稿オブジェクト描画層に配置される原稿オブジェクトである。
【0043】
ステップS1202において、編集部202は、ステップS1201で生成したページ画像オブジェクトのそれぞれを各ページのページデータとする、画像化文書データを作成する。
【0044】
ステップS1203において、解析部204は、画像化対象の文書データを解析し、該文書データの原稿オブジェクトリスト600および注釈オブジェクトリスト700を作成する。この原稿オブジェクトリスト600および注釈オブジェクトリスト700は編集部202に渡される。編集部202は、渡された原稿オブジェクトリスト600から文字列の情報を有する原稿オブジェクト情報610を全て取得し、また、渡された注釈オブジェクトリスト700から、文字列の情報を有する注釈オブジェクト情報710を全て取得する。そして、編集部202は、該取得した原稿オブジェクト情報610および注釈オブジェクト情報710に基づき、画像化対象の文書データに含まれるテキストオブジェクトのリスト(以下、テキストオブジェクトリスト)を作成する。図13に、本ステップで作成するテキストオブジェクトリストの例を示す。図示するように、テキストオブジェクトリスト1300は、各テキストオブジェクトに対応するデータ群(テキストオブジェクト情報)1301を保持する。
【0045】
ステップS1204において、編集部202は、ステップS1203で作成したテキストオブジェクトリスト1300にある未処理のテキストオブジェクトの1つに注目し、該注目したテキストオブジェクトに対応するテキストオブジェクト情報1301を取得する。本ステップで注目するテキストオブジェクトを「注目テキストオブジェクト」と呼ぶ。
【0046】
ステップS1205において、編集部202は、注目テキストオブジェクトが、ユーザーにとって視認可能に表示されるオブジェクトであるかを判定する。ステップS1205の判定の結果が真の場合、ステップS1206に進む一方、該判定の結果が偽の場合、ステップS1210に進む。なお、ステップS1205の処理については、図14を用いて後述する。
【0047】
ステップS1206において、編集部202は、ユーザーにとって視認可能に表示される注目テキストオブジェクトの文字列とその座標の情報とを生成する。なお、ステップS1206の処理については、図14を用いて後述する。
【0048】
ステップS1207において、編集部202は、ステップS1204で取得したテキストオブジェクト情報1301を参照し、注目テキストオブジェクトが存在するページを示すページ番号を取得する。
【0049】
ステップS1208において、編集部202は、注目テキストオブジェクトのテキストオブジェクト情報1301に基づきテキストオブジェクトを複製する。そして、該複製したテキストオブジェクトを、ステップS1202で作成した画像化文書データにおける所定の位置、即ち、ステップS1207で取得したページ番号とステップS1206で取得した座標とが示す位置に、非表示の状態で挿入する(埋め込み処理)。非表示の状態とは例えば、テキストオブジェクトが透明な状態である。
【0050】
ステップS1209において、編集部202は、画像化文書データに対応する文書検索用情報510を更新する。具体的には、画像化情報901を、文書データが画像化されていることを示す値に設定し、注目テキストオブジェクトに対応するテキストオブジェクト情報920を追加する。このテキストオブジェクト情報920において、種類910は、注目テキストオブジェクトの種類(すなわち、原稿オブジェクトと注釈オブジェクトとの何れであるか)に応じて、原稿オブジェクトまたは注釈オブジェクトであることを示す値に設定される。また、文字列911は、ステップS1206で取得した文字列に設定される。さらに、位置情報912は、所定の位置を示す情報、即ち、ステップS1207で取得したページ番号、および、ステップS1206で取得した座標に設定される。また、実在情報913は、テキストオブジェクトが文書データに存在していることを示す値に設定される。なお、本ステップで取り扱っている注目テキストオブジェクトは、ユーザーにとって視認可能に表示されるオブジェクトであるため(ステップS1205でYES)、テキストオブジェクトの複製および埋め込みは必ず実行される(ステップS1208)。従って、本ステップでは、実在情報913は常に、テキストオブジェクトが文書データに存在していることを示す値に設定されることとなる。このように注目テキストオブジェクト毎に、テキストオブジェクト情報920を作成し、文書検索用情報510に追加することで、文書検索用情報510を更新する。
【0051】
ステップS1210において、編集部202は、テキストオブジェクトリスト1300にある全てのテキストオブジェクトに対する処理が完了したかを判定する。ステップS1210の判定の結果が真の場合、ステップS1211に進む一方、該判定の結果が偽の場合、ステップS1204に戻る。
【0052】
ステップS1211において、編集部202は、画像化文書データとこれに対応する文書検索用情報とを保存するよう保存部203に指示し、保存部203は、該画像化文書データおよび該文書検索用情報を保存する。
【0053】
図14は、図12のステップS1205およびステップS1206における処理の詳細なフローチャートである。
【0054】
ステップS1401において、編集部202は、注目テキストオブジェクトが透明であるかを判定する。この判定は、注目テキストオブジェクトが原稿オブジェクトの場合、注目テキストオブジェクトに対応するテキストオブジェクト情報1301の原稿オブジェクト固有情報に含まれる文字の色情報(文字色623)に基づいて行われる。一方、注目テキストオブジェクトが注釈オブジェクトの場合、文字色723に基づいて行われる。ステップS1401の判定の結果が真の場合、ステップS1402に進む一方、該判定の結果が偽の場合、ステップS1406に進む。
【0055】
ステップS1402において、編集部202は、画像化対象の文書データの原稿オブジェクトリスト600および注釈オブジェクトリスト700を参照し、注目テキストオブジェクトの存在領域内に他のオブジェクトが存在するかを判定する。ステップS1402の判定の結果が真の場合、ステップS1403に進む一方、該判定の結果が偽の場合、ステップS1210に進む。
【0056】
ステップS1403において、編集部202は、存在領域内の他のオブジェクトが画像オブジェクトであるかを判定する。この判定は、存在領域内の他のオブジェクトに関するオブジェクトの種類を示す情報(即ち、原稿オブジェクト種類602または注釈オブジェクト種類702)に基づいて行われる。ステップS1403の判定の結果が真の場合、ステップS1404に進む一方、該判定の結果が偽の場合、ステップS1210に進む。
【0057】
ステップS1404において、編集部202は、画像オブジェクトの存在領域に対し光学文字認識(以下、OCR)処理を実行することで、この画像オブジェクトに対応する文字列を抽出し、取得する。
【0058】
ステップS1405において、編集部202は、注目テキストオブジェクトの文字列が、ステップS1404で取得した文字列と同一かを判定する。ステップS1405の判定の結果が真の場合、ステップS1406に進む一方、該判定の結果が偽の場合、ステップS1210に進む。
【0059】
ステップS1401〜S1405の処理は、文書データが予めOCR処理されていることにより透明なテキストオブジェクトを保持している可能性を考慮した処理である。一連の処理により、テキストオブジェクト自体が透明であるために該テキストオブジェクトの文字列が視認可能に表示されない場合であっても、同等の文字列が画像オブジェクトにより表示されるのであれば、この文字列を検索可能な対象に含めることが可能となる。
【0060】
ステップS1406において、編集部202は、画像化対象の文書データの原稿オブジェクトリスト600および注釈オブジェクトリスト700を参照することで、注目テキストオブジェクトの上位オブジェクトが存在するかを判定する。ここで上位オブジェクトとは、注目テキストオブジェクトの存在領域内にあるオブジェクトであって、注目テキストオブジェクトより上位に重なって配置されるオブジェクトである。ステップS1406の判定の結果が真の場合、ステップS1407に進む一方、該判定の結果が偽の場合、ステップS1411に進む。
【0061】
ステップS1407において、編集部202は、上位オブジェクトが透明であるかを判定する。この判定は、上位オブジェクトのオブジェクト情報に基づいて行う。例えば、上位オブジェクトが長方形の原稿オブジェクトである場合、対応する原稿オブジェクト情報610の塗りつぶしの色情報(塗りつぶし色613)に基づいてステップS1407の判定が行われる。ステップS1407の判定の結果が真の場合、ステップS1411に進む一方、該判定の結果が偽の場合、ステップS1408に進む。
【0062】
ステップS1408において、編集部202は、注目描画オブジェクトと上位オブジェクトとが重なるため、ユーザーにとって視認可能に表示されない注目テキストオブジェクトの文字(以下、重なり文字)を導出する。具体的には図15に示すように、注目テキストオブジェクトの文字列について、1文字ごとに左上座標および右上座標を取得し、1文字ごとの矩形領域(存在領域)を導出する。そして、1文字ごとの存在領域と、上位オブジェクトの存在領域とを比較する。これにより、注目テキストオブジェクトの文字列の各文字について、上位オブジェクトと重なっているかを判定し、重なり文字を導出する。
【0063】
ステップS1409において、編集部202は、注目テキストオブジェクトの文字列のうち、注目オブジェクトの少なくとも一部が上位オブジェクトと重ならないため、ユーザーにとって視認可能に表示される文字列(以下、非重なり文字列)を生成する。非重なり文字列の生成は、注目テキストオブジェクトの文字列から重なり文字を除外することで行う。なお、注目オブジェクトの文字の全てが重なり文字の場合、本ステップは実行されない。本ステップで取得する非重なり文字列が、ステップ1209における文書検索用情報510の更新処理に用いられる。
【0064】
ステップS1410において、編集部202は、文字列の文字毎の座標に基づき、ステップS1409で生成した非重なり文字列の座標を示す情報を生成する。例として、図15の文字列ABCについて、ABが非重なり文字列、Cが重なり文字である場合について検討する。この場合、文字Aの左上座標(30,50)および文字Bの右下座標(57,70)が、非重なり文字列の座標を示す情報となる。本ステップが終了すると、ステップS1207に進む。
【0065】
ステップS1406〜S1410の処理は、テキストオブジェクトの上位に配置された他のオブジェクトにより、該テキストオブジェクトの文字列が隠された状態になっている可能性を考慮した処理である。この一連の処理により、テキストオブジェクトの文字列の一部が隠される場合、隠されていない(ユーザーが視認可能な)文字列のみを検索可能な対象に含めることが可能となる。
【0066】
ステップS1411において、編集部202は、注目テキストオブジェクトの背景色の情報を取得する。ここで背景色とは、注目テキストオブジェクトの直下に配置される他のオブジェクト(以下、背景オブジェクト)が存在する場合は、背景オブジェクトの色であり、背景オブジェクトが存在しない場合は、白色である。
【0067】
ステップS1412において、編集部202は、注目テキストオブジェクトの文字の色情報を取得する。
【0068】
ステップS1413において、編集部202は、ステップS1411で取得した背景色の情報およびステップS1412で取得した文字の色情報に基づき、背景色と文字の色とが同一かを判定する。ステップS1413の判定の結果が真の場合、ステップS1210に進む一方、該判定の結果が偽の場合、ステップS1409に進む。
【0069】
ステップS1411〜S1413の処理は、テキストオブジェクトの文字の色と背景色とが同一である可能性を考慮した処理である。この一連の処理により、テキストオブジェクトの文字の色が背景色と同一である場合に、テキストオブジェクトの文字列はユーザーにとって視認可能に表示されないものとして、この文字列を検索可能な対象から除外することが可能となる。
【0070】
[実施例2]
実施例1では、文書データの画像化処理の際、ユーザーにとって視認可能に表示される文字列のオブジェクトは、原稿オブジェクト、注釈オブジェクトにかかわらず全て画像化文書データに埋め込まれる。しかし、文書画像において表示される文字列を用いた検索をできないようにすることや、画像化文書データに原稿オブジェクトと注釈オブジェクトとの何れか一方を埋め込むことを、ユーザーが望む場合も考えられる。そこで本実施例では、ユーザーにとって視認可能に表示される文字列を用いた検索を可能にするか否か、および、検索可能とした場合に、画像化文書データに何れのテキストオブジェクトを埋め込むかをユーザーが選択できるようにする。なお、以下では、実施例1と共通する内容については、説明を適宜省略する。
【0071】
<GUIのダイアログについて>
図16に、本実施例におけるGUIのダイアログを示す。ユーザーは、文書データの画像化処理を実行するにあたって、検索設定ダイアログ1600を介し、検索用文字列の抽出に関する設定を行う。なお、検索設定ダイアログ1600は、文書編集装置200のGUI画面(図3(a)参照)の検索設定コントロールボタン(図示せず)が押下されると表示される。
【0072】
図示するように、検索設定ダイアログ1600は、3つのチェックボックス1601〜1603を有する。チェックボックス1601は、文書データの画像化処理の際、ユーザーにとって視認可能に表示されている文字列を用いた検索を可能にするか否かを設定するためのチェックボックスである。チェックボックス1601にチェックが入った状態で、チェックボックス1602、1603にチェックを入れることができるようになる。チェックボックス1602は、テキストオブジェクトのうちの原稿オブジェクトを画像化文書データに埋め込むか否かを設定するためのチェックボックスである。チェックボックス1603は、テキストオブジェクトのうちの注釈オブジェクトを画像化文書データに埋め込むか否かを設定するためのチェックボックスである。なお、検索設定ダイアログ1600のチェックボックス1601〜1603を用いてユーザーによって入力された情報は、画像化文書データに対応する文書検索用情報1700(図17参照)として保存される。
【0073】
<文書検索用情報について>
図17は、本実施例における文書検索情報の一例を示す図である。図示するように、文書検索用情報1700は、符号1701〜1703に示す項目の情報を含む。なお、図示していないが、文書検索用情報1700は、実施例1と同様に、図9に示した符号900,901、910〜913に示す項目の情報も含む。
【0074】
画像検索可否1701は、画像化文書データについて、文字列を用いた検索が可能であるか否かを示す情報である。検索設定ダイアログ1600のチェックボックス1601にチェックが入った状態で画像化が実行された場合、画像検索可否1701は、画像化文書データについて、文字列を用いた検索が可能であることを示す値となる。一方、チェックボックス1601にチェックが入っていない状態で画像化が実行された場合、画像検索可否1701は、画像化文書データについて、文字列を用いた検索ができないことを示す値となる。
【0075】
原稿埋め込み1702は、テキストオブジェクトのうちの原稿オブジェクトが、画像化文書データに埋め込まれるか否かを示す情報である。チェックボックス1602にチェックが入った状態で文書データの画像化が実行された場合、原稿埋め込み1702は、テキストオブジェクトのうちの原稿オブジェクトが、画像化文書データに埋め込まれていることを示す値となる。一方、チェックボックス1602にチェックが入っていない状態で文書データの画像化が実行された場合、原稿埋め込み1702は、テキストオブジェクトのうちの原稿オブジェクトが、画像化文書データに埋め込まれていないことを示す値となる。
【0076】
注釈埋め込み1703は、テキストオブジェクトのうちの注釈オブジェクトが、画像化文書データに埋め込まれるか否かを示す情報である。チェックボックス1603にチェックが入った状態で文書データの画像化が実行された場合、注釈埋め込み1703は、テキストオブジェクトのうちの注釈オブジェクトが、画像化文書データに埋め込まれていることを示す値となる。一方、チェックボックス1603にチェックが入っていない状態で文書データの画像化が実行された場合、注釈埋め込み1703は、テキストオブジェクトのうちの注釈オブジェクトが、画像化文書データに埋め込まれていないことを示す値となる。
【0077】
<画像化処理について>
図18は、本実施例における文書データの画像化処理の流れを示すフローチャートである。
【0078】
ステップS1201において、編集部202は、文書データのページ毎に、各ページの1または複数の描画オブジェクトに基づくページ画像オブジェクトを生成する。ステップS1202において、編集部202は、ステップS1201で生成したページ画像オブジェクトのそれぞれを各ページのページデータとする、画像化文書データを作成する。このように、ステップS1201及びステップS1202は、実施例1と同様である(図12参照)。ただし本実施例では、ステップS1202の後、ステップS1801に進む。
【0079】
ステップS1801において、編集部202は、文書検索用情報1700を取得する。
【0080】
ステップS1802において、編集部202は、ステップS1801で取得した文書検索用情報1700に含まれる画像検索可否1701に基づき、検索用文字列を抽出するかを判定する。ステップS1802の判定の結果が真の場合、ステップS1203に進む一方、該判定の結果が偽の場合、ステップS1211に進む。
【0081】
ステップS1203において、編集部202は、画像化対象の文書データに対応するテキストオブジェクトリストを取得する。ステップS1204において、編集部202は、ステップS1203で取得したテキストオブジェクトリストにある未処理のテキストオブジェクトの1つに注目する。ステップS1205において、編集部202は、注目テキストオブジェクトがユーザーにとって視認可能に表示されるオブジェクトであるかを判定する。ステップS1206において、編集部202は、ユーザーにとって視認可能に表示される注目テキストオブジェクトの文字列と座標の情報とを生成する。ステップS1207において、編集部202は、注目テキストオブジェクトのテキストオブジェクト情報1301を参照し、注目テキストオブジェクトが存在するページを示すページ番号を取得する。このように、ステップS1203〜ステップS1207は、実施例1と同様である(図12参照)。ただし本実施例では、ステップS1207の後、ステップS1803に進む。
【0082】
ステップS1803において、編集部202は、注目テキストオブジェクトのテキストオブジェクト情報1301を参照し、注目テキストオブジェクトの種類を示す情報を取得する。
【0083】
ステップS1804において、編集部202は、ステップS1803で取得した注目テキストオブジェクトの種類を示す情報に基づき、注目テキストオブジェクトが原稿オブジェクトであるかを判定する。ステップS1804の判定の結果が真の場合、ステップS1805に進む一方、該判定の結果が偽の場合(注目テキストオブジェクトが注釈オブジェクトの場合)、ステップS1808に進む。
【0084】
ステップS1805において、編集部202は、テキストオブジェクトのうちの原稿オブジェクトが画像化文書データに埋め込まれるか否かを示す情報(原稿埋め込み1702)に基づき、注目テキストオブジェクトを画像化文書データに埋め込むかを判定する。ステップS1805の判定の結果が真の場合、ステップS1806に進む一方、該判定の結果が偽の場合、ステップS1807に進む。
【0085】
ステップS1806において、編集部202は、ステップS1208と同様の処理、即ち、注目テキストオブジェクト(本ステップでは原稿テキストオブジェクト)を画像化文書データに挿入する埋め込み処理を実行する。
【0086】
ステップS1807において、編集部202は、ステップS1209と同様の処理、即ち、画像化文書データに対応する文書検索用情報1700を更新する。このとき、種類910(注目テキストオブジェクトの種類を示す情報)は、原稿オブジェクトであることを示す値に設定される。また、実在情報913(テキストオブジェクトが文書データに存在するか否かを示す情報)は、ステップS1806で原稿テキストオブジェクトを画像化文書データに埋め込んだ否かに基づき設定される。即ち、原稿テキストオブジェクトを画像化文書データに埋め込んだ場合、実在情報913は、テキストオブジェクトが文書データに存在することを示す値となる。一方、原稿テキストオブジェクトを画像化文書データに埋め込まなかった場合、実在情報913は、テキストオブジェクトが文書データに存在しないことを示す値となる。
【0087】
ステップS1808において、編集部202は、テキストオブジェクトのうちの注釈オブジェクトが画像化文書データに埋め込まれるか否かを示す情報(注釈埋め込み1703)に基づき、注目テキストオブジェクトを画像化文書データに埋め込むかを判定する。ステップS1808の判定の結果が真の場合、ステップS1809に進む一方、該判定の結果が偽の場合、ステップS1810に進む。
【0088】
ステップS1809において、編集部202は、ステップS1208と同様の処理、即ち、注目テキストオブジェクト(本ステップでは注釈テキストオブジェクト)を画像化文書データに挿入する埋め込み処理を実行する。
【0089】
ステップS1810において、編集部202は、ステップS1209と同様の処理、即ち、画像化文書データに対応する文書検索用情報1700を更新する。このとき、種類910(注目テキストオブジェクトの種類を示す情報)は、注釈オブジェクトであることを示す値に設定される。また、実在情報913は、ステップS1809で注釈テキストオブジェクトを画像化文書データに埋め込んだ否かに基づき設定される。即ち、注釈テキストオブジェクトを画像化文書データに埋め込んだ場合、実在情報913は、テキストオブジェクトが文書データに存在することを示す値となる。一方、注釈テキストオブジェクトを画像化文書データに埋め込まなかった場合、実在情報913は、テキストオブジェクトが文書データに存在しないことを示す値となる。
【0090】
本実施例により、文書データの画像化の際、文書画像において表示される文字列を用いた検索を可能にするか否か、および、検索可能とした場合に、画像化文書データに何れのテキストオブジェクトを埋め込むか、をユーザーが選択することが可能となる。
【0091】
[実施例3]
実施例1及び実施例2では、文書データの画像化処理により画像化文書データと、これに対応付けされた文書検索用情報とを作成した。本実施例では、この文書検索用情報を更新可能とする形態について説明する。
【0092】
<文書検索用情報の更新処理について>
図19は、本実施例における、文書データに対する編集が行われた際の、文書検索用情報の更新処理のフローチャートである。なお、以下に示す文書検索用情報の更新処理は、例えば、文書編集装置200のGUI画面(図3(a)参照)でユーザーが注釈ボタン311を押下し注釈を挿入することで、開始する。
【0093】
ステップS1901において、編集部202は、文書検索用情報510を取得する。
【0094】
ステップS1902において、編集部202は、ステップS1901で取得した文書検索用情報510の画像化情報901を取得する。
【0095】
ステップS1903において、編集部202は、ステップS1902で取得した画像化情報901に基づき、処理対象の文書データが画像化されているかを判定する。ステップS1903の判定の結果が真の場合、ステップS1904に進む一方、該判定の結果が偽の場合、一連の処理は終了する。
【0096】
ステップS1904において、編集部202は、編集対象ページのページ番号を取得する。
【0097】
ステップS1905において、編集部202は、編集情報を取得する。ここで編集情報とは、編集の内容がページの削除、或いは、ページの追加であるかを示す情報と、表示される文字列(以下、表示文字列)の変更に関する情報とを含む。表示文字列の変更に関する情報とは、編集により表示文字列が追加、或いは、削除されたかを示す情報と、変更された表示文字列そのものとを含む。
【0098】
ステップS1906において、編集部202は、ステップS1905で取得した編集情報に基づき、編集の内容がページの削除であるかを判定する。ステップS1906の判定の結果が真の場合、ステップS1907に進む一方、該判定の結果が偽の場合、ステップS1908に進む。
【0099】
以下、編集の内容がページの削除である場合(ステップS1906でYESの場合)について説明する。ステップS1907において、編集部202は、ステップS1904で取得した編集対象ページ(削除したページ)のページ番号と同じページ番号を位置情報912として持つテキストオブジェクト情報920を全て、文書検索用情報510から削除する。次いで、ステップS1916に進む。
【0100】
ステップS1916において、編集部202は、編集対象ページより後のページに存在するテキストオブジェクトに関するテキストオブジェクト情報920、具体的には位置情報912を更新する。例えば、あるテキストオブジェクトに関するテキストオブジェクト情報920の位置情報912であるページ番号が3であって、かつ、編集により2ページ目が削除されたような場合、該ページ番号を3から2に更新する。
【0101】
次に、編集の内容がページの削除ではない場合(ステップS1906でNOの場合)について説明する。ステップS1908において、編集部202は、ステップS1905で取得した編集情報に基づき、編集の内容がページの追加であるかを判定する。ステップS1908の判定の結果が真の場合、ステップS1913に進む一方、該判定の結果が偽の場合、ステップS1909に進む。
【0102】
以下、編集の内容がページの追加である場合(ステップS1908でYESの場合)について説明する。ステップS1913において、編集部202は、編集で追加されたページに存在するテキストオブジェクトのテキストオブジェクト情報を取得する。
【0103】
ステップS1914において、編集部202は、ステップS1913で取得したテキストオブジェクト情報を用いて、文書検索用情報510を更新する。具体的には、編集で追加されたページに存在する各テキストオブジェクトに対応するテキストオブジェクト情報920(文字列911等)を、文書検索用情報510に追加する。
【0104】
ステップS1915において、編集部202は、編集対象ページより後のページに存在するテキストオブジェクトに関するテキストオブジェクト情報920、具体的には位置情報912を更新する。例えば、あるテキストオブジェクトに関するテキストオブジェクト情報920の位置情報912であるページ番号が3であって、かつ、編集により2ページ目が追加されたような場合、該ページ番号を3から4に更新する。
【0105】
次に、編集の内容がページの追加ではない場合(ステップS1908でNOの場合)について説明する。ステップS1909において、編集部202は、ステップS1905で取得した編集情報に基づき、表示文字列が追加されたかを判定する。ステップS1909の判定の結果が真の場合、ステップS1912に進む一方、該判定の結果が偽の場合、ステップS1910に進む。
【0106】
ステップS1912において、編集部202は、追加された表示文字列を文字列911として持つテキストオブジェクト情報920を、文書検索用情報510に追加する。
【0107】
ステップS1910において、編集部202は、ステップS1905で取得した編集情報に基づき、表示文字列が削除されたかを判定する。ステップS1910の判定の結果が真の場合、ステップS1911に進む一方、該判定の結果が偽の場合、一連の処理は終了する。
【0108】
ステップS1911において、編集部202は、削除された表示文字列を文字列911として持つテキストオブジェクト情報920を、文書検索用情報510から削除する。
【0109】
本実施例により、文書の編集内容に応じて文書検索用情報510を更新することが可能となり、文書データの画像化処理により作成された画像化文書データが編集された場合に、該編集された画像化文書データについても、表示文字列を用いた検索が可能となる。なお、上述の説明では、本実施例を実施例1に適用する場合を説明しているが、本実施例は実施例2に適用することもできる。
【0110】
[その他の実施例]
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
【符号の説明】
【0111】
10・・・PC
202・・・編集部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19