IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士ゼロックス株式会社の特許一覧

<>
  • 特許-情報処理装置及び情報処理プログラム 図1
  • 特許-情報処理装置及び情報処理プログラム 図2
  • 特許-情報処理装置及び情報処理プログラム 図3
  • 特許-情報処理装置及び情報処理プログラム 図4
  • 特許-情報処理装置及び情報処理プログラム 図5
  • 特許-情報処理装置及び情報処理プログラム 図6
  • 特許-情報処理装置及び情報処理プログラム 図7
  • 特許-情報処理装置及び情報処理プログラム 図8
  • 特許-情報処理装置及び情報処理プログラム 図9
  • 特許-情報処理装置及び情報処理プログラム 図10
  • 特許-情報処理装置及び情報処理プログラム 図11
  • 特許-情報処理装置及び情報処理プログラム 図12
  • 特許-情報処理装置及び情報処理プログラム 図13
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-12-18
(45)【発行日】2023-12-26
(54)【発明の名称】情報処理装置及び情報処理プログラム
(51)【国際特許分類】
   G06F 3/0481 20220101AFI20231219BHJP
   G06F 40/169 20200101ALI20231219BHJP
   G06F 3/04842 20220101ALI20231219BHJP
【FI】
G06F3/0481
G06F40/169
G06F3/04842
【請求項の数】 6
(21)【出願番号】P 2020040900
(22)【出願日】2020-03-10
(65)【公開番号】P2021144302
(43)【公開日】2021-09-24
【審査請求日】2023-02-20
(73)【特許権者】
【識別番号】000005496
【氏名又は名称】富士フイルムビジネスイノベーション株式会社
(74)【代理人】
【識別番号】100115129
【弁理士】
【氏名又は名称】清水 昇
(74)【代理人】
【識別番号】100102716
【弁理士】
【氏名又は名称】在原 元司
(74)【代理人】
【識別番号】100122275
【弁理士】
【氏名又は名称】竹居 信利
(72)【発明者】
【氏名】加藤 慎吾
【審査官】玉木 宏治
(56)【参考文献】
【文献】特開2016-219022(JP,A)
【文献】特開2012-093895(JP,A)
【文献】特開2019-095849(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 3/0481- 3/0486
G06F 40/00 -40/197
(57)【特許請求の範囲】
【請求項1】
一又は複数のプロセッサを備え、
前記プロセッサは、文書の種類を示す種類情報と属性を示す属性情報とに対応付けて、または前記文書の前記属性情報に対応付けて、該文書に前記属性情報を付与したときに表示されていた該文書の部分を示す表示部分情報をメモリに記憶しており、
ユーザーによって指定された属性情報に対応する、前記メモリ内の表示部分情報にしたがって、表示対象である文書の部分を表示装置に表示するように制御を行う、
情報処理装置。
【請求項2】
前記属性情報を付与したときに表示されていた文書と前記表示対象である文書は、前記種類情報が同じであるが、それぞれ異なる文書である、
請求項1に記載の情報処理装置。
【請求項3】
前記プロセッサは、
前記表示対象である文書内の文字を認識した結果が存在する場合は
ユーザーによって指定された属性情報に対応する文字認識結果がある位置の文書の部分を表示装置に表示するように制御を行う、
請求項1に記載の情報処理装置。
【請求項4】
一又は複数のプロセッサを備え、
前記プロセッサは、文書の種類を示す種類情報と属性を示す属性情報とに対応付けて、または前記文書の前記属性情報に対応付けて、該文書に前記属性情報を付与したときに表示されていた該文書の部分を示す表示部分情報をメモリに記憶しており、
ユーザーによって指定された属性情報に対応する、前記メモリ内の表示部分情報にしたがって、表示対象である文書の部分を表示装置に表示するように制御を行う一方で、
前記表示対象である文書内の文字を認識した結果が存在する場合であって、ユーザーによって指定された前記属性情報に対応する文字列及び該文字列と予め定められた位置関係にある文字列が既に抽出されている場合は、前記予め定められた位置関係にある文字列の文字認識結果がある位置の文書の部分を前記表示装置に表示するように制御を行う、
情報処理装置。
【請求項5】
一又は複数のプロセッサを備えたコンピュータは、文書の種類を示す種類情報と属性を示す属性情報とに対応付けて、または前記文書の前記属性情報に対応付けて、該文書に前記属性情報を付与したときに表示されていた該文書の部分を示す表示部分情報をメモリに記憶しており、
前記プロセッサに、
ユーザーによって指定された属性情報に対応する、前記メモリ内の表示部分情報にしたがって、表示対象である文書の部分を表示装置に表示するように制御を行う、
処理を実行させるための情報処理プログラム。
【請求項6】
一又は複数のプロセッサを備えたコンピュータは、
文書の種類を示す種類情報と属性を示す属性情報とに対応付けて、または前記文書の前記属性情報に対応付けて、該文書に前記属性情報を付与したときに表示されていた該文書の部分を示す表示部分情報をメモリに記憶しており、
前記プロセッサに、
ユーザーによって指定された属性情報に対応する、前記メモリ内の表示部分情報にしたがって、表示対象である文書の部分を表示装置に表示するように制御を行う一方で、
前記表示対象である文書内の文字を認識した結果が存在する場合であって、ユーザーによって指定された前記属性情報に対応する文字列及び該文字列と予め定められた位置関係にある文字列が既に抽出されている場合は、前記予め定められた位置関係にある文字列の文字認識結果がある位置の文書の部分を前記表示装置に表示するように制御を行う、
処理を実行させるための情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置及び情報処理プログラムに関する。
【背景技術】
【0002】
特許文献1には、スキャン画像に対してOCR処理を行って得られた文字列を用いてファイル名等の設定を行う場面において、ファイル名等の設定に用いられた文字列をユーザーが確認しやすい態様で提示できることを課題とし、スキャン画像データが表すスキャン画像から文字列領域を抽出する抽出手段と、抽出された文字列領域を選択可能なようにスキャン画像をプレビュー画面に表示する表示制御手段と、プレビュー画面を介して選択された文字列領域の文字列を用いてスキャン画像データに関連する情報を生成する生成手段と、選択された文字列領域を特定可能な選択情報を保持する保持手段を備え、表示制御手段は、保持手段が保持する、過去のスキャン画像データに関する選択情報に基づいて、抽出手段が抽出した文字列領域のうち選択状態にして表示する対象を決定し、対象となるすべての文字列領域がプレビュー画面に収まるようにスキャン画像の表示範囲を決定することが開示されている。
【0003】
特許文献2には、スキャン画像データを表示するプレビュー画面において、ユーザーによる文字領域の選択を行いやすくすることを課題とし、文書をスキャンして得られたスキャン画像データに関連する情報を設定するための装置は、スキャン画像データに含まれる複数の文字領域を判定する領域判定手段と、判定された複数の文字領域の中から所望の文字領域をユーザーが選択するために、スキャン画像データをプレビュー画面に表示する表示手段を備え、ユーザーが選択する際に用いる文字領域は、領域判定手段で判定された文字領域を拡大したものであることが開示されている。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2019-128715号公報
【文献】特開2019-197989号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
文書に付与された属性を確認する場合に、その属性と関係する文書の部分を表示させることが行われている。その表示を行うために、ユーザーはスクロール、拡大等の操作を行う必要がある。そこで本発明は、文書に付与された属性を確認する場合に、ユーザーがその属性と関係する文書の部分を表示させるための操作を行わなければならない場合に較べて、属性に該当する部分を表示させるためのユーザーの指定を軽減させることができる情報処理装置及び情報処理プログラムを提供することを目的としている。
【課題を解決するための手段】
【0006】
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。なお、以下の「請求項」とあるのは、出願当初の請求項である。
請求項1の発明は、メモリと一又は複数のプロセッサを備え、前記メモリは、文書の種類を示す種類情報と属性を示す属性情報とに対応付けて、該文書に属性情報を付与する場合に表示されていた該文書の部分を示す表示部分情報を記憶しており、前記プロセッサは、ユーザーによって指定された種類情報と属性情報とに対応する、前記メモリ内の表示部分情報にしたがって、表示対象である文書の部分を表示装置に表示するように制御を行う、情報処理装置である。
【0007】
請求項2の発明は、前記プロセッサは、表示対象となっている文書の種類情報と属性情報とに対応付けて、該文書に属性を付与する場合に表示されていた該文書の部分を示す表示部分情報を、前記メモリに記憶させる、請求項1に記載の情報処理装置である。
【0008】
請求項3の発明は、前記文書は画像であり、前記プロセッサは、前記文書内の文字を認識し、ユーザーによって指定された属性情報に対応する文字認識結果がある位置の文書の部分を表示装置に表示するように第2の制御を行う、請求項1に記載の情報処理装置である。
【0009】
請求項4の発明は、前記プロセッサは、予め定められた文字列と該文字列と予め定められた位置関係にある文字列が既に抽出されている場合に、前記第2の制御を行う、請求項3に記載の情報処理装置である。
【0010】
請求項5の発明は、メモリと一又は複数のプロセッサを備えたコンピュータの前記メモリは、文書の種類を示す種類情報と属性を示す属性情報とに対応付けて、該文書に属性情報を付与する場合に表示されていた該文書の部分を示す表示部分情報を記憶しており、前記プロセッサに、ユーザーによって指定された種類情報と属性情報とに対応する、前記メモリ内の表示部分情報にしたがって、表示対象である文書の部分を表示装置に表示するように制御を行う、処理を実行させるための情報処理プログラムである。
【発明の効果】
【0011】
請求項1の情報処理装置によれば、文書に付与された属性を確認する場合に、ユーザーがその属性と関係する文書の部分を表示させるための操作を行わなければならない場合に較べて、属性に該当する部分を表示させるためのユーザーの指定を軽減させることができる。
【0012】
請求項2の情報処理装置によれば、文書の種類情報と属性情報とに対応付けて、その文書に属性を付与する場合に表示されていたその文書の部分を示す表示部分情報を、今後の表示に利用することができる。
【0013】
請求項3の情報処理装置によれば、文書内の文字認識結果を用いて、ユーザーによって指定された属性情報に対応する文字認識結果がある位置の文書の部分を表示することができる。
【0014】
請求項4の情報処理装置によれば、予め定められた文字列とその文字列と予め定められた位置関係にある文字列が抽出された場合に、ユーザーによって指定された属性情報に対応する文字認識結果がある位置の文書の部分を表示することができる。
【0015】
請求項5の情報処理プログラムによれば、文書に付与された属性を確認する場合に、ユーザーがその属性と関係する文書の部分を表示させるための操作を行わなければならない場合に較べて、属性に該当する部分を表示させるためのユーザーの指定を軽減させることができる。
【図面の簡単な説明】
【0016】
図1】本実施の形態の構成例についての概念的なモジュール構成図である。
図2】本実施の形態を利用したシステム構成例を示す説明図である。
図3】本実施の形態による処理例を示す説明図である。
図4】本実施の形態による処理例を示す説明図である。
図5】本実施の形態の構成例についての具体的なモジュール構成図である。
図6】本実施の形態による処理例を示すフローチャートである。
図7】プレビュー表示情報のデータ構造例を示す説明図である。
図8】本実施の形態による処理例を示すフローチャートである。
図9】本実施の形態による設定処理例を示す説明図である。
図10】本実施の形態による処理例を示す説明図である。
図11】キー・バリュー抽出テーブルのデータ構造例を示す説明図である。
図12】抽出位置情報テーブルのデータ構造例を示す説明図である。
図13】本実施の形態による処理例を示すフローチャートである。
【発明を実施するための形態】
【0017】
以下、図面に基づき本発明を実現するにあたっての好適な一実施の形態の例を説明する。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(「ソフトウェア」の解釈として、コンピュータ・プログラムを含む)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(例えば、コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するという意味である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(例えば、データの授受、指示、データ間の参照関係、ログイン等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態にしたがって、又はそれまでの状況・状態にしたがって定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(「2以上の値」には、もちろんのことながら、全ての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。また、「A、B、C」等のように事物を列挙した場合は、断りがない限り例示列挙であり、その1つのみを選んでいる場合(例えば、Aのみ)を含む。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(「ネットワーク」には、一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(つまり、社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。
【0018】
本実施の形態である情報処理装置100は、文書に付与された属性を確認する場合に、その属性と関係する文書の部分を表示させるプレビュー表示機能を有している。図1の例に示すように、情報処理装置100は、少なくともプロセッサ105、メモリ110を有しており、それらをつないでデータのやりとりをするためのバス198により構成されている。この他に、情報処理装置100は、出力装置185、受付装置190、通信装置195を有していてもよい。そして、バス198を介して、プロセッサ105、メモリ110、出力装置185、受付装置190、通信装置195の間でデータのやりとりが行われる。
【0019】
なお、図1の例に示すブロック図は、本実施の形態を実現するコンピュータのハードウェア構成例をも示している。本実施の形態としてのプログラムが実行されるコンピュータのハードウェア構成は、図1に例示するようなコンピュータであり、具体的にはパーソナルコンピュータ、サーバーとなり得るコンピュータ等である。具体例として、処理部としてプロセッサ105を用い、記憶装置としてメモリ110を用いている。
【0020】
プロセッサ105は、1つであってもよいし、複数あってもよい。プロセッサ105として、例えば、CPU(Central Processing Unitの略)、マイクロプロセッサ等を含む。複数のプロセッサ105を用いる場合は、密結合マルチプロセッサ、疎結合マルチプロセッサのいずれの形態であってもよい。例えば、1つのプロセッサ105内に複数のプロセッサ・コアが搭載されていてもよい。さらに、複数のコンピュータを通信路で結んで仮想的に一台のコンピュータのように振る舞わせるシステムとしてもよい。具体例として、疎結合マルチプロセッサであって、クラスタシステム、コンピュータクラスタとして構成してもよい。プロセッサ105は、プログラムメモリ120内のプログラムを実行する。
【0021】
メモリ110として、例えば、レジスタやキャッシュメモリ等のプロセッサ105内部の半導体メモリを含めてもよいし、RAM(Random Access Memoryの略)やROM(Read Only Memoryの略)等によって構成される主記憶装置であるメインメモリであってもよいし、永続性記憶装置としての機能を有するHDD(Hard Disk Driveの略)やSSD(Solid State Driveの略)の内部記憶装置、CD、DVD、Blu-ray(登録商標) Disc、USBメモリ、メモリーカード等の外部記憶装置又は補助記憶装置であってもよいし、また、通信回線を介して接続されたサーバー等の記憶装置を含めてもよい。
メモリ110は、主にプログラムを記憶するプログラムメモリ120と主にデータを記憶するデータメモリ115を有している。なお、プログラムメモリ120、データメモリ115には、図示しているモジュールのプログラムの他、本コンピュータを起動するためのOS等のプログラム、モジュールの実行において適宜変化するパラメータ等のデータが格納されていてもよい。
【0022】
出力装置185は、例えば、表示装置187、印刷装置189等を有している。液晶ディスプレイ、有機ELディスプレイ、3次元ディスプレイ等の表示装置187は、プロセッサ105による処理結果、データメモリ115内のデータ等を、テキストやイメージ情報等として表示する。プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)等の印刷装置189は、プロセッサ105による処理結果、データメモリ115内のデータ等を印刷する。また、出力装置185として、スピーカー、機器を振動させるアクチュエータ等を含んでいてもよい。
受付装置190は、例えば、指示受付装置192、文書読取装置194等を有している。キーボード、マウス、マイク、カメラ(視線検知カメラ等を含む)等の指示受付装置192は、これらに対する利用者の操作(動作、音声、視線等を含む)に基づいたデータを受け付ける。
また、タッチスクリーンのように、表示装置187と指示受付装置192の両方の機能を備えているものがあってもよい。その場合、キーボードの機能の実現について、物理的なキーが存在しなくても、タッチスクリーン上にソフトウェアでキーボード(いわゆるソフトウェアキーボード、スクリーンキーボード等ともいわれる)を描画して、キーボードの機能を実現するようにしてもよい。
なお、ユーザーインタフェースとして、主に、表示装置187、指示受付装置192が用いられる。
スキャナ、カメラ等の文書読取装置194は、文書を読み取り又は撮影して、発生する画像データを受け付ける。
通信装置195は、通信回線を介して他の装置と接続するためのネットワークカード等の通信回線インタフェースである。
【0023】
本実施の形態のうち、コンピュータ・プログラムによるものについては、本ハードウェア構成のプログラムメモリ120にソフトウェアであるコンピュータ・プログラムを読み込ませ、ソフトウェアとハードウェア資源とが協働して、本実施の形態が実現される。
なお、図1に示すハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図1に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、プロセッサ105として、GPU(Graphics Processing Unitの略、GPGPU(General-Purpose computing on Graphics Processing Unitsの略)を含む)を用いてもよいし、一部のモジュールの実行を専用のハードウェア(例えば特定用途向け集積回路(具体例として、ASIC(Application Specific Integrated Circuitの略)等がある)や再構成可能な集積回路(具体例として、FPGA(Field-Programmable Gate Arrayの略)等がある)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続している形態でもよく、さらに図1に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、特に、パーソナルコンピュータの他、携帯情報通信機器(携帯電話、スマートフォン、モバイル機器、ウェアラブルコンピュータ等を含む)、情報家電、ロボット、複写機、ファックス、スキャナ、プリンタ、複合機等に組み込まれていてもよい。
【0024】
プロセッサ105は、バス198を介してメモリ110、出力装置185、受付装置190、通信装置195と接続されている。プロセッサ105は、プログラムメモリ120内のプログラムである各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する。例えば、指示受付装置192によってユーザーの指定を受け付けたことを契機として、プログラムメモリ120内のその指定に対応するモジュールによる処理を実行し、その処理結果をデータメモリ115に記憶させたり、表示装置187に出力したり、通信装置195を制御して他の装置に送信したりする。
【0025】
メモリ110は、データメモリ115、プログラムメモリ120を有しており、バス198を介してプロセッサ105、出力装置185、受付装置190、通信装置195と接続されている。
データメモリ115は、表示情報記憶モジュール125、文書記憶モジュール130を記憶している。
表示情報記憶モジュール125は、文書の表示を行うための情報を記憶している。つまり、表示情報記憶モジュール125は、文書の種類を示す種類情報と属性を示す属性情報とに対応付けて、その文書に属性情報を付与する場合に表示されていた、その文書の部分を示す表示部分情報を記憶している。なお、以下、文書の表示をプレビュー表示ともいう。表示情報記憶モジュール125内に記憶される情報として、図7の例を用いて、後述する。
ここで「文書の種類」は、文書の構成が共通であるカテゴリを指す。例えば、同じ文書のフォーマット(型、書式、ひな型、フォーム等ともいわれる)を用いて作成された文書は、同じ文書の種類である。文書の種類として、例えば、請求書、見積書、領収書等がある。なお、「文書の種類を示す種類情報」を、以下、文書種類ともいう。
また「属性情報」とは、文書そのものである内容を変更することなく、文書に付与する情報である。属性情報の内容は、文書に関する情報であって、文書内に記載されている情報を含むようにしてもよい。具体的には、少なくとも属性名を含み、さらに属性名と属性値の組み合わせであってもよい。
「文書に属性情報を付与する」とは、(1)文書に属性名を付与すること、(2)既に属性名が付与されている場合にあっては、その属性名に対応する属性値を付与すること、(3)属性名と属性値の組み合わせを付与すること、のいずれかである。例えば、属性名として「請求書番号」が付与されている場合は、その属性値として「9000177419」を付与することが該当する。
「文書に属性情報を付与する場合に表示されていた、その文書の部分」とは、ユーザーが文書に属性情報を付与する場合に、対象となっている文書を表示しており、その文書に対して属性を付与している際に、表示されている文書の一部分を指す。例えば、プレビュー画面に表示されている文書の部分が該当する。
「文書の部分を示す情報」として、表示装置187に表示されていた文書の部分の表示を再現できるようにする情報であればよい。例えば、表示されている文書の位置を示す情報であってもよい。文書の部分の位置として、具体的には、表示されていた矩形領域の角(例えば、左上角等)の座標としてもよい。そして、「文書の部分を示す情報」として、表示を行っている際の表示倍率を含めるようにしてもよい。また、表示されている部分の大きさを含めるようにしてもよい。
【0026】
文書記憶モジュール130は、属性付与対象又は表示対象である文書を記憶している。ここで、文書(ファイルとも言われる)とは、テキストデータ、数値データ、図形データ、画像データ、動画データ、音声データ等、又は、これらの組み合わせであり、記憶、編集及び検索等の対象となり、システム又は利用者間で個別の単位として交換できるものをいい、これらに類似するものを含む。具体的には、文書は、文書作成プログラム(いわゆるワープロソフト)によって作成された文書、画像読取装置(スキャナー等)で読み込まれた画像、Webページ等を含む。
【0027】
プログラムメモリ120は、UIモジュール135、プレビュー処理モジュール140、属性処理モジュール145を記憶している。
UIモジュール135は、ユーザーインタフェースに関する処理を行う。入力関係の処理として、指示受付装置192によって受け付けられた操作に関する処理を行う。例えば、その操作に応じて属性処理モジュール145に処理を行わせる。また、出力関係の処理として、属性処理モジュール145による処理結果にしたがって、表示装置187に表示を行わせるように制御する。
【0028】
プレビュー処理モジュール140は、文書を表示装置187に表示するための制御を行う。プレビュー処理モジュール140は、ユーザーによって指定された種類情報と属性情報とに対応する、表示情報記憶モジュール125内の表示部分情報にしたがって、表示対象である文書の部分を表示装置187に表示するように制御を行う。なお、表示情報記憶モジュール125内には、種類情報と属性情報とに対応付けて、表示部分情報を記憶しているので、種類情報と属性情報を指定すれば、表示部分情報を抽出することができる。
【0029】
また、プレビュー処理モジュール140は、表示対象となっている文書の種類情報と属性情報とに対応付けて、その文書に属性を付与する場合に表示されていた、その文書の部分を示す表示部分情報を、表示情報記憶モジュール125に記憶させるようにしてもよい。
表示情報記憶モジュール125に記憶されるのは、表示対象となっている文書の種類情報と属性情報と文書の部分を示す表示部分情報である。具体的には、ユーザーが表示対象となっている文書Aに属性を付与しようとしている場面において、その文書Aの種類情報、付与しようとしている属性、表示装置に表示されている文書の部分を対応させて記憶させることになる。したがって、文書Aとは異なる文書であるが、文書Aの種類情報が同じである文書Bについて、同じ属性情報を指定された場合、表示情報記憶モジュール125内の対応する文書Aの表示部分情報にしたがって、文書Bの該当部分を表示することになる。種類情報が同じであれば、属性が記載されている場所も同じである可能性が高いので、文書Aで表示されていた部分と同じ場所を文書Bについても表示して、文書Bについても同じ属性を確認できるようにしている。なお、もちろんのことながら、文書Aを再度表示する場合も、種類情報は同じであるから、メモリ内に記憶されている属性情報と同じ属性情報が指定された場合は、メモリ内に記憶されている表示部分情報にしたがった表示を行うことになる。いわゆる属性付与時の表示状態を再現することになる。
【0030】
また、文書が画像である場合、プレビュー処理モジュール140は、属性処理モジュール145による文字認識結果を用いて、ユーザーによって指定された属性情報に対応する文字認識結果がある位置の文書の部分を表示装置187に表示するように第2の制御を行うようにしてもよい。
ここで「属性情報に対応する文字認識結果」とは、属性情報と予め定められた文字列とを対応させておき、その予め定められた文字列が文字認識結果である場合をいう。例えば、属性名が「請求書番号」、予め定められた文字列として「請求書番号」がある。また、予め定められた文字列は複数あってもよい。例えば、属性名が「請求書番号」、予め定められた文字列として「請求書番号」又は「請求番号」としてもよい。また、「文字認識結果がある位置」とは、文字認識の対象となった文字画像の位置のことをいう。例えば、文字認識結果として、文字列を示すテキスト情報の他に、その文字画像があった文書内の位置(具体的には、座標)があればよい。つまり、その位置を用いて、ユーザーによって指定された属性情報に対応する文字認識結果がある位置の文書の部分を表示装置187に表示すればよい。
【0031】
そして、プレビュー処理モジュール140は、予め定められた文字列とその文字列と予め定められた位置関係にある文字列が既に抽出されている場合に、第2の制御を行うようにしてもよい。「予め定められた文字列とその文字列と予め定められた位置関係にある文字列」を抽出するための規則の具体例について、図11の例を用いて後述する。
【0032】
属性処理モジュール145は、ユーザーの指定にしたがって、対象となっている文書に対して、属性を付与する。
また、文書が画像である場合に、属性処理モジュール145は、対象となっている文書内を文字認識するようにしてもよい。そして、属性処理モジュール145は、その文字認識結果が予め定められた文字列Aであり、その文字列Aと予め定められた位置関係にある文字列Bを属性情報として抽出してもよい。
【0033】
図2は、本実施の形態を利用したシステム構成例を示す説明図である。
図2(a)は、スタンドアロン型のシステム構成例を示している。情報処理装置100と画像処理装置200は接続されている。画像処理装置200は、文書をスキャンする機能、印刷する機能等を有している。例えば、複合機である。情報処理装置100は、印刷装置189、文書読取装置194の機能を画像処理装置200を用いて実現することになる。なお、画像処理装置200内に情報処理装置100を内蔵させ、画像処理装置200だけで文書のプレビュー表示を行うようにしてもよい。
情報処理装置100は、プレビュー表示位置の自動切り替え機能を有している。具体的には、情報処理装置100は、文書の属性入力時にユーザーが指定したプレビュー位置を文書種類と属性名に紐づけて表示情報記憶モジュール125に記憶させる。そして、情報処理装置100は、文書種類と属性名からプレビュー表示位置情報を読み出し、プレビュー表示を切り替える。なお、表示情報記憶モジュール125に記憶させた文書Aと、その後に表示させる文書Bは、異なっていてもよい。ただし、文書Aの文書種類と文書Bの文書種類は、同じである。そして、文書Aで属性入力時にユーザーが指定した属性名(つまり、表示情報記憶モジュール125に記憶されている属性名)と、文書Bにおいてユーザーが指定した属性名は、同じである。つまり、既に属性を入力した文書Aとは異なる文書Bであっても、同じ文書種類であって、同じ属性名にある文書の部分を確認しようとした場合は、文書Aと同じ位置を確認することができることになる。
【0034】
図2(b)は、ネットワーク型のシステム構成例を示している。情報処理装置100、画像処理装置200、ユーザー端末220A、ユーザー端末220Bは、通信回線290を介してそれぞれ接続されている。通信回線290は、無線、有線、これらの組み合わせであってもよく、例えば、通信インフラとしてのインターネット、イントラネット等であってもよい。また、情報処理装置100による機能は、クラウドサービスとして実現してもよい。
例えば、ユーザーは、画像処理装置200のスキャナ機能を用いて紙の文書を読み取って、その文書の画像を記憶する。そして、ユーザーは、ユーザー端末220を用いて、画像処理装置200に記憶されている文書を取り出し、その文書に属性を付与する指定を行う。例えば、ユーザー端末220のブラウザを用いて、情報処理装置100に接続し、情報処理装置100の機能によって、その文書に属性を付与する。
【0035】
図3は、本実施の形態による処理例を示す説明図である。文書の管理処理、属性付与処理に関するものである。
文書の管理手法として、紙文書をスキャンして電子化する手法が広く行われている。紙文書を電子化した後に、属性情報を電子化した文書に付与し、その属性情報をフォルダへの分類に使用したり、ファイル名に使用したり、検索情報として活用することが行われている。
【0036】
図3(a)の例は、紙文書310から対象となる文書320を生成する処理を示している。
まず、ユーザーは、前述の画像処理装置200に該当する画像処理装置300によって、紙文書310をスキャンして電子化し、文書320を生成させる。そして、予め定められたフォルダ325に、その文書320を格納する。例えば、フォルダ325はユーザー毎にあり、画像処理装置300にログインしたユーザーのフォルダ325に、紙文書310をスキャンした結果である文書320が格納される。
【0037】
図3(b)の例は、文書管理処理390を示している。
例えば、ユーザー端末220で文書管理処理390を行う。画像処理装置300のフォルダ325内にある文書320を、文書管理処理390によってユーザー端末220内に取り込んで、文書管理画面330に表示する。図3(b)は、文書管理画面330で文書320を管理している例を示している。ユーザーの操作によって文書320が選択された状態で、文書属性付与ボタン335が選択された場合に、文書属性付与処理392を開始する。
【0038】
図3(c)の例は、文書属性付与処理392を示している。
図3(b)の例に示すように文書属性付与ボタン335が選択されたことにより、文書属性付与画面340を表示する。文書属性付与画面340には、プレビュー領域345と属性付与領域350が少なくともある。
ユーザーは、プレビュー領域345に表示されている文書320を確認しながら、属性付与領域350を用いて、その文書320に属性を付与する。例えば、ユーザーは、プレビュー領域345内の文書320の内容を確認しながら、属性付与領域350内に属性値を入力する。属性付与領域350内の詳細については、図4の例を用いて後述する。
そして、文書属性付与処理392では、文書320の文書種類、又は/及び、取引先名等の属性ごとに見積書フォルダ360を選択し、その見積書フォルダ360に文書320を格納する。また、文書320に属性値を入力後、注文書トレイ380を用いて、他のユーザーに文書320を渡すようにしてもよい。
【0039】
図4は、本実施の形態による処理例を示す説明図である。文書属性付与処理392による属性情報の付与処理についての具体例を示すものである。
図4(a)の例は、文書属性付与画面340には、少なくともプレビュー領域345、属性付与領域350があることを示している。
【0040】
図4(b)の例は、その属性付与領域350の内容を示すものである。
属性付与領域350は、第1行460~第5行468の5行を有しており、各行は、属性名欄450、種類欄452、入力欄454を有している。属性名欄450には、属性名が表示されている。例えば、プレビュー領域345に表示されている文書320の文書種類に応じて定まった属性名を表示する。また、ユーザーが入力するようにしてもよい。種類欄452には、その属性がテキスト、数値、日付、画像等のいずれであるかが表示されている。入力欄454には、その属性の属性値がユーザーによって入力される。
【0041】
図4(c1)の例は、属性名「請求書番号」の属性値について、第1行460の入力欄454をユーザーが入力するにあたって、プレビュー領域345内に表示されている文書320の領域の例を示している。具体的には、ユーザーは、文書の「右上、167%表示」を表示した状態で、属性付与領域350の第1行460の入力欄454に値を入力したことを示している。
図4(c2)の例は、属性名「合計金額」の属性値について、第2行462の入力欄454をユーザーが入力するにあたって、プレビュー領域345内に表示されている文書320の領域の例を示している。具体的には、ユーザーは、文書の「左中段、133%表示」を表示した状態で、属性付与領域350の第2行462の入力欄454に値を入力したことを示している。
図4(c3)の例は、属性名「製品番号」の属性値について、第3行464の入力欄454をユーザーが入力するにあたって、プレビュー領域345内に表示されている文書320の領域の例を示している。具体的には、ユーザーは、文書の「左中段、200%表示」を表示した状態で、属性付与領域350の第3行464の入力欄454に値を入力したことを示している。
図4(c4)の例は、属性名「支払い期限」の属性値について、第4行466の入力欄454をユーザーが入力するにあたって、プレビュー領域345内に表示されている文書320の領域の例を示している。具体的には、ユーザーは、文書の「左下、167%表示」を表示した状態で、属性付与領域350の第4行466の入力欄454に値を入力したことを示している。
図4(c5)の例は、属性名「発行元」の属性値について、第5行468の入力欄454をユーザーが入力するにあたって、プレビュー領域345内に表示されている文書320の領域の例を示している。具体的には、ユーザーは、文書の「右上、167%表示」を表示した状態で、属性付与領域350の第5行468の入力欄454に値を入力したことを示している。
【0042】
例えば、情報処理装置100を用いないで、文書に属性を付与しようとした場合、文書種類や属性によって確認するプレビュー位置が異なるため、その都度、ユーザーは、プレビュー領域345内の文書320をスクロールして位置を調整する必要がある。例えば、文書種類、又は、属性を切り替える度にプレビュー位置を調整することが必要となる。さらに、文書320によっては文字サイズも小さく、倍率の変更も必要となる。つまり、属性の入力項目によって、参照するプレビュー位置が異なり、確認すべき文字が読みにくい場合がある。そのため、ユーザーは、手動でプレビュー領域345内の文書320をスクロールし、拡大又は縮小の調整をする必要が生じていた。
【0043】
図5は、本実施の形態の構成例についての具体的なモジュール構成図である。
図1の例に示したモジュール構成と比較しながら説明する。
文書情報エントリーモジュール500は、UIモジュール505、属性名判定モジュール510、プレビュー操作モジュール515、環境設定モジュール520を有しており、D文書コントロールライブラリ530Aのプレビュー表示ライブラリ532A、PDF文書コントロールライブラリ530Bのプレビュー表示ライブラリ532Bと接続されている。
UIモジュール505はUIモジュール135に該当し、属性名判定モジュール510は属性処理モジュール145に該当し、プレビュー操作モジュール515、D文書コントロールライブラリ530A、PDF文書コントロールライブラリ530Bはプレビュー処理モジュール140に該当し、環境設定モジュール520は表示情報記憶モジュール125に該当する。
UIモジュール505は、属性名判定モジュール510と接続されている。属性名判定モジュール510は、UIモジュール505、プレビュー操作モジュール515と接続されている。プレビュー操作モジュール515は、属性名判定モジュール510、環境設定モジュール520と接続されている。環境設定モジュール520は、プレビュー操作モジュール515と接続されている。
D文書コントロールライブラリ530Aは、プレビュー表示ライブラリ532A、D文書表示モジュール534Aを有している。プレビュー表示ライブラリ532Aは、文書情報エントリーモジュール500、D文書表示モジュール534Aと接続されている。D文書表示モジュール534Aは、プレビュー表示ライブラリ532Aと接続されている。
PDF文書コントロールライブラリ530Bは、プレビュー表示ライブラリ532B、PDF文書表示モジュール534Bを有している。プレビュー表示ライブラリ532Bは、文書情報エントリーモジュール500、PDF文書表示モジュール534Bと接続されている。PDF文書表示モジュール534Bは、プレビュー表示ライブラリ532Bと接続されている。
【0044】
属性の設定処理にあっては、各モジュールは以下のように処理する。
1)ユーザーによって属性付与領域350内のいずれかの属性(具体的には、属性付与領域350内のいずれかの行)が選択されたことをUIモジュール505が検知した場合、属性名判定モジュール510は、表示されている文書320の文書種類と選択された属性名をUIモジュール505から取得する。そして、取得した情報をプレビュー操作モジュール515に渡す。
2)プレビュー操作モジュール515は、現在のプレビュー表示位置(表示部分情報の一例)をプレビュー表示ライブラリ532から取得する。文書の種類(拡張子)によって使用するライブラリを変更する。図5の例では、2つの文書コントロールライブラリ530(D文書コントロールライブラリ530A、PDF文書コントロールライブラリ530B)を用いている。もちろんのことながら、3つ以上の文書コントロールライブラリ530を利用してもよい。
3)プレビュー操作モジュール515は、プレビュー表示ライブラリ532から取得したプレビュー表示位置(表示部分情報の一例)を、属性名判定モジュール510から渡された文書種類と属性名と紐づけて環境設定モジュール520に保存する。
【0045】
プレビュー表示の自動切り替えにあっては、各モジュールは以下のように処理する。
1)ユーザーによって属性付与領域350内のいずれかの属性(具体的には、属性付与領域350内のいずれかの行)が選択されたことをUIモジュール505が検知した場合、属性名判定モジュール510は、表示されている文書320の文書種類と選択された属性名をUIモジュール505から取得する。そして、取得した情報をプレビュー操作モジュール515に渡す。
2)プレビュー操作モジュール515は、環境設定モジュール520から文書種類と属性名に紐づいたプレビュー表示位置の情報を取得する。
3)プレビュー操作モジュール515は、プレビュー表示情報をプレビュー表示ライブラリ532に渡す。
4)プレビュー表示ライブラリ532は、プレビュー操作モジュール515から渡されたプレビュー表示情報にしたがって、プレビュー表示を切り替える。
【0046】
図6は、本実施の形態による処理例を示すフローチャートである。つまり、属性入力時にユーザーが操作したプレビュー位置と倍率を、文書種類と属性情報に紐づけて保存する処理例を示している。
【0047】
ステップS602では、ユーザーの指定にしたがって、文書種類として請求書、属性名である発行元の属性値の入力が完了する。文書情報エントリーモジュール500は、この情報を受け取る。
ステップS604では、文書情報エントリーモジュール500は、プレビュー表示ライブラリ532に対して、現在(つまり、属性値の入力を完了した時点)の左上原点の位置情報取得の要求を行う。ここで「左上原点の位置情報」とは、プレビュー領域345内において表示されている文書320の部分を示すための情報である。具体的には、プレビュー領域345の左上原点の位置が、文書320のどの位置に対応しているかを示す情報である。
ステップS606では、プレビュー表示ライブラリ532は、文書情報エントリーモジュール500に対して、左上原点の位置情報である「X:180,Y:50」を返す。つまり、文書320のX座標:180、Y座標:50の位置を、プレビュー領域345の左上に合わせて表示していることを示している。
【0048】
ステップS608では、文書情報エントリーモジュール500は、プレビュー表示ライブラリ532に対して、現在の倍率情報取得の要求を行う。ここで「倍率情報」とは、プレビュー領域345内において表示されている文書320の倍率を示す情報である。
ステップS610では、プレビュー表示ライブラリ532は、文書情報エントリーモジュール500に対して、「167%」を返す。つまり、文書320を167%に拡大して、プレビュー領域345に表示していることを示している。
ステップS612では、文書情報エントリーモジュール500は、ステップS606とステップS610で取得した情報をプレビュー表示情報700として、環境設定モジュール520に保存する。プレビュー表示情報700の例を、図7を用いて説明する。
【0049】
図7は、プレビュー表示情報700のデータ構造例を示す説明図である。プレビュー表示情報700は、文書種類欄705、属性名欄710、位置欄715、倍率欄720を有している。文書種類欄705は、文書種類を記憶している。属性名欄710は、属性名を記憶している。位置欄715は、位置を記憶している。倍率欄720は、倍率を記憶している。
例えば、プレビュー表示情報700の1行目は、文書種類が「請求書」であり、属性名が「発行元」であり、位置が「X:180,Y:50」であり、倍率が「167%」であることを示しており、2行目は、文書種類が「請求書」であり、属性名が「請求書番号」であることを示しており、3行目は、文書種類が「請求書」であり、属性名が「合計金額」であることを示している。1行目は、図6の例で示した処理によって、位置欄715、倍率欄720に値が格納されている。2行目、3行目は、未だユーザーによる属性値の入力がないので、空欄となっている。
【0050】
図8は、本実施の形態による処理例を示すフローチャートである。つまり、ユーザーインタフェースで入力する属性値を切り替えると(具体的には、属性付与領域350内の行の選択を変更すると)、文書種類と属性名からプレビュー表示位置情報を環境設定モジュール520から読み出し、プレビュー表示を切り替える処理例を示している。
【0051】
ステップS802では、ユーザーの指定にしたがって、文書種類として請求書、属性名である発行元の属性値が選択される。文書情報エントリーモジュール500は、この情報を受け取る。
ステップS804では、文書情報エントリーモジュール500は、プレビュー表示情報700を読み出す。具体的には、ステップS802で受け取った情報に対応するプレビュー表示情報700を読み出す。具体的には、プレビュー表示情報700から、文書種類として請求書、属性名である発行元に対応する位置欄715と倍率欄720を抽出する。
ステップS806では、文書情報エントリーモジュール500は、プレビュー表示ライブラリ532に対して、左上原点の位置情報「X:180,Y:50」の設定を要求する。つまり、ステップS804で抽出した位置欄715内の値をプレビュー表示ライブラリ532に渡す。
ステップS808では、プレビュー表示ライブラリ532は、文書情報エントリーモジュール500に対して、設定完了を通知する。
【0052】
ステップS810では、文書情報エントリーモジュール500は、プレビュー表示ライブラリ532に対して、倍率情報「167%」の設定を要求する。つまり、ステップS804で抽出した倍率欄720内の値をプレビュー表示ライブラリ532に渡す。
ステップS812では、プレビュー表示ライブラリ532は、文書情報エントリーモジュール500に対して、設定完了を通知する。
ステップS814では、プレビュー表示ライブラリ532は、プレビュー領域内に「X:180,Y:50、167%表示」にしたがって文書をプレビュー表示する。つまり、図6の例で示したプレビュー領域345内の文書320の表示部分と同じ部分が、プレビュー領域345内に表示されることになる。もちろんのことながら、図6の例で示した文書と、図8の例で示した文書が異なる場合は、表示内容は異なるものになる。ただし、図6の例で示した文書の文書種類(具体的には、請求書)と図8の例で示した文書の文書種類は同じであって、属性名(具体的には、発行元)は同じである。つまり、図8の例では、発行元の属性値を入力するにあたって、文書320の確認したい領域をスクロール操作、拡大縮小操作することなしに、属性付与領域350内の第5行468を選択するだけで表示させることができる。
【0053】
図9は、本実施の形態による設定処理例を示す説明図である。プレビュー表示の自動切り替えのオン、オフの設定に関する処理である。つまり、プレビュー表示を自動で切り替えるか否かは、環境設定画面900によって切り替えを可能としている。
環境設定画面900には基本情報設定領域902を表示し、基本情報設定領域902には、入力者情報設定領域904、画像情報表示設定チェックボックス906、プレビュー表示設定チェックボックス908、ボタン情報設定領域910、OKボタン992、キャンセルボタン994を表示する。
入力者情報設定領域904内では、ユーザー名の使用の設定、入力者情報をファイルに保存すること等の設定ができるようにしている。
画像情報表示設定チェックボックス906では、画像情報を表示するか否かの設定ができるようにしている。
プレビュー表示設定チェックボックス908では、プレビュー表示を自動で切り替えるか否かの設定ができるようにしている。プレビュー表示設定チェックボックス908のチェックボックスがオンの場合、文書種類と属性名に紐づけてプレビュー表示位置を自動で保存する。そして、入力する属性にしたがって、自動でプレビュー表示位置を切り替える。
ボタン情報設定領域910内では、文書種類の初期値の設定、文書の登録先等の設定ができるようにしている。
ユーザーによってOKボタン992が選択された場合に、環境設定画面900内で指定された設定が行われる。ユーザーによってキャンセルボタン994が選択された場合は、環境設定画面900内の指定をキャンセルして、以前の状態に戻す。
【0054】
図10は、本実施の形態による処理例を示す説明図である。つまり、プレビュー表示の自動切り替えの優先順位に関する処理例を示す。
例えば、画像処理装置1000のオプション機能、又は、情報処理装置100の機能で、文書の画像に対して文字認識を行い、文字認識結果から予め定められた文字列を抽出し、抽出した文字列に対応する位置情報をプレビュー処理モジュール140に渡すようにしてもよい。この場合、渡された位置情報を既にあるプレビュー表示位置情報よりも優先し、その渡された位置情報にしたがって、プレビューの表示位置及び倍率を変更し、抽出した文字列の部分をハイライト表示する。
【0055】
まず、ユーザーは、前述の画像処理装置200に該当する画像処理装置1000によって、紙文書310をスキャンして電子化し、文書1020を生成させる。そして、予め定められたフォルダ325に、その文書1020を格納する。そして、画像処理装置1000のオプション機能、又は、情報処理装置100の機能で、抽出位置情報1030を抽出する。抽出位置情報1030の抽出処理については、図11の例に示すキー・バリュー抽出テーブル1100を用いて抽出することを後述する。また、抽出位置情報1030の詳細な内容については、図12の例を用いて後述する。
【0056】
文書管理処理390では、例えば、ユーザー端末220で文書管理処理390を行う。画像処理装置1000のフォルダ325内にある文書1020を、文書管理処理390によってユーザー端末220内に取り込んで、表示装置187に表示する。ユーザーの操作によって文書1020が選択された状態で、文書属性付与ボタン335が選択された場合に、文書属性付与処理392を開始する。
文書属性付与ボタン335が選択されたことにより、文書属性付与画面340を表示する。文書属性付与画面340には、プレビュー領域345と属性付与領域1050が少なくともある。
ユーザーは、プレビュー領域345に表示されている文書1020を確認しながら、属性付与領域1050を用いて、その文書1020に属性を付与する。ただし、ここでの属性付与領域1050の入力欄1064は、既に設定されている。つまり、ユーザーが入力欄1064に属性値を入力する必要がない。ユーザーは、入力欄1064内の値と、確認した行を選択した場合に、プレビュー領域345内の文書1020の表示を確認すればよい。誤っている場合は、ユーザーは、入力欄1064内の値の修正を行う。具体的には、第1行1070の入力欄1064は「2018/09/05」と設定されており、第2行1072の入力欄1064は「9000177419」と設定されており、第3行1074の入力欄1064は「10,800」と設定されており、第4行1076の入力欄1064は「SID700-4-100-C」と設定されており、第5行1078の入力欄1064は「2018/10/25」と設定されており、第5行1080の入力欄1064は「a」と設定されている。
【0057】
図11は、キー・バリュー抽出テーブル1100のデータ構造例を示す説明図である。「予め定められた文字列とその文字列と予め定められた位置関係にある文字列」を抽出するための規則の一例を示すものである。
キー・バリュー抽出テーブル1100は、キー欄1105、バリュー抽出規則欄1110を有している。キー欄1105は、キーを記憶している。バリュー抽出規則欄1110は、バリュー抽出規則を記憶している。
例えば、キー・バリュー抽出テーブル1100の1行目は、キー「請求番号」のバリュー抽出規則は『「請求番号」が記載された位置の右側にある英数字の10桁を「請求書番号」として抽出』であることを示している。前述したように、画像処理装置1000のオプション機能、又は、情報処理装置100は、このキー・バリュー抽出テーブル1100にしたがって、属性値を抽出する。具体的には、文書1020内の文字画像を文字認識し、その文字認識結果にキー欄1105内の文字例がある場合は、バリュー抽出規則欄1110内の規則にしたがって、属性値を抽出する。これによって、予め定められた文字列とその文字列と予め定められた位置関係にある文字列を抽出することができる。さらに、この際に、抽出位置情報テーブル1200を抽出する。
【0058】
図12は、抽出位置情報テーブル1200のデータ構造例を示す説明図である。抽出位置情報テーブル1200は、文書種類欄1205、属性名欄1210、位置欄1215、倍率欄1220、属性値欄1225を有している。文書種類欄1205は、文書種類を記憶している。属性名欄1210は、属性名を記憶している。位置欄1215は、その属性名が記載されている文書内の位置を記憶している。倍率欄1220は、倍率を記憶している。属性値欄1225は、その属性の属性値を記憶している。
例えば、抽出位置情報テーブル1200の1行目は、文書種類が「請求書」であり、属性名が「請求書番号」であり、その請求書番号が記載されていた文書内の位置が「X:170,Y:35」であり、倍率が「200%」であり、属性値が「9000177419」であることを示している。
なお、倍率は、抽出された文字列が、プレビュー領域345内で予め定められたサイズとなるように表示できる値を設定する。例えば、図12の例に示す属性値欄1225内の「9000177419」をそのまま(つまり、100%)でプレビュー領域345内に表示すると8ポイントのサイズとなるが、予め定められたサイズが16ポイントである場合は、倍率欄1220に200%と設定される。
【0059】
図13は、本実施の形態による処理例を示すフローチャートである。
ステップS1302では、ユーザーの操作にしたがって、属性情報の属性入力欄を選択する。
ステップS1304では、文書に既に位置情報(図10の例では、抽出位置情報1030)が付与しているか否かを判断し、付与している場合はステップS1306へ進み、それ以外の場合はステップS1312へ進む。
【0060】
ステップS1306では、位置情報にしたがって、表示位置を切り替える。
ステップS1308では、位置情報にしたがって、倍率を切り替える。
ステップS1310では、位置情報にしたがって、ステップS1302で選択された属性情報の属性値にあたる文字画像をハイライト表示する。ここでのハイライト表示は、他の文字画像と区別できるようすればよい。例えば、対象となる文字画像を赤く表示すること、その文字画像の背景を赤く表示すること、その文字画像を点滅させること等がある。
【0061】
ステップS1312では、プレビュー表示の自動切替えの設定がオンであるか否かを判断し、オンの場合はステップS1314へ進み、それ以外の場合はステップS1322へ進む。
ステップS1314では、同じ文書種類についてプレビュー表示情報が設定されているか否かを判断し、設定されている場合はステップS1316へ進み、それ以外の場合はステップS1322へ進む。
【0062】
ステップS1316では、環境設定モジュール520からプレビュー表示情報を取得する。
ステップS1318では、プレビュー表示情報にしたがって、表示位置を切り替える。
【0063】
ステップS1320では、プレビュー表示情報にしたがって、倍率を切り替える。なお、ステップS1316からステップS1320までの処理は、図8の例に示した処理と同等の処理である。つまり、過去に属性値入力が行われた文書種類におけるプレビュー表示位置情報にしたがって、プレビュー表示を行う。
ステップS1322では、プレビュー表示を切り替えない。つまり、その文書種類の文書の属性入力が行われていないので、図6の例に示したような、ユーザーによる属性入力処理が行われる。
【0064】
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通等のために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD-R、DVD-RW、DVD-RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD-ROM)、CDレコーダブル(CD-R)、CDリライタブル(CD-RW)等、ブルーレイ・ディスク(Blu-ray(登録商標) Disc)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digitalの略)メモリーカード等が含まれる。
そして、前記のプログラムの全体又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、又は無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分若しくは全部であってもよく、又は別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して記録されていてもよい。また、圧縮や暗号化等、復元可能であればどのような態様で記録されていてもよい。
【符号の説明】
【0065】
100…情報処理装置
105…プロセッサ
110…メモリ
115…データメモリ
120…プログラムメモリ
125…表示情報記憶モジュール
130…文書記憶モジュール
135…UIモジュール
140…プレビュー処理モジュール
145…属性処理モジュール
185…出力装置
187…表示装置
189…印刷装置
190…受付装置
192…指示受付装置
194…文書読取装置
195…通信装置
198…バス
200…画像処理装置
220…ユーザー端末
290…通信回線
500…文書情報エントリーモジュール
505…UIモジュール
510…属性名判定モジュール
515…プレビュー操作モジュール
520…環境設定モジュール
530…文書コントロールライブラリ
532…プレビュー表示ライブラリ
534…文書表示モジュール
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13