(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024093621
(43)【公開日】2024-07-09
(54)【発明の名称】情報処理システム、情報処理方法、プログラム
(51)【国際特許分類】
G06V 30/196 20220101AFI20240702BHJP
G06F 3/0484 20220101ALI20240702BHJP
G06V 30/12 20220101ALI20240702BHJP
【FI】
G06V30/196 E
G06F3/0484
G06V30/12 B
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2022210129
(22)【出願日】2022-12-27
(71)【出願人】
【識別番号】390002761
【氏名又は名称】キヤノンマーケティングジャパン株式会社
(71)【出願人】
【識別番号】592135203
【氏名又は名称】キヤノンITソリューションズ株式会社
(74)【代理人】
【識別番号】100189751
【弁理士】
【氏名又は名称】木村 友輔
(74)【代理人】
【識別番号】100227857
【弁理士】
【氏名又は名称】中山 圭
(72)【発明者】
【氏名】櫻井 達也
(72)【発明者】
【氏名】森井 寛幸
【テーマコード(参考)】
5B064
5E555
【Fターム(参考)】
5B064EA11
5B064FA02
5E555AA04
5E555BA03
5E555BA10
5E555BB03
5E555BC17
5E555BC18
5E555BC19
5E555BD01
5E555CA02
5E555CA12
5E555CA18
5E555CB02
5E555CB05
5E555CB12
5E555CB44
5E555CB74
5E555CC18
5E555DB20
5E555DB21
5E555DB58
5E555DC11
5E555DC13
5E555DC18
5E555EA03
5E555EA13
5E555EA24
5E555FA00
(57)【要約】 (修正有)
【課題】辞書のメンテナンスを効率的に行うための情報処理システム、情報処理方法及びプログラムを提供する。
【解決手段】情報処理システムは、OCR結果の候補となる文字列が登録された辞書を用いてOCR処理を行うOCR手段と、OCR手段によるOCR処理の結果に対する修正を受け付ける受付手段と、受付手段により受け付けた修正の実績を通知する通知手段と、を備える。
【選択図】
図3
【特許請求の範囲】
【請求項1】
OCR結果の候補となる文字列が登録された辞書を用いてOCR処理を行うOCR手段と、
前記OCR手段によるOCR処理の結果に対する修正を受け付ける受付手段と、
前記受付手段により受け付けた修正の実績を通知する通知手段と、
を備えることを特徴とする情報処理システム。
【請求項2】
前記受付手段は、修正後の文字列について前記辞書への登録要請を受け付けることを特徴とする請求項1に記載の情報処理システム。
【請求項3】
前記受付手段は、前記辞書に登録された文字列の削除要請を受け付けることを特徴とする請求項1または2に記載の情報処理システム。
【請求項4】
前記通知手段は、前記辞書のメンテンナンスを受け付ける画面において修正の実績を通知することを特徴する請求項3に記載の情報処理システム。
【請求項5】
前記実績は、前記受付手段により受け付けた修正回数、登録要請の回数、削除要請の回数のいずれかを含むことを特徴とする請求項4に記載の情報処理システム。
【請求項6】
情報処理システムのOCR手段が、OCR結果の候補となる文字列が登録された辞書を用いてOCR処理を行うOCR工程と、
前記情報処理システムの受付手段が、前記OCR工程によるOCR処理の結果に対する修正を受け付ける受付工程と、
前記情報処理システムの通知手段が、前記受付工程により受け付けた修正の実績を通知する通知工程と、
を備えることを特徴とする情報処理方法。
【請求項7】
コンピュータを、
OCR結果の候補となる文字列が登録された辞書を用いてOCR処理を行うOCR手段と、
前記OCR手段によるOCR処理の結果に対する修正を受け付ける受付手段と、
前記受付手段により受け付けた修正の実績を通知する通知手段として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理システム、情報処理方法、プログラムに関する。
【背景技術】
【0002】
紙文書をデータ化するにあたって、スキャンしたあとOCR処理を行うことで、テキストデータを取得することが一般的である。OCR処理の精度を向上させる取り組みが行われているものの、100%の精度を実現することは難しく、OCR処理の結果に対してユーザが手作業で修正することが行われている。
【0003】
OCR結果の修正方法としては、予め候補となる文字列が登録された辞書を用意し、当該辞書に登録された文字列のうち最も可能性の高い文字列をOCR結果として提示する仕組みがある。例えば特許文献1には、利用者からの辞書への追加依頼に基づき、一定の評価基準を満たす文字列を辞書に登録する仕組みが開示されている。
【先行技術文献】
【特許文献】
【0004】
【発明の開示】
【発明が解決しようとする課題】
【0005】
しかし、この辞書機能を用いた補正においては、辞書を適切にメンテナンスしなければ、適切な候補が表示されないといった問題が生じる。
【0006】
そこで本発明は、辞書のメンテナンスを効率的に行うための仕組みを提供することを目的とする。
【課題を解決するための手段】
【0007】
OCR結果の候補となる文字列が登録された辞書を用いてOCR処理を行うOCR手段と、
前記OCR手段によるOCR処理の結果に対する修正を受け付ける受付手段と、
前記受付手段により受け付けた修正の実績を通知する通知手段と、
を備えることを特徴とする情報処理システム。
【発明の効果】
【0008】
本発明によれば、辞書のメンテナンスを効率的に行うことが可能となる。
【図面の簡単な説明】
【0009】
【
図3】OCR結果に対する修正や、辞書に登録された文字列(項目)の追加・削除要請を受け付けた場合の処理を示すフローチャート
【
図4】辞書メンテナンス時における文字列の追加登録処理を示すフローチャート
【
図5】辞書メンテナンス時における文字列の削除処理を示すフローチャート
【
図6】辞書に登録された文字列のうち利用頻度の低い文字列を特定する処理を示すフローチャート
【発明を実施するための形態】
【0010】
図1に示す一例のように、本発明の情報処理システムは、スキャナ101とクライアント端末102とサーバ装置103とがネットワークを介して通信可能に接続された構成となっている。
【0011】
スキャナ101は、紙媒体の文書をスキャンしてデータ化する機能を備える装置である。
【0012】
クライアント端末102は、スキャナ101によるスキャンデータやサーバ装置103によるOCR処理の結果、辞書メンテナンス画面などを表示する機能や、ユーザからの指示を受けつける機能を備える。
【0013】
サーバ装置103は、OCR処理の実行や、辞書や各種テーブルを記憶する機能を備える。
【0014】
図2は、本発明のスキャナ101、クライアント端末102、サーバ装置103として適用可能な情報処理装置のハードウェア構成の一例を示すブロック図である。
【0015】
図2に示すように、情報処理装置は、システムバス200を介してCPU(Central Processing Unit)201、ROM(Read Only Memory)202、RAM(Random Access Memory)203、記憶装置204、入力コントローラ205、音声コントローラ206、ビデオコントローラ207、メモリコントローラ208、よび通信I/Fコントローラ209が接続される。
【0016】
CPU201は、システムバス200に接続される各デバイスやコントローラを統括的に制御する。
【0017】
ROM202あるいは外部メモリ213は、CPU201が実行する制御プログラムであるBIOS(Basic Input/Output System)やOS(Operating System)や、本情報処理方法を実現するためのコンピュータ読み取り実行可能なプログラムおよび必要な各種データ(データテーブルを含む)を保持している。
【0018】
RAM203は、CPU201の主メモリ、ワークエリア等として機能する。CPU201は、処理の実行に際して必要なプログラム等をROM202あるいは外部メモリ213からRAM203にロードし、ロードしたプログラムを実行することで各種動作を実現する。
【0019】
入力コントローラ205は、キーボード210や不図示のマウス等のポインティングデバイス等の入力装置からの入力を制御する。入力装置がタッチパネルの場合、ユーザがタッチパネルに表示されたアイコンやカーソルやボタンに合わせて押下(指等でタッチ)することにより、各種の指示を行うことができることとする。
【0020】
また、タッチパネルは、マルチタッチスクリーンなどの、複数の指でタッチされた位置を検出することが可能なタッチパネルであってもよい。
【0021】
ビデオコントローラ207は、ディスプレイ212などの外部出力装置への表示を制御する。ディスプレイは本体と一体になったノート型パソコンのディスプレイも含まれるものとする。なお、外部出力装置はディスプレイに限ったものははく、例えばプロジェクタであってもよい。また、前述のタッチ操作を受け付け可能な装置については、入力装置も提供する。
【0022】
なおビデオコントローラ207は、表示制御を行うためのビデオメモリ(VRAM)を制御することが可能で、ビデオメモリ領域としてRAM203の一部を利用することもできるし、別途専用のビデオメモリを設けることも可能である。
【0023】
メモリコントローラ208は、外部メモリ213へのアクセスを制御する。外部メモリとしては、ブートプログラム、各種アプリケーション、フォントデータ、ユーザファイル、編集ファイル、および各種データ等を記憶する外部記憶装置(ハードディスク)、フレキシブルディスク(FD)、或いはPCMCIAカードスロットにアダプタを介して接続されるコンパクトフラッシュ(登録商標)メモリ等を利用可能である。
【0024】
通信I/Fコントローラ209は、ネットワークを介して外部機器と接続・通信するものであり、ネットワークでの通信制御処理を実行する。例えば、TCP/IPを用いた通信やISDNなどの電話回線、および携帯電話の4G回線、5G回線等を用いた通信が可能である。
【0025】
尚、CPU201は、例えばRAM203内の表示情報用領域へアウトラインフォントの展開(ラスタライズ)処理を実行することにより、ディスプレイ212上での表示を可能としている。また、CPU201は、ディスプレイ212上の不図示のマウスカーソル等でのユーザ指示を可能とする。
【0026】
図3はOCR結果に対する修正や、辞書に登録された文字列(項目)の追加・削除要請を受け付けた場合の処理を示すフローチャートである。
【0027】
ステップS301では、OCR処理の対象となる文書を入力する。例えばスキャナを用いて紙文書をスキャンすることで入力しても良いし、既存のPDFファイル等の選択を受け付けることで入力しても良い。
【0028】
ステップS302では、ステップS301で入力された文書に対してOCR処理を実行する。
【0029】
ステップS303では、ステップS302におけるOCR処理の結果を表示する。OCR処理の結果を表示した画面の一例を
図9に示す。
【0030】
ステップS304では、ユーザからOCR結果に対する修正を受け付ける。また辞書に登録された文字列の削除要請や新たな文字列の登録要請を受け付ける。
【0031】
修正の受付は、
図9のOCR結果が表示された領域(例えば901等)に対してクリック操作を受け付け、修正後の文字列の入力を受け付け、修正ボタン904が押下されることで受け付ける。
【0032】
削除・登録要請の受付は、
図9の登録要請チェックボックス902、削除要請チェックボックス903に対するチェックを受け付け、修正ボタン904が押下されることで受け付ける。なお、辞書機能を用いていないOCR領域については、削除要請チェックボックスは表示しないよう制御される。
【0033】
ステップS305では、ステップS304で削除要請を受け付けたかを判定する。削除要請を受け付けた場合(ステップS305:YES)は、処理をステップS306に移行する。削除要請を受け付けていない場合(ステップS305:NO)は処理をステップS310に移行する。
【0034】
ステップS306では、削除の対象となる文字列と、当該文字列が登録された辞書名(OCR領域ごとに辞書が登録されているものとし、辞書名は、削除対象の文字列に係るOCR領域に対応する辞書を特定可能な情報である)を取得する。
【0035】
ステップS307では、ステップS306で取得した文字列が削除候補テーブルに登録済みであるかを判定する。
【0036】
登録済みである場合は処理をステップS308に移行する。未登録である場合は処理をステップS309に移行する。
【0037】
ステップS308では、削除要請の対象となった文字列に対する削除要請回数を1追加する。
【0038】
ステップS309では、削除要請の対象となった文字列を新たなレコードとして削除候補テーブルに登録し、削除要請回数に1を設定する。
【0039】
ここで削除候補テーブルについて説明する。
図7に削除候補テーブルの一例を示す。
図7に示す通り、辞書名、削除候補の文字列、削除要請の回数、最終使用日、低利用フラグから構成されている。
【0040】
辞書名は、削除候補の文字列が登録されている辞書を示す情報である。
【0041】
ステップS310では、ステップS304で受け付けたOCR結果に対する修正内容と、辞書への追加登録の要請を取得する。
【0042】
ステップS311では、修正後文字列が登録候補テーブルにすでに登録済みであるかを判断する。
【0043】
ステップS312では、登録候補テーブルにおける修正後文字列に係る修正回数を1追加する。
【0044】
ステップS313では、登録候補テーブルにおける修正後文字列に係る修正日を更新する。
【0045】
ここで登録候補テーブルについて説明する。
図8に登録候補テーブルの一例を示す。
図8に示す通り、修正後文字列(登録候補の文字列)、修正回数、登録要請の有無、最終修正日から構成されている。
【0046】
ステップS314では、登録候補テーブルに登録されたレコード数が上限(所定の設定値)に達しているかを判断する。
【0047】
上限に達している場合(ステップS314:YES)は、処理をステップS315に移行する。上限に達していない場合(ステップS314:NO)は、処理をステップS316に移行する。
【0048】
ステップS315では、修正日が最も古いレコードを削除する。
【0049】
ステップS316では、修正後文字列を新たなレコードとして登録候補テーブルに登録する。
【0050】
ステップS317では、ステップS310で登録要請を取得したか(S304においてユーザから登録要請を受け付けたか)を判定し、登録要請があった場合はステップS318で登録要請の対象の文字列のレコードについて、登録要請があった旨のフラグをONにする。
【0051】
次に、
図4のフローチャートを用いて、辞書メンテナンス時における文字列の追加登録処理について説明する。
【0052】
ステップS401では、辞書メンテナンス画面を表示する。
図10(A)に辞書メンテナンス画面の一例を示す。
【0053】
ステップS402では、メンテナンス画面を介して登録候補表示指示を受けつける。具体的には、
図10(A)の画面の左側にあるメニューバーから辞書候補一覧を選択すると
図10(B)の画面が表示され、
図10Bの画面の登録候補ボタンが押下されることで、登録候補が表示される(表示された画面の一例を
図10Cに示す)
ステップS403では、登録候補テーブルに登録された情報に基づき、登録候補を表示する。
【0054】
【0055】
ステップS404では、登録候補テーブルに登録されたレコード数が所定数以上であるかを判定する。所定数以上の場合(ステップS404;YES)は、処理をステップS405に移行する。
【0056】
ステップS405では、登録候補のレコード数が所定数以上であることに基づくメッセージを表示する(一例として、削除を促すメッセージ)。
【0057】
ステップS406では、登録候補として表示されたレコードのうち、辞書への登録をするレコード(文字列)(辞書への登録については、登録先の辞書の指定も受け付けるものとする)や、登録候補テーブルから削除するレコードの選択を受け付ける。具体的には、
図10Cの画面に表示された候補の各レコードに付与されたチェックボックスに対してチェックを受け付け、登録ボタンや削除ボタンが押下されることで受け付ける。
【0058】
ステップS407では、ステップS406で受け付けた選択に基づき、登録する旨の選択を受け付けた文字列については辞書への登録をし、削除する旨の選択を受け付けた文字列については登録候補テーブルから削除する。
【0059】
次に、
図5のフローチャートを用いて、辞書メンテナンス時における文字列の削除処理を説明する。
【0060】
ステップS501では、辞書メンテナンス画面を表示する。
【0061】
ステップS502では、メンテナンス画面を介して削除候補表示指示を受けつける。
【0062】
ステップS503では、削除候補テーブルに登録された情報に基づき、削除候補を表示する。
【0063】
削除候補が表示された画面の一例を
図10Dに示す。なお、
図10Dは、
図10Bの画面から削除候補ボタンが押下されることで表示される画面である。
【0064】
ステップS504では、削除候補テーブルに登録されたレコード数が所定数以上であるかを判定する。所定数以上の場合(ステップS504;YES)は、処理をステップS505に移行する。
【0065】
ステップS505では、削除候補のレコード数が所定数以上であることに基づくメッセージ(一例として、削除を促すメッセージ)を表示する。
【0066】
ステップS506では、削除候補として表示されたレコードのうち、辞書から削除するレコード(文字列)や削除候補テーブルから削除するレコードの選択を受け付ける。具体的には、
図10Dの画面に表示された候補の各レコードに付与されたチェックボックスに対してチェックを受け付け、登録ボタンや削除ボタンが押下されることで受け付ける。
【0067】
ステップS507では、ステップS506で受け付けた選択に基づき、辞書から削除する旨の選択を受け付けた文字列については辞書から削除し、削除候補テーブルから削除する旨の選択を受け付けた文字列については削除候補テーブルから削除する。
【0068】
次に
図6のフローチャートを用いて、辞書に登録された文字列のうち利用頻度の低い文字列を特定する処理について説明する。
【0069】
ステップS601では、辞書が作成(登録)されてから所定時間(例えば1年間など)を経過した辞書を取得する。
【0070】
ステップS602では、ステップS601で取得した辞書のうち所定期間(例えば1年間など)使用されていない文字列を取得する。
【0071】
ステップS602で取得した文字列について、S604~S607の処理を実行する。
【0072】
ステップS604では、処理対象の文字列が削除候補テーブルに登録済みであるかを判定する。登録済みの場合(ステップS604:YES)は、処理をステップS605に移行する。登録されていない場合(ステップS604:No)は、処理をステップS606に移行する。
【0073】
ステップS605では、処理対象の文字列に係る削除要請回数を1追加する。
【0074】
ステップS606では、処理対象の文字列を削除候補テーブルに追加し、削除要請回数に1を設定する。
【0075】
ステップS607では、削除候補テーブルにおける処理対象の文字列に係るレコードに、丁利用頻度フラグを立てる。
【0076】
以上、実施形態について示したが、本発明は、例えば、システム、装置、方法、プログラムもしくは記録媒体等としての実施態様をとることが可能である。具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
【0077】
また、本発明におけるプログラムは、
図3に示すフローチャートの処理方法をコンピュータが実行可能なプログラムであり、本発明の記憶媒体は
図3の処理方法をコンピュータが実行可能なプログラムが記憶されている。なお、本発明におけるプログラムは
図3の各装置の処理方法ごとのプログラムであってもよい。
【0078】
以上のように、前述した実施形態の機能を実現するプログラムを記録した記録媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムを読み出し、実行することによっても本発明の目的が達成されることは言うまでもない。
【0079】
この場合、記録媒体から読み出されたプログラム自体が本発明の新規な機能を実現することになり、そのプログラムを記録した記録媒体は本発明を構成することになる。
【0080】
プログラムを供給するための記録媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD-ROM、CD-R、DVD-ROM、磁気テープ、不揮発性のメモリカード、ROM、EEPROM、シリコンディスク等を用いることが出来る。
【0081】
また、コンピュータが読み出したプログラムを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0082】
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0083】
また、本発明は、複数の機器から構成されるシステムに適用しても、ひとつの機器から成る装置に適用しても良い。また、本発明は、システムあるいは装置にプログラムを供給することによって達成される場合にも適応できることは言うまでもない。この場合、本発明を達成するためのプログラムを格納した記録媒体を該システムあるいは装置に読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。
【0084】
さらに、本発明を達成するためのプログラムをネットワーク上のサーバ、データベース等から通信プログラムによりダウンロードして読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。なお、上述した各実施形態およびその変形例を組み合わせた構成も全て本発明に含まれるものである。
【符号の説明】
【0085】
101 クライアント端末
102 サーバ装置
103 LAN