IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ キヤノンマーケティングジャパン株式会社の特許一覧 ▶ キヤノンITソリューションズ株式会社の特許一覧

特開2022-103685情報処理システム、情報処理方法、プログラム
<>
  • 特開-情報処理システム、情報処理方法、プログラム 図1
  • 特開-情報処理システム、情報処理方法、プログラム 図2
  • 特開-情報処理システム、情報処理方法、プログラム 図3
  • 特開-情報処理システム、情報処理方法、プログラム 図4
  • 特開-情報処理システム、情報処理方法、プログラム 図5
  • 特開-情報処理システム、情報処理方法、プログラム 図6
  • 特開-情報処理システム、情報処理方法、プログラム 図7
  • 特開-情報処理システム、情報処理方法、プログラム 図8
  • 特開-情報処理システム、情報処理方法、プログラム 図9
  • 特開-情報処理システム、情報処理方法、プログラム 図10
  • 特開-情報処理システム、情報処理方法、プログラム 図11
  • 特開-情報処理システム、情報処理方法、プログラム 図12
  • 特開-情報処理システム、情報処理方法、プログラム 図13
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022103685
(43)【公開日】2022-07-08
(54)【発明の名称】情報処理システム、情報処理方法、プログラム
(51)【国際特許分類】
   G06F 16/383 20190101AFI20220701BHJP
   G06V 30/12 20220101ALI20220701BHJP
【FI】
G06F16/383
G06K9/03 B
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2020218463
(22)【出願日】2020-12-28
(71)【出願人】
【識別番号】390002761
【氏名又は名称】キヤノンマーケティングジャパン株式会社
(71)【出願人】
【識別番号】592135203
【氏名又は名称】キヤノンITソリューションズ株式会社
(74)【代理人】
【識別番号】100189751
【弁理士】
【氏名又は名称】木村 友輔
(72)【発明者】
【氏名】松田 雄介
(72)【発明者】
【氏名】福田 直之
【テーマコード(参考)】
5B064
5B175
【Fターム(参考)】
5B064AA01
5B064BA01
5B064CA08
5B064EA11
5B064EA18
5B064EA19
5B064EA21
5B175DA02
5B175GA03
(57)【要約】
【課題】 効率的に誤読修正を行い適切な検索結果を得ることができる
【解決手段】 文書をOCR処理した結果に対して修正を行い、OCR処理した結果と修正された結果とを記憶する。入力された検索語により、OCR処理した結果と修正された結果との両方を検索する。
【選択図】 図1
【特許請求の範囲】
【請求項1】
文書をOCR処理した結果に対して、修正を行う修正手段と、
前記OCR処理した結果と、前記修正手段により修正された結果とを記憶する記憶手段と、
入力された検索語を用いて、前記記憶手段に記憶されたOCR処理した結果と、前記修正手段により修正された結果とを検索する検索手段と、
を備えることを特徴とする情報処理システム。
【請求項2】
前記修正手段は、前記OCR処理の結果に対して形態素解析をした結果に基づき、修正を行うことを特徴とする請求項1に記載の情報処理システム。
【請求項3】
前記修正手段は、前記OCR処理の結果に対して、正しいキーワードが登録された辞書情報を用いて修正を行うことを特徴とする請求項1または2に記載の情報処理システム。
【請求項4】
前記修正手段は、前記OCR処理の結果に対して、ユーザによる修正履歴に基づいて修正を行うことを特徴とする請求項1乃至3のいずれか1項に記載の情報処理システム。
【請求項5】
前記修正手段により修正された結果に対して、ユーザから評価を受け付ける受付手段を備えることを特徴とする請求項1乃至4のいずれか1項に記載の情報処理システム。
【請求項6】
情報処理システムの修正手段が、文書をOCR処理した結果に対して、修正を行う修正工程と、
前記情報処理システムの記憶手段が、前記OCR処理した結果と、前記修正工程により修正された結果とを記憶する記憶工程と、
前記情報処理システムの検索手段が、入力された検索語を用いて、前記記憶手段に記憶されたOCR処理した結果と、前記修正工程において修正された結果とを検索する検索工程と、
を備えることを特徴とする情報処理方法。
【請求項7】
コンピュータを、
文書をOCR処理した結果に対して、修正を行う修正手段と、
前記OCR処理した結果と、前記修正手段により修正された結果とを記憶する記憶手段と、
入力された検索語を用いて、前記記憶手段に記憶されたOCR処理した結果と、前記修正手段により修正された結果とを検索する検索手段として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理システム、情報処理方法、プログラムに関する。
【背景技術】
【0002】
多くの企業において、紙媒体で保管していた文書をデータ化して保管することが行われている。このようにして保管される文書データは、膨大な量となるため、効率的に所望の文書が検索できる仕組みが必要不可欠となっている。効率的な検索を行うための方法の一つとして、文書に対してOCR(光学文字認識)処理を行ってデータ化することが行われている。これにより、検索キーワードを用いて文書を検索することが可能となる。
【0003】
OCRは必ずしも正しく認識するものではなく、誤読が生じることがある。誤読したままにしておくと、適切に検索されないといった後続の処理に悪影響を与える場合があるため、誤読はできるだけ前もって修正しておく必要がある。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開平05-314303号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
特許文献1には、オペレータによる修正履歴を保存しておき、それを修正候補として提示することでオペレータの修正作業の負荷を軽減させるための技術が記載されている。
【0006】
しかし、前述の技術を用いたとしても、文書が大きくなれば誤読箇所も増えるため、全てを一度に修正しようとするとオペレータには大きな負担となるという課題がある。
【0007】
そこで、本発明は、効率的に誤読修正を行い適切な検索結果を得られる仕組みを提供すること目的とする。
【課題を解決するための手段】
【0008】
本発明の情報処理システムは、文書をOCR処理した結果に対して修正を行う修正手段と、前記OCR処理した結果と、前記修正手段により修正された結果とを記憶する記憶手段と、入力された検索語を用いて、前記記憶手段に記憶されたOCR処理した結果と、前記修正手段により修正された結果とを検索する検索手段と、を備えることを特徴とする。
【発明の効果】
【0009】
本発明によれば、効率的に誤読修正を行い適切な検索結果を得ることができる。
【図面の簡単な説明】
【0010】
図1】本発明の実施形態における、システム構成の一例を示す図
図2】本発明の実施形態における、ハードウエア構成の一例を示す図
図3】本発明の実施形態における、機能構成の一例を示す図である。
図4】本発明の実施形態における、文書登録処理の一例を示すフローチャートである。
図5】本発明の実施形態における、誤読修正処理の一例を示すフローチャートである。
図6】本発明の実施形態における、形態素解析による誤読修正の一例を示すフローチャートである。
図7】本発明の実施形態における、キーワード辞書による誤読修正の一例を示すフローチャートである。
図8】本発明の実施形態における、誤読修正履歴による誤読修正の一例を示すフローチャートである。
図9】本発明の実施形態における、検索処理の一例を示すフローチャートである。
図10】本発明の実施形態における、修正確定処理の一例を示すフローチャートである。
図11】本発明の実施形態における、検索結果画面の一例を示す図である。
図12】本発明の実施形態における、修正確定画面の一例を示す図である。
図13】本発明の実施形態における、誤読修正履歴テーブルの一例を示す図である。
【発明を実施するための形態】
【0011】
以下、図面を参照して、本発明の実施形態を詳細に説明する。
【0012】
図1は、本発明における情報処理システムの構成の一例を示す図である。
【0013】
図1に示す通り、1または複数のサーバ装置101とクライアント端末102とが通信可能に接続されている。
【0014】
サーバ装置は、本実施例の図4図10の処理を実行する装置であり、クライアント端末102は、図11図12に示す画面を表示し、ユーザからの指示を受け付ける装置である。
【0015】
図2は、本発明のクライアント端末、サーバ装置に適用可能な情報処理装置のハードウェア構成の一例を示すブロック図である。
【0016】
図2に示すように、情報処理装置は、システムバス215を介してCPU(Central Processing Unit)201、ROM(Read Only Memory)202、RAM(Random Access Memory)203、記憶装置204、入力コントローラ205、音声コントローラ206、ビデオコントローラ207、メモリコントローラ208、よび通信I/Fコントローラ209が接続される。
【0017】
CPU201は、システムバス215に接続される各デバイスやコントローラを統括的に制御する。
【0018】
ROM202あるいは外部メモリ213は、CPU201が実行する制御プログラムであるBIOS(Basic Input/Output System)やOS(Operating System)や、本情報処理方法を実現するためのコンピュータ読み取り実行可能なプログラムおよび必要な各種データ(データテーブルを含む)を保持している。
【0019】
RAM203は、CPU201の主メモリ、ワークエリア等として機能する。CPU201は、処理の実行に際して必要なプログラム等をROM202あるいは外部メモリ213からRAM203にロードし、ロードしたプログラムを実行することで各種動作を実現する。
【0020】
入力コントローラ205は、キーボード210や不図示のマウス等のポインティングデバイス等の入力装置からの入力を制御する。入力装置がタッチパネルの場合、ユーザがタッチパネルに表示されたアイコンやカーソルやボタンに合わせて押下(指等でタッチ)することにより、各種の指示を行うことができることとする。
【0021】
また、タッチパネルは、マルチタッチスクリーンなどの、複数の指でタッチされた位置を検出することが可能なタッチパネルであってもよい。
【0022】
ビデオコントローラ207は、ディスプレイ212などの外部出力装置への表示を制御する。ディスプレイは本体と一体になったノート型パソコンのディスプレイも含まれるものとする。なお、外部出力装置はディスプレイに限ったものははく、例えばプロジェクタであってもよい。また、前述のタッチ操作を受け付け可能な装置については、入力装置も提供する。
【0023】
なおビデオコントローラ207は、表示制御を行うためのビデオメモリ(VRAM)を制御することが可能で、ビデオメモリ領域としてRAM203の一部を利用することもできるし、別途専用のビデオメモリを設けることも可能である。
【0024】
メモリコントローラ208は、外部メモリ213へのアクセスを制御する。外部メモリとしては、ブートプログラム、各種アプリケーション、フォントデータ、ユーザファイル、編集ファイル、および各種データ等を記憶する外部記憶装置(ハードディスク)、フレキシブルディスク(FD)、或いはPCMCIAカードスロットにアダプタを介して接続されるコンパクトフラッシュ(登録商標)メモリ等を利用可能である。
【0025】
通信I/Fコントローラ209は、ネットワークを介して外部機器と接続・通信するものであり、ネットワークでの通信制御処理を実行する。例えば、TCP/IPを用いた通信やISDNなどの電話回線、および携帯電話の4G回線、5G回線等を用いた通信が可能である。
【0026】
尚、CPU201は、例えばRAM203内の表示情報用領域へアウトラインフォントの展開(ラスタライズ)処理を実行することにより、ディスプレイ212上での表示を可能としている。また、CPU201は、ディスプレイ212上の不図示のマウスカーソル等でのユーザ指示を可能とする。
【0027】
図3は、本発明の情報処理システムの機能を示した機能ブロック図である。
【0028】
文書登録処理部100は、スキャンされた文書など登録対象の文書を、登録文書インデックスに登録する処理を行う。
【0029】
誤読修正処理部200は、OCR原文に対して誤読箇所を検出し、検出された誤読箇所を正しい内容に修正する処理を実行する。
【0030】
文書登録部300は、誤読修正処理部200により誤読箇所の修正が行われた文書を登録文書インデックスに登録する処理を行う。
【0031】
検索処理部400は、ユーザから受け付けた検索語を用いて、登録文書インデックスで管理された文書の検索を行う。
【0032】
修正確定処理部500は、登録文書インデックスで管理された文書に対して、ユーザにより受け付けた修正内容を反映する処理を行う。
【0033】
誤修正用データソース600は、誤読箇所の検出や修正に用いられるデータ(住所データ、形態素辞書、キーワード辞書など)が登録されている。
【0034】
登録文書インデックス700は、検索対象となる文書が管理されるデータベースである。
【0035】
誤読修正履歴800は、ユーザにより確定された誤読修正履歴(修正実績)が管理されるデータベースである。
【0036】
次に図4図10のフローチャートを用いて、本発明の実施形態における情報処理システムが実行する処理について説明する。
【0037】
図4のフローチャートは、文書登録処理部100および誤読修正処理部200および文書登録部300において文書を登録する処理を示すフローチャートである。
【0038】
ステップS401では、登録対象となる文書全てに対して処理が終了したかどうかを判定する。処理が終了していれば(S401のYes)該フローチャートの処理を終了し、処理の終了していない文書が残っていれば(S401のNo)ステップS02に進む。
【0039】
なお、登録対象となる文書は、ユーザにより登録対象として指定された文書や、登録対象の文書を管理する装置において管理されている文書などが対象となる。
【0040】
ステップS402では、登録対象の文書に対してOCRを用いたテキスト抽出処理を行う。
【0041】
ステップS403では、ステップS402で抽出されたテキストに対して、誤読修正処理を行う。誤読修正処理の詳細については、図5のフローチャートを用いて後述する。
【0042】
ステップS404では、ステップS402におけるOCR処理によって抽出されたテキストの原文(OCR原文)とステップS403(S403のサブフローである図5のフローチャートのS504)で出力された仮修正文の両方を登録文書インデックス700に格納する。
【0043】
次に図5のフローチャートを用いて、ステップS403の処理(誤読修正処理部200においてOCR原文の誤読を修正する処理)の詳細を説明する。なお、ここで示す誤読修正処理の手法はあくまでも一例であり、ここで示さない誤読修正の手法を用いても構わない。
【0044】
ステップS501では、形態素解析による誤読修正を行う。処理の詳細は、図6のフローチャートを用いて後述する。
【0045】
ステップS502では、キーワード辞書による誤読修正を行う。処理の詳細は、図7のフローチャートを用いて後述する。
【0046】
ステップS503では、過去誤読傾向による誤読修正を行う。処理の詳細は、図8のフローチャートを用いて後述する。
【0047】
ステップS504では、ステップS501~S503の処理により修正した文書を仮修正文として出力する。
【0048】
次に図6のフローチャートを用いて、ステップS501における形態素解析を用いて誤読を修正する処理について説明する。なお、本実施例では住所に対する誤読修正について説明するが、これはあくまでも一例である。
【0049】
ステップS601では、ステップS402で抽出されたOCR原文に形態素解析を実行する。
【0050】
ステップS602では、ステップS601における形態素解析の結果に基づき、品詞が[名詞-固有名詞-地域]で囲まれた部分が存在するかどうかを判断する。条件に合致する場合(S602のYes)ステップS603へ処理を進め、そうでない場合(S602のNo)処理を終了する。
【0051】
ステップS603では、ステップS602の条件に該当する部分を抽出する。例えば、「市役所は大阪府東太阪市荒本北にある。」という文字列の場合、「大阪」と「荒本北」という言葉の品詞が[名詞-固有名詞-地域]であるため、「大阪」と「荒本北」とにより囲まれた部分である「大阪府東太阪市荒本北」が条件に合致する部分となり抽出される。
【0052】
ステップS604では、ステップS603で抽出された部分のうち、品詞が[名詞-固有名詞-地域]である形態素を使って住所の検索を行う。例えば「大阪府東太阪市荒本北」の場合、「大阪」「荒本北」で住所の検索を実行する。
【0053】
ステップS605では、住所の検索結果が見つかりかつ該部分と検索結果の住所の編集距離(二つの文字列がどの程度異なっているかを示す値)が小さいかどうか(所定の条件を満たすか否か)を判断する。例えば、編集距離が所定の値以下であるかを判断したり、文字列の文字数との比率によって判断しても良い。
【0054】
条件に合致すれば(S605のYes)処理をステップS606に進め、条件に合致しない場合(S605のNo)は処理をステップS602に進める。
【0055】
例えば、「大阪」「荒本北」で住所検索をした場合、「大阪府東大阪市荒本北」が見つかり、S603において抽出された文字列である「大阪府東太阪市荒本北」との編集距離は1となる。この1という値が所定の条件を満たす値であると判断されると、ステップS605はYesと判定される。
【0056】
ステップS606では、S603において抽出された文字列をS604において検索された住所に修正したものを仮修正とする。上記例の場合、「大阪府東太阪市荒本北」の修正が「大阪府東大阪市荒本北」となるため仮修正は「太」→「大」となる。
【0057】
次に図7のフローチャートを用いて、ステップS502の処理(正しい表記のキーワードが登録されたキーワード辞書603を用いた誤読を修正する処理)について説明する。
【0058】
ステップS701では、キーワード辞書に含まれる全てのキーワードを処理したかどうかを判断する。全て処理した場合(S701のYes)処理を終了し、そうでない場合(S701のNo)処理をステップS702に進める。
【0059】
ステップS702では、キーワード辞書からキーワードを取得する。キーワード辞書には予め正しい表記のキーワードが登録されているものとする。
【0060】
ステップS703では、OCR原文に、ステップS702で取得したキーワードと編集距離が小さいワードがあるかどうかを判断する。ある場合(S703のYes)処理をステップS704へ進め、そうでない場合(S703のNo)処理をステップS701へ進める。
【0061】
例えばOCR原文が「国の文化敗保護法で指定された重要文化敗である。」でキーワードが「文化財保護法」である場合、OCR原文の「文化敗保護法」の部分がキーワードとの編集距離が1となり、条件と合致する部分と判定される。
【0062】
ステップS04では、条件と合致すると判定された部分を当該キーワードとしたものを仮修正とする。例の場合、「文化敗保護法」の修正が「文化財保護法」となるため仮修正は「敗」→「財」となる。
【0063】
次に図8のフローチャートを用いて、ステップS503における誤読修正履歴800を用いた誤読修正処理について説明する。
【0064】
ステップS801では、OCR原文を形態素解析する。例えば「国の文化財保護法で指定された重要文化敗である」という文書の場合、「国/の/文化財/保護/法/で/指定/さ/れ/た/重要/文化/敗/で/ある」という形態素に分解される。
【0065】
ステップS802では、誤読修正履歴(一例として図13)に含まれるすべての修正履歴を処理したかどうかを判断する。すべて処理した場合(S802のYes)処理を終了し、そうでない場合(S802のNo)処理をステップS803に進める。
【0066】
ステップS803では、修正履歴のエントリを取得する。例えば、「敗」→「財」を取得したとする。
【0067】
ステップS804では、ステップS803で取得したエントリの修正前に該当する部分がOCR原文に存在するかどうかを判断する。存在する場合(S804のYes)処理をステップS805に進め、そうでない場合(S804のNo)処理をステップS802に進める。上で例示した文の場合、13形態素目の「敗」が該当する部分として存在する。
【0068】
ステップS805では、ステップS804で該当すると判定された部分を含む周辺(所定の範囲。例えば、前後2形態素分)の形態素を抽出する。上で例示した文の場合、例えば「重要/文化/敗/で/ある」を抽出する。
【0069】
ステップS806では、ステップS805で抽出した形態素の数を修正前形態素数として記録する。例の場合、修正前形態素数は5となる。
【0070】
ステップS807では、ステップS804で該当すると判定された部分を修正履歴に従って修正する。例の場合、「重要文化財である」と修正される。
【0071】
ステップS808では、当該部分に対して形態素解析を実行する。例の場合、「重要/文化財/で/ある」という形態素に分解される。
【0072】
ステップS809では、ステップS808により得られる形態素の数を修正後形態素数として記録する。例の場合、修正後形態素数は4となる。
【0073】
ステップS810では、修正後形態素数が修正前形態素数より小さいかどうかを判断する。小さい場合(S810のYes)処理をステップS811に進め、そうでない場合(S810のNo)処理をステップS804に進める。上述の例の場合、修正後形態素数が4で修正前形態素数が5であるため小さいと判断される。
【0074】
ステップS811では、ステップS807における修正を仮修正とする。例の場合「敗」→「財」が仮修正となる。
【0075】
以上の処理により、過去の修正履歴(修正実績)に基づいて、修正すべき部分を特定し修正する処理について説明した。本実施例においては、過去のすべての修正履歴を用いて修正を行う手法を説明したが、図13の修正件数1303のような情報を用いて、仮修正とするかどうかを判断してもよい。例えば、修正履歴の修正件数が他の修正履歴よりも極端に小さいと判断できる場合には仮修正としない、といった処理を加えてもよい。
【0076】
過去の修正実績が少ない履歴を用いることがなくなるため、例えば「誤って修正してしまったような実績」を用いることがなくなる。そのため、本来修正すべきではない箇所を修正してしまうという事態を低減させることが可能となる。
【0077】
以上説明した、図4図8のフローチャートで示す処理により、文書に対してOCR処理をした結果であるOCR原文と、当該OCR原文に対して誤読(誤認識)をしたと考えられる部分を修正した仮修正文の両方をインデックスに登録することが可能となる。
【0078】
次に、図9のフローチャートを用いて、登録文書インデックス700から文書を検索する処理について説明する。
【0079】
図9は、検索処理部400において、ユーザからの検索語を入力として受けとり、登録文書インデックス700から文書を検索する処理を示すフローチャートである。
【0080】
ステップS901では、ユーザにより入力された検索語を取得する。検索語の取得については、ユーザにより入力されたキーワードを取得しても良いし、ユーザから受け付けた文書から抽出されたキーワードを取得しても良い。
【0081】
ステップS902では、ステップS901で取得した検索語を用いて、OCR原文および仮修正文から検索を行う。OCR原文と仮修正文の両方から検索を行うことで、OCR原文を誤修正していた場合(本来、修正が必要ないにもかかわらず修正してしまった場合)でもヒットさせることができる。
【0082】
ステップS903では、ヒットしたすべての文書に対して、ステップS904以降の処理を実行したかどうかを判断する。すべての文書に対して処理を実行した場合(S903のYes)は本フローチャートの処理を終了し、そうでない場合(S903のNo)は処理をステップS904に進める。
【0083】
ステップS904では、ステップS902における検索処理によりヒットした文書を取得する。
【0084】
ステップS905では、検索ヒットした部分に仮修正が含まれるかどうかを判断する。含まれる場合(S905のYes)処理をステップS906に進め、そうでない場合(S905のNo)処理をステップS907に進める。例えば文書が上記の例(OCR原文が「国の文化敗保護法で指定された重要文化敗である」で、仮修正文が「国の文化財保護法で指定された重要文化財である」)で、検索語が「文化財」である場合、仮修正である「敗」→「財」の部分が含まれることになる。
【0085】
ステップS906では、検索結果に誤読を修正した箇所がある旨(一例として図11の誤読修正ありリンク1106)を表示する。
【0086】
ステップS907では、検索結果のみを表示する。
【0087】
以上の処理により、検索処理によりヒットした文書に、図4図8のフローチャートの処理による修正箇所が含まれているか否かを把握することが可能となる。
【0088】
図10は、修正確定処理部500において、修正確定画面1200(図12)からの入力を受けとり、修正を確定する処理を示すフローチャートである。
【0089】
修正確定画面1200は、図11に示す誤読修正ありリンク1106に対してクリック操作を受け付けることで表示される画面である。
【0090】
ステップS1001では、修正確定画面1200において、ユーザによる修正内容に対する指示を受け付ける。図12の修正確定画面の詳細は後述する。
【0091】
ステップS1002では、すべての修正指示を処理したかどうかを判断する。すべて処理した場合(S1002のYes)処理を終了し、そうでない場合(S1002のNo)処理をステップS1003に進める。
【0092】
ステップS1003では、図12の画面を介してユーザから受け付けた修正指示を取得する。
【0093】
ステップS1004では、ステップS1003で取得した修正指示の内容が、仮修正が正しいとするものかどうか(修正確定画面1200の仮修正が正しいラジオボタン1203が選択されているかどうか)を判断する。仮修正が正しいと判断された場合(S1004のYes)処理をステップS1005に進め、そうでない場合(S1004のNo)処理をステップS1006に進める。
【0094】
ステップS1005では、修正指示の内容が、OCR原文が正しいとするものかどうか(修正確定画面1200のOCR原文が正しいラジオボタン1204が選択されているかどうか)を判断する。OCR原文が正しいと判断された場合(S1005のYes)処理をステップS1007に進め、そうでない場合(S1005のNo)処理をステップS108に進める。
【0095】
ステップS1006では、仮修正の内容を確定し、誤読修正履歴に記録する。
【0096】
ステップS1007では、仮修正を破棄し、OCR原文の内容で確定する。
【0097】
ステップS1008では、正しい修正内容の入力を受け付け、入力された内容を誤読修正履歴に記録する。
【0098】
図11は、ユーザが入力した検索語での検索結果を表示する画面である。検索結果画面1100は検索語入力フィールド1101、検索ボタン1102、検索結果表示領域1103、ヒット文書タイトル1104、ヒット部分スニペット1105、誤読修正リンク1106からなる。
【0099】
検索語入力フィールド1101は、ユーザが検索したい語句を入力するためのものである。
【0100】
検索ボタン1102は、押下することで検索語入力フィールド1101に入力された語句を用いて検索処理を実行するためのものである。
【0101】
検索結果表示領域1103は、検索処理によってヒットした文書の一覧を表示する領域である。
【0102】
ヒット文書タイトル1104は、検索処理によってヒットした文書のタイトルを表示するものである。これは文書ファイルのダウンロードリンクになっていたり、ブラウザ上で内容の詳細を表示するためのリンクになっていたりする。
【0103】
ヒット部分スニペット1105は、文書の本文内でヒットした検索語の周辺を表示するものである。
【0104】
誤読修正リンク1106は、後述する図12に遷移するためのリンクである。ヒットした検索語が仮修正の部分に該当する場合のみ表示される。
【0105】
図12は、該文書の仮修正を確定させるための指示を入力する画面である。修正確定画面1200は、OCR原文表示フィールド1201、仮修正文表示フィールド1202、仮修正が正しいラジオボタン1203、OCR原文が正しいラジオボタン1204、修正を入力するラジオボタン1205、修正入力フィールド1206、修正確定ボタン1207、キャンセルボタン1208からなる。
【0106】
OCR原文表示フィールド1201は、該仮修正のOCR原文側を表示するためのものである。
【0107】
仮修正文表示フィールド1202は、該仮修正の仮修正文側を表示するためのものである。
【0108】
仮修正文が正しいラジオボタン1203は、該仮修正の内容が、仮修正文側が正しいとユーザが判断した場合に選択するためのものである。
【0109】
OCR原文が正しいラジオボタン1204は、該仮修正の内容が、OCR原文側が正しいとユーザが判断した場合に選択するためのものである。
【0110】
修正を入力するラジオボタン1205は、該仮修正の内容が、仮修正文側・OCR原文側ともに正しくないとユーザが判断した場合に選択するためのものである。
【0111】
修正入力フィールド1206は、ユーザが自分で修正内容を入力するためのフィールドである。修正を入力するラジオボタン1205が選択された場合に入力可能となる。
【0112】
修正確定ボタン1207は、押下することで入力された修正内容で修正確定処理を実行するためのものである。
【0113】
キャンセルボタン1208は、押下することで修正確定処理を実行させずに修正確定画面00を閉じるためのものである。
【0114】
図13の修正履歴テーブル1300は、修正履歴を保持するためのテーブルであり、修正前語句1301、修正後語句1302、修正件数1303の項目からなる。
【0115】
修正前語句1301には、修正確定時の修正前の語句が登録される。
【0116】
修正後語句1302には、修正確定時の修正後の語句が登録される。
【0117】
修正件数1303には、該修正確定処理が行われた回数が記録される。
【0118】
以上説明した通り、本願発明は、文書に対してOCR処理を実行し、当該OCR処理の結果に対して、形態素解析やキーワード辞書やユーザによる修正履歴を用いて修正を行う。このように、システム側でOCR結果に対して修正を行うため、ユーザが一つ一つ確認しながら修正を行う場合に比べ、効率的にOCR結果に対する修正を行うことが可能となる。
【0119】
そして、修正された内容と、修正前の内容(OCR原文)の両方を保持し両方を検索対象とすることで、修正内容が間違っていた場合(例えば、OCR原文が正しいのに、間違っていると判断して誤修正してしまった場合など)でも、OCR原文の方が検索でヒットするため、適切な(漏れのない)検索を行うことが可能となる。
【0120】
また、修正内容についてユーザに確認させ、評価を受け付ける(適切な修正内容の入力や、修正内容とOCR原文のどちらが正しいかの選択)を受け付けることで、誤修正を修正することが可能となる。
【0121】
本発明は、例えば、システム、装置、方法、プログラムもしくは記録媒体等としての実施態様をとることが可能である。具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
【0122】
また、本発明におけるプログラムは、図4図10に示すフローチャートの処理方法をコンピュータが実行可能なプログラムであり、本発明の記憶媒体は図4図10の処理方法をコンピュータが実行可能なプログラムが記憶されている。なお、本発明におけるプログラムは図4図10の各装置の処理方法ごとのプログラムであってもよい。
【0123】
以上のように、前述した実施形態の機能を実現するプログラムを記録した記録媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムを読み出し、実行することによっても本発明の目的が達成されることは言うまでもない。
【0124】
この場合、記録媒体から読み出されたプログラム自体が本発明の新規な機能を実現することになり、そのプログラムを記録した記録媒体は本発明を構成することになる。
【0125】
プログラムを供給するための記録媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD-ROM、CD-R、DVD-ROM、磁気テープ、不揮発性のメモリカード、ROM、EEPROM、シリコンディスク等を用いることが出来る。
【0126】
また、コンピュータが読み出したプログラムを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0127】
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0128】
また、本発明は、複数の機器から構成されるシステムに適用しても、ひとつの機器から成る装置に適用しても良い。また、本発明は、システムあるいは装置にプログラムを供給することによって達成される場合にも適応できることは言うまでもない。この場合、本発明を達成するためのプログラムを格納した記録媒体を該システムあるいは装置に読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。
【0129】
さらに、本発明を達成するためのプログラムをネットワーク上のサーバ、データベース等から通信プログラムによりダウンロードして読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。なお、上述した各実施形態およびその変形例を組み合わせた構成も全て本発明に含まれるものである。
【符号の説明】
【0130】
101 サーバ装置
102 クライアント端末
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13