IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社PFUの特許一覧

特許7591914OCR処理装置、OCR処理方法、及びプログラム
<>
  • 特許-OCR処理装置、OCR処理方法、及びプログラム 図1
  • 特許-OCR処理装置、OCR処理方法、及びプログラム 図2
  • 特許-OCR処理装置、OCR処理方法、及びプログラム 図3
  • 特許-OCR処理装置、OCR処理方法、及びプログラム 図4
  • 特許-OCR処理装置、OCR処理方法、及びプログラム 図5
  • 特許-OCR処理装置、OCR処理方法、及びプログラム 図6
  • 特許-OCR処理装置、OCR処理方法、及びプログラム 図7
  • 特許-OCR処理装置、OCR処理方法、及びプログラム 図8
  • 特許-OCR処理装置、OCR処理方法、及びプログラム 図9
  • 特許-OCR処理装置、OCR処理方法、及びプログラム 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-11-21
(45)【発行日】2024-11-29
(54)【発明の名称】OCR処理装置、OCR処理方法、及びプログラム
(51)【国際特許分類】
   G06V 30/12 20220101AFI20241122BHJP
【FI】
G06V30/12 J
【請求項の数】 11
(21)【出願番号】P 2020202849
(22)【出願日】2020-12-07
(65)【公開番号】P2022090443
(43)【公開日】2022-06-17
【審査請求日】2023-09-20
(73)【特許権者】
【識別番号】000136136
【氏名又は名称】株式会社PFU
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】豊田 裕史
【審査官】小池 正彦
(56)【参考文献】
【文献】特開2012-146147(JP,A)
【文献】特開2003-242171(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06V 30/12
(57)【特許請求の範囲】
【請求項1】
入力項目に入力された文字列を特定するOCR処理部と、
前記OCR処理部により特定された複数の文字列を、複数のグループに分類するグループ化部と、
前記グループ化部により分類された複数の文字列を、グループ毎に区別して表示する表示部と
を有するOCR処理装置。
【請求項2】
前記グループ化部は、同一の入力項目に関して、前記OCR処理部により特定された文字列を、文字列の類似度に基づいてグループ化する
請求項1に記載のOCR処理装置。
【請求項3】
ユーザの操作に応じて、前記グループ化部により分類された複数の文字列に対して、確定した文字列を指定する文字列確定部
をさらに有する
請求項2に記載のOCR処理装置。
【請求項4】
前記表示部は、前記グループ化部により同一グループに分類された複数の文字列について、前記同一グループの複数の文字列の数に応じて、表示態様を変える
請求項3に記載のOCR処理装置。
【請求項5】
前記表示部は、前記グループ化部により同一グループに分類された複数の文字列について、最多の同一文字列を、他の文字列よりも強調して表示する
請求項4に記載のOCR処理装置。
【請求項6】
前記グループ化部は、
予め登録された登録文字列と一致する文字列を、グループに分類する辞書グループ化部と、
前記辞書グループ化部によりいずれの登録文字列とも不一致であると判定された文字列について、互いの類似度に基づいて分類する類似グループ化部と
を含み、
前記表示部は、前記辞書グループ化部により分類された文字列、又は、前記類似グループ化部により分類された文字列を、グループ毎に区別して表示する
請求項5に記載のOCR処理装置。
【請求項7】
前記グループ化部は、
未記入であると判定された入力項目をグループ化する未記入グループ化部と、
前記未記入グループ化部により未記入であると判定されなかった入力項目について、予め登録された登録文字列と一致する文字列を、グループに分類する辞書グループ化部と、
前記辞書グループ化部によりいずれの登録文字列とも不一致であると判定された文字列について、互いの類似度に基づいて分類する類似グループ化部と
を含み、
前記表示部は、前記辞書グループ化部により分類された文字列、又は、前記類似グループ化部により分類された文字列を、グループ毎に区別して表示する
請求項5に記載のOCR処理装置。
【請求項8】
前記グループ化部により分類されたグループ間で、文字列を移動させる操作を受け付けるグループ移動部と、
前記グループ移動部により移動させた文字列について、移動先のグループに関して前記文字列確定部により確定された確定文字列を適用する移動確定部と
をさらに有する請求項3に記載のOCR処理装置。
【請求項9】
前記グループ化部により分類されたグループを一覧表示し、各グループに対する確認作業が完了したか否かを示す表示を付すグループ表示部
をさらに有する請求項3に記載のOCR処理装置。
【請求項10】
コンピュータが、入力項目に入力された文字列を特定するOCR処理ステップと、
コンピュータが、前記OCR処理ステップにより特定された複数の文字列を、複数のグループに分類するグループ化ステップと、
コンピュータが、前記グループ化ステップにより分類された複数の文字列を、グループ毎に区別して表示する表示ステップと
を有するOCR処理方法。
【請求項11】
入力項目に入力された文字列を特定するOCR処理ステップと、
前記OCR処理ステップにより特定された複数の文字列を、複数のグループに分類するグループ化ステップと、
前記グループ化ステップにより分類された複数の文字列を、グループ毎に区別して表示する表示ステップと
をコンピュータに実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、OCR処理装置、OCR処理方法、及びプログラムに関する。
【背景技術】
【0002】
例えば、特許文献1には、点数が所定点数以下の文字を、文字コードが同じである文字毎にグループ分けし、グループ分けされた文字群のうち1つの文字について文字コードを修正する指示が入力された場合には、この1つの文字が属するグループ内の全ての文字コードをこの指示に従って変更する画像処理方法点数が所定点数以下の文字を、文字コードが同じである文字毎にグループ分けし、グループ分けされた文字群のうち1つの文字について文字コードを修正する指示が入力された場合には、この1つの文字が属するグループ内の全ての文字コードをこの指示に従って変更する(点数が所定点数以下の文字を、文字コードが同じである文字毎にグループ分けし、グループ分けされた文字群のうち1つの文字について文字コードを修正する指示が入力された場合には、この1つの文字が属するグループ内の全ての文字コードをこの指示に従って変更する点数が所定点数以下の文字を、文字コードが同じである文字毎にグループ分けし、グループ分けされた文字群のうち1つの文字について文字コードを修正する指示が入力された場合には、この1つの文字が属するグループ内の全ての文字コードをこの指示に従って変更する点数が所定点数以下の文字を、文字コードが同じである文字毎にグループ分けし、グループ分けされた文字群のうち1つの文字について文字コードを修正する指示が入力された場合には、この1つの文字が属するグループ内の全ての文字コードをこの指示に従って変更するが開示されている。
【0003】
また、特許文献2には、OCR認識結果の文字列が同じ画像の分類を行い、文字列に対応する画像の領域を重ね合わせて合成を行い、分類軸の文字列と合成画像の文字列の比較を行い、合成した画像すべてに対して一括で修正処理を行う文書処理装置OCR認識結果の文字列が同じ画像の分類を行い、文字列に対応する画像の領域を重ね合わせて合成を行い、分類軸の文字列と合成画像の文字列の比較を行い、合成した画像すべてに対して一括で修正処理を行うが開示されている。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2006-178543
【文献】特開2012-146147
【発明の概要】
【発明が解決しようとする課題】
【0005】
OCR処理結果の確認又は修正を効率化するOCR処理装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明に係るOCR処理装置は、入力項目に入力された文字列を特定するOCR処理部と、前記OCR処理部により特定された複数の文字列を、複数のグループに分類するグループ化部と、前記グループ化部により分類された複数の文字列を、グループ毎に区別して表示する表示部とを有する。
【0007】
好適には、前記グループ化部は、同一の入力項目に関して、前記OCR処理部により特定された文字列を、文字列の類似度に基づいてグループ化する。
【0008】
好適には、ユーザの操作に応じて、前記グループ化部により分類された複数の文字列に対して、確定した文字列を指定する文字列確定部をさらに有する。
【0009】
好適には、前記表示部は、前記グループ化部により同一グループに分類された複数の文字列について、同じ文字列の数に応じて、表示態様を変える。
【0010】
好適には、前記表示部は、前記グループ化部により同一グループに分類された複数の文字列について、最多の同一文字列を、他の文字列よりも強調して表示する。
【0011】
好適には、前記グループ化部は、予め登録された登録文字列と一致する文字列を、グループに分類する辞書グループ化部と、前記辞書グループ化部によりいずれの登録文字列とも不一致であると判定された文字列について、互いの類似度に基づいて分類する類似グループ化部とを含み、前記表示部は、前記辞書グループ化部により分類された文字列、又は、前記類似グループ化部により分類された文字列を、グループ毎に区別して表示する。
【0012】
好適には、前記グループ化部は、未記入であると判定された入力項目をグループ化する未記入グループ化部と、前記未記入グループ化部により未記入であると判定されなかった入力項目について、予め登録された登録文字列と一致する文字列を、グループに分類する辞書グループ化部と、前記辞書グループ化部によりいずれの登録文字列とも不一致であると判定された文字列について、互いの類似度に基づいて分類する類似グループ化部とを含み、前記表示部は、前記辞書グループ化部により分類された文字列、又は、前記類似グループ化部により分類された文字列を、グループ毎に区別して表示する。
【0013】
好適には、前記グループ化部により分類されたグループ間で、文字列を移動させる操作を受け付けるグループ移動部と、前記グループ移動部により移動させた文字列について、移動先のグループに関して前記文字列確定部により確定された確定文字列を適用する移動確定部とをさらに有する。
【0014】
好適には、前記グループ化部により分類されたグループを一覧表示し、各グループに対する確認作業が完了したか否かを示す表示を付すグループ表示部をさらに有する。
【0015】
また、本発明に係るOCR処理方法は、コンピュータが、入力項目に入力された文字列を特定するOCR処理ステップと、コンピュータが、前記OCR処理ステップにより特定された複数の文字列を、複数のグループに分類するグループ化ステップと、コンピュータが、前記グループ化ステップにより分類された複数の文字列を、グループ毎に区別して表示する表示ステップとを有する。
【0016】
また、本発明に係るプログラムは、入力項目に入力された文字列を特定するOCR処理ステップと、前記OCR処理ステップにより特定された複数の文字列を、複数のグループに分類するグループ化ステップと、前記グループ化ステップにより分類された複数の文字列を、グループ毎に区別して表示する表示ステップとをコンピュータに実行させる。
【発明の効果】
【0017】
OCR処理結果の確認又は修正を効率化できる。
【図面の簡単な説明】
【0018】
図1】OCR処理システム1の全体構成を例示する図である。
図2】OCR処理システム1における確認修正作業を説明する図である。
図3】OCR処理装置2のハードウェア構成を例示する図である。
図4】OCR処理装置2の機能構成を例示する図である。
図5】OCR処理装置2によるOCR処理(S10)を説明するフローチャートである。
図6】OCR処理装置2による文字列移動処理(S20)を説明するフローチャートである。
図7】OCR処理結果を確認修正するための表示画面を例示する図である。
図8】OCR処理結果をグループ間で移動させた場合の表示画面例である。
図9】OCR処理結果を確定済みのグループに移動させた場合の表示画面例である。
図10】(A)は、辞書グループ化部314によるグループ化処理をより詳細に説明し、(B)は、類似グループ化部316によるグループ化処理をより詳細に説明する図である。
【発明を実施するための形態】
【0019】
本発明の実施形態を、図面を参照して説明する。
図1は、OCR処理システム1の全体構成を例示する図である。
図1に例示するように、OCR処理システム1は、OCR処理装置2と、スキャナ装置4とを含み、ネットワーク7を介して互いに接続している。複数のスキャナ装置4A及びスキャナ装置4Bを併せてスキャナ装置4と称する。なお、OCR処理装置2は、USBケーブルなどを介して直接スキャナ装置4と有線接続してもよい。
OCR処理装置2は、コンピュータ端末であり、スキャナ装置4から受信した画像データに対し、OCR処理を行い、OCR処理結果をユーザに確認又は修正させる。本例のOCR処理装置2は、スキャナ装置4から受信した帳票の画像データに対し、OCR処理を行い、帳票の各入力項目について文字列を特定し、ユーザに確認作業及び修正作業を行わせる。
【0020】
スキャナ装置4は、光学式の読取装置であり、原稿から取得した画像データをOCR処理装置2に送信する。本例において、スキャナ装置4は、帳票をスキャンするものとする。
【0021】
図2は、OCR処理システム1における確認修正作業を説明する図である。
図2(A)に例示するように、スキャンされた帳票毎に、OCR処理結果を確認する方法がある(比較例)。この場合、帳票全体の入力項目の整合性を確認しやすい。
また、図2(B)に例示するように、入力項目(本例では「会社名」)毎に、OCR処理結果を集約し、まとめて確認する方法がある(比較例)。この場合、同一の入力項目に関してまとめて確認できるため、OCR処理結果の誤りに気付きやすい。
しかしながら、上記比較例では、いずれもOCR処理結果を全て確認する必要があり、作業効率が悪い。
【0022】
そこで、本例のOCR処理システム1では、図2(C)に例示するように、入力項目毎のOCR処理結果(文字列)を複数のグループに分類し、分類されたグループ毎にOCR処理結果(文字列)を一覧表示し確認する。グループへの分類は、OCR処理結果の類似度(一致及び類似)に基づいている。そのため、グループ内の複数の文字列(互いに類似する文字列)を一括で確認でき、確認作業に要する時間を短縮できる。
また、本例のOCR処理システム1では、図2(C)に例示するように、グループ内のいずれかの文字列(OCR処理結果)を正解として選択すると、グループ内のOCR処理結果が、選択された文字列に一括修正される。これにより、修正作業に要する時間を短縮できる。なお、本願における「文字列」とは、1文字のみである場合や、0文字である場合(未記入)も含む概念である。
【0023】
図3は、OCR処理装置2のハードウェア構成を例示する図である。
図3に例示するように、OCR処理装置2は、CPU200、メモリ202、HDD204、ネットワークインタフェース206(ネットワークIF206)、表示装置208、及び、入力装置210を有し、これらの構成はバス212を介して互いに接続している。
CPU200は、例えば、中央演算装置である。
メモリ202は、例えば、揮発性メモリであり、主記憶装置として機能する。
HDD204は、例えば、ハードディスクドライブ装置であり、不揮発性の記録装置としてコンピュータプログラム(例えば、図4のOCR処理プログラム3)やその他のデータファイルを格納する。
ネットワークIF206は、有線又は無線で通信するためのインタフェースであり、例えば、スキャナ装置4との通信を実現する。
表示装置208は、例えば、液晶ディスプレイである。
入力装置210は、例えば、キーボード及びマウスである。
【0024】
図4は、OCR処理装置2の機能構成を例示する図である。
図4に例示するように、本例のOCR処理装置2には、OCR処理プログラム3がインストールされる。
OCR処理プログラム3は、OCR処理部300、グループ化部310、文字列表示部320、グループ表示部330、文字列確定部340、グループ移動部350、及び移動確定部360を有する。また、グループ化部310は、未記入グループ化部312、辞書グループ化部314、及び類似グループ化部316を含む。
なお、OCR処理プログラム3の一部又は全部は、ASICなどのハードウェアにより実現されてもよく、また、OS(Operating System)の機能を一部借用して実現されてもよい。
【0025】
OCR処理プログラム3において、OCR処理部300は、スキャナ装置4により読み取られた画像データに対して、OCR処理を行い、画像データに含まれている文字列を特定する。本例のOCR処理部300は、帳票のOCR定義情報に従って、帳票の画像データに対してOCR処理を行い、帳票の各入力項目の文字列を特定する。
【0026】
グループ化部310は、OCR処理部300により特定された複数の文字列を、複数のグループに分類する。より具体的には、グループ化部310は、同一の入力項目に関して、OCR処理部300により特定された複数の文字列を、文字列の類似度に基づいて複数のグループに分類する。本例のグループ化部310は、複数段のグループ化処理で、互いに異なるロジックにより文字列をグループ化する。すなわち、本例のグループ化部310は、未記入グループ化部312、辞書グループ化部314、及び類似グループ化部316を含む。
【0027】
未記入グループ化部312は、同一の入力項目に関して、未記入であるものをグループ化する。ここで、未記入であると判定されるものは、例えば、OCR処理部300により文字列が特定できなかった入力項目に加えて、OCR処理部300により特定された文字列の文字数が基準未満であった入力項目も含む。
【0028】
辞書グループ化部314は、未記入グループ化部312により未記入であると判定されなかった入力項目について、予め登録された登録文字列と一致する文字列を、グループに分類する。例えば、辞書グループ化部314は、辞書に予め登録された登録文字列と一致する文字列を、登録文字列それぞれに対応するグループに分類する。
【0029】
類似グループ化部316は、辞書グループ化部314によりいずれの登録文字列とも不一致であると判定された文字列について、互いの類似度に基づいて分類する。例えば、類似グループ化部316は、辞書グループ化部314によりいずれの登録文字列とも不一致であると判定された文字列について、レーベンシュタイン距離を算出し、レーベンシュタイン距離が一定距離以内である複数の文字列を、同一のグループに分類する。本例の類似グループ化部316は、レーベンシュタイン距離が一定距離以内である文字列が既定数以上(例えば、30%以上)存在する場合に、これら複数の文字列を、同一のグループに分類する。
【0030】
文字列表示部320は、本発明に係る表示部の一例であり、グループ化部310により分類された複数の文字列を、グループ毎に区別して表示する。本例の文字列表示部320は、図7に例示するように、ユーザが選択したグループに分類された文字列を文字列一覧表示領域920に一覧表示する。一覧表示される文字列(OCR処理結果)の近傍には、帳票から切り出した入力項目画像が表示される。
また、文字列表示部320は、グループ化部310により同一グループに分類された複数の文字列について、同じ文字列の数に応じて、表示態様を変える。本例の文字列表示部320は、図2(C)に例示するように、グループ化部310により同一グループに分類された複数の文字列について、最多の同一文字列を青枠で囲み、他の文字列よりも強調して表示する。
【0031】
グループ表示部330は、グループ化部310により分類されたグループを一覧表示し、各グループに対するユーザの確認作業が完了したか否かを示す表示を付す。本例のグループ表示部330は、図7に例示するように、グループ化部310により分類されたグループ名をグループ一覧表示領域900に一覧表示し、グループ名に関連付けて、各グループに対する確認作業が完了したことを示す確認済みアイコン、又は、各グループに対する確認作業が完了していないことを示す未確定アイコンを配置する。
【0032】
文字列確定部340は、ユーザの操作に応じて、グループ化部310により分類された複数の文字列に対して、確定した文字列を一括指定する。本例の文字列確定部340は、図7の文字列一覧表示領域920において、ユーザがいずれかの文字列(OCR処理結果)をクリックすると、クリックされた文字列を、このグループに属する全ての文字列に適用する。これにより、グループに対する修正作業が一括で完了する。
【0033】
グループ移動部350は、グループ化部310により分類されたグループ間で、文字列(OCR処理結果)を移動させる操作を受け付ける。本例のグループ移動部350は、図8に例示するように、移動させたい文字列(OCR処理結果)を文字列一覧表示領域920で選択し、グループ一覧表示領域900に表示されたグループ名にドラッグすると、ドラッグ先のグループ名に対応するグループに、選択された文字列を移動させる。
【0034】
移動確定部360は、グループ移動部350により移動させた文字列について、移動先のグループに関して文字列確定部340により確定された確定文字列を適用する。本例の移動確定部360は、図9に例示するように、文字列一覧表示領域920の文字列を、確定済みアイコンが付されたグループにドラッグ&ドロップすると、このグループで確定された文字列(値)が、ドラッグされた文字列(OCR処理結果)に適用される。
【0035】
図5は、OCR処理装置2によるOCR処理(S10)を説明するフローチャートである。なお、本例では、複数の帳票がスキャナ装置4によりスキャンされ、これらの画像データがOCR処理装置2に送信されていることを前提とする。
図5に例示するように、ステップ100(S100)において、OCR処理装置2のOCR処理部300(図4)は、スキャナ装置4から受信した複数の帳票画像データに対して、OCR定義情報に従ってOCR処理を行い、各入力項目の文字列を特定する。
【0036】
ステップ105(S105)において、グループ化部310の未記入グループ化部312は、処理対象の入力項目に関して、未記入であるものをグループ化する。
ステップ110(S110)において、辞書グループ化部314は、処理対象の入力項目の未分類文字列に関して、辞書に予め登録された登録文字列と一致する文字列を、登録文字列それぞれに対応するグループに分類する。なお、S110は、S105でグループ化されなかったものだけを処理対象とする。
ステップ115(S115)において、類似グループ化部316は、処理対象の入力項目の未分類文字列に関して、レーベンシュタイン距離を算出し、算出されたレーベンシュタイン距離が一定距離以内である複数の文字列を、同一のグループに分類する。なお、S115は、S105及びS110でグループ化されなかったものだけを処理対象とする。また、類似グループ化部316でも分類されなかった文字列は、最終的に、未分類グループに分類される。
【0037】
ステップ120(S120)において、グループ化部310は、全ての入力項目についてグループ化処理を完了したか否かを判定し、完了していない入力項目が存在する場合には、次の入力項目を処理対象としてS105の処理に戻り、全ての入力項目が完了した場合に、S125の処理に移行する。
【0038】
ステップ125(S125)において、グループ表示部330は、図7に例示するように、グループ一覧表示領域900に、グループ化部310により分類されたグループのグループ名を一覧表示し、ユーザによる選択操作を促す。
文字列表示部320は、図7に例示するように、グループ一覧表示領域900においてユーザがいずれかのグループ名を選択すると、選択されたグループに分類された文字列(OCR処理結果)と、帳票画像から切り出された文字列画像とを文字列一覧表示領域920に一覧表示する。
【0039】
ステップ130(S130)において、文字列表示部320は、文字列一覧表示領域920に表示された文字列のうち、最多の文字列(OCR処理結果)を最多文字列として強調表示する。
【0040】
ステップ135(S135)において、文字列確定部340は、図7に例示するように、文字列一覧表示領域920において、表示されたいずれかの文字列(OCR処理結果)がクリックされると、このグループに分類された全ての文字列を、クリックされた文字列に変更し、確定させる。
ステップ140(S140)において、グループ表示部330は、文字列確定部340により文字列(OCR処理結果)の確定処理が行われると、図7のグループ一覧表示領域900において、このグループのアイコンを未確定アイコンから確定済みアイコンに変更する。
【0041】
ステップ145(S145)において、OCR処理プログラム3は、未確定のグループが存在する場合に、S125の処理に戻り、全てのグループが確定した場合に、OCR処理結果の確認作業を完了し、OCR処理(S10)を終了させる。
【0042】
図6は、OCR処理装置2による文字列移動処理(S20)を説明するフローチャートである。なお、文字列移動処理(S20)は、図5のS125~S140の処理と並行して実施される。
ステップ200(S200)において、グループ移動部350は、図8に例示するように、文字列一覧表示領域920に表示された文字列のいずれかが、グループ一覧表示領域900の他のグループのグループ名にドラッグ&ドロップされるまで待機し(S200:No)、いずれかの文字列が他のグループのグループ名にドラッグ&ドロップされると、S205の処理に移行する(S200:Yes)。
【0043】
ステップ205(S205)において、グループ移動部350は、図8に例示するように、ドラッグ&ドロップされた文字列を、ドロップされたグループ名のグループに移動させる。つまり、グループ化部310による分類がユーザにより修正される。
【0044】
ステップ210(S210)において、移動確定部360は、グループ移動部350により移動した文字列の移動先が、文字列確定部340により文字列が確定されたグループであるか未確定のグループであるかを判定し、確定済みのグループである場合に、S215の処理に移行し、未確定のグループである場合に、S220の処理に移行する。
ステップ215(S215)において、移動確定部360は、文字列の移動先が確定済みグループである場合、図9に例示するように、移動させた文字列に対して、移動先のグループで確定された文字列を自動的に適用する。
ステップ220(S220)において、移動確定部360は、文字列の移動先が未確定グループである場合、図8に例示するように、移動させた文字列を確定させず、そのまま文字列一覧表示領域920に表示する。
【0045】
図10(A)は、辞書グループ化部314によるグループ化処理をより詳細に説明し、(B)は、類似グループ化部316によるグループ化処理をより詳細に説明する図である。
図10(A)に例示するように、OCR処理結果は、一般的に、1文字ごとに複数の候補を持ち、それぞれが信頼度を持つような構造となっている(図中のOCR処理結果 1位~3位を参照)。そこで、辞書グループ化部314は、図10(A)に示すように、OCR処理結果(全候補の組み合わせ)を、辞書に登録されている単語と比較し、該当する単語があれば、対象の単語と同一の値としてグループ化する。すべての単語と比較した上で、複数該当する場合は、各文字の順位を点数にし、点数が一番小さいものを採用する。
【0046】
図10(B)に例示するように、類似グループ化部316は、OCR処理結果(文字列)の全通りの組合せについて、レーベンシュタイン距離を測定し、一定以下の値となったものをグループとして扱う。レーベンシュタイン距離とは、2つの文字列がどの程度異なるかを示す距離であり、値が小さい程似ているものとなる。ただし、全通り(順列)でのグループ化であるため、複数グループに所属する可能性がある。複数グループに所属する場合、一番距離が小さいグループに所属するものとする。最終的に一つでもグループに属しているものを、グループ化の結果とする。図10(B)の例では、レーベンシュタイン距離が最小値1となったものが採用される(背景がグレーのセル)。最小値が複数出現する場合、並び順(No.1の昇順)でどちらかに絞られる。最終的に、最小値1の出現回数が多いもの(太枠で囲ったNo.1とNo.4)がグループとなる。
【0047】
以上説明したように、本実施形態のOCR処理システム1によれば、OCR処理結果を類似度に基づいてグループ化し、グループ単位で確認作業及び修正作業を行うことができるため、確認作業及び修正作業に要する時間や労力を抑制できる。
【符号の説明】
【0048】
1…OCR処理システム
2…OCR処理装置
3…OCR処理プログラム
300…OCR処理部
310…グループ化部
320…文字列表示部
330…グループ表示部
340…文字列確定部
350…グループ移動部
360…移動確定部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10