(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024167725
(43)【公開日】2024-12-04
(54)【発明の名称】文字認識結果判定装置、文字認識結果判定方法、文字認識結果判定プログラム、および、文字認識システム
(51)【国際特許分類】
G06V 30/12 20220101AFI20241127BHJP
【FI】
G06V30/12 C
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2023083984
(22)【出願日】2023-05-22
(71)【出願人】
【識別番号】000001270
【氏名又は名称】コニカミノルタ株式会社
(74)【代理人】
【識別番号】110001807
【氏名又は名称】弁理士法人磯野国際特許商標事務所
(72)【発明者】
【氏名】近藤 敦士
【テーマコード(参考)】
5B064
【Fターム(参考)】
5B064AA01
5B064AB02
5B064AB12
5B064BA01
5B064DA03
5B064EA30
(57)【要約】
【課題】対象項目のOCR結果の読取精度が悪い場合でも、他のOCR結果を用いて読取精度を向上させる。
【解決手段】文字認識結果判定装置10は、関連する3つ以上の項目のOCR結果を取得する文字認識結果取得部111と、3つ以上の項目の内何れか1つの対象項目に関連する他の項目のOCR結果を用いて、検索データベース30を参照することにより、対象項目の突合データを抽出する突合データ抽出部112と、対象項目のOCR結果と、他の項目から得られた突合データそれぞれとを比較し、同一値となった数が全体のうち所定の割合を超えているか否かを判定する信頼性判定部113と、を備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
関連する3つ以上の項目のOCR結果を取得する文字認識結果取得部と、
前記3つ以上の項目の内何れか1つの対象項目に関連する他の項目のOCR結果を用いて、各前記項目の値同士が対応付けられて格納される検索データベースを参照することにより、前記対象項目の突合データを抽出する突合データ抽出部と、
前記対象項目のOCR結果と、前記他の項目から得られた突合データそれぞれとを比較し、同一値となった数が全体のうち所定の割合を超えているか否かを判定する信頼性判定部と、
を備える文字認識結果判定装置。
【請求項2】
前記信頼性判定部は、複数の前記突合データが前記同一値であって、前記所定の割合を超えており、かつ、前記対象項目のOCR結果が前記同一値と異なる場合に、前記対象項目のOCR結果を前記突合データの前記同一値に修正する
請求項1に記載の文字認識結果判定装置。
【請求項3】
前記信頼性判定部が、前記対象項目のOCR結果と、複数の前記突合データとを比較し、前記所定の割合を超える同一値がない場合、判定不能である旨の情報を出力する通知部をさらに備える
請求項1に記載の文字認識結果判定装置。
【請求項4】
関連する3つ以上の項目のOCR結果を取得する文字認識結果取得工程と、
前記3つ以上の項目の内何れか1つの対象項目に関連する他の項目のOCR結果を用いて、各前記項目の値同士が対応付けられて格納される検索データベースを参照することにより、前記対象項目の突合データを抽出する突合データ抽出工程と、
前記対象項目のOCR結果と、前記他の項目から得られた突合データそれぞれとを比較し、同一値となった数が全体のうち所定の割合を超えているか否かを判定する信頼性判定工程と、
を実行する文字認識結果判定装置の文字認識結果判定方法。
【請求項5】
コンピュータに、
関連する3つ以上の項目のOCR結果を取得する手順、
前記3つ以上の項目の内何れか1つの対象項目に関連する他の項目のOCR結果を用いて、各前記項目の値同士が対応付けられて格納される検索データベースを参照することにより、前記対象項目の突合データを抽出する手順、
前記対象項目のOCR結果と、前記他の項目から得られた突合データそれぞれとを比較し、同一値となった数が全体のうち所定の割合を超えているか否かを判定する手順、
を実行させるための文字認識結果判定プログラム。
【請求項6】
文字認識機能を有する文字認識装置と、前記文字認識機能の信頼性を判定する文字認識結果判定装置とを備える文字認識システムであって、
前記文字認識結果判定装置は、
前記文字認識装置から、関連する3つ以上の項目のOCR結果を取得する文字認識結果取得部と、
前記3つ以上の項目の内何れか1つの対象項目に関連する他の項目のOCR結果を用いて、各前記項目の値同士が対応付けられて格納される検索データベースを参照することにより、前記対象項目の突合データを抽出する突合データ抽出部と、
前記対象項目のOCR結果と、前記他の項目から得られた突合データそれぞれとを比較し、同一値となった数が全体のうち所定の割合を超えているか否かを判定する信頼性判定部と、
を備える文字認識システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文字認識結果判定装置、文字認識結果判定方法、文字認識結果判定プログラム、および、文字認識システムに関する。
【背景技術】
【0002】
紙面を写した画像などを解析して、その中に含まれる文字に相当するパターンを検出し、書かれている内容を文字データとして認識するOCR(Optical Character Recognition)等の文字認識が普及している。
このOCRの精度を向上する手段の一つとして、正しい情報が記録された辞書データと突合し、OCR結果と不一致の場合は、辞書データの値でOCR結果を修正する手法がある。
【0003】
例えば、特許文献1に記載の技術では、OCRにより読み取った住所の情報について辞書データを検索してデータの照合を行うとともに、住所以外の他のOCR結果である、電話番号や郵便番号を用いて辞書データから住所を検索し、OCRにより読み取った住所と照合することにより、住所の読取精度を向上させる技術が開示されている。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1に記載の技術は、照合(突合)の結果として、一致した文字数の割合に基づき、OCR結果を突合データで修正するか否かの判断を行うものであり、その際、対象のOCR結果の一部を修正することが前提となる。そのため、対象項目のOCR結果の読取精度が悪すぎると突合データが正しく取得できても、一致率が悪く修正できないという問題がある。
【0006】
本発明は、このような事情に鑑みてなされたものであり、対象項目のOCR結果の読取精度が悪い場合でも、他のOCR結果を用いて読取精度を向上させることを課題とする。
【課題を解決するための手段】
【0007】
本発明の上記課題は、下記の構成により解決される。
【0008】
(1)文字認識結果判定装置であって、関連する3つ以上の項目のOCR結果を取得する文字認識結果取得部と、前記3つ以上の項目の内何れか1つの対象項目に関連する他の項目のOCR結果を用いて、各前記項目の値同士が対応付けられて格納される検索データベースを参照することにより、前記対象項目の突合データを抽出する突合データ抽出部と、前記対象項目のOCR結果と、前記他の項目から得られた突合データそれぞれとを比較し、同一値となった数が全体のうち所定の割合を超えているか否かを判定する信頼性判定部と、を備える文字認識結果判定装置。
【0009】
(2)前記信頼性判定部は、複数の前記突合データが前記同一値であって、前記所定の割合を超えており、かつ、前記対象項目のOCR結果が前記同一値と異なる場合に、前記対象項目のOCR結果を前記突合データの前記同一値に修正する、上記(1)に記載の文字認識結果判定装置。
【0010】
(3)前記信頼性判定部が、前記対象項目のOCR結果と、複数の前記突合データとを比較し、前記所定の割合を超える同一値がない場合、判定不能である旨の情報を出力する通知部をさらに備える、上記(1)に記載の文字認識結果判定装置。
【0011】
(4)文字認識結果判定方法であって、関連する3つ以上の項目のOCR結果を取得する文字認識結果取得工程と、前記3つ以上の項目の内何れか1つの対象項目に関連する他の項目のOCR結果を用いて、各前記項目の値同士が対応付けられて格納される検索データベースを参照することにより、前記対象項目の突合データを抽出する突合データ抽出工程と、前記対象項目のOCR結果と、前記他の項目から得られた突合データそれぞれとを比較し、同一値となった数が全体のうち所定の割合を超えているか否かを判定する信頼性判定工程と、を実行する文字認識結果判定装置の文字認識結果判定方法。
【0012】
(5)文字認識結果判定プログラムであって、コンピュータに、関連する3つ以上の項目のOCR結果を取得する手順、前記3つ以上の項目の内何れか1つの対象項目に関連する他の項目のOCR結果を用いて、各前記項目の値同士が対応付けられて格納される検索データベースを参照することにより、前記対象項目の突合データを抽出する手順、前記対象項目のOCR結果と、前記他の項目から得られた突合データそれぞれとを比較し、同一値となった数が全体のうち所定の割合を超えているか否かを判定する手順、を実行させるための文字認識結果判定プログラム。
【0013】
(6)文字認識機能を有する文字認識装置と、前記文字認識機能の信頼性を判定する文字認識結果判定装置とを備える文字認識システムであって、前記文字認識結果判定装置は、前記文字認識装置から、関連する3つ以上の項目のOCR結果を取得する文字認識結果取得部と、前記3つ以上の項目の内何れか1つの対象項目に関連する他の項目のOCR結果を用いて、各前記項目の値同士が対応付けられて格納される検索データベースを参照することにより、前記対象項目の突合データを抽出する突合データ抽出部と、前記対象項目のOCR結果と、前記他の項目から得られた突合データそれぞれとを比較し、同一値となった数が全体のうち所定の割合を超えているか否かを判定する信頼性判定部と、を備える文字認識システム。
【発明の効果】
【0014】
本発明によれば、対象項目のOCR結果の読取精度が悪い場合でも、他のOCR結果を用いて読取精度を向上させることができる。
【図面の簡単な説明】
【0015】
【
図1】本実施形態に係る文字認識結果判定装置を含む文字認識システムの構成を示す機能ブロック図である。
【
図2】探索データベースから突合データを抽出する処理を説明するための図である。
【
図3】本実施形態に係る信頼性判定部による文字認識の信頼性に関する判定結果を説明するための図である。
【
図4】ある1つの対象項目のOCR結果と2つの突合データの3つが一致した場合(ケース1)の例を示す図である。
【
図5】ある1つの対象項目のOCR結果と1つの突合データとが一致した場合(ケース2)の例を示す図である。
【
図6】ある1つの対象項目のOCR結果以外の2つの突合データが一致した場合(ケース3)の例を示す図である。
【
図7】ある1つの対象項目のOCR結果と、2つの突合データのそれぞれが不一致の場合(ケース4)の例を示す図である。
【
図8】本実施形態に係る文字認識結果判定装置が実行する処理の流れを示すフローチャートである。
【発明を実施するための形態】
【0016】
以下、本発明の実施形態(以下、「本実施形態」と称する。)を、図面を参照して説明する。但し、本明細書の全図において機能が対応する構成部分には同一符号を付し、その説明を適宜省略する。
【0017】
図1は、本実施形態に係る文字認識結果判定装置10を含む文字認識システム1の構成を示す機能ブロック図である。
文字認識システム1は、文字認識装置20と、この文字認識装置20に通信接続される文字認識結果判定装置10とを備える。文字認識結果判定装置10は、不図示のプロセッサと、記憶部13を備えたコンピュータであり、不図示の文字認識結果判定プログラムを実行することで各機能部を具現化する。この文字認識結果判定装置10は、図示を省略したネットワーク等を介して検索データベース(DB)30に通信接続される。
【0018】
文字認識装置20は、手書きや印刷された文字を、イメージスキャナ等で読みとり、画像データのテキスト部分を認識し、文字データに変換するOCR機能を備える装置である。
また、AI-OCRを用いることで、単に文字を認識するだけでなく、AI(人工知能)により、読取位置や項目を自動抽出する機能を文字認識装置20が備えているものとする。
【0019】
文字認識結果判定装置10は、文字認識装置20から、互いに関連する3つ以上の項目に関するOCR結果の情報(以下、「OCR結果」または「OCR結果情報」と称する。)を取得する。そして、文字認識結果判定装置10は、対象とする項目(対象項目)のOCR結果に対して、その項目に関連する2つ以上の他のOCR結果をキーとして、各種データベース(検索データベース)の検索を行い、ヒットした値を突合データとして抽出する。そして、文字認識結果判定装置10は、OCR結果と複数の突合データとを比較し、OCR結果および突合データの中で、同一値となった数が全体(項目数)のうち所定の割合を超えた場合に信頼性が高いと判定し、所定の割合以下である場合に、OCR結果の信頼性が低いと判定する。文字認識結果判定装置10は、所定の割合を超えた場合において、対象項目のOCR結果が、当該同一値と異なる場合には、そのOCR結果を当該同一値で置き換える(修正する)(詳細は後記)。これにより、文字認識結果判定装置10は、文字認識の読取精度を向上させることができる。
【0020】
この文字認識結果判定装置10は、
図1で示すように、制御部11と、入出力部12と、記憶部13とを備える。
【0021】
入出力部12は、他の装置(文字認識装置20や、検索データベース30等)との間の情報について入出力を行う。この入出力部12は、通信回線を介して情報の送受信を行う通信インタフェースと、不図示のキーボード等の入力装置やモニタ等の出力装置との間で情報の入出力を行う入出力インタフェースとから構成される。
【0022】
記憶部13は、ハードディスクやフラッシュメモリ、RAM(Random Access Memory)等により構成される。
この記憶部13には、制御部11の各機能部を実行させるためのプログラム(文字認識結果判定プログラム)や、制御部22の処理に必要な情報(例えば、突合データ等)が一時的に記憶される。
【0023】
制御部11は、文字認識結果判定装置10が実行する処理の全般を司り、文字認識結果取得部111と、突合データ抽出部112と、信頼性判定部113と、通知部114とを含んで構成される。
【0024】
文字認識結果取得部111は、文字認識装置20から、OCR結果情報を取得する。
なお、本実施形態において、文字認識装置20のOCR機能により読み取る情報の例は、請求書に記載される会社名関連の情報である、会社名、住所、電話番号の3つの項目である。この3つ以外でも、法人番号や社長名が含まれていてもよい。また、請求書の文字認識に限定されず、各種報告書の担当者名、社員番号、内線番号、メールアドレス等の項目であってもよい。また、会社名、電話番号、会社のURL(Uniform Resource Locator)等の項目であってもよい。
文字認識結果取得部111は、文字認識装置20のAI-OCR機能により得られた3つの項目(会社名、住所、電話番号)のOCR結果情報を取得する。
【0025】
突合データ抽出部112は、ある対象項目(例えば、「会社名」)について、その対象項目に関連する2つ以上の他の項目のOCR結果(ここでは、「住所」「電話番号」のOCR結果)をキーとして検索データベース30の検索を行い、ヒットした値(会社名)を突合データとして抽出する。
なお、3つ以上の項目のうち、文字認識の信頼性を判定するために選択される1つの項目を「対象項目」とし、対象項目以外を、他の項目として説明する。
【0026】
ここで、検索データベース(DB)30は、互いに関連のある3つ以上の項目のうち、少なくとも2つ以上の項目の値を関連付けて登録しているデータベースである。
この検索データベース30は、例えば、「会社名」と「電話番号」とを相互に関連付けている電話番号検索データベースや、「会社名」と「住所」とを相互に関連付けている住所検索データベースである。
突合データ抽出部112は、インターネット等を介して、WEBやクラウド上に存在する、これらの電話番号検索データベースや、住所検索データベースにアクセスすることにより、突合データを取得する。
なお、この検索データベース30を、文字認識結果判定装置10内の記憶部13に備えてもよい。また、検索データベース30を備えるようにした装置に文字認識結果判定装置10が外部接続され、突合データ抽出部112が突合データを取得するようにしてもよい。
【0027】
図2は、検索データベース30から突合データを抽出する処理を説明するための図である。
ここでは、OCR結果として、
図2の網掛け部分で示すように、「会社名」(符号K1)、「住所」(符号J1)、「電話番号」(符号D1)の情報を取得した例を示している。
【0028】
<会社名の突合データの抽出>
対象項目として「会社名」の突合データを抽出する場合について説明する。
突合データ抽出部112は、「会社名」と関連する対象項目である「住所」に関するOCR結果(符号J1)をキーとして、住所検索データベースを検索し、ヒットした情報を「会社名」の突合データ(符号TK1)として抽出する。
【0029】
また、突合データ抽出部112は、「会社名」と関連する対象項目である「電話番号」に関するOCR結果(符号D1)をキーとして、電話番号検索データベースを検索し、ヒットした情報を「会社名」の突合データ(符号TK2)として抽出する。
【0030】
<住所の突合データの抽出>
対象項目として「住所」の突合データを抽出する場合について説明する。
突合データ抽出部112は、「住所」と関連する対象項目である「会社名」に関するOCR結果(符号K1)をキーとして、住所検索データベースを検索し、ヒットした情報を「住所」の突合データ(符号TJ1)として抽出する。
【0031】
また、突合データ抽出部112は、「住所」と関連する対象項目である「電話番号」に関するOCR結果(符号D1)をキーとして、電話番号検索データベースを検索し、ヒットした情報を「住所」の突合データ(符号TJ2)として抽出する。
【0032】
<電話番号の突合データの抽出>
対象項目として「電話番号」の突合データを抽出する場合について説明する。
突合データ抽出部112は、「電話番号」と関連する対象項目である「会社名」に関するOCR結果(符号K1)をキーとして、電話番号検索データベースを検索し、ヒットした情報を「電話番号」の突合データ(符号TD1)として抽出する。
【0033】
また、突合データ抽出部112は、「電話番号」と関連する対象項目である「住所」について、「電話番号」から直接「住所」を検索できるデータベースがないため、まず、「住所」に関するOCR結果(符号J1)をキーとして、住所検索データベースを検索し、「会社名」の検索結果を取得する。そして、突合データ抽出部112は、その検索結果である「会社名」をキーとして、電話番号検索データベースを検索し、ヒットした情報を「電話番号」の突合データ(符号TD2)として抽出する。
【0034】
図1に戻り、信頼性判定部113は、対象項目のOCR結果と他の項目から得られた突合データそれぞれとを比較し、同一値となった数が全体(項目数)のうち所定の割合を超えているか否かを判定する。ここで、信頼性判定部113は、OCR結果と突合データとの間で、所定の割合を超えて一致した場合にOCR結果の信頼性が高いと判定し、所定の割合以下である場合に、OCR結果の信頼性が低いと判定する。
【0035】
信頼性判定部113が、3つの項目(例えば、「会社名」「住所」「電話番号」)についてOCR結果情報を取得した場合の判定例を説明する。ここでは、信頼性判定部113が、「所定の割合」として、OCR結果と突合データとの間で過半数が一致した場合を信頼性が高いとし、過半数が一致しない場合を信頼性が低いと判定するものとする。
【0036】
図3は、信頼性判定部113による文字認識の信頼性に関する判定結果を場合分けして説明する図である。
(ケース1)
ある1つの対象項目のOCR結果と2つの突合データの3つが一致した場合(3つとも一致)、このOCR結果は、信頼性が高いと判定する。つまり、OCR結果は正しいものであり修正不要と判定する。
【0037】
(ケース2)
ある1つの対象項目のOCR結果と1つの突合データとが一致した場合(OCR結果を含めた2つが一致)、OCR結果と突合データとの間で過半数が一致しているので、このOCR結果は、信頼性が高いと判定する。つまり、OCR結果は正しいものであり修正不要と判定する。
【0038】
(ケース3)
ある1つの対象項目のOCR結果以外の2つの突合データが一致した場合(OCR結果以外の2つが一致)、OCR結果が間違っていると判定し、2つの突合データが一致した値にOCR結果を修正する。
【0039】
(ケース4)
ある1つの対象項目のOCR結果と、2つの突合データのそれぞれが不一致の場合(3つとも不一致)、この場合、どの情報が正しいのか判定不能である。信頼性判定部113は、判定不能である旨の情報を通知部114へ出力する。
【0040】
信頼性判定部113は、上記のように、ある対象項目のOCR結果と、他の対象項目のOCR結果から抽出した突合データとの間で、同一値となった数が全体(項目数)のうち所定の割合を超えているか否かを判定する。そして、信頼性判定部113は、所定の割合を超えて一致した場合に全体としてOCR結果の信頼性が高いと判定し、所定の割合以下である場合には、全体としてOCR結果の信頼性が低いと判定する。
所定の割合は、過半数としてもよいし、半数以上としてもよいし、6割や7割のように予め設定しておいてもよい。また、文字認識装置20の読取率を過去のデータから算出しておき、読取率が高い場合に、所定の割合(所定の閾値)を高く設定してもよい。
なお、信頼性判定部113は、後記するように、複数の突合データが同一値であって、所定の割合を超えており、かつ、対象項目のOCR結果が異なる値である場合に、対象項目のOCR結果を突合データの当該同一値で置き換える(修正する)処理を実行する。
【0041】
通知部114は、信頼性判定部133の判定結果が、所定の割合以下であり判定不能となった場合に、判定不能である旨の通知を、図示を省略したシステム管理装置等に送信する。このようにすることで、ユーザによる目視の確認を促すことができる。
【0042】
<判定例>
OCR結果と突合データとによる修正の要否の判定例について説明する。ここでは、項目を「会社名」「住所」「電話番号」の3つとし、上記の(ケース1)~(ケース4)の判定例についての具体的に説明する。
なお、以下の
図4~
図7の網掛け部分がOCR結果を示す。また、OCRで読み取ったデータの正解の内容は、「会社名」:コニカミノルタ株式会社、「住所」:東京都千代田区丸の内2丁目7番2号、「電話番号」:03-1234-5678、であるものとする。また、信頼性判定部113は、所定の割合を過半数(半数を超える)として判定するものとする。
文字認識装置20のAI-OCR機能により、原稿の内容記載から「会社名」「住所」「電話番号」が判別され、文字認識結果判定装置10の文字認識結果取得部111が取得し、そのOCR結果情報を記憶部13に格納しているものとする。
また、以下では、「会社名」を対象項目とし、「会社名」のOCR結果について突合データと比較する場合について説明する。「会社名」と関連する「住所」「電話番号」を対象項目する場合も同様に処理する。
【0043】
(ケース1)
図4は、ある1つの対象項目(ここでは、「会社名」)のOCR結果と2つの突合データの3つが一致した場合(ケース1)の例を示す図である。
図4で示すように、「会社名」のOCR結果は、[コニカミノルタ株式会社]である。「住所」のOCR結果は、「東京都千代田区丸の内2丁目7番2号」である。「電話番号」のOCR結果は、「03-1234-5678」である。
【0044】
突合データ抽出部112は、「会社名」と関連する項目である「住所」に関するOCR結果「東京都千代田区丸の内2丁目7番2号」をキーとして、住所検索データベースを検索し、ヒットした値を「会社名」の突合データ[コニカミノルタ株式会社]として抽出する。
【0045】
また、突合データ抽出部112は、「会社名」と関連する項目である「電話番号」に関するOCR結果「03-1234-5678」をキーとして、電話番号検索データベースを検索し、ヒットした値を「会社名」の突合データ[コニカミノルタ株式会社]として抽出する。
【0046】
ここでは、「住所」「電話番号」のOCR結果に誤りはないため、検索結果は正しい値でヒットする。よって、「会社名」はすべて「コニカミノルタ株式会社」で一致し、会社名のOCR結果に修正の必要はなく、正しいと判定される。
【0047】
(ケース2)
図5は、ある1つの対象項目のOCR結果(ここでは、「会社名」)と1つの突合データとが一致した場合(ケース2)の例を示す図である。
図5の網掛け部分で示すように、「会社名」のOCR結果は、[コニカミノルタ株式会社]である。「住所」のOCR結果は、「東京都千代田区丸の内2丁目7番2号」である。「電話番号」のOCR結果は、「03-1234-5676」であり、正しい下4桁「5678」ではなく誤っている。
【0048】
突合データ抽出部112は、「会社名」と関連する項目である「住所」に関するOCR結果「東京都千代田区丸の内2丁目7番2号」をキーとして、住所検索データベースを検索し、ヒットした値を「会社名」の突合データ[コニカミノルタ株式会社]として抽出する。
【0049】
また、突合データ抽出部112は、「会社名」と関連する項目である「電話番号」に関するOCR結果「03-1234-5676」をキーとして、電話番号検索データベースを検索する。しかしながら、「03-1234-5676」の電話番号はOCR結果が誤りであり、電話番号検索データベースにも未登録であったため、「会社名」が抽出されない。
【0050】
このケースでは、「会社名」の値が、OCR結果と、「住所」に基づく突合データの値との2つが一致する。よって、信頼性判定部113は、半数を超えており(過半数であるため)、会社名のOCR結果に修正の必要はなく、正しいと判定する。
【0051】
(ケース3)
図6は、ある1つの対象項目のOCR結果(ここでは、「会社名」)以外の2つの突合データが一致した場合(ケース3)の例を示す図である。
図6の網掛け部分で示すように、「会社名」のOCR結果は、[コミカミノルタ株式会社]であり、正しい「コニカミノルタ」ではなく誤っている。「住所」のOCR結果は、「東京都千代田区丸の内2丁目7番2号」である。「電話番号」のOCR結果は、「03-1234-5678」である。
【0052】
突合データ抽出部112は、「会社名」と関連する項目である「住所」に関するOCR結果「東京都千代田区丸の内2丁目7番2号」をキーとして、住所検索データベースを検索し、ヒットした値を「会社名」の突合データ[コニカミノルタ株式会社]として抽出する。
【0053】
また、突合データ抽出部112は、「会社名」と関連する項目である「電話番号」に関するOCR結果「03-1234-5678」をキーとして、電話番号検索データベースを検索し、ヒットした値を「会社名」の突合データ[コニカミノルタ株式会社]として抽出する。
【0054】
このケースでは、「会社名」の値が、「住所」に基づく突合データの値と、「電話番号」に基づく突合データの値とで一致するが、会社名のOCR結果とは不一致となる。信頼性判定部113は、2つの突合データが一致しており半数を超えているため(過半数であるため)、会社名のOCR結果が誤っていると判定し、OCR結果を突合データの値に修正する。
【0055】
(ケース4)
図7は、ある1つの対象項目のOCR結果と、2つの突合データのそれぞれが不一致の場合(ケース4)の例を示す図である。
図7の網掛け部分で示すように、「会社名」のOCR結果は、[コミカミノルタ株式会社]であり、正しい「コニカミノルタ」ではなく誤っている。「住所」のOCR結果は、「東京都千代田区丸の内2丁目7番2号」である。「電話番号」のOCR結果は、「03-1234-5878」であり、正しい下4桁「5678」ではなく誤っている。
【0056】
突合データ抽出部112は、「会社名」と関連する項目である「住所」に関するOCR結果「東京都千代田区丸の内2丁目7番2号」をキーとして、住所検索データベースを検索し、ヒットした値を「会社名」の突合データ[コニカミノルタ株式会社]として抽出する。
【0057】
また、突合データ抽出部112は、「会社名」と関連する項目である「電話番号」に関するOCR結果「03-1234-5878」をキーとして、電話番号検索データベースを検索し、ヒットした値を「会社名」の突合データ[〇△□株式会社]として抽出する。
【0058】
このケースでは、「会社名」の値において、OCR結果、「住所」に基づく突合データの値、「電話番号」に基づく突合データの値のそれぞれが異なり、どの情報が正しいのか判定不能である。よって、信頼性判定部113は、OCR結果および突合データの信頼性が低く、判定不能である旨を通知部114へ出力する。そして、通知部114が、判定不能である旨の通知を、図示を省略したシステム管理装置等に送信することにより、ユーザによる目視の確認を促す。
【0059】
<処理の流れ>
次に、文字認識結果判定装置10が実行する処理の流れについて説明する。
図8は、本実施形態に係る文字認識結果判定装置10が実行する処置の流れを示すフローチャートである。
【0060】
まず、文字認識結果判定装置10の文字認識結果取得部111は、文字認識装置20から、OCR結果情報を取得する(ステップS1)。
【0061】
続いて、突合データ抽出部112は、ある対象項目(例えば、「会社名」)について、その対象項目に関連する2つ以上の他の項目のOCR結果(例えば、「住所」「電話番号」)をキーとして検索データベース30の検索を行い、ヒットした値(会社名)を突合データとして抽出する(ステップS2)。
【0062】
次に、信頼性判定部113は、対象項目のOCR結果と他の項目から得られた突合データそれぞれとを比較し、同一値となった数が全体(項目数)のうち所定の割合を超えているか否かを判定する(ステップS3)。
【0063】
ここで、信頼性判定部113は、同一値になった数が全体(項目数)のうち所定の割合を超えていない場合には(ステップS3→No)、全体としてOCR結果の信頼性が低く判定不能として、ステップS4へ進む。
ステップS4において、通知部114は、信頼性判定部113から所定の割合以下であり判定不能である旨の情報を受け取ると、判定不能である旨の通知をシステム管理装置等へ出力し、処理を終える。
【0064】
一方、信頼性判定部113は、ステップS3において、同じ値になった数が全体(項目数)のうち所定の割合を超えた場合には(ステップS3→Yes)、全体としてOCR結果の信頼性が高いと判定し、ステップS5へ進む。
ステップS5において、信頼性判定部113は、ステップS3の対象項目のOCR結果と他の項目から得られた突合データそれぞれとの比較において一致した値(同一値)に、OCR結果の値が含まれるか否かを判定する。
そして、信頼性判定部113は、対象項目のOCR結果の値が含まれる場合には(ステップS5→Yes)、対象項目のOCR結果が正しい(信頼性が高い)と判定し(ステップS6)、処理を終える。
一方、信頼性判定部113は、対象項目のOCR結果の値が含まれていない場合には(ステップS5→No)、対象項目のOCR結果が誤っていると判定し、対象項目のOCR結果を、突合データで一致した値(同一値)に置き換えて(ステップS7)、処理を終える。
【0065】
このようにすることで、本実施形態に係る文字認識結果判定装置10は、OCR結果の読取精度の信頼性を判定することができる。そして、文字認識結果判定装置10は、対象項目のOCR結果の読取精度が悪い場合でも、他の項目のOCR結果に基づき正しいデータに修正し、読取精度をより向上させることができる。
【0066】
なお、本発明は、前記した実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲で種々の変更や変形を行うことができる。
【符号の説明】
【0067】
1 文字認識システム
10 文字認識結果判定装置
11 制御部
12 入出力部
13 記憶部
20 文字認識装置
30 検索データベース(DB)
111 文字認識結果取得部
112 突合データ抽出部
113 信頼性判定部
114 通知部