(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024014065
(43)【公開日】2024-02-01
(54)【発明の名称】帳票判定システム、帳票判定装置、及び帳票判定方法
(51)【国際特許分類】
G06V 30/412 20220101AFI20240125BHJP
【FI】
G06V30/412
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2022116633
(22)【出願日】2022-07-21
(71)【出願人】
【識別番号】000102728
【氏名又は名称】株式会社NTTデータグループ
(74)【代理人】
【識別番号】110001634
【氏名又は名称】弁理士法人志賀国際特許事務所
(72)【発明者】
【氏名】石浦 大樹
(72)【発明者】
【氏名】河部 瞭太
【テーマコード(参考)】
5B029
【Fターム(参考)】
5B029AA01
5B029CC18
5B029CC21
(57)【要約】 (修正有)
【課題】帳票の種類を適切に特定する帳票判定システム、帳票判定装置及び帳票判定方法を提供する。
【解決手段】帳票判定システムSYSは、文字認識の対象となる帳票に記載されている文字を認識し、帳票に記載されている文字の文字情報及び位置情報を抽出する文字認識処理部102と、文字認識処理部102により抽出された文字情報から単語を抽出し、抽出した単語をベクトル化した単語ベクトルに変換する文字情報解析部103と、帳票の領域毎に含まれる単語ベクトルに関する情報が帳票の種類毎に定義されている帳票情報と、文字情報解析部により文字情報から抽出された単語の単語ベクトル及び位置情報とに基づいて、文字認識の対象となる帳票の種類を特定する帳票特定部104と、を備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
文字認識の対象となる帳票に記載されている文字を認識し、帳票に記載されている文字の文字情報及び位置情報を抽出する文字認識処理部と、
前記文字認識処理部により抽出された前記文字情報から単語を抽出し、抽出した単語をベクトル化した単語ベクトルに変換する文字情報解析部と、
帳票の領域毎に含まれる単語ベクトルに関する情報が帳票の種類毎に定義されている帳票情報と、前記文字情報解析部により前記文字情報から抽出された単語の前記単語ベクトル及び前記位置情報とに基づいて、前記文字認識の対象となる帳票の種類を特定する帳票特定部と、
を備える帳票判定システム。
【請求項2】
前記帳票情報には、帳票の領域毎の前記単語ベクトルの出現確率が帳票の種類毎に定義されており、
前記文字情報解析部は、前記文字情報から抽出された単語の前記単語ベクトル及び前記位置情報に基づいて、帳票の領域毎の前記単語ベクトルの出現確率を算出し、
前記帳票特定部は、前記文字情報解析部により算出された領域毎の前記単語ベクトルの出現確率と前記帳票情報とに基づいて、前記文字認識の対象となる帳票の種類を特定する、
請求項1に記載の帳票判定システム。
【請求項3】
前記帳票特定部により特定された前記文字認識の対象となる帳票の種類と、前記文字情報解析部により前記文字情報から抽出された単語の前記単語ベクトル及び前記位置情報とに基づいて、前記帳票情報を更新する更新部、
をさらに備える請求項1に記載の帳票判定システム。
【請求項4】
前記帳票特定部により特定された前記文字認識の対象となる帳票の種類と、前記文字情報解析部により算出された領域毎の前記単語ベクトルの出現確率とに基づいて、前記帳票情報を更新する更新部、
をさらに備える請求項2に記載の帳票判定システム。
【請求項5】
文字認識の対象となる帳票に記載されている文字を認識し、帳票に記載されている文字の文字情報及び位置情報を抽出する文字認識処理部と、
前記文字認識処理部により抽出された前記文字情報から単語を抽出し、抽出した単語をベクトル化した単語ベクトルに変換する文字情報解析部と、
帳票の領域毎に含まれる単語ベクトルに関する情報が帳票の種類毎に定義されている帳票情報と、前記文字情報解析部により前記文字情報から抽出された単語の前記単語ベクトル及び前記位置情報とに基づいて、前記文字認識の対象となる帳票の種類を特定する帳票特定部と、
を備える帳票判定装置。
【請求項6】
文字認識処理部が、文字認識の対象となる帳票に記載されている文字を認識し、帳票に記載されている文字の文字情報及び位置情報を抽出するステップと、
文字情報解析部が、前記文字認識処理部により抽出された前記文字情報から単語を抽出し、抽出した単語をベクトル化した単語ベクトルに変換するステップと、
帳票特定部が、帳票の領域毎に含まれる単語ベクトルに関する情報が帳票の種類毎に定義されている帳票情報と、前記文字情報解析部により前記文字情報から抽出された前記単語ベクトル及び前記位置情報とに基づいて、前記文字認識の対象となる帳票の種類を特定するステップと、
を含む帳票判定方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、帳票判定システム、帳票判定装置、及び帳票判定方法に関する。
【背景技術】
【0002】
OCR(Optical Character Recognition)により帳票から文字を認識して抽出する技術があるしかしながら、抽出したい抽出対象の文字が帳票のどこに記載されているかは帳票の種類によって異なるため、OCRの技術のみでは、抽出対象の文字がどれであるかを特定できない場合がある。また、抽出対象の文字が抽出できない場合、帳票に記載されていないのか或いは帳票に記載されているのにOCRで認識できなかったのか区別がつかないことがある。そのため、OCRによる文字認識の精度向上には、帳票の種類を特定することが必要である。
【0003】
例えば、特許文献1には、帳票に含まれる文字の文字情報と位置情報を取得し、取得した文字情報が帳票のどの領域に属するかを確認し、分類済みの帳票の対応する領域の文字情報との一致度に基づいて帳票の種類を分類する技術が開示されている。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、帳票には、フォーマットとして記載されている項目(帳票名など)と、帳票の作成者が記述するもの(記入欄など)とが存在する。特許文献1に開示されている技術のように帳票に含まれる文字の文字情報の一致度により帳票の種類を特定する方法は、フォーマットとして記載されている項目の割合が多い伝票やチェックリストの場合には規定の単語や文が多く含まれているため帳票の種類を特定するのに適している。一方、帳票の作成者が記述するもの(記入欄など)は記述される単語や文を事前に把握することが難しいため、文字情報の一致度により帳票の種類を特定することが困難であった。
【0006】
本発明は、上記した課題に鑑みてなされたもので、帳票の種類を適切に特定することができる帳票判定システム、帳票判定装置、及び帳票判定方法を提供することを目的の一つとする。
【課題を解決するための手段】
【0007】
上述の課題を解決するために、本発明の一態様に係る帳票判定システムは、文字認識の対象となる帳票に記載されている文字を認識し、帳票に記載されている文字の文字情報及び位置情報を抽出する文字認識処理部と、前記文字認識処理部により抽出された前記文字情報から単語を抽出し、抽出した単語をベクトル化した単語ベクトルに変換する文字情報解析部と、帳票の領域毎に含まれる単語ベクトルに関する情報が帳票の種類毎に定義されている帳票情報と、前記文字情報解析部により前記文字情報から抽出された単語の前記単語ベクトル及び前記位置情報とに基づいて、前記文字認識の対象となる帳票の種類を特定する帳票特定部と、を備える。
【0008】
また、本発明の一態様に係る帳票判定装置は、文字認識の対象となる帳票に記載されている文字を認識し、帳票に記載されている文字の文字情報及び位置情報を抽出する文字認識処理部と、前記文字認識処理部により抽出された前記文字情報から単語を抽出し、抽出した単語をベクトル化した単語ベクトルに変換する文字情報解析部と、帳票の領域毎に含まれる単語ベクトルに関する情報が帳票の種類毎に定義されている帳票情報と、前記文字情報解析部により前記文字情報から抽出された単語の前記単語ベクトル及び前記位置情報とに基づいて、前記文字認識の対象となる帳票の種類を特定する帳票特定部と、を備える。
【0009】
また、本発明の一態様に係る帳票判定方法は、文字認識処理部が、文字認識の対象となる帳票に記載されている文字を認識し、帳票に記載されている文字の文字情報及び位置情報を抽出するステップと、文字情報解析部が、前記文字認識処理部により抽出された前記文字情報から単語を抽出し、抽出した単語をベクトル化した単語ベクトルに変換するステップと、帳票特定部が、帳票の領域毎に含まれる単語ベクトルに関する情報が帳票の種類毎に定義されている帳票情報と、前記文字情報解析部により前記文字情報から抽出された前記単語ベクトル及び前記位置情報とに基づいて、前記文字認識の対象となる帳票の種類を特定するステップと、を含む。
【発明の効果】
【0010】
本発明の上記態様によれば、帳票の種類を適切に特定することができる。
【図面の簡単な説明】
【0011】
【
図1】実施形態に係る帳票判定システムの概略構成の一例を示すブロック図。
【
図2】実施形態に係る帳票の種類の一例を示す模式図。
【
図3】実施形態において定義される帳票情報の一例を示す図。
【
図4】実施形態に係る帳票判定装置のハードウェア構成の一例を示すブロック図。
【
図5】実施形態に係る帳票判定処理の一例を示すフローチャート。
【発明を実施するための形態】
【0012】
以下、図面を参照して、本発明の実施形態について説明する。
[システム構成]
まず、実施形態に係る帳票判定システムの構成について説明する。
図1は、本実施形態に係る帳票判定システムの概略構成の一例を示すブロック図である。図示する帳票判定システムSYSは、帳票判定装置10を含んで構成されている。なお、帳票判定装置10は、1つのコンピュータ装置で構成されても良いし、複数のコンピュータ装置が連携して実現される構成であっても良い。
【0013】
帳票判定装置10には、OCRによる文字認識の対象となる帳票が入力される。帳票とは、所定の書式に各種情報が記載された書類であり、例えば、見積書、発注書、納品書、請求書、申請書(申込書)などである。具体的には、例えば、保険の申込書、クレジットカードの申込書、役所へ提出する申請書など、特に用途に限らず任意の帳票であってよい。この帳票は、記載されている内容の文字情報を得るには、記載されている文字をOCRで認識して読み取る必要がある。帳票判定装置10は、OCRで文字認識を行う文字認識処理と、帳票の種類を特定する帳票判定処理を行う。帳票判定装置10は、帳票の種類を特定することにより、OCRによる文字認識の精度を向上することができる。なお、帳票のデータの種類として、例えば、画像データ、テキストデータ、画像データ及びテキストデータが混合した情報がある。
【0014】
例えば、帳票判定装置10は、パーソナルコンピュータであっても良いし、スキャナ装置、或いは、コピー機能、スキャナ機能、プリンタ機能及びファックス機能などを有する複合機であってもよい。
図1に示す帳票判定装置10は、帳票取得部101と、文字認識処理部102と、文字情報解析部103と、帳票特定部104と、更新部105と、帳票情報記憶部110とを備えている。
【0015】
帳票取得部101は、文字認識の対象となる帳票データを取得する。例えば、帳票取得部101は、スキャン済みの帳票データを、ネットワークNを介して接続されるサーバ20から取得しても良いし、光ディスクやUSB(Universal Serial Bus)メモリなどの記憶媒体を介して取得してもよい。また、帳票判定装置10がスキャナ機能を有する場合、帳票取得部101は、紙の帳票をスキャンすることにより帳票データを取得してもよい。帳票データは、例えば、PNG、IMG、JPGなどの拡張子を持つ画像ファイルのデータ、テキスト情報を含まないPDFファイルのデータなどである。
【0016】
ネットワークNは、インターネットや携帯電話通信網などの公衆回線、無線LAN(Local Area Network)または有線LANなどが含まれる通信ネットワークである。
【0017】
文字認識処理部102は、帳票取得部101が取得した帳票データに対してOCR処理を行うことにより、帳票に記載されている文字を認識し、帳票に記載されている文字の文字情報と、当該文字の位置を示す位置情報とを抽出する。なお、OCR処理は、AI技術を適用したAI-OCR処理としてもよい。AI-OCR処理では、機械学習(ディープラーニングなど)により多くの手書きの文字やタイプ文字を機械学習させておくことで、文字認識精度を向上させることができる。
【0018】
文字情報解析部103は、文字認識処理部102により抽出された文字情報から単語を抽出する。例えば、文字情報解析部103は、文字認識処理部102により抽出された文字情報に対して形態素解析を行った後にフィルタリングを行うことにより単語を抽出する。ここでは、文字情報解析部103は、文字情報から抽出する単語として主に名詞を抽出する。なお、一般的には使用頻度が低いが、文字認識の対象となる帳票に含まれている抽出したい単語を抽出対象の単語として予め登録しておくことで、文字情報解析部103は、単語の抽出精度を向上させることができる。
【0019】
また、文字情報解析部103は、抽出した単語をベクトル化して単語ベクトルに変換する。単語ベクトルに変換することで、意味や性質、種類などが近い単語を同種の単語として認識できる。例えば、帳票から抽出された単語をベクトル化することにより、抽出された単語が、企業名、人名、場所名、物品名、その他などのいずれを示す単語であるかを特定することができる。
【0020】
一例として、埼玉、千葉などのように単語どうしの比較では異なる単語であっても、単語ベクトルを用いることで埼玉も千葉も地名を示す単語であると認識できる。同様に、企業名及び人名も、単語どうしの比較では名称が違うと異なる単語となるが、単語ベクトルを用いることで名称が違っても、企業名は企業名、人名は人名として認識できる。
【0021】
帳票特定部104は、帳票から抽出された単語の単語ベクトルに基づいて、帳票の種類を特定する。ここで、帳票の種類の特定方法について説明する。
【0022】
図2は、本実施形態に係る帳票の種類の一例を示す模式図である。この図では、書類A、書類B、及び書類Cの3種類の帳票の簡易的な例を示している。帳票は種類によって記載される内容と場所に違いがあるため、帳票を所定数の領域(一例として、領域1~領域6の6つの領域)に分割し、各領域に出現する単語の単語ベクトルの違いによって、帳票の種類を特定することができる。
【0023】
図示する例では、書類A、書類B、及び書類Cのいずれにも企業情報、明細/内訳、備考などの記載が含まれるが、書類によって記載の位置が異なる。書類Aは、請求した企業名が領域1に記載され、請求された企業情報が領域6に記載されるため、領域1と領域6に企業名が出現するという特徴がある。書類Bは、差し出し企業情報が領域1に記載され、受け取り企業情報が領域2に記載されるため、領域1と領域2に企業名が出現するという特徴がある。書類Cは、請求した企業情報が領域1から領域3に記載され、請求された企業情報が領域2から領域4に記載されるため、領域1または領域3と領域2または領域4に企業名が出現するという特徴がある。
【0024】
帳票の領域毎に含まれる単語ベクトルに関する情報が帳票の種類毎に定義されている帳票情報を予め用意しておくことにより、帳票特定部104は、帳票から抽出された単語の単語ベクトル及び位置情報(各領域に出現する単語ベクトル)を帳票情報と比較して、帳票情報に定義されている最も近い帳票の種類に特定する。例えば、帳票特定部104は、領域1と領域6に企業名が出現する書類を、書類Aであると特定する。
【0025】
また、領域1と領域2に企業名が出現する書類は、書類Bと書類Cのいずれであるか特定できない場合もある。そこで、帳票情報において、各領域に出現する単語ベクトルの出現確率を定義しておき、文字情報解析部103は、帳票から抽出された単語の単語ベクトル及び位置情報に基づいて、帳票の領域毎の単語ベクトルの出現確率を算出する。そして、帳票特定部104は、両者の出現確率を比較することにより、最も近い帳票の種類に特定してもよい。また、企業名のみでは特定できない場合もある。そのため、帳票特定部104は、企業情報または明細/内訳のいずれかに記載されている他の単語の単語ベクトル(例えば、場所名、人名、物品名など)も含む複数の単語ベクトルの領域毎の出現確率を比較することにより、帳票の種類に特定してもよい。
【0026】
なお、
図2に示す例では、帳票を2(水平方向)×3(垂直方向)の計6つの領域に分割する例を示したが、これに限られるものではなく、各方向の分割数、領域の形状などは任意に決めることができる。
【0027】
図3は、本実施形態において定義される帳票情報の一例を示す図である。図示するように、帳票情報には、帳票の領域毎の単語ベクトルの出現確率が帳票の種類毎に定義されている。なお、出現確率とは、特定領域における単語ベクトルの割合を示している。出現確率の具体的な算出方法としては、特定領域にて(例えば、
図2に示す領域1~6のそれぞれにて)、認識された全単語数を分母とし、単語ベクトル毎(企業名、人名など)に集計した単語数を分子として割合を算出する。例えば、帳票の種類毎に、複数の帳票サンプル(例えば、100件など)の各領域に出現する単語ベクトルを調べて算出した出現確率が定義されている。この帳票情報は、帳票情報記憶部110に記載される。即ち、帳票情報は、帳票の領域毎の単語ベクトルの出現確率が帳票の種類毎にリスト化されたものである。
【0028】
このように、帳票特定部104は、帳票の領域毎に含まれる単語ベクトルに関する情報が帳票の種類毎に定義されている帳票情報と、文字認識の対象となる帳票から抽出された単語ベクトル及び位置情報とに基づいて、文字認識の対象となる帳票の種類を特定する。
例えば、帳票情報には、帳票の領域毎の単語ベクトルの出現確率が帳票の種類毎に定義されており、文字情報解析部103は、文字認識の対象となる帳票から抽出された単語ベクトル及び位置情報に基づいて、帳票の領域毎の単語ベクトルの出現確率を算出する。そして、帳票特定部104は、算出された領域毎の単語ベクトルの出現確率と帳票情報とに基づいて、文字認識の対象となる帳票の種類を特定する。帳票特定部104は、特定した帳票の種類を示す情報を出力する。出力形式は、テキストデータでもよいし、表示データでもよい。
【0029】
更新部105は、帳票特定部104により特定された文字認識の対象となる帳票の種類と、文字認識の対象となる帳票から抽出された単語ベクトル及び位置情報とに基づいて、帳票情報を更新する。例えば、更新部105は、帳票特定部104により特定された文字認識の対象となる帳票の種類と、文字情報解析部103により算出された領域毎の単語ベクトルの出現確率とに基づいて、帳票情報を更新する。
【0030】
具体的には、帳票特定部104により特定された文字認識の対象となる帳票の種類をユーザが確認し、正しく特定されていた場合には、更新部105は、その帳票の領域毎の単語ベクトルの出現確率の値を、特定された帳票のサンプルの一つとして帳票情報に加えて反映させる。なお、ユーザが確認した結果、帳票特定部104により特定された文字認識の対象となる帳票の種類が間違っていた場合には、更新部105は、その帳票の領域毎の単語ベクトルの出現確率の値を、正解の帳票のサンプルの一つとして帳票情報に加えて反映させる。このように、帳票の種類を特定した結果を帳票情報にフィードバックさせることで、帳票の種類の特定精度を向上させることができる。
【0031】
図4は、本実施形態に係る帳票判定装置のハードウェア構成の一例を示すブロック図である。帳票判定装置10は、ハードウェア構成として、CPU(Central Processing Unit)11と、RAM(Random Access Memory)12と、ROM(Resad Only Memory)13と、記憶装置14と、通信部15と、入力部16と、出力部17とを備えている。
【0032】
CPU11は、ROM13または記憶装置14に記憶されているプログラムを実行することにより各種の処理を実行するプロセッサである。例えば、CPU11は、
図1に示す帳票取得部101、文字認識処理部102、文字情報解析部103、帳票特定部104、及び更新部105による各処理を実行する。
【0033】
RAM12は、CPU11が実行するプログラムの読み込み領域として、又は、当該プログラムによる処理に使用するデータを書き込む作業領域として利用される。
【0034】
ROM13は、例えば、EEPROM(Electrically Erasable Programmable Read Only Memory)やフラッシュROMなどの電気的に書き換え可能な不揮発性メモリで構成される。例えば、ROM13には、システムプログラム、各種処理を実行するプログラムなどの少なくとも一部が記憶されている。
【0035】
記憶装置14は、HDD(Hard Disk Drive)、SSD(Solid State Drive)、などを含んで構成される。例えば、記憶装置14には、システムプログラム、各種処理を実行するプログラムなどの少なくとも一部が記憶されてもよい。また、記憶装置14には、
図1に示す帳票情報記憶部110を備え、例えば
図3に示す帳票情報が記憶される。
【0036】
通信部15は、無線LAN(Local Area Network)または有線LANによりネットワークに接続して、外部の装置(サーバ20など)とデータ通信を行う。また、通信部15は、Bluetooth(登録商標)などの近距離無線通信、USB(Universal Serial Bus)などのインターフェースを備えて周辺機器類とデータ通信を行ってもよい。
【0037】
入力部16は、例えば、キーボード、タッチパッド、タッチパネル、マイクロフォンなどの入力デバイスを備えている。また、帳票判定装置10がスキャナ機能を有する場合、入力部16は、スキャナとして構成されてもよい。出力部17は、液晶ディスプレイ、有機ELディスプレイなどの表示デバイス、スピーカなどの出力デバイスなどを備えている。
【0038】
なお、前述したように、帳票判定装置10は、1つのコンピュータ装置で構成されても良いし、複数のコンピュータ装置が連携して実現される構成であっても良いため、
図4に示すハードウェア構成を1つ備えても良いし、複数備えても良い。例えば、帳票判定装置10は、帳票取得部101と文字認識処理部102を含むコンピュータ装置と、文字情報解析部103と帳票特定部104と更新部105とを含むコンピュータ装置とが通信可能に接続された構成において、各コンピュータ装置が、
図4に示すハードウェア構成を備える構成としても良い。
【0039】
次に、上述した帳票判定装置10が実行する帳票判定処理の動作について説明する。
図5は、本実施形態に係る帳票判定処理の一例を示すフローチャートである。
【0040】
まず、帳票取得部101は、文字認識の対象となる帳票データを取得したか否かを判定する(ステップS101)。帳票取得部101は、帳票データを取得していないと判定した場合(ステップS101:NO)、ステップS101の処理を再び実行し、帳票データの入力を待ち受ける。一方、帳票取得部101は、帳票データを取得したと判定した場合(ステップS101:YES)、取得した帳票データを記憶装置14に保存し、ステップS103の処理へ進む。
【0041】
ステップS103において、文字認識処理部102は、帳票取得部101が取得した帳票データを記憶装置14から読み出し、帳票データに対してOCR処理を行うことにより、帳票に記載されている文字を認識し、帳票に記載されている文字の文字情報と、当該文字の位置を示す位置情報とを抽出する。
【0042】
次に、文字情報解析部103は、文字認識処理部102により抽出された文字情報から単語を抽出する(ステップS105)。続いて、文字情報解析部103は、抽出した単語をベクトル化して単語ベクトルに変換する(ステップS107)。そして、文字情報解析部103は、帳票から抽出された単語の単語ベクトル及び位置情報に基づいて、帳票の領域毎の単語ベクトルの出現確率を算出する(ステップS109)。
【0043】
次に、帳票特定部104は、ステップS109で算出された領域毎の単語ベクトルの出現確率と、帳票の領域毎の単語ベクトルの出現確率が帳票の種類毎に定義された帳票情報とを比較する(ステップS111)。そして、帳票特定部104は、比較結果に基づいて、文字認識の対象となる帳票の種類を特定し、特定した帳票の種類を示す情報を出力する(ステップS113)。出力形式は、テキストデータでもよいし、表示データでもよい。
【0044】
以上の処理により、帳票判定装置10は、帳票の種類を特定することができる。以降の処理は、帳票の種類の特定精度をより向上させるために追加で実施可能な、フィードバック処理である。このフィードバック処理は、帳票の種類が特定される度に行われても良いし、後からまとめて行われても良い。また、特定された帳票の全てに対してフィードバック処理を行われても良いし、一部に対して行われても良い。
【0045】
ユーザは、帳票特定部104により特定された帳票の種類を示す情報を確認し、特定された種類が正しいか否かの確認結果を、入力部16(例えば、キーボード、マウスなど)を用いて入力する(ステップS115)。
【0046】
更新部105は、ユーザの確認結果に基づいて、帳票情報の出現確率を更新する(ステップS117)。例えば、更新部105は、ユーザの確認結果に基づいて、帳票の種類が正しく特定されていた場合には、その帳票の領域毎の単語ベクトルの出現確率の値を、特定された帳票のサンプルの一つとして帳票情報に加えて反映させる。一方、更新部105は、ユーザの確認結果に基づいて、帳票の種類が間違って特定されていた場合には、その帳票の領域毎の単語ベクトルの出現確率の値を、正解の帳票のサンプルの一つとして帳票情報に加えて反映させる。
【0047】
以上説明したように、本実施形態に係る帳票判定システムSYSは、文字認識の対象となる帳票に記載されている文字を認識し、帳票に記載されている文字の文字情報及び位置情報を抽出し、抽出された文字情報からさらに単語を抽出し、抽出した単語をベクトル化した単語ベクトルに変換する。そして、帳票判定装置10は、帳票の領域毎に含まれる単語ベクトルに関する情報が帳票の種類毎に定義されている帳票情報と、文字情報から抽出された単語の単語ベクトル及び位置情報とに基づいて、文字認識の対象となる帳票の種類を特定する。
【0048】
これにより、帳票判定システムSYSは、帳票の種類によって各領域に記載される内容に違いあることから、帳票に記載されている文字を認識して単語ベクトル化することにより、帳票の種類を適切に特定することができる。帳票判定装置10は、帳票に記載されている文字を単語で判断するのではなく単語ベクトルで判断するため、単語どうしの比較では異なる単語であっても企業名は企業名、人名は人名として認識することができ、帳票の種類を適切に特定することができる。
【0049】
例えば、帳票情報には、帳票の領域毎の前記単語ベクトルの出現確率が帳票の種類毎に定義されている。そして、帳票判定装置10は、文字情報から抽出された単語の単語ベクトル及び位置情報に基づいて、帳票の領域毎の単語ベクトルの出現確率を算出し、算出された領域毎の単語ベクトルの出現確率と帳票情報とに基づいて、文字認識の対象となる帳票の種類を特定する。
【0050】
これにより、帳票判定システムSYSは、帳票の種類によって各領域に出現する単語ベクトルの出現確率が異なることから、帳票の各領域に出現する文字を認識して単語ベクトル化することにより、帳票の種類を適切に特定することができる。
【0051】
また、帳票判定装置10は、特定された文字認識の対象となる帳票の種類と、文字情報から抽出された単語の単語ベクトル及び位置情報とに基づいて、帳票情報を更新する。
【0052】
これにより、帳票判定システムSYSは、帳票の種類の特定結果をフィードバックさせることで、帳票の種類の特定精度を向上させることができる。
【0053】
例えば、帳票判定システムSYSは、特定された文字認識の対象となる帳票の種類と、算出された領域毎の単語ベクトルの出現確率とに基づいて、帳票情報を更新する。
【0054】
これにより、帳票判定システムSYSは、帳票の種類の特定結果をフィードバックさせることで、帳票の種類の特定精度を向上させることができる。
【0055】
また、本実施形態に係る帳票判定装置10は、文字認識の対象となる帳票に記載されている文字を認識し、帳票に記載されている文字の文字情報及び位置情報を抽出し、抽出された文字情報からさらに単語を抽出し、抽出した単語をベクトル化した単語ベクトルに変換する。そして、帳票判定装置10は、帳票の領域毎に含まれる単語ベクトルに関する情報が帳票の種類毎に定義されている帳票情報と、文字情報から抽出された単語の単語ベクトル及び位置情報とに基づいて、文字認識の対象となる帳票の種類を特定する。
【0056】
これにより、帳票判定装置10は、帳票の種類によって各領域に記載される内容に違いあることから、帳票に記載されている文字を認識して単語ベクトル化することにより、帳票の種類を適切に特定することができる。帳票判定装置10は、帳票に記載されている文字を単語で判断するのではなく単語ベクトルで判断するため、単語どうしの比較では異なる単語であっても企業名は企業名、人名は人名として認識することができ、帳票の種類を適切に特定することができる。
【0057】
また、本実施形態に係る帳票判定システムSYS及び帳票判定装置10における帳票判定方法は、文字認識処理部102が、文字認識の対象となる帳票に記載されている文字を認識し、帳票に記載されている文字の文字情報及び位置情報を抽出するステップと、文字情報解析部103が、文字認識処理部102により抽出された文字情報から単語を抽出し、抽出した単語をベクトル化した単語ベクトルに変換するステップと、帳票特定部104が、帳票の領域毎に含まれる単語ベクトルに関する情報が帳票の種類毎に定義されている帳票情報と、文字情報解析部103により文字情報から抽出された単語の単語ベクトル及び位置情報とに基づいて、文字認識の対象となる帳票の種類を特定するステップと、を含む。
【0058】
これにより、帳票判定システムSYS及び帳票判定装置10は、帳票の種類によって各領域に記載される内容に違いあることから、帳票に記載されている文字を認識して単語ベクトル化することにより、帳票の種類を適切に特定することができる。帳票判定装置10は、帳票に記載されている文字を単語で判断するのではなく単語ベクトルで判断するため、単語どうしの比較では異なる単語であっても企業名は企業名、人名は人名として認識することができ、帳票の種類を適切に特定することができる。
【0059】
以上、この発明の各実施形態について図面を参照して詳述してきたが、具体的な構成は上述の実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。例えば、上述の各実施形態において説明した各構成は、任意に組み合わせることができる。
【0060】
なお、上述した帳票判定装置10は、内部にコンピュータシステムを有している。そして、上述した帳票判定装置10が備える各構成の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより上述した帳票判定装置10が備える各構成における処理を行ってもよい。ここで、「記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行する」とは、コンピュータシステムにプログラムをインストールすることを含む。ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、インターネットやWAN、LAN、専用回線等の通信回線を含むネットワークを介して接続された複数のコンピュータ装置を含んでもよい。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。このように、プログラムを記憶した記録媒体は、CD-ROM等の非一過性の記録媒体であってもよい。
【0061】
また、記録媒体には、当該プログラムを配信するために配信サーバからアクセス可能な内部又は外部に設けられた記録媒体も含まれる。なお、プログラムを複数に分割し、それぞれ異なるタイミングでダウンロードした後に帳票判定装置10が備える各構成で合体される構成や、分割されたプログラムのそれぞれを配信する配信サーバが異なっていてもよい。さらに「コンピュータ読み取り可能な記録媒体」とは、ネットワークを介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。また、上記プログラムは、上述した機能の一部を実現するためのものであってもよい。さらに、上述した機能をコンピュータシステムに既に記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
【0062】
また、上述した実施形態における帳票判定装置10が備える各機能の一部、または全部を、LSI(Large Scale Integration)等の集積回路として実現してもよい。各機能は個別にプロセッサ化してもよいし、一部、又は全部を集積してプロセッサ化してもよい。また、集積回路化の手法はLSIに限らず専用回路、または汎用プロセッサで実現してもよい。また、半導体技術の進歩によりLSIに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いてもよい。
【符号の説明】
【0063】
SYS 帳票判定システム、10 帳票判定装置、11 CPU、12 RAM、13 ROM、14 記憶装置、15 通信部、16 入力部、17 出力部、20 サーバ、101 帳票取得部、102 文字認識処理部、103 文字情報解析部、104 帳票特定部、105 更新部、110 帳票情報記憶部