特許第6060134号(P6060134)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社プリマジェストの特許一覧

<>
  • 特許6060134-情報処理装置及び情報処理方法 図000002
  • 特許6060134-情報処理装置及び情報処理方法 図000003
  • 特許6060134-情報処理装置及び情報処理方法 図000004
  • 特許6060134-情報処理装置及び情報処理方法 図000005
  • 特許6060134-情報処理装置及び情報処理方法 図000006
  • 特許6060134-情報処理装置及び情報処理方法 図000007
  • 特許6060134-情報処理装置及び情報処理方法 図000008
  • 特許6060134-情報処理装置及び情報処理方法 図000009
  • 特許6060134-情報処理装置及び情報処理方法 図000010
  • 特許6060134-情報処理装置及び情報処理方法 図000011
  • 特許6060134-情報処理装置及び情報処理方法 図000012
  • 特許6060134-情報処理装置及び情報処理方法 図000013
  • 特許6060134-情報処理装置及び情報処理方法 図000014
  • 特許6060134-情報処理装置及び情報処理方法 図000015
  • 特許6060134-情報処理装置及び情報処理方法 図000016
  • 特許6060134-情報処理装置及び情報処理方法 図000017
  • 特許6060134-情報処理装置及び情報処理方法 図000018
  • 特許6060134-情報処理装置及び情報処理方法 図000019
  • 特許6060134-情報処理装置及び情報処理方法 図000020
  • 特許6060134-情報処理装置及び情報処理方法 図000021
  • 特許6060134-情報処理装置及び情報処理方法 図000022
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6060134
(24)【登録日】2016年12月16日
(45)【発行日】2017年1月11日
(54)【発明の名称】情報処理装置及び情報処理方法
(51)【国際特許分類】
   G06K 9/03 20060101AFI20161226BHJP
【FI】
   G06K9/03 Z
【請求項の数】9
【全頁数】20
(21)【出願番号】特願2014-231133(P2014-231133)
(22)【出願日】2014年11月13日
(65)【公開番号】特開2016-95662(P2016-95662A)
(43)【公開日】2016年5月26日
【審査請求日】2014年11月14日
(73)【特許権者】
【識別番号】599001389
【氏名又は名称】株式会社プリマジェスト
(74)【代理人】
【識別番号】100101306
【弁理士】
【氏名又は名称】丸山 幸雄
(72)【発明者】
【氏名】佐藤 広行
(72)【発明者】
【氏名】森田 康裕
【審査官】 ▲広▼島 明芳
(56)【参考文献】
【文献】 特開2004−046393(JP,A)
【文献】 特開2010−170461(JP,A)
【文献】 特開2002−189985(JP,A)
【文献】 特開平11−282964(JP,A)
【文献】 特開2009−187361(JP,A)
【文献】 特開2000−123116(JP,A)
【文献】 特開平05−128300(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06K 9/03
(57)【特許請求の範囲】
【請求項1】
イメージ情報を表示する表示手段を備え、
処理対象原稿をイメージ情報として取得するイメージ取得手段と、
前記イメージ取得手段で取得したイメージ情報中の必要文字列を前記表示手段に表示し当該表示を確認して入力される文字列を正解文字列として取得する正解文字列取得手段と、
前記イメージ取得手段で取得したイメージ情報中の必要文字列を抽出して文字認識する認識手段と、
前記認識手段で認識した文字認識結果と前記正解文字列取得手段で取得した対応する正解文字列とを関連付けて予め登録する分類器と、
前記分類器に関連付けて登録されている認識結果と正解文字列とを参照して新に文字認識した認識結果に対する正解文字列を類推する類推手段を備え
前記分類器に登録する認識結果には、前記認識手段で認識した前記イメージ情報中の必要文字列に対応する認識文字群が前記正解文字列と関連付けて登録されることを特徴とする誤読補正方法。
【請求項2】
更に予め正解文字列が登録されている登録マスター
前記認識手段が認識した前記必要文字列認識結果が前記登録マスターに登録されているか否かで誤認識文字列か否かを判定する判定手段と、
前記判定手段が誤認識文字列と判定した前記必要文字列認識結果を取り出す誤認識文字列抽出手段とを備え
前記類推手段は、前記誤認識と判定した文字列から正解文字列を類推することを特徴とする請求項1記載の誤読補正方法。
【請求項3】
更に予め正解文字列が登録されている登録マスター
前記登録マスターに前記認識結果と類似する文字列が登録されているか否かを判定し類似する文字列を読み出す読み出し手段と、
前記読み出し手段で類似する文字列が登録されていない場合には前記認識手段で認識した認識結果の前記分類器への登録を中止すること特徴とする請求項1記載の誤読補正方法。
【請求項4】
更に予め正解文字列が登録されている登録マスター
前記登録マスターに前記認識結果と類似する文字列が登録されているか否かを判定する判定手段と、
前記登録マスターに前記認識結果と類似する文字列が登録されていない場合には前記認識手段で認識した認識結果の前記分類器への登録を中止する登録中止手段と、
前記判定手段が新たに文字認識した文字列に類似した文字列が前記登録マスターに登録されている場合には類似する文字列を読み出す読み出し手段と、
前記分類器に関連付けて登録されている認識結果と正解文字列とを参照して新に文字認識した認識結果に対する正解文字列を類推すること特徴とする請求項1記載の誤読補正方法。
【請求項5】
前記類推手段が、複数の類推文字列を確率付きで類推することを特徴とする請求項1乃至請求項4のいずれかに記載の誤読補正方法。
【請求項6】
前記認識手段は、複数種類の文字認識方法でそれぞれ文字認識を行い、
前記の分類器にはそれぞれ文字認識した認識結果と前記正解文字列取得手段で取得した対応する正解文字列とを関連付けて予め登録することを特徴とする請求項1乃至請求項5のいずれかに記載の誤読補正方法。
【請求項7】
前記類推手段が類推した類推文字列を前記表示手段に表示する類推文字列表示手段を備え、
前記表示手段により表示された類推文字列を参照して認識文字列を補正可能とすることを特徴とする請求項1乃至請求項6のいずれかに記載の誤読補正方法。
【請求項8】
類推文字列表示手段は、前記類推手段が類推した複数の類推文字列を正解確率の高い順番に表示し、かつ、正解確率の和が一定値に達するまで類推文字列を表示することを特徴とする請求項7記載の誤読補正方法。
【請求項9】
類推文字列表示手段は、前記類推手段が類推した複数の類推文字列を正解確率の高い順番に表示し、かつ、正解確率の和が一定値に達するまで類推文字列を表示することを特徴とする請求項7記載の誤読補正方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、取得したイメージ情報中から文字認識処理で認識した文字列認識結果の補正を効率的に行うことができる情報処理装置及び情報処理方法に関し、例えば、認識された文字列と予め登録された文字列とを比較して認識された文字列補正を可能とした情報処理装置及び情報処理方法に関するものである。
【背景技術】
【0002】
デジタル情報技術が普及した現在であるが、紙原稿は情報伝達の媒体としてなお広く使われている。紙原稿に記載された情報を高い精度でデジタルデータ化する場合、データ化する文字をキーボードなどから手入力により入力していた。特に大量の手入力を行う場合には、異なる入力者が同一原稿から同一文字をそれぞれ入力するダブルエントリ処理が行われ、入力された結果が同一であれば(一致すれば)正しく入力されたとしてエントリ結果のデータを採用し、入力結果が異なった場合にはいずれかの入力が誤っていたとして入力文字の確認を行っていた。
【0003】
手入力によるエントリに代わる方法として、OCR(光学式文字読取)装置で紙原稿の文字列部分の文字データを認識し、データ化する方法も広く採用されている。スキャナの解像度の向上や画像解析技術の発達により、高い認識精度を得られるようになってはいるが、どうしても誤認識が避けられず、認識の精度の問題があり、OCR装置による大量の文字認識処理では手入力によるエントリに代わる方法にはなりえていない。
【0004】
例えば、診療報酬請求書などは電子化が進んでいるが、なお紙媒体で提供されることもある。その中には、印刷された傷病名等をデータ化する必要があり、データ化には高い精度が求められる。そのため、手入力によるエントリが2回行われ、そのエントリ結果が合致すればそのデータを採用し、合致しなければ再度エントリして合致したデータを採用することが行われているが、その労力は膨大なものとなっている。
【0005】
この点を改良すべくOCR装置で誤認識した文字データに対して、正解データの単語辞書と照会し、文法規則を用いてチェックして日本語文章として妥当な候補文字列を生成し、その候補文字列に対して、単語長、単語の出現頻度などから評価値を算出し、評価値が最大の候補文字列を誤読の補正結果とする方法(特許文献1)が提案されている。
【0006】
OCR装置で読み取られる文字のなかで誤認識され易い文字を集めた類似単語辞書を用意し、誤認識と判定されたら類似辞書を参照して、同じ誤読文字を見つけて正文字と置換し、同じ誤読文字が見つからない場合、あるいは、置換後でも誤認識されやすい文字を含む場合、誤認識の可能性があると容易に認識できるマークに置換する方法も提案されていた(特許文献2)。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開平07−028956号公報
【特許文献2】特開2011−150436号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかしながら、従来のOCR装置による文字認識処理により、手入力によるエントリの一方をOCR処理に置き換えるためにはどうしても90%を上回る正解率が必要である。OCR装置の読取解像度の向上や画像解析技術の発達により、高い認識精度を得られるようになってきているが、従来ではどうしても正解率が90%を下回ることが多い。
このため、OCR装置による文字認識処理を用いたが誤認識した文字からより確からしい文字を類推し90%を上回る正解率を提供する方法が望まれていた。
【0009】
即ち、OCR処理では、イメージから一つの文字の描かれている範囲を判断し、その一つの文字を認識する。このため、一つの文字範囲の判断で誤ったり、一つの文字の認識で誤ったりし、誤りの原因は多様である。正解率を上げるにはこのような多様な誤認識に対して、正解文字を類推する方法が必要となる。
【0010】
特許文献1では、OCR装置で誤認識した文字データに対して、正解データの単語辞書と照会している。OCRの誤認識では、「右膝関節捻挫」を「右額鸚挫W」のように複数文字を誤認識することも多く、正解データの単語辞書と単純に照会しても候補文字列を探し出すことが難しい。また、日本語文章として妥当かどうかの判断も、ただの単語である傷病名では意味を持たない。
【0011】
特許文献2では、「誤認識されやすい文字を特定し」とあり、例えば「口」(漢字のクチ)と「ロ」(カタカナのロ)を挙げている。OCRは、「右膝関節捻挫」を「右額鸚挫W」のように誤認識したりする。すなわち、文字範囲の切出しに失敗して2文字を1文字で認識したり(「関節」を「鸚」と)、文字の後ろにあるノイズを文字と認識したり(「挫」を「挫W」と)する。このため、文字単位の置換だけでは、正解率を上げることが難しい。
【課題を解決するための手段】
【0012】
本発明は上記の問題点を解決し、OCR装置で読み取った原稿文字列の正解率を向上させることが出来る情報処理装置及び情報処理方法を提供することを目的としてなされたもので、係る目的を達成する一手段として例えば以下の構成を備える。
【0013】
すなわち、イメージ情報を表示する表示手段を備え、処理対象原稿をイメージ情報として取得するイメージ取得手段と、前記イメージ取得手段で取得したイメージ情報中の必要文字列を抽出して文字認識する認識手段と、前記イメージ取得手段で取得したイメージ情報中の必要文字列を前記表示手段に表示し当該表示を確認して入力される文字列を正解文字列として取得する正解文字列取得手段と、前記認識手段で認識した認識文字列と前記正解文字列取得手段で取得した対応する正解文字列とを関連付けて予め登録する分類器と、前記分類器の登録文字列ペアを参照して新に文字認識した文字列の正解文字列を類推する類推手段を備えることを特徴とする。
【0014】
そして例えば、更に予め正解文字列が登録されている登録マスターを備え、前記認識手段が認識した文字列が前記登録マスターに登録されているか否かで誤認識文字列か否かを判定する判定手段と、前記判定手段が誤認識文字列と判定した認識文字列を取り出す誤認識文字列抽出手段と、前記分類器の登録文字列ペアを参照して新たに文字認識した文字列のうち誤認識と判定した文字列から正解文字列を類推する類推手段を備えることを特徴とする。
【0015】
又例えば、更に予め正解文字列が登録されている登録マスターを備え、前記登録マスターに前記認識文字列と類似する文字列が登録されているか否かを判定し類似する文字列を読み出す読み出し手段と、前記読み出し手段で類似文字列が抽出されない場合には前記認識手段で認識した認識文字列の前記分類器への登録を中止すること特徴とする。
【0016】
更に例えば、予め正解文字列が登録されている登録マスターを備え、前記登録マスターに前記認識文字列と類似する文字列が登録されているか否かを判定する判定手段と、前記登録マスターに前記認識文字列と類似する文字列が登録されていない場合には前記認識手段で認識した認識文字列の前記分類器への登録を中止する登録中止手段と、前記判定手段が新たに文字認識した文字列に類似した文字列が前記登録マスターに登録されている場合には類似する文字列を読み出す読み出し手段と、前記分類器に関連付けて登録されている認識文字列と正解文字列とを参照して新に文字認識した文字列に対する正解文字列を類推すること特徴とする。
【0017】
又例えば前記認識手段は、複数種類の文字認識方法でそれぞれ文字認識を行い、前記の分類器にはそれぞれ文字認識した認識文字列と前記正解文字列取得手段で取得した対応する正解文字列とを関連付けて予め登録することを特徴とする。
【0018】
更に例えば、前記類推手段が類推した類推文字列を前記表示手段に表示する類推文字列表示手段を備え、前記表示手段により表示された類推文字列を参照して認識文字列を補正可能とすることを特徴とする。
【0019】
又例えば、類推文字列表示手段は、前記類推手段が類推した複数の類推文字列を正解確率の高い順番に表示し、かつ、正解確率の和が一定値に達するまで類推文字列を表示することを特徴とする。
【0020】
又例えば、前記認識手段で認識した認識文字列を各文字毎に分離する分離手段を備え、前記分類器には、前記認識文字列として分離手段で分離した認識文字列の分離した文字群を前記正解文字列と関連付けて登録することを特徴とする。
【発明の効果】
【0021】
本発明によれば、例えばOCR装置等で読み取った原稿文字列の正解率を向上させることが、例えば正解率を90%以上に向上させることができる情報処理装置及び情報処理方法を提供出来る。
【図面の簡単な説明】
【0022】
図1】本発明に係る一発明の実施の形態例の情報処理システムの基本構成を示すブロック図である。
図2】本発明に係る一発明の実施の形態例の文字列認識処理の概要を説明するための機能図である。
図3】本実施の形態例で処理する柔道整復施術療養費支給申請書の例を示す図である。
図4】本実施の形態例で用いる柔道整復療養費支給申請書に印刷された負傷名の例を示す図である。
【0023】
図5】本実施の形態例で用いる柔道整復療養費支給申請書に印刷された負傷名をイメージ情報として読み取り文字認識して得た文字列の例を示す図である。
図6】本実施の形態例における文字認識した文字列を一文字ずつに分解した例を示す図である。
図7】本実施の形態例で読み取った申請書読み取りイメージ情報を確認して特定した正解文字列の例を示す図である。
【0024】
図8】本実施の形態例で認識した文字列を一文字ずつ分解した文字列と対応する正解文字列を並べて表示した例を示す図である。
図9】本発明に係る第2の実施の形態例の概略処理を示すフローチャートである。
図10】第2の実施の形態例における誤読文字と判定された文字列の例を示す図である。
図11】第2の実施の形態例の誤読と判定された文字列の一文字ずつ分解した文字列の例である。
【0025】
図12】第2の発明の実施の形態例で用いる誤読と判定された文字列を一文字ずつ分解した文字列と正解文字列をペアにして比較している例を示す図である。
図13】本発明に係る第3の発明の実施の形態例に係る誤読補正方法の概略を示すフローチャートである。
【0026】
図14】第2の実施の形態例の文字認識した文字列の例と、認識文字列の類似文字列の例を比較可能に表示した例を示す図である。
図15】第3の実施の形態例におけるエントリされた正解文字列の例を示す図である。
図16】第3の実施の形態例において認識した文字列中の誤読文字列と判定した文字列を一文字ずつに分解した列と、誤読文字列に類似した文字列とを抽出した状態を示す図である。
図17】第3の実施の形態例における誤読文字列を一文字ずつ分解した文字列と、正解文字列と判定した文字列をペア表示した例を示す図である。
図18】本発明に係る第4の実施の形態例の誤読補正方法の動作を説明するためのフローチャートである。
図19】本発明に係る第4の実施の形態例に係るエントリー画面の例を示す図である。
図20】本発明の各実施の形態例におけるエントリー画面の例を示す図である。
図21】本発明の各実施の形態例における誤読補正方法の効果例を説明するための図である。
【符号の説明】
【0027】
100 中央処理装置
110 表示装置
120 入力装置
130 イメージ読取装置
150 通信装置
160 誤読補正処理部
162 分類噐
163 マスタ
210 認識結果データベース
220 正解文字列データベース
230 申請書データベース
240 認識領域抽出部
500 顧客端末
【発明を実施するための形態】
【0028】
以下、図面も参照して本発明に係る一発明の実施の形態例を詳細に説明する。
本発明に係る一発明の実施の形態例によれば、診療報酬請求書などの中に印刷された傷病名等をデータ化するときは、高い正確性が求められる。そのため、従来は手入力によるエントリーが2回行われ、そのエントリー結果が合致すればそのデータを採用し、合致しなければ再度エントリして合致したデータを採用することが行われているが、その労力は膨大なものとなっていた。
【0029】
手入力によるエントリーに代わる方法として、OCR(光学式文字読取)で文字データを認識し、データ化する方法もあるが、従来は正解率が90%を下回ることも多い。しかし、本発明に係る一発明の実施の形態例のOCR誤読補正方法によれば、OCRが誤読した文字に対して正解データを90%以上の正解率で類推することができ、手入力によるエントリの一方をOCRに代えることができ、データ化の労力を減らすことができる。
【0030】
〔第1の実施の形態例〕
図1は本発明に係る一実施の形態例の情報処理システムの基本構成を示すブロック図である。図1において、100は本システムの各構成の全体制御を行なっている中央処理装置である。中央処理装置100は、例えば、イメージ読取装置130を制御して読み取った紙原稿用紙(例えば帳票)読取イメージデータを申請書データファイル230に登録すると共に、認識領域抽出部240を制御して認識領域特定処理、特定した認識領域に記載された文字認識処理等を行うと共に、認識した文字列を認識結果データベース210に一時登録する処理も行う。
【0031】
110は表示装置であり、後述する各種の情報を表示する。120はキーボード等で構成された入力装置であり、必要に応じて表示装置110に表示された認識結果と読取イメージ情報を確認して認識結果の修正などを行うことができる。130は各種帳票などの紙原稿を読み取り、必要に応じて記載された特定領域の文字認識が可能なイメージ読取装置であり、帳票や紙に記載されている保険適用申請書等を高速で読み取りイメージ情報に変換すると共に、特定領域の文字情報を文字認識し、キャラクタデータに変換可能である。
【0032】
150は他の装置やシステムなどに通信媒体を介して通信することが出来る通信装置である。例えば治療院の治療院端末装置500との間で各種のデータ通信が可能である。なお、図1では医院端末は1台のみ記載されているが、通信可能な治療院端末数に制限はなく、実際には数百台或いはそれ以上の医療端末との間での通信が可能である。なお、治療院よりの通信はデジタルデータの通信に限定されるものではなく、例えば書類をファクシミリ通信で送る場合も含まれる。
【0033】
210はイメージ読取装置130で読み取り認識された認識結果を一時的に登録する認識結果データベースであり申請書データファイル230と関連付けて読み出し可能に登録している。
【0034】
160は誤読補正処理部であり、詳細を後述するが、分類噐162、マスタ163などを備え、認識結果を例えば分類器162を用いて必要に応じて正解文字列データベース220に登録されている正解文字列を参照して補正する。220は申請書に記載されるべき傷病名などの文字列を正解文字列として予め登録する正解文字列データベースである。
【0035】
230は申請書データベースであり申請書のイメージ情報および記載内容の文字コード化データを登録している。
以上の構成を備える本実施の形態例の概略機能を図2を参照して説明する。本実施の形態例では、実際の文字列認識処理を行う前に、予め認識するべき文字列の正しい文字列である正解文字列145と紙原稿用紙から読み出した認識処理により認識された認識文字列とを互いに対応付けて分類器162に登録する処理を行う。
【0036】
図2の誤読補正方法(S101)において、まず左側の分類器生成処理S102を行う。最初に処理対象の紙原稿用紙を読み取り第1イメージ情報141を生成する第1スキャン処理S111を実行する。具体的には、認識処理対象の文字列が表示されている紙原稿用紙をイメージ読取装置130にセットする。そして入力装置120から指示して中央処理装置100の制御下でイメージ読取装置130にセットされた紙原稿用紙をスキャンして紙原稿用紙のイメージ情報を習得して申請書データファイル230に登録する。
【0037】
続いてステップS112の第1文字列抽出処理に移行し、読み取った原稿(申請書)中の予め指定されている文字認識するべき文字列の領域を抽出し、第1抽出文字列142を抽出する。次のステップS113の第1文字列認識処理においてステップS112で抽出した第1抽出文字列142に対する文字認識処理を行い、認識結果としての第1認識文字列 143を得る。
次のステップS114の第1文字列分解処理において、ステップ113で認識した第1認識文字列 143に対する文字列分解処理S114を行い、第1認識文字群144を得る。
【0038】
又、第1スキャン処理(S111)で読み取った紙原稿イメージ情報は、例えば表示装置110に表示されるため、ステップS115の第1エントリ処理を行い、ステップS112の抽出文字列142に相当する領域の読み取りイメージ情報を確認しつつ当該領域に表示されている正解文字列145を例えば入力装置120から指示入力する。この処理は1回行えば足りるため、予め申請書に書き込まれる全ての文字列を全てエントリし終わった場合にはエントリ処理は行われない。
このようにして入力された同じ領域に表されている正解文字列145と、認識文字群144を対応付けてそれぞれ分類器162に登録する。
【0039】
全ての処理対象の文字列に対する正解文字列145及び第1認識文字群144のぺアの分類器162への登録がなされたときには、続いて具体的な認識処理を行う準備が完了したため、右側のステップS103の正解類推処理を実行することになる。
【0040】
まずステップS131で実際に処理対象の紙原稿用紙をイメージ読取装置130にセットしてイメージ読取処理を行い、読み取ったイメージ情報は申請書データファイル230に登録する第2スキャン処理を実行して第2イメージ情報151を得る。続いてステップS132で紙原稿用紙中の文字認識する必要のある領域のイメージを切り出し認識対象の文字列(第2抽出文字列152)を抽出する第2文字列抽出処理を行う。続くステップS133で抽出した文字列152を含む情報に対する文字認識処理を行い、第2認識文字列153を生成する。次のステップS134の第2分解処理において、ステップ133で認識した第2認識文字列 153に対する文字列分解処理S134を行い、第2認識文字群154を得る。
【0041】
次にステップS135で正解類推処理を行い、先に登録した分器162に登録されている正解文字列145と第1認識文字群144を参照して正解文字列と類推する類推文字列155を類推する。あるいは、複数の類推した文字列をその正解確率と共に出力する(165)。
【0042】
以下に以上で説明した本実施の形態例の詳細を説明する。以下の説明では、処理対象の紙原稿用紙として柔道整復施術療養費支給申請書を処理する例を説明する。本実施の形態例で処理する柔道整復施術療養費支給申請書の例を図3に示す。図3は本実施の形態例で処理する柔道整復施術療養費支給申請書の例を示す図である。
【0043】
抽出する文字列は図3に402で示す負傷名であり、係る負傷名表示領域の表示文字列を文字認識してデジタルデータ化する例とする。例えば、図3に示す柔道整復施術療養費支給申請書401では、負傷名記載欄402は、プリンターにより印刷される。
負傷名印刷例を図4に示す。傷病名は例えば図4に501〜503で示すように印刷されている。なお、この文字列は印刷ではなく手書きされた文字列であってもよい。但し手書きの場合には、書き手によって文字認識の正解率が下がるため、印刷された文字列が望ましい。
【0044】
実際の処理では、処理対象の複数の柔道整復施術療養費支給申請書をイメージ読取装置130より読み取り、スキャニングした場合には、分類器生成処理102では、複数の柔道整復施術療養費支給申請書401を第1スキャンS111でイメージ情報として取り込み、読み込んだ枚数分の第1イメージ141を得る。
【0045】
次に、この複数の読み取りイメージ情報(第1イメージ141)に対してステップS112の第1文字抽出処理では、抽出するべき文字列の領域である例えば負傷名欄402を抽出し、第1抽出文字列142を得る。次にステップS113の文字認識処理(OCR処理)で文字認識処理を実行して第1認識文字列143を得る。柔道整復施術療養費支給申請書401の負傷名402は、例えば図4に示すように印刷されており、第1抽出文字列142を例えば図5に示すように文字認識したとする。
【0046】
この状態で第1認識文字列分解処理S114では、第1認識文字列143を一文字ずつに分解し、第1認識文字群144を作る。例えば、図5の認識文字列例601,602,603を、図6に示す第1認識文字群例701,702,703のように一文字ずつに分解する。
【0047】
第1エントリ処理では、中央処理装置100は表示装置110に第1スキャン処理で読み取ったイメージ情報を申請書データファイル230に登録すると共に、第1イメージ141の第1認識文字列143に該当する部分を表示して、オペレータがこの表示を確認して第1エントリ処理S115にて正解文字列145の入力を促す。
【0048】
例えば入力するべき文字列部分をハイライト表示などすることで、オペレータが入力するべき対象を目視確認できる。この文字列を確認したオペレータは、ハイライト表示されている読み取りイメージを目視確認しながら正解文字列145を順次打ち込むことになる。
例えば、図7の正解文字列例801,802,803である。なお、このエントリを二回行い、その結果を突き合わせることによりデータの正確性を向上させることもある。
【0049】
このようにしてえた正解文字列145と第1認識文字群144を対応付けて分類器162に登録する。本実施の形態例の分類器生成処理S116では、第1認識文字群144と正解文字列145のペア146を作る。たとえば、具体例を示すと図8に示すペア901,902,903ようになる。分類器生成処理S116では、第1認識文字群と正解文字列のペア146を多数集めて、必要数が収集できてから例えば機械学習アルゴリズムにより分類器162を生成する。
【0050】
機械学習アルゴリズムには、ナイーブベイズやサポートベクトルマシンなど様々な種類があり、本実施の形態例でも採用可能である。機械学習アルゴリズムの詳細をナイーブベイズを例に説明する。ナイーブベイズは、二つのクラス間で、ある属性が与えられたとき、どちらのクラスに属する確率が高いかを確率として判定する。本例では、属性とは、認識文字群であり、クラスとは、正解文字列である。分類器は、二つのクラス間で一つ作成される。本実施の形態例では、負傷名としての正解文字列は、400個程度あり、生成される分類器はその組み合わせの数となり、例えば400×399/2=79,800個程度が生成される。
【0051】
分類器162の一つの例として、右膝関節捻挫902と左膝関節捻挫903のペアを比較する分類器を生成する場合を例として説明する。正解文字列145と第1認識文字群144の全てのペアから、正解文字列に、右膝関節捻挫902か左膝関節捻挫903が入るペアを取り出し、第1認識文字群の出現回数から確率を計算する。
【0052】
例えば、前記ペアの総数が100個であり、右額鸚挫W906の3文字目の鸚の出現回数が1であれば、右膝関節捻挫902か左膝関節捻挫903の分類器において、3文字目に鸚が属性として現れたとき、右膝関節捻挫902である確率は、1/100であり、左膝関節捻挫903である確率は、0となる。
【0053】
このように、属性毎の出現確率を計算し、掛け算した結果がトータルの確率となる。この場合、属性に出現確率ゼロがあると、トータルがゼロになってしまう。このような現象を避けるため、出現確率計算の分子と分母に1を和し、かつ、Log関数を掛け、掛け算を和算に変換している。
【0054】
新たな認識文字群が与えられると、分器は例えば79,800個あり、この中から新たな認識文字群が出現する確率の高いクラス、すなわち正解らしい類推文字列を選択し、最も多く選択された類推文字列を正解であると類推する。
【0055】
認識文字列を一文字ずつに分解する以外の方法としては、Bag of Wordsと呼ばれる方法がある。Bag of Wordsとは、まず、全てのOCR認識文字をユニークに集めた集合を作る。認識文字群の文字が、その集合に含まれていればTrueとし、含まれていなければFalseとする表を作り、属性とする方法である。本実施の形態例の分類器生成処理で一文字ごとでなくBag of Wordsを用いたばあいは、後述する正解類推処理でもBag of Wordsを使う。
【0056】
前記した機械学習アルゴリズムに前記の分類器を設定し、認識文字群を与えると、正解文字列を類推し、またその確率を返す。分類器の正確性を向上するためには、第1認識文字群と正解文字列のペアを多く集める必要がある。柔道整復施術療養費支給申請書401は、1ヶ月単位で集計されるので、少なくとも1ヶ月分の柔道整復施術療養費支給申請書401を読み込み、1ヶ月分の柔道整復施術療養費支給申請書401イメージから分類器162を生成する。
【0057】
更に、翌月分の誤読補正では、今月分のイメージと認識文字列と正解文字列も使い、分類器生成処理S102を行う。今月分のイメージと認識文字列と正解文字列は既にあるので、第1スキャンS111、第1エントリS115、第1文字列抽出S112、第1文字列認識S113は不要となることから、スキャンを二回行う必要が無くなり、連続してスムーズに、かつ、精度を高めながら運用することができる。
【0058】
機械学習アルゴリズムとしては、サポートベクトルマシーン(SVM)やニューロなどがあるが、分類器を生成できる機械学習アルゴリズムであれば、これらに限定されるわけでない。
【0059】
次に、正解類推処理部103の詳細を説明する。処理対象の新たな複数の柔道整復施術療養費支給申請書をイメージ読取装置130にセットして第2スキャン処理S131でイメージの読み込みを行い、複数の第2イメージ151を得る。
この第2イメージ151から第2抽出文字列152を抽出する第2文字列抽出処理S132はステップS112の第1文字列抽出処理と同様であるため詳細説明を省略する。
抽出した第2抽出文字列152はステップS113の第1認識文字列認識処理と同様の第2文字列認識処理S133でそれぞれ文字認識され、第2認識文字153は第1文字列分解処理と同様の第2文字列分解処理134で第2認識文字群154に分割される。
【0060】
ステップS135の正解類推処理では、分類器162を先の機械学習に設定し、第2認識文字群154を機械学習に与えることにより、類推文字列155を得る。
第2認識文字群154が右,額,鸚,挫,W,1102であった場合、前記の79,800個の分類器に属性として右,額,鸚,挫,W,1102を投入すると、右膝関節捻挫902か左膝関節捻挫903の分類器からは、右膝関節捻挫902の確率が高く返り、右膝関節捻挫902が類推文字列の候補として選択される。同様に、全ての分類器で試すと、右膝関節捻挫902が類推文字列の候補として選択される数が最も多く、類推文字列155として選択される。
【0061】
あるいは、正解類推135が一つの第2認識文字群154に対して、機械学習に指示し、複数の類推文字列とその確率165を得ることもできる。
この場合に学習効果の具体例と、認識文字群である154に対して具体的に類推された複数の類推文字列とその確率165のエントリでの使用方法の具体例を以下に示す。
印字されている文字列が「右膝関節捻挫」で、文字認識結果が「告関節捻挫」と誤認識することがあり、印字されている文字列が「左膝関節捻挫」で、文字認識結果が「告関節捻挫」と誤認識することもある。もちろん、分類器162の確率としては、「右膝関節捻挫」が高くでるが、「左膝関節捻挫」の確率もある程度の確率となる。
類推結果をエントリに用いる場合には、「右膝関節捻挫」を第一候補として表示するが、「左膝関節捻挫」も第二候補として表示すると、エントリの効率が上がる。
【0062】
〔第2の実施の形態例〕
以上の説明は予め例えば標準紙原稿等をスキャンし、認識した全ての文字列から分類器162を生成し、次に、処理対象の紙原稿をスキャンして先に生成した分類器162を用いて正解文字列を類推する例について説明した。
【0063】
しかし本発明は以上の例に限定されるものではなく、予め全ての負傷名を登録したマスター163を生成しておき、認識文字列と同じ負傷名が登録されているか比較し、登録されていなければ誤読と判断するように、制御してもよい。分類器162を誤読文字群と正解文字列のペアから生成し、類推するときも誤読文字列のみを使用することも考えられる。この場合には高い正確性が期待できる。
【0064】
このように構成した本発明に係る第2の実施の形態例を以下に説明する。
図9は、本発明に係る第2の実施の形態例の概略処理を示すフローチャートである。図9において、上述した図2のフローチャートに示す処理と同様処理には同一ステップ番号を付し詳細説明を省略する。
【0065】
第1スキャン処理ステップS111、第1文字列抽出処理ステップS112、第1文字列認識ステップS113,第1文字列分解ステップS114,第1エントリ処理ステップS115、第2スキャン処理ステップS131、第2文字列抽出処理ステップS132、第2文字列認識ステップS133,第2文字列分解ステップS134は、図2に示す第1の実施の形態例の処理と同様である。
【0066】
第2の実施の形態例で用いるマスター163には、予め全ての負傷名が登録されており、400種類ほどである。ステップS112の第1文字列認識処理で抽出された例えば図5に示す第1認識文字列143を抽出すると、ステップS213に示す第1マスター比較処理に進み、第1認識文字列143について、順次マスター163を参照してマスター163に登録されている文字列か否かを比較する。
【0067】
そして、第1認識文字列の中で登録されていない文字列を第1誤読文字列243として選ぶ。例えば図5の文字列が認識された時には、図10の誤読文字列例の「右額鸚挫W 」1002は、マスター163に登録された負傷名に含まれておらず、誤読文字列と判定する。
【0068】
なお、マスター163に登録されている文字列が第1抽出文字列142内に含まれていた場合には、第1エントリ処理ステップS116でのエントリが必要なく正解文字列であると判定してもよい。
【0069】
第1マスター比較処理S213に次いで、第1誤読文字列分解処理S114では、第1誤読文字列243を一文字ずつに分解し、第1誤読文字群144を作る。例えば、図10に示す誤読文字群例の「右額鸚挫W 」1001を図11に示す第1誤読文字群例1102のように一文字ずつに分解する。
【0070】
次に、分類器生成処理ステップS216では、第1誤読文字群144と正解文字列145のペアである第1誤読文字群と正解文字列のペア246を作る。例えば、第2の実施の形態例では、第1誤読文字群と正解文字列のペア246は図12に示す1202に示すペア文字列となる。
【0071】
なお、分類器生成216は、第2の実施の形態例でも、第1誤読文字群と正解文字列のペア246を多数集めてから機械学習アルゴリズムにより分類器222を作る。
【0072】
次に、図9の右側に示す正解類推部処理ステップS203を説明する。新たな複数の柔道整復施術療養費支給申請書を図2の第2スキャン処理ステップS131と同様の処理でイメージ読み取りを行い、所定数の第2イメージ151を得る。
次に、得られた複数の第2イメージ151に対して図2と同様のステップS132の第2文字列抽出処理で第2抽出文字列152を得る。
次に、得られた複数の第2抽出文字列152に対して図2と同様のステップS133の第2文字列認識処理で第2誤読文字列153を得る。
【0073】
続くステップS233の第2マスター比較処理では、第2誤読文字列153についてマスター163を参照し、マスター163に登録されていない第2認識文字列153が検出された場合には、検出された文字列を第2誤読文字列253として取り出す。
【0074】
次に、ステップS134の第2誤読文字列分解処理では、第2誤読文字列253を一文字ずつに分解し、第2誤読文字群154を作る。
次に、ステップS235の正解類推処理において、分類器162を先の機械学習アルゴリズムに設定し、第2誤読文字群154を機械学習に与えて類推文字列255を得る。
【0075】
なお、第1の発明の実施の形態例と同様に、正解類推処理S235において、一つの第2誤読文字群253に対して、機械学習に指示し、複数の類推文字列とその確率265を得る様にしてもよい。
【0076】
第2の発明の実施の形態例によれば、高い正解率の認識文字列を得ることが出来ると共に、マスター163に負傷名を登録しているため、認識文字列が正解か否かを判断するに際し、対象を容易に絞ることが出来る。
【0077】
〔第3の実施の形態例〕
次に、本発明に係る第3の実施の形態例を説明する。第3の実施の形態例に係る文字列認識誤読補正方法の概略を図13を参照して説明する。図13において、上述した図2に示す処理及び図9に示す処理と同様処理には同一ステップ番号を付し詳細説明を省略する。
図13に示す第3の実施の形態例は、図2に示す誤読補正方法を改良したものであり、第1スキャン処理S111、第1文字列抽出処理S112、第1文字列認識処理S113、第1エントリ処理S115、第1文字列分解S114、第2スキャン処理S131、第2文字列抽出処理S132、第2文字列認識処理S133、第2文字列分解S134は図2に示す処理と同様である。
第3の実施の形態例においても、第2の実施の形態例と同様にマスター163には全ての負傷名が登録されている。
【0078】
図13において、ステップS313の第1類似文字列検索処理においては、第1認識文字列144に関してマスター163から対応する複数の類似文字列343を取り出す。たとえば、第1認識文字列144が図14に示す曹部挫傷1301であった場合を例として説明する。
【0079】
この場合、第1類似文字列検索処理S313では、類似する複数の類似文字列343として、図16に示す背部挫傷1311、臀部挫傷1312、殿部挫傷1313、腰部挫傷1314を検索して抽出したとする。文字の類似度としては、たとえばレーベンシュタイン編集距離などを使う。
【0080】
第1エントリ処理S115から得た正解文字列145が、図15に示す背部挫傷1401であったとすると、第1中断判定処理S317では、この正解文字列である背部挫傷1401が複数の類似文字列343の中にある背部挫傷1311に一致するため、分類器生成処理S318に進む。
【0081】
一方、第1エントリ処理S115から得た正解文字列145が、図15に示す大腿部捻挫1411であったとすると、第1中断判定処理S319においては、大腿部捻挫1411に対しては複数の類似文字列343の中に一致する文字列がないため、分類器生成処理S318に進まず、処理を中断する。
【0082】
第1認識文字列144が曹部挫傷1301であり、その正解文字列145が大腿部捻挫1411であった場合においては、類似性が低い。このようなデータから分類器を生成することはノイズを増やし計算量を増すのみで精度を向上させないため、誤読補正処理の分類器生成処理を中断する。
【0083】
あるいは、第1文字列抽出処理S112において、柔道整復施術療養費支給申請書401の負傷名の位置検出に失敗したような場合で、右隣の負傷年月日を読んでしまい、第1抽出文字列142が図14の“23・9・5”1302であったような場合では、第1類似文字列検索処理S313においては類似文字列を検索することが出来ず、類似文字列を返すことが出来ないため、第1中断判定処理S319では、分類器生成処理S318に進まず、分類器への登録処理を中断する。
【0084】
第1抽出文字列142が“23・9・5”1302である様な場合には、その正解文字列145が何であろうと、類似性が低い。このようなデータから分類器を生成することはノイズを増やし計算量を増すのみで精度を向上させないため、この場合にも分類器生成処理を中断する。
【0085】
次に、たとえば、第1抽出文字列142が図14に示す曹部挫傷1301であったとすれば、第1文字列分解処理S144は、図16に示す曹,部,挫,傷,,,,,,,1501のように分解し、第1認識文字群144を生成する。
【0086】
次に、分類器生成処理S318は、第1認識文字群144と関連付けられている正解文字列145のペアである第1認識文字群と正解文字列のペア146を作る。たとえば、図17に示すように曹,部,挫,傷,,,,,,,背部挫傷1601である。このデータを多数集めて、機械学習アルゴリズムで分類器162を作成する。
【0087】
サポートベクトルマシン(SVM)に代表される機械学習の分類器は、一つの正解文字列ともう一つの正解文字列とのどちらに分類するのかという分類器が多数集まって構成される。曹,部,挫,傷,,,,,,,背部挫傷1601というデータは、背部挫傷vs大腿部挫傷という分類器の生成にも利用される。
【0088】
しかし、曹部挫傷1301の複数の類似文字列343である背部挫傷1311、臀部挫傷1312、殿部挫傷1313、腰部挫傷1314を考慮して、曹,部,挫,傷,,,,,,,背部挫傷1601というデータを背部挫傷vs臀部挫傷、背部挫傷vs殿部挫傷、背部挫傷vs腰部挫傷という分類器162の生成にのみ利用することで、分類器162を生成する計算量を減らし、精度を上げることもできる。
【0089】
次に、図13の右側に示す正解類推処理S303を説明する。新たな複数の柔道整復施術療養費支給申請書を第2スキャン処理S131でスキャンし、複数の第2イメージ151を得る。
次に、得られた複数の第2イメージ151に対して第2文字列抽出処理S132では、第2抽出文字列152を得る。
次に、得られた複数の第2抽出文字列152に対して第2文字列認識処理S133において、第2認識文字列153を得る。
【0090】
第2類似文字列検索S333では、第2認識文字列153についてマスター163から複数の類似文字列353を取り出す。
第2認識文字列153に似た文字列がマスター163内に登録されておらず検索できない場合、第2中断判定処理S339における判定で正解類推処理を中断する。
【0091】
第2文字列分解処理S134においては、第2認識文字列153を分解し、第2認識文字群154を生成する。
次に、正解類推処理S235においては、分類器162を先の機械学習アルゴリズムに設定し、第2認識文字群154を機械学習アルゴリズムに与えると、類推文字列355を生成することが出来る。
【0092】
あるいは、正解類推処理S235において、一つの第2認識文字群154に対して、機械学習に指示し、複数の類推文字列とその確率365を得ることができる様に構成してもよい。
分類器生成処理S318では、似た文字列(類似文字列)が検索されない場合には処理を中断し、認識文字列のデータは分類器162の生成には使われなかった。このため、正解類推処理S338でも同様に、似た文字列(類似文字列)が検索されない場合には正解類推処理を中断する。しかしながら、類推が当たる可能性もあるため、正解類推処理を中断せずに続行する様にしてもよい。
【0093】
また、複数の類似文字列353を対象とする分類器162のみを参照して類推するように機械学習に指示することにより、機械学習は類推する範囲を絞り込むことができ、類推に必要な計算時間が大幅に減少することが出来る。
【0094】
例えば、第2類似文字列検索処理S333で検索された複数の類似文字列が、背部挫傷1311、臀部挫傷1312、殿部挫傷1313、腰部挫傷1314であった場合、その組み合わせである、背部挫傷vs臀部挫傷、背部挫傷vs殿部挫傷、背部挫傷vs腰部挫傷、臀部挫傷vs殿部挫傷、臀部挫傷vs腰部挫傷、殿部挫傷vs腰部挫傷という分類器のみで確率を計算することにより、計算量を大幅に減らすことができる。
【0095】
さらに、類似度を確率の計算に加えて、精度を高めることができる。例えば、第2類似文字検索S333において類似度を広くして検索すると、曹部挫傷1301の類似文字列として、大腿部挫傷も類似文字となる。背部挫傷は、曹部挫傷から一文字違いであり、大腿部挫傷は二文字違いである。この類似度の相違を確率計算に反映することにより、精度を高めることができる。
【0096】
さらに、第2類似文字列検索S333の前に、第2認識文字列の内、明らかな誤読文字を正解文字に置き換えてしまう処理も精度の向上に有効である。たとえば、第2認識文字列が、治下腿部挫傷Wであった場合、治下腿部を右下腿部と置き換えてから、第2類似文字列検索S333を行うことにより、第2類似文字列353に正解文字列が含まれる確率が上がり、精度が向上する。
【0097】
〔第4の実施の形態例〕
次に、本発明に係る第4の発明の実施の形態例を図18のフローチャートも参照して説明する。以上で説明した第1乃至第3の実施の形態例では、分類器生成処理、正解類推処理をそれぞれ1種類揃える例を説明した。しかし本発明は以上の例に限定されるものではなく複数種類備えてもよい。或いは、それぞれの例を2回、或いはそれ以上繰り返し実行してもよい。
【0098】
第4の実施の形態例では、異なる二種類のイメージ処理を行うこととし、それぞれイメージ読み込み処理、文字認識処理を行うこととし、それぞれの処理を文字認識処理Aと文字認識処理Bと呼ぶ。第4の実施の形態例では分類器生成部と正解類推部も二つ用意する。
【0099】
分類器生成処理部S1702として.第1文字列抽出・認識処理S1711と分類器生成処理S1712を実行する。正解類推処理S1703では、第2文字列抽出・認識処理S1713、正解類推処理S1714を実行する。そして、類推文字列1715、あるいは、複数の類推文字列とその確率1716と共に生成する。
【0100】
一方、分類器生成処理部S1704として.第3文字列抽出・認識処理S1721と分類器生成処理S1722を実行する。正解類推処理S1705では、第4文字列抽出・認識処理S1723、正解類推処理S1724を実行する。そして、類推文字列1725、あるいは、複数の類推文字列とその確率1726と共に生成する。
【0101】
第4の実施の形態例では、例えば2つの分類器生成処理の一方を第1の実施の形態例の分類器生成処理を行うように制御し、分類器生成処理1704は第2実施の形態例の処理を採用するようにしてもよい。
【0102】
例えば、異なる文字列抽出、認識処理は、異なる文字認識能力を持ち、当該処理から生成される分類器1621と分類器1622の登録内容が異なるものとなる。このことから、正解類推処理S1714と正解類推処理S1724とは、異なる根拠に基づき、誤読文字群から類推文字列1715と類推文字列1725とを選び出す。
【0103】
第4の実施の形態例においては、異なる認識方法で生成した類推文字列1715,1725をステップS1731の比較処理S1731が取り込み、類推文字列1715と類推文字列1725とを比較し、合致していれば類推文字列1732を出力し、合致していなければ合致せずと出力する。合致しない場合でも、どちらかが正解である確率は上がり、改善される。
【0104】
あるいは、合致しない場合でも、第3の実施の形態例の処理を適用し、正解類推1714と正解類推1724が機械学習に指示し、複数の類推文字列とその確率1716と複数の類推文字列とその確率1726を得た場合、確率の高い類推文字列を選択することで、正解である可能性が高まる。
本実施例では、二種類の文字認識処理を利用する例を示したが、三種類以上の文字認識方法を適用することも可能である。
【0105】
〔第5の実施の形態例〕
本発明に係る第5の実施の形態例を図19を参照して説明する。第5の実施の形態例において、上記した各実施の形態例と異なるところを主に説明する。
第5の実施の形態例は、上記各実施の形態例で得られた類推文字列115を入手後の活用に特徴を有している。たとえば、操作者が第2イメージ151の負傷名を参考としながらエントリする必要がある様な場合には中央処理装置100は表示装置110に図19に示すエントリ画面1801を表示する。
【0106】
エントリ画面1801には、第2イメージ151を表示するエリア1802があり、その中に表示された負傷名でエントリされる負傷名にハイライト1803が施され、その負傷名の拡大1804を右上に表示するように制御する。右側には負傷名のエントリエリア1806が設けられるようにする。
【0107】
類推文字列155をエントリエリア1806の下にエントリ候補文字1807として表示する。このため、操作者は、負傷名の拡大1804とエントリ候補文字1807とが等しければ、エンターキーを入力するのみの操作でエントリ候補文字1807が負傷名のエントリエリア1806に入力され、次のエントリエリアに自動的にカーソルを移動させる。これによりエントリに要する時間が大幅に短縮する。
【0108】
〔第6の実施の形態例〕
本発明に係る第6の実施の形態例を図20を参照して説明する。第6の実施の形態例において、上記した各実施の形態例と異なるところを主に説明する。
【0109】
第6の実施の形態例は、上記各実施の形態例で得られた複数の類推文字列とその確率165を入手後の活用に特徴を有している。たとえば、操作者が第2イメージ151の負傷名を参考としながらエントリする必要がある様な場合には中央処理装置100は表示装置110に図20に示すエントリ画面1801を表示する。
【0110】
第6の実施の形態例では、例えば第1の実施の形態例における類推文字列165とその確率とを入手後の有効活用処理に特徴を有している。たとえば、オペレータが第2イメージ151の負傷名を参考として正解文字列を見て、エントリするときに、エントリ画面1801を表示させる。エントリ画面1801には、第2イメージ151を表示するエリア1802があり、その中に表示された負傷名でエントリされる負傷名にハイライト1803が施され、その負傷名の拡大1804が右上に表示され、その負傷名のエントリエリア1806が設けられている。
【0111】
具体的には、例えば以下のように類推文字列を確率の高い順に表示し、正解文字列の特定を容易にしている。複数の類推文字列とその確率を得たとする。例えば、類推文字列の一つ目が「右膝関節捻挫」でその確率が50%であり、類推文字列の二つ目が「右肘関節捻挫」でその確率が30%であり、類推文字列の三つ目が「右肩関節捻挫」でその確率が20%であり、和した確率値が80%となったら表示を中止とする。
【0112】
「右膝関節捻挫」の確率が50%で一番高く、「右肘関節捻挫」の確率が30%と二番目に高い。確率を和すると80%となり、ここまでの表示となる。すなわち、右膝関節捻挫1901と右肘関節捻挫1902が表示される。
【0113】
オペレータは、右膝関節捻挫1901と右肘関節捻挫1902の表示に対して、負傷名の拡大1104と等しい方を選択し、エンターキーを入力することにより、選択した類推文字列が負傷名のエントリーエリア1806に入力され、次のエントリーエリアにカーソルが移動する。これによりエントリーに要する時間が短縮し、かつ、正解の類推文字列が現れる確率が増加する。
第6の実施の形態例によれば正解文字列の特定が極めて簡単な操作で確実に行うことができる。
【0114】
以上、本発明に係る誤読補正方法について説明したが、本発明にかかる誤読補正方法は、上述した実施形態例にのみ限定されるものではなく、本発明の範囲で種々の変更実施が可能であることは言うまでもない。
【産業上の利用可能性】
【0115】
図21を用いて、本発明の産業上の利用例を説明する。例えば、診療報酬請求書などの中に印刷された傷病名等をデータ化するときは、高い正確性が求められる。そのため本発明の誤読補正方法適用前の従来の処理2001では、手入力による第1エントリ処理2012と第2エントリ処理2013が異なるオペレータにより行われ、その二つのエントリ結果を比較し合致しないデータを取り出す、異なるデータ取出し2014が行われ、その合致しないデータに関してエントリを行う第3エントリが行われる。
【0116】
本発明に係る誤読補正方法適用後2002では、第1エントリ2012を廃止し、本発明に係る各実施の形態例の誤読補正方法で出力したデータを異なる取り出しデータに代わりに用いる。このことにより、エントリする件数を大幅に減らすことが出来る。このような高い正確性が求められるデータ化は、処方された薬品名など数多く存在し、エントリを2回行う運用は広く行われており、本発明の有効範囲も広い。
図1
図4
図5
図6
図7
図8
図10
図11
図12
図14
図15
図16
図17
図2
図3
図9
図13
図18
図19
図20
図21