特許6060134 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社プリマジェストの特許一覧

特許6060134情報処理装置及び情報処理方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
4
5
6
7
8
10
11
12
14
15
16
17
2
3
9
13
18
19
20
21

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】6060134

(24)【登録日】2016年12月16日

(45)【発行日】2017年1月11日

(54)【発明の名称】情報処理装置及び情報処理方法

(51)【国際特許分類】

G06K 9/03 20060101AFI20161226BHJP

【ＦＩ】

G06K9/03 Z

【請求項の数】9

【全頁数】20

(21)【出願番号】特願2014-231133(P2014-231133)

(22)【出願日】2014年11月13日

(65)【公開番号】特開2016-95662(P2016-95662A)

(43)【公開日】2016年5月26日

【審査請求日】2014年11月14日

(73)【特許権者】

【識別番号】599001389

【氏名又は名称】株式会社プリマジェスト

(74)【代理人】

【識別番号】100101306

【弁理士】

【氏名又は名称】丸山幸雄

(72)【発明者】

【氏名】佐藤広行

(72)【発明者】

【氏名】森田康裕

【審査官】 ▲広▼島明芳

(56)【参考文献】

【文献】特開２００４−０４６３９３（ＪＰ，Ａ）

【文献】特開２０１０−１７０４６１（ＪＰ，Ａ）

【文献】特開２００２−１８９９８５（ＪＰ，Ａ）

【文献】特開平１１−２８２９６４（ＪＰ，Ａ）

【文献】特開２００９−１８７３６１（ＪＰ，Ａ）

【文献】特開２０００−１２３１１６（ＪＰ，Ａ）

【文献】特開平０５−１２８３００（ＪＰ，Ａ）

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ０６Ｋ９／０３

(57)【特許請求の範囲】

【請求項1】

イメージ情報を表示する表示手段を備え、
処理対象原稿をイメージ情報として取得するイメージ取得手段と、
前記イメージ取得手段で取得したイメージ情報中の必要文字列を前記表示手段に表示し当該表示を確認して入力される文字列を正解文字列として取得する正解文字列取得手段と、
前記イメージ取得手段で取得したイメージ情報中の必要文字列を抽出して文字認識する認識手段と、
前記認識手段で認識した文字認識結果と前記正解文字列取得手段で取得した対応する正解文字列とを関連付けて予め登録する分類器と、
前記分類器に関連付けて登録されている認識結果と正解文字列とを参照して新に文字認識した認識結果に対する正解文字列を類推する類推手段を備え、
前記分類器に登録する認識結果には、前記認識手段で認識した前記イメージ情報中の必要文字列に対応する認識文字群が前記正解文字列と関連付けて登録されることを特徴とする誤読補正方法。

【請求項2】

更に予め正解文字列が登録されている登録マスターと、
前記認識手段が認識した前記必要文字列認識結果が前記登録マスターに登録されているか否かで誤認識文字列か否かを判定する判定手段と、
前記判定手段が誤認識文字列と判定した前記必要文字列認識結果を取り出す誤認識文字列抽出手段とを備え、
前記類推手段は、前記誤認識と判定した文字列から正解文字列を類推することを特徴とする請求項１記載の誤読補正方法。

【請求項3】

更に予め正解文字列が登録されている登録マスターと、
前記登録マスターに前記認識結果と類似する文字列が登録されているか否かを判定し類似する文字列を読み出す読み出し手段と、
前記読み出し手段で類似する文字列が登録されていない場合には前記認識手段で認識した認識結果の前記分類器への登録を中止すること特徴とする請求項１記載の誤読補正方法。

【請求項4】

更に予め正解文字列が登録されている登録マスターと、
前記登録マスターに前記認識結果と類似する文字列が登録されているか否かを判定する判定手段と、
前記登録マスターに前記認識結果と類似する文字列が登録されていない場合には前記認識手段で認識した認識結果の前記分類器への登録を中止する登録中止手段と、
前記判定手段が新たに文字認識した文字列に類似した文字列が前記登録マスターに登録されている場合には類似する文字列を読み出す読み出し手段と、
前記分類器に関連付けて登録されている認識結果と正解文字列とを参照して新に文字認識した認識結果に対する正解文字列を類推すること特徴とする請求項１記載の誤読補正方法。

【請求項5】

前記類推手段が、複数の類推文字列を確率付きで類推することを特徴とする請求項１乃至請求項４のいずれかに記載の誤読補正方法。

【請求項6】

前記認識手段は、複数種類の文字認識方法でそれぞれ文字認識を行い、
前記の分類器にはそれぞれ文字認識した認識結果と前記正解文字列取得手段で取得した対応する正解文字列とを関連付けて予め登録することを特徴とする請求項１乃至請求項５のいずれかに記載の誤読補正方法。

【請求項7】

前記類推手段が類推した類推文字列を前記表示手段に表示する類推文字列表示手段を備え、
前記表示手段により表示された類推文字列を参照して認識文字列を補正可能とすることを特徴とする請求項１乃至請求項６のいずれかに記載の誤読補正方法。

【請求項8】

類推文字列表示手段は、前記類推手段が類推した複数の類推文字列を正解確率の高い順番に表示し、かつ、正解確率の和が一定値に達するまで類推文字列を表示することを特徴とする請求項７記載の誤読補正方法。

【請求項9】

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、取得したイメージ情報中から文字認識処理で認識した文字列認識結果の補正を効率的に行うことができる情報処理装置及び情報処理方法に関し、例えば、認識された文字列と予め登録された文字列とを比較して認識された文字列補正を可能とした情報処理装置及び情報処理方法に関するものである。

【背景技術】

【0002】

デジタル情報技術が普及した現在であるが、紙原稿は情報伝達の媒体としてなお広く使われている。紙原稿に記載された情報を高い精度でデジタルデータ化する場合、データ化する文字をキーボードなどから手入力により入力していた。特に大量の手入力を行う場合には、異なる入力者が同一原稿から同一文字をそれぞれ入力するダブルエントリ処理が行われ、入力された結果が同一であれば（一致すれば）正しく入力されたとしてエントリ結果のデータを採用し、入力結果が異なった場合にはいずれかの入力が誤っていたとして入力文字の確認を行っていた。

【0003】

手入力によるエントリに代わる方法として、ＯＣＲ（光学式文字読取）装置で紙原稿の文字列部分の文字データを認識し、データ化する方法も広く採用されている。スキャナの解像度の向上や画像解析技術の発達により、高い認識精度を得られるようになってはいるが、どうしても誤認識が避けられず、認識の精度の問題があり、ＯＣＲ装置による大量の文字認識処理では手入力によるエントリに代わる方法にはなりえていない。

【0004】

例えば、診療報酬請求書などは電子化が進んでいるが、なお紙媒体で提供されることもある。その中には、印刷された傷病名等をデータ化する必要があり、データ化には高い精度が求められる。そのため、手入力によるエントリが２回行われ、そのエントリ結果が合致すればそのデータを採用し、合致しなければ再度エントリして合致したデータを採用することが行われているが、その労力は膨大なものとなっている。

【0005】

この点を改良すべくＯＣＲ装置で誤認識した文字データに対して、正解データの単語辞書と照会し、文法規則を用いてチェックして日本語文章として妥当な候補文字列を生成し、その候補文字列に対して、単語長、単語の出現頻度などから評価値を算出し、評価値が最大の候補文字列を誤読の補正結果とする方法（特許文献１）が提案されている。

【0006】

ＯＣＲ装置で読み取られる文字のなかで誤認識され易い文字を集めた類似単語辞書を用意し、誤認識と判定されたら類似辞書を参照して、同じ誤読文字を見つけて正文字と置換し、同じ誤読文字が見つからない場合、あるいは、置換後でも誤認識されやすい文字を含む場合、誤認識の可能性があると容易に認識できるマークに置換する方法も提案されていた（特許文献２）。

【先行技術文献】

【特許文献】

【0007】

【特許文献1】特開平０７−０２８９５６号公報

【特許文献2】特開２０１１−１５０４３６号公報

【発明の概要】

【発明が解決しようとする課題】

【0008】

しかしながら、従来のＯＣＲ装置による文字認識処理により、手入力によるエントリの一方をＯＣＲ処理に置き換えるためにはどうしても９０％を上回る正解率が必要である。ＯＣＲ装置の読取解像度の向上や画像解析技術の発達により、高い認識精度を得られるようになってきているが、従来ではどうしても正解率が９０％を下回ることが多い。
このため、ＯＣＲ装置による文字認識処理を用いたが誤認識した文字からより確からしい文字を類推し９０％を上回る正解率を提供する方法が望まれていた。

【0009】

即ち、ＯＣＲ処理では、イメージから一つの文字の描かれている範囲を判断し、その一つの文字を認識する。このため、一つの文字範囲の判断で誤ったり、一つの文字の認識で誤ったりし、誤りの原因は多様である。正解率を上げるにはこのような多様な誤認識に対して、正解文字を類推する方法が必要となる。

【0010】

特許文献１では、ＯＣＲ装置で誤認識した文字データに対して、正解データの単語辞書と照会している。ＯＣＲの誤認識では、「右膝関節捻挫」を「右額鸚挫Ｗ」のように複数文字を誤認識することも多く、正解データの単語辞書と単純に照会しても候補文字列を探し出すことが難しい。また、日本語文章として妥当かどうかの判断も、ただの単語である傷病名では意味を持たない。

【0011】

特許文献２では、「誤認識されやすい文字を特定し」とあり、例えば「口」（漢字のクチ）と「ロ」（カタカナのロ）を挙げている。ＯＣＲは、「右膝関節捻挫」を「右額鸚挫Ｗ」のように誤認識したりする。すなわち、文字範囲の切出しに失敗して２文字を１文字で認識したり（「関節」を「鸚」と）、文字の後ろにあるノイズを文字と認識したり（「挫」を「挫Ｗ」と）する。このため、文字単位の置換だけでは、正解率を上げることが難しい。

【課題を解決するための手段】

【0012】

本発明は上記の問題点を解決し、ＯＣＲ装置で読み取った原稿文字列の正解率を向上させることが出来る情報処理装置及び情報処理方法を提供することを目的としてなされたもので、係る目的を達成する一手段として例えば以下の構成を備える。

【0013】

すなわち、イメージ情報を表示する表示手段を備え、処理対象原稿をイメージ情報として取得するイメージ取得手段と、前記イメージ取得手段で取得したイメージ情報中の必要文字列を抽出して文字認識する認識手段と、前記イメージ取得手段で取得したイメージ情報中の必要文字列を前記表示手段に表示し当該表示を確認して入力される文字列を正解文字列として取得する正解文字列取得手段と、前記認識手段で認識した認識文字列と前記正解文字列取得手段で取得した対応する正解文字列とを関連付けて予め登録する分類器と、前記分類器の登録文字列ペアを参照して新に文字認識した文字列の正解文字列を類推する類推手段を備えることを特徴とする。

【0014】

そして例えば、更に予め正解文字列が登録されている登録マスターを備え、前記認識手段が認識した文字列が前記登録マスターに登録されているか否かで誤認識文字列か否かを判定する判定手段と、前記判定手段が誤認識文字列と判定した認識文字列を取り出す誤認識文字列抽出手段と、前記分類器の登録文字列ペアを参照して新たに文字認識した文字列のうち誤認識と判定した文字列から正解文字列を類推する類推手段を備えることを特徴とする。

【0015】

又例えば、更に予め正解文字列が登録されている登録マスターを備え、前記登録マスターに前記認識文字列と類似する文字列が登録されているか否かを判定し類似する文字列を読み出す読み出し手段と、前記読み出し手段で類似文字列が抽出されない場合には前記認識手段で認識した認識文字列の前記分類器への登録を中止すること特徴とする。

【0016】

更に例えば、予め正解文字列が登録されている登録マスターを備え、前記登録マスターに前記認識文字列と類似する文字列が登録されているか否かを判定する判定手段と、前記登録マスターに前記認識文字列と類似する文字列が登録されていない場合には前記認識手段で認識した認識文字列の前記分類器への登録を中止する登録中止手段と、前記判定手段が新たに文字認識した文字列に類似した文字列が前記登録マスターに登録されている場合には類似する文字列を読み出す読み出し手段と、前記分類器に関連付けて登録されている認識文字列と正解文字列とを参照して新に文字認識した文字列に対する正解文字列を類推すること特徴とする。

【0017】

又例えば前記認識手段は、複数種類の文字認識方法でそれぞれ文字認識を行い、前記の分類器にはそれぞれ文字認識した認識文字列と前記正解文字列取得手段で取得した対応する正解文字列とを関連付けて予め登録することを特徴とする。

【0018】

更に例えば、前記類推手段が類推した類推文字列を前記表示手段に表示する類推文字列表示手段を備え、前記表示手段により表示された類推文字列を参照して認識文字列を補正可能とすることを特徴とする。

【0019】

又例えば、類推文字列表示手段は、前記類推手段が類推した複数の類推文字列を正解確率の高い順番に表示し、かつ、正解確率の和が一定値に達するまで類推文字列を表示することを特徴とする。

【0020】

又例えば、前記認識手段で認識した認識文字列を各文字毎に分離する分離手段を備え、前記分類器には、前記認識文字列として分離手段で分離した認識文字列の分離した文字群を前記正解文字列と関連付けて登録することを特徴とする。

【発明の効果】

【0021】

本発明によれば、例えばＯＣＲ装置等で読み取った原稿文字列の正解率を向上させることが、例えば正解率を９０％以上に向上させることができる情報処理装置及び情報処理方法を提供出来る。

【図面の簡単な説明】

【0022】

【図1】本発明に係る一発明の実施の形態例の情報処理システムの基本構成を示すブロック図である。

【図2】本発明に係る一発明の実施の形態例の文字列認識処理の概要を説明するための機能図である。

【図3】本実施の形態例で処理する柔道整復施術療養費支給申請書の例を示す図である。

【図4】本実施の形態例で用いる柔道整復療養費支給申請書に印刷された負傷名の例を示す図である。

【0023】

【図5】本実施の形態例で用いる柔道整復療養費支給申請書に印刷された負傷名をイメージ情報として読み取り文字認識して得た文字列の例を示す図である。

【図6】本実施の形態例における文字認識した文字列を一文字ずつに分解した例を示す図である。

【図7】本実施の形態例で読み取った申請書読み取りイメージ情報を確認して特定した正解文字列の例を示す図である。

【0024】

【図8】本実施の形態例で認識した文字列を一文字ずつ分解した文字列と対応する正解文字列を並べて表示した例を示す図である。

【図9】本発明に係る第２の実施の形態例の概略処理を示すフローチャートである。

【図10】第２の実施の形態例における誤読文字と判定された文字列の例を示す図である。

【図11】第２の実施の形態例の誤読と判定された文字列の一文字ずつ分解した文字列の例である。

【0025】

【図12】第２の発明の実施の形態例で用いる誤読と判定された文字列を一文字ずつ分解した文字列と正解文字列をペアにして比較している例を示す図である。

【図13】本発明に係る第３の発明の実施の形態例に係る誤読補正方法の概略を示すフローチャートである。

【0026】

【図14】第２の実施の形態例の文字認識した文字列の例と、認識文字列の類似文字列の例を比較可能に表示した例を示す図である。

【図15】第３の実施の形態例におけるエントリされた正解文字列の例を示す図である。

【図16】第３の実施の形態例において認識した文字列中の誤読文字列と判定した文字列を一文字ずつに分解した列と、誤読文字列に類似した文字列とを抽出した状態を示す図である。

【図17】第３の実施の形態例における誤読文字列を一文字ずつ分解した文字列と、正解文字列と判定した文字列をペア表示した例を示す図である。

【図18】本発明に係る第４の実施の形態例の誤読補正方法の動作を説明するためのフローチャートである。

【図19】本発明に係る第４の実施の形態例に係るエントリー画面の例を示す図である。

【図20】本発明の各実施の形態例におけるエントリー画面の例を示す図である。

【図21】本発明の各実施の形態例における誤読補正方法の効果例を説明するための図である。

【符号の説明】

【0027】

１００中央処理装置
１１０表示装置
１２０入力装置
１３０イメージ読取装置
１５０通信装置
１６０誤読補正処理部
１６２分類噐
１６３マスタ
２１０認識結果データベース
２２０正解文字列データベース
２３０申請書データベース
２４０認識領域抽出部
５００顧客端末

【発明を実施するための形態】

【0028】

以下、図面も参照して本発明に係る一発明の実施の形態例を詳細に説明する。
本発明に係る一発明の実施の形態例によれば、診療報酬請求書などの中に印刷された傷病名等をデータ化するときは、高い正確性が求められる。そのため、従来は手入力によるエントリーが２回行われ、そのエントリー結果が合致すればそのデータを採用し、合致しなければ再度エントリして合致したデータを採用することが行われているが、その労力は膨大なものとなっていた。

【0029】

手入力によるエントリーに代わる方法として、ＯＣＲ（光学式文字読取）で文字データを認識し、データ化する方法もあるが、従来は正解率が９０%を下回ることも多い。しかし、本発明に係る一発明の実施の形態例のＯＣＲ誤読補正方法によれば、ＯＣＲが誤読した文字に対して正解データを９０%以上の正解率で類推することができ、手入力によるエントリの一方をＯＣＲに代えることができ、データ化の労力を減らすことができる。

【0030】

〔第１の実施の形態例〕
図１は本発明に係る一実施の形態例の情報処理システムの基本構成を示すブロック図である。図１において、１００は本システムの各構成の全体制御を行なっている中央処理装置である。中央処理装置１００は、例えば、イメージ読取装置１３０を制御して読み取った紙原稿用紙（例えば帳票）読取イメージデータを申請書データファイル２３０に登録すると共に、認識領域抽出部２４０を制御して認識領域特定処理、特定した認識領域に記載された文字認識処理等を行うと共に、認識した文字列を認識結果データベース２１０に一時登録する処理も行う。

【0031】

１１０は表示装置であり、後述する各種の情報を表示する。１２０はキーボード等で構成された入力装置であり、必要に応じて表示装置１１０に表示された認識結果と読取イメージ情報を確認して認識結果の修正などを行うことができる。１３０は各種帳票などの紙原稿を読み取り、必要に応じて記載された特定領域の文字認識が可能なイメージ読取装置であり、帳票や紙に記載されている保険適用申請書等を高速で読み取りイメージ情報に変換すると共に、特定領域の文字情報を文字認識し、キャラクタデータに変換可能である。

【0032】

１５０は他の装置やシステムなどに通信媒体を介して通信することが出来る通信装置である。例えば治療院の治療院端末装置５００との間で各種のデータ通信が可能である。なお、図１では医院端末は１台のみ記載されているが、通信可能な治療院端末数に制限はなく、実際には数百台或いはそれ以上の医療端末との間での通信が可能である。なお、治療院よりの通信はデジタルデータの通信に限定されるものではなく、例えば書類をファクシミリ通信で送る場合も含まれる。

【0033】

２１０はイメージ読取装置１３０で読み取り認識された認識結果を一時的に登録する認識結果データベースであり申請書データファイル２３０と関連付けて読み出し可能に登録している。

【0034】

１６０は誤読補正処理部であり、詳細を後述するが、分類噐１６２、マスタ１６３などを備え、認識結果を例えば分類器１６２を用いて必要に応じて正解文字列データベース２２０に登録されている正解文字列を参照して補正する。２２０は申請書に記載されるべき傷病名などの文字列を正解文字列として予め登録する正解文字列データベースである。

【0035】

２３０は申請書データベースであり申請書のイメージ情報および記載内容の文字コード化データを登録している。
以上の構成を備える本実施の形態例の概略機能を図２を参照して説明する。本実施の形態例では、実際の文字列認識処理を行う前に、予め認識するべき文字列の正しい文字列である正解文字列１４５と紙原稿用紙から読み出した認識処理により認識された認識文字列とを互いに対応付けて分類器１６２に登録する処理を行う。

【0036】

図２の誤読補正方法（Ｓ１０１）において、まず左側の分類器生成処理Ｓ１０２を行う。最初に処理対象の紙原稿用紙を読み取り第１イメージ情報１４１を生成する第１スキャン処理Ｓ１１１を実行する。具体的には、認識処理対象の文字列が表示されている紙原稿用紙をイメージ読取装置１３０にセットする。そして入力装置１２０から指示して中央処理装置１００の制御下でイメージ読取装置１３０にセットされた紙原稿用紙をスキャンして紙原稿用紙のイメージ情報を習得して申請書データファイル２３０に登録する。

【0037】

続いてステップＳ１１２の第１文字列抽出処理に移行し、読み取った原稿（申請書）中の予め指定されている文字認識するべき文字列の領域を抽出し、第１抽出文字列１４２を抽出する。次のステップＳ１１３の第１文字列認識処理においてステップＳ１１２で抽出した第１抽出文字列１４２に対する文字認識処理を行い、認識結果としての第１認識文字列１４３を得る。
次のステップＳ１１４の第１文字列分解処理において、ステップ１１３で認識した第１認識文字列１４３に対する文字列分解処理Ｓ１１４を行い、第１認識文字群１４４を得る。

【0038】

又、第１スキャン処理（Ｓ１１１）で読み取った紙原稿イメージ情報は、例えば表示装置１１０に表示されるため、ステップＳ１１５の第１エントリ処理を行い、ステップＳ１１２の抽出文字列１４２に相当する領域の読み取りイメージ情報を確認しつつ当該領域に表示されている正解文字列１４５を例えば入力装置１２０から指示入力する。この処理は１回行えば足りるため、予め申請書に書き込まれる全ての文字列を全てエントリし終わった場合にはエントリ処理は行われない。
このようにして入力された同じ領域に表されている正解文字列１４５と、認識文字群１４４を対応付けてそれぞれ分類器１６２に登録する。

【0039】

全ての処理対象の文字列に対する正解文字列１４５及び第１認識文字群１４４のぺアの分類器１６２への登録がなされたときには、続いて具体的な認識処理を行う準備が完了したため、右側のステップＳ１０３の正解類推処理を実行することになる。

【0040】

まずステップＳ１３１で実際に処理対象の紙原稿用紙をイメージ読取装置１３０にセットしてイメージ読取処理を行い、読み取ったイメージ情報は申請書データファイル２３０に登録する第２スキャン処理を実行して第２イメージ情報１５１を得る。続いてステップＳ１３２で紙原稿用紙中の文字認識する必要のある領域のイメージを切り出し認識対象の文字列（第２抽出文字列１５２）を抽出する第２文字列抽出処理を行う。続くステップＳ１３３で抽出した文字列１５２を含む情報に対する文字認識処理を行い、第２認識文字列１５３を生成する。次のステップＳ１３４の第２分解処理において、ステップ１３３で認識した第２認識文字列１５３に対する文字列分解処理Ｓ１３４を行い、第２認識文字群１５４を得る。

【0041】

次にステップＳ１３５で正解類推処理を行い、先に登録した分類器１６２に登録されている正解文字列１４５と第１認識文字群１４４を参照して正解文字列と類推する類推文字列１５５を類推する。あるいは、複数の類推した文字列をその正解確率と共に出力する（１６５）。

【0042】

以下に以上で説明した本実施の形態例の詳細を説明する。以下の説明では、処理対象の紙原稿用紙として柔道整復施術療養費支給申請書を処理する例を説明する。本実施の形態例で処理する柔道整復施術療養費支給申請書の例を図３に示す。図３は本実施の形態例で処理する柔道整復施術療養費支給申請書の例を示す図である。

【0043】

抽出する文字列は図３に４０２で示す負傷名であり、係る負傷名表示領域の表示文字列を文字認識してデジタルデータ化する例とする。例えば、図３に示す柔道整復施術療養費支給申請書４０１では、負傷名記載欄４０２は、プリンターにより印刷される。
負傷名印刷例を図４に示す。傷病名は例えば図４に５０１〜5０３で示すように印刷されている。なお、この文字列は印刷ではなく手書きされた文字列であってもよい。但し手書きの場合には、書き手によって文字認識の正解率が下がるため、印刷された文字列が望ましい。

【0044】

実際の処理では、処理対象の複数の柔道整復施術療養費支給申請書をイメージ読取装置１３０より読み取り、スキャニングした場合には、分類器生成処理１０２では、複数の柔道整復施術療養費支給申請書４０１を第１スキャンＳ１１１でイメージ情報として取り込み、読み込んだ枚数分の第１イメージ１４１を得る。

【0045】

次に、この複数の読み取りイメージ情報（第１イメージ１４１）に対してステップＳ１１２の第１文字抽出処理では、抽出するべき文字列の領域である例えば負傷名欄４０２を抽出し、第１抽出文字列１４２を得る。次にステップＳ１１３の文字認識処理（ＯＣＲ処理）で文字認識処理を実行して第１認識文字列１４３を得る。柔道整復施術療養費支給申請書４０１の負傷名４０２は、例えば図４に示すように印刷されており、第１抽出文字列１４２を例えば図５に示すように文字認識したとする。

【0046】

この状態で第１認識文字列分解処理Ｓ１１４では、第１認識文字列１４３を一文字ずつに分解し、第１認識文字群１４４を作る。例えば、図５の認識文字列例６０１，６０２，６０３を、図６に示す第１認識文字群例７０１，７０２，７０３のように一文字ずつに分解する。

【0047】

第１エントリ処理では、中央処理装置１００は表示装置１１０に第１スキャン処理で読み取ったイメージ情報を申請書データファイル２３０に登録すると共に、第１イメージ１４１の第１認識文字列１４３に該当する部分を表示して、オペレータがこの表示を確認して第１エントリ処理Ｓ１１５にて正解文字列１４５の入力を促す。

【0048】

例えば入力するべき文字列部分をハイライト表示などすることで、オペレータが入力するべき対象を目視確認できる。この文字列を確認したオペレータは、ハイライト表示されている読み取りイメージを目視確認しながら正解文字列１４５を順次打ち込むことになる。
例えば、図７の正解文字列例８０１，８０２，８０３である。なお、このエントリを二回行い、その結果を突き合わせることによりデータの正確性を向上させることもある。

【0049】

このようにしてえた正解文字列１４５と第１認識文字群１４４を対応付けて分類器１６２に登録する。本実施の形態例の分類器生成処理Ｓ１１６では、第１認識文字群１４４と正解文字列１４５のペア１４６を作る。たとえば、具体例を示すと図８に示すペア９０１，９０２，９０３ようになる。分類器生成処理Ｓ１１６では、第１認識文字群と正解文字列のペア１４６を多数集めて、必要数が収集できてから例えば機械学習アルゴリズムにより分類器１６２を生成する。

【0050】

機械学習アルゴリズムには、ナイーブベイズやサポートベクトルマシンなど様々な種類があり、本実施の形態例でも採用可能である。機械学習アルゴリズムの詳細をナイーブベイズを例に説明する。ナイーブベイズは、二つのクラス間で、ある属性が与えられたとき、どちらのクラスに属する確率が高いかを確率として判定する。本例では、属性とは、認識文字群であり、クラスとは、正解文字列である。分類器は、二つのクラス間で一つ作成される。本実施の形態例では、負傷名としての正解文字列は、４００個程度あり、生成される分類器はその組み合わせの数となり、例えば４００×３９９／２＝７９，８００個程度が生成される。

【0051】

分類器１６２の一つの例として、右膝関節捻挫９０２と左膝関節捻挫９０３のペアを比較する分類器を生成する場合を例として説明する。正解文字列１４５と第１認識文字群１４４の全てのペアから、正解文字列に、右膝関節捻挫９０２か左膝関節捻挫９０３が入るペアを取り出し、第１認識文字群の出現回数から確率を計算する。

【0052】

例えば、前記ペアの総数が１００個であり、右額鸚挫Ｗ９０６の３文字目の鸚の出現回数が１であれば、右膝関節捻挫９０２か左膝関節捻挫９０３の分類器において、３文字目に鸚が属性として現れたとき、右膝関節捻挫９０２である確率は、１／１００であり、左膝関節捻挫９０３である確率は、０となる。

【0053】

このように、属性毎の出現確率を計算し、掛け算した結果がトータルの確率となる。この場合、属性に出現確率ゼロがあると、トータルがゼロになってしまう。このような現象を避けるため、出現確率計算の分子と分母に１を和し、かつ、Log関数を掛け、掛け算を和算に変換している。

【0054】

新たな認識文字群が与えられると、分類器は例えば７９，８００個あり、この中から新たな認識文字群が出現する確率の高いクラス、すなわち正解らしい類推文字列を選択し、最も多く選択された類推文字列を正解であると類推する。

【0055】

認識文字列を一文字ずつに分解する以外の方法としては、Bag of Wordsと呼ばれる方法がある。Bag of Wordsとは、まず、全てのＯＣＲ認識文字をユニークに集めた集合を作る。認識文字群の文字が、その集合に含まれていればTrueとし、含まれていなければFalseとする表を作り、属性とする方法である。本実施の形態例の分類器生成処理で一文字ごとでなくBag of Wordsを用いたばあいは、後述する正解類推処理でもBag of Wordsを使う。

【0056】

前記した機械学習アルゴリズムに前記の分類器を設定し、認識文字群を与えると、正解文字列を類推し、またその確率を返す。分類器の正確性を向上するためには、第１認識文字群と正解文字列のペアを多く集める必要がある。柔道整復施術療養費支給申請書４０１は、1ヶ月単位で集計されるので、少なくとも1ヶ月分の柔道整復施術療養費支給申請書４０１を読み込み、１ヶ月分の柔道整復施術療養費支給申請書４０１イメージから分類器１６２を生成する。

【0057】

更に、翌月分の誤読補正では、今月分のイメージと認識文字列と正解文字列も使い、分類器生成処理Ｓ１０２を行う。今月分のイメージと認識文字列と正解文字列は既にあるので、第１スキャンＳ１１１、第１エントリＳ１１５、第１文字列抽出Ｓ１１２、第１文字列認識Ｓ１１３は不要となることから、スキャンを二回行う必要が無くなり、連続してスムーズに、かつ、精度を高めながら運用することができる。

【0058】

機械学習アルゴリズムとしては、サポートベクトルマシーン（ＳＶＭ）やニューロなどがあるが、分類器を生成できる機械学習アルゴリズムであれば、これらに限定されるわけでない。

【0059】

次に、正解類推処理部１０３の詳細を説明する。処理対象の新たな複数の柔道整復施術療養費支給申請書をイメージ読取装置１３０にセットして第２スキャン処理S１３１でイメージの読み込みを行い、複数の第２イメージ１５１を得る。
この第２イメージ１５１から第２抽出文字列１５２を抽出する第２文字列抽出処理Ｓ１３２はステップＳ１１２の第１文字列抽出処理と同様であるため詳細説明を省略する。
抽出した第２抽出文字列１５２はステップＳ１１３の第１認識文字列認識処理と同様の第２文字列認識処理Ｓ１３３でそれぞれ文字認識され、第２認識文字１５３は第１文字列分解処理と同様の第２文字列分解処理１３４で第２認識文字群１５４に分割される。

【0060】

ステップＳ１３５の正解類推処理では、分類器１６２を先の機械学習に設定し、第２認識文字群１５４を機械学習に与えることにより、類推文字列１５５を得る。
第２認識文字群１５４が右，額，鸚，挫，Ｗ，１１０２であった場合、前記の７９，８００個の分類器に属性として右，額，鸚，挫，Ｗ，１１０２を投入すると、右膝関節捻挫９０２か左膝関節捻挫９０３の分類器からは、右膝関節捻挫９０２の確率が高く返り、右膝関節捻挫９０２が類推文字列の候補として選択される。同様に、全ての分類器で試すと、右膝関節捻挫９０２が類推文字列の候補として選択される数が最も多く、類推文字列１５５として選択される。

【0061】

あるいは、正解類推１３５が一つの第２認識文字群１５４に対して、機械学習に指示し、複数の類推文字列とその確率１６５を得ることもできる。
この場合に学習効果の具体例と、認識文字群である１５４に対して具体的に類推された複数の類推文字列とその確率１６５のエントリでの使用方法の具体例を以下に示す。
印字されている文字列が「右膝関節捻挫」で、文字認識結果が「告関節捻挫」と誤認識することがあり、印字されている文字列が「左膝関節捻挫」で、文字認識結果が「告関節捻挫」と誤認識することもある。もちろん、分類器１６２の確率としては、「右膝関節捻挫」が高くでるが、「左膝関節捻挫」の確率もある程度の確率となる。
類推結果をエントリに用いる場合には、「右膝関節捻挫」を第一候補として表示するが、「左膝関節捻挫」も第二候補として表示すると、エントリの効率が上がる。

【0062】

〔第２の実施の形態例〕
以上の説明は予め例えば標準紙原稿等をスキャンし、認識した全ての文字列から分類器１６２を生成し、次に、処理対象の紙原稿をスキャンして先に生成した分類器１６２を用いて正解文字列を類推する例について説明した。

【0063】

しかし本発明は以上の例に限定されるものではなく、予め全ての負傷名を登録したマスター１６３を生成しておき、認識文字列と同じ負傷名が登録されているか比較し、登録されていなければ誤読と判断するように、制御してもよい。分類器１６２を誤読文字群と正解文字列のペアから生成し、類推するときも誤読文字列のみを使用することも考えられる。この場合には高い正確性が期待できる。

【0064】

このように構成した本発明に係る第２の実施の形態例を以下に説明する。
図９は、本発明に係る第２の実施の形態例の概略処理を示すフローチャートである。図９において、上述した図２のフローチャートに示す処理と同様処理には同一ステップ番号を付し詳細説明を省略する。

【0065】

第１スキャン処理ステップＳ１１１、第１文字列抽出処理ステップＳ１１２、第１文字列認識ステップＳ１１３，第１文字列分解ステップＳ１１４，第１エントリ処理ステップＳ１１５、第２スキャン処理ステップＳ１３１、第２文字列抽出処理ステップＳ１３２、第２文字列認識ステップＳ１３３，第２文字列分解ステップＳ１３４は、図２に示す第１の実施の形態例の処理と同様である。

【0066】

第２の実施の形態例で用いるマスター１６３には、予め全ての負傷名が登録されており、４００種類ほどである。ステップＳ１１２の第１文字列認識処理で抽出された例えば図５に示す第１認識文字列１４３を抽出すると、ステップＳ２１３に示す第１マスター比較処理に進み、第１認識文字列１４３について、順次マスター１６３を参照してマスター１６３に登録されている文字列か否かを比較する。

【0067】

そして、第１認識文字列の中で登録されていない文字列を第１誤読文字列２４３として選ぶ。例えば図５の文字列が認識された時には、図１０の誤読文字列例の「右額鸚挫Ｗ」１００２は、マスター１６３に登録された負傷名に含まれておらず、誤読文字列と判定する。

【0068】

なお、マスター１６３に登録されている文字列が第１抽出文字列１４２内に含まれていた場合には、第１エントリ処理ステップＳ１１６でのエントリが必要なく正解文字列であると判定してもよい。

【0069】

第１マスター比較処理Ｓ２１３に次いで、第１誤読文字列分解処理Ｓ１１４では、第１誤読文字列２４３を一文字ずつに分解し、第１誤読文字群１４４を作る。例えば、図１０に示す誤読文字群例の「右額鸚挫Ｗ」１００１を図１１に示す第１誤読文字群例１１０２のように一文字ずつに分解する。

【0070】

次に、分類器生成処理ステップＳ２１６では、第１誤読文字群１４４と正解文字列１４５のペアである第１誤読文字群と正解文字列のペア２４６を作る。例えば、第２の実施の形態例では、第１誤読文字群と正解文字列のペア２４６は図１２に示す１２０２に示すペア文字列となる。

【0071】

なお、分類器生成２１６は、第２の実施の形態例でも、第１誤読文字群と正解文字列のペア２４６を多数集めてから機械学習アルゴリズムにより分類器２２２を作る。

【0072】

次に、図９の右側に示す正解類推部処理ステップＳ２０３を説明する。新たな複数の柔道整復施術療養費支給申請書を図２の第２スキャン処理ステップＳ１３１と同様の処理でイメージ読み取りを行い、所定数の第２イメージ１５１を得る。
次に、得られた複数の第２イメージ１５１に対して図２と同様のステップＳ１３２の第２文字列抽出処理で第２抽出文字列１５２を得る。
次に、得られた複数の第２抽出文字列１５２に対して図２と同様のステップＳ１３３の第２文字列認識処理で第２誤読文字列１５３を得る。

【0073】

続くステップＳ２３３の第２マスター比較処理では、第２誤読文字列１５３についてマスター１６３を参照し、マスター１６３に登録されていない第２認識文字列１５３が検出された場合には、検出された文字列を第２誤読文字列２５３として取り出す。

【0074】

次に、ステップＳ１３４の第２誤読文字列分解処理では、第２誤読文字列２５３を一文字ずつに分解し、第２誤読文字群１５４を作る。
次に、ステップＳ２３５の正解類推処理において、分類器１６２を先の機械学習アルゴリズムに設定し、第２誤読文字群１５４を機械学習に与えて類推文字列２５５を得る。

【0075】

なお、第１の発明の実施の形態例と同様に、正解類推処理Ｓ２３５において、一つの第２誤読文字群２５３に対して、機械学習に指示し、複数の類推文字列とその確率２６５を得る様にしてもよい。

【0076】

第２の発明の実施の形態例によれば、高い正解率の認識文字列を得ることが出来ると共に、マスター１６３に負傷名を登録しているため、認識文字列が正解か否かを判断するに際し、対象を容易に絞ることが出来る。

【0077】

〔第３の実施の形態例〕
次に、本発明に係る第３の実施の形態例を説明する。第３の実施の形態例に係る文字列認識誤読補正方法の概略を図１３を参照して説明する。図１３において、上述した図２に示す処理及び図９に示す処理と同様処理には同一ステップ番号を付し詳細説明を省略する。
図１３に示す第３の実施の形態例は、図２に示す誤読補正方法を改良したものであり、第１スキャン処理Ｓ１１１、第１文字列抽出処理Ｓ１１２、第１文字列認識処理Ｓ１１３、第１エントリ処理Ｓ１１５、第１文字列分解Ｓ１１４、第２スキャン処理Ｓ１３１、第２文字列抽出処理Ｓ１３２、第２文字列認識処理Ｓ１３３、第２文字列分解Ｓ１３４は図２に示す処理と同様である。
第３の実施の形態例においても、第２の実施の形態例と同様にマスター１６３には全ての負傷名が登録されている。

【0078】

図１３において、ステップＳ３１３の第１類似文字列検索処理においては、第１認識文字列１４４に関してマスター１６３から対応する複数の類似文字列３４３を取り出す。たとえば、第１認識文字列１４４が図１４に示す曹部挫傷１３０１であった場合を例として説明する。

【0079】

この場合、第１類似文字列検索処理Ｓ３１３では、類似する複数の類似文字列３４３として、図１６に示す背部挫傷１３１１、臀部挫傷１３１２、殿部挫傷１３１３、腰部挫傷１３１４を検索して抽出したとする。文字の類似度としては、たとえばレーベンシュタイン編集距離などを使う。

【0080】

第１エントリ処理Ｓ１１５から得た正解文字列１４５が、図１５に示す背部挫傷１４０１であったとすると、第１中断判定処理Ｓ３１７では、この正解文字列である背部挫傷１４０１が複数の類似文字列３４３の中にある背部挫傷１３１１に一致するため、分類器生成処理Ｓ３１８に進む。

【0081】

一方、第１エントリ処理Ｓ１１５から得た正解文字列１４５が、図１５に示す大腿部捻挫１４１１であったとすると、第１中断判定処理Ｓ３１９においては、大腿部捻挫１４１１に対しては複数の類似文字列３４３の中に一致する文字列がないため、分類器生成処理Ｓ３１８に進まず、処理を中断する。

【0082】

第１認識文字列１４４が曹部挫傷１３０１であり、その正解文字列１４５が大腿部捻挫１４１１であった場合においては、類似性が低い。このようなデータから分類器を生成することはノイズを増やし計算量を増すのみで精度を向上させないため、誤読補正処理の分類器生成処理を中断する。

【0083】

あるいは、第１文字列抽出処理Ｓ１１２において、柔道整復施術療養費支給申請書４０１の負傷名の位置検出に失敗したような場合で、右隣の負傷年月日を読んでしまい、第１抽出文字列１４２が図１４の“２３・９・５”１３０２であったような場合では、第１類似文字列検索処理Ｓ３１３においては類似文字列を検索することが出来ず、類似文字列を返すことが出来ないため、第１中断判定処理Ｓ３１９では、分類器生成処理Ｓ３１８に進まず、分類器への登録処理を中断する。

【0084】

第１抽出文字列１４２が“２３・９・５”１３０２である様な場合には、その正解文字列１４５が何であろうと、類似性が低い。このようなデータから分類器を生成することはノイズを増やし計算量を増すのみで精度を向上させないため、この場合にも分類器生成処理を中断する。

【0085】

次に、たとえば、第１抽出文字列１４２が図１４に示す曹部挫傷１３０１であったとすれば、第１文字列分解処理Ｓ１４４は、図１６に示す曹，部，挫，傷，，，，，，，１５０１のように分解し、第１認識文字群１４４を生成する。

【0086】

次に、分類器生成処理Ｓ３１８は、第１認識文字群１４４と関連付けられている正解文字列１４５のペアである第１認識文字群と正解文字列のペア１４６を作る。たとえば、図１７に示すように曹，部，挫，傷，，，，，，，背部挫傷１６０１である。このデータを多数集めて、機械学習アルゴリズムで分類器１６２を作成する。

【0087】

サポートベクトルマシン（ＳＶＭ）に代表される機械学習の分類器は、一つの正解文字列ともう一つの正解文字列とのどちらに分類するのかという分類器が多数集まって構成される。曹，部，挫，傷，，，，，，，背部挫傷１６０１というデータは、背部挫傷ｖｓ大腿部挫傷という分類器の生成にも利用される。

【0088】

しかし、曹部挫傷１３０１の複数の類似文字列３４３である背部挫傷１３１１、臀部挫傷１３１２、殿部挫傷１３１３、腰部挫傷１３１４を考慮して、曹，部，挫，傷，，，，，，，背部挫傷１６０１というデータを背部挫傷ｖｓ臀部挫傷、背部挫傷ｖｓ殿部挫傷、背部挫傷ｖｓ腰部挫傷という分類器１６２の生成にのみ利用することで、分類器１６２を生成する計算量を減らし、精度を上げることもできる。

【0089】

次に、図１３の右側に示す正解類推処理Ｓ３０３を説明する。新たな複数の柔道整復施術療養費支給申請書を第２スキャン処理Ｓ１３１でスキャンし、複数の第２イメージ１５１を得る。
次に、得られた複数の第２イメージ１５１に対して第２文字列抽出処理Ｓ１３２では、第２抽出文字列１５２を得る。
次に、得られた複数の第２抽出文字列１５２に対して第２文字列認識処理Ｓ１３３において、第２認識文字列１５３を得る。

【0090】

第２類似文字列検索Ｓ３３３では、第２認識文字列１５３についてマスター１６３から複数の類似文字列３５３を取り出す。
第２認識文字列１５３に似た文字列がマスター１６３内に登録されておらず検索できない場合、第２中断判定処理Ｓ３３９における判定で正解類推処理を中断する。

【0091】

第２文字列分解処理Ｓ１３４においては、第２認識文字列１５３を分解し、第２認識文字群１５４を生成する。
次に、正解類推処理Ｓ２３５においては、分類器１６２を先の機械学習アルゴリズムに設定し、第２認識文字群１５４を機械学習アルゴリズムに与えると、類推文字列３５５を生成することが出来る。

【0092】

あるいは、正解類推処理Ｓ２３５において、一つの第２認識文字群１５４に対して、機械学習に指示し、複数の類推文字列とその確率３６５を得ることができる様に構成してもよい。
分類器生成処理Ｓ３１８では、似た文字列（類似文字列）が検索されない場合には処理を中断し、認識文字列のデータは分類器１６２の生成には使われなかった。このため、正解類推処理Ｓ３３８でも同様に、似た文字列（類似文字列）が検索されない場合には正解類推処理を中断する。しかしながら、類推が当たる可能性もあるため、正解類推処理を中断せずに続行する様にしてもよい。

【0093】

また、複数の類似文字列３５３を対象とする分類器１６２のみを参照して類推するように機械学習に指示することにより、機械学習は類推する範囲を絞り込むことができ、類推に必要な計算時間が大幅に減少することが出来る。

【0094】

例えば、第２類似文字列検索処理Ｓ３３３で検索された複数の類似文字列が、背部挫傷１３１１、臀部挫傷１３１２、殿部挫傷１３１３、腰部挫傷１３１４であった場合、その組み合わせである、背部挫傷ｖｓ臀部挫傷、背部挫傷ｖｓ殿部挫傷、背部挫傷ｖｓ腰部挫傷、臀部挫傷ｖｓ殿部挫傷、臀部挫傷ｖｓ腰部挫傷、殿部挫傷ｖｓ腰部挫傷という分類器のみで確率を計算することにより、計算量を大幅に減らすことができる。

【0095】

さらに、類似度を確率の計算に加えて、精度を高めることができる。例えば、第２類似文字検索Ｓ３３３において類似度を広くして検索すると、曹部挫傷１３０１の類似文字列として、大腿部挫傷も類似文字となる。背部挫傷は、曹部挫傷から一文字違いであり、大腿部挫傷は二文字違いである。この類似度の相違を確率計算に反映することにより、精度を高めることができる。

【0096】

さらに、第２類似文字列検索Ｓ３３３の前に、第２認識文字列の内、明らかな誤読文字を正解文字に置き換えてしまう処理も精度の向上に有効である。たとえば、第２認識文字列が、治下腿部挫傷Ｗであった場合、治下腿部を右下腿部と置き換えてから、第２類似文字列検索Ｓ３３３を行うことにより、第２類似文字列３５３に正解文字列が含まれる確率が上がり、精度が向上する。

【0097】

〔第４の実施の形態例〕
次に、本発明に係る第４の発明の実施の形態例を図１８のフローチャートも参照して説明する。以上で説明した第１乃至第３の実施の形態例では、分類器生成処理、正解類推処理をそれぞれ１種類揃える例を説明した。しかし本発明は以上の例に限定されるものではなく複数種類備えてもよい。或いは、それぞれの例を２回、或いはそれ以上繰り返し実行してもよい。

【0098】

第４の実施の形態例では、異なる二種類のイメージ処理を行うこととし、それぞれイメージ読み込み処理、文字認識処理を行うこととし、それぞれの処理を文字認識処理Ａと文字認識処理Ｂと呼ぶ。第４の実施の形態例では分類器生成部と正解類推部も二つ用意する。

【0099】

分類器生成処理部S１７０２として．第１文字列抽出・認識処理S１７１１と分類器生成処理S１７１２を実行する。正解類推処理Ｓ１７０３では、第２文字列抽出・認識処理S１７１３、正解類推処理S１７１４を実行する。そして、類推文字列１７１５、あるいは、複数の類推文字列とその確率１７１６と共に生成する。

【0100】

一方、分類器生成処理部S１７０４として．第３文字列抽出・認識処理S１７２１と分類器生成処理S１７２２を実行する。正解類推処理Ｓ１７０５では、第４文字列抽出・認識処理S１７２３、正解類推処理S１７２４を実行する。そして、類推文字列１７２５、あるいは、複数の類推文字列とその確率１７２６と共に生成する。

【0101】

第４の実施の形態例では、例えば２つの分類器生成処理の一方を第１の実施の形態例の分類器生成処理を行うように制御し、分類器生成処理１７０４は第２実施の形態例の処理を採用するようにしてもよい。

【0102】

例えば、異なる文字列抽出、認識処理は、異なる文字認識能力を持ち、当該処理から生成される分類器１６２１と分類器１６２２の登録内容が異なるものとなる。このことから、正解類推処理Ｓ１７１４と正解類推処理Ｓ１７２４とは、異なる根拠に基づき、誤読文字群から類推文字列１７１５と類推文字列１７２５とを選び出す。

【0103】

第４の実施の形態例においては、異なる認識方法で生成した類推文字列１７１５，１７２５をステップＳ１７３１の比較処理Ｓ１７３１が取り込み、類推文字列１７１５と類推文字列１７２５とを比較し、合致していれば類推文字列１７３２を出力し、合致していなければ合致せずと出力する。合致しない場合でも、どちらかが正解である確率は上がり、改善される。

【0104】

あるいは、合致しない場合でも、第３の実施の形態例の処理を適用し、正解類推１７１４と正解類推１７２４が機械学習に指示し、複数の類推文字列とその確率１７１６と複数の類推文字列とその確率１７２６を得た場合、確率の高い類推文字列を選択することで、正解である可能性が高まる。
本実施例では、二種類の文字認識処理を利用する例を示したが、三種類以上の文字認識方法を適用することも可能である。

【0105】

〔第５の実施の形態例〕
本発明に係る第５の実施の形態例を図１９を参照して説明する。第５の実施の形態例において、上記した各実施の形態例と異なるところを主に説明する。
第５の実施の形態例は、上記各実施の形態例で得られた類推文字列１１５を入手後の活用に特徴を有している。たとえば、操作者が第２イメージ１５１の負傷名を参考としながらエントリする必要がある様な場合には中央処理装置１００は表示装置１１０に図１９に示すエントリ画面１８０１を表示する。

【0106】

エントリ画面１８０１には、第２イメージ１５１を表示するエリア１８０２があり、その中に表示された負傷名でエントリされる負傷名にハイライト１８０３が施され、その負傷名の拡大１８０４を右上に表示するように制御する。右側には負傷名のエントリエリア１８０６が設けられるようにする。

【0107】

類推文字列１５５をエントリエリア１８０６の下にエントリ候補文字１８０７として表示する。このため、操作者は、負傷名の拡大１８０４とエントリ候補文字１８０７とが等しければ、エンターキーを入力するのみの操作でエントリ候補文字１８０７が負傷名のエントリエリア１８０６に入力され、次のエントリエリアに自動的にカーソルを移動させる。これによりエントリに要する時間が大幅に短縮する。

【0108】

〔第６の実施の形態例〕
本発明に係る第６の実施の形態例を図２０を参照して説明する。第６の実施の形態例において、上記した各実施の形態例と異なるところを主に説明する。

【0109】

第６の実施の形態例は、上記各実施の形態例で得られた複数の類推文字列とその確率１６５を入手後の活用に特徴を有している。たとえば、操作者が第２イメージ１５１の負傷名を参考としながらエントリする必要がある様な場合には中央処理装置１００は表示装置１１０に図２０に示すエントリ画面１８０１を表示する。

【0110】

第６の実施の形態例では、例えば第１の実施の形態例における類推文字列１６５とその確率とを入手後の有効活用処理に特徴を有している。たとえば、オペレータが第２イメージ１５１の負傷名を参考として正解文字列を見て、エントリするときに、エントリ画面１８０１を表示させる。エントリ画面１８０１には、第２イメージ１５１を表示するエリア１８０２があり、その中に表示された負傷名でエントリされる負傷名にハイライト１８０３が施され、その負傷名の拡大１８０４が右上に表示され、その負傷名のエントリエリア１８０６が設けられている。

【0111】

具体的には、例えば以下のように類推文字列を確率の高い順に表示し、正解文字列の特定を容易にしている。複数の類推文字列とその確率を得たとする。例えば、類推文字列の一つ目が「右膝関節捻挫」でその確率が５０%であり、類推文字列の二つ目が「右肘関節捻挫」でその確率が３０%であり、類推文字列の三つ目が「右肩関節捻挫」でその確率が２０%であり、和した確率値が８０％となったら表示を中止とする。

【0112】

「右膝関節捻挫」の確率が５０%で一番高く、「右肘関節捻挫」の確率が３０%と二番目に高い。確率を和すると８０％となり、ここまでの表示となる。すなわち、右膝関節捻挫１９０１と右肘関節捻挫１９０２が表示される。

【0113】

オペレータは、右膝関節捻挫１９０１と右肘関節捻挫１９０２の表示に対して、負傷名の拡大１１０４と等しい方を選択し、エンターキーを入力することにより、選択した類推文字列が負傷名のエントリーエリア１８０６に入力され、次のエントリーエリアにカーソルが移動する。これによりエントリーに要する時間が短縮し、かつ、正解の類推文字列が現れる確率が増加する。
第６の実施の形態例によれば正解文字列の特定が極めて簡単な操作で確実に行うことができる。

【0114】

以上、本発明に係る誤読補正方法について説明したが、本発明にかかる誤読補正方法は、上述した実施形態例にのみ限定されるものではなく、本発明の範囲で種々の変更実施が可能であることは言うまでもない。

【産業上の利用可能性】

【0115】

図２１を用いて、本発明の産業上の利用例を説明する。例えば、診療報酬請求書などの中に印刷された傷病名等をデータ化するときは、高い正確性が求められる。そのため本発明の誤読補正方法適用前の従来の処理２００１では、手入力による第１エントリ処理２０１２と第２エントリ処理２０１３が異なるオペレータにより行われ、その二つのエントリ結果を比較し合致しないデータを取り出す、異なるデータ取出し２０１４が行われ、その合致しないデータに関してエントリを行う第３エントリが行われる。

【0116】

本発明に係る誤読補正方法適用後２００２では、第１エントリ２０１２を廃止し、本発明に係る各実施の形態例の誤読補正方法で出力したデータを異なる取り出しデータに代わりに用いる。このことにより、エントリする件数を大幅に減らすことが出来る。このような高い正確性が求められるデータ化は、処方された薬品名など数多く存在し、エントリを２回行う運用は広く行われており、本発明の有効範囲も広い。

【図1】