(58)【調査した分野】(Int.Cl.,DB名)
【背景技術】
【0002】
健康診断結果を通知する帳票、例えば健康診断結果通知書には、赤血球数、コレステロール、血糖などといった検査項目毎に各々の検査結果である数値(項目値)が記載(印字)される欄が設けられている。このような帳票の処理にはスキャナを用いて帳票の画像を読み取り、文字認識する帳票読取装置が利用される。
【0003】
ところで、健康診断結果通知書は、検査機関毎に独自の項目の配置が採用されており、同じ項目を用いているといえども配置が異なるため、帳票読取装置には事前に個々の帳票を読み取る(文字認識する)ための読取情報の定義を検査機関毎(帳票毎)に行っておく必要がある。読取情報とは、例えば、文字認識する認識対象文字が記録されている帳票上の位置情報、認識対象文字の種類(漢字、仮名,カタカナ、数字)や文字数などである。
【0004】
帳票読取装置に新たな帳票の読み取りをさせる場合には、文字認識のための読取情報の定義をすべての文字認識対象の項目について入力設定する必要がある。このため、帳票読取のための初期設定として読取情報の定義に多大な時間と労力が必要であった。
【発明を実施するための形態】
【0010】
以下、図面を参照して実施形態を詳細に説明する。実施形態では、複数の検査機関が作成した、検査項目の名称が記載されている項目名欄と検査項目の結果である項目値が記載(印字)される結果欄との配置がそれぞれ異なる複数の健康診断結果通知書を文字認識する場合を例示として説明する。つまり、これら複数の健康診断結果通知書ではすべての検査項目は共通するが、項目欄と結果欄の配置がそれぞれ異なっている。
図1は第1実施形態の帳票読取システムの構成を示すブロック図である。
【0011】
(第1実施形態)
図1に示すように、この第1実施形態の帳票読取システムは、入力機器1、スキャナ2、コンピュータ3(以下「PC3」と称す)および表示装置としてのモニタ4を備える。
【0012】
PC3は例えばCPU、メモリ、ハードディスク装置、CD−ROM、DVD−ROMなどの記録媒体を再生する再生装置としてのディスク再生装置などを有する。PC3ではディスク再生装置にセットされた記録媒体からハードディスク装置にインストールされた制御ソフトウェアをCPUがメモリ上に読み出し、そのソフトウェアの処理を実行することで、PC3が、帳票を読み取る帳票読取装置として機能する。
【0013】
帳票読取装置として機能するPC3は、帳票画像記憶部31、入出力インターフェース32(以下「入出力I/F32」と称す)、項目名リスト記憶部33、定義情報記憶部34、第1定義部35、第2定義部36を備える。
【0014】
スキャナ2は、読取対象の帳票、例えば帳票20(
図2参照)の帳票イメージ(帳票画像)を光学的に読み取り、読み取った帳票画像をPC3の帳票画像記憶部31に記憶する。
【0015】
図2に示す帳票20は、健康診断結果通知書である。帳票20には、最上部に帳票名(健康診断結果通知書)が印字され、その下に項目名が印字された項目名欄と、各項目名に対応した検査結果である項目値が印字される結果欄とが設けられている。これらの欄は罫線で区切られている。この帳票20は、検査項目の結果が印字されていない未使用の帳票である。
【0016】
帳票20には表題「項目」が印刷されている表題欄21が設けられている。表題欄21の下には複数の項目名欄が設けられている。各項目名欄には検査項目の項目名(赤血球、白血球、血色素、血小板など)が印刷されている。帳票20には表題「結果」が印刷されている表題欄22が表題欄21の右側に対応付けて設けられている。表題欄22の下には複数の結果欄が設けられている。各結果欄には左隣の項目名欄に印刷された検査項目に対応する検査結果である数値が印字される。帳票画像記憶部31には、スキャナ2により光学的に読み取られた帳票の帳票画像が記憶される。
【0017】
入出力I/F32は帳票定義設定用の画面をモニタ4に表示し、定義対象の帳票画像を帳票画像記憶部31から読み出しその画面に表示する。入出力I/F32は、画面に表示された帳票画像に対して、入力機器1の操作により項目名欄と結果欄の位置情報を指定可能とする。
【0018】
項目名リスト記憶部33には、複数の検査機関が作成した複数の健康診断結果通知書において共通する検査項目の項目名称と、検査項目に対応付けられた結果欄に記載(印字)される項目値に関する読取情報とが、対応付けて記憶されている。
【0019】
項目名称は、赤血球、白血球、血色素、血小板などいった名称(テキストデータ)である。読取情報は、認識対象文字の種類(漢字、仮名,カタカナ、数字)や文字数などである。この読取情報に結果欄の位置情報は含まれていない。
【0020】
これは、上記複数の健康診断結果通知書において、検査項目に対応付けられた結果欄の位置が同一ではなく異なるからである。換言すれば、位置情報を除く認識対象文字の種類や文字数などの読取情報は、上記複数の健康診断結果通知書において共通であることが前提となっている。
【0021】
定義情報記憶部34には、上記複数の帳票毎に定義された位置情報を含む読取情報が記憶される。第1定義部35は帳票画像記憶部31から読み出した帳票画像における項目名欄23と結果欄24の位置情報(座標値)が入力機器1から入力され指定された場合、この位置が指定された項目名欄23に対応する帳票画像の領域から切り出した画像に基づいて項目名欄23に印字された項目名を文字認識する。
【0022】
第1定義部35は文字認識した項目名をキーとして、項目名リスト情報記憶部33を参照して、項目名に対応づけられている読取情報を取得し、この読取情報を結果欄24に対する読取情報として定義する。第1定義部35は項目名欄23と結果欄24の位置情報に基づいて、両者の相対的な位置関係の情報を一時的に保存する。相対的な位置関係の情報とは、例えば、項目名欄23と結果欄24の位置情報の位置誤差(距離)である。
【0023】
第2定義部36は、次に読取情報を定義すべき結果欄26の位置情報が入力機器1から入力され指定された場合、結果欄26の位置情報と第1定義部35から提供される項目名欄23と結果欄24との相対的な位置関係の情報とに基づいて項目名欄25の領域の位置を特定し、この位置が特定された帳票画像の領域から切り出した画像に基づいて項目名欄25に印字された項目名を文字認識する。
【0024】
第2定義部36は、文字認識した項目名をキーとして、項目名リスト情報記憶部33を参照して、項目名に対応づけられている読取情報を取得し、この読取情報を結果欄25対する読取情報として定義する。
【0025】
続いて、
図2,
図3を参照してこの第1実施形態の帳票読取システムの動作を説明する。
この帳票読取システムの場合、入出力I/F32は、モニタ4に帳票定義用の画面を表示し、画面において処理対象の帳票の画像を取り込む操作を行うことで、スキャナ2にセットされた処理対象の帳票、例えば
図2に示した帳票20が光学的に読み取られ、読み取られた帳票20の帳票画像がPC3の帳票画像記憶部31に記憶される。
【0026】
続いて、上記画面において、定義対象の帳票画像の読み出し操作を行うことで、帳票画像記憶部31に記憶された帳票画像が読み出されて画面に表示される(
図3のステップS101)。
【0027】
画面に表示された帳票画像に対して、まず初めにユーザがマウスなどの入力機器1の操作により結果欄24の位置情報を指定する(ステップS102のYes)。この位置情報の指定は、結果欄24の対角線上に位置する2点(左上の角と右下の角の組み合わせ、又は右上の角と左下の角の組み合わせ)を指定する方法や、結果欄24の領域全体の範囲を指定する方法で行う。
【0028】
続いて、項目名欄23の位置情報が指定されと(ステップS103のYes)、第1定義部35は項目名欄23に印字された項目名を文字認識する。
【0029】
そして、第1定義部35は文字認識した項目名をキーとして、項目名リスト情報記憶部33を参照して、項目名に対応づけられている読取情報を取得し、この読取情報を結果欄24に対する読取情報として定義する。
【0030】
この結果、項目名「赤血球」の検査結果が印字される結果欄24の領域を文字認識するための読取情報が定義されたことになる。第1定義部35は項目名欄23と結果欄24の位置情報に基づいて、両者の相対的な位置関係の情報を一時的に保存する(ステップS104)。
【0031】
次に、ユーザがマウスの操作により次に読取情報を定義すべき結果欄26の位置情報を指定すると(ステップS105のYes)、第2定義部36は、結果欄26の位置情報と第1定義部35から提供される項目名欄23と結果欄24との相対的な位置関係の情報とに基づいて結果欄26に対応する項目名欄25の領域の位置を特定し、この位置が特定された帳票画像の領域から切り出した画像に基づいて項目名欄25に印字された項目名を文字認識する(ステップS106)。
【0032】
第2定義部36は、文字認識した項目名をキーとして、項目名リスト情報記憶部33を参照して、項目名に対応づけられている読取情報を取得し、この読取情報を結果欄25対する読取情報として定義する(ステップS107)。この結果、項目名「白血球」の検査結果が印字される結果欄26の領域を文字認識するための読取情報が定義されたことになる。
【0033】
以下、同様に読取情報を定義すべき結果欄の位置情報を指定すると、その結果欄の領域を文字認識するための読取情報が定義される。そして、定義終了操作が行われると(ステップS108のYes)、第2定義部36は、帳票名や帳票IDなどと共に帳票20の定義情報を定義情報記憶部34に記憶する(ステップS109)。
【0034】
このように第1実施形態によれば、帳票20の読取情報を定義すべき結果欄24と結果欄24に対応付けられている項目名欄23の位置情報を指定すると、項目名欄23に印字されている項目名を文字認識し、この項目名に対応付けられている読取情報を結果欄24に対する読取情報として定義する。次に読取情報を定義すべき結果欄26の位置情報を指定すると、結果欄26の位置情報と項目名欄23と結果欄24との相対的な位置関係の情報とに基づいて項目名欄25の領域の位置を特定し、この位置が特定された項目名欄25に印字された項目名の文字認識、及び結果欄26に対する読取情報の定義が行われる。以降、ユーザは結果欄の位置情報を指定するだけで、その結果欄に対する読取情報が定義できる。
【0035】
この結果、項目名が共通し項目名に対応付けられている文字認識すべき欄の配置が異なる複数の帳票に対して、読取情報の定義を容易に行うことができる。
【0036】
以上の実施形態では、項目名欄と結果欄が左右に直接隣接し罫線で区切られ、項目名欄と結果欄の対が縦方向に複数配置された帳票20を対象とする読取情報の定義について説明した。しかし、帳票はこのような帳票20に限定されない。
【0037】
すなわち、項目名欄と結果欄が上下に直接隣接し罫線で区切られ、項目名欄と結果欄の対が横方向に複数配置された帳票でも本発明は適用できる。更に、項目名欄と結果欄が罫線で区切られるが、直接隣接せずに離間して項目名欄と結果欄が対応して配置されている帳票でも本発明は適用できる。この場合、項目名欄と結果欄の対が横方向に複数配置された帳票、項目名欄と結果欄の対が縦方向に複数配置された帳票のいずれの場合でもよい。
【0038】
更に、項目名欄と結果欄が罫線で区切られていない帳票でも本発明は適用できる。
図4に項目名欄と結果欄が罫線で区切られていない帳票27を示す。この帳票27に対して読取情報の定義をする場合には、
図4に示すように使用済みの帳票を使用する。
【0039】
帳票27には罫線がないため項目名欄と結果欄は存在しないが、印字結果に基づいて項目名欄と結果欄に相当する領域の位置情報を指定することになる。この場合の位置情報の指定は、各欄に相当する領域の位置をマウスなどで
図4に点線で示したように範囲指定することで行う。なお、この範囲指定は罫線が存在しないため、正確な範囲の位置指定はできないが、認識すべき文字が存在する大まかな範囲が指定できれば十分である。
【0040】
(第2実施形態)
続いて、
図5、
図6を参照して第2実施形態を説明する。なおこの第2実施形態において第1実施形態と同じ構成には同一の符号を付しその説明は省略する。
図5に示すように、この第2実施形態の帳票読取システムは、第3定義部37を備える。第3定義部37は前列の定義情報を用いて次の列をまとめて一括定義する。
【0041】
図6に示すように、各項目名欄に対応する結果欄が、2012年の結果と2013年の結果というように、それぞれ独立した列で設けられている健康診断結果通知書60の場合、上記第1実施形態では、2列の結果欄についてそれぞれ読取情報の定義作業を繰り返す必要がある。
【0042】
そこで、この第2実施形態では、第1定義部35が1列目の最後の結果欄28の読取情報の定義を終了した後、ユーザが2列目の初めの結果欄29の位置情報と項目名欄23の位置情報と指定することで、第3定義部37が結果欄29の位置情報、項目名欄23の位置情報、及び1列目のすべての結果欄の位置情報とに基づいて、2列目のすべての結果欄に対する読取情報の定義を一括して定義する。
【0043】
このように第2実施形態によれば、第3定義部37は2列目のすべての結果欄に対する読取情報の定義を一括してすることができる。
【0044】
本発明の実施形態を説明したが、上記実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。上記新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。上記実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
【0045】
さらに上記実施形態では、各構成要素を、コンピュータのハードディスク装置などのストレージにインストールしたプログラムで実現したが、上記プログラムを、コンピュータ読取可能な電子媒体:electronic mediaに記憶しておき、プログラムを電子媒体からコンピュータに読み取らせることで本発明の機能をコンピュータが実現するようにしてもよい。電子媒体としては、例えばCD−ROM,DVD−ROMなどの記録媒体やフラッシュメモリ、リムーバブルメディア:Removable mediaなどが含まれる。さらに、ネットワークを介して接続した異なるコンピュータに構成要素を分散して記憶し、各構成要素を機能させたコンピュータ間で通信することで実現してもよい。