(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-02-07
(45)【発行日】2024-02-16
(54)【発明の名称】情報処理装置、情報処理方法、及びプログラム
(51)【国際特許分類】
G06V 30/12 20220101AFI20240208BHJP
【FI】
G06V30/12 B
(21)【出願番号】P 2021163954
(22)【出願日】2021-10-05
【審査請求日】2022-09-22
(73)【特許権者】
【識別番号】504103984
【氏名又は名称】ウイングアーク1st株式会社
(74)【代理人】
【識別番号】100190621
【氏名又は名称】崎間 伸洋
(74)【代理人】
【識別番号】100212510
【氏名又は名称】笠原 翔
(72)【発明者】
【氏名】名護屋 豊
(72)【発明者】
【氏名】湯田 知己
【審査官】伊知地 和之
(56)【参考文献】
【文献】特開平07-210623(JP,A)
【文献】特開2021-015490(JP,A)
【文献】特開2017-126225(JP,A)
【文献】特開平07-192079(JP,A)
【文献】特開2009-181225(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06V 30/00 - 30/12
G06V 30/14 - 30/168
G06V 30/18 - 30/222
G06V 30/224
G06V 30/226 - 30/32
G06V 30/40 - 30/416
G06V 30/42 - 30/424
(57)【特許請求の範囲】
【請求項1】
光学式文字認識により対象画像に含まれる少なくとも一の画像文字を変換することにより生成された文字テキストを、操作者が修正することを可能にした情報処理装置であって、
前記画像文字及び前記文字テキストを比較可能な視認状態にして表示部の第1表示エリアに表示する第1表示手段と、
前記表示部の第1表示エリアに表示された前記文字テキストに対して前記操作者が入力部を操作して行った修正を受け付けて、当該文字テキストから修正後文字テキストに置き換える第1修正手段と、
前記操作者が前記表示部の前記第1表示エリアに表示された前記文字テキストを指定することにより、当該指定した文字テキストを含む所定オブジェクトを、前記表示部の第1表示エリアとは異なる第2表示エリアに表示する第2表示手段と、
前記第2表示エリアに表示された前記所定オブジェクト内の前記文字テキストに対して前記操作者が入力部を操作して行った修正を受け付けて、当該文字テキストから修正後文字テキストに置き換える第2修正手段と、
を備える情報処理装置。
【請求項2】
前記文字テキストに対し前
記修正を補助するためのデータ修正候補を前記表示部に表示する第3表示手段を更に備え、
前記第1修正手段は、前記データ修正候補から選ばれた選択データ修正候補に基づき前
記修正を受け付ける、
請求項1に記載の情報処理装置。
【請求項3】
前記第1表示手段は、前記画像文字及び前記文字テキストに関連する項目のうち、指定された項目に合わせて前記画像文字及び前記文字テキストを前記表示部に表示する、
請求項1又は2に記載の情報処理装置。
【請求項4】
前記光学式文字認識の正確度を算出する正確度算出手段を更に備え、
前記第1表示手段は、前記正確度に基づく表示状態で少なくとも前記画像文字を前記表示部に表示する、
請求項1乃至3の何れか1項に記載の情報処理装置。
【請求項5】
光学式文字認識により対象画像に含まれる少なくとも一の画像文字を変換することにより生成された文字テキストを、操作者が修正することを可能にした情報処理装置が実行する情報処理方法であって、
前記画像文字及び前記文字テキストを比較可能な視認状態にして表示部の第1表示エリアに表示する第1表示ステップと、
前記表示部の第1表示エリアに表示された前記文字テキストに対して前記操作者が入力部を操作して行った修正を受け付けて、当該文字テキストから修正後文字テキストに置き換える第1修正ステップと、
前記操作者が前記表示部の前記第1表示エリアに表示された前記文字テキストを指定することにより、当該指定した文字テキストを含む所定オブジェクトを、前記表示部の第1表示エリアとは異なる第2表示エリアに表示する第2表示ステップと、
前記第2表示エリアに表示された前記所定オブジェクト内の前記文字テキストに対して前記操作者が入力部を操作して行った修正を受け付けて、当該文字テキストから修正後文字テキストに置き換える第2修正ステップと、
を含む、情報処理方法。
【請求項6】
光学式文字認識により対象画像に含まれる少なくとも一の画像文字を変換することにより生成された文字テキストを、操作者が修正することを可能にした情報処理装置を制御するコンピュータに、
前記画像文字及び前記文字テキストを比較可能な視認状態にして表示部の第1表示エリアに表示する第1表示ステップと、
前記表示部の第1表示エリアに表示された前記文字テキストに対して前記操作者が入力部を操作して行った修正を受け付けて、当該文字テキストから修正後文字テキストに置き換える第1修正ステップと、
前記操作者が前記表示部の前記第1表示エリアに表示された前記文字テキストを指定することにより、当該指定した文字テキストを含む所定オブジェクトを、前記表示部の第1表示エリアとは異なる第2表示エリアに表示する第2表示ステップと、
前記第2表示エリアに表示された前記所定オブジェクト内の前記文字テキストに対して前記操作者が入力部を操作して行った修正を受け付けて、当該文字テキストから修正後文字テキストに置き換える第2修正ステップと、
を含む制御処理を実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法、及びプログラムに関する。
【背景技術】
【0002】
仕入先から、例えば、請求書等の紙文書が送られてくると、納入先では、その送られてきた紙文書に対する受領をすると共に、紙文書の内容を目視確認し、納入先の基幹システムに入力するためのデータを作成する。紙文書に不明点があれば問い合わせをし、間違いがあれば上述の基幹システムに入力するためのデータを修正する。
納入先の管理部では、紙文書のデータ入力を行った後に基幹システムから、例えば、支払い案内書を出力する。その後、仕入先に対する支払い案内が迅速に行われる。
【0003】
紙文書の内容から基幹システムに入力するためのデータを作成する作業は、多大な人件費が必要になる。そのため、下記特許文献1では、光学式文字認識により画像に含まれた文字をテキストデータに変換して上述のデータにするといったことが行われる。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
上述の従来技術にあっては、光学式文字認識により画像に含まれた文字をテキストデータに変換することを行っているが、文字認識が正確に行われるとは限らず、誤認識された文字については、手作業で一つ一つ修正するといった必要があった。
なお、誤認識が生じているか否かについては、例えば、紙文書と上述の支払い案内書とを突き合わせて確認するという作業や、上述の基幹システムの画面を見ながら紙文書を片手にして確認するという作業が行われていた。
【0006】
本発明は、このような状況を鑑みてなされたものであり、文字認識結果の修正作業の効率化を図ることが可能な情報処理装置、情報処理方法、及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
上記目的を達成するため、本発明の一態様の情報処理装置は、
光学式文字認識により画像に含まれる少なくとも一の画像文字を変換することにより生成された文字テキストを、操作者が修正することを可能にした情報処理装置であって、
前記画像文字及び前記文字テキストを比較可能な視認状態にして表示部に表示する第1表示手段と、
前記表示部に表示された前記文字テキストに対し、前記操作者が、前記修正が必要と判断した場合に、入力部からの前記必要な修正を受け付けて、前記文字テキストから修正後文字テキストに置き換える第1修正手段と、
を備える。
【0008】
また、本発明の一態様の情報処理方法は、上述の本発明の一態様の情報処理装置に対応する方法とする。
【0009】
また、本発明の一態様のプログラムは、上述の本発明の一態様の情報処理装置に対応するプログラムとする。
【発明の効果】
【0010】
本発明によれば、文字認識結果の修正作業の効率化を図ることができる。
【図面の簡単な説明】
【0011】
【
図1】情報処理システムにおける本発明の情報処理装置が提供する本サービスの概要を示す図である。
【
図2】
図1の情報処理装置における表示部に画像文字及び文字テキストを表示した上で修正する一例を示す図である。
【
図3】情報処理システムに関するシステム構成の一例を示すブロック図である。
【
図4】
図3の情報処理装置のハードウェア構成を示すブロック図である。
【
図5】
図3の情報処理装置の機能的構成の一例を示す機能ブロック図である。
【
図6】
図3の情報処理装置の処理動作の一例を示すフローチャートである。
【
図7】表示部に画像文字及び文字テキストを表示した状態の一例を示す図である。
【
図8】
図7の状態から修正を行おうとする際の一例を示す図である。
【
図9】
図7又は
図8の状態から修正を行おうとする際の一例を示す図である。
【
図10】
図7乃至
図9のうち何れか一の状態から修正を行おうとする際の一例を示す図である。
【
図11】修正を補助するためのデータ修正候補を表示部に表示した状態の一例を示す図である。
【発明を実施するための形態】
【0012】
<本サービスの概要について>
図1は、情報処理システムにおける本発明の情報処理装置1が提供する本サービスの概要を示す図である。
【0013】
図1において、本サービスでは、情報処理装置1を用いて文字認識時における文字認識結果の適切な修正をより容易に行えるようにした環境を提供することを目的とする。別な言い方をすれば、情報処理装置1を用いて文字認識時における文字認識結果の修正作業を操作者2が効率的に行えるようにした環境を提供することを目的とする。
【0014】
図1の本実施形態では、仕入先7が納入先(符号省略)に対し請求書を送った場合の例を挙げて説明する(請求書は一例であるものとする)。なお、仕入先7は、1つのみの図示であるが、実際には複数あるものとする。このような複数の仕入先7に関し、納入先(符号省略)では、例えば、ID等で夫々管理して識別するものとする。
【0015】
図1の仕入先7は、例えば、独自の基幹システムである情報処理システム4を有する。この仕入先7側の情報処理システム4によって、納入先への請求書が作成される。請求書は、仕入先7ごとに異なり、例えば、
図1の(1)~(3)の記載のような3つのパターンのうちの何れか一で作成されて、納入先側へ送られる。
【0016】
仕入先7側の1つ目のパターンである(1)は、請求書のファイルとデータとを一緒にした状態で送付するものである。なお、(1)のファイルとは、紙のように印刷できるという形で情報を固定化し、その固定化した情報で受け渡しができるようにした電子ファイルのことをいうものとする。即ち、紙に代わる電子ファイルのことをいうものとする(所謂PDF等)。また、(1)のデータとは、例えば、(1)のファイルから抽出されたテキストデータをいうものとする。
【0017】
2つ目のパターンである(2)は、上述のファイルのみを送付するものである。また、3つ目のパターンである(3)は、紙文書の状態で送付するものである。ここでの紙文書とは、請求書の原本となるものを印刷したものである。印刷した原本は、納入先へ郵送される。
【0018】
本実施形態において、(1)のファイルとデータは、所定のネットワークN(
図3参照)を介してデータ化システム5に送信される。また、(2)のファイルもデータ化システム5に送信される。これに対し、(3)の原本は、データ化システム5に送信されることなく納入先へ直接郵送される。
【0019】
データ化システム5は、例えば、本サービスを提供する情報処理装置1とは別個に構築されて、少なくもとも帳票を自動的に作成するサービスを提供することができるといったシステムである。データ化システム5では、納入先の情報処理システム3において利用可能な帳票のデータ(帳票のファイル)が作成される。詳細な説明については省略するが、上述の(1)の場合は、例えば、テキストデータをカンマで区切ったような状態のデータ(所謂CSV)と一緒に帳票のデータが作成される。また、上述の(2)の場合は、例えば、データ化装置6を用いて帳票のデータ(帳票のファイル)や、その他のデータ(その他のファイル)が作成される。(2)の場合も、データ化装置6を用いて(1)の場合のようなテキストデータをカンマで区切った状態のデータが作成される。
【0020】
なお、データ化システム5で作成された帳票のデータ等は、納入先のBPOセンター(BPO:ビジネスプロセスアウトソーシング)へ送信されて、情報処理装置1に取り込まれる。BPOセンターの設置は任意であるが、本実施形態では仕入先7が多くあることから、納入先での効率化を図るためにBPOセンターが設置されるものとする。
BPOセンターが設置されない場合、情報処理装置1は、例えば、納入先の情報処理システム3の一構成となるものとする。
【0021】
データ化装置6は、例えば、スキャナと、OCR装置(OCR:Optical Character Recognition:光学式文字認識)と、画像記憶部と、テキスト記憶部等とを備えて構成される。スキャナは、光学的読取装置であり、文書等の紙媒体の原稿を光学的に読み取って画像データ化するものである。OCR装置は、スキャナにより生成された画像に含まれる文字を認識して、画像としての文字(画像文字)を文字コード(文字テキスト)に変換することによってテキストデータを生成するものである。このような構成のデータ化装置6は、画像に含まれる画像文字(画像としての文字)と、この画像文字を変換することにより生成された文字テキスト(文字コード)とを出力することができるといった機能を有する。
データ化装置6は、文字テキストを用いて帳票のデータも作成可能に構成される。
【0022】
本実施形態において、データ化装置6は、(3)の場合に対応するため、納入先のBPOセンターにも備えられる。納入先へ郵送された請求書の原本は、データ化装置6のスキャナやOCR装置で画像文字や文字テキストにデータ化される。また、帳票のデータも作成される。なお、データ化装置6は、文字認識を正確に行っているとは限らず、誤認識された文字についての確認や修正が必要になってくる。そのため、情報処理装置1は、上述の確認や修正を効率的に行えるように(上述の本サービスの目的を実現できるように)構成される。
【0023】
仕入先は、上述のBPOセンターの他に、例えば、管理部のような組織を備える。この管理部は、基幹システムである情報処理システム3を有する。管理部が管理する情報処理システム3では、BPOセンターの情報処理装置1からのデータ出力に基づき、例えば、支払案内書が自動的に作成され、そして出力される。この後、管理部では、支払案内の手続きが実施される。なお、情報処理システム3と情報処理装置1との間では、データ照合が適宜実施される。
【0024】
情報処理装置1は、操作者2の判断により誤認識された文字があれば、その修正を操作者2が行えるように構成される。
【0025】
情報処理装置1の表示部16(
図4参照)の表示画面16aには、例えば、
図2に示すような内容が画面表示される。
図2は、
図1の情報処理装置1における表示部16(表示画面16a)に画像文字及び文字テキストを表示した上で修正する一例を示す図である。
【0026】
図2において、表示画面16aには、第1表示エリア16bと第2表示エリア16cとが設けられる。第1表示エリア16bには、画像文字及び文字テキストが上下に並べられて表示される。表示画面16aでは、誤認識された文字があるか否かの確認や、誤認識された文字があればその修正が操作者2によって行えるような状態に表示される。一方、第2表示エリア16cには、第1表示エリア16bの文字テキストを含んで作成された帳票Fの一部が表示される。
なお、特に詳細な説明は省略するが、第1表示エリア16bの内容を全画面表示したり、第2表示エリア16cの帳票Fを全画面表示したりすることも可能であるものとする。
【0027】
先ず、第1表示エリア16bの表示内容について説明する。
第1表示エリア16bには、例えば、データ化装置6のスキャナやOCR装置でデータ化され、そして、情報処理装置1に送信されてきたものが表示される。
【0028】
図2では、例えば、項目フィルター設定欄16dに「フィールド名」という項目が入力された例が示される。この例の場合、帳票Fのフィールド名に関連する項目が第1表示エリア16bに表示される。具体的には、縦に複数並ぶように設けられた項目欄16eにフィールド名に関連する項目が夫々表示される。例えば、一番上の項目欄16eにフィールド名として「発行年月日」の項目が表示される。そして、この下には、「請求番号」の項目が表示される。また、この下には、「請求先名」、「請求先住所」、「請求先電話番号」、「合計」、「製品名」、「明細番号」、「請求先製品番号」、「数量」、「単価」の項目が順に並んで表示される。これら項目の表示は、帳票認識に用いられる辞書を参照して行われるものとする(一例であるものとする)。上述の入力は、操作者2が用いる入力部17にて行われるものとする。
【0029】
複数の項目欄16eの右隣には、画像文字欄16fとテキスト文字欄16gとが設けられる。画像文字欄16fとテキスト文字欄16gは、上下に並んで比較可能な状態に設けられる。画像文字欄16fとテキスト文字欄16gは、これら画像文字欄16fに表示された画像文字(後述する)とテキスト文字欄16gに表示されたテキスト文字とを一目で視認することが可能な状態に配置される。
【0030】
画像文字欄16fは、画像に含まれる画像文字を表示するために設けられる(画像を表示するために設けられる)。また、テキスト文字欄16gは、画像文字を変換することにより生成された文字テキストを表示するために設けられる(画像に対応する値を表示するために設けられる)。
【0031】
一番上の項目欄16eのフィールド名「発行年月日」の右隣にある画像文字欄16fには、「2021/04/15」が画像文字の状態で表示される。また、テキスト文字欄16gには、「2021/04/15」がテキスト文字の状態で表示される。
【0032】
項目欄16eのフィールド名「請求番号」の右隣にある画像文字欄16fには、「1000476」が画像文字の状態で表示される。また、テキスト文字欄16gには、「1000476」がテキスト文字の状態で表示される。
【0033】
項目欄16eのフィールド名「請求先名」の右隣にある画像文字欄16fには、「××××ソリューション株式会社 御中」が画像文字の状態で表示される。また、テキスト文字欄16gには、「××××ソリューション株式会社」がテキスト文字の状態で表示される(テキスト文字の表示に「御中」が存在しないことから、修正の対象であることが分かる)。
【0034】
なお、「請求先住所」、「請求先電話番号」、「合計」、「製品名」、「明細番号」、「請求先製品番号」、「数量」、「単価」の右隣にある画像文字欄16fの画像文字と、テキスト文字欄16gのテキスト文字とに関するここでの記載は省略するものとする。
【0035】
画像文字欄16fとテキスト文字欄16gの右隣には、チェックボックス16hが設けられる。このチェックボックス16hは、「確認済み」であるか否かのチェックマークを入れるために設けられる。チェックボックス16hは、小さな四角形で設けられる。
【0036】
画像文字欄16fは、光学式文字認識の正確度で色表示される。正確度とは、例えば、フィールド名「請求先住所」に対応する位置や、「請求先電話番号」に対応する位置において、過去に同じ内容の文字テキストの修正がどの程度行われたかに基づいて算出された指標である。正確度は、修正の行われた回数が多いほど値が小さくなり、逆に修正の行われた回数が少ないほど正確度の値は大きくなるように設定される。算出の一例としては、これまで記憶部18に記憶された文字テキストの数を母数として、修正が行われた回数の割合の逆数を正確度として算出することが挙げられる。
【0037】
本実施形態では、正確度が大きい分類に属する場合、青系の色で画像文字欄16fが色表示される。また、正確度が中程度の分類に属する場合は、黄系の色で画像文字欄16fが色表示される。また、正確度が小さい分類に属する場合は、赤系の色で画像文字欄16fが色表示される。
【0038】
例えば、本実施形態において、フィールド名「請求先住所」に対応する位置の画像文字欄16fは赤色表示される(修正回数が多い)。また、フィールド名「請求先電話番号」に対応する位置の画像文字欄16fは青色表示される(数字であるため文字認識し易く、修正回数が少ない)。この他、フィールド名「請求先製品番号」に対応する位置の画像文字欄16fは紫色(赤紫色)で表示される(比較的修正回数が多い)。
【0039】
以上のように、画像文字欄16fが正確度で色表示されることから、操作者2は、その色表示に注意して画像文字欄16fの画像文字とテキスト文字欄16gのテキスト文字とを比較して確認すればよい。なお、画像文字欄16fとテキスト文字欄16gとを上下に並べて配置することから、画像文字とテキスト文字との比較が非常にし易くなっている(並べ方は一例であり、例えば、左右の配置であってもよいものとする)。
【0040】
正確度の色表示に関し、本実施形態では、正確度表示マーク16iの左側にあるチェックボックス(符号省略)のチェックを外すと、例えば、テキスト文字欄16gと同様の白色で表示される。なお、チェックボックスと正確度表示マーク16iとの間は、「正確度を色表示する」と表示される(この表示は一例であるものとする)。
【0041】
図2では、フィールド名「商品名」のテキスト文字欄16gにおいて値が修正中(カーソルCの位置で修正)となっており、この時、第2表示エリア16cの帳票Fにおける「商品名」がある項目欄16jが拡大表示される。修正中の値に対応する項目欄16jは、ハイライトHL1で表示される。なお、本実施例では、テキスト文字欄16gでの修正のみならず、ハイライトHL1で表示された項目欄16jからの修正(値の修正)もできるようになっている。
【0042】
テキスト文字欄16gでの値の修正や項目欄16jでの値の修正は、操作者2が後述する入力部17を用いて行えるようになっている。修正は、文字テキストから修正後文字テキストへの置き換えを入力によって行うようになっている。
【0043】
以上、
図1及び
図2を参照しながら本サービスの概要について説明してきたように、本サービスでは、情報処理装置1を用いることから、操作者2が文字認識時における文字認識結果の修正作業を効率的に行うことができる。
【0044】
<情報処理システムのシステム構成について>
図3は、全体的な情報処理システムに関するシステム構成の一例を示すブロック図である。
【0045】
情報処理システムは、インターネット等の所定のネットワークNに接続される。このネットワークNには、仕入先7(
図1参照)側の情報処理システム4や、仕入先7側の情報処理システム4と情報処理装置1との間に介在するデータ化システム5、納入先側の情報処理システム3も接続される。情報処理装置1には、スキャナやOCR装置等で構成されるデータ化装置6が接続される。なお、
図3では示さないが、データ化装置6は、データ化システム5にも備えられる。
【0046】
<情報処理装置1のハードウェア構成について>
図4は、
図3の全体的な情報処理システムのうち、情報処理装置1のハードウェア構成を示すブロック図である。
【0047】
情報処理装置1は、CPU(Central Processing Unit)11と、ROM(Read Only Memory)12と、RAM(Random Access Memory)13と、バス14と、入出力インターフェース15と、表示部16(出力部)と、入力部17と、記憶部18と、通信部19と、ドライブ20とを備えて構成される。
【0048】
CPU11は、ROM12に記録されているプログラム、又は、記憶部18からRAM13にロードされたプログラムに従って各種の処理を実行する。
RAM13には、CPU11が各種の処理を実行する上において必要なデータ等も適宜記憶される。
【0049】
CPU11、ROM12及びRAM13は、バス14を介して相互に接続される。このバス14には、入出力インターフェース15が接続される。
入出力インターフェース15には、表示部16(出力部)、入力部17、記憶部18、通信部19及びドライブ20が接続される。
【0050】
表示部16(出力部)は、ディスプレイ(画面。本明細書ではこの画面を表示画面16aとする)により構成され、各種画像を表示する。入力部17は、マウスやキーボード等の各種ハードウェア等で構成され、各種情報を入力する。
記憶部18は、ハードディスクやDRAM(Dynamic Random Access Memory)等で構成され、各種データを記憶する。
通信部19は、所定のネットワークNを介して他の装置(
図3の場合、データ化システム5や納入先側の情報処理システム3)との間で行う通信を制御する。
【0051】
ドライブ20は、必要に応じて設けられる。ドライブ20には、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリ等よりなる、リムーバブルメディア21が適宜装着される。
ドライブ20によってリムーバブルメディア21から読み出されたプログラムは、必要に応じて記憶部18にインストールされる。また、リムーバブルメディア21は、記憶部18に記憶されている各種データも、記憶部18と同様に記憶することができる。
【0052】
以上のような情報処理装置1に関し、各種ハードウェアと各種ソフトウェアとの協働により、後述する各種処理が実現されるようになるものとする。
【0053】
なお、情報処理装置1は、例えば、パーソナルコンピュータ(PC)や、タブレット等の携帯端末が一例として挙げられるものとする。パーソナルコンピュータ(PC)の場合は、所謂デスクトップパソコンやノートパソコンの何れであってもよいものとする。
【0054】
<情報処理装置1の機能的構成について>
図5は、
図3の情報処理装置1の機能的構成の一例を示す機能ブロック図である。
【0055】
図5において、情報処理装置1は、
図4を参照しながら上述したように、CPU11と、表示部16と、入力部17と、記憶部18と、通信部19と、その他機能(
図5での図示は省略)とを備えて構成される。
【0056】
CPU11は、項目データ・文字データ処理部111と、表示処理部112と、修正処理部113と、正確度算出処理部114と、帳票データ処理部115とを備えて構成される。別な言い方をすれば、情報処理装置1のCPU11においては、動作する際に、項目データ・文字データ処理部111と、表示処理部112と、修正処理部113と、正確度算出処理部114と、帳票データ処理部115とが機能する。
【0057】
これら構成のうち、表示処理部112は、第1表示処理部112a(第1表示手段)と、第2表示処理部112b(第2表示手段)と、第3表示処理部112c(第3表示手段)とを有する。また、修正処理部113は、第1修正処理部113a(第1修正手段)と、第2修正処理部113b(第2修正手段)とを有する。
【0058】
記憶部18は、項目データ・文字データ記憶部181と、データ修正候補記憶部182と、正確度データ記憶部183と、帳票データ記憶部184を備えて構成される。
【0059】
CPU11の項目データ・文字データ処理部111は、項目フィルター設定欄16dに入力された項目に合わせて各種処理を実行する。例えば、項目データ・文字データ処理部111は、表示処理部112が所定の表示をする際に必要となるデータの提供に係る処理や、記憶部18の項目データ・文字データ記憶部181に対し上述の項目を記憶させる処理等を実行する。
【0060】
項目データ・文字データ処理部111は、上述の他に、データ化装置6で作成された画像文字及び文字テキストを記憶部18の項目データ・文字データ記憶部181に記憶させる処理も実行する。なお、画像文字及び文字テキストは、帳票データ記憶部184に記憶させた帳票Fのデータに対し紐付けるように記憶される。
【0061】
表示処理部112の第1表示処理部112aは、データ化装置6で作成された画像文字及び文字テキストを比較可能な視認状態にして表示部16(表示画面16a)に表示する処理を実行する。具体的には、上下に並ぶようにして、画像文字欄16fに画像文字を表示すると共に、テキスト文字欄16gにテキスト文字を夫々表示する処理を実行する。
【0062】
第1表示処理部112aは、指定された項目に合わせて(項目フィルター設定欄16dに入力された項目に合わせて)画像文字及び文字テキストを表示する処理を実行する。また、第1表示処理部112aは、正確度算出処理部114で得られた正確度に基づく表示状態で(例えば、青系、赤系、黄系で色分けした状態)画像文字を表示する処理も実行する。
【0063】
第2表示処理部112bは、表示部16(表示画面16a)に表示された文字テキストに対し、修正が必要な場合に、その必要な修正を補助するためのデータ修正候補16l(
図11を参照しながら後述する)を表示画面16aに表示する処理を実行する。なお、データ修正候補16lを用いての文字テキストの修正にあたっては、修正処理部113が機能する。
【0064】
第3表示処理部112cは、帳票Fを表示部16(表示画面16a)に表示する処理を実行する。具体的には、操作者2が第1表示エリア16bに表示された文字テキストに対し、例えば、ポインターPを合わせてマウスのボタンをクリックすると(文字テキストを指定すると)、その文字テキストが含まれる箇所の帳票Fを第2表示エリア16cに表示する処理を実行する。第3表示処理部112cは、上述の他に、ハイライト表示(ハイライトHL1、ハイライトHL2)をする処理も実行する。
【0065】
表示処理部112は、第1表示処理部112a~第3表示処理部112cの上述の処理の他に、例えば、第1表示エリア16bを全画面表示したり、第2表示エリア16cの帳票Fを全画面表示したりする処理も実行する。また、表示処理部112は、第1表示エリア16bの小さな四角いチェックボックス16hにチェックマークを入れたり外したりする表示の処理も実行する。表示処理部112は、表示に関する各種処理を実行する。
【0066】
修正処理部113の第1修正処理部113aは、表示部16(表示画面16a)に表示された文字テキストに誤認識が生じ、そして、誤認識が生じた箇所(文字)の修正が必要と操作者2が判断した場合に、その必要な修正を入力部17から受け付けて、文字テキストから修正後文字テキストに置き換える処理を実行する。なお、文字テキストから修正後文字テキストへの置き換えは、表示画面16aで行われるのは勿論のこと、記憶部18の項目データ・文字データ記憶部181及び帳票データ記憶部184でも行われるものとする。
【0067】
第1修正処理部113aは、上述の他に、データ修正候補16l(
図11を参照しながら後述する)から選ばれた選択データ修正候補に基づき必要な修正を受け付ける処理も実行する。
【0068】
第2修正処理部113bは、帳票Fで指定した文字テキストにて修正をしようと操作者2が判断した場合に、その必要な修正を入力部17から受け付けて、指定した文字テキストから修正後文字テキストに置き換える処理を実行する。なお、ここでの指定とは、例えば、ポインターPを合わせてマウスのボタンをクリックし文字テキストを指定することをいうものとする。指定した文字テキストから修正後文字テキストへの置き換えは、表示画面16aで行われるのは勿論のこと、記憶部18の項目データ・文字データ記憶部181及び帳票データ記憶部184でも行われるものとする。
【0069】
第1修正処理部113a及び第2修正処理部113bを有する修正処理部113は、修正に関する各種処理を実行する。
【0070】
正確度算出処理部114は、第1表示処理部112aで色表示する際に用いられる正確度を算出するための処理を実行する。又は、予め設定された正確度を第1表示処理部112aで活用することができるような処理を実行する。正確度は、上述したように、過去に同じ内容の文字テキストの修正がどの程度行われたかに基づいて算出された指標である。正確度は、修正の行われた回数が多いほど値が小さくなり、逆に修正の行われた回数が少ないほど正確度の値は大きくなるように設定される。
【0071】
なお、正確度算出処理部114は、
図5に示すような機能ブロックとするのでなく、第1表示処理部112aの機能ブロックに含まれるようにしてもよいものとする。
【0072】
帳票データ処理部115は、データ化装置6で作成された帳票Fのデータに関する各種処理を実行する。例えば、帳票データ処理部115は、帳票Fのデータを記憶部18の帳票データ記憶部184に記憶させる等の処理を実行する。
【0073】
記憶部18の項目データ・文字データ記憶部181は、上述の項目やデータ化装置6で作成された画像文字及び文字テキスト等を記憶する記憶領域として備えられる。
【0074】
データ修正候補記憶部182は、データ修正候補16l(
図11を参照しながら後述する)に関するデータを記憶する記憶領域として備えられる。
正確度データ記憶部183は、正確度に関するデータを記憶する記憶領域として備えられる。
帳票データ記憶部184は、データ化装置6で作成された帳票Fのデータを記憶する記憶領域として備えられる。
【0075】
<情報処理装置1の処理動作について>
図6は、
図3の情報処理装置1の処理動作の一例(文字認識結果の修正作業に関連する例)を示すフローチャートである。
【0076】
情報処理装置1の動作として、ステップS1では、指定された項目に合わせて(項目フィルター設定欄16dに入力された項目に合わせて)、上下に並ぶように、画像文字欄16fに画像文字を正確度に応じて表示すると共に、テキスト文字欄16gにテキスト文字を夫々表示する。画像文字及び文字テキストの表示が完了するとステップS2へ移行する。
【0077】
ステップS2では、各チェックボックス16hにチェックマークが入り、「全て確認済み」であるか否かを判断する。即ち、上下に並んで表示された画像文字とテキスト文字とを夫々見比べて誤認識がないと操作者2が判断した時、又は、誤認識があって必要な修正を操作者2が行った後に、チェックボックス16hにチェックマークを入れて「確認済み」としてあるか否かを判断する。「全て確認済み」であると判断(ステップS2でYes)した場合は動作を終了し、チェックマークが入っていないチェックボックス16hがあると判断(ステップS2でNo)した場合は、ステップS3へ移行する。
【0078】
ステップS3では、チェックマークが入っていないチェックボックス16hがあるため、修正が必要であるか否かを操作者2に判断させる。この判断のさせ方は様々あるが、例えば、操作者2に向けて修正の要否を問うポップアップを行うことが一例として挙げられる(図示省略)。操作者2の入力により修正が不要である場合(ステップS3でNo)は、例えば、ステップS4へ移行する。一方、操作者2の入力により修正が必要である場合(ステップS3でYes)は、ステップS5へ移行する。
【0079】
ステップS4では、チェックボックス16hにチェックマークを入れて「全て確認済み」の状態にし、ステップS2へ移行する。ステップS2へ移行することにより、この後に動作を終了する。
【0080】
ステップS5では、修正が必要な項目の文字テキストの修正を行い、ステップS6へ移行する。
【0081】
ステップS6では、修正した項目のチェックボックス16hにチェックマークを入れて「確認済み」の状態にし、ステップS2へ移行する。ステップS2へ移行して動作を繰り返すことにより、最終的に動作を終了する。
【0082】
<表示画面16aの表示例について>
図7は、表示部16(表示画面16a)に画像文字及び文字テキストを表示した状態の一例を示す図である。
また、
図8は、
図7の状態から修正を行おうとする際の一例を示す図であり、
図9は、
図7又は
図8の状態から修正を行おうとする際の一例を示す図である。
また、
図10は、
図7乃至
図9のうち何れか一の状態から修正を行おうとする際の一例を示す図である。
また、
図11は、修正を補助するためのデータ修正候補16lを表示部16(表示画面16a)に表示した状態の一例を示す図である。
【0083】
図7において、ここでは、項目フィルター設定欄16dに「フィールド名」という項目が入力部17を介して入力された例が示される(
図2の例とは表示が異なるものとする)。第1表示エリア16bには、縦に複数並ぶ項目欄16eに「製品名」、「金額」、「備考」が繰り返すように表示される。また、「製品名」に合わせて画像文字欄16fに画像文字が表示されると共に、テキスト文字欄16gにテキスト文字が表示される。また、「金額」に合わせて画像文字欄16fに画像文字が表示されると共に、テキスト文字欄16gにテキスト文字が表示される。また、「備考」に合わせて画像文字欄16fに画像文字が表示されると共に、テキスト文字欄16gにテキスト文字が表示される。
なお、ここでは修正が必要であるか否かを操作者2が判断していない状態であるため、チェックボックス16hには、チェックマークが入っていないものとする。
図7での画像文字欄16fの表示色を見ると、全て正確度が高いというわけではないことが分かる。
【0084】
ポインターPを項目欄16eの「製品名」、又は、その右側のテキスト文字欄16gに合わせてマウスのボタンをクリックすると、第2表示エリア16cには、
図8に示すように、「製品名」に関連する箇所の帳票Fが表示される。修正が必要な場合は、第1表示エリア16bのテキスト文字欄16gや、第2表示エリア16cのハイライト表示(ハイライトHL1)された項目欄16jから行えるようになる。
【0085】
図9において、ポインターPを項目欄16eの「金額」、又は、その右側のテキスト文字欄16gに合わせてマウスのボタンをクリックすると、第2表示エリア16cには、「金額」に関連する箇所の帳票Fが表示される。修正が必要な場合は、第1表示エリア16bのテキスト文字欄16gや、第2表示エリア16cのハイライト表示(ハイライトHL2)された項目欄16kから行えるようになる。
【0086】
図10において、ここでは、項目フィルター設定欄16dに「製品名」という項目が入力部17を介して入力された例が示される。第1表示エリア16bには、縦に複数並ぶ項目欄16eに「製品名」が繰り返すように表示される。また、「製品名」に合わせて画像文字欄16fに画像文字が表示されると共に、テキスト文字欄16gにテキスト文字が表示される。なお、画像文字欄16f及びテキスト文字欄16gに表示がない箇所には、予めチェックボックス16hにチェックマークが入っているものとする。第2表示エリア16cには、「製品名」に関連する箇所の帳票Fが表示される。
【0087】
図10から分かることは、項目フィルター設定欄16dに、例えば、「製品名」が入力部17を介して入力されば、「製品名」に関して操作者2が確認及び修正をすることができる。別な言い方をすれば、「製品名」で絞り込みができて、確認及び修正をすることができる。
【0088】
図示は省略するが、例えば、項目フィルター設定欄16dに「請求先住所」が入力部17を介して入力されれば、「請求先住所」に関して表示させることができ、そして、「請求先住所」に関して操作者2が確認及び修正をすることができる。同様に、「数量」が入力されれば、「数量」に関して表示させることができ、そして、「数量」に関して確認及び修正をすることができる。
【0089】
ここで、
図10を用いて一例を挙げることにする。
図10では、1つの文書(例えば請求書)を対象とする。この1つの文書は3ページあって、各ページに跨って「製品名」があるものとすると、項目フィルター設定欄16dに、「製品名」が入力部17を介して入力されば、3ページに跨って「製品名」に関し、表示をすることができる。そして、操作者2が確認及び修正を一括して行うことができる。
【0090】
この他、特に図示しないが、例えば、3つの文書を対象とし、この3つの文書は夫々3ページあって、各ページに跨って「製品名」があるとすると、項目フィルター設定欄16dに、「製品名」が入力部17を介して入力されば、3つの文書の合計9ページに跨って「製品名」に関し、表示をすることができる。そして、操作者2が確認及び修正を一括して行うことができる。
【0091】
図7乃至
図10の説明における修正に関し、例えば、
図11に示すような、データ修正候補16lを表示画面16aに表示させ、このデータ修正候補16lから選んだ選択データ修正候補に基づき操作者2が修正を行うようにすれば、文字認識結果の修正作業の効率化を図ることができる。
<効果について>
以上、
図3乃至
図11を参照しながら説明してきたように、本サービスによれば、修正作業の効率化を図ることができる。つまり、情報処理装置1を用いて操作者2が文字認識時における文字認識結果の修正作業を効率的に行うことができる。
【0092】
<まとめ>
以上、情報処理システムにおける本発明の情報処理装置1の一実施形態について説明したが、本発明は上述した本実施形態に限定されないものとする。また、本実施形態に記載された効果は、本発明から生じる最も好適な効果の列挙に過ぎず、本発明による効果は、本実施形態に記載されたものに限定されないものとする。
【0093】
図4に示すハードウェア構成は、本発明の目的を達成するための例示に過ぎず、特に限定されないものとする。また、
図5に示す機能的構成も例示に過ぎず、特に限定されないものとする。即ち、上述した一連の処理を全体として実行できる機能が情報処理装置1に備えられていれば足り、この機能を実現するためにどのような機能ブロックを用いるのかは特に
図5の例に限定されないものとする。
【0094】
また、機能ブロックの存在場所も、
図5に特に限定されず、任意でよいものとする。例えば、情報処理装置1の機能ブロックを納入先の情報処理システム3等に適宜移譲させてもよいものとする。また、1つの機能ブロックは、ハードウェア単体で構成してもよいし、ソフトウェア単体で構成してもよいし、それらの組み合わせで構成してもよいものとする。
【0095】
また、例えば、一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、コンピュータ等にネットワークや記録媒体からインストールされるものとする。また、コンピュータは、専用のハードウェアに組み込まれるコンピュータであってもよいものとする。
コンピュータは、各種のプログラムをインストールすることで、各種の機能を実行することが可能なコンピュータ、例えば情報処理装置1の他、汎用のパーソナルコンピュータやタブレットであってもよいものとする。
【0096】
また、例えば、このようなプログラムを含む記録媒体は、利用者にプログラムを提供するために、装置本体とは別に配布される図示しないリムーバブルメディアにより構成されるだけでなく、装置本体に予め組み込まれた状態で利用者に提供される記録媒体等で構成されるものであってもよいものとする。
【0097】
なお、本明細書において、記録媒体に記録されるプログラムを記述するステップは、その順序に沿って時系列的に行われる処理は勿論、必ずしも時系列的に処理されなくとも、並列的或いは個別に実行される処理をも含むものとする。また、本明細書において、システムの用語は、複数の装置や複数の手段等より構成される全体的な装置を意味するものとする。
【0098】
このようなプログラムを含む記録媒体は、ユーザーにプログラムを提供するために装置本体とは別に配布される
図4のリムーバブルメディア21により構成されるだけでなく、装置本体に予め組み込まれた状態で利用者に提供される記録媒体等で構成される。
リムーバブルメディア21は、例えば、磁気ディスク(フロッピディスクを含む)、光ディスク、又は光磁気ディスク等により構成される。光ディスクは、例えば、CD-ROM(Compact Disk-Read Only Memory),DVD(Digital Versatile Disk)等により構成される。光磁気ディスクは、MD(Mini-Disk)等により構成される。
装置本体に予め組み込まれた状態でユーザーに提供される記録媒体は、例えば、プログラムが記録されている
図4のROM12や、
図4の記憶部18に含まれるハードディスク等で構成される。
【0099】
以上まとめると、本発明が適用される情報処理装置は、次のような構成を取れば足り、各種各様な実施形態を取ることができる。
即ち、本発明が適用される情報処理装置(例えば、
図3の情報処理装置1)は、
光学式文字認識により画像に含まれる少なくとも一の画像文字を変換することにより生成された文字テキストを、操作者(例えば、
図3の操作者2)が修正することを可能にした情報処理装置であって、
前記画像文字及び前記文字テキストを比較可能な視認状態にして表示部(例えば、
図5の表示部16)に表示する第1表示手段(例えば、
図5の第1表示処理部112a)と、
前記表示部に表示された前記文字テキストに対し、前記操作者が、前記修正が必要と判断した場合に、入力部からの前記必要な修正を受け付けて、前記文字テキストから修正後文字テキストに置き換える第1修正手段(例えば、
図5の第1修正処理部113a)と、
を備える。
【0100】
本発明によれば、第1表示手段により画像文字及び文字テキストを比較可能な視認状態にして表示部に表示することができ、また、第1修正手段により修正を受け付けて文字テキストから修正後文字テキストに置き換えができることから、情報処理装置を用いて文字認識時における文字認識結果の修正作業を操作者が効率的に行うことができる。従って、修正作業の効率化を図ることができる。
【0101】
また、本発明が適用される情報処理装置は、
前記文字テキストに対し前記必要な修正を補助するためのデータ修正候補(例えば、
図11のデータ修正候補16l)を前記表示部に表示する第2表示手段(例えば、
図5の第2表示処理部112b)を更に備え、
前記第1修正手段は、前記データ修正候補から選ばれた選択データ修正候補に基づき前記必要な修正を受け付ける。
【0102】
本発明によれば、データ修正候補から選ばれた選択データ修正候補に基づき修正をすることができる。従って、修正作業の効率化を向上させることができる。
【0103】
また、本発明が適用される情報処理装置は、
前記第1表示手段は、前記画像文字及び前記文字テキストに関連する項目のうち、指定された項目に合わせて前記画像文字及び前記文字テキストを前記表示部に表示する。
【0104】
本発明によれば、文字認識結果の修正にあたり項目を指定し絞り込みをした上で修正をすることができる。従って、修正作業の効率化を向上させることができる。
【0105】
また、本発明が適用される情報処理装置は、
前記光学式文字認識の正確度を算出する正確度算出手段(例えば、
図5の正確度算出処理部114)を更に備え、
前記第1表示手段は、前記正確度に基づく表示状態で少なくとも前記画像文字を前記表示部に表示する。
【0106】
本発明によれば、正確度に基づく表示状態で画像文字を表示部に表示することができる。これにより、表示状態を見るだけで光学式文字認識の正確度を把握することができる。従って、修正作業の効率化を向上させることができる。
【0107】
また、本発明が適用される情報処理装置は、
前記操作者が前記表示部に表示された前記文字テキストを指定することにより、当該指定した文字テキストが含まれる帳票(例えば、
図8の帳票F)を、表示エリア(例えば、
図8の第1表示エリア16bと第2表示エリア16c)を分けて前記表示部に表示する第3表示手段(例えば、
図5の第3表示処理部112c)と、
前記帳票における前記指定した文字テキストに対する前記必要な修正を受け付けて、前記指定した文字テキストから前記修正後文字テキストに置き換える第2修正手段(例えば、
図5の第2修正処理部113b)と、
を更に備える。
【0108】
本発明によれば、第3表示手段により表示エリアを分けて帳票を表示部に表示することができ、また、第2修正手段により修正を受け付けて文字テキストから修正後文字テキストに置き換えができることから、情報処理装置を用いて文字認識時における文字認識結果の修正作業を操作者が効率的に行うことができる。従って、修正作業の効率化を図ることができる。
【0109】
本発明が適用される情報処理方法は、
光学式文字認識により画像に含まれる少なくとも一の画像文字を変換することにより生成された文字テキストを、操作者が修正することを可能にした情報処理装置が実行する情報処理方法であって、
前記画像文字及び前記文字テキストを比較可能な視認状態にして表示部に表示する第1表示ステップ(例えば、
図6のフローチャートのステップS1)と、
前記表示部に表示された前記文字テキストに対し、前記操作者が、前記修正が必要と判断した場合に、入力部からの前記必要な修正を受け付けて、前記文字テキストから修正後文字テキストに置き換える第1修正ステップ(例えば、
図6のフローチャートのステップS6)と、
を含む。
【0110】
本発明によれば、情報処理装置が実行する情報処理方法であることから、文字認識結果の修正作業の効率化を図ることができる。
【0111】
本発明が適用されるプログラムは、
光学式文字認識により画像に含まれる文字を認識して得られた少なくとも一の画像文字を変換することにより生成された文字テキストを、操作者が修正することを可能にした情報処理装置を制御するコンピュータに、
前記画像文字及び前記文字テキストを比較可能な視認状態にして表示部に表示する第1表示ステップ(例えば、
図6のフローチャートのステップS1)と、
前記表示部に表示された前記文字テキストに対し、前記操作者が、前記修正が必要と判断した場合に、入力部からの前記必要な修正を受け付けて、前記文字テキストから修正後文字テキストに置き換える第1修正ステップ(例えば、
図6のフローチャートのステップS6)と、
を含む制御処理を実行させる。
【0112】
本発明によれば、情報処理装置を制御するコンピュータに上述の制御処理を実行させることから、文字認識結果の修正作業の効率化を図ることができる。
【符号の説明】
【0113】
1・・・情報処理装置、11・・・CPU、112a・・・第1表示処理部(第1表示手段)、112b・・・第2表示処理部(第2表示手段)、112c・・・第3表示処理部(第3表示手段)、113a・・・第1修正処理部(第1修正手段)、113b・・・第2修正処理部(第2修正手段)、114・・・正確度算出処理部、115・・・帳票データ処理部、18・・・記憶部、181・・・項目データ・文字データ記憶部、182・・・データ修正候補記憶部、183・・・正確度データ記憶部、184・・・帳票データ記憶部