(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-01-29
(45)【発行日】2024-02-06
(54)【発明の名称】情報処理装置及び情報処理プログラム
(51)【国際特許分類】
G06V 30/12 20220101AFI20240130BHJP
【FI】
G06V30/12 D
G06V30/12 J
(21)【出願番号】P 2020053995
(22)【出願日】2020-03-25
【審査請求日】2023-02-28
(73)【特許権者】
【識別番号】000005496
【氏名又は名称】富士フイルムビジネスイノベーション株式会社
(74)【代理人】
【識別番号】100115129
【氏名又は名称】清水 昇
(74)【代理人】
【識別番号】100102716
【氏名又は名称】在原 元司
(74)【代理人】
【識別番号】100122275
【氏名又は名称】竹居 信利
(72)【発明者】
【氏名】榎本 尚之
(72)【発明者】
【氏名】山口 政幸
(72)【発明者】
【氏名】道村 唯夫
【審査官】伊知地 和之
(56)【参考文献】
【文献】特開2010-056603(JP,A)
【文献】特開2008-122788(JP,A)
【文献】特開2007-158946(JP,A)
【文献】特開2005-251050(JP,A)
【文献】特開2017-175238(JP,A)
【文献】特開2019-101647(JP,A)
【文献】堤裕之 外2名,紙媒体による運用を前提とした授業文書管理システムの構築とその汎用性,情報処理学会 デジタルプラクティス Vol.6 No.2 [online] ,日本,情報処理学会,2016年04月15日,第6巻 第2号,pp.112~122
(58)【調査した分野】(Int.Cl.,DB名)
G06V30/14 - 30/168
G06V30/224
G06V30/40 - 30/416
H04N 1/00
CSDB(日本国特許庁)
(57)【特許請求の範囲】
【請求項1】
一又は複数のプロセッサを備え、
前記プロセッサは、
記入者を特定するための情報である特定情報、ページ番号、総ページ数が記載されている複数枚の文書を受け取り、
前記特定情報、前記ページ番号、前記総ページ数を文字認識し、
前記特定情報の文字認識結果が同じである文書の枚数、該文書に記載されている前記ページ番号と前記総ページ数にしたがって、前記文字認識又は前記記入者による記入の誤りがある旨を出力するように制御する、
情報処理装置。
【請求項2】
前記プロセッサは、
前記文書の枚数、該文書に記載されている前記ページ番号と前記総ページ数にしたがって、誤りの種類を出力するように制御する、
請求項1に記載の情報処理装置。
【請求項3】
前記プロセッサは、
前記特定情報の文字認識結果が同じである文書において、各文書に記載されている総ページ数の文字認識結果に一致しないものがある場合は、総ページ数の誤検知である旨を出力するように制御する、
請求項2に記載の情報処理装置。
【請求項4】
前記プロセッサは、
前記文書の枚数が前記総ページ数より少ない場合は、ページ不足である旨を出力するように制御する、
請求項2に記載の情報処理装置。
【請求項5】
前記プロセッサは、
前記文書の枚数が前記総ページ数より多い場合は、特定情報の誤検知である旨を出力するように制御する、
請求項2に記載の情報処理装置。
【請求項6】
前記プロセッサは、
前記特定情報の文字認識結果が同じである文書において、前記ページ番号が揃っていない場合は、ページ番号の誤検知である旨を出力するように制御する、
請求項2に記載の情報処理装置。
【請求項7】
前記プロセッサは、
前記特定情報の文字認識結果が同じである文書において、各文書に記載されている総ページ数の文字認識結果が一致していると判断をした後に、
前記文書の枚数が前記総ページ数より少ないか否かの判断、前記文書の枚数が前記総ページ数より多いか否かの判断、前記特定情報の文字認識結果が同じである文書において、前記ページ番号が揃っているか否かの判断、のいずれか1つ以上の判断を行う、
請求項2に記載の情報処理装置。
【請求項8】
前記プロセッサは、
前記特定情報の文字認識結果が同じである文書において、該文書の枚数と前記総ページ数が適合しており、前記ページ番号が揃っている場合は、他の特定情報が記載された文書の処理を続ける、
請求項1に記載の情報処理装置。
【請求項9】
一又は複数のプロセッサを備えたコンピュータの前記プロセッサに、
記入者を特定するための情報である特定情報、ページ番号、総ページ数が記載されている複数枚の文書を受け取り、
前記特定情報、前記ページ番号、前記総ページ数を文字認識し、
前記特定情報の文字認識結果が同じである文書の枚数、該文書に記載されている前記ページ番号と前記総ページ数にしたがって、前記文字認識又は前記記入者による記入の誤りがある旨を出力するように制御する、
処理を実行させるための情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置及び情報処理プログラムに関する。
【背景技術】
【0002】
特許文献1には、認識対象が誤り検出符号付きであって、誤りが検出されると常に認識結果を人手で修正する場合に比べて、人手で修正する回数を減少させるようにした情報処理装置を提供することを課題とし、情報処理装置の検出手段は、誤り検出符号付きの認識対象に対する複数の認識結果のうちの1つの認識結果について誤り検出符号を用いて、該認識結果の誤り検出を行い、変換手段は、前記検出手段によって誤りが検出され、予め定められた条件を満たす場合は、複数の前記認識結果のうち、前記検出手段の対象となった認識結果とは異なる認識結果に変換し、第1の制御手段は、前記変換手段によって変換された認識結果に対して、前記検出手段による検出を行わせるように制御し、第2の制御手段は、前記変換手段における予め定められた条件を満たさなかった場合は、前記認識対象の認識結果を人手で修正させるように制御することが開示されている。
【0003】
特許文献2には、文書の画像を受け付ける受付手段と、前記文書の第1の枠内の文字列と該第1の枠とは異なる第2の枠内の文字列との関係を定義する定義情報に基づき、該第1の枠内の複数の文字認識候補から、該第1の枠内の文字認識結果を選択する選択手段を有し、前記定義情報として、前記第1の枠内と前記第2の枠内であり得る文字列の集合、該第1の枠内の文字列と該第2の枠内の文字列の関係を示す正規表現情報、該第1の枠内の文字列と該第2の枠内の文字列の種別の制限のいずれか又はこれらの組み合わせを含み、前記選択手段は、該第1の枠内の複数の文字認識候補と該第2の枠内の複数の文字認識候補から、前記定義情報に合致する文字認識結果を選択し、前記第1の枠の定義情報と前記第2の枠の定義情報において、一方が複数の文字認識候補が列記されている定義情報であって、該定義情報内に他方の定義情報と矛盾する文字認識候補がある場合は、該他方の定義情報に合致する一方の定義情報内の文字認識候補を採用する、画像処理装置について開示されている。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2017-004311号公報
【文献】特許第6303531号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
記入者を特定するための情報である特定情報、ページ番号、総ページ数が記載されている複数枚の文書を受け取り、それらを文字認識し、記入者毎に文書をまとめる処理を行う場合に、文字認識又は記入者による記入の誤りが発生することがある。そこで本発明は、記入者を特定するための情報である特定情報、ページ番号、総ページ数が記載されている複数枚の文書を受け取り、それらを文字認識する場合に、文字認識又は記入者による記入の誤りがある旨を出力することができる情報処理装置及び情報処理プログラムを提供することを目的としている。
【課題を解決するための手段】
【0006】
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、一又は複数のプロセッサを備え、前記プロセッサは、記入者を特定するための情報である特定情報、ページ番号、総ページ数が記載されている複数枚の文書を受け取り、前記特定情報、前記ページ番号、前記総ページ数を文字認識し、前記特定情報の文字認識結果が同じである文書の枚数、該文書に記載されている前記ページ番号と前記総ページ数にしたがって、前記文字認識又は前記記入者による記入の誤りがある旨を出力するように制御する、情報処理装置である。
【0007】
請求項2の発明は、前記プロセッサは、前記文書の枚数、該文書に記載されている前記ページ番号と前記総ページ数にしたがって、誤りの種類を出力するように制御する、請求項1に記載の情報処理装置である。
【0008】
請求項3の発明は、前記プロセッサは、前記特定情報の文字認識結果が同じである文書において、各文書に記載されている総ページ数の文字認識結果に一致しないものがある場合は、総ページ数の誤検知である旨を出力するように制御する、請求項2に記載の情報処理装置である。
【0009】
請求項4の発明は、前記プロセッサは、前記文書の枚数が前記総ページ数より少ない場合は、ページ不足である旨を出力するように制御する、請求項2に記載の情報処理装置である。
【0010】
請求項5の発明は、前記プロセッサは、前記文書の枚数が前記総ページ数より多い場合は、特定情報の誤検知である旨を出力するように制御する、請求項2に記載の情報処理装置である。
【0011】
請求項6の発明は、前記プロセッサは、前記特定情報の文字認識結果が同じである文書において、前記ページ番号が揃っていない場合は、ページ番号の誤検知である旨を出力するように制御する、請求項2に記載の情報処理装置である。
【0012】
請求項7の発明は、前記プロセッサは、前記特定情報の文字認識結果が同じである文書において、各文書に記載されている総ページ数の文字認識結果が一致していると判断をした後に、前記文書の枚数が前記総ページ数より少ないか否かの判断、前記文書の枚数が前記総ページ数より多いか否かの判断、前記特定情報の文字認識結果が同じである文書において、前記ページ番号が揃っているか否かの判断、のいずれか1つ以上の判断を行う、請求項2に記載の情報処理装置である。
【0013】
請求項8の発明は、前記プロセッサは、前記特定情報の文字認識結果が同じである文書において、該文書の枚数と前記総ページ数が適合しており、前記ページ番号が揃っている場合は、他の特定情報が記載された文書の処理を続ける、請求項1に記載の情報処理装置である。
【0014】
請求項9の発明は、一又は複数のプロセッサを備えたコンピュータの前記プロセッサに、記入者を特定するための情報である特定情報、ページ番号、総ページ数が記載されている複数枚の文書を受け取り、前記特定情報、前記ページ番号、前記総ページ数を文字認識し、前記特定情報の文字認識結果が同じである文書の枚数、該文書に記載されている前記ページ番号と前記総ページ数にしたがって、前記文字認識又は前記記入者による記入の誤りがある旨を出力するように制御する、処理を実行させるための情報処理プログラムである。
【発明の効果】
【0015】
請求項1の情報処理装置によれば、記入者を特定するための情報である特定情報、ページ番号、総ページ数が記載されている複数枚の文書を受け取り、それらを文字認識する場合に、文字認識又は記入者による記入の誤りがある旨を出力することができる。
【0016】
請求項2の情報処理装置によれば、文書の枚数、ページ番号と総ページ数にしたがって、誤りの種類を出力することができる。
【0017】
請求項3の情報処理装置によれば、特定情報の文字認識結果が同じである文書において、総ページ数の文字認識結果に一致しないものがある場合を、総ページ数の誤検知として出力することができる。
【0018】
請求項4の情報処理装置によれば、文書の枚数が総ページ数より少ない場合を、ページ不足として出力することができる。
【0019】
請求項5の情報処理装置によれば、文書の枚数が総ページ数より多い場合を、特定情報の誤検知として出力することができる。
【0020】
請求項6の情報処理装置によれば、特定情報の文字認識結果が同じである文書において、ページ番号が揃っていない場合を、ページ番号の誤検知として出力することができる。
【0021】
請求項7の情報処理装置によれば、特定情報の文字認識結果が同じである文書において、各文書に記載されている総ページ数の文字認識結果が一致していると判断をした後に、文書の枚数が総ページ数より少ないか否かの判断、文書の枚数が総ページ数より多いか否かの判断、特定情報の文字認識結果が同じである文書において、ページ番号が揃っているか否かの判断、のいずれか1つ以上の判断を行うことができる。
【0022】
請求項8の情報処理装置によれば、特定情報の文字認識結果が同じである文書において、その文書の枚数と総ページ数が適合しており、ページ番号が揃っている場合は、他の特定情報が記載された文書の処理を続けることができる。
【0023】
請求項9の情報処理プログラムによれば、記入者を特定するための情報である特定情報、ページ番号、総ページ数が記載されている複数枚の文書を受け取り、それらを文字認識する場合に、文字認識又は記入者による記入の誤りがある旨を出力することができる。
【図面の簡単な説明】
【0024】
【
図1】本実施の形態の構成例についての概念的なモジュール構成図である。
【
図2】本実施の形態を利用したシステム構成例を示す説明図である。
【
図3】本実施の形態が読み込んだ文書の学籍番号欄、ページ番号欄、総ページ欄が記載されている領域の例を示す説明図である。
【
図4】本実施の形態による処理結果の表示例を示す説明図である。
【
図5】文字認識等に誤りがなかった場合の処理例を示す説明図である。
【
図6】文字認識等に誤りがあった場合に、本実施の形態を用いずに、処理を行った場合の結果の例を示す説明図である。
【
図7】文字認識等に誤りがあった場合に、本実施の形態を用いずに、処理を行った場合の結果の例を示す説明図である。
【
図8】文字認識等に誤りがあった場合に、本実施の形態を用いて、処理を行った場合の結果の例を示す説明図である。
【
図9】文字認識等に誤りがあった場合に、本実施の形態を用いて、処理を行った場合の結果の例を示す説明図である。
【
図10】文字認識等に誤りがなかった場合に、本実施の形態を用いて、処理を行った場合の結果の例を示す説明図である。
【
図11】文字認識等に誤りがあった場合に、本実施の形態を用いて、処理を行った場合の結果の例を示す説明図である。
【
図12】文字認識等に誤りがあった場合に、本実施の形態を用いて、処理を行った場合の結果の例を示す説明図である。
【
図13】文字認識等に誤りがあった場合に、本実施の形態を用いて、処理を行った場合の結果の例を示す説明図である。
【
図14】文字認識等に誤りがあった場合に、本実施の形態を用いて、処理を行った場合の結果の例を示す説明図である。
【
図15】文字認識等に誤りがあった場合に、本実施の形態を用いて、処理を行った場合の結果の例を示す説明図である。
【
図16】文字認識等に誤りがなかった場合に、本実施の形態を用いて、処理を行った場合の結果の例を示す説明図である。
【
図17】文字認識等に誤りがあった場合に、本実施の形態を用いて、処理を行った場合の結果の例を示す説明図である。
【
図18】文字認識等に誤りがあった場合に、本実施の形態を用いて、処理を行った場合の結果の例を示す説明図である。
【
図19】本実施の形態による処理例を示すフローチャートである。
【
図20】本実施の形態による処理例を示すフローチャートである。
【発明を実施するための形態】
【0025】
以下、図面に基づき本発明を実現するにあたっての好適な一実施の形態の例を説明する。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(「ソフトウェア」の解釈として、コンピュータ・プログラムを含む)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(例えば、コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するという意味である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(例えば、データの授受、指示、データ間の参照関係、ログイン等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態にしたがって、又はそれまでの状況・状態にしたがって定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(「2以上の値」には、もちろんのことながら、全ての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。また、「A、B、C」等のように事物を列挙した場合は、断りがない限り例示列挙であり、その1つのみを選んでいる場合(例えば、Aのみ)を含む。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(「ネットワーク」には、一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(つまり、社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。
【0026】
本実施の形態である情報処理装置100は、文書に対して文字認識処理を行う機能を有している。
図1の例に示すように、情報処理装置100は、少なくともプロセッサ105、メモリ110を有しており、それらをつないでデータのやりとりをするためのバス198により構成されている。この他に、情報処理装置100は、出力装置185、受付装置190、通信装置195を有していてもよい。そして、バス198を介して、プロセッサ105、メモリ110、出力装置185、受付装置190、通信装置195の間でデータのやりとりが行われる。
【0027】
なお、
図1の例に示すブロック図は、本実施の形態を実現するコンピュータのハードウェア構成例をも示している。本実施の形態としてのプログラムが実行されるコンピュータのハードウェア構成は、
図1に例示するようなコンピュータであり、具体的にはパーソナルコンピュータ、サーバーとなり得るコンピュータ等である。具体例として、処理部としてプロセッサ105を用い、記憶装置としてメモリ110を用いている。
【0028】
プロセッサ105は、1つであってもよいし、複数あってもよい。プロセッサ105として、例えば、CPU(Central Processing Unitの略)、マイクロプロセッサ等を含む。複数のプロセッサ105を用いる場合は、密結合マルチプロセッサ、疎結合マルチプロセッサのいずれの形態であってもよい。例えば、1つのプロセッサ105内に複数のプロセッサ・コアが搭載されていてもよい。さらに、複数のコンピュータを通信路で結んで仮想的に一台のコンピュータのように振る舞わせるシステムとしてもよい。具体例として、疎結合マルチプロセッサであって、クラスタシステム、コンピュータクラスタとして構成してもよい。プロセッサ105は、プログラムメモリ120内のプログラムを実行する。
【0029】
メモリ110として、例えば、レジスタやキャッシュメモリ等のプロセッサ105内部の半導体メモリを含めてもよいし、RAM(Random Access Memoryの略)やROM(Read Only Memoryの略)等によって構成される主記憶装置であるメインメモリであってもよいし、永続性記憶装置としての機能を有するHDD(Hard Disk Driveの略)やSSD(Solid State Driveの略)の内部記憶装置、CD、DVD、Blu-ray(登録商標) Disc、USBメモリ、メモリーカード等の外部記憶装置又は補助記憶装置であってもよいし、また、通信回線を介して接続されたサーバー等の記憶装置を含めてもよい。
メモリ110は、主にプログラムを記憶するプログラムメモリ120と主にデータを記憶するデータメモリ115を有している。なお、プログラムメモリ120、データメモリ115には、図示しているモジュールのプログラムの他、本コンピュータを起動するためのOS等のプログラム、モジュールの実行において適宜変化するパラメータ等のデータが格納されていてもよい。
【0030】
出力装置185は、例えば、表示装置187、印刷装置189等を有している。液晶ディスプレイ、有機ELディスプレイ、3次元ディスプレイ等の表示装置187は、プロセッサ105による処理結果、データメモリ115内のデータ等を、テキストやイメージ情報等として表示する。プリンタ、複合機等の印刷装置189は、プロセッサ105による処理結果、データメモリ115内のデータ等を印刷する。また、出力装置185として、スピーカー、機器を振動させるアクチュエータ等を含んでいてもよい。
受付装置190は、例えば、指示受付装置192、文書読取装置194等を有している。キーボード、マウス、マイク、カメラ(視線検知カメラ等を含む)等の指示受付装置192は、これらに対する利用者の操作(動作、音声、視線等を含む)に基づいたデータを受け付ける。
また、タッチスクリーンのように、表示装置187と指示受付装置192の両方の機能を備えているものがあってもよい。その場合、キーボードの機能の実現について、物理的なキーが存在しなくても、タッチスクリーン上にソフトウェアでキーボード(いわゆるソフトウェアキーボード、スクリーンキーボード等ともいわれる)を描画して、キーボードの機能を実現するようにしてもよい。
なお、ユーザーインタフェースとして、主に、表示装置187、指示受付装置192が用いられる。
スキャナ、カメラ等の文書読取装置194は、文書を読み取り又は撮影して、発生する画像データを受け付ける。
通信装置195は、通信回線を介して他の装置と接続するためのネットワークカード等の通信回線インタフェースである。
【0031】
本実施の形態のうち、コンピュータ・プログラムによるものについては、本ハードウェア構成のプログラムメモリ120にソフトウェアであるコンピュータ・プログラムを読み込ませ、ソフトウェアとハードウェア資源とが協働して、本実施の形態が実現される。
なお、
図1に示すハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、
図1に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、プロセッサ105として、GPU(Graphics Processing Unitの略、GPGPU(General-Purpose computing on Graphics Processing Unitsの略)を含む)を用いてもよいし、一部のモジュールの実行を専用のハードウェア(例えば特定用途向け集積回路(具体例として、ASIC(Application Specific Integrated Circuitの略)等がある)や再構成可能な集積回路(具体例として、FPGA(Field-Programmable Gate Arrayの略)等がある)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続している形態でもよく、さらに
図1に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、特に、パーソナルコンピュータの他、携帯情報通信機器(携帯電話、スマートフォン、モバイル機器、ウェアラブルコンピュータ等を含む)、情報家電、ロボット、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)等に組み込まれていてもよい。
【0032】
プロセッサ105は、バス198を介してメモリ110、出力装置185、受付装置190、通信装置195と接続されている。プロセッサ105は、プログラムメモリ120内のプログラムである各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する。例えば、文書読取装置194によって文書が読み込まれたことを契機として、プログラムメモリ120内のモジュールによる処理を実行し、誤り検知等の処理結果をデータメモリ115に記憶させたり(表形式等の文書ファイルに出力することを含む)、表示装置187に表示させたり、通信装置195を制御して他の装置に送信したりする。以下、出力の例示として、表示装置187に表示することを挙げるが、前述したように、表形式等の文書ファイルに出力すること等であってもよい。
【0033】
メモリ110は、データメモリ115、プログラムメモリ120を有しており、バス198を介してプロセッサ105、出力装置185、受付装置190、通信装置195と接続されている。
データメモリ115は、文書記憶領域125、ユーザー情報記憶領域130を有している。
文書記憶領域125は、文字認識モジュール140による処理対象となる文書を記憶している。例えば、文書読取装置194によって読み取られた文書の画像を記憶している。
ユーザー情報記憶領域130は、記入者等のユーザーに関する情報を記憶している。例えば、ユーザーと対応させて、文字認識モジュール140による文字認識結果を記憶している。具体例として、
図5の例で示す文字認識結果管理テーブル500のように、学籍番号と採点結果である点数を対応させて記憶している。
【0034】
プログラムメモリ120は、文書受取モジュール135、文字認識モジュール140、誤り検知モジュール145、表示制御モジュール150を記憶している。
文書受取モジュール135は、対象となる複数枚の文書を受け取る。「文書を受け取る」ことには、例えば、スキャナ、カメラ等の文書読取装置194によって読み取られた文書の画像を受け取ること、ファックス等で通信装置195を介して外部機器から画像を受信すること、ハードディスク(情報処理装置100に内蔵されているデータメモリ115内の文書記憶領域125の他に、通信回線を介して接続されているもの等を含めてもよい)等に記憶されている画像を読み出すこと等が含まれる。画像は、2値画像、多値画像(カラー画像を含む)であってもよい。
文書受取モジュール135が受け付ける文書は、複数枚であって、各文書(各ページ)には、記入者を特定するための情報である特定情報、ページ番号、総ページ数が記載されている。ここでの「特定情報」は、本実施の形態において、記入者を一意に特定するための情報であればよく、例えば、学生を特定するための学籍番号、社員を特定するための社員番号等が該当する。また、特定情報の文字種は、数字、アルファベット、ひらがな、カタカナ、漢字等、又は、これらの組み合わせであってもよい。また、ページ番号、総ページ数の文字種は、数字である。また、「記載」は、記入者による手書き文字であってもよいし、一部は活字等の予め印刷されているものが含まれていてもよい。手書き文字、活字のいずれであっても、文字認識モジュール140による文字認識において、誤認識が発生する可能性がある。文書として、例えば、大学、生涯学習センター等の授業で用いるテスト用紙、レポート提出用紙等であってもよい。具体例については、
図3を用いて後述する。
【0035】
文字認識モジュール140は、文書受取モジュール135が受け付けた文書内の文字画像を認識する。文書内に記載されている特定情報、ページ番号、総ページ数を文字認識する。例えば、手書き文字を認識する。また、特定情報が英数字で構成されている場合には、英数字のみを対象とした文字認識を行うようにしてもよい。また、ページ番号、総ページ数に対しては、数字のみを対象とした文字認識を行うようにしてもよい。
【0036】
誤り検知モジュール145は、特定情報の文字認識結果が同じである文書の枚数、その文書に記載されているページ番号と総ページ数にしたがって、文字認識モジュール140による文字認識又は記入者による記入の誤りを検知する。
なお、誤り検知モジュール145は、文字認識の誤り、記入者による記入の誤り、のいずれであるかを判断する必要はない。誤り検知モジュール145は、特定情報の文字認識結果が同じである文書の枚数、その文書に記載されているページ番号の文字認識結果、その文書に記載されている総ページ数の文字認識結果を用いて、それらの間に矛盾がある場合に、文字認識の誤り又は記入者による記入の誤りがあると判断している。なお、以下の説明では、主に文字認識に誤りがあった場合の例を用いているが、記入者による記入誤りであってもよい。
【0037】
また、誤り検知モジュール145は、文書の枚数、その文書に記載されているページ番号と総ページ数にしたがって、誤りの種類を検知する。
ここで「誤りの種類」として、「総ページ数の誤検知」、「ページ不足である」、「特定情報の誤検知」、「ページ番号の誤検知」がある。
誤り検知モジュール145は、特定情報の文字認識結果が同じである文書において、各文書に記載されている総ページ数の文字認識結果に一致しないものがある場合は、総ページ数の誤検知と判断する。
誤り検知モジュール145は、文書の枚数が総ページ数より少ない場合は、ページ不足であると判断する。
誤り検知モジュール145は、文書の枚数が総ページ数より多い場合は、特定情報の誤検知であると判断する。
【0038】
誤り検知モジュール145は、特定情報の文字認識結果が同じである文書において、ページ番号が揃っていない場合は、ページ番号の誤検知であると判断する。
ここで、「ページ番号が揃っている場合」とは、文書に記載されているページ番号の文字認識結果が、最初のページ番号である「1」から順に最後のページ番号である「総ページ数」まで揃っていることである。したがって、「ページ番号が揃っていない場合」とは、「ページ番号が揃っている場合」ではない場合をいい、例えば、同じページ番号の文書が複数あること、抜けているページ番号があること、総ページ数より大きいページ番号があること等が該当する。
【0039】
誤り検知モジュール145は、特定情報の文字認識結果が同じである文書において、各文書に記載されている総ページ数の文字認識結果が一致していると判断をした後に、(1)文書の枚数が総ページ数より少ないか否かの判断、(2)文書の枚数が総ページ数より多いか否かの判断、(3)特定情報の文字認識結果が同じである文書において、ページ番号が揃っているか否かの判断、のいずれか1つ以上の判断を行うようにしてもよい。
【0040】
誤り検知モジュール145は、特定情報の文字認識結果が同じである文書において、(条件1)その文書の枚数と総ページ数が適合しており、(条件2)ページ番号が揃っている場合は、他の特定情報が記載された文書の処理を続けるようにしてもよい。つまり、文字認識による誤りがなく、記入者による記入誤りもない、正常の状態であると判断したことになる。
なお、誤り検知モジュール145は、さらに、条件として、特定情報の文字認識結果が同じである文書において、(条件3)各文書に記載されている総ページ数の文字認識結果が一致していることを付加して、他の特定情報が記載された文書の処理を続けるようにしてもよい。
【0041】
表示制御モジュール150は、誤り検知モジュール145によって誤りが検知された場合は、誤りがある旨を表示するように制御する。表示先として、例えば、表示装置187であってもよいし、通信装置195を介して他の情報処理装置であるユーザー端末205等であってもよい。
ここで、「誤りがある旨」の形態として、単に誤りがあること、誤りの種類を明示することを含む。誤りの種類として、前述したように、「総ページ数の誤検知」、「ページ不足である」、「特定情報の誤検知」、「ページ番号の誤検知」がある。ユーザーは、この誤りの種類を知ることによって、次に行うべき対処を検討することができる。例えば、「総ページ数の誤検知」があった場合は、文書に記載されている総ページ数の欄を確認し、記入者による記入誤りである場合は、その旨(丁寧に記載すべきである注意等であってもよい)を記入者に伝えること、文字認識の誤りである場合は、その旨(記入された文字を正確に文字認識できるようにする要求等であってもよい)を管理者等に伝えること等が行われる。
【0042】
図2は、本実施の形態を利用したシステム構成例を示す説明図である。
本実施の形態を、LMS(学習管理システム:Learning Management Systemの略)と連携させ、大学の授業におけるテスト結果の返却に利用した場合のシステム構成例を示すものである。本実施の形態を、画像受付装置200又は画像処理装置230に組み込んでいる例である。
画像受付装置200、教員/採点者210のユーザー端末205、学生220(学生220a等)のユーザー端末215(ユーザー端末215a等)、画像処理装置230、学習管理システム240、メール装置250は、通信回線290を介してそれぞれ接続されている。通信回線290は、無線、有線、これらの組み合わせであってもよく、例えば、通信インフラとしてのインターネット、イントラネット等であってもよい。また、情報処理装置100による機能は、クラウドサービスとして実現してもよい。
【0043】
教員/採点者210は、学生220に対して、学籍番号、ページ番号、総ページ数が記載される欄を有しているテスト用紙を配布し、テストを行う。学生220は、そのテスト用紙に、自分の学籍番号、ページ番号、総ページ数を記載して、解答する。教員/採点者210は、テスト用紙を回収し、採点する。具体的には、そのテスト用紙に点数を記載する。教員/採点者210は、採点されたテスト用紙を、画像受付装置200で読み取る。例えば、画像受付装置200に備え付けられている自動原稿送り装置を用いて、連続してテスト用紙を読み取る。画像受付装置200又は画像処理装置230内の情報処理装置100は、そのテスト用紙内の学籍番号、点数を文字認識し、学籍番号と点数を対応させた一覧表を作成し、平均点、最高点等を集計結果として、教員/採点者210のユーザー端末205に通知する。そして、学籍番号に該当する学生220のユーザー端末215に対して、メール装置250による電子メール等を用いて、採点結果を通知する。また、一覧表等のデータを学習管理システム240に送信し、学習管理システム240は、各学生220の成績管理等を行う。
【0044】
この際に、学籍番号、ページ番号、総ページ数において、文字認識の誤り又は記入者である学生220による記入の誤りがある場合は、正しい集計結果を得ることができない。そこで、本実施の形態である情報処理装置100は、誤りがある旨を表示する。さらに、単に誤りがあるというだけでは、教員/採点者210はどこを確認すべきであるか判断できない。そこで、本実施の形態である情報処理装置100は、誤りの種類を表示できるようしている。
【0045】
より具体的に説明する。
大学の講義で、教員/採点者210は、毎週記述式(手書き)の小テストを実施し、出欠の確認代わりにするとともに、学生220の理解度を確認している。そして、教員/採点者210の採点結果を学生220に毎週返却することで、学生220の講義に対するモチベーションアップ、次の講義の予習に活用している。
学生220の理解度や成績の一覧表作成、学生220への採点結果の返却は手間がかかり、特に大教室(例えば、学生100人超)の講義では、学生220への返却は実施されないことも多い。
教員/採点者210が採点した答案を画像受付装置200でスキャンするだけで、採点結果の一覧表を作成するとともに、学生220に採点結果(PDFのファイル)を学習管理システム240を介して返却することで、教員/採点者210の労力を軽減している。
【0046】
ページ番号を文字認識して、同一人物の答案をまとめることを行っているが、本実施の形態を用いない場合、特に、誤りが発生した場合の情報を正しく表記するのは困難である。例えば、同じ学籍番号で、1/2と文字認識したページが2枚存在した場合、学籍番号とページ番号のどちらの文字認識の誤りであるかの判断ができない。例えば、「ページ番号不一致エラー」にまとめてしまっている。
本実施の形態では、「誤りの種類」として、「総ページ数の誤検知」、「ページ不足である」、「特定情報の誤検知」、「ページ番号の誤検知」に分けて表示できるようにしている。
【0047】
図3は、本実施の形態が読み込んだ文書の学籍番号欄320、ページ番号欄305、総ページ数欄310が記載されている領域の例を示す説明図である。
図3の例に示す文書300は、テスト用紙の上部であって、ページ番号欄305、総ページ数欄310、採点結果欄315、学籍番号欄320、氏名欄325、日時欄330、科目欄335を有している。
例えば、科目欄335内に「複素解析学」と印刷されており、この文書300は複素解析学のテスト用紙であることを示している。学籍番号欄320、氏名欄325、日時欄330、ページ番号欄305、総ページ数欄310は、学生220によって記載される。採点結果欄315は、教員/採点者210によって記載される。学籍番号欄320には、学生220によって自分の学籍番号(例えば、「a201301」等))が記載される。総ページ数欄310には、学生220が提出するテスト用紙の総ページ数が記載され、ページ番号欄305には、その文書300のページ番号、つまり、1ページから総ページ数までの連番が記載される。採点結果欄315には、教員/採点者210によって採点結果である点数が記載される。
文書300を画像受付装置200で読み取って、学籍番号欄320と採点結果欄315内を文字認識し、学生220毎の点数の一覧表を生成する。
【0048】
図4は、本実施の形態による処理結果の表示例を示す説明図である。
情報処理装置100は、処理結果表示画面400に、種別欄405、講義欄410、課題欄415、集計結果テーブル420を表示する。なお、処理結果表示画面400は、ユーザー端末205のディスプレイであってもよいし、画像受付装置200又は画像処理装置230に備え付けられているディスプレイであってもよい。ユーザー端末205のディスプレイである場合は、ユーザー端末205のブラウザを用いて、処理結果表示画面400を表示するように制御してもよいし、処理結果表示画面400の内容を記憶しているファイルをユーザー端末205に送信するようにしてもよい。
【0049】
種別欄405には、種別を表示する。例えば、「テスト」である。講義欄410には、講義名を表示する。例えば、「複素解析学」である。課題欄415には、課題の名称を表示する。例えば、「課題1」である。
集計結果テーブル420は、項番欄422、集計処理結果欄424、学籍番号欄426、学籍番号(Image)欄428、氏名(Image)欄430、得点欄432、得点(Image)欄434、ファイル名欄436を有している。項番欄422には、項番を表示する。集計処理結果欄424には、集計処理結果を表示する。例えば、誤りがなかった場合には「正常終了」、誤りがあると判断した場合には「誤検知あり」、さらに誤りの種類として「総ページ数の誤検知」、「ページ不足である」、「特定情報の誤検知」、「ページ番号の誤検知」のいずれかを表示する。学籍番号欄426には、学籍番号を表示する。つまり、
図3の例で示した学籍番号欄320内を文字認識した結果を表示する。学籍番号(Image)欄428には、学籍番号の画像を表示する。つまり、
図3の例で示した学籍番号欄320内を切り抜いた画像を表示する。学籍番号欄426内の文字列と学籍番号(Image)欄428を、教員/採点者210が比較することによって、学籍番号欄320内の文字認識結果に誤りがないか否かを確認することができるようにしている。氏名(Image)欄430には、氏名の画像を表示する。得点欄432には、得点を表示する。つまり、
図3の例で示した採点結果欄315内を文字認識した結果を表示する。得点(Image)欄434には、得点の画像を表示する。つまり、
図3の例で示した採点結果欄315内を切り抜いた画像を表示する。得点欄432内の文字列と得点(Image)欄434を、教員/採点者210が比較することによって、採点結果欄315内の文字認識結果に誤りがないか否かを確認することができるようにしている。ファイル名欄436には、採点済みのテスト用紙を読み込んだ画像のファイル名を表示する。
【0050】
図5は、文字認識等に誤りがなかった場合の処理例を示す説明図である。
図5(a)は、文字認識結果管理テーブル500のデータ構造例を示す説明図である。
文字認識結果管理テーブル500は、スキャン順欄505、学籍番号欄510、ページ分子欄515、ページ分母欄520、点数欄525を有している。スキャン順欄505は、スキャン順を記憶している。学籍番号欄510は、学籍番号を記憶している。ページ分子欄515は、ページ分子を記憶している。ページ分母欄520は、ページ分母を記憶している。点数欄525は、点数を記憶している。
文字認識結果管理テーブル500の1行目は、スキャン順欄505が「1」で、学籍番号欄510が「a201301」、ページ分子欄515が「1」、ページ分母欄520が「2」、点数欄525が「8」であり、2行目は、スキャン順欄505が「2」で、学籍番号欄510が「a201301」、ページ分子欄515が「2」、ページ分母欄520が「2」、点数欄525が「-」(「-」は不記載であることを示している)であり、3行目は、スキャン順欄505が「3」で、学籍番号欄510が「a201302」、ページ分子欄515が「1」、ページ分母欄520が「2」、点数欄525が「7」であり、4行目は、スキャン順欄505が「4」で、学籍番号欄510が「a201302」、ページ分子欄515が「2」、ページ分母欄520が「2」、点数欄525が「-」であり、5行目は、スキャン順欄505が「5」で、学籍番号欄510が「a201303」、ページ分子欄515が「1」、ページ分母欄520が「2」、点数欄525が「9」であり、6行目は、スキャン順欄505が「6」で、学籍番号欄510が「a201303」、ページ分子欄515が「2」、ページ分母欄520が「2」、点数欄525が「-」である。
【0051】
図5(b)は、点数管理テーブル550のデータ構造例を示す説明図である。点数管理テーブル550は、文字認識結果管理テーブル500から生成されるものである。なお、点数管理テーブル550は、
図4の例に示した集計結果テーブル420を、本実施の形態による処理例を示すために、簡易化したものである。
点数管理テーブル550は、結果欄555、学籍番号欄560、スキャン順欄565、点数欄570を有している。点数管理テーブル550は、文字認識結果管理テーブル500内の学籍番号が同じ行をまとめたものである。結果欄555は、結果を記憶している。ここでは文字認識等に誤りがなかった場合の処理例を示しているので、全て「正常」である。学籍番号欄560は、学籍番号を記憶している。スキャン順欄565は、スキャン順を記憶している。つまり、文字認識結果管理テーブル500内の学籍番号番号が同じスキャン順欄505の値を記憶している。点数欄570は、点数を記憶している。つまり、その学籍番号の1ページ目の点数欄525内の値を記憶している。
点数管理テーブル550の1行目は、結果欄555が「正常」、学籍番号欄560が「a201301」、スキャン順欄565が「1,2」、点数欄570が「8」であり、2行目は、結果欄555が「正常」、学籍番号欄560が「a201302」、スキャン順欄565が「3,4」、点数欄570が「7」であり、3行目は、結果欄555が「正常」、学籍番号欄560が「a201303」、スキャン順欄565が「5,6」、点数欄570が「9」である。
つまり、2ページのテスト用紙の場合であって、学籍番号が同じで、1/2と2/2のページをマージして、学籍番号の昇順でソートしている。具体的には、点数管理テーブル550の1行目は、文字認識結果管理テーブル500の1、2行目から生成されており、2行目は、文字認識結果管理テーブル500の3、4行目から生成されており、3行目は、文字認識結果管理テーブル500の5、6行目から生成されている。
【0052】
図6は、文字認識等に誤りがあった場合に、本実施の形態を用いずに、処理を行った場合の結果の例を示す説明図である。
この例も、2ページのテスト用紙の場合であって、学籍番号が同じで、1/2と2/2のページをマージしている。
図6(a)は、文字認識結果管理テーブル600のデータ構造例を示す説明図である。
文字認識結果管理テーブル600は、スキャン順欄605、学籍番号欄610、ページ分子欄615、ページ分母欄620、点数欄625を有している。文字認識結果管理テーブル600は、前述した文字認識結果管理テーブル500と同等のデータ構造である。
この例では、文字認識結果管理テーブル600の3行目の学籍番号欄610で「a201302」と文字認識すべきところを「a201303」と誤認識している。
【0053】
図6(b)は、点数管理テーブル650のデータ構造例を示す説明図である。点数管理テーブル650は、文字認識結果管理テーブル600から生成されるものである。
点数管理テーブル650は、結果欄655、学籍番号欄660、スキャン順欄665、点数欄670を有している。点数管理テーブル650は、前述した点数管理テーブル550と同等のデータ構造である。
点数管理テーブル650の1行目は、結果欄655が「正常」、学籍番号欄660が「a201301」、スキャン順欄665が「1,2」、点数欄670が「8」であり、2行目は、結果欄655が「ページ数不一致エラー」、学籍番号欄660が「a201302」、スキャン順欄665が「4」、点数欄670が「-」であり、3行目は、結果欄655が「ページ数不一致エラー」、学籍番号欄660が「a201303」、スキャン順欄665が「3,5,6」、点数欄670が「7,9」である。
総ページ数であるページ分母が2であるにもかかわらず、学籍番号「a201302」においては1ページであり、学籍番号「a201303」においては3ページであるので、一律に「ページ数不一致エラー」としている。
本実施の形態を用いた場合、
図8の例を用いて後述する。
【0054】
図7は、文字認識等に誤りがあった場合に、本実施の形態を用いずに、処理を行った場合の結果の例を示す説明図である。
図7(a)は、文字認識結果管理テーブル700のデータ構造例を示す説明図である。
文字認識結果管理テーブル700は、スキャン順欄705、学籍番号欄710、ページ分子欄715、ページ分母欄720、点数欄725を有している。文字認識結果管理テーブル600は、前述した文字認識結果管理テーブル500と同等のデータ構造である。
この例では、文字認識結果管理テーブル700の5行目のページ分子欄715で「1」と文字認識すべきところを「7」と誤認識している。
【0055】
図7(b)は、点数管理テーブル750のデータ構造例を示す説明図である。
点数管理テーブル750は、結果欄755、学籍番号欄760、スキャン順欄765、点数欄770を有している。点数管理テーブル750は、前述した点数管理テーブル550と同等のデータ構造である。
点数管理テーブル750の1行目は、結果欄755が「正常」、学籍番号欄760が「a201301」、スキャン順欄765が「1,2」、点数欄770が「8」であり、2行目は、結果欄755が「正常」、学籍番号欄760が「a201302」、スキャン順欄765が「3,4」、点数欄770が「7」であり、3行目は、結果欄755が「ページ数不一致エラー」、学籍番号欄760が「a201303」、スキャン順欄765が「5,6(7/2と2/2)」、点数欄770が「9」である。
総ページ数であるページ分母が2であるにもかかわらず、学籍番号「a201303」においては7ページがあり、この場合も「ページ数不一致エラー」としている。
本実施の形態を用いた場合、
図9の例を用いて後述する。
【0056】
図8は、文字認識等に誤りがあった場合に、本実施の形態を用いて、処理を行った場合の結果の例を示す説明図である。
図8(a)の例に示す点数管理テーブル650は、
図6(b)の例に示した点数管理テーブル650と同じである。
図8(b)の例に示す点数管理テーブル650は、本実施の形態による処理結果の例を示すものである。具体的には、点数管理テーブル650の1行目は、結果欄655が「正常」、学籍番号欄660が「a201301」、スキャン順欄665が「1,2」、点数欄670が「8」であり、2行目は、結果欄655が「ページ数不足」、学籍番号欄660が「a201302」、スキャン順欄665が「4」、点数欄670が「-」であり、3行目は、結果欄655が「学籍番号の誤検知」、学籍番号欄660が「a201303」、スキャン順欄665が「3,5,6」、点数欄670が「7,9」である。
つまり、本実施の形態では、学籍番号「a201302」は、総ページ数が2であるにもかかわらず、2/2のみの1ページであるので、ページ不足である。具体的には、1/2が不足している。そして、学籍番号「a201303」は、総ページ数が2であるにもかかわらず、1/2,1/2,2/2の3ページであるので、学籍番号の誤検知である。そして、点数管理テーブル650の2行目では「ページ不足」である旨を表示し、点数管理テーブル650の3行目では特定情報の一例である「学籍番号の誤検知」である旨を表示することになる。
【0057】
図9は、文字認識等に誤りがあった場合に、本実施の形態を用いて、処理を行った場合の結果の例を示す説明図である。
図9(a)の例に示す点数管理テーブル750は、
図7(b)の例に示した点数管理テーブル750と同じである。
図9(b)の例に示す点数管理テーブル750は、本実施の形態による処理結果の例を示すものである。具体的には、点数管理テーブル750の1行目は、結果欄755が「正常」、学籍番号欄760が「a201301」、スキャン順欄765が「1,2」、点数欄770が「8」であり、2行目は、結果欄755が「正常」、学籍番号欄760が「a201302」、スキャン順欄765が「3,4」、点数欄770が「7」であり、3行目は、結果欄755が「ページの誤検知」、学籍番号欄760が「a201303」、スキャン順欄765が「5,6(7/2と2/2)」、点数欄770が「9」である。
つまり、本実施の形態では、学籍番号「a201303」は、総ページが2であるにもかかわらず、7/2と2/2が存在しており、1/2が不足しているので、ページ番号が揃っていない場合に該当するので、ページ番号の誤検知である。そして、点数管理テーブル750の3行目では「ページ番号の誤検知」である旨を表示することになる。
【0058】
図10は、文字認識等に誤りがなかった場合に、本実施の形態を用いて、処理を行った場合の結果の例を示す説明図である。
学籍番号の文字認識結果が同じである文書において、その文書の枚数と総ページ数の文字認識結果が適合しており、ページ番号が揃っている場合の例を示している。さらに、この例では、各文書に記載されている総ページ数の文字認識結果が一致していることの条件も満たしている。
図10(a)に示す例では、学籍番号「a201301」と認識した各ページでは、ページ分子とページ分母を「1/7,2/7,3/7,4/7,5/7,6/7,7/7」と認識した結果、「正常」と判断する。学籍番号「a201301」と認識した文書の枚数は7枚であり、総ページ数の文字認識結果である「7」と合致しており、ページ番号の文字認識結果は、1から7まで揃っており、各文書の総ページ数の文字認識結果は全て「7」であるからである。
同様に、
図10(b)に示す例では、学籍番号「a201302」と認識した各ページでは、ページ分子とページ分母を「1/7,2/7,3/7,4/7,5/7,6/7,7/7」と認識した結果、「正常」と判断する。
同様に、
図10(c)に示す例では、学籍番号「a201303」と認識した各ページでは、ページ分子とページ分母を「1/7,2/7,3/7,4/7,5/7,6/7,7/7」と認識した結果、「正常」と判断する。
【0059】
図11は、文字認識等に誤りがあった場合に、本実施の形態を用いて、処理を行った場合の結果の例を示す説明図である。本来は学籍番号「a201302」の文書である「1/7」で、学籍番号「a201303」とする文字認識の誤りがある場合の例である。
図11(a)に示す例では、
図10の例と同様に、学籍番号「a201301」と認識した各ページでは、ページ分子とページ分母を「1/7,2/7,3/7,4/7,5/7,6/7,7/7」と認識した結果、「正常」と判断する。なお、総ページ数は7であり、ページ番号も揃っている。
図11(b)に示す例では、学籍番号「a201302」と認識した各ページでは、ページ分子とページ分母を「2/7,3/7,4/7,5/7,6/7,7/7」と認識した結果、「ページ不足」と判断する。総ページ数の文字認識結果は7であるが、学籍番号「a201302」のページ数は全部で6ページであることから、このような判断になる。
図11(c)に示す例では、学籍番号「a201303」と認識した各ページでは、ページ分子とページ分母を「1/7,1/7,2/7,3/7,4/7,5/7,6/7,7/7」と認識した結果、「学籍番号の誤検知」と判断する。総ページ数の文字認識結果は7であるが、学籍番号「a201303」のページ数は全部で8ページであることから、このような判断になる。
【0060】
図12は、文字認識等に誤りがあった場合に、本実施の形態を用いて、処理を行った場合の結果の例を示す説明図である。本来は学籍番号「a201303」の文書である「1/7」で、「7/7」とする文字認識の誤り(分子の「1」を「7」とする文字認識の誤り)がある場合の例である。
図12(a)に示す例では、
図10の例と同様に、学籍番号「a201301」と認識した各ページでは、ページ分子とページ分母を「1/7,2/7,3/7,4/7,5/7,6/7,7/7」と認識した結果、「正常」と判断する。なお、総ページ数は7であり、ページ番号も揃っている。
図12(b)に示す例では、
図10の例と同様に、学籍番号「a201302」と認識した各ページでは、ページ分子とページ分母を「1/7,2/7,3/7,4/7,5/7,6/7,7/7」と認識した結果、「正常」と判断する。なお、総ページ数は7であり、ページ番号も揃っている。
図12(c)に示す例では、学籍番号「a201303」と認識した各ページでは、ページ分子とページ分母を「2/7,3/7,4/7,5/7,6/7,7/7,7/7」と認識した結果、「ページ番号の誤検知」と判断する。総ページ数の文字認識結果は7であり、学籍番号「a201303」のページ数は全部で7ページであって一致するが、7/7が重複しており、ページ番号が揃っていないからである。
【0061】
図13は、文字認識等に誤りがあった場合に、本実施の形態を用いて、処理を行った場合の結果の例を示す説明図である。本来は学籍番号「a201302」の文書である「1/7」と「7/7」で、それぞれ「1/9」と「7/9」とする文字認識の誤り(分母の「7」を「9」とする文字認識の誤り)がある場合の例である。
図13(a)に示す例では、
図10の例と同様に、学籍番号「a201301」と認識した各ページでは、ページ分子とページ分母を「1/7,2/7,3/7,4/7,5/7,6/7,7/7」と認識した結果、「正常」と判断する。なお、総ページ数は7であり、ページ番号も揃っている。
図13(b)に示す例では、学籍番号「a201302」と認識した各ページでは、ページ分子とページ分母を「2/7,3/7,4/7,5/7,6/7,1/9,7/9」と認識した結果、「総ページ数の誤検知」と判断する。学籍番号「a201302」と記載されている文書において、総ページ数が異なる文書が混在しているからである。
図13(c)に示す例では、
図10の例と同様に、学籍番号「a201303」と認識した各ページでは、ページ分子とページ分母を「1/7,2/7,3/7,4/7,5/7,6/7,7/7」と認識した結果、「正常」と判断する。なお、総ページ数は7であり、ページ番号も揃っている。
【0062】
図14は、文字認識等に誤りがあった場合に、本実施の形態を用いて、処理を行った場合の結果の例を示す説明図である。2つの文字認識の誤りがある場合の例について説明する。本来は学籍番号「a201302」の文書である「1/7」を、学籍番号「a201303」の「1/7」とする文字認識の誤り(学籍番号の最終桁の「2」を「3」とする文字認識の誤り)があり、さらに、本来は学籍番号「a201304」の文書である「7/7」を、「1/7」とする文字認識の誤り(分子の「7」を「1」とする文字認識の誤り)がある場合の例である。
図14(a)に示す例では、
図10の例と同様に、学籍番号「a201301」と認識した各ページでは、ページ分子とページ分母を「1/7,2/7,3/7,4/7,5/7,6/7,7/7」と認識した結果、「正常」と判断する。なお、総ページ数は7であり、ページ番号も揃っている。
図14(b)に示す例では、学籍番号「a201302」と認識した各ページでは、ページ分子とページ分母を「2/7,3/7,4/7,5/7,6/7,7/7」と認識した結果、「ページ不足」と判断する。総ページ数の文字認識結果は7であるが、学籍番号「a201302」のページ数は全部で6ページであることから、このような判断になる。
図14(c)に示す例では、学籍番号「a201303」と認識した各ページでは、ページ分子とページ分母を「1/7,1/7,2/7,3/7,4/7,5/7,6/7,7/7」と認識した結果、「学籍番号の誤検知」と判断する。総ページ数の文字認識結果は7であるが、学籍番号「a201303」のページ数は全部で8ページであることから、このような判断になる。
図14(d)に示す例では、学籍番号「a201304」と認識した各ページでは、ページ分子とページ分母を「1/7,1/7,2/7,3/7,4/7,5/7,6/7」と認識した結果、「ページ番号の誤検知」と判断する。総ページ数の文字認識結果は7であり、学籍番号「a201304」のページ数は全部で7ページであるが、1/7が重複しており、ページ番号が揃っていないからである。
【0063】
図15は、文字認識等に誤りがあった場合に、本実施の形態を用いて、処理を行った場合の結果の例を示す説明図である。3つの文字認識の誤りがある場合の例について説明する。本来は学籍番号「a201302」の文書である「1/7」を、学籍番号「a201303」の「1/7」とする文字認識の誤り(学籍番号の最終桁の「2」を「3」とする文字認識の誤り)があり、本来は学籍番号「a201302」の文書である「5/7」を、「6/7」とする文字認識の誤り(分子の「5」を「6」とする文字認識の誤り)があり、さらに、本来は学籍番号「a201304」の文書である「7/7」を、「1/7」とする文字認識の誤り(分子の「7」を「1」とする文字認識の誤り)がある場合の例である。
図15(a)に示す例では、
図10の例と同様に、学籍番号「a201301」と認識した各ページでは、ページ分子とページ分母を「1/7,2/7,3/7,4/7,5/7,6/7,7/7」と認識した結果、「正常」と判断する。なお、総ページ数は7であり、ページ番号も揃っている。
図15(b)に示す例では、学籍番号「a201302」と認識した各ページでは、ページ分子とページ分母を「2/7,3/7,4/7,6/7,6/7,7/7」と認識した結果、「ページ不足」と判断する。総ページ数の文字認識結果は7であるが、学籍番号「a201302」のページ数は全部で6ページであることから、このような判断になる。
図15(c)に示す例では、学籍番号「a201303」と認識した各ページでは、ページ分子とページ分母を「1/7,1/7,2/7,3/7,4/7,5/7,6/7,7/7」と認識した結果、「学籍番号の誤検知」と判断する。総ページ数の文字認識結果は7であるが、学籍番号「a201303」のページ数は全部で8ページであることから、このような判断になる。
図15(d)に示す例では、学籍番号「a201304」と認識した各ページでは、ページ分子とページ分母を「1/7,1/7,2/7,3/7,4/7,5/7,6/7」と認識した結果、「ページ番号の誤検知」と判断する。総ページ数の文字認識結果は7であり、学籍番号「a201304」のページ数は全部で7ページであるが、1/7が重複しており、ページ番号が揃っていないからである。
【0064】
図16から
図18までの例は、総ページ数が学生によって異なる場合の処理例を示している。
図16は、文字認識等に誤りがなかった場合に、本実施の形態を用いて、処理を行った場合の結果の例を示す説明図である。
図16(a)に示す例では、学籍番号「a201301」と認識した各ページでは、ページ分子とページ分母を「1/3,2/3,3/3」と認識した結果、「正常」と判断する。なお、総ページ数は3であり、ページ番号も揃っている。
図16(b)に示す例では、学籍番号「a201302」と認識した各ページでは、ページ分子とページ分母を「1/5,2/5,3/5,4/5,5/5」と認識した結果、「正常」と判断する。なお、総ページ数は5であり、ページ番号も揃っている。
図16(c)に示す例では、学籍番号「a201303」と認識した各ページでは、ページ分子とページ分母を「1/3,2/3,3/3」と認識した結果、「正常」と判断する。なお、総ページ数は3であり、ページ番号も揃っている。
図16(d)に示す例では、学籍番号「a201304」と認識した各ページでは、ページ分子とページ分母を「1/2,2/2」と認識した結果、「正常」と判断する。なお、総ページ数は2であり、ページ番号も揃っている。
【0065】
図17は、文字認識等に誤りがあった場合に、本実施の形態を用いて、処理を行った場合の結果の例を示す説明図である。本来は学籍番号「a201302」の文書である「1/5」で、学籍番号「a201303」とする文字認識の誤りがある場合の例である。
図17(a)に示す例では、
図16の例と同様に、学籍番号「a201301」と認識した各ページでは、ページ分子とページ分母を「1/3,2/3,3/3」と認識した結果、「正常」と判断する。なお、総ページ数は3であり、ページ番号も揃っている。
図17(b)に示す例では、学籍番号「a201302」と認識した各ページでは、ページ分子とページ分母を「2/5,3/5,4/5,5/5」と認識した結果、「ページ不足」と判断する。総ページ数の文字認識結果は5であるが、学籍番号「a201302」のページ数は全部で4ページであることから、このような判断になる。
図17(c)に示す例では、学籍番号「a201303」と認識した各ページでは、ページ分子とページ分母を「1/5,1/3,2/3,3/3」と認識した結果、「総ページ数の誤検知」と判断する。総ページ数の文字認識結果として「3」と「5」があり、一致していないので、このような判断になる。
図17(d)に示す例では、
図16の例と同様に、学籍番号「a201304」と認識した各ページでは、ページ分子とページ分母を「1/2,2/2」と認識した結果、「正常」と判断する。なお、総ページ数は2であり、ページ番号も揃っている。
【0066】
図18は、文字認識等に誤りがあった場合に、本実施の形態を用いて、処理を行った場合の結果の例を示す説明図である。本来は学籍番号「a201303」の文書である「1/3」で、「7/3」とする文字認識の誤り(分子の「1」を「7」とする文字認識の誤り)がある場合の例である。
図18(a)に示す例では、
図16の例と同様に、学籍番号「a201301」と認識した各ページでは、ページ分子とページ分母を「1/3,2/3,3/3」と認識した結果、「正常」と判断する。なお、総ページ数は3であり、ページ番号も揃っている。
図18(b)に示す例では、
図16の例と同様に、学籍番号「a201302」と認識した各ページでは、ページ分子とページ分母を「1/5,2/5,3/5,4/5,5/5」と認識した結果、「正常」と判断する。なお、総ページ数は5であり、ページ番号も揃っている。
図18(c)に示す例では、学籍番号「a201303」と認識した各ページでは、ページ分子とページ分母を「2/3,3/3,7/3」と認識した結果、「ページ番号の誤検知」と判断する。総ページ数の文字認識結果は3であり、学籍番号「a201303」のページ数は全部で3ページであって一致するが、1/3がなく(又は、7/3があり)、ページ番号が揃っていないからである。
図18(d)に示す例では、
図16の例と同様に、学籍番号「a201304」と認識した各ページでは、ページ分子とページ分母を「1/2,2/2」と認識した結果、「正常」と判断する。なお、総ページ数は2であり、ページ番号も揃っている。
【0067】
図19は、本実施の形態による処理例を示すフローチャートである。
ステップS1902では、文書のスキャンを行う。この例では、スキャンされる文書は、学生220が提出したテスト用紙に対して、教員/採点者210が採点したものである。この各文書には、学生220によって、学籍番号、ページ番号、総ページ数が記載されている。そして、教員/採点者210によって、学生毎に文書の1ページ目には点数が記載されている。
ステップS1904では、文書の画像であるスキャンデータを転送する。
【0068】
ステップS1906では、その文書のフォームを判定する。既存の技術を用いて、文書のフォームを判定し、学籍番号、ページ番号、総ページ数、点数が記載されている位置を特定する。
ステップS1908では、文字認識領域を取得する。具体的には、
図3の例に示したように、学籍番号欄320、ページ番号欄305、総ページ数欄310、採点結果欄315内の画像を抽出する。
【0069】
ステップS1910では、文字認識処理を行う。
ステップS1912では、全文書に対する処理が終了したか否かを判断し、終了した場合はステップS1914へ進み、それ以外の場合はステップS1906へ戻る。
【0070】
ステップS1914では、学籍番号でのまとめ処理を行う。つまり、学籍番号の文字認識結果が同じ文書をまとめる。
ステップS1916では、正常、異常の種別判断処理を行う。ステップS1916の詳細な処理については、
図20の例に示すフローチャートを用いて後述する。
【0071】
ステップS1918では、全学生分の処理が完了したか否かを判断し、完了した場合はステップS1920へ進み、それ以外の場合はステップS1916へ戻る。
【0072】
ステップS1920では、結果を集計する。例えば、
図4に示した処理結果表示画面400内の情報を生成する。
ステップS1922では、結果を登録する。例えば、
図4に示した処理結果表示画面400を教員/採点者210に提示し、教員/採点者210よる検査の後、集計結果を学習管理システム240に登録する。そして、その後、各学生220に採点結果を電子メール等で送信する。
【0073】
図20は、本実施の形態による処理例を示すフローチャートである。
図19に示したフローチャート内のステップS1916の詳細な処理例を示すものである。学籍番号の文字認識結果が同じである文書に対して、この処理を行う。つまり、各学生220のテスト用紙毎に、この処理を行う。ただし、学籍番号の文字認識誤り、又は、学生220による記入誤りがある可能性があり、その場合は、必ずしも、各学生220のテスト用紙毎となるわけではない。
【0074】
ステップS2002では、総ページ数は一致するか否かを判断し、一致する場合はステップS2006へ進み、それ以外の場合はステップS2004へ進む。具体的には、学籍番号の文字認識結果が同じである文書において、各文書に記載された総ページ数の文字認識結果が全て同じであるか否かを判断している。1つでも異なる文書がある場合は、ステップS2004へ進むことになる。
ステップS2004では、「総ページ数の誤検知」と確定する。つまり、学籍番号の文字認識結果が同じである文書において、各文書に記載されている総ページ数の文字認識結果に一致しないものがある場合は、総ページ数の誤検知であると判断している。
【0075】
ステップS2006では、総ページ数と文書の枚数は不一致かを判断し、一致していない場合はステップS2008へ進み、それ以外の場合(一致している場合)はステップS2014へ進む。具体的には、総ページ数の文字認識結果と、対象としている学籍番号の文字認識結果が同じである文書の枚数が不一致であるか否かを判断している。
ステップS2008では、「文書の枚数<総ページ数」であるか否かを判断し、「文書の枚数<総ページ数」の場合はステップS2012へ進み、それ以外の場合はステップS2010へ進む。ここでの「文書の枚数」は、対象としている学籍番号の文字認識結果が同じである文書の枚数である。「総ページ数」は、総ページ数の文字認識結果のことである。
【0076】
ステップS2010では、「学籍番号の誤検知」と確定する。つまり、文書の枚数が総ページ数より多い場合は、学籍番号の誤検知であると判断している。
ステップS2012では、「ページ不足」と確定する。つまり、文書の枚数が総ページ数より少ない場合は、ページ不足であると判断している。
【0077】
ステップS2014では、ページ番号のソートを行う。具体的には、対象としている学籍番号の文字認識結果が同じである文書において、ページ番号の文字認識結果で昇順のソートを行う。ページ番号が揃っているか否かを判断するためである。
ステップS2016では、ページ番号は揃っているか否かを判断し、揃っている場合はステップS2018へ進み、それ以外の場合はステップS2020へ進む。具体的には、ステップS2014でのソート結果が、1から始まっており、ページ番号が抜けることなく、総ページ数まであること、さらに、余分なページ(重複しているページ、総ページより大きい数であるページ番号があること等)がない場合に、ステップS2018へ進む。
【0078】
ステップS2018では、「正常」と確定する。つまり、学籍番号の文字認識結果が同じである文書において、その文書の枚数と総ページ数が適合しており、ページ番号が揃っている場合は、正常であると判断している。
ステップS2020では、「ページ番号の誤検知」と確定する。つまり、学籍番号の文字認識結果が同じである文書において、ページ番号が揃っていない場合は、ページ番号の誤検知であると判断している。
【0079】
なお、本実施の形態は、対象とする一連の文書(複数人のユーザー端末215の提出したテスト用紙)において、文書の枚数が総ページ数より少ない場合と文書の枚数が総ページ数より多い場合が混在する場合は、両者を対応させて表示するようにしてもよい。一方の不足している文書が、他方の文書に混入している可能性が高いためである。さらに、総ページ数より少ない枚数と総ページ数より多い枚数が一致する組み合わせを対応させて表示するようにしてもよい。ここで「対応させて表示」として、例えば、
図4の例に示す集計結果テーブル420の集計処理結果欄424で、「ページ不足である」、「特定情報の誤検知」を同じ表示形態(例えば、赤色等)で表示するようにしてもよいし、一方の行(例えば、「ページ不足である」の行)を選択すると、他方の行(例えば、「特定情報の誤検知」の行)を点滅させるようにしてもよい。なお「総ページ数より少ない枚数」と「総ページ数より多い枚数」は、総ページ数の文字認識結果と特定情報の文字認識結果が同じである文書の枚数とを比較することによって算出すればよい。
【0080】
また、採点結果欄315が記載されているにもかかわらず(又は、採点結果欄315の文字認識結果があるにもかかわらず)、ページ番号欄305に対する文字認識結果が「1」以外である場合であって、その学籍番号の文書では「ページ番号の誤検知」以外のエラーではない場合(つまり、その学籍番号の文書では「ページ番号の誤検知」のみのエラーである場合)は、ページ番号欄305に対する文字認識結果を「1」と修正するようにしてもよい。又は、ページ番号欄305に対する文字認識結果を「1」と修正することを、教員/採点者210に通知し、教員/採点者210による許可を示す操作があった場合に、ページ番号欄305に対する文字認識結果を「1」と修正するようにしてもよい。
【0081】
また、正常ではないと判断された場合、対象としている文書に対して、総ページ数の文字認識結果又は学籍番号の文字認識結果が同じである文書の枚数をもとに、文字認識処理の数値範囲を限定し、再度文字認識処理を実施するようにしてもよい。例えば、総ページ数の文字認識結果が「5」である場合は、ページ番号の文字認識処理にあたって、文字認識結果が「1」から「5」までの範囲になるようにする。具体的には、「7」と「1」は、文字認識処理で誤る可能性が高いが、文字認識結果が「7」となるような場合は、「1」から「5」までの範囲に入らないので、「1」の文字認識率を高くすることができる。なお、前述の「正常ではないと判断された場合」を、「ページ番号の誤検知と判断された場合」と限定してもよい。
【0082】
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通等のために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD-R、DVD-RW、DVD-RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD-ROM)、CDレコーダブル(CD-R)、CDリライタブル(CD-RW)等、ブルーレイ・ディスク(Blu-ray(登録商標) Disc)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digitalの略)メモリーカード等が含まれる。
そして、前記のプログラムの全体又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、又は無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分若しくは全部であってもよく、又は別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して記録されていてもよい。また、圧縮や暗号化等、復元可能であればどのような態様で記録されていてもよい。
【符号の説明】
【0083】
100…情報処理装置
105…プロセッサ
110…メモリ
115…データメモリ
120…プログラムメモリ
125…文書記憶領域
130…ユーザー情報記憶領域
135…文書受取モジュール
140…文字認識モジュール
145…誤り検知モジュール
150…表示制御モジュール
185…出力装置
187…表示装置
189…印刷装置
190…受付装置
192…指示受付装置
194…文書読取装置
195…通信装置
198…バス
200…画像受付装置
205…ユーザー端末
210…教員/採点者
215…ユーザー端末
220…学生
230…画像処理装置
240…学習管理システム
250…メール装置
290…通信回線