IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士ゼロックス株式会社の特許一覧

<>
  • 特許-文字認識装置及びプログラム 図1
  • 特許-文字認識装置及びプログラム 図2
  • 特許-文字認識装置及びプログラム 図3
  • 特許-文字認識装置及びプログラム 図4
  • 特許-文字認識装置及びプログラム 図5
  • 特許-文字認識装置及びプログラム 図6
  • 特許-文字認識装置及びプログラム 図7
  • 特許-文字認識装置及びプログラム 図8
  • 特許-文字認識装置及びプログラム 図9
  • 特許-文字認識装置及びプログラム 図10
  • 特許-文字認識装置及びプログラム 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-08-28
(45)【発行日】2023-09-05
(54)【発明の名称】文字認識装置及びプログラム
(51)【国際特許分類】
   G06V 30/24 20220101AFI20230829BHJP
【FI】
G06V30/24 620D
【請求項の数】 8
(21)【出願番号】P 2019068277
(22)【出願日】2019-03-29
(65)【公開番号】P2020166722
(43)【公開日】2020-10-08
【審査請求日】2022-02-28
(73)【特許権者】
【識別番号】000005496
【氏名又は名称】富士フイルムビジネスイノベーション株式会社
(74)【代理人】
【識別番号】100104880
【弁理士】
【氏名又は名称】古部 次郎
(74)【代理人】
【識別番号】100118108
【弁理士】
【氏名又は名称】久保 洋之
(72)【発明者】
【氏名】鈴木 裕介
【審査官】新井 則和
(56)【参考文献】
【文献】特開平07-006212(JP,A)
【文献】米国特許出願公開第2018/0349693(US,A1)
【文献】米国特許出願公開第2015/0356365(US,A1)
【文献】特開2015-138458(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06V 30/00-30/424
(57)【特許請求の範囲】
【請求項1】
複数の文字列体系の何れかに従って記述された文字列の画像である文字列画像を取得する取得手段と、
前記複数の文字列体系の各文字列体系に設定された文字認識の結果の範囲を特定する特定手段と、
前記文字列画像の第1の文字認識を行い、当該第1の文字認識の結果が前記複数の文字列体系のうち、特定の文字列体系に従って記述される文字列の指定された位置における指定された特徴を満たす場合に、当該特定の文字列体系に設定された前記文字認識の結果の範囲内で当該文字列画像の第2の文字認識を行う文字認識手段と
を備えたことを特徴とする文字認識装置。
【請求項2】
前記複数の文字列体系の各文字列体系の特徴及び当該各文字列体系に設定された前記文字認識の結果の範囲は、当該各文字列体系に従って記述される文字列が表す対象の属性に関連付けられており、
前記文字認識手段は、前記第1の文字認識の結果が前記特定の文字列体系の特徴を満たす場合に、当該特徴が関連付けられた属性を特定し、当該属性に関連付けられた前記文字認識の結果の範囲を、当該特定の文字列体系に設定された前記文字認識の結果の範囲として特定することを特徴とする請求項1に記載の文字認識装置。
【請求項3】
前記属性は、前記複数の文字列体系の各文字列体系に従って記述される文字列が表す対象が所属する分類であることを特徴とする請求項2に記載の文字認識装置。
【請求項4】
複数の文字列体系の何れかに従って記述された文字列の画像である文字列画像を取得する取得手段と、
前記複数の文字列体系の各文字列体系に設定された文字認識の結果の範囲を特定する特定手段と、
前記文字列画像の第1の文字認識を行い、当該第1の文字認識の結果が前記複数の文字列体系のうち、特定の文字列体系の特徴を満たす場合に、当該特定の文字列体系に設定された前記文字認識の結果の範囲内で当該文字列画像の第2の文字認識を行う文字認識手段と
を備え、
前記特定の文字列体系の特徴は、当該特定の文字列体系に従って記述される文字列に関する規則であることを特徴とする文字認識装置。
【請求項5】
前記文字列に関する規則は、当該文字列の予め定められた位置における文字が予め定められた文字の何れかであるという規則であることを特徴とする請求項4に記載の文字認識装置。
【請求項6】
前記文字列に関する規則は、当該文字列が予め定められた個数の文字を含むという規則であることを特徴とする請求項4に記載の文字認識装置。
【請求項7】
前記文字列に関する規則は、当該文字列が予め定められた文字の何れかを含む又は含まないという規則であることを特徴とする請求項4に記載の文字認識装置。
【請求項8】
コンピュータに、
複数の文字列体系の何れかに従って記述された文字列の画像である文字列画像を取得する機能と、
前記複数の文字列体系の各文字列体系に設定された文字認識の結果の範囲を特定する機能と、
前記文字列画像の第1の文字認識を行い、当該第1の文字認識の結果が前記複数の文字列体系のうち、特定の文字列体系に従って記述される文字列の指定された位置における指定された特徴を満たす場合に、当該特定の文字列体系に設定された前記文字認識の結果の範囲内で当該文字列画像の第2の文字認識を行う機能と
を実現させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文字認識装置及びプログラムに関する。
【背景技術】
【0002】
記入媒体に記入された、記入者の識別情報を含む文字が読み取られた画像データを取得する取得手段と、取得された画像データに基づいて、文字を文字認識する認識手段と、文字認識された文字に含まれる記入者の識別情報に誤りがあるか否かを判定する判定手段と、文字認識された記入者の識別情報に誤りがない場合は、文字認識された文字を認識結果リストに登録する一方、文字認識された記入者の識別情報に誤りがある場合は、記入媒体に記入する複数の記入者の識別情報を含む複数の記入者情報が予め登録された記入者リストにおいて、取得された画像データにおける文字に類似する記入者情報に基づいて、文字認識された文字を変更して認識結果リストに登録する情報処理手段とを含み、判定手段は、文字認識された記入者の識別情報が、予め設定された範囲に含まれているか否かを判定し、識別情報が範囲に含まれていない場合に、記入者の識別情報に誤りがあると判定する情報処理システムは、知られている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2015-138458号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
文字列画像の文字認識を行う際に、予め文字列画像の文字列体系を設定し、設定された範囲内で文字認識を行う技術がある。ところで、複数の文字列体系の何れかに従って記述された文字列の画像である文字列画像の文字認識を行うことが必要となる場合がある。そのような場合においては、予め複数の文字列体系の範囲を足し合わせた範囲を設定しておくことが考えられるが、範囲が広範となるため高精度で文字認識を行うことができない。
【0005】
本発明の目的は、予め複数の文字列体系の範囲を足し合わせた範囲を設定しておく構成よりも、高精度で文字認識を行うことにある。
【課題を解決するための手段】
【0006】
請求項1に記載の発明は、複数の文字列体系の何れかに従って記述された文字列の画像である文字列画像を取得する取得手段と、前記複数の文字列体系の各文字列体系に設定された文字認識の結果の範囲を特定する特定手段と、前記文字列画像の第1の文字認識を行い、当該第1の文字認識の結果が前記複数の文字列体系のうち、特定の文字列体系に従って記述される文字列の指定された位置における指定された特徴を満たす場合に、当該特定の文字列体系に設定された前記文字認識の結果の範囲内で当該文字列画像の第2の文字認識を行う文字認識手段とを備えたことを特徴とする文字認識装置である。
請求項2に記載の発明は、前記複数の文字列体系の各文字列体系の特徴及び当該各文字列体系に設定された前記文字認識の結果の範囲は、当該各文字列体系に従って記述される文字列が表す対象の属性に関連付けられており、前記文字認識手段は、前記第1の文字認識の結果が前記特定の文字列体系の特徴を満たす場合に、当該特徴が関連付けられた属性を特定し、当該属性に関連付けられた前記文字認識の結果の範囲を、当該特定の文字列体系に設定された前記文字認識の結果の範囲として特定することを特徴とする請求項1に記載の文字認識装置である。
請求項3に記載の発明は、前記属性は、前記複数の文字列体系の各文字列体系に従って記述される文字列が表す対象が所属する分類であることを特徴とする請求項2に記載の文字認識装置である。
請求項4に記載の発明は、複数の文字列体系の何れかに従って記述された文字列の画像である文字列画像を取得する取得手段と、前記複数の文字列体系の各文字列体系に設定された文字認識の結果の範囲を特定する特定手段と、前記文字列画像の第1の文字認識を行い、当該第1の文字認識の結果が前記複数の文字列体系のうち、特定の文字列体系の特徴を満たす場合に、当該特定の文字列体系に設定された前記文字認識の結果の範囲内で当該文字列画像の第2の文字認識を行う文字認識手段とを備え、前記特定の文字列体系の特徴は、当該特定の文字列体系に従って記述される文字列に関する規則であることを特徴とする文字認識装置である。
請求項5に記載の発明は、前記文字列に関する規則は、当該文字列の予め定められた位置における文字が予め定められた文字の何れかであるという規則であることを特徴とする請求項4に記載の文字認識装置である。
請求項6に記載の発明は、前記文字列に関する規則は、当該文字列が予め定められた個数の文字を含むという規則であることを特徴とする請求項4に記載の文字認識装置である。
請求項7に記載の発明は、前記文字列に関する規則は、当該文字列が予め定められた文字の何れかを含む又は含まないという規則であることを特徴とする請求項4に記載の文字認識装置である。
請求項8に記載の発明は、コンピュータに、複数の文字列体系の何れかに従って記述された文字列の画像である文字列画像を取得する機能と、前記複数の文字列体系の各文字列体系に設定された文字認識の結果の範囲を特定する機能と、前記文字列画像の第1の文字認識を行い、当該第1の文字認識の結果が前記複数の文字列体系のうち、特定の文字列体系に従って記述される文字列の指定された位置における指定された特徴を満たす場合に、当該特定の文字列体系に設定された前記文字認識の結果の範囲内で当該文字列画像の第2の文字認識を行う機能とを実現させるためのプログラムである。
【発明の効果】
【0007】
請求項1の発明によれば、予め複数の文字列体系の範囲を足し合わせた範囲を設定しておく構成よりも、高精度で文字認識を行うことができる。
請求項2の発明によれば、各文字列体系の特徴及び各文字列体系に設定された文字認識の結果の範囲を、各文字列体系に従って記述される文字列が表す対象の属性ごとに管理することができる。
請求項3の発明によれば、各文字列体系の特徴及び各文字列体系に設定された文字認識の結果の範囲を、各文字列体系に従って記述される文字列が表す対象が所属する分類ごとに管理することができる。
請求項4の発明によれば、文字列画像の文字認識の結果が文字列に関する規則を満たすことにより、その文字列画像が、特定の文字列体系に従って記述された文字列の画像であることを識別することができる。
請求項5の発明によれば、文字列画像の文字認識の結果の予め定められた位置における文字が予め定められた文字の何れかであることにより、その文字列画像が、特定の文字列体系に従って記述された文字列の画像であることを識別することができる。
請求項6の発明によれば、文字列画像の文字認識の結果が予め定められた個数の文字を含むことにより、その文字列画像が、特定の文字列体系に従って記述された文字列の画像であることを識別することができる。
請求項7の発明によれば、文字列画像の文字認識の結果が予め定められた文字の何れかを含むこと又は含まないことにより、その文字列画像が、特定の文字列体系に従って記述された文字列の画像であることを識別することができる。
請求項8の発明によれば、予め複数の文字列体系の範囲を足し合わせた範囲を設定しておく構成よりも、高精度で文字認識を行うことができる。
【図面の簡単な説明】
【0008】
図1】本発明の実施の形態における授業支援システムの全体構成例を示した図である。
図2】本発明の実施の形態における画像読取装置のハードウェア構成例を示した図である。
図3】本発明の実施の形態における授業支援装置のハードウェア構成例を示した図である。
図4】本発明の実施の形態における授業支援システムで用いられる答案用紙の例を示した図である。
図5】本発明の実施の形態における授業支援装置の第1の実施例を示した模式図である。
図6】本発明の実施の形態における授業支援装置の第2の実施例を示した模式図である。
図7】本発明の実施の形態における授業支援装置の第3の実施例を示した模式図である。
図8】本発明の実施の形態における授業支援装置の第4の実施例を示した模式図である。
図9】本発明の実施の形態における授業支援装置の機能構成例を示したブロック図である。
図10】本発明の実施の形態における授業支援装置に記憶される設定情報の具体例を示した図である。
図11】本発明の実施の形態における授業支援装置の動作例を示したフローチャートである。
【発明を実施するための形態】
【0009】
以下、添付図面を参照して、本発明の実施の形態について詳細に説明する。
【0010】
[本実施の形態の背景及び概要]
文字列画像の文字認識を行う際に、予め文字列画像の文字列体系に応じて範囲を設定し、設定された範囲内で文字認識を行う技術がある。ここで文字列体系とは、文字列が記述されている規則のことである。これに限られるものではないが、例えば、文字列の文字数や、文字列のどの位置にどのような文字が入るか、といった規則を含む。
【0011】
ところで、複数の文字列体系の何れかに従って記述された文字列画像の文字認識を行うことが必要となる場合がある。そのような場合においては、予め複数の文字列体系の範囲を足し合わせた範囲を設定しておく方法が考えられる。ここで、文字列体系の範囲とは、文字列を構成する文字として使用され得る文字の候補であり、文字列を構成する各文字について設定される。複数の文字列体系の範囲を足し合わせた範囲とは、複数の文字列体系の範囲の和集合のことである。例えば、文字列の先頭の文字について、第1の文字列体系の範囲が「6」~「8」であり、第2の文字列体系の範囲が「0」、「8」、「9」であるとすると、これらの文字列体系の範囲を足し合わせた範囲は、「0」、「6」~「9」となる。また、第1の文字列体系の範囲が「0」~「9」であり、第2の文字列体系の範囲が「a」~「z」であるとすると、これらの文字列体系の範囲を足し合わせた範囲は、「0」~「9」、「a」~「z」となる。
【0012】
しかしながら、このように複数の文字列体系の範囲を足し合わせた範囲を設定しておく方法では、文字列体系の範囲が広範となるため、高精度で文字認識を行うことができない。
【0013】
そこで、本実施の形態は、複数の文字列体系の何れかに従って記述された文字列の画像である文字列画像の第1の文字認識を行い、第1の文字認識の結果が特定の文字列体系の特徴を満たす場合に、その特定の文字列体系に設定された文字認識の結果の範囲内で文字列画像の第2の文字認識を行う。つまり文字認識の結果の範囲とは、特定の文字列体系に設定された文字列体系の範囲と同義である。
【0014】
また、本実施の形態は、各文字列体系の特徴及び各文字列体系に設定された文字認識の結果の範囲を、各文字列体系に従って記述される文字列が表す対象の属性に関連付けておく。そして、第1の文字認識の結果が特定の文字列体系の特徴を満たす場合に、その特徴が関連付けられた属性を特定し、その属性に関連付けられた文字認識の結果の範囲を、その特定の文字列体系に設定された文字認識の結果の範囲として特定するとよい。その場合、属性は、各文字列体系に従って記述される文字列が表す対象の性質であれば如何なるものでもよいが、例えば、各文字列体系に従って記述される文字列が表す対象が所属する分類が考えられる。
【0015】
また、本実施の形態では、特定の文字列体系の特徴を、その特定の文字列体系に従って記述される文字列に関する規則の一部とするとよい。その場合、文字列に関する規則の一部としては、これに限られるものではないが、文字列の予め定められた位置における文字が予め定められた文字の何れかであるという第1の規則、文字列が予め定められた個数の文字を含むという第2の規則、文字列が予め定められた文字の何れかを含む又は含まないという第3の規則等が考えられる。
【0016】
以下では、本実施の形態を学籍番号の文字認識に適用した場合について説明する。即ち、文字列体系として「学籍番号体系」を、文字列体系に従って記述される文字列として「学籍番号」を、文字列が表す対象として「学生」を、対象が所属する分類として「大学」を、それぞれ例にとって説明する。
【0017】
[授業支援システムの全体構成]
図1は、本実施の形態が適用される授業支援システム1の全体構成例を示した図である。図示するように、この授業支援システム1は、画像読取装置10と、授業支援装置30と、授業管理サーバ50a~50dとが通信回線80に接続されることにより構成されている。尚、図では、授業管理サーバ50a~50dを示したが、これらを区別する必要がない場合は、授業管理サーバ50と称することもある。また、図には、4つの授業管理サーバ50しか示していないが、2つ、3つ又は5つ以上の授業管理サーバ50を設けてもよい。
【0018】
画像読取装置10は、紙等の記録媒体からの画像読取りを行う装置である。画像読取装置10は、これに加えて、紙等の記録媒体への画像形成、公衆回線を介した画像送信及び画像受信等を行う装置であってもよい。画像読取りのみを行う観点からはスキャナであり、画像印刷のみを行う観点からはプリンタであり、画像読取り及び画像印刷を行う観点からはコピー機であり、画像読取り及び画像送信又は画像受信及び画像印刷を行う観点からはファクシミリである。本実施の形態において、画像読取装置10は、特に、大学の学生に対して行ったテストの答案用紙を読み取る。
【0019】
授業支援装置30は、画像読取装置10で読み取られた読取画像を用いて、大学における授業の支援を行うコンピュータ装置である。本実施の形態において、授業支援装置30は、大学における授業の支援として、特に、答案用紙を読み取って得られた読取画像の文字認識を行い、その文字認識に基づく情報と読取画像とを大学に返却する処理を行う。本実施の形態では、文字認識装置の一例として、授業支援装置30を設けている。
【0020】
授業管理サーバ50は、大学における授業の管理を行うサーバコンピュータである。本実施の形態では、特に、授業支援装置30から返却された文字認識に基づく情報と読取画像とを受け付け、その処理を行う。ここで、授業管理サーバ50aはA大学に設置され、授業管理サーバ50bはB大学に設置され、授業管理サーバ50cはC大学に設置され、授業管理サーバ50dはD大学に設置されていることを想定している。
【0021】
通信回線80は、画像読取装置10と授業支援装置30との間、及び、授業支援装置30と授業管理サーバ50との間の情報通信に用いられる通信手段である。通信回線80としては、例えばLAN(Local Area Network)やインターネットを用いるとよい。
【0022】
[画像読取装置のハードウェア構成]
図2は、本実施の形態における画像読取装置10のハードウェア構成例を示した図である。図示するように、画像読取装置10は、CPU(Central Processing Unit)11と、RAM(Random Access Memory)12と、ROM(Read Only Memory)13と、HDD(Hard Disk Drive)14と、操作パネル15と、画像読取部16と、画像形成部17と、通信インターフェース(以下、「通信I/F」と表記する)18とを備える。
【0023】
CPU11は、ROM13等に記憶された各種プログラムをRAM12にロードして実行することにより、後述する各機能を実現する。
【0024】
RAM12は、CPU11の作業用メモリ等として用いられるメモリである。ROM13は、CPU11が実行する各種プログラム等を記憶するメモリである。HDD14は、画像読取部16が読み取った画像データや画像形成部17における画像形成にて用いる画像データ等を記憶する例えば磁気ディスク装置である。
【0025】
操作パネル15は、各種情報の表示やユーザからの操作入力の受付を行う例えばタッチパネルである。ここで、操作パネル15は、各種情報が表示されるディスプレイと、指やスタイラスペン等の指示手段で指示された位置を検出する位置検出シートとからなる。或いは、タッチパネルに代えて、ディスプレイ及びキーボードを用いてもよい。
【0026】
画像読取部16は、紙等の記録媒体に記録された画像を読み取る。ここで、画像読取部16は、例えばスキャナであり、光源から原稿に照射した光に対する反射光をレンズで縮小してCCD(Charge Coupled Devices)で受光するCCD方式や、LED光源から原稿に順に照射した光に対する反射光をCIS(Contact Image Sensor)で受光するCIS方式のものを用いるとよい。
【0027】
画像形成部17は、紙等の記録媒体に画像を形成する。ここで、画像形成部17は、例えばプリンタであり、感光体に付着させたトナーを記録媒体に転写して像を形成する電子写真方式や、インクを記録媒体上に吐出して像を形成するインクジェット方式のものを用いるとよい。
【0028】
通信I/F18は、通信回線80を介して他の装置、例えば授業支援装置30との間で各種情報の送受信を行う。
【0029】
[授業支援装置及び授業管理サーバのハードウェア構成]
図3は、本実施の形態における授業支援装置30のハードウェア構成例を示した図である。図示するように、授業支援装置30は、演算手段であるCPU31と、記憶手段であるメインメモリ32及びHDD(Hard Disk Drive)33とを備える。ここで、CPU31は、OS(Operating System)やアプリケーション等の各種ソフトウェアを実行し、後述する各機能を実現する。また、メインメモリ32は、各種ソフトウェアやその実行に用いるデータ等を記憶する記憶領域であり、HDD33は、各種ソフトウェアに対する入力データや各種ソフトウェアからの出力データ等を記憶する記憶領域である。更に、授業支援装置30は、外部との通信を行うための通信I/F34と、ディスプレイ等の表示デバイス35と、キーボードやマウス等の入力デバイス36とを備える。
【0030】
また、図3に示したハードウェア構成は、授業管理サーバ50のハードウェア構成としても捉えられる。但し、授業管理サーバ50について述べるときは、図3のCPU31、メインメモリ32、HDD33、通信I/F34、表示デバイス35、入力デバイス36をそれぞれ、CPU51、メインメモリ52、HDD53、通信I/F54、表示デバイス55、入力デバイス56と表記するものとする。
【0031】
[授業支援システムの背景及び概要]
例えば、近年では、複数の大学の学生が参加する合同セミナーという形態の講義が行われるようになっている。複数の大学は異なる学籍番号体系を持つため、このような講義で答案用紙に記入された学籍番号の文字認識を行う場合、予め複数の学籍番号体系の範囲を足し合わせた範囲を設定しておくことが考えられる。しかしながら、複数の学籍番号体系の範囲を足し合わせた範囲を設定することには多大な労力を要する。また、複数の学籍番号体系の範囲を足し合わせた範囲を設定したとしても、その範囲は広範となるので、高精度で文字認識を行うことができない。従って、答案用紙を人手により大学ごとに振り分けて、大学ごとにその大学の学籍番号体系で文字認識を行った方が効率的という結論になってしまう。
【0032】
そこで、本実施の形態では、複数の学籍番号体系の何れかに従って記述された学籍番号の画像の第1の文字認識を行い、第1の文字認識の結果が特定の学籍番号体系の特徴を満たす場合に、その特定の学籍番号体系に設定された文字認識の結果の範囲内で学籍番号の画像の第2の文字認識を行う。
【0033】
以下、異なる学籍番号体系を持つ複数の大学に所属する学生が同一の講義に参加した場面を想定して、授業支援システム1の概要を説明する。
【0034】
図4は、このような講義のテストで用いられる答案用紙20の例を示した図である。図示するように、答案用紙20には、学籍番号を手書き入力するための学籍番号記入欄21と、得点を手書き入力するための得点記入欄22と、問題文及び解答欄を含む問題解答領域23とが設けられている。この答案用紙20が配布されると、この講義に参加した複数の大学の学生は、自身の大学における学籍番号を学籍番号記入欄21に手書き入力し、問題に対する解答を問題解答領域23の解答欄に手書き入力する。
【0035】
次に、例えば講師は、この講義に参加した複数の大学の学生から答案用紙20を回収して持ち帰り、問題解答領域23の解答欄に手書き入力された解答に従って採点を行う。そして、採点結果である得点を得点記入欄22に手書き入力する。
【0036】
その後、例えば講師は、採点済みの答案用紙20を画像読取装置10で読み取る。すると、画像読取装置10が、読取画像を授業支援装置30へ転送する。
【0037】
これにより、授業支援装置30は、学籍番号記入欄21から学籍番号の画像(以下、「学籍番号画像」という)を取得し、その一部の文字認識を行う。そして、その文字認識の結果と学籍番号体系の特徴との合致度に基づいて、学籍番号画像を、その学籍番号画像に対応する大学に振り分け、大学に事前に設定された範囲で学籍番号画像を文字認識する。一方で、授業支援装置30は、得点記入欄22から得点の画像(以下、「得点画像」という)を取得して文字認識し、得点の集計結果を各大学に伝える。
【0038】
ここで、学籍番号体系の特徴は、学籍番号体系に従って記述される学籍番号に関する規則の一部とする。学籍番号に関する規則の一部としては、これに限られるものではないが、例えば、学籍番号の予め定められた位置における文字が予め定められた文字の何れかであるという規則、学籍番号が予め定められた個数の文字を含むという規則、学籍番号が予め定められた文字の何れかを含むという規則等が考えられる。
【0039】
以下、学籍番号に関する規則の一部として1つ目の規則を採用した場合の例を第1の実施例として、学籍番号に関する規則の一部として2つ目の規則を採用した場合の例を第2の実施例として、学籍番号に関する規則の一部として3つ目の規則を採用した場合の2つの例を第3及び第4の実施例として説明する。尚、1つ目の規則は、前述した第1の規則の一例であり、2つ目の規則は、前述した第2の規則の一例であり、3つ目の規則は、前述した第3の規則の一例である。
【0040】
(第1の実施例)
図5は、第1の実施例を示した模式図である。図では、授業支援装置30が、表311に示す学籍番号画像を取得している。尚、この時点では、各学籍番号画像に対応する大学名は分かっていないが、表311には補足的に大学名も示している。
【0041】
第1の実施例では、学籍番号体系の特徴として、学籍番号における特定の項目の文字位置を用いる。特定の項目は入学年度とし、入学年度は西暦の末尾2桁、具体的には「2016」の「16」、「2017」の「17」、「2018」の「18」の何れかであるとする。そして、下線で示すように、A大学の学籍番号における入学年度の文字位置は、先頭から4文字目及び5文字目とし、B大学の学籍番号における入学年度の文字位置は、先頭から2文字目及び3文字目とする。
【0042】
すると、授業支援装置30は、表312に示すように、先頭から4文字目及び5文字目の文字列が「16」、「17」、「18」の何れかに類似すると判断された学籍番号画像をA大学に振り分ける。また、表313に示すように、先頭から4文字目及び5文字目の文字列が「16」、「17」、「18」の何れにも類似しないと判断された学籍番号画像をB大学に振り分ける。
【0043】
そして、授業支援装置30は、表312に示した学籍番号画像を、A大学に事前に設定された範囲で文字認識する。また、表313に示した学籍番号画像を、B大学に事前に設定された範囲で文字認識する。
【0044】
その後、授業支援装置30は、得点画像を文字認識し、A大学について得点を集計した結果をA大学に、B大学について得点を集計した結果をB大学にそれぞれ伝える。
【0045】
(第2の実施例)
図6は、第2の実施例を示した模式図である。図では、授業支援装置30が、表321に示す学籍番号画像を取得している。尚、この時点では、各学籍番号画像に対応する大学名は分かっていないが、表321には補足的に大学名も示している。
【0046】
第2の実施例では、学籍番号体系の特徴として、学籍番号の桁数を用いる。縦の破線及び下線で示すように、C大学の学籍番号の桁数は9桁とし、B大学の学籍番号の桁数は8桁とする。
【0047】
すると、授業支援装置30は、表322に示すように、桁数が9桁と判断された学籍番号画像をC大学に振り分ける。また、表323に示すように、桁数が9桁でないと判断された学籍番号画像をB大学に振り分ける。
【0048】
そして、授業支援装置30は、表322に示した学籍番号画像を、C大学に事前に設定された範囲で文字認識する。また、表323に示した学籍番号画像を、B大学に事前に設定された範囲で文字認識する。
【0049】
その後、授業支援装置30は、得点画像を文字認識し、C大学について得点を集計した結果をC大学に、B大学について得点を集計した結果をB大学にそれぞれ伝える。
【0050】
(第3の実施例)
図7は、第3の実施例を示した模式図である。図では、授業支援装置30が、表331に示す学籍番号画像を取得している。尚、この時点では、各学籍番号画像に対応する大学名は分かっていないが、表331には補足的に大学名も示している。
【0051】
第3の実施例では、学籍番号体系の特徴として、学籍番号における特定の文字種の有無を用いる。特定の文字種としては、英小文字、英大文字、数字等が考えられるが、ここでは、英大文字とする。また、学籍番号の何れかの文字位置における特定の文字種の有無を特徴として用いてもよいが、ここでは、学籍番号の特定の文字位置における特定の文字種の有無を特徴として用いる。下線で示すように、A大学の学籍番号は2文字目及び3文字目に英大文字を含むものとし、B大学の学籍番号は英大文字を含まないものとする。
【0052】
すると、授業支援装置30は、表332に示すように、2文字目及び3文字目に英大文字を含むと判断された学籍番号画像をA大学に振り分ける。また、表333に示すように、2文字目及び3文字目に英大文字を含まないと判断された学籍番号画像をB大学に振り分けている。
【0053】
そして、授業支援装置30は、表332に示した学籍番号画像を、A大学に事前に設定された範囲で文字認識する。また、表333に示した学籍番号画像を、B大学に事前に設定された範囲で文字認識する。
【0054】
その後、授業支援装置30は、得点画像を文字認識し、A大学について得点を集計した結果をA大学に、B大学について得点を集計した結果をB大学にそれぞれ伝える。
【0055】
(第4の実施例)
図8は、第4の実施例を示した模式図である。図では、授業支援装置30が、表341に示す学籍番号画像を取得している。尚、この時点では、各学籍番号画像に対応する大学名は分かっていないが、表341には補足的に大学名も示している。
【0056】
第4の実施例では、学籍番号体系の特徴として、学籍番号における特殊文字の有無を用いる。特殊文字としては、ハイフン(-)、アスタリスク(*)等が考えられるが、ここでは、ハイフン(-)とする。また、学籍番号の何れかの文字位置における特殊文字の有無を特徴として用いてもよいが、ここでは、学籍番号の特定の文字位置における特殊文字の有無を特徴として用いる。下線で示すように、D大学の学籍番号は6文字目にハイフン(-)を含むものとし、C大学の学籍番号はハイフン(-)を含まないものとする。
【0057】
すると、授業支援装置30は、表342に示すように、6文字目にハイフン(-)を含むと判断された学籍番号画像をD大学に振り分ける。また、表343に示すように、6文字目にハイフン(-)を含まないと判断された学籍番号画像をC大学に振り分ける。
【0058】
そして、授業支援装置30は、表342に示した学籍番号画像を、D大学に事前に設定された範囲で文字認識する。また、表343に示した学籍番号画像を、C大学に事前に設定された範囲で文字認識する。
【0059】
その後、授業支援装置30は、得点画像を文字認識し、D大学について得点を集計した結果をD大学に、C大学について得点を集計した結果をC大学にそれぞれ伝える。
【0060】
[授業支援装置の機能構成]
図9は、本実施の形態における授業支援装置30の機能構成例を示したブロック図である。図示するように、本実施の形態における授業支援装置30は、受信部41と、画像抽出部42と、設定情報記憶部43と、設定情報取得部44と、文字認識部45と、集計処理部46と、送信部47とを備えている。
【0061】
受信部41は、画像読取装置10から答案用紙20を読み取ることにより得られた読取画像を受信し、その読取画像を画像抽出部42に出力する。
【0062】
画像抽出部42は、受信部41から受け取った読取画像上で、学籍番号記入欄21に相当する領域及び得点記入欄22に相当する領域を特定する。ここで、学籍番号記入欄21に相当する領域の位置及び得点記入欄22に相当する領域の位置を示す情報は、例えば、答案用紙20の予め決められた箇所にコード化して印刷しておくとよい。そして、画像抽出部42は、特定した学籍番号記入欄21に相当する領域及び得点記入欄22に相当する領域からそれぞれ学籍番号画像及び得点画像を切り出し、学籍番号画像及び得点画像を読取画像と共に文字認識部45に出力する。本実施の形態では、文字列画像の一例として、学籍番号画像を用いており、文字列画像を取得する取得手段の一例として、画像抽出部42を設けている。
【0063】
設定情報記憶部43は、大学ごとに、学籍番号における各文字位置の文字が割り当てられた項目を示す項目情報と、学籍番号における各文字位置の文字の範囲を示す範囲情報とからなる設定情報を記憶する。ここで、設定情報は、学籍番号における各文字の範囲、学籍番号の桁数、学籍番号における各文字の文字種、学籍番号における各文字が特殊文字である場合の特殊文字の種類等の特徴情報を含んでいると言うことができる。この設定情報の具体例については後述する。
【0064】
設定情報取得部44は、学籍番号画像及び得点画像を受け取った旨が文字認識部45から通知されると、1回目の文字認識の対象とすべき学籍番号画像の文字位置と、設定情報記憶部43に記憶された特徴情報とを文字認識部45に出力する。ここで、第1の実施例では、文字位置は、特定の項目に割り当てられた文字位置であり、特徴情報は、その文字位置における文字の範囲の指定である。第2の実施例では、文字位置は、学籍番号の桁数を区別可能な文字位置であり、特徴情報は、その文字位置における文字の有無である。第3の実施例では、文字位置は、特定の文字種が存在する可能性がある文字位置であり、特徴情報は、その特定の文字種の種類である。第4の実施例では、特殊文字が存在する可能性がある文字位置であり、特徴情報は、その特殊文字の種類である。
【0065】
これにより、設定情報取得部44は、文字認識部45から、学籍番号画像の指定した文字位置の画像と指定した特徴情報との合致度を取得する。ここで、第1の実施例では、合致度は、学籍番号画像の指定した文字位置の画像の文字認識結果と、指定した範囲内の文字との類似度である。指定した範囲内の文字が複数あれば、最も類似する文字との類似度を採用すればよい。指定した文字位置が複数の桁に渡っていれば、各桁における類似度から何らかの計算で求めた類似度を採用すればよい。第2の実施例では、合致度は、学籍番号画像の指定した文字位置に文字の画像が存在すると判定した際の信頼度である。例えば、桁数が8桁の学籍番号と桁数が9桁の学籍番号とを切り分ける場合であれば、学籍番号画像の9桁目が存在する確率である。第3の実施例では、合致度は、学籍番号の指定した文字位置の画像の文字認識結果と、指定した文字種の文字との類似度である。第4の実施例では、合致度は、学籍番号の指定した文字位置の画像の文字認識結果と、指定した種類の特殊文字との類似度である。
【0066】
設定情報取得部44は、文字認識部45から取得した合致度が予め定めた閾値以上であるかどうかに基づいて、学籍番号画像に対応する大学を特定する。そして、その大学の大学名を文字認識部45に出力する。尚、ここでは、大学名を出力するものとするが、大学を識別する情報であれば如何なる情報を出力してもよい。また、設定情報取得部44は、その大学に対して設定された範囲情報を、2回目の文字認識で用いる文字の範囲を示す情報として、文字認識部45に出力する。本実施の形態では、文字認識の結果の範囲の一例として、範囲情報が表す範囲を用いており、文字認識の結果の範囲を特定する特定手段の一例として、設定情報取得部44を設けている。
【0067】
文字認識部45は、画像抽出部42から学籍番号画像及び得点画像を受け取ると、その旨を設定情報取得部44に通知する。これにより設定情報取得部44から文字位置及び特徴情報を受け取ると、文字認識部45は、学籍番号画像のその文字位置の画像を認識する第1の文字認識を行い、第1の文字認識の結果と受け取った特徴情報との合致度を算出する。そして、合致度を設定情報取得部44に出力する。本実施の形態では、文字列画像の第1の文字認識を行う文字認識手段の一例として、文字認識部45を設けている。
【0068】
これにより設定情報取得部44から大学名を受け取ると、画像抽出部42から受け取った読取画像にその大学名を付加する。つまり、読取画像を大学ごとに振り分ける。また、設定情報取得部44から範囲情報を受け取ると、画像抽出部42から受け取った学籍番号画像をその範囲情報が示す範囲で認識する第2の文字認識を行う。本実施の形態では、特定の文字列体系に設定された文字認識の結果の範囲内で文字列画像の第2の文字認識を行う文字認識手段の一例として、文字認識部45を設けている。
【0069】
更に、文字認識部45は、画像抽出部42から受け取った得点画像を文字認識して学籍番号ごとの得点を取得する。そして、学籍番号ごとの得点と読取画像とを、大学ごとに集計処理部46に出力する。
【0070】
集計処理部46は、学籍番号ごとの得点と読取画像とを、大学ごとに文字認識部45から受け取ると、大学ごとに得点を集計する。そして、大学ごとに、得点の集計結果と読取画像とを送信部47に出力する。
【0071】
送信部47は、大学ごとに、得点の集計結果と読取画像とを、その大学の授業管理サーバ50へ送信する。
【0072】
図10は、設定情報記憶部43に記憶された設定情報の具体例を示した図である。図示するように、設定情報は、大学ごとに、その大学の大学名に対して、その大学の学籍番号体系の情報を設定したものとなっている。
【0073】
学籍番号は、入学年度、学生種別、学科種別、個人番号等の情報をコード化したものであることが多い。従って、学籍番号体系の情報は、学籍番号の文字位置ごとにその文字位置における文字が割り当てられた入学年度、学生種別、学科種別、個人番号等の項目を示す項目情報を含んでいる。
【0074】
入学年度としては、A大学、B大学、D大学のように、西暦の末尾2桁で表したものや、C大学のように、元号を表すアルファベット1文字と年を表す数字2桁とで表したものが考えられる。学生種別としては、学部、大学院等をコード化したもので、A大学、B大学のように数字で表したものや、C大学、D大学のように英文字で表したものが考えられる。学科種別としては、○○学科、○○専攻等をコード化したもので、B大学、D大学のように数字で表したものや、A大学、C大学のように英文字で表したものが考えられる。個人番号としては、個人ごとに設定される通し番号が考えられる。従って、学籍番号体系の情報は、学籍番号の文字位置ごとにその文字位置における文字の範囲を示す項目情報を含んでいる。
【0075】
ここで、図10の設定情報は、第1の実施例では、特定の項目に割り当てられた文字位置における文字の範囲を特徴情報として含んでいると言うことができる。第2の実施例では、学籍番号の桁数を区別可能な文字位置における文字の有無を特徴情報として含んでいると言うことができる。第3の実施例では、特定の文字種が存在する可能性がある文字位置におけるその特定の文字種の種類を特徴情報として含んでいると言うことができる。第4の実施例では、特殊文字が存在する可能性がある文字位置におけるその特殊文字の種類を特徴情報として含んでいると言うことができる。
【0076】
尚、ここでは、大学名と項目情報と範囲情報とを1つのテーブルで関連付けているが、大学名と項目情報とを関連付けるテーブルと、大学名と範囲情報とを関連付けるテーブルとを分けてもよい。また、大学を識別する情報として大学名を用いたが、大学コード等の情報であってもよい。
【0077】
[授業支援装置の動作]
図11は、本実施の形態における授業支援装置30の動作例を示したフローチャートである。図10では、4つの大学に対する設定情報を示したが、ここでは、2つの大学(「第1の大学」、「第2の大学」と称する)の学籍番号を区別する動作例を示す。この動作例に先立ち、設定情報取得部44が、設定情報記憶部43から第1の大学の学籍番号の特徴を示す特徴情報を取得し、文字認識部45にこの特徴情報を与えておくものとする。例えば、第1の実施例では、第1の大学をA大学とし、特徴情報を、先頭から4文字目が「1」で、先頭から5文字目が「6」、「7」、「8」の何れかであるという情報とする。第2の実施例では、第1の大学をC大学とし、特徴情報を、先頭から9文字目が存在するという情報とする。第3の実施例では、第1の大学をA大学とし、特徴情報を、先頭から2文字目及び3文字目が英文字であるという情報とする。第4の実施例では、第1の大学をD大学とし、特徴情報を、先頭から6文字目がハイフン(-)であるという情報とする。
【0078】
この状態で、まず、受信部41は、画像読取装置10から読取画像を受信する(ステップ401)。
【0079】
次に、画像抽出部42は、ステップ401で受信された読取画像から、学籍番号画像及び得点画像を切り出す(ステップ402)。
【0080】
次いで、文字認識部45は、ステップ402で切り出された学籍番号画像のうち設定情報取得部44により事前に指定された文字位置の画像と、設定情報取得部44により事前に指定された特徴情報との合致度を算出する(ステップ403)。例えば、第1の実施例では、合致度は、先頭から4文字目及び5文字目の画像と「16」、「17」、「18」のうち最も類似するものとの類似度である。この類似度は、先頭から4文字目の画像と「1」との類似度と、先頭から5文字目の画像と「6」、「7」、「8」のうち最も類似するものとの類似度とから計算によって算出すればよい。第2の実施例では、合致度は、先頭から9文字目の画像が存在するという判定の信頼度である。第3の実施例では、合致度は、先頭から2文字目及び3文字目の画像と英文字との類似度である。この類似度は、先頭から2文字目の画像と全ての英文字のうち最も類似するものとの類似度と、先頭から3文字目の画像と全ての英文字のうち最も類似するものとの類似度とから計算によって算出すればよい。第4の実施例では、合致度は、先頭から6文字目の画像とハイフン(-)との類似度である。
【0081】
これにより、設定情報取得部44は、ステップ403で算出された合致度が、予め定められた閾値以上であるかどうかを判定する(ステップ404)。
【0082】
ステップ404で合致度が閾値以上であると判定した場合、設定情報取得部44は、ステップ401で受信された読取画像に第1の大学の大学名を付与する(ステップ405)。尚、ここでは大学名を付与するが、大学を識別するための情報であれば、如何なる情報を付与してもよい。そして、設定情報取得部44は、設定情報記憶部43から第1の大学に設定された範囲情報を取得する(ステップ406)。
【0083】
一方、ステップ404で合致度が閾値未満であると判定した場合、設定情報取得部44は、ステップ401で受信された読取画像に第2の大学の大学名を付与する(ステップ407)。尚、ここでは大学名を付与するが、大学を識別するための情報であれば、如何なる情報を付与してもよい。そして、設定情報取得部44は、設定情報記憶部43から第2の大学に設定された範囲情報を取得する(ステップ408)。
【0084】
これにより、文字認識部45は、ステップ406又はステップ408で取得された範囲情報が示す範囲で、ステップ402で切り出された学籍番号画像を文字認識する(ステップ409)。
【0085】
また、文字認識部45は、ステップ402で切り出された得点画像を文字認識する(ステップ410)。
【0086】
その後、文字認識部45は、画像読取装置10で読み取られた読取画像がまだあるかどうかを判定する(ステップ411)。例えば、画像読取装置10で全ての学生の答案用紙20が読み取られた場合に、その旨の情報が受信部41、画像抽出部42を介して文字認識部45に伝わるようにし、文字認識部45はこの情報に基づいて読取画像がまだあるかどうかを判定すればよい。
【0087】
ステップ411で読取画像がまだあると判定されれば、処理はステップ401へ戻り、ステップ411で読取画像がまだあると判定されなければ、集計処理部46が、ステップ405又はステップ407で付与された大学名に基づいて、大学ごとに、ステップ410の文字認識で得られた得点を集計する(ステップ412)。
【0088】
そして、ステップ405又はステップ407で付与された大学名に基づいて、大学ごとに、ステップ401で受信された読取画像と、ステップ412での得点の集計結果とを、その大学の授業管理サーバ50へ送信する(ステップ413)。
【0089】
尚、この動作例では、2つの大学の学籍番号を区別することとしたが、これには限らない。一般的には、複数の大学の学籍番号を区別することが必要となる場合がある。そのような場合は、この動作例を、複数の大学の学籍番号から1つの大学の学籍番号を区別する動作例として、複数回繰り返せばよい。
【0090】
例えば、図10に示したA大学~D大学の設定情報が記憶されている場合には、次のような動作を行えばよい。即ち、まず、第3の実施例の動作を行って、A大学~D大学からA大学を区別する。次に、第2の実施例の動作を行って、残ったB大学~D大学からB大学を区別する。そして最後に、第4の実施例の動作を行って、残ったC大学及びD大学をC大学とD大学とに区別する。
【0091】
また、上記では、本実施の形態を学籍番号の文字認識に適用した場合を例にとったが、本実施の形態は、複数の文字列体系が考えられる他の文字列の文字認識に適用してもよい。そのような例としては、複数のメーカで製造された製品の製造番号の体系がメーカごとに異なる場合に、メーカごとの製造番号を区別して文字認識する場合等がある。
【0092】
[プログラム]
本実施の形態における授業支援装置30が行う処理は、例えば、アプリケーションソフトウェア等のプログラムとして用意される。
【0093】
即ち、本実施の形態を実現するプログラムは、コンピュータに、複数の文字列体系の何れかに従って記述された文字列の画像である文字列画像を取得する機能と、複数の文字列体系の各文字列体系に設定された文字認識の結果の範囲を特定する機能と、文字列画像の第1の文字認識を行い、第1の文字認識の結果が複数の文字列体系のうち、特定の文字列体系の特徴を満たす場合に、特定の文字列体系に設定された文字認識の結果の範囲内で文字列画像の第2の文字認識を行う機能とを実現させるためのプログラムとして捉えられる。
【0094】
尚、本実施の形態を実現するプログラムは、通信手段により提供することはもちろん、CD-ROM等の記録媒体に格納して提供することも可能である。
【符号の説明】
【0095】
1…授業支援システム、10…画像読取装置、30…授業支援装置、41…受信部、42…画像抽出部、43…設定情報記憶部、44…設定情報取得部、45…文字認識部、46…集計処理部、47…送信部、50a,50b,50c,50d…授業管理サーバ
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11