(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023070287
(43)【公開日】2023-05-19
(54)【発明の名称】図形正誤判定装置、図形正誤判定方法、プログラム、及び、記録媒体
(51)【国際特許分類】
G06V 30/196 20220101AFI20230512BHJP
【FI】
G06K9/68 E
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2021182363
(22)【出願日】2021-11-09
(71)【出願人】
【識別番号】000232092
【氏名又は名称】NECソリューションイノベータ株式会社
(74)【代理人】
【識別番号】100115255
【弁理士】
【氏名又は名称】辻丸 光一郎
(74)【代理人】
【識別番号】100201732
【弁理士】
【氏名又は名称】松縄 正登
(74)【代理人】
【識別番号】100154081
【弁理士】
【氏名又は名称】伊佐治 創
(72)【発明者】
【氏名】細川 豊
【テーマコード(参考)】
5B064
【Fターム(参考)】
5B064AA01
5B064AB03
5B064AB12
5B064BA01
5B064DA27
(57)【要約】
【課題】 図形認識の精度を向上可能な図形正誤判定装置を提供する。
【解決手段】 本発明の図形正誤判定装置10において、図形画像取得部11は、設問に対し入力された図形画像を取得し、図形画像認識部12は、取得された前記図形画像を認識し、かつ、認識した一つ以上の認識図形と前記認識図形の確信度を算出して確信度リストを生成し、正解情報取得部13は、前記設問の正解情報を取得し、正誤判定部14は、前記認識図形を前記正解情報と照合して一致不一致情報を生成し、かつ前記確信度リスト及び前記一致不一致情報を基に、前記図形画像の正誤を判定して正誤情報を生成し、正誤情報出力部15は、前記正誤情報を出力する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
図形画像取得部、図形画認識部、正解情報取得部、正誤判定部、正誤情報出力部を含み、
前記図形画像取得部は、設問に対し入力された図形画像を取得し、
前記図形画像認識部は、取得された前記図形画像を認識し、かつ、認識した一つ以上の認識図形と前記認識図形の確信度を算出して確信度リストを生成し、
前記正解情報取得部は、前記設問の正解情報を取得し、
前記正誤判定部は、前記認識図形を前記正解情報と照合して一致不一致情報を生成し、かつ前記確信度リスト及び前記一致不一致情報を基に、前記図形画像の正誤を判定して正誤情報を生成し、
前記正誤情報出力部は、前記正誤情報を出力する、
図形正誤判定装置。
【請求項2】
前記正誤判定部は、下記の判断基準(1)、(2)及び(3)により、前記図形画像の正誤を判定して正誤情報を生成する、
請求項1記載の図形正誤判定装置。
(1)正解判定条件
下記(1a)及び(1b)のいずれかの条件を満たす場合に前記図形画像を正解と判定する。
(1a)前記確信度リストにおいて最も確信度が高い認識図形が、正解情報と一致。
(1b)前記正解情報と一致した前記認識画像の確信度が正解閾値以上。
(2)誤答判定基準
下記(2a)の条件を満たす場合に前記図形画像を誤答と判定する。
(2a)前記確信度リストにおいて、正解情報と一致した前記認識図形の確信度が正解閾値未満であり、かつ前記正解情報と不一致の前記認識図形の確信度が誤答閾値以上である。
(3)判定不能条件
下記(3a)の条件を満たす場合に前記図形画像を判定不能と判定する。
(3a)前記確信度リストにおいて、前記正解情報と一致する前記認識画像の確信度が前記正解閾値未満であり、かつ前記正解情報と不一致の前記認識図形の確信度が前記誤答閾値未満である。
【請求項3】
さらに、学習部を含み、
前記学習部は、出力された前記正誤情報の正解率を算出し、前記正解率に基づき、前記正誤判定部における前記正解閾値及び前記誤答閾値を調整する、
請求項2記載の図形正誤判定装置。
【請求項4】
前記図形画像認識部は、機械学習による学習済みモデルを含み、
前記学習済みモデルにより、前記図形画像を認識し、認識した一つ以上の認識図形と前記認識図形の確信度を算出する、
請求項1から3のいずれか一項に記載の図形正誤判定装置。
【請求項5】
図形画像取得工程、図形画認識工程、正解情報取得工程、正誤判定工程、正誤情報出力工程を含み、
前記図形画像取得工程は、設問に対し入力された図形画像を取得し、
前記図形画像認識工程は、取得された前記図形画像を認識し、かつ、認識した一つ以上の認識図形と前記認識図形の確信度を算出して確信度リストを生成し、
前記正解情報取得工程は、前記設問の正解情報を取得し、
前記正誤判定工程は、前記認識図形を前記正解情報と照合して一致不一致情報を生成し、かつ前記確信度リスト及び前記一致不一致情報を基に、前記図形画像の正誤を判定して正誤情報を生成し、
前記正誤情報出力工程は、前記正誤情報を出力する、
図形正誤判定方法。
【請求項6】
前記正誤判定工程は、下記の判断基準(1)、(2)及び(3)により、前記図形画像の正誤を判定して正誤情報を生成する、
請求項5記載の図形正誤判定方法。
(1)正解判定条件
下記(1a)及び(1b)のいずれかの条件を満たす場合に前記図形画像を正解と判定する。
(1a)前記確信度リストにおいて最も確信度が高い認識図形が、正解情報と一致。
(1b)前記正解情報と一致した前記認識画像の確信度が正解閾値以上。
(2)誤答判定基準
下記(2a)の条件を満たす場合に前記図形画像を誤答と判定する。
(2a)前記確信度リストにおいて、正解情報と一致した前記認識図形の確信度が正解閾値未満であり、かつ前記正解情報と不一致の前記認識図形の確信度が誤答閾値以上である。
(3)判定不能条件
下記(3a)の条件を満たす場合に前記図形画像を判定不能と判定する。
(3a)前記確信度リストにおいて、前記正解情報と一致する前記認識画像の確信度が前記正解閾値未満であり、かつ前記正解情報と不一致の前記認識図形の確信度が前記誤答閾値未満である。
【請求項7】
さらに、学習工程を含み、
前記学習工程は、出力された前記正誤情報の正解率を算出し、前記正解率に基づき、前記正誤判定工程における前記正解閾値及び前記誤答閾値を調整する、
請求項6記載の図形正誤判定方法。
【請求項8】
前記図形画像認識工程は、機械学習による学習済みモデルを含み、
前記学習済みモデルにより、前記図形画像を認識し、認識した一つ以上の認識図形と前記認識図形の確信度を算出する、
請求項5から7のいずれか一項に記載の図形正誤判定方法。
【請求項9】
コンピュータに、図形画像取得手順、図形画認識手順、正解情報取得手順、正誤判定手順、正誤情報出力手順を含む手順を実行させるためのプログラム;
前記図形画像取得手順は、設問に対し入力された図形画像を取得し、
前記図形画像認識手順は、取得された前記図形画像を認識し、かつ、認識した一つ以上の認識図形と前記認識図形の確信度を算出して確信度リストを生成し、
前記正解情報取得手順は、前記設問の正解情報を取得し、
前記正誤判定手順は、前記認識図形を前記正解情報と照合して一致不一致情報を生成し、かつ前記確信度リスト及び前記一致不一致情報を基に、前記図形画像の正誤を判定して正誤情報を生成し、
前記正誤情報出力手順は、前記正誤情報を出力する。
【請求項10】
前記正誤判定手順は、下記の判断基準(1)、(2)及び(3)により、前記図形画像の正誤を判定して正誤情報を生成する、
請求項9記載のプログラム。
(1)正解判定条件
下記(1a)及び(1b)のいずれかの条件を満たす場合に前記図形画像を正解と判定する。
(1a)前記確信度リストにおいて最も確信度が高い認識図形が、正解情報と一致。
(1b)前記正解情報と一致した前記認識画像の確信度が正解閾値以上。
(2)誤答判定基準
下記(2a)の条件を満たす場合に前記図形画像を誤答と判定する。
(2a)前記確信度リストにおいて、正解情報と一致した前記認識図形の確信度が正解閾値未満であり、かつ前記正解情報と不一致の前記認識図形の確信度が誤答閾値以上である。
(3)判定不能条件
下記(3a)の条件を満たす場合に前記図形画像を判定不能と判定する。
(3a)前記確信度リストにおいて、前記正解情報と一致する前記認識画像の確信度が前記正解閾値未満であり、かつ前記正解情報と不一致の前記認識図形の確信度が前記誤答閾値未満である。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、図形正誤判定装置、図形正誤判定方法、プログラム、及び、記録媒体に関する。
【背景技術】
【0002】
特許文献1には、機械学習を用いて手書きの文字を認識する技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、機械学習の技術進歩による文字認識の精度向上には限界がある。特に、クイズ、テスト、アンケート等に対する文字認識には、精度向上が強く求められている。この問題は、文字だけでなく、数字及び記号等を含む図形認識全般の問題でもある。
【0005】
そこで、本発明は、図形認識の精度を向上可能な図形正誤判定装置、図形正誤判定方法、プログラム、及び、記録媒体を提供することを目的とする。
【課題を解決するための手段】
【0006】
前記目的を達成するために、本発明の図形正誤判定装置は、
図形画像取得部、図形画認識部、正解情報取得部、正誤判定部、正誤情報出力部を含み、
前記図形画像取得部は、設問に対し入力された図形画像を取得し、
前記図形画像認識部は、取得された前記図形画像を認識し、かつ、認識した一つ以上の認識図形と前記認識図形の確信度を算出して確信度リストを生成し、
前記正解情報取得部は、前記設問の正解情報を取得し、
前記正誤判定部は、前記認識図形を前記正解情報と照合して一致不一致情報を生成し、かつ前記確信度リスト及び前記一致不一致情報を基に、前記図形画像の正誤を判定して正誤情報を生成し、
前記正誤情報出力部は、前記正誤情報を出力する、
装置である。
【0007】
本発明の図形正誤判定方法は、
図形画像取得工程、図形画認識工程、正解情報取得工程、正誤判定工程、正誤情報出力工程を含み、
前記図形画像取得工程は、設問に対し入力された図形画像を取得し、
前記図形画像認識工程は、取得された前記図形画像を認識し、かつ、認識した一つ以上の認識図形と前記認識図形の確信度を算出して確信度リストを生成し、
前記正解情報取得工程は、前記設問の正解情報を取得し、
前記正誤判定工程は、前記認識図形を前記正解情報と照合して一致不一致情報を生成し、かつ前記確信度リスト及び前記一致不一致情報を基に、前記図形画像の正誤を判定して正誤情報を生成し、
前記正誤情報出力工程は、前記正誤情報を出力する、
方法である。
【発明の効果】
【0008】
本発明によれば、手書き等の書く度に字体や字形が異なる入力形式で記入された図形に対する図形認識の精度を向上することができる。
【図面の簡単な説明】
【0009】
【
図1】
図1は、実施形態1の図形正誤判定装置の構成の一例を示すブロック図である。
【
図2】
図2は、実施形態1の図形正誤判定装置のハードウエア構成の一例を示すブロック図である。
【
図3】
図3は、実施形態1の図形正誤判定方法における処理の一例を示すフローチャートである。
【
図4】
図4(A)は、設問及びその設問に対して手書き入力された解答(図形画像)の一例を示す模式図であり、
図4(B)は、
図4(A)に示す図形画像から生成された確信度リストの一例を示す模式図である。
【
図5】
図5(A)は、設問及びその設問に対して手書き入力された解答(図形画像)の一例を示す模式図であり、
図5(B)は、
図5(A)に示す図形画像から生成された確信度リストの一例を示す模式図である。
【
図6】
図6(A)は、設問及びその設問に対して手書き入力された解答(図形画像)の一例を示す模式図であり、
図6(B)は、
図6(A)に示す図形画像から生成された確信度リストの一例を示す模式図である。
【
図7】
図7(A)は、設問及びその設問に対して手書き入力された解答(図形画像)の一例を示す模式図であり、
図7(B)は、
図7(A)に示す図形画像から生成された確信度リストの一例を示す模式図である。
【
図8】
図8(A)は、設問及びその設問に対して手書き入力された解答(図形画像)の一例を示す模式図であり、
図8(B)は、
図8(A)に示す図形画像から生成された確信度リストの一例を示す模式図である。
【発明を実施するための形態】
【0010】
本発明の図形正誤判定装置において、例えば、
前記正誤判定部は、下記の判断基準(1)、(2)及び(3)により、前記図形画像の正誤を判定して正誤情報を生成する、という態様であってもよい。
(1)正解判定条件
下記(1a)及び(1b)のいずれかの条件を満たす場合に前記図形画像を正解と判定する。
(1a)前記確信度リストにおいて最も確信度が高い認識図形が、正解情報と一致。
(1b)前記正解情報と一致した前記認識画像の確信度が正解閾値以上。
(2)誤答判定基準
下記(2a)の条件を満たす場合に前記図形画像を誤答と判定する。
(2a)前記確信度リストにおいて、正解情報と一致した前記認識図形の確信度が正解閾値未満であり、かつ前記正解情報と不一致の前記認識図形の確信度が誤答閾値以上である。
(3)判定不能条件
下記(3a)の条件を満たす場合に前記図形画像を判定不能と判定する。
(3a)前記確信度リストにおいて、前記正解情報と一致する前記認識画像の確信度が前記正解閾値未満であり、かつ前記正解情報と不一致の前記認識図形の確信度が前記誤答閾値未満である。
【0011】
本発明の図形正誤判定装置は、例えば、
さらに、学習部を含み、
前記学習部は、出力された前記正誤情報の正解率を算出し、前記正解率に基づき、前記正誤判定部における前記正解閾値及び前記誤答閾値を調整する、という態様であってもよい。
【0012】
本発明の図形正誤判定装置において、例えば、
前記図形画像認識部は、機械学習による学習済みモデルを含み、
前記学習済みモデルにより、前記図形画像を認識し、認識した一つ以上の認識図形と前記認識図形の確信度を算出する、という態様であってもよい。
【0013】
本発明の図形正誤判定方法において、例えば、
前記正誤判定工程は、下記の判断基準(1)、(2)及び(3)により、前記図形画像の正誤を判定して正誤情報を生成する、という態様であってもよい。
(1)正解判定条件
下記(1a)及び(1b)のいずれかの条件を満たす場合に前記図形画像を正解と判定する。
(1a)前記確信度リストにおいて最も確信度が高い認識図形が、正解情報と一致。
(1b)前記正解情報と一致した前記認識画像の確信度が正解閾値以上。
(2)誤答判定基準
下記(2a)の条件を満たす場合に前記図形画像を誤答と判定する。
(2a)前記確信度リストにおいて、正解情報と一致した前記認識図形の確信度が正解閾値未満であり、かつ前記正解情報と不一致の前記認識図形の確信度が誤答閾値以上である。
(3)判定不能条件
下記(3a)の条件を満たす場合に前記図形画像を判定不能と判定する。
(3a)前記確信度リストにおいて、前記正解情報と一致する前記認識画像の確信度が前記正解閾値未満であり、かつ前記正解情報と不一致の前記認識図形の確信度が前記誤答閾値未満である。
【0014】
本発明の図形正誤判定方法は、例えば、
さらに、学習工程を含み、
前記学習工程は、出力された前記正誤情報の正解率を算出し、前記正解率に基づき、前記正誤判定工程における前記正解閾値及び前記誤答閾値を調整する、という態様であってもよい。
【0015】
本発明の図形正誤判定方法において、例えば、
前記図形画像認識工程は、機械学習による学習済みモデルを含み、
前記学習済みモデルにより、前記図形画像を認識し、認識した一つ以上の認識図形と前記認識図形の確信度を算出する、という態様であってもよい。
【0016】
本発明のプログラムは、本発明の方法の各工程を、手順として、コンピュータに実行させるためのプログラムである。
【0017】
本発明の記録媒体は、本発明のプログラムを記録しているコンピュータ読み取り可能な記録媒体である。
【0018】
本発明の「図形画像」等における図形には、文字、数字、記号、用語、単語等が含まれる。
【0019】
本発明は、例えば、あらかじめ回答者に求める答え(選択肢を用いた解答又は回答を含む)が分かるもの、具体的には、アンケート、試験、クイズ、学習ドリル等の対象に対して適用可能である。さらに、本発明は、アンケート装置、テスト装置、クイズ装置等の装置、これらに対応する方法、及びプログラム等の一部として使用可能である。
【0020】
次に、本発明の実施形態について図を用いて説明する。本発明は、以下の実施形態には限定されない。以下の各図において、同一部分には、同一符号を付している。また、各実施形態の説明は、特に言及がない限り、互いの説明を援用でき、各実施形態の構成は、特に言及がない限り、組合せ可能である。
【0021】
[実施形態1]
図1は、本実施形態の図形正誤判定装置10の構成の一例を示すブロック図である。
図1に示すように、本装置10は、図形画像取得部11、図形画認識部12、正解情報取得部13、正誤判定部14、正誤情報出力部15を含む。また、本装置10は、任意の構成として、さらに、学習部16等を含んでもよい。前記各部は、例えば、内部バスにより相互に接続されている。
【0022】
本装置10は、例えば、前記各部を含む1つの装置でもよいし、前記各部が、通信回線網を介して接続可能な装置でもよい。また、本装置10は、前記通信回線網を介して、後述する外部装置と接続可能である。前記通信回線網は、特に制限されず、公知のネットワークを使用でき、例えば、有線でも無線でもよい。前記通信回線網は、例えば、インターネット回線、WWW(World Wide Web)、電話回線、LAN(Local Area Network)、SAN(Storage Area Network)、DTN(Delay Tolerant Networking)、LPWA(Low Power Wide Area)、L5G(ローカル5G)、等があげられる。無線通信としては、例えば、Wi-Fi(登録商標)、Bluetooth(登録商標)、ローカル5G、LPWA等が挙げられる。前記無線通信としては、各装置が直接通信する形態(Ad Hoc通信)、インフラストラクチャ(infrastructure通信)、アクセスポイントを介した間接通信等であってもよい。本装置10は、例えば、システムとしてサーバに組み込まれていてもよい。また、本装置10は、例えば、本発明のプログラムがインストールされたパーソナルコンピュータ(PC、例えば、デスクトップ型、ノート型)、スマートフォン、タブレット端末、ウエアラブル端末等であってもよい。さらに、本装置10の各部の全部又は一部が、クラウド上で実現されてもよい。具体的に、本装置10は、例えば、前記各部のうち少なくとも一つがサーバ(クラウド)上にあり、その他の前記各部が端末上にあるような、クラウドコンピューティングやエッジコンピューティング等の形態であってもよい。
【0023】
図2に、本装置10のハードウエア構成のブロック図を例示する。本装置10は、例えば、中央処理装置(CPU、GPU等)101、メモリ102、バス103、記憶装置104、入力装置105、出力装置106、及び通信デバイス107等を含んでもよい。なお、これらは例示であって、本装置10のハードウエア構成は、前記各部の処理を実行可能であれば、これに限定されない。また、本装置10に含まれる中央処理装置101等の数も
図2の例示に限定されるものではなく、例えば、複数の中央処理装置101が本装置10に含まれていてもよい。本装置10のハードウエア構成の各部は、それぞれのインタフェース(I/F)により、バス103を介して相互に接続されている。
【0024】
中央処理装置101は、本装置10の全体の制御を担う。本装置10において、中央処理装置101により、例えば、本発明のプログラムやその他のプログラムが実行され、また、各種情報の読み込みや書き込みが行われる。そして、中央処理装置101により、本装置10の各部の処理が実行され得る。
【0025】
バス103は、例えば、外部装置とも接続できる。前記外部装置は、例えば、外部記憶装置(外部データベース等)、外部入力装置、外部出力装置、等があげられる。本装置10は、例えば、バス103に接続された通信デバイス107により、外部ネットワーク(前記通信回線網)に接続でき、外部ネットワークを介して、他の装置と接続することもできる。
【0026】
メモリ102は、例えば、メインメモリ(主記憶装置)が挙げられる。中央処理装置101が処理を行う際には、例えば、後述する記憶装置104に記憶されている本発明のプログラム等の種々の動作プログラムを、メモリ102が読み込み、中央処理装置101は、メモリ102からデータを受け取って、プログラムを実行する。前記メインメモリは、例えば、RAM(ランダムアクセスメモリ)である。また、メモリ102は、例えば、ROM(読み出し専用メモリ)であってもよい。
【0027】
記憶装置104は、例えば、前記メインメモリ(主記憶装置)に対して、いわゆる補助記憶装置ともいう。前述のように、記憶装置104には、本発明のプログラムを含む動作プログラムが格納されている。記憶装置104は、例えば、記録媒体と、記録媒体に読み書きするドライブとの組合せであってもよい。前記記録媒体は、特に制限されず、例えば、内蔵型でも外付け型でもよく、HD(ハードディスク)、CD-ROM、CD-R、CD-RW、MO、DVD、フラッシュメモリー、メモリーカード等が挙げられる。記憶装置104は、例えば、記録媒体とドライブとが一体化されたハードディスクドライブ(HDD)、及びソリッドステートドライブ(SSD)であってもよい。
【0028】
本装置10において、メモリ102及び記憶装置104は、ログ情報、外部データベース(図示せず)や外部の装置から取得した情報、本装置10の各処理によって生じた情報、本装置10が各処理を実行する際に用いる情報等の種々の情報を記憶することも可能である。なお、少なくとも一部の情報は、例えば、メモリ102及び記憶装置104以外の外部サーバに記憶されていてもよいし、複数の端末にブロックチェーン技術等を用いて分散して記憶されていてもよい。
【0029】
本装置10は、例えば、さらに、入力装置105、及び出力装置106を含んでもよい。入力装置105は、例えば、文字、数字、画面上に表示された物の位置、画像、音等を入力する装置であり、具体的には、デジタイザ(タッチパネル等)、キーボード、マウス、スキャナ、撮像装置、マイク、センサ等が挙げられる。出力装置106は、例えば、表示装置(LEDディスプレイ、液晶ディスプレイ)、プリンター、スピーカー等が挙げられる。
【0030】
つぎに、本実施形態の図形正誤判定方法の一例を、
図3のフローチャートに基づき説明する。本実施形態の図形正誤判定方法は、例えば、
図1の図形正誤判定装置10を用いて、次のように実施する。なお、本実施形態の図形正誤判定方法は、
図1の図形正誤判定装置10の使用には限定されない。
【0031】
以下において、前記図形画像取得工程は、例えば、図形画像取得部11により実行でき、前記図形画像認識工程は、例えば、図形画像認識部12により実行でき、前記正解情報取得工程は、例えば、正解情報取得部13により実行でき、前記正誤判定工程は、例えば、正誤判定部14により実行でき、前記正誤情報出力工程は、例えば、正誤情報出力部15により実行でき、前記学習工程は、例えば、学習部16により実行できる。
【0032】
まず、図形画像取得部11により、設問に対し入力された図形画像を取得する(S11)。前記入力は、前記設問に対する「解答」又は「回答」である。前記設問に対する入力(記入)の形式は、例えば、手書き入力や視線入力等の記入の度に字体や字形が異なる入力形式である。前記設問は、例えば、記録用紙等の印刷媒体に印刷されたものであってもよいし、タッチディスプレイ等を有する端末上に表示されたものであってもよい。印刷媒体に印刷された設問である場合、図形画像取得部11は、例えば、前記印刷媒体に記入された図形を電子化したものを前記図形画像として取得してもよい。前記電子化の手法は、特に制限されず、スキャンでもよいし、カメラによる撮影でもよい。一方で、端末上に表示された設問である場合、図形画像取得部11は、例えば、前記端末に手書き等で入力された図形を前記図形画像として取得してもよい。前記端末は、例えば、本装置10でもよい。
【0033】
次に、図形画像認識部12により、取得された前記図形画像を認識し、かつ、認識した一つ以上の認識図形と前記認識図形の確信度を算出して確信度リストを生成する(S12)。前記確信度リストの一例については後述する。図形画像認識部12は、例えば、深層学習を含む機械学習を用いて、前記認識を行ってもよい。具体的に、図形画像認識部12は、例えば、機械学習による学習済みモデルを含んでもよい。そして、図形画像認識部12は、例えば、前記学習済みモデルにより、前記図形画像を認識し、認識した一つ以上の認識図形と前記認識図形の確信度を算出してもよい。前記学習済みモデルは、特に制限されない。前記学習済みモデルは、例えば、回答者(前記設問に対して図形を入力する者)の属性(例えば、年齢、性別、人種、国籍等)と筆跡とを対応付けて学習したモデルであってもよいし、前記回答者と前記回答者毎の筆跡とを対応付けて学習したモデルであってもよい。このように、前記認識に際して、前記回答者の属性や特定の個人に特化した情報を加味することで、図形画像認識部12による前記認識の精度がより向上する。
【0034】
次に、正解情報取得部13により、前記設問の正解情報を取得する(S13)。前記正解情報は、前記設問に対する正解を示す情報である。前記設問が選択肢のある設問(例えば、アンケート等)であり、前記選択肢が「1」、「2」、「3」及び「4」である場合は、例えば、前記選択肢である「1」、「2」、「3」及び「4」の少なくとも一つが前記正解となる。一方で、前記選択肢のない設問の場合は、例えば、その設問から導き出せるもの全て又は一部が前記正解となり得る。より具体的に、前記設問が2と2との和を問う設問であれば、前記正解は、「4」となる。このように、前記設問の正解情報が示す正解は、複数あってもよい。正解情報取得部13は、例えば、メモリ102及び記憶装置104に予め記憶されている前記正解情報を取得してもよいし、外部から入力された前記正解情報を取得してもよいし、外部の装置から前記正解情報を取得してもよい。
【0035】
次に、正誤判定部14により、前記認識図形を前記正解情報と照合して一致不一致情報を生成し、かつ前記確信度リスト及び前記一致不一致情報を基に、前記図形画像の正誤を判定して正誤情報を生成する(S14)。例えば、前述した、前記設問が選択肢のある設問の場合を例に挙げると、図形画像認識部12により、前記図形画像が「9」と認識された場合、前記選択肢に「9」がないため、正誤判定部14は、「不一致」を示す一致不一致情報を生成する。
【0036】
正誤判定部14による前記正誤情報の生成について、より具体的に説明する。正誤判定部14は、例えば、下記の判断基準(1)、(2)及び(3)により、前記図形画像の正誤を判定して正誤情報を生成してもよい。
【0037】
判断基準(1):正解判定条件
下記(1a)及び(1b)のいずれかの条件を満たす場合に前記図形画像を正解と判定する。
(1a)前記確信度リストにおいて最も確信度が高い認識図形が、正解情報と一致。
(1b)前記正解情報と一致した前記認識画像の確信度が正解閾値以上。
【0038】
判断基準(2):誤答判定基準
下記(2a)の条件を満たす場合に前記図形画像を誤答と判定する。
(2a)前記確信度リストにおいて、正解情報と一致した前記認識図形の確信度が正解閾値未満であり、かつ前記正解情報と不一致の前記認識図形の確信度が誤答閾値以上である。
【0039】
判断基準(3):判定不能条件
下記(3a)の条件を満たす場合に前記図形画像を判定不能と判定する。
(3a)前記確信度リストにおいて、前記正解情報と一致する前記認識画像の確信度が前記正解閾値未満であり、かつ前記正解情報と不一致の前記認識図形の確信度が前記誤答閾値未満である。
【0040】
前記正解閾値及び前記誤答閾値には、任意の確信度を設定可能である。前記正解閾値には、例えば、前記誤答閾値よりも小さい確信度が設定されていてもよい。具体的に、前記確信度が1~100までの数値で表されるものである場合、前記正解閾値が50未満の数値であり、前記誤答閾値が50以上の数値であってもよい。
【0041】
そして、正誤情報出力部15により、前記正誤情報を出力する(S15)。前記出力は、例えば、出力装置106を介して行われる。
【0042】
本装置10が、さらに、学習部16を含む場合は、例えば、前記工程S15の後に、学習部16により、出力された前記正誤情報の正解率を算出し、前記正解率に基づき、正誤判定部14における前記正解閾値及び前記誤答閾値を調整してもよい(S16)。なお、これに限られず、前記正解閾値及び前記誤答閾値は、例えば、ユーザが手動で調整可能である。
【0043】
前記工程S16は、任意の工程であって、実行されなくともよい。本実施形態の図形正誤判定方法は、例えば、前記工程15又は前記工程S16の後に、処理を終了する(END)。
【0044】
従来のOCR(Optical character recognition)技術では、深層学習を用いても、判断基準の線引きが困難なケースが多く存在する。具体的には、例えば、従来のOCR技術によって特定の文字(例えば、「4」)に認識された認識対象の文字が、人が見ると前記特定の文字と異なる文字(例えば、「9」)に見えるケースが存在する。また、OCR技術の運用状況によっても判断基準が異なり、運用状況毎に異なる文字が認識されることもある。これに対し、本実施形態によれば、例えば、前記確信度及び前記正解情報を用いることで、図形認識の精度を向上可能である。また、製品の形態が図形(例えば、丸、三角、四角等)で認識される場合は、製造ラインでの品質管理にも本実施形態に記載の発明を適用可能である。
【0045】
[実施形態2]
手書きの数字を認識する場合を例に挙げて、本発明をより具体的に説明する。なお、これらは例示であって、本発明は、これらに限定されるものではない。
【0046】
図4(A)は、設問及びその設問に対して手書き入力された解答(図形画像)の一例を示す模式図である。
図4(A)において、スマートフォンである本装置10のタッチディスプレイ上には、2と2との和を問う内容の設問及び前記設問する解答が手書きで入力された解答欄1が表示されている。本例において、本装置10には、前記設問に対応する正解情報として、予め「4」が設定されているものとする。この場合、図形画像取得部11は、解答欄1に入力された図形画像を取得する。次に、図形画像認識部12は、前記図形画像を認識し、確信度リストを生成する。本例における確信度リストの一例を
図4(B)に示す。この確信度リストにおいて、「認識した数字(認識図形)」の列は、図形画像認識部12が認識した認識図形を示し、「確信度(%)」の列は、それらの確信度を示す。本例において、確信度は、100%を上限として、確信度が高ければ高いほど認識図形が図形画像である確からしさが高いことを意味する。なお、前記確信度の態様は、本例に限定されるものではない。以下、本例では、前記正解閾値として確信度10%、前記誤答閾値として確信度85%が予め設定されているものとする。
【0047】
正誤判定部14による処理について
図4を例に挙げてより具体的に説明する。本例では、前述の通り、「4」が正解であるため、正誤判定部14は、
図4(B)の「一致・不一致」の列に示すように、認識図形「4」のみが前記正解情報と一致し、他の認識図形は前記正解情報と不一致であることを示す一致不一致情報を生成する。次に、正誤判定部14による正誤判定について説明する。本例では、
図4(B)に示す確信度リストにおいて認識図形「4」が最も確信度が高く、且つ前記正解情報と一致する。さらには、認識図形「4」の確信度(98%)が前記正解閾値(10%)以上である。したがって、認識図形「4」が前記判断基準(1)である正解判定条件の前記条件(1a)及び(1b)の双方を満たすため、正誤判定部14は、解答欄1に入力された前記図形画像を正解と判定し、前記正解を示す正誤情報を生成する。
【0048】
図5(A)は、設問及びその設問に対して手書き入力された解答(図形画像)の一例を示す模式図である。
図5(A)は、解答欄1に手書き入力された解答が
図4(A)に示す解答と異なる以外は、
図4(A)と同じである。本例において、本装置10には、前記設問に対応する正解情報として、予め「4」が設定されているものとする。この場合、前述と同様に、図形画像取得部11が解答欄1に入力された図形画像を取得し、図形画像認識部12が前記図形画像を認識して確信度リストを生成する。本例における確信度リストの一例を
図5(B)に示す。
図5(B)に示す確信度リストは、各認識図形に対する確信度が異なる以外は、
図4(B)に示す各確信度リストと同じ内容である。
【0049】
正誤判定部14による処理について
図5を例に挙げてより具体的に説明する。本例では、前述の通り、「4」が正解であるため、正誤判定部14は、
図5(B)の「一致・不一致」の列に示すように、認識図形「4」のみが前記正解情報と一致し、他の認識図形は前記正解情報と不一致であることを示す一致不一致情報を生成する。次に、正誤判定部14による正誤判定について説明する。本例では、
図5(B)に示す確信度リストにおいて認識図形「3」が最も確信度が高いが、前記正解情報と一致しない。また、前記正解情報と一致する認識図形「4」の確信度は、正解閾値以下である。したがって、本例では、前記判断基準(1)である正解判定条件の前記条件(1a)及び(1b)のいずれも満たさないため、正誤判定部14は、解答欄1に入力された前記図形画像を正解と判定しない。一方で、本例では、
図5(B)に示す確信度リストにおいて前記正解情報と一致する認識図形「4」の確信度(2%)が正解閾値(10%)未満であり、かつ前記正解情報と不一致の認識図形の確信度(例えば、確信度が最も高い認識図形「3」:98%)が誤答閾値(85%)以上である。したがって、本例では、前記判断基準(2)である誤答判定基準(2a)を満たすため、正誤判定部14は、解答欄1に入力された前記図形画像を誤答と判定し、前記誤答を示す正誤情報を生成する。
【0050】
図6(A)は、設問及びその設問に対して手書き入力された解答(図形画像)の一例を示す模式図である。
図6(A)は、解答欄1に手書き入力された解答が
図4(A)に示す解答と異なる以外は、
図4(A)と同じである。本例において、本装置10には、前記設問に対応する正解情報として、予め「4」が設定されているものとする。この場合、前述と同様に、図形画像取得部11が解答欄1に入力された図形画像を取得し、図形画像認識部12が前記図形画像を認識して確信度リストを生成する。本例における確信度リストの一例を
図6(B)に示す。
図6(B)に示す確信度リストは、各認識図形に対する確信度が異なる以外は、
図4(B)に示す各確信度リストと同じ内容である。
【0051】
正誤判定部14による処理について
図6を例に挙げてより具体的に説明する。本例では、前述の通り、「4」が正解であるため、正誤判定部14は、
図6(B)の「一致・不一致」の列に示すように、認識図形「4」のみが前記正解情報と一致し、他の認識図形は前記正解情報と不一致であることを示す一致不一致情報を生成する。次に、正誤判定部14による正誤判定について説明する。本例では、
図6(B)に示す確信度リストにおいて、前記正解情報と一致する認識図形「4」の確信度(9%)が正解閾値(10%)未満であるため、前記判断基準(1)である正解判定条件の前記条件(1b)を満たさない。しかし、認識図形「4」は、
図6(B)に示す確信度リスト内で最も確信度が高く且つ前記正解情報と一致するため、前記判断基準(1)である正解判定条件の前記条件(1a)を満たす。したがって、正誤判定部14は、解答欄1に入力された前記図形画像を正解と判定し、前記正解を示す正誤情報を生成する。
【0052】
図7(A)は、設問及びその設問に対して手書き入力された解答(図形画像)の一例を示す模式図である。
図7(A)は、解答欄1に手書き入力された解答が
図4(A)に示す解答と異なる以外は、
図4(A)と同じである。本例において、本装置10には、前記設問に対応する正解情報として、予め「4」が設定されているものとする。この場合、前述と同様に、図形画像取得部11が解答欄1に入力された図形画像を取得し、図形画像認識部12が前記図形画像を認識して確信度リストを生成する。本例における確信度リストの一例を
図7(B)に示す。
図7(B)に示す確信度リストは、各認識図形に対する確信度が異なる以外は、
図4(B)に示す各確信度リストと同じ内容である。
【0053】
正誤判定部14による処理について
図7を例に挙げてより具体的に説明する。本例では、前述の通り、「4」が正解であるため、正誤判定部14は、
図7(B)の「一致・不一致」の列に示すように、認識図形「4」のみが前記正解情報と一致し、他の認識図形は前記正解情報と不一致であることを示す一致不一致情報を生成する。次に、正誤判定部14による正誤判定について説明する。本例では、
図7(B)に示す確信度リストにおいて、最も確信度が高い認識図形は、前記正解情報と一致しない認識図形「5」であるため、前記判断基準(1)である正解判定条件の前記条件(1a)を満たさない。しかし、前記正解情報と一致する認識図形「4」の確信度(50%)が正解閾値(10%)以上であるため、前記判断基準(1)である正解判定条件の前記条件(1b)を満たす。したがって、正誤判定部14は、解答欄1に入力された前記図形画像を正解と判定し、前記正解を示す正誤情報を生成する。
【0054】
図8(A)は、設問及びその設問に対して手書き入力された解答(図形画像)の一例を示す模式図である。
図8(A)は、解答欄1に手書き入力された解答が
図4(A)に示す解答と異なる以外は、
図4(A)と同じである。本例において、本装置10には、前記設問に対応する正解情報として、予め「4」が設定されているものとする。この場合、前述と同様に、図形画像取得部11が解答欄1に入力された図形画像を取得し、図形画像認識部12が前記図形画像を認識して確信度リストを生成する。本例における確信度リストの一例を
図8(B)に示す。
図8(B)に示す確信度リストは、各認識図形に対する確信度が異なる以外は、
図4(B)に示す各確信度リストと同じ内容である。
【0055】
正誤判定部14による処理について
図8を例に挙げてより具体的に説明する。本例では、前述の通り、「4」が正解であるため、正誤判定部14は、
図8(B)の「一致・不一致」の列に示すように、認識図形「4」のみが前記正解情報と一致し、他の認識図形は前記正解情報と不一致であることを示す一致不一致情報を生成する。次に、正誤判定部14による正誤判定について説明する。本例では、
図8(B)に示す確信度リストにおいて、最も確信度が高い認識図形は、前記正解情報と一致しない認識図形「3」であるため、前記判断基準(1)である正解判定条件の前記条件(1a)を満たさない。また、前記正解情報と一致する認識図形「4」の確信度(1%)が正解閾値(10%)未満であるため、前記判断基準(1)である正解判定条件の前記条件(1b)も満たさない。さらに、前記正解情報と一致する認識図形「4」の確信度(1%)が正解閾値(10%)未満であり、かつ前記正解情報と不一致の認識図形の確信度(例えば、確信度が最も高い認識図形「3」:9%)が誤答閾値(85%)未満であるため、前記判断基準(2)である誤答判定基準(2a)も満たさない。一方で、前記正解情報と一致する認識図形「4」の確信度(2%)が正解閾値(10%)未満であり、かつ前記正解情報と不一致の認識図形の確信度(例えば、確信度が最も高い認識図形「3」:9%)が誤答閾値(85%)未満であるため、前記判断基準(3)である判定不能条件の前記条件(3a)を満たす。したがって、正誤判定部14は、解答欄1に入力された前記図形画像を判定不能と判定する。本例のように、判定不能と判定された場合は、例えば、誤答を示す正誤情報を生成してもよいし、判定不能を示す正誤情報を生成してもよい。また、判定不能と判定された場合、正誤判定部14は、例えば、ユーザの目視による前記図形画像の正誤の判定結果を取得して、正誤情報を生成してもよい。
【0056】
[実施形態3]
本実施形態のプログラムは、本発明の方法の各工程を、手順として、コンピュータに実行させるためのプログラムである。本発明において、「手順」は、「処理」と読み替えてもよい。また、本実施形態のプログラムは、例えば、コンピュータ読み取り可能な記録媒体に記録されていてもよい。前記記録媒体は、例えば、非一時的なコンピュータ可読記録媒体(non-transitory computer-readable storage medium)である。前記記録媒体としては、特に限定されず、例えば、読み出し専用メモリ(ROM)、ハードディスク(HD)、光ディスク等が挙げられる。
【0057】
以上、実施形態を参照して本発明を説明したが、本発明は、上記実施形態に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解しうる様々な変更をできる。
【0058】
<付記>
上記の実施形態の一部または全部は、以下の付記のように記載されうるが、以下には限られない。
(付記1)
図形画像取得部、図形画認識部、正解情報取得部、正誤判定部、正誤情報出力部を含み、
前記図形画像取得部は、設問に対し入力された図形画像を取得し、
前記図形画像認識部は、取得された前記図形画像を認識し、かつ、認識した一つ以上の認識図形と前記認識図形の確信度を算出して確信度リストを生成し、
前記正解情報取得部は、前記設問の正解情報を取得し、
前記正誤判定部は、前記認識図形を前記正解情報と照合して一致不一致情報を生成し、かつ前記確信度リスト及び前記一致不一致情報を基に、前記図形画像の正誤を判定して正誤情報を生成し、
前記正誤情報出力部は、前記正誤情報を出力する、
図形正誤判定装置。
(付記2)
前記正誤判定部は、下記の判断基準(1)、(2)及び(3)により、前記図形画像の正誤を判定して正誤情報を生成する、
付記1記載の図形正誤判定装置。
(1)正解判定条件
下記(1a)及び(1b)のいずれかの条件を満たす場合に前記図形画像を正解と判定する。
(1a)前記確信度リストにおいて最も確信度が高い認識図形が、正解情報と一致。
(1b)前記正解情報と一致した前記認識画像の確信度が正解閾値以上。
(2)誤答判定基準
下記(2a)の条件を満たす場合に前記図形画像を誤答と判定する。
(2a)前記確信度リストにおいて、正解情報と一致した前記認識図形の確信度が正解閾値未満であり、かつ前記正解情報と不一致の前記認識図形の確信度が誤答閾値以上である。
(3)判定不能条件
下記(3a)の条件を満たす場合に前記図形画像を判定不能と判定する。
(3a)前記確信度リストにおいて、前記正解情報と一致する前記認識画像の確信度が前記正解閾値未満であり、かつ前記正解情報と不一致の前記認識図形の確信度が前記誤答閾値未満である。
(付記3)
さらに、学習部を含み、
前記学習部は、出力された前記正誤情報の正解率を算出し、前記正解率に基づき、前記正誤判定部における前記正解閾値及び前記誤答閾値を調整する、
付記2記載の図形正誤判定装置。
(付記4)
前記図形画像認識部は、機械学習による学習済みモデルを含み、
前記学習済みモデルにより、前記図形画像を認識し、認識した一つ以上の認識図形と前記認識図形の確信度を算出する、
付記1から3のいずれかに記載の図形正誤判定装置。
(付記5)
図形画像取得工程、図形画認識工程、正解情報取得工程、正誤判定工程、正誤情報出力工程を含み、
前記図形画像取得工程は、設問に対し入力された図形画像を取得し、
前記図形画像認識工程は、取得された前記図形画像を認識し、かつ、認識した一つ以上の認識図形と前記認識図形の確信度を算出して確信度リストを生成し、
前記正解情報取得工程は、前記設問の正解情報を取得し、
前記正誤判定工程は、前記認識図形を前記正解情報と照合して一致不一致情報を生成し、かつ前記確信度リスト及び前記一致不一致情報を基に、前記図形画像の正誤を判定して正誤情報を生成し、
前記正誤情報出力工程は、前記正誤情報を出力する、
図形正誤判定方法。
(付記6)
前記正誤判定工程は、下記の判断基準(1)、(2)及び(3)により、前記図形画像の正誤を判定して正誤情報を生成する、
付記5記載の図形正誤判定方法。
(1)正解判定条件
下記(1a)及び(1b)のいずれかの条件を満たす場合に前記図形画像を正解と判定する。
(1a)前記確信度リストにおいて最も確信度が高い認識図形が、正解情報と一致。
(1b)前記正解情報と一致した前記認識画像の確信度が正解閾値以上。
(2)誤答判定基準
下記(2a)の条件を満たす場合に前記図形画像を誤答と判定する。
(2a)前記確信度リストにおいて、正解情報と一致した前記認識図形の確信度が正解閾値未満であり、かつ前記正解情報と不一致の前記認識図形の確信度が誤答閾値以上である。
(3)判定不能条件
下記(3a)の条件を満たす場合に前記図形画像を判定不能と判定する。
(3a)前記確信度リストにおいて、前記正解情報と一致する前記認識画像の確信度が前記正解閾値未満であり、かつ前記正解情報と不一致の前記認識図形の確信度が前記誤答閾値未満である。
(付記7)
さらに、学習工程を含み、
前記学習工程は、出力された前記正誤情報の正解率を算出し、前記正解率に基づき、前記正誤判定工程における前記正解閾値及び前記誤答閾値を調整する、
付記6記載の図形正誤判定方法。
(付記8)
前記図形画像認識工程は、機械学習による学習済みモデルを含み、
前記学習済みモデルにより、前記図形画像を認識し、認識した一つ以上の認識図形と前記認識図形の確信度を算出する、
付記5から7のいずれかに記載の図形正誤判定方法。
(付記9)
コンピュータに、図形画像取得手順、図形画認識手順、正解情報取得手順、正誤判定手順、正誤情報出力手順を含む手順を実行させるためのプログラム;
前記図形画像取得手順は、設問に対し入力された図形画像を取得し、
前記図形画像認識手順は、取得された前記図形画像を認識し、かつ、認識した一つ以上の認識図形と前記認識図形の確信度を算出して確信度リストを生成し、
前記正解情報取得手順は、前記設問の正解情報を取得し、
前記正誤判定手順は、前記認識図形を前記正解情報と照合して一致不一致情報を生成し、かつ前記確信度リスト及び前記一致不一致情報を基に、前記図形画像の正誤を判定して正誤情報を生成し、
前記正誤情報出力手順は、前記正誤情報を出力する。
(付記10)
前記正誤判定手順は、下記の判断基準(1)、(2)及び(3)により、前記図形画像の正誤を判定して正誤情報を生成する、
付記9記載のプログラム。
(1)正解判定条件
下記(1a)及び(1b)のいずれかの条件を満たす場合に前記図形画像を正解と判定する。
(1a)前記確信度リストにおいて最も確信度が高い認識図形が、正解情報と一致。
(1b)前記正解情報と一致した前記認識画像の確信度が正解閾値以上。
(2)誤答判定基準
下記(2a)の条件を満たす場合に前記図形画像を誤答と判定する。
(2a)前記確信度リストにおいて、正解情報と一致した前記認識図形の確信度が正解閾値未満であり、かつ前記正解情報と不一致の前記認識図形の確信度が誤答閾値以上である。
(3)判定不能条件
下記(3a)の条件を満たす場合に前記図形画像を判定不能と判定する。
(3a)前記確信度リストにおいて、前記正解情報と一致する前記認識画像の確信度が前記正解閾値未満であり、かつ前記正解情報と不一致の前記認識図形の確信度が前記誤答閾値未満である。
(付記11)
さらに、学習手順を含み、
前記学習手順は、出力された前記正誤情報の正解率を算出し、前記正解率に基づき、前記正誤判定手順における前記正解閾値及び前記誤答閾値を調整する、
付記10記載のプログラム。
(付記12)
前記図形画像認識手順は、機械学習による学習済みモデルを含み、
前記学習済みモデルにより、前記図形画像を認識し、認識した一つ以上の認識図形と前記認識図形の確信度を算出する、
付記9から11のいずれかに記載のプログラム。
(付記13)
付記9から12のいずれかに記載のプログラムを記録しているコンピュータ読み取り可能な記録媒体。
【産業上の利用可能性】
【0059】
本発明によれば、手書き等の書く度に字体や字形が異なる入力形式で記入された図形に対する図形認識の精度を向上可能である。このため、本発明は、例えば、あらかじめ回答者に求める答えが分かっているものに対して入力された図形を認識する場合に特に有用である。
【符号の説明】
【0060】
1 解答欄
10 図形正誤判定装置
11 図形画像取得部
12 図形画像認識部
13 正解情報取得部
14 正誤判定部
15 正誤情報出力部
16 学習部
101 中央処理装置
102 メモリ
103 バス
104 記憶装置
105 入力装置
106 出力装置
107 通信デバイス