特表2017-531262(P2017-531262A)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ アイフライテック カンパニー,リミテッドの特許一覧

特表2017-531262記述式問題のための知的採点方法およびシステム
<>
  • 特表2017531262-記述式問題のための知的採点方法およびシステム 図000008
  • 特表2017531262-記述式問題のための知的採点方法およびシステム 図000009
  • 特表2017531262-記述式問題のための知的採点方法およびシステム 図000010
  • 特表2017531262-記述式問題のための知的採点方法およびシステム 図000011
  • 特表2017531262-記述式問題のための知的採点方法およびシステム 図000012
  • 特表2017531262-記述式問題のための知的採点方法およびシステム 図000013
  • 特表2017531262-記述式問題のための知的採点方法およびシステム 図000014
  • 特表2017531262-記述式問題のための知的採点方法およびシステム 図000015
  • 特表2017531262-記述式問題のための知的採点方法およびシステム 図000016
  • 特表2017531262-記述式問題のための知的採点方法およびシステム 図000017
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】特表2017-531262(P2017-531262A)
(43)【公表日】2017年10月19日
(54)【発明の名称】記述式問題のための知的採点方法およびシステム
(51)【国際特許分類】
   G06K 9/62 20060101AFI20170922BHJP
   G06K 9/34 20060101ALI20170922BHJP
   G06F 17/27 20060101ALI20170922BHJP
   G09B 19/00 20060101ALN20170922BHJP
【FI】
   G06K9/62 620B
   G06K9/34
   G06F17/27 615
   G09B19/00 H
【審査請求】有
【予備審査請求】未請求
【全頁数】30
(21)【出願番号】特願2017-515834(P2017-515834)
(86)(22)【出願日】2015年8月11日
(85)【翻訳文提出日】2017年5月15日
(86)【国際出願番号】CN2015086585
(87)【国際公開番号】WO2016041423
(87)【国際公開日】20160324
(31)【優先権主張番号】201410472818.3
(32)【優先日】2014年9月16日
(33)【優先権主張国】CN
(81)【指定国】 AP(BW,GH,GM,KE,LR,LS,MW,MZ,NA,RW,SD,SL,ST,SZ,TZ,UG,ZM,ZW),EA(AM,AZ,BY,KG,KZ,RU,TJ,TM),EP(AL,AT,BE,BG,CH,CY,CZ,DE,DK,EE,ES,FI,FR,GB,GR,HR,HU,IE,IS,IT,LT,LU,LV,MC,MK,MT,NL,NO,PL,PT,RO,RS,SE,SI,SK,SM,TR),OA(BF,BJ,CF,CG,CI,CM,GA,GN,GQ,GW,KM,ML,MR,NE,SN,TD,TG),AE,AG,AL,AM,AO,AT,AU,AZ,BA,BB,BG,BH,BN,BR,BW,BY,BZ,CA,CH,CL,CN,CO,CR,CU,CZ,DE,DK,DM,DO,DZ,EC,EE,EG,ES,FI,GB,GD,GE,GH,GM,GT,HN,HR,HU,ID,IL,IN,IR,IS,JP,KE,KG,KN,KP,KR,KZ,LA,LC,LK,LR,LS,LU,LY,MA,MD,ME,MG,MK,MN,MW,MX,MY,MZ,NA,NG,NI,NO,NZ,OM,PA,PE,PG,PH,PL,PT,QA,RO,RS,RU,RW,SA,SC,SD,SE,SG,SK,SL,SM,ST,SV,SY,TH,TJ,TM,TN,TR,TT,TZ,UA,UG,US
(71)【出願人】
【識別番号】517092341
【氏名又は名称】アイフライテック カンパニー,リミテッド
【氏名又は名称原語表記】IFLYTEK CO., LTD.
(74)【代理人】
【識別番号】100097320
【弁理士】
【氏名又は名称】宮川 貞二
(74)【代理人】
【識別番号】100155192
【弁理士】
【氏名又は名称】金子 美代子
(74)【代理人】
【識別番号】100131820
【弁理士】
【氏名又は名称】金井 俊幸
(74)【代理人】
【識別番号】100100398
【弁理士】
【氏名又は名称】柴田 茂夫
(72)【発明者】
【氏名】フー,ユーロン
(72)【発明者】
【氏名】ヂャン,インティエン
(72)【発明者】
【氏名】ヂュ,ブォ
(72)【発明者】
【氏名】ウェイ,スー
(72)【発明者】
【氏名】フー,グオピン
(72)【発明者】
【氏名】フー,ユー
(72)【発明者】
【氏名】リュウ,チンフォン
【テーマコード(参考)】
5B029
5B064
5B091
【Fターム(参考)】
5B029AA01
5B029BB02
5B029CC21
5B029CC23
5B029CC27
5B029EE08
5B064AA01
5B064AA10
5B064AB03
5B064BA01
5B064CA08
5B064EA18
5B064EA19
5B064EA36
5B091CB09
5B091CC05
5B091EA24
(57)【要約】
本発明は、記述式問題のための知的採点方法およびシステムを開示する。当該方法は、記述式問題の解答の画像を取得するステップと、前記解答の画像を切り分けて、同定すべき解答の文字列に対する1つまたは複数の切り分け結果を取得するステップと、標準解答の文字数と同じ文字数の切り分け結果があるか否かを判断するステップと、標準解答の文字数と同じ文字数の切り分け結果がなければ、解答が間違っていると特定するステップと、標準解答の文字数と同じ文字数の切り分け結果があれば、前記標準解答の文字数と同じ文字数の切り分け結果の同一性信頼度を算出し、および/または、前記標準解答の文字数と同じ文字数の切り分け結果における各キャラクタの同一性信頼度を算出するステップと、算出された同一性信頼度に基づいて解答が正しいか否かを特定するステップとを含む。本発明によれば、記述式問題の自動採点が実現可能であり、人的資源の消耗が軽減され、採点効率および正確性が向上する。
【選択図】図1
【特許請求の範囲】
【請求項1】
記述式問題のための知的採点方法であって、
記述式問題の解答の画像を取得するステップと、
前記解答の画像を切り分けて、同定すべき解答の文字列に対する1つまたは複数の切り分け結果を取得するステップと、
標準解答の文字数と同じ文字数の切り分け結果があるか否かを判断するステップと、
標準解答の文字数と同じ文字数の切り分け結果がなければ、解答が間違っていると特定するステップと、
標準解答の文字数と同じ文字数の切り分け結果があれば、前記標準解答の文字数と同じ文字数の切り分け結果の同一性信頼度を算出し、および/または、前記標準解答の文字数と同じ文字数の切り分け結果における各キャラクタの同一性信頼度を算出するステップと、
算出された同一性信頼度に基づいて解答が正しいか否かを特定するステップと、を含むことを特徴とする方法。
【請求項2】
前記記述式問題の解答の画像を取得するステップは、
解答カードの画像を取得するステップと、
解答カードのレイアウト情報に基づいて、前記解答カードの画像から対象解答領域を分割して抽出するステップと、
前記対象解答領域から記述式問題の解答の画像を抽出するステップと、を含むことを特徴とする、
請求項1に記載の方法。
【請求項3】
前記解答カードの画像を取得するステップは、
光学式マーク読取装置(OMR)、高速撮影装置あるいは移動端末機器を用いて解答カードの画像を取得するステップを含むことを特徴とする、
請求項2に記載の方法。
【請求項4】
前記解答の画像を切り分けて、同定すべき解答の文字列に対する1つまたは複数の切り分け結果を取得するステップは、
前記解答の画像を細かく切り分けて、複数の細かく切り分けられたサブブロックを取得するステップと、
前記細かく切り分けられたサブブロックを統合して、統合信頼度を算出するステップと、
前記信頼度に基づいて統合結果を特定し、同定すべき解答の文字列に対する1つまたは複数の切り分け結果を取得するステップと、を含むことを特徴とする、
請求項1に記載の方法。
【請求項5】
前記統合信頼度を算出するステップは、
統合により得られたキャラクタからキャラクタ特徴を抽出するステップと、
予め訓練して得られた規則統計モデルと前記キャラクタ特徴とを用いて当該統合の信頼度を算出するステップと、を含むことを特徴とする、
請求項4に記載の方法。
【請求項6】
前記標準解答の文字数と同じ文字数の切り分け結果の同一性信頼度を算出するステップは、
前記標準解答の文字数と同じ文字数の切り分け結果を前記標準解答のテキスト文字列に揃えるステップと、
全キャラクタセットの音響モデルおよび汎用の言語モデルに基づいて、前記標準解答の文字数と同じ文字数の切り分け結果に対して手書き復号化および同定を行って各同定結果の尤度スコアを取得するステップと、
同定結果から、復号パスが標準解答に一致するパスの尤度スコアを選択するステップと、
前記パスの事後スコアを算出し、前記事後スコアを前記標準解答の文字数と同じ文字数の切り分け結果の同一性信頼度とするステップと、を含み、
算出された同一性信頼度に基づいて解答が正しいか否かを特定するステップは、
標準解答の文字数と同じ文字数の切り分け結果のうち、何れかの切り分け結果の同一性信頼度が第1信頼度閾値よりも大きければ、解答が正しいと特定し、そうでなければ、解答が間違っていると特定するステップを含むことを特徴とする、
請求項1から請求項5の何れか一項に記載の方法。
【請求項7】
前記標準解答の文字数と同じ文字数の切り分け結果における各キャラクタの同一性信頼度を算出するステップは、
前記標準解答の文字数と同じ文字数の切り分け結果を前記標準解答のテキスト文字列に揃えるステップと、
全キャラクタセットの音響モデルに基づいて、前記標準解答の文字数と同じ文字数の切り分け結果における各キャラクタの同定結果の尤度スコアを算出するステップと、
前記同定結果のうちの標準解答に一致するキャラクタの同定結果の尤度スコアを選択するステップと、
選択された同定結果の事後スコアを算出し、前記事後スコアを前記キャラクタの同一性信頼度とするステップと、を含み、
算出された同一性信頼度に基づいて解答が正しいか否かを特定するステップは、
標準解答の文字数と同じ文字数の切り分け結果のうち、そのいずれのキャラクタの同一性信頼度も第2信頼度閾値より大きい切り分け結果が存在すれば、解答が正しいと特定し、そうでなければ、解答が間違っていると特定するステップを含むことを特徴とする、
請求項1から請求項5の何れか一項に記載の方法。
【請求項8】
前記標準解答の文字数と同じ文字数の切り分け結果における各キャラクタの同一性信頼度を算出するステップは、
前記標準解答の文字数と同じ文字数の切り分け結果を前記標準解答のテキスト文字列に揃えるステップと、
全キャラクタセットの音響モデルおよび汎用の言語モデルに基づいて、前記標準解答の文字数と同じ文字数の切り分け結果に対して手書き復号化および同定を行って各同定結果の尤度スコアを取得するステップと、
各同定結果の事後確率を算出し、各同定結果の事後確率に基づいて、前記切り分け結果におけるキャラクタごとに、各同定結果において当該キャラクタの同定結果と標準解答とが一致する事後確率を累積し、当該事後確率を当該キャラクタの信頼度とするステップと、を含み、
算出された同一性信頼度に基づいて解答が正しいか否かを特定するステップは、
標準解答の文字数と同じ文字数の切り分け結果のうち、そのいずれのキャラクタの同一性信頼度も第3信頼度閾値より大きい切り分け結果が存在すれば、解答が正しいと特定し、そうでなければ、解答が間違っていると特定するステップを含むことを特徴とする、
請求項1から請求項5の何れか一項に記載の方法。
【請求項9】
記述式問題のための知的採点システムであって、
画像取得モジュールと、切分モジュールと、第1判断モジュールと、算出モジュールと、第2判断モジュールと、出力モジュールと、を備え、
前記画像取得モジュールは、記述式問題の解答の画像を取得し、
前記切分モジュールは、前記画像取得モジュールによって取得された解答の画像を切り分けて、同定すべき解答の文字列に対する1つまたは複数の切り分け結果を取得し、
前記第1判断モジュールは、前記切分モジュールによって取得された切り分け結果のうち、標準解答の文字数と同じ文字数の切り分け結果があるか否かを判断し、標準解答の文字数と同じ文字数の切り分け結果がないと判断した場合、解答が間違っている旨の指示情報を前記出力モジュールが出力するようトリガし、そうではない場合、前記算出モジュールが同一性信頼度を算出するようトリガし、
前記算出モジュールは、第1算出モジュール、および/または、第2算出モジュールを備え、前記第1算出モジュールは、前記標準解答の文字数と同じ文字数の切り分け結果の同一性信頼度を算出し、前記第2算出モジュールは、前記標準解答の文字数と同じ文字数の切り分け結果における各キャラクタの同一性信頼度を算出し、
前記第2判断モジュールは、前記算出モジュールによって算出された同一性信頼度に基づいて解答が正しいか否かを特定し、解答が正しいと判断した場合、解答が正しい旨の指示情報を前記出力モジュールが出力するようトリガし、解答が間違っていると判断した場合、解答が間違っている旨の指示情報を前記出力モジュールが出力するようトリガすることを特徴とするシステム。
【請求項10】
前記画像取得モジュールは、
解答カードの画像を取得するための画像取得手段と、
解答カードのレイアウト情報に基づいて、前記解答カードの画像から対象解答領域を分割して抽出するための解答領域抽出手段と、
前記対象解答領域から記述式問題の解答の画像を抽出するための解答内容抽出手段と、を備えることを特徴とする、
請求項9に記載のシステム。
【請求項11】
前記画像取得手段は、光学式マーク読取装置(OMR)、高速撮影装置、または移動端末機器であることを特徴とする、
請求項10に記載のシステム。
【請求項12】
前記切分モジュールは、
前記解答の画像を細かく切り分けて、複数の細かく切り分けられたサブブロックを取得するための切分手段と、
前記細かく切り分けられたサブブロックを統合して、統合信頼度を算出するための信頼度算出手段と、
前記信頼度に基づいて統合結果を特定し、同定すべき解答の文字列に対する1つまたは複数の切り分け結果を取得するための統合結果特定手段と、を備えることを特徴とする、
請求項9に記載のシステム。
【請求項13】
前記信頼度算出手段は、
前記細かく切り分けられたサブブロックを統合するための統合サブ手段と、
統合により得られたキャラクタからキャラクタ特徴を抽出するための抽出サブ手段と、
予め訓練して得られた規則統計モデルと前記キャラクタ特徴とを用いて当該統合の信頼度を算出するための算出サブ手段と、を備えることを特徴とする、
請求項12に記載のシステム。
【請求項14】
前記第1算出モジュールは、
前記標準解答の文字数と同じ文字数の切り分け結果を前記標準解答のテキスト文字列に揃えるためのアラインメント手段と、
全キャラクタセットの音響モデルおよび汎用の言語モデルに基づいて、前記標準解答の文字数と同じ文字数の切り分け結果に対して手書き復号化および同定を行って各同定結果の尤度スコアを取得するための第1同定手段と、
同定結果から、復号パスが標準解答に一致するパスの尤度スコアを選択するための第1選択手段と、
前記パスの事後スコアを算出し、前記事後スコアを前記切り分け結果の同一性信頼度とするための第1算出手段と、を備え、
前記第2判断モジュールは、標準解答の文字数と同じ文字数の切り分け結果のうち、何れかの切り分け結果の同一性信頼度が第1信頼度閾値よりも大きい場合、解答が正しいと判断し、そうではない場合、解答が間違っていると判断することを特徴とする、
請求項9から請求項13の何れか一項に記載のシステム。
【請求項15】
前記第2算出モジュールは、
前記標準解答の文字数と同じ文字数の切り分け結果を前記標準解答のテキスト文字列に揃えるためのアラインメント手段と、
全キャラクタセットの音響モデルに基づいて、前記標準解答の文字数と同じ文字数の切り分け結果における各キャラクタの同定結果の尤度スコアを算出するための第2同定手段と、
前記同定結果のうちの標準解答に一致するキャラクタの同定結果の尤度スコアを選択するための第2選択手段と、
選択された同定結果の事後スコアを算出し、前記事後スコアを前記キャラクタの同一性信頼度とするための第2算出手段と、を備え、
前記第2判断モジュールは、標準解答の文字数と同じ文字数の切り分け結果のうち、そのいずれのキャラクタの同一性信頼度も第2信頼度閾値より大きい切り分け結果が存在する場合、解答が正しいと判断し、そうではない場合、解答が間違っていると判断することを特徴とする、
請求項9から請求項13の何れか一項に記載のシステム。
【請求項16】
前記第2算出モジュールは、
前記標準解答の文字数と同じ文字数の切り分け結果を前記標準解答のテキスト文字列に揃えるためのアラインメント手段と、
全キャラクタセットの音響モデルおよび汎用の言語モデルに基づいて、前記標準解答の文字数と同じ文字数の切り分け結果に対して手書き復号化および同定を行って各同定結果の尤度スコアを取得するための第1同定手段と、
各同定結果の事後確率を算出し、各同定結果の事後確率に基づいて、前記標準解答の文字数と同じ文字数の切り分け結果におけるキャラクタごとに、各同定結果において当該キャラクタの同定結果と標準解答とが一致する事後確率を累積し、当該事後確率を当該キャラクタの信頼度とするための第3算出手段と、を備え、
前記第2判断モジュールは、標準解答の文字数と同じ文字数の切り分け結果のうち、そのいずれのキャラクタの同一性信頼度も第3信頼度閾値より大きい切り分け結果が存在する場合、解答が正しいと判断し、そうではない場合、解答が間違っていると判断することを特徴とする、
請求項9から請求項13の何れか一項に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理技術分野に関し、具体的に、記述式問題(文字を記入する問題、TEXT OBJECTIVE QUESTION)のための知的採点方法およびシステムに関する。
【背景技術】
【0002】
コンピュータ技術および教育情報化の継続的な発展とともに、コンピュータと人工知能技術は、徐々に日常的な教育活動の各側面に応用されつつある。例えば、教育補助、教育評価等の実際の応用場面に活用されている。中国内の現在の基礎教育、生徒の学習状況に対する主な考察形式として、各タイプの試験やテストがある。このような状況において、教師が宿題および解答用紙をチェックするには、大変な手間がかかる。その事実を受け止め、大中規模あるいは重要性の高い試験やテストにおいて、各種の自動採点システムが既に普及し採用されてきたため、教師による採点の仕事量をある程度低減させることができる。
【0003】
しかし、従来の自動採点システムにおいて、完全にコンピュータによって採点される部分は、ほとんどが塗り潰しのような客観式問題(例えば、選択式問題)に対するものであり、書き込み等の記述式問題に対する採点については、いまだ大勢の教師たちを集めて作業させざるを得ないどころか、大規模試験の採点前に採点を行う教師を集中訓練し、テストする必要がある。そのため、従来の自動採点システムの人的資源の消耗は相変わらず激しい。さらに、採点時に、異なる教師の傾向、気分、心理状態等の主観的な要素により、採点結果が公平ではない恐れもある。
【発明の概要】
【発明が解決しようとする課題】
【0004】
本発明の実施例は、記述式問題の自動採点を達成し、人的資源の消耗を軽減し、ならびに、採点効率および正確性の向上を図る、記述式問題のための知的採点方法およびシステムを提供する。
【課題を解決するための手段】
【0005】
そこで、本発明の実施例は、以下の解決手段を提供する。
【0006】
本発明の実施例は、記述式問題のための知的採点方法を提供する。当該方法は、記述式問題の解答の画像を取得するステップと、前記解答の画像を切り分けて、同定すべき解答の文字列に対する1つまたは複数の切り分け結果を取得するステップと、標準解答の文字数と同じ文字数の切り分け結果があるか否かを判断するステップと、標準解答の文字数と同じ文字数の切り分け結果がなければ、解答が間違っていると特定するステップと、標準解答の文字数と同じ文字数の切り分け結果があれば、前記標準解答の文字数と同じ文字数の切り分け結果の同一性信頼度(identificial confidence)を算出し、および/または、前記標準解答の文字数と同じ文字数の切り分け結果における各キャラクタの同一性信頼度を算出するステップと、算出された同一性信頼度に基づいて解答が正しいか否かを特定するステップとを含む。
【0007】
好ましくは、前記記述式問題の解答の画像を取得するステップは、解答カードの画像を取得するステップと、解答カードのレイアウト情報に基づいて、前記解答カードの画像から対象解答領域を分割して抽出するステップと、前記対象解答領域から記述式問題の解答の画像を抽出するステップとを含む。
【0008】
好ましくは、前記解答カードの画像を取得するステップは、光学式マーク読取装置(OMR)、高速撮影装置あるいは移動端末機器を用いて解答カードの画像を取得するステップを含む。
【0009】
好ましくは、前記解答の画像を切り分けて、同定すべき解答の文字列に対する1つまたは複数の切り分け結果を取得するステップは、前記解答の画像を細かく切り分けて、複数の細かく切り分けられたサブブロックを取得するステップと、前記細かく切り分けられたサブブロックを統合して、統合信頼度(combination confidence)を算出するステップと、前記信頼度に基づいて統合結果を特定し、同定すべき解答の文字列に対する1つまたは複数の切り分け結果を取得するステップとを含む。
【0010】
好ましくは、前記統合信頼度を算出するステップは、統合により得られたキャラクタからキャラクタ特徴を抽出するステップと、予め訓練して得られた規則統計モデルと前記キャラクタ特徴とを用いて当該統合の信頼度を算出するステップとを含む。
【0011】
好ましくは、前記標準解答の文字数と同じ文字数の切り分け結果の同一性信頼度を算出するステップは、前記標準解答の文字数と同じ文字数の切り分け結果を前記標準解答のテキスト文字列に揃える(整列させる)ステップと、全キャラクタセットの音響モデルおよび汎用の言語モデルに基づいて、前記標準解答の文字数と同じ文字数の切り分け結果に対して手書き復号化(デコーディング)および同定を行って各同定結果の尤度スコアを取得するステップと、同定結果から、復号パス(a decoding path)が標準解答に一致するパスの尤度スコアを選択するステップと、前記パスの事後スコアを算出し、前記事後スコアを前記標準解答の文字数と同じ文字数の切り分け結果の同一性信頼度とするステップとを含む。
【0012】
相応して、前記算出された同一性信頼度に基づいて解答が正しいか否かを特定するステップは、標準解答の文字数と同じ文字数の切り分け結果のうち、何れかの切り分け結果の同一性信頼度が第1信頼度閾値よりも大きければ、解答が正しいと特定し、そうでなければ、解答が間違っていると特定するステップを含む。
【0013】
好ましくは、前記標準解答の文字数と同じ文字数の切り分け結果における各キャラクタの同一性信頼度を算出するステップは、前記標準解答の文字数と同じ文字数の切り分け結果を前記標準解答のテキスト文字列に揃えるステップと、全キャラクタセットの音響モデルに基づいて、前記標準解答の文字数と同じ文字数の切り分け結果における各キャラクタの同定結果の尤度スコアを算出するステップと、前記同定結果のうちの標準解答に一致するキャラクタの同定結果の尤度スコアを選択するステップと、選択された同定結果の事後スコアを算出し、前記事後スコアを前記キャラクタの同一性信頼度とするステップとを含む。
【0014】
相応して、前記算出された同一性信頼度に基づいて解答が正しいか否かを特定するステップは、標準解答の文字数と同じ文字数の切り分け結果のうち、そのいずれのキャラクタの同一性信頼度も第2信頼度閾値より大きい切り分け結果が存在すれば、解答が正しいと特定し、そうでなければ、解答が間違っていると特定するステップを含む。
【0015】
好ましくは、前記標準解答の文字数と同じ文字数の切り分け結果における各キャラクタの同一性信頼度を算出するステップは、前記標準解答の文字数と同じ文字数の切り分け結果を前記標準解答のテキスト文字列に揃えるステップと、全キャラクタセットの音響モデルおよび汎用の言語モデルに基づいて、前記標準解答の文字数と同じ文字数の切り分け結果に対して手書き復号化および同定を行って各同定結果の尤度スコアを取得するステップと、各同定結果の事後確率を算出し、各同定結果の事後確率に基づいて、前記切り分け結果におけるキャラクタごとに、各同定結果において当該キャラクタの同定結果と標準解答とが一致する事後確率を累積し、当該事後確率を当該キャラクタの信頼度とするステップとを含む。
【0016】
相応して、前記算出された同一性信頼度に基づいて解答が正しいか否かを特定するステップは、標準解答の文字数と同じ文字数の切り分け結果のうち、そのいずれのキャラクタの同一性信頼度も第3信頼度閾値より大きい切り分け結果が存在すれば、解答が正しいと特定し、そうでなければ、解答が間違っていると特定するステップを含む。
【0017】
本発明の実施例は、記述式問題のための知的採点システムをさらに提供する。当該システムは、画像取得モジュールと、切分モジュールと、第1判断モジュールと、算出モジュールと、第2判断モジュールと、出力モジュールとを備える。
【0018】
前記画像取得モジュールは、記述式問題の解答の画像を取得する。
【0019】
前記切分モジュールは、前記解答の画像を切り分けて、同定すべき解答の文字列に対する1つまたは複数の切り分け結果を取得する。
【0020】
前記第1判断モジュールは、前記切分モジュールによって取得された切り分け結果のうち、標準解答の文字数と同じ文字数の切り分け結果があるか否かを判断し、標準解答の文字数と同じ文字数の切り分け結果がないと判断した場合、解答が間違っている旨の指示情報を前記出力モジュールが出力するようトリガし、そうではない場合、前記算出モジュールが同一性信頼度を算出するようトリガする。
【0021】
前記算出モジュールは、第1算出モジュール、および/または、第2算出モジュールを備える。前記第1算出モジュールは、前記標準解答の文字数と同じ文字数の切り分け結果の同一性信頼度を算出し、前記第2算出モジュールは、前記標準解答の文字数と同じ文字数の切り分け結果における各キャラクタの同一性信頼度を算出する。
【0022】
前記第2判断モジュールは、前記算出モジュールによって算出された同一性信頼度に基づいて解答が正しいか否かを特定し、解答が正しいと判断した場合、解答が正しい旨の指示情報を前記出力モジュールが出力するようトリガし、解答が間違っていると判断した場合、解答が間違っている旨の指示情報を前記出力モジュールが出力するようトリガする。
【0023】
好ましくは、前記画像取得モジュールは、解答カードの画像を取得するための画像取得手段と、解答カードのレイアウト情報に基づいて、前記解答カードの画像から対象解答領域を分割して抽出するための解答領域抽出手段と、前記対象解答領域から記述式問題の解答の画像を抽出するための解答内容抽出手段とを備える。
【0024】
好ましくは、前記画像取得手段は、光学式マーク読取装置(OMR)、高速撮影装置、または移動端末機器である。
【0025】
好ましくは、前記切分モジュールは、前記解答の画像を細かく切り分けて、複数の細かく切り分けられたサブブロックを取得するための切分手段と、前記細かく切り分けられたサブブロックを統合して、統合信頼度を算出するための信頼度算出手段と、前記信頼度に基づいて統合結果を特定し、同定すべき解答の文字列に対する1つまたは複数の切り分け結果を取得するための統合結果特定手段とを備える。
【0026】
好ましくは、前記信頼度算出手段は、前記細かく切り分けられたサブブロックを統合するための統合サブ手段と、統合により得られたキャラクタからキャラクタ特徴を抽出するための抽出サブ手段と、予め訓練して得られた規則統計モデルと前記キャラクタ特徴とを用いて当該統合の信頼度を算出するための算出サブ手段とを備える。
【0027】
好ましくは、前記第1算出モジュールは、前記標準解答の文字数と同じ文字数の切り分け結果を前記標準解答のテキスト文字列に揃えるためのアラインメント手段と、全キャラクタセットの音響モデルおよび汎用の言語モデルに基づいて、前記標準解答の文字数と同じ文字数の切り分け結果に対して手書き復号化および同定を行って各同定結果の尤度スコアを取得するための第1同定手段と、同定結果から、復号パスが標準解答に一致するパスの尤度スコアを選択するための第1選択手段と、前記パスの事後スコアを算出し、前記事後スコアを前記切り分け結果の同一性信頼度とするための第1算出手段とを備える。
【0028】
前記第2判断モジュールは、標準解答の文字数と同じ文字数の切り分け結果のうち、何れかの切り分け結果の同一性信頼度が第1信頼度閾値よりも大きい場合、解答が正しいと判断し、そうではない場合、解答が間違っていると判断する。
【0029】
好ましくは、前記第2算出モジュールは、前記標準解答の文字数と同じ文字数の切り分け結果を前記標準解答のテキスト文字列に揃えるためのアラインメント手段と、全キャラクタセットの音響モデルに基づいて、前記標準解答の文字数と同じ文字数の切り分け結果における各キャラクタの同定結果の尤度スコアを算出するための第2同定手段と、前記同定結果のうちの標準解答に一致するキャラクタの同定結果の尤度スコアを選択するための第2選択手段と、選択された同定結果の事後スコアを算出し、前記事後スコアを前記キャラクタの同一性信頼度とするための第2算出手段とを備える。
【0030】
前記第2判断モジュールは、標準解答の文字数と同じ文字数の切り分け結果のうち、そのいずれのキャラクタの同一性信頼度も第2信頼度閾値より大きい切り分け結果が存在する場合、解答が正しいと判断し、そうではない場合、解答が間違っていると判断する。
【0031】
好ましくは、前記第2算出モジュールは、前記標準解答の文字数と同じ文字数の切り分け結果を前記標準解答のテキスト文字列に揃えるためのアラインメント手段と、全キャラクタセットの音響モデルおよび汎用の言語モデルに基づいて、前記標準解答の文字数と同じ文字数の切り分け結果に対して手書き復号化および同定を行って各同定結果の尤度スコアを取得するための第1同定手段と、各同定結果の事後確率を算出し、各同定結果の事後確率に基づいて、前記標準解答の文字数と同じ文字数の切り分け結果におけるキャラクタごとに、各同定結果において当該キャラクタの同定結果と標準解答とが一致する事後確率を累積し、当該事後確率を当該キャラクタの信頼度とするための第3算出手段とを備える。
【0032】
前記第2判断モジュールは、標準解答の文字数と同じ文字数の切り分け結果のうち、そのいずれのキャラクタの同一性信頼度も第3信頼度閾値より大きい切り分け結果が存在する場合、解答が正しいと判断し、そうではない場合、解答が間違っていると判断する。
【発明の効果】
【0033】
本発明の実施例に供される記述式問題のための知的採点方法およびシステムでは、標準解答が既知の記述式問題について、解答の事前情報を用いて手書き文字列に対する同定を行うことにより、記述式問題の自動採点が実施できるため、コンピュータにて記述式問題採点を全自動的に行うことができない一方で、人力の採点により人的資源の消耗が激しいこと、教師の仕事のプレッシャが大きいこと、教師の主観要素による採点結果が正確ではないなどの、従来の自動採点システムにおける問題を解決する。
【図面の簡単な説明】
【0034】
本出願の実施例や従来技術における技術をより明瞭に説明するために、実施例の説明に必要な図面を以下に簡単に紹介する。明らかに、下記の図面は単に本発明に記載の幾つかの実施例であり、当業者であれば、これらの図面から他の図面を得ることができる。
【0035】
図1】本発明の実施例における記述式問題のための知的採点方法のフローチャートである。
【0036】
図2】本発明の実施例における解答の画像切分例である。
【0037】
図3】本発明の実施例における解答の画像を切り分けるフローチャートである。
【0038】
図4】本発明の実施例における同一性信頼度を算出する1つのフローチャートである。
【0039】
図5】本発明の実施例における同一性信頼度を算出する別のフローチャートである。
【0040】
図6】本発明の実施例における同一性信頼度を算出する別のフローチャートである。
【0041】
図7】本発明の実施例における記述式問題のための知的採点システムの構造を示す模式図である。
【0042】
図8】本発明の実施例における第1算出モジュールの構造を示すブロック図である。
【0043】
図9】本発明の実施例における第2算出モジュールの1の構造を示すブロック図である。
【0044】
図10】本発明の実施例における第2算出モジュールの別の構造を示すブロック図である。
【発明を実施するための形態】
【0045】
当業者が本発明の実施例の技術手段をより理解できるように、添付の図面および実施形態を参照して本発明の実施例をさらに詳細に説明する。
【0046】
本発明の実施例における記述式問題のための知的採点方法およびシステムでは、標準解答を有する文字入力型試験問題の解答用紙、例えば穴埋め問題の解答用紙について、標準解答の事前情報を用いて手書き文字列に対する同定を行うことで、記述式問題の自動採点を実施する。
【0047】
図1は、本発明の実施例における記述式問題のための知的採点方法を示すフローチャートであり、以下のステップを含む。
【0048】
ステップ101では、記述式問題の解答の画像を取得する。
【0049】
前記記述式問題の解答の画像そのものは、解答の文字列の画像である。本発明の実施例において、前記解答の文字列は、漢字文字列、英文文字列等であってもよい。
【0050】
解答の画像を取得する具体的な手順は、下記の通りである。
【0051】
(1)解答カードの画像を取得する。
【0052】
解答カードの画像の取得は、光学式マーク読取装置(OMR)を用いて走査してもよいし、高速撮影装置、移動端末等の機器を用いて撮影してもよい。
【0053】
(2)解答カードのレイアウト情報に基づいて、前記解答カードの画像から対象解答領域を分割して抽出する。
【0054】
実際の応用において、対象解答領域を分割し抽出する前に、正確な対象解答領域が抽出されるように、先に解答カードの画像を前処理してもよい。前記前処理は、解答カードの画像に対する測位、校正、ノイズ低減、コントラスト向上、グレー化等の操作を含んでもよい。具体的な処理方法が従来の自動採点システムにおける解答カードの画像前処理方法と同じであるため、ここで繰り返し説明しない。
【0055】
解答カードのレイアウト情報は、既知の事前情報である。解答カードの画像を測位すれば、解答カードの画像の測位情報を取得可能である。これらの情報をもとに、エッジ検出により、対象解答領域を正確に分割し抽出することができる。
【0056】
(3)前記対象解答領域から記述式問題の解答の画像を抽出する。
【0057】
対象解答領域が取得された後、解答カードのレイアウト情報に基づいて、エッジ点検出により、解答の画像を取得することができる。当該解答の画像は、解答の文字列の画像である。
【0058】
ステップ102では、前記解答の画像を切り分けて、同定すべき解答の文字列に対する1つまたは複数の切り分け結果を取得する。
【0059】
具体的な切り分け手順は、後述する。
【0060】
また、留意すべきことは、実際の応用において、前記解答の画像を切り分ける前に、解答の画像を前処理してより正確な切り分け結果を取得してもよい。前記前処理は、解答の画像に対する二値化処理、手書き文字の傾斜校正、手書き文字の細径化等を含んでもよい。
【0061】
ステップ103では、標準解答の文字数と同じ文字数の切り分け結果があるか否かを判断する。あれば、ステップ104を実行し、なければ、ステップ106を実行する。
【0062】
複数の異なる統合結果があるため、ステップ102において得られた、複数の切り分け結果は、異なる文字数を有することになる。標準解答の文字数と同じ文字数の切り分け結果は、正しい可能性の一番高い解答である。本発明の技術が標準解答を有する文字入力型客観試験問題に対するものであるため、文字数が異なれば、解答が間違っていると特定できる。切り分け結果の文字数が標準解答の文字数と同じ場合、当該解答が正しいか否かをさらに判断する必要がある。
【0063】
ステップ104では、前記標準解答の文字数と同じ文字数の切り分け結果の同一性信頼度を算出し、および/または、前記標準解答の文字数と同じ文字数の切り分け結果における各キャラクタの同一性信頼度を算出する。
【0064】
ステップ105では、算出された同一性信頼度に基づいて解答が正しいか否かを特定する。
【0065】
同一性信頼度の算出方式は、複数種ありえる。相応して、異なる算出方式により得られた同一性信頼度に基づいて解答が正しいか否かを特定することも複数ある。詳細は、後述する。
【0066】
ステップ106では、解答が間違っていると特定する。
【0067】
本発明の実施例に供される記述式問題のための知的採点方法では、標準解答が既知の記述式問題について、解答の事前情報を用いて手書き文字列の同定を行うことにより、記述式問題の自動採点が実施できるため、コンピュータにて記述式問題の採点を全自動で行うことができない一方で、人力の採点により人的資源の消耗が激しいこと、教師の仕事のプレッシャが大きいこと、教師の主観要素により採点結果が正確ではないなどの、従来の自動採点システムにおける問題を解決する。
【0068】
図3は、本発明の実施例における解答の画像を切り分けるフローチャートであり、以下のステップを含む。
【0069】
ステップ301では、解答の画像を細かく切り分けて、複数の細かく切り分けられたサブブロックを取得する。
【0070】
例えば、解答の画像の最左上端の黒色画素点から8隣接領域の黒色拡張を開始して、画像全体を、黒色画素からなる連通サブ領域の幾つかに分割する。図2は、切り分け例であり、黒色筆跡部分に対して連通領域の分割が行われ、元の1つの文字列画像が幾つかの断片に分けられる。これらの断片は、いずれも個々の文字を構成する部品であり、偏旁や部首であったり、書き方の相違により単一の筆跡部分である可能性がある。これらの断片を組み合わせると異なるキャラクタをなす。
【0071】
ステップ302では、前記細かく切り分けられたサブブロックを統合して、統合信頼度を算出する。
【0072】
例えば、細かく切り分けられたサブブロックに対して全数統合、即ち、統合可能なあらゆる細かく切り分けられたサブブロックを逐一統合してもよい。例えば、細かく切り分けられたサブブロックが5つある場合、以下の幾つかの統合方式が存在する。
【0073】
(1)キャラクタが1つあるとすれば、細かく切り分けられたサブブロック1、2、3、4、5を統合する。
【0074】
(2)キャラクタが2つあるとすれば、細かく切り分けられたサブブロック1、2、3、4を統合する。細かく切り分けられたサブブロック1、2、3を統合し、細かく切り分けられたサブブロック4、5を統合する。細かく切り分けられたサブブロック1、2を統合し、細かく切り分けられたサブブロック3、4、5を統合する。細かく切り分けられたサブブロック2、3、4、5を統合する。
【0075】
このようにして、5つのキャラクタがあるとみなされるまで、同じ操作が実行される。
【0076】
前記統合信頼度は、統合後に得られたキャラクタの正確性を示す。具体的に、統合後のキャラクタの高さ、幅、縦横比、キャラクタ外ピッチ(例えば図2の文字において、文字間の距離、即ち符号7の「果」と符号8の「木」の間の距離)、キャラクタ内ピッチ(例えば図2の文字において、文字内部の距離、即ち符号6の「木」と符号7の「果」の間の距離)等の特徴を抽出し、システムにより予め訓練された規則統計モデルに基づいて尤度スコアを取得し、当該スコアを現在の統合結果の信頼度としてもよい。
【0077】
前記規則統計モデルは、訓練データを切り分けた後の、キャラクタの高さ、幅、縦横比、キャラクタ外ピッチ、キャラクタ内ピッチ等の抽出された特徴に基づいて訓練された統計モデルである。当該モデルは、GMM(Gaussian Mixture Model、ガウス混合モデル)あるいはSVM(Support Vector Machine、サポートベクターマシン)等であってもよい。
【0078】
統合信頼度の算出、即ち、統合結果から抽出された特徴に基づいて規則統計モデルにより尤度スコアを算出する。つまり、統合スコアを算出する。そして、当該スコアに基づいて統合信頼度を特定する。当該スコアをそのまま対応する統合信頼度としてもよい。
【0079】
ステップ303では、前記信頼度に基づいて統合結果を特定し、同定すべき解答の文字列に対する1つまたは複数の切り分け結果を取得する。
【0080】
具体的に、信頼度が設定された閾値より大きい場合、当該統合が信頼できると見なされ、そうでない場合、当該統合が信頼できないと見なされる。さらに、信頼できる統合結果に基づいて、1つまたは複数の同定すべき解答の文字列を取得する。
【0081】
留意すべきことは、実際の応用において、統合前、あるいは統合信頼度を判断する際、経験や実験を介して幾つかの判断規則を設定してもよい。例えば、1つの漢字の筆跡が3つの細かく切り分けられたサブブロックを超えない等にして、文字列切り分け結果が正しいか否かの判断をさらに補助や先導して、判断の正確性を高める。
【0082】
本発明の実施例において、標準解答の文字数と同じ文字数の各切り分け結果の同一性信頼度を算出し、および/または、標準解答の文字数と同じ文字数の各切り分け結果における各キャラクタの同一性信頼度を算出し、算出した同一性信頼度に基づいて解答が正しいか否かを特定する必要がある。実際の応用において、算出および判断方法が複数ありえる。以下にそれぞれ説明する。
【0083】
図4は、本発明の実施例における同一性信頼度を算出するフローチャートである。当該実施例では、各切り分け結果の同定尤度スコアを算出してから、当該同定尤度スコアに基づいて当該切り分け結果の同一性信頼度を算出する必要がある。
【0084】
標準解答の文字数と同じ文字数の切り分け結果ごとに、その同一性信頼度を算出する具体的な手順は、以下のステップを含む。
【0085】
ステップ401では、切り分け結果を標準解答のテキスト文字列に揃える。
【0086】
つまり、切り分け結果における各切り分けられた断片を順に標準解答のテキスト文字列における各キャラクタに一つ一つ揃える(整列させる)。切り分けられた断片の順番に沿う各断片は、1つのキャラクタを示す。
【0087】
ステップ402では、全キャラクタセットの音響モデルおよび汎用の言語モデルに基づいて、前記切り分け結果に対して手書き復号化および同定を行って各同定結果の尤度スコアを取得する。
【0088】
前記言語モデルは、N−Gramモデルであってもよく、その具体的な算出数式が下記になる。
【0089】
【数1】
【0090】
ただし、p(X,W)は、切り分け結果の全文Xの第k番目の同定結果の尤度スコアを表し、Mは、切り分け結果における断片の総数であり、Kは、全文の同定結果数であり、p(x|wki)は、第i番目の断片xがパスWにおける第i番目のキャラクタwkiとして同定される尤度スコアを表し、p(wki|hi−1)は、1からi−1の同定結果が与えられた後でwkiと同定する事前確率を表す。
【0091】
ステップ403では、同定結果から、復号パスが標準解答に一致するパスの尤度スコアを選択する。
【0092】
ステップ404では、前記パスの事後スコアを算出し、前記事後スコアを前記切り分け結果の同一性信頼度とする。
【0093】
具体的に、まず、同定した復号パスが標準解答と一致するパスの尤度スコアを選択し、次に、切り分け結果の全文同一性信頼度を算出し、その算出数式が下記になる。
【0094】
【数2】
【0095】
ただし、Wは、標準解答に一致する同定した復号パスを表し、p(x|wyi)は、第i番目の切り分けられた断片xが標準解答に一致するパスWにおける第i番目のキャラクタwyiとして同定される尤度スコアを表し、p(wyi|hi−1)は、1からi−1の同定結果が与えられた後で標準解答に一致するwyiとして同定される事前確率を表し、Kの値は、あらゆる同定結果数であってもよい。さらに、算出量を減らすために、Kは、比較的に小さい値、例えば、50に適宜選択されてもよい。当該値の選択は、経験や実験結果に基づいて特定されてもよい。
【0096】
相応して、上記方法にしたがって各切り分け結果の同一性信頼度を取得した後、解答が正しいか否かを特定する判断は、下記のようになる。何れかの切り分け結果の同一性信頼度が第1信頼度閾値より大きい場合、解答が正しいと特定し、そうでない場合、解答が間違っていると特定する。
【0097】
例えば、標準解答のテキストが「黄河入海流」である。同定すべき文字列の切り分け結果に対して、音響モデルおよび言語モデルを用いて手書き復号化および同定を行って、3つの同定結果を取得したとする。当該3つの同定結果がそれぞれ「黄河入海流」、「黄河人海流」、「黄河入洋流」であり、その対応する尤度スコアがそれぞれ90、54、36である。同定結果において復号パスが標準解答に一致するパス「黄河入海流」の尤度スコア90を選択し、当該パスの事後スコアを0.5として算出する。同一性信頼度に基づいて解答に対して正誤判断を行う際、同定結果が標準解答に一致する「黄河入海流」の事後スコアが第1信頼度閾値より大きいか否かを判断する。
【0098】
図5は、本発明の実施例における同一性信頼度を算出する1つのフローチャートである。当該実施例では、各切り分け結果における各キャラクタの同一性信頼度をそれぞれ算出する必要がある。
【0099】
標準解答の文字数と同じ文字数の切り分け結果ごとに、その中の各キャラクタの同一性信頼度を算出する具体的な手順は、以下のステップを含む。
【0100】
ステップ501では、切り分け結果を標準解答のテキスト文字列に揃える。
【0101】
つまり、切り分け結果における各切り分けられた断片(切り分けられた断片のそれぞれは、1つのキャラクタを代表する)を順に標準解答のテキスト文字列における各キャラクタに一つ一つ揃える。標準解答が「上海」である場合、切り分け結果における第1の切り分けられた断片を「上」に関連付け、切り分け結果における第2の切り分けられた断片を「海」に関連付ける。
【0102】
ステップ502では、全キャラクタセットの音響モデルに基づいて、前記切り分け結果における各キャラクタの同定結果の尤度スコアp(x|w)を算出する。
【0103】
ただし、xは、第i(i=1,2,・・・,M)番目の切り分けられた断片を表し、Mは、切り分け結果における切り分けられた断片の総数であり、wは、第i番目の切り分けられた断片が音響モデルを介してW(j=1,2,・・・,N)として同定されたキャラクタを表し、Nは、同定結果の数である。
【0104】
留意すべきことは、実際の算出において、算出量を減らすために、Nの値を適宜小さくしてもよい。例えば、50にしてもよい。
【0105】
ステップ503では、前記同定結果のうちの標準解答に一致するキャラクタの同定結果の尤度スコアを選択する。
【0106】
ステップ504では、選択された同定結果の事後スコアを算出し、前記事後スコアを前記キャラクタの同一性信頼度とする。
【0107】
具体的に、切り分けられた断片の同定結果において標準解答に一致するキャラクタの同定結果の尤度スコアを選択し、選択した当該同定結果の事後確率を当該切り分けられた断片(即ち、キャラクタ)の同一性信頼度として算出し、その算出数式は、下記のようになる。
【0108】
【数3】
【0109】
ただし、p(wyi|x)は、第i番目の切り分けられた断片xが標準解答に一致するパスWにおける第i番目のキャラクタwyiとして同定される事後スコアを表す。
【0110】
相応して、上記取得された各切り分け結果における各キャラクタの同一性信頼度に基づいて、解答が正しいか否かを特定する判断は、下記のようになる。
【0111】
その中のいずれのキャラクタの同一性信頼度も第2信頼度閾値より大きい切り分け結果が存在すれば、解答が正しいと特定し、そうでなければ、解答が間違っていると特定する。
【0112】
図6は、本発明の実施例における同一性信頼度を算出する1つのフローチャートである。当該実施例では、同様に、各切り分け結果における各キャラクタの同一性信頼度をそれぞれ算出する必要があるが、算出方法が図5に示す実施例と異なる。具体的に、以下のステップを含む。
【0113】
ステップ601では、切り分け結果を標準解答のテキスト文字列に揃える。
【0114】
ステップ602では、全キャラクタセットの音響モデルおよび汎用の言語モデルに基づいて、前記切り分け結果に対して手書き復号化および同定を行って各同定結果の尤度スコアを取得する。
【0115】
具体的な算出数式は、上記数式(1)を参照すればよい。
【0116】
ステップ603では、各同定結果の事後確率を算出する。
【0117】
具体的な算出数式は、下記のようになる。
【0118】
【数4】
【0119】
ただし、p(W|X)は、第k番目の同定結果の事後確率を表し、他のパラメータは、前述した該当パラメータの示す意味と同じ意味を示す。
【0120】
ステップ604では、各同定結果の事後確率に基づいて、前記切り分け結果におけるキャラクタごとに、各同定結果において当該キャラクタの同定結果と標準解答とが一致する事後確率を累積し、当該事後確率を当該キャラクタの信頼度とする。
【0121】
具体的な算出数式は、下記のようになる。
【0122】
【数5】
【0123】
ただし、p(wyi|X)は、各同定結果におけるキャラクタiの同定結果が標準解答と一致する事後確率を表し、他のパラメータは、前述した該当パラメータの示す意味と同じ意味を示す。Kの値は、あらゆる同定結果の総数であってもよい。さらに、算出量を減らすために、Kは、比較的に小さい値、例えば、50に適宜選択されてもよい。当該値の選択は、経験や実験結果に基づいて特定されてもよい。
【0124】
例えば、標準解答のテキストが「黄河入海流」である。説明の便宜上、手書き同定により得られた同定結果が3つある(即ち、Kの値が3)とする。その3つの同定結果は、それぞれ、尤度スコアが0.5の第1同定結果「黄河入海流」、尤度スコアが0.3の第2同定結果「黄河人海流」、尤度スコアが0.2の第3同定結果「黄河入洋流」である。その場合には、「黄」、「河」、「流」との3つの漢字の事後確率スコアが0.5+0.3+0.2=1.0であり、「入」の事後確率スコアが0.5+0.2=0.7であり、「海」の事後確率スコアが0.5+0.3=0.8である。
【0125】
相応して、上記方法により得られた各切り分け結果における各キャラクタの同一性信頼度に基づいて、解答が正しいか否かを特定する判断は、下記のようになる。
【0126】
その中のいずれのキャラクタの同一性信頼度も第3信頼度閾値より大きい切り分け結果が存在すれば、解答が正しいと特定し、そうでなければ、解答が間違っていると特定する。
【0127】
留意すべきことは、前述した第1信頼度閾値、第2信頼度閾値、および第3信頼度閾値が同じであってもよいし、異なってもよく、本発明の実施例において限定されない。そして、実際の応用において、上記3種の技術は、任意に組み合わせてもよい。例えば、その中の2種の技術、即ち、解答の正誤の判断は、その2種の技術における判断条件がいずれも満たされるか否かに応じて特定されてもよい。もし両者もみたされる場合、解答が正しいと判断し、そうでない場合、解答が間違っていると判断する。その中の3種の技術を採用すれば、その3種の技術における判断条件がいずれも満たされる、またはその中の任意の2つの技術における判断条件が満たされる場合に、解答が正しいと判断し、そうでない場合、解答が間違っていると特定してもよい。
【0128】
相応して、本発明の実施例は、記述式問題のための知的採点システムをさらに提供する。図7は、本発明の実施例における記述式問題のための知的採点システムの構造を示す模式図である。
【0129】
当該実施例では、前記システムは、画像取得モジュール701、切分モジュール702、第1判断モジュール703、算出モジュール704、第2判断モジュール705、および出力モジュール706を含む。ただし、算出モジュール704は、第1算出モジュール741および第2算出モジュール742を備える。
【0130】
上記画像取得モジュール701は、記述式問題の解答の画像を取得する。
【0131】
上記切分モジュール702は、前記画像取得モジュール701によって取得された解答の画像を切り分けて、同定すべき解答の文字列に対する1つまたは複数の切り分け結果を取得する。
【0132】
上記第1判断モジュール703は、前記切分モジュール702によって取得された切り分け結果のうち、標準解答の文字数と同じ文字数の切り分け結果があるか否かを判断し、標準解答の文字数と同じ文字数の切り分け結果がないと判断した場合、前記出力モジュール706が解答が間違っている旨の指示情報を出力するようトリガし、そうでない場合、前記算出モジュール704が同一性信頼度を算出するようトリガする。
【0133】
上記第1算出モジュール741は、前記標準解答の文字数と同じ文字数の切り分け結果の同一性信頼度を算出し、第2算出モジュール742は、前記標準解答の文字数と同じ文字数の切り分け結果における各キャラクタの同一性信頼度を算出する。
【0134】
上記第2判断モジュール705は、前記算出モジュール704によって算出された同一性信頼度に基づいて解答が正しいか否かを特定し、解答が正しいと判断した場合、前記出力モジュール706が解答が正しい旨の指示情報を出力するようトリガし、解答が間違っていると判断した場合、前記出力モジュール706が解答が間違っている旨の指示情報を出力するようトリガする。
【0135】
前記記述式問題の解答の画像そのものは、解答の文字列画像である。本発明の実施例における前記解答の文字列は、漢字文字列、英文文字列等であってもよい。
【0136】
上記画像取得モジュール701の1の実施例は、以下の各手段を含んでもよい。
【0137】
画像取得手段は、解答カードの画像を取得する。
【0138】
解答領域抽出手段は、解答カードのレイアウト情報に基づいて、前記解答カードの画像から対象解答領域を分割して抽出する。
【0139】
解答内容抽出手段は、前記対象解答領域から記述式問題の解答の画像を抽出する。具体的には、解答領域抽出手段が対象解答領域を取得した後、解答カードのレイアウト情報に基づいて、エッジ点検出により、解答の画像を取得することができる。当該解答の画像は、解答の文字列の画像である。
【0140】
上記画像取得手段は、具体的に、光学式マーク読取装置(OMR)、高速撮影装置、または移動端末機器である。つまり、光学式マーク読取装置(OMR)を用いて走査し、または高速撮影装置、移動端末等の機器を用いて撮影する等の方式により、解答カードの画像を取得してもよい。
【0141】
上記切分モジュール702の1の実施例は、以下の各手段を含んでもよい。
【0142】
切分手段は、前記解答の画像を細かく切り分けて、複数の細かく切り分けられたサブブロックを取得する。
【0143】
信頼度算出手段は、前記細かく切り分けられたサブブロックを統合して、統合信頼度を算出する。
【0144】
統合結果特定手段は、前記信頼度に基づいて統合結果を特定し、同定すべき解答の文字列に対する1つまたは複数の切り分け結果を取得する。具体的に、信頼度が設定された閾値より大きい場合、当該統合が信頼できると見なされ、そうでない場合、当該統合が信頼できないと見なされる。さらに、信頼できる統合結果に基づいて、1つまたは複数の同定すべき解答の文字列を取得する。
【0145】
留意すべきことは、上記信頼度算出手段の1の実施例は、統合サブ手段、抽出サブ手段および算出サブ手段を含んでもよい。ただし、統合サブ手段は、前記細かく切り分けられたサブブロックを統合する。細かく切り分けられたサブブロックを統合する方式は、複数ありえる。例えば、全数統合がある。各種の可能な統合結果が漏れなければよい。抽出サブ手段は、統合により得られたキャラクタからキャラクタ特徴を抽出する。算出サブ手段は、予め訓練して得られた規則統計モデルと前記キャラクタ特徴とを用いて当該統合の信頼度を算出する。
【0146】
前記統合信頼度は、統合後に得られたキャラクタの正確性を示す。具体的に、統合後のキャラクタの高さ、幅、縦横比、キャラクタ外ピッチ、キャラクタ内ピッチ等の特徴を抽出し、システムによって予め訓練された規則統計モデルに基づいて尤度スコアを取得し、当該スコアを現在の統合結果の信頼度としてもよい。
【0147】
前記規則統計モデルは、訓練データを切り分けた後の、キャラクタの高さ、幅、縦横比、キャラクタ外ピッチ、キャラクタ内ピッチ等の抽出された特徴に基づいて訓練された統計モデルである。当該モデルは、GMMあるいはSVM等であってもよい。
【0148】
統合信頼度の算出、即ち、統合結果から抽出された特徴に基づいて規則統計モデルにより尤度スコアを算出する。つまり、統合スコアを算出する。そして、当該スコアに基づいて統合信頼度を特定する。無論、当該スコアをそのまま対応する統合信頼度としてもよい。
【0149】
また、留意すべきことは、実際の応用において、前記システムが前記画像取得モジュール701と前記切分モジュール702の間に設けられた前処理モジュール(図示せず)をさらに含んでもよい。当該前処理モジュールは、前記切分モジュール702が前記解答の画像を切り分ける前に、前記解答の画像を前処理して、より正確な切り分け結果を取得する。前記前処理は、解答の画像に対する二値化処理、手書き文字の傾斜校正、手書き文字の細径化等を含んでもよい。
【0150】
本発明の実施例に供される記述式問題のための知的採点システムでは、標準解答が既知の記述式問題について、解答の事前情報を用いて手書き文字列に対する同定を行うことにより、記述式問題の自動採点が実施できるため、コンピュータにて記述式問題採点を全自動的に行うことができない一方で、人力の採点により人的資源の消耗が激しいこと、教師の仕事のプレッシャが大きいこと、教師の主観要素による採点結果が正確ではないなどの、従来の自動採点システムにおける問題を解決する。
【0151】
図7において、第1算出モジュール741は、標準解答の文字数と同じ文字数の各切り分け結果の同一性信頼度を算出し、第2算出モジュール742は、標準解答の文字数と同じ文字数の各切り分け結果における各キャラクタの同一性信頼度を算出する。実際の応用において、前記システムは、第1算出モジュール741あるいは第2算出モジュール742を択一的に選択してもよいし、第1算出モジュール741および第2算出モジュール742を同時に含んでもよく、本発明の実施例において限定されない。相応して、第2判断モジュール705は、解答の正誤を判断する際、その中の算出結果に基づいて判断してもよいし、両者の算出結果に基づいて総合的に判断してもよい。
【0152】
以下に、第1算出モジュール741および第2算出モジュール742の具体的な構造について例を挙げて詳細に説明する。
【0153】
図8は、本発明の実施例における第1算出モジュールの1の構造を示すブロック図である。
【0154】
当該実施例では、前記第1算出モジュール741は、アラインメント手段801、第1同定手段802、第1選択手段803および第1算出手段804を備える。
【0155】
アラインメント手段801は、前記標準解答の文字数と同じ文字数の切り分け結果を前記標準解答のテキスト文字列に揃える。
【0156】
第1同定手段802は、全キャラクタセットの音響モデルおよび汎用の言語モデルに基づいて、前記標準解答の文字数と同じ文字数の切り分け結果に対して手書き復号化および同定を行って各同定結果の尤度スコアを取得する。
【0157】
第1選択手段803は、同定結果から、復号パスが標準解答に一致するパスの尤度スコアを選択する。
【0158】
第1算出手段804は、前記パスの事後スコアを算出し、前記事後スコアを前記標準解答の文字数と同じ文字数の切り分け結果の同一性信頼度とする。
【0159】
相応して、上記第1算出モジュール741の算出結果に基づいて、図7における第2判断モジュール704は、標準解答の文字数と同じ文字数の切り分け結果のうち、何れかの切り分け結果の同一性信頼度が第1信頼度閾値よりも大きい場合、解答が正しいと判断し、そうではない場合、解答が間違っていると判断する。
【0160】
図9は、本発明の実施例における第2算出モジュールの1の構造を示すブロック図である。
【0161】
当該実施例における第2算出モジュール910は、アラインメント手段801、第2同定手段912、第2選択手段913および第2算出手段914を備える。
【0162】
アラインメント手段801は、前記標準解答の文字数と同じ文字数の切り分け結果を前記標準解答のテキスト文字列に揃える。
【0163】
第2同定手段912は、全キャラクタセットの音響モデルに基づいて、前記標準解答の文字数と同じ文字数の切り分け結果における各キャラクタの同定結果の尤度スコアを算出する。
【0164】
第2選択手段913は、前記同定結果のうちの標準解答に一致するキャラクタの同定結果の尤度スコアを選択する。
【0165】
第2算出手段914は、選択された同定結果の事後スコアを算出し、前記事後スコアを前記キャラクタの同一性信頼度とする。
【0166】
相応して、上記第2算出モジュール910の算出結果に基づいて、図7における第2判断モジュール704は、標準解答の文字数と同じ文字数の切り分け結果のうち、そのいずれのキャラクタの同一性信頼度も第2信頼度閾値より大きい切り分け結果が存在する場合、解答が正しいと判断し、そうではない場合、解答が間違っていると判断する。
【0167】
図10は、本発明の実施例における第2算出モジュールの別の構造を示すブロック図である。
【0168】
当該実施例における第2算出モジュール920は、アラインメント手段801、第1同定手段802および第3算出手段923を備える。
【0169】
アラインメント手段801は、前記標準解答の文字数と同じ文字数の切り分け結果を前記標準解答のテキスト文字列に揃える。
【0170】
第1同定手段802は、全キャラクタセットの音響モデルおよび汎用の言語モデルに基づいて、前記標準解答の文字数と同じ文字数の切り分け結果に対して手書き復号化および同定を行って各同定結果の尤度スコアを取得する。
【0171】
第3算出手段923は、各同定結果の事後確率を算出し、各同定結果の事後確率に基づいて、前記標準解答の文字数と同じ文字数の切り分け結果におけるキャラクタごとに、各同定結果において当該キャラクタの同定結果と標準解答とが一致する事後確率を累積し、当該事後確率を当該キャラクタの信頼度とする。
【0172】
相応して、上記第2算出モジュール920の算出結果に基づいて、図7における第2判断モジュール704は、標準解答の文字数と同じ文字数の切り分け結果のうち、そのいずれのキャラクタの同一性信頼度も第3信頼度閾値より大きい切り分け結果が存在する場合、解答が正しいと判断し、そうではない場合、解答が間違っていると判断する。
【0173】
留意すべきことは、前述した第1信頼度閾値、第2信頼度閾値、および第3信頼度閾値が同じであってもよいし、異なってもよく、本発明の実施例において限定されない。そして、実際の応用において、第1算出モジュールおよび第2算出モジュールが同時に選択されると、第2判断モジュール704の解答の正誤についての判断は、その2種の技術における判断条件がともに満たされるか否かに基づいて特定してもよい。両方満たされた場合、解答が正しいと判断し、そうでない場合、解答が間違っていると判断する。
【0174】
本明細書における各実施例がいずれも累加の方式で記述された。各実施例間の同じあるいは類似する部分を参照し合えばよい。各実施例は、主に他の実施例との異なる箇所を説明する。上述したシステムの実施例は、単に例示であり、その中の分離部品として説明されたモジュールが物理的に分離されたものであってもよいし、なくてもよい。手段として表示された部品が物理的手段でなくてもよい。即ち、1箇所に存在してもよいし、複数のネットワークセルに分散されてもよい。実際の必要に応じてその中の一部または全部のモジュールを選択して本実施例の技術を実施してもよい。そして、その中の幾つかのモジュールに供される機能もソフトウェアにて実現されてもよい。幾つかのモジュールが従来の機器(例えば、パソコン、タブレットPC、携帯電話)における同じ機能モジュールと共有されてもよい。当業者は、創造的な労動をせずに、理解し実施可能である。
【0175】
上記に本発明の実施例を詳細に説明した。本文では具体的な実施形態を用いて本発明を説明したが、以上の実施例の説明は単に本発明の方法および機器を理解するためのものであり、当業者であれば、本発明の精神に従って、具体的な実施形態および応用範囲を変更可能である。このように、本明細書の内容は、本発明の限定とはならない。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
【国際調査報告】