(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2022-04-28
(45)【発行日】2022-05-12
(54)【発明の名称】学力推定用モデル生成装置、学力推定装置、学力推定用モデル生成方法、学力推定方法、プログラム
(51)【国際特許分類】
G09B 19/00 20060101AFI20220502BHJP
G09B 7/02 20060101ALI20220502BHJP
【FI】
G09B19/00 H
G09B7/02
(21)【出願番号】P 2020181375
(22)【出願日】2020-10-29
【審査請求日】2020-10-29
(73)【特許権者】
【識別番号】506142716
【氏名又は名称】株式会社Z会
(74)【代理人】
【識別番号】100121706
【氏名又は名称】中尾 直樹
(74)【代理人】
【識別番号】100128705
【氏名又は名称】中村 幸雄
(74)【代理人】
【識別番号】100147773
【氏名又は名称】義村 宗洋
(72)【発明者】
【氏名】渡辺 淳
(72)【発明者】
【氏名】上田 倫也
(72)【発明者】
【氏名】渡邉 翔子
【審査官】西村 民男
(56)【参考文献】
【文献】特開2020-035409(JP,A)
【文献】特開2018-205447(JP,A)
【文献】特開2016-177161(JP,A)
【文献】米国特許出願公開第2018/0151084(US,A1)
【文献】決定木|分類問題を解く教師あり機械学習のアルゴリズム,農学情報科学[online],2019年06月30日,https://axa.biopapyrus.jp/machine-learning/decision-tree/,[2021年10月25日検索]
(58)【調査した分野】(Int.Cl.,DB名)
G09B 1/00- 9/56,
17/00-19/26,
G06N 3/00- 3/12,
7/08-99/00,
G06Q50/20
(57)【特許請求の範囲】
【請求項1】
予め定めた複数の問題からなる問題群に解答した複数人の解答者が各問題を正解または不正解したことを示す正誤情報を教師データとして、決定木を生成する決定木生成部と、
生成された前記決定木の末端である葉ノードが示す分類結果のエントロピーが所定値以下である場合に該当する葉ノードを消去する枝刈部と、
葉ノード消去後の前記決定木の新たな末端のそれぞれを何れかの解答者が属するカテゴリとするカテゴリ生成部を含む
学力推定用モデル生成装置。
【請求項2】
請求項1に記載の学力推定用モデル生成装置であって、
何れかの前記カテゴリにおける前記エントロピーの値が所定値よりも大きい、または何れかの前記カテゴリに属する前記解答者の人数が所定値よりも小さい場合に、該当のカテゴリに達するまでに経由したノードのうちの何れかのノードよりも末端側に存在する、該当のカテゴリに達しない部分木を補助決定木として該当のカテゴリに接続して、該当のカテゴリに属する前記解答者を補助決定木の末端に存在するカテゴリに誘導する補助決定木接続部を含む
学力推定用モデル生成装置。
【請求項3】
請求項
1または2に記載の学力推定用モデル生成装置であって、
前記解答者が所定の学校を受験した結果である合否結果を記憶する合否結果記憶部と、
前記カテゴリごとに、当該カテゴリに属する解答者の前記所定の学校における合格率を生成して前記カテゴリごとに出力する合格率生成部を含む
学力推定用モデル生成装置。
【請求項4】
予め定めた複数の問題からなる問題群に解答した複数人の解答者が各問題を正解または不正解したことを示す正誤情報を教師データとして生成された決定木の、末端である葉ノードが示す分類結果のエントロピーが所定値以下となる葉ノードを消去し、葉ノード消去後の前記決定木の新たな末端のそれぞれを何れかの解答者が属するカテゴリとすることにより生成された学力推定用モデルを記憶する学力推定用モデル記憶部と、
学力推定の対象者の前記正誤情報を取得し、前記学力推定用モデルに基づいて、前記対象者の学力を推定する学力推定部を含む
学力推定装置。
【請求項5】
学力推定用モデル生成装置が実行する学力推定用モデル生成方法であって、
予め定めた複数の問題からなる問題群に解答した複数人の解答者が各問題を正解または不正解したことを示す正誤情報を教師データとして、決定木を生成するステップと、
生成された前記決定木の末端である葉ノードが示す分類結果のエントロピーが所定値以下である場合に該当する葉ノードを消去するステップと、
葉ノード消去後の前記決定木の新たな末端のそれぞれを何れかの解答者が属するカテゴリとするステップを含む
学力推定用モデル生成方法。
【請求項6】
学力推定装置が実行する学力推定方法であって、
予め定めた複数の問題からなる問題群に解答した複数人の解答者が各問題を正解または不正解したことを示す正誤情報を教師データとして生成された決定木の、末端である葉ノードが示す分類結果のエントロピーが所定値以下となる葉ノードを消去し、葉ノード消去後の前記決定木の新たな末端のそれぞれを何れかの解答者が属するカテゴリとすることにより生成された学力推定用モデルに基づいて、学力推定の対象者の前記正誤情報を用いて、前記対象者の学力を推定するステップを含む
学力推定方法。
【請求項7】
コンピュータを請求項1か
ら3の何れかに記載の学力推定用モデル生成装置として機能させるプログラム。
【請求項8】
コンピュータを請求
項4に記載の学力推定装置として機能させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、学力推定のためのモデルを生成する学力推定用モデル生成装置、学力推定用モデルを用いて学力を推定する学力推定装置、学力推定用モデル生成方法、学力推定方法、プログラムに関する。
【背景技術】
【0002】
学習支援システムの従来技術として、例えば特許文献1が開示されている。特許文献1の学習支援システムは、サーバ装置、端末装置を含む。端末装置は、志望校情報をサーバ装置に送信し、志望校情報に基づいて特定された複数のレッスンを含むレッスン情報と当該レッスン情報に対応するチェックテスト情報とを、サーバ装置から受信し、チェックテスト情報に基づいてチェックテストを実行して、チェックテストの結果に基づいて学習者の学力レベルを判定し、レッスン情報及び判定された学力レベルに基づいて、所定時期に学習者が学習すべきレッスンを示す第1の画面を生成する。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
従来の学力推定には、志望校の出題範囲について網羅的に学習を進めた学習データを収集する必要があり、煩雑であった。また過去の学習データは時間とともに陳腐化していくため、現時点の学力推定の精度を下げる要因となっていた。
【0005】
そこで本発明では、網羅的な学習データを必要とせず、現在の学力を精度よく推定する学力推定用モデルを生成することができる学力推定用モデル生成装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明の学力推定用モデル生成装置は、決定木生成部と、枝刈部と、カテゴリ生成部を含む。
【0007】
決定木生成部は、予め定めた複数の問題からなる問題群に解答した複数人の解答者が各問題を正解または不正解したことを示す正誤情報を教師データとして、決定木を生成する。枝刈部は、生成された決定木の末端である葉ノードが示す分類結果のエントロピーが所定値以下である場合に該当する葉ノードを消去する。カテゴリ生成部は、葉ノード消去後の決定木の新たな末端のそれぞれを何れかの解答者が属するカテゴリとする。
【発明の効果】
【0008】
本発明の学力推定用モデル生成装置によれば、網羅的な学習データを必要とせず、現在の学力を精度よく推定する学力推定用モデルを生成することができる。
【図面の簡単な説明】
【0009】
【
図1】実施例1の学力推定用モデル生成装置の構成を示すブロック図。
【
図2】実施例1の学力推定用モデル生成装置の動作を示すフローチャート。
【
図3】葉ノード消去後の各末端をカテゴリとした決定木の例を示す図。
【
図5】実施例1の学力推定装置の構成を示すブロック図。
【
図6】実施例1の学力推定装置の動作を示すフローチャート。
【発明を実施するための形態】
【0010】
以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。
【実施例1】
【0011】
[学力推定用モデル生成装置]
図1を参照して実施例1の学力推定用モデル生成装置の構成を説明する。同図に示すように本実施例の学力推定用モデル生成装置1は、決定木生成部11と、枝刈部12と、カテゴリ生成部13と、補助決定木接続部14と、パラメータ記憶部15と、補足情報記憶部16と、理解度生成部17と、合否結果記憶部18と、合格率生成部19を含む。
【0012】
【0013】
<決定木生成部11>
決定木生成部11は、予め定めた複数の問題からなる問題群に解答した複数人の解答者が各問題を正解または不正解したことを示す正誤情報を教師データとして、決定木を生成する(S11)。
【0014】
<枝刈部12>
枝刈部12は、生成された決定木の末端である葉ノードが示す分類結果のエントロピーが所定値以下である場合に該当する葉ノードを消去する(S12)。
【0015】
<カテゴリ生成部13>
カテゴリ生成部13は、葉ノード消去後の決定木の新たな末端のそれぞれを何れかの解答者が属するカテゴリとする(S13)。
【0016】
ステップS11~S13までを実行することにより得られる決定木の例を
図3に示す。
図3の例では、問題群=全8問とした。ステップS12を実行して分類結果のエントロピーが所定値以下の葉ノードを消去し、ステップS13を実行して、新たな末端をカテゴリA~Lとした。
【0017】
ステップS12において、エントロピーが所定値以下となる葉ノードを削除したため、この決定木の各ルートは、問1~問8の全てを含むものとなっていない。例えば、問1、問2、問3を連続正解した解答者は直ちにカテゴリAに分類される。これは、問1~問3までを連続で正解した解答者の集団は、その後の問題の解答においても正誤情報にほとんどばらつきがなかった(エントロピーが小さかった)ためと考えられる。例えば、問1~問3までを連続で正解できた集団は、残りの問題(問4~問8)も全て正解する学力があったために、問1~問3までの時点でエントロピーが収束して小さな値となったと想定される。
【0018】
他の例として、例えば問1が正解、問2が不正解、問4~問5を連続正解した集団は、エントロピーが所定値を下回るため、カテゴリCに分類される。この場合、決定木のルートに上がっていない問3、問6~問8に関しては、カテゴリCに属する集団において、ほとんどバラツキなく正解または不正解の何れかに収束していると考えられる。例えば、問2が不正解であることに連動して、連関する問3はほとんど不正解に収束し、問1、問4~問5が正解であったことに連動して、連関する問6~問8は全問正解し、収束しているパターンなどが想定される。
【0019】
<補助決定木接続部14>
補助決定木接続部14は、何れかのカテゴリにおけるエントロピーの値が所定値よりも大きい、または何れかのカテゴリに属する解答者の人数が所定値よりも小さい場合に、該当のカテゴリに達するまでに経由したノードのうちの何れかのノードよりも末端側に存在する、該当のカテゴリに達しない部分木を補助決定木として該当のカテゴリに接続して、該当のカテゴリに属する解答者を補助決定木の末端に存在するカテゴリに誘導する(S14)。
【0020】
ステップS14で接続される補助決定木の例を
図4に示す。同図の例において、カテゴリJにおけるエントロピーの値が所定値よりも大きい、またはカテゴリJに属する解答者の人数が所定値よりも小さいものとする。これは、カテゴリJが、一般的な問1~問8の正誤情報の傾向とかけ離れた傾向を示しているために様々なタイプの解答者が偶発的に含まれている場合、あるいは、カテゴリJに該当する解答者の人数がそもそも少なく、エントロピーが収束しなかった場合(例えばJよりも末端にそれぞれ別の正誤情報を持つ解答者がごく少数、例えば1名ずつ存在するような場合)が想定される。
【0021】
同図の例の場合、カテゴリJに達するまでに経由したノードのうちの何れかのノード、例えばノード「問8」よりも末端側に存在する、カテゴリJに達しない部分木(「問6」→カテゴリK、「問6」→カテゴリL)を補助決定木としてカテゴリJに接続して、カテゴリJに属する解答者を補助決定木の末端に存在するカテゴリK、Lの何れかに誘導する。
【0022】
例えば、応用問題に該当する問題を学力が不足しているのにたまたま正解してしまった事例を多く含んでいると考えられるためにエントロピーが収束しない、あるいは学力が十分であるのに、あまり一般的でないミスをすることにより、たまたま不正解になってしまった事例を多く含んでいると考えられるためにエントロピーが収束しない、といった場合に、このようなカテゴリに属する解答者を、補助決定木が指し示す、より確からしいカテゴリに誘導することができるため、好適である。
【0023】
同図の例では、問1、問4、問5が不正解であったにも関わらず問8を正解することがそもそもレアケースである場合(例えば問8は、問1、問4、問5の応用問題)などが想定できる。この場合、カテゴリJは解答者を分類するカテゴリとして精度が低くなると考えられ、同図に示すように補助決定木で誘導を図ることにより、これらの解答者をカテゴリK、Lなどの別のカテゴリに振り替えることが可能となる。例えば、カテゴリJに属する解答者が補助決定木によりカテゴリLに属することになった場合、問8の正解は、例えば出題上の不備、採点方法の不備などにより、学力が伴わなくても正解することができる、すなわち外れ値または異常値としての正解、と捉えることができる。
【0024】
<パラメータ記憶部15>
パラメータ記憶部15は、各問題の正誤情報と各学習分野の理解度とを関連付けるパラメータを記憶する(S15)。
図3、
図4の例を用いれば、例えば問1→分野イ、問2→分野ロ、…、問8→分野チなどと、問題と分野が完全に1:1に関連付けられていてもよいし、問1→分野イ、ロ、ハ、…などと、一つの問題に複数の分野が関連付けられていてもよい。
【0025】
<補足情報記憶部16>
補足情報記憶部16は、各学習分野についての解答者の学習進捗度、または各学習分野についての解答者の主観的理解度の情報である補足情報を記憶する(S16)。
【0026】
<理解度生成部17>
理解度生成部17はパラメータを用いて、カテゴリのそれぞれに属する解答者の各学習分野の理解度を生成し、生成した各学習分野の理解度を補足情報に基づいて補正する(S17)。
【0027】
パラメータを用いた理解度の生成例を以下の表に示す。
【0028】
【0029】
補足情報に基づいた理解度の補正例を以下の表に示す。例えば、カテゴリAに分類された解答者が補足情報として問1=「未学習」と回答した場合、問1が分野イ、ロ、ハに関連した出題であった場合は、理解度は例えば下表のように補正される。
【0030】
【0031】
また、カテゴリAに分類された解答者が補足情報として問1=「自信なし」と回答した場合、理解度は例えば下表のように補正される。
【0032】
【0033】
また、例えば理解度生成部17は、所定のカテゴリに属する解答者向けに、目標となるカテゴリと現在属しているカテゴリの差分(各学習分野における理解度の差分)を表示してもよい(下表参照)。
【0034】
【0035】
<合否結果記憶部18>
合否結果記憶部18は、解答者が所定の学校を受験した結果である合否結果を記憶する(S18)。
【0036】
<合格率生成部19>
合格率生成部19は、カテゴリごとに、当該カテゴリに属する解答者の所定の学校における合格率を生成してカテゴリごとに出力する(S19)。合格率の生成例を下表に示す。
【0037】
【0038】
例えば学校を偏差値、文系-理系、国公立-私立などの尺度を用いて複数のクラスに分類し、クラスごとに合格率を生成してもよい。この場合の合格率の生成例を下表に示す。
【0039】
【0040】
[学力推定装置]
以下、
図5を参照して、上述の学力推定モデル生成装置1によって生成された学力推定モデルを用いて、学力を推定する装置である学力推定装置2の構成を説明する。
【0041】
同図に示すように学力推定装置2は、学力推定用モデル記憶部21と、学力推定部22を含む。
【0042】
<学力推定用モデル記憶部21>
学力推定用モデル記憶部21は、予め定めた複数の問題からなる問題群に解答した複数人の解答者が各問題を正解または不正解したことを示す正誤情報を教師データとして生成された決定木の、末端である葉ノードが示す分類結果のエントロピーが所定値以下となる葉ノードを消去し、葉ノード消去後の決定木の新たな末端のそれぞれを何れかの解答者が属するカテゴリとすることにより生成された学力推定用モデル(すなわち、学力推定モデル生成装置1によって生成された学力推定用モデル)を記憶する。
【0043】
<学力推定部22>
学力推定部22は、学力推定の対象者の正誤情報を取得し、学力推定用モデルに基づいて、対象者の学力を推定する(S22)。ただし、学力推定の対象者の正誤情報は、学力推定用モデル生成時に用いられた問題群と同じ問題群についての正誤情報であるものとし、出題時期も揃っているものとする。例えば、モデル生成時に用いた正誤情報が、高校二年生の夏時点での正誤情報であった場合、学力推定の対象者の高校二年生の夏時点での正誤情報を入力するものとする。
【0044】
<補記>
本発明の装置は、例えば単一のハードウェアエンティティとして、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、ハードウェアエンティティの外部に通信可能な通信装置(例えば通信ケーブル)が接続可能な通信部、CPU(Central Processing Unit、キャッシュメモリやレジスタなどを備えていてもよい)、メモリであるRAMやROM、ハードディスクである外部記憶装置並びにこれらの入力部、出力部、通信部、CPU、RAM、ROM、外部記憶装置の間のデータのやり取りが可能なように接続するバスを有している。また必要に応じて、ハードウェアエンティティに、CD-ROMなどの記録媒体を読み書きできる装置(ドライブ)などを設けることとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。
【0045】
ハードウェアエンティティの外部記憶装置には、上述の機能を実現するために必要となるプログラムおよびこのプログラムの処理において必要となるデータなどが記憶されている(外部記憶装置に限らず、例えばプログラムを読み出し専用記憶装置であるROMに記憶させておくこととしてもよい)。また、これらのプログラムの処理によって得られるデータなどは、RAMや外部記憶装置などに適宜に記憶される。
【0046】
ハードウェアエンティティでは、外部記憶装置(あるいはROMなど)に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてメモリに読み込まれて、適宜にCPUで解釈実行・処理される。その結果、CPUが所定の機能(上記、…部、…手段などと表した各構成要件)を実現する。
【0047】
本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
【0048】
既述のように、上記実施形態において説明したハードウェアエンティティ(本発明の装置)における処理機能をコンピュータによって実現する場合、ハードウェアエンティティが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記ハードウェアエンティティにおける処理機能がコンピュータ上で実現される。
【0049】
上述の各種の処理は、
図7に示すコンピュータの記録部10020に、上記方法の各ステップを実行させるプログラムを読み込ませ、制御部10010、入力部10030、出力部10040などに動作させることで実施できる。
【0050】
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD-RAM(Random Access Memory)、CD-ROM(Compact Disc Read Only Memory)、CD-R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP-ROM(Electrically Erasable and Programmable-Read Only Memory)等を用いることができる。
【0051】
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
【0052】
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
【0053】
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、ハードウェアエンティティを構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
【要約】
【課題】網羅的な学習データを必要とせず、現在の学力を精度よく推定する学力推定用モデルを生成することができる学力推定用モデル生成装置を提供する。
【解決手段】予め定めた複数の問題からなる問題群に解答した複数人の解答者が各問題を正解または不正解したことを示す正誤情報を教師データとして、決定木を生成する決定木生成部と、生成された決定木の末端である葉ノードが示す分類結果のエントロピーが所定値以下である場合に該当する葉ノードを消去する枝刈部と、葉ノード消去後の決定木の新たな末端のそれぞれを何れかの解答者が属するカテゴリとするカテゴリ生成部を含む。
【選択図】
図1