(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023008705
(43)【公開日】2023-01-19
(54)【発明の名称】合否予測システム
(51)【国際特許分類】
G06Q 50/20 20120101AFI20230112BHJP
【FI】
G06Q50/20 300
【審査請求】未請求
【請求項の数】5
【出願形態】OL
(21)【出願番号】P 2021129400
(22)【出願日】2021-08-05
(31)【優先権主張番号】P 2021110405
(32)【優先日】2021-07-01
(33)【優先権主張国・地域又は機関】JP
(71)【出願人】
【識別番号】712007762
【氏名又は名称】株式会社トワール
(74)【代理人】
【識別番号】100129986
【弁理士】
【氏名又は名称】森田 拓生
(72)【発明者】
【氏名】▲濱▼野 裕希
【テーマコード(参考)】
5L049
【Fターム(参考)】
5L049CC20
5L049CC34
5L049DD01
5L049DD04
(57)【要約】
【課題】対象者である受験生本人の特質ないし個人特性を考慮しつつ、主観的、或いは恣意的な特質評価を排除して、精度の高い合否予測システムを提供する。
【解決手段】IQ及びEQの指標に関するIQ・EQ質問群を提示することで、対象者からのIQ・EQ質問群への回答入力を記録する指標取得ステップと、複数の対象者の検査データの記録に基づき、対象者の性格指標を加算項に含む式を、対象者の合格予測指標の算出式として設定する予測指標値算出ステップと、前記取得した対象者の指標値に基づいて、前記設定された算出式による、対象者の予測指標値を算出する予測指標値算出ステップと、
前記算出したこの予測指標値と志望校の結果偏差値とを比較してこれらの値の差に基づいて合格予測結果を導出する合格予測導出ステップと、を有する。
【選択図】
図3
【特許請求の範囲】
【請求項1】
少なくともIQ及びEQの指標に関するIQ・EQ質問群に対する対象者からの回答を記録し、検査結果からIQ及びEQを含む対象者の指標値を取得する指標取得ステップと、
前記取得した指標の値と、時期の異なる複数の成績データを用いて、アルゴリズム作成ステップで作成された機械学習のアルゴリズムを使って、予測指標値である「確信度」を算出する予測指標値算出ステップと、
:前記予測指標値算出ステップで算出した予測指標値「確信度」を、過去の合否実績とこれに対応する過去の予測指標値「確信度」との関係表と照らし合わせて、合格率を導出する合格率導出ステップと、を含むことを特徴とする、合否予測システム。
【請求項2】
前記予測指標値算出ステップにおいて、過去の受験者の指標値及び成績データ及び合否データに基づく機械学習のアルゴリズムに基づいて、複数の対象者のデータ入力に基づく機械学習によって、各加算項の係数を決定することを特徴とする、請求項1に記載の合否予測システム。
【請求項3】
前記予測指標値算出ステップにおいて、
複数の対象者のデータ入力に基づく機械学習により、過去の合格者実績データの正解率を評価指標として、予め設定された複数の分類器モデルから尤も近い精度の分類器モデルからなる最も高い正解率の分類器を算出式として選択すると共に、ロジスティック回帰によって、選択した分類器において算出式の各加算項の係数を決定することを特徴とする、請求項1又は2に記載の合否予測システム。
【請求項4】
前記予測指標値算出ステップにおいては、
複数の前記指標取得ステップで取得した対象者の指標値に基づいて、前記設定された算出式による、各対象者の合否の予測指標値を「確信度」として算出して記録するものであり、
さらに前記予測指標値算出ステップにおいて、
算出された予測指標値「確信度」と実際の合否を並べて閾値ごとに区分し、各区分に対応する合格率を導出することを特徴とする、請求項1、2、又は3のいずれかに記載の合否予測システム。
【請求項5】
前記予測指標値算出ステップにおいては、
複数の前記指標取得ステップで取得した対象者の指標値に基づいて、前記設定された算出式による、各対象者の合否の予測指標値を「確信度」として算出して記録するものであり、
さらに前記合格率導出ステップにおいて、
算出された予測指標値「確信度」と実際の合否を並べて閾値ごとに区分し、各区分に対応する合格率を導出することを特徴とする、請求項1、2、3、又は4のいずれかに記載の合否予測システム。
【発明の詳細な説明】
【技術分野】
【0001】
受験生の志望校への合否を判別予測する合否予測システムに関する。
【背景技術】
【0002】
従来、受験生の志望校への合格可能性は、志望校の合格判定を、対象受験生が実際に受けた擬試験の偏差値をもとに算出されている。
【0003】
具体的には、多くの例において、対象受験生が実際に受けた模擬試験結果による「模擬試験偏差値」と、予備校や学習塾で算出された、各志望校の「結果偏差値」とを比較している。そして、「模擬試験偏差値」と「結果偏差値」の各値の差に基づいて、段階的に振り分けた合格可能性のパーセント数値を表示したり、或いは、例えばA+、A-、B+、B-、C、D、といった段階符号を各閾値の区分け基準にあてはめて表示したりしている。
【0004】
ここで「結果偏差値」は、過去に実施された模擬試験の結果と実際の入試結果をもとに算出された偏差値のことであり、各学校の実際の入試合格者の成績をもとに、模試の偏差値がどの程度なら合格できるかを統計的に算出している。
【0005】
例えば特許文献1に記載の成績表は、成績表を構成する各種情報について、その情報の種類および目的に応じグループ化して各領域毎に統一性を持った適切な配置構成を成し、また、偏差値について、志望校毎の合否につき明確な指標を示して視覚的に容易に意味を理解できるグラフと、それに連動した合格確率や受験アドバイス等を示す手段とを備えている。これによれば、成績表を構成する各種情報の種類および目的に応じ、成績表示ゾーンと、判定表示ゾーンと、受験指導表示ゾーンとにグループ化して独立な配置構成を成しており、また、偏差値分布表示部中においては、志望校毎の合否につき合格基準偏差値線及び受講生の偏差値といった明確な指標を示し、さらに、合格可能性表示部においては、メーター状の略半円形の表示部に指針による視覚的表現をもって合格可能性を示し、加えて、受験指導表示ゾーンにおいては、「チャレンジ校」と、「適正校」と、「安全校」とについて志望校選択指導を示す、とされる(特許文献1参照)。
【先行技術文献】
【特許文献】
【0006】
【発明の概要】
【発明が解決しようとする課題】
【0007】
従来の一般的な合格予測では、1回分の成績データを用いて、何人中何人が受かっているかという確率を使って予測していた。
しかしながら、1回分の成績データは、判定対象に用いる模擬試験の内容の偏りや、模擬試験の全受験者の学力傾向の偏り、過去の模擬試験の全受験者との学力傾向の相違などによって影響を受けてしまうという問題があった。
【0008】
また上記の他に、対象受験生本人の特質、つまり、対象受験生の性格や環境といった個人特性が、模擬試験偏差値に反映されていないという問題が挙げられる。
対象受験生本人の特質や個人特性は、判定対象の模擬試験実施日から志望校の受験当日までの学力の変化にも影響があり、さらには受験当日の能力の発揮具合にも影響があると考えられる。
【0009】
このような対象受験生本人の特質を考慮せず、1回の模擬試験の成績データのみに基づく判別予測を行うことは合否予測の精度の低下につながり、合格可能性の表示自体の信頼性、不適切な志望校変更への誘発といった問題にも関わる。
【0010】
一方で、対象受験生本人の特質ないし個人特性を客観的な合否判別用の指標として表したり、合否判別との客観的な相関性を図ったりすることは容易ではない。このため、仮に前記特質ないし個人特性を考慮したとしても、主観的、或いは恣意的な特質評価によって、結果的に精度の低い合否予測となってしまうおそれがある。
【0011】
上記課題にかんがみ、対象受験生本人の特質ないし個人特性を考慮しつつ、主観的、或いは恣意的な特質評価を排除して、精度の高い合否予測システムを提供することを課題とする。
【課題を解決するための手段】
【0012】
上記課題を解決すべく、以下[1]~[5]の手段を講じている。
【0013】
[1]
合否予測システムは、
少なくともIQ及びEQの指標に関するIQ・EQ質問群に対する対象者からの回答を記録し、検査結果からIQ及びEQを含む対象者の指標値を取得する指標取得ステップと、
前記取得した指標の値と、時期の異なる複数の成績データを用いて、アルゴリズム作成ステップで作成された機械学習のアルゴリズムを使って、予測指標値である「確信度」を算出する予測指標値算出ステップと、
:前記予測指標値算出ステップで算出した予測指標値「確信度」を、過去の合否実績とこれに対応する過去の予測指標値「確信度」との関係表と照らし合わせて、合格率を導出する合格率導出ステップと、を含むことを特徴とする。
複数の成績データIQ,EQ,動機付けなどの指標と全ての成績データを用いて、機械学習のアルゴリズムを使った予測指標値である「確信度」を算出し、この予測指標値である「確信度」に基づいて合格率を導出することで、より精度の高い合否予測システムとなる。
【0014】
[2]
前記予測指標値算出ステップにおいて、過去の受験者の指標値及び成績データ及び合否データに基づく機械学習のアルゴリズムに基づいて、複数の対象者のデータ入力に基づく機械学習によって、各加算項の係数を決定することを特徴とする。
【0015】
[3]
前記予測指標値算出ステップにおいて、
複数の対象者のデータ入力に基づく最尤推定のMax
Voting(最大値投票)又はWeighted Average Voting(重量平均値投票)によるアンサンブル機械学習によって過去の合格者実績データのAccuracy(正解率)を評価指標として、予め設定された複数の分類器モデルから尤も近い精度の線形分類器又は二次分類器からなる最も高いAccuracy(正解率)の分類器を算出式として選択すると共に、ロジスティック回帰によって、選択した分類器において算出式の各加算項の係数を決定することを特徴とする。
【0016】
[4]
前記予測指標値算出ステップにおいては、
複数の前記指標取得ステップで取得した対象者の指標値に基づいて、前記設定された算出式による、各対象者の合否の予測指標値を「確信度」として算出して記録するものであり、
さらに前記予測指標値算出ステップにおいて、
算出された予測指標値「確信度」と実際の合否を並べて閾値ごとに区分し、各区分に対応する合格率を導出することを特徴とする。
【0017】
[5]アルゴリズム作成ステップにおいては、受験生対象者の偏差値、及び受験生対象者のIQ・EQ及び対象者の動機付けに関する指標の各指標を検査データとしてもよい。
また、過去の指標値の検査データと実際の合否結果のデータを複数の対象者それぞれについて記録し、記録した結合データと過去の合格実績の統計に基づいて、アンサンブル機械学習を行うこととしてもよい。
教育検査データと成績データを結合させ、結合データに基づいて、過去の合格実績とのACCURACY(全予測正答率)を評価値として機械学習を行うことで、蓄積された検査データと実際の合格実績に基づく精度の高い合格予測を行うことができる。
【0018】
上記の対象者へ教育検査を受検させ、その内容を記録する指標取得ステップにおいて、対象者が教育検査を受けていない場合は、教育検査データを用いていないアルゴリズムを代替適用することが可能である。
【0019】
成績データの入力においてインポートまたは入力した成績データと教育検査データとを結合した結合データを作成する場合、教育検査データが無ければ、結合はしない成績データのみを用いて標準化し、欠損値は多重代入法で補完するものとしてもよい。
【0020】
そして予測指標値算出ステップとして、あらかじめ作成されたアルゴリズムから予測指標値である確信度の算出を行う。すなわち、アルゴリズム作成ステップで作成された機械学習のアルゴリズムにデータを通し確信度を算出する。そして、予測合格率を出す合格率導出ステップとして、算出された確信度と過去の合格率表とから予測合格率を出す。
【発明の効果】
【0021】
本発明は上記手段によって、対象受験生本人の性格傾向(性格特性)の検査結果を判別要素に含むこととし、これを判別予測式の加算項に含むものとした。これにより、判別予測式の計算結果という客観的な指標に基づいて合否予測を行うことができ、比較的精度の高い合否予測を行うものとなった。
【図面の簡単な説明】
【0022】
【
図3】欠損データの多重代入による分析統合の概念図。
【
図4】アルゴリズム選択における各分類器のACCURACY値の対比画像例。
【
図5A】教育検査データ及び成績データからなる結合データ例の一部。
【
図5B】教育検査データ及び成績データからなる結合データ例の一部。
【
図5C】教育検査データ及び成績データからなる結合データ例の一部。
【
図6A】志望校ごとの合否結果と成績データの過去実績データ例の一部。
【
図6B】志望校ごとの合否結果と成績データの過去実績データ例の一部。
【
図6C】志望校ごとの合否結果と成績データの過去実績データ例の一部。
【
図7】予測指標である「確信度」と合格率の分散区分のデータ例。
【発明を実施するための形態】
【0023】
以下、本発明の実施形態について、実施例として示す各図とともに説明する。なお、以下において各種の用語の直後に数字又はアルファベットとして示す文字列は、実施例として図面を参酌するために便宜的に付した符号であり、文字列それ自体が概念を有するものではなく、用語の意義を限定するものでもなく、実施例等の構成に限定するものでもない。
本発明の合否予測システムは例えば
図1に示す構成によって運用される。
【0024】
(予測方法)
本発明の合否予測プログラムによる予測方法は、
各対象者、又は各対象者の特定の関係者である第三者、を被験者として、各対象者を対象に試行する選択式のテストの入力結果によって、対象者からのIQ・EQ質問群への回答入力を記録し、対象者のIQ指標値、EQ指標値、及びGRIT指標値を取得する指標取得ステップと、
過去の複数の受験生の指標(IQ,EQ指標及び成績データを含む指標)と、各受験生の実際の合格率に基づいて機械学習のアルゴリズムを行い、対象者の合格予測指標である「確信度」の算出式を作成するアルゴリズム作成ステップと、
前記指標取得ステップで取得した対象者の指標値に基づいて、前記設定された算出式による、対象者の予測指標値(確信度)を算出する予測指標値算出ステップと、
前記算出したこの予測指標値と志望校の結果偏差値とを比較して、過去の予測指標値と志望校の合格率を紐づけた合格率表に基づき、合格予測結果を導出して出力する合格率導出ステップと、を有する。
【0025】
また、前記指標取得ステップでは各対象者本人、及び各対象者の特定の関係者である第三者、を被験者として、各対象者を対象に試行する選択式のテストの入力結果によって、対象者それぞれのIQ指標値、EQ指標値、及びGRIT指標値を、本人の指標値、又は本人以外の第三者の指標値として被験者ごとに割出すものである。
【0026】
対象受験生の性格傾向(性格特性)は、例えば外向性(E)、協調性(A)、良識性(C)、情緒安定性(N)、知的好奇心(O)からなる、いわゆるビッグファイブの基本尺度に加え、思考力、主体性、といった追加尺度の各尺度によって統計的に算出される。これらは、対象受験生の受験当日までの学力の変化、ないし、受験当日の判断に少なからず寄与する。
【0027】
より具体的には、本発明のシステムは以下の各ステップを手順に含む。
【0028】
(アルゴリズム作成ステップ)
まずアルゴリズム作成ステップとして、過去の生徒のIQ・EQ、動機付けなどの指標の値と全ての成績データ、志望校の偏差値(学校別でやる場合は必要なし)、合否データを用いて合否を予測する機械学習のアルゴリズムを作成する。
【0029】
(合格率表作成ステップ)
次に合格率表作成ステップとして、前記アルゴリズム作成ステップで算出される確信度と実際の合否を照らし合わせ、確信度と合格率が紐づいた合格率表を作成する。
【0030】
(指標取得ステップ)
次に指標取得ステップとして、合格予測をしたい対象者のIQ・EQ,動機付けなどの検査をし、検査結果からIQ及びEQを含む対象者の指標値を取得する。
【0031】
(予測指標値算出ステップ)
次に、指標取得ステップとして、取得した指標値と、対象者の過去の全ての成績データを用いて、アルゴリズム作成ステップで作成された機械学習のアルゴリズムを使って、予測指標値である「確信度」を算出する。
【0032】
(合格率導出ステップ)
そして合格率導出ステップとして、前記予測指標値算出ステップで出た予測指標値「確信度」を、前記合格率表作成ステップで作成された合格率表と照らし合わせて、合格率を導出する。
【0033】
・指標取得ステップ(データの入力)
指標取得ステップは、データの入力ステップである。本ステップにおいて、
合否データ(第一志望校の名称と合否結果)と、成績データのインポートをする。
インポートする成績データが無ければ、一般化されているアルゴリズムを使用することになる)
【0034】
前記指標取得ステップにおけるデータ準備として、
昨年度生の「EQ,IQ、性格検査、本人への動機付けアプローチを含む教育検査データ」、「成績データ」、及び「合否データ」を結合する。
ここで上記動機付けアプローチとは、構成員に対して成績向上の動機づけを与えるための積極的アプローチを意味し、すくなくとも、構成員に対する励まし・助言・指導、構成員の意見(不満ないし悩み)の聞き取りを含む。
【0035】
また、指標取得ステップにおけるデータ準備として、教育検査データと成績データを結合する。なお教育検査データが無ければ、結合はしない。例えば
図3に示す概念に従って標準化し、欠損値は多重代入法で補完する。
【0036】
続く予測指標値算出ステップ(アルゴリズムから予測指標値である確信度を算出するステップ)として、作成されているアルゴリズムにデータを通し、予測指標値である確信度を算出する。
【0037】
そして最後に合格率導出ステップ(予測合格率を出すステップ)として、
算出された確信度と表から予測合格率を出す。
【0038】
(指標値のカテゴリと具体例)
「EQ,IQ及び性格検査を含む教育検査データ」について指標のカテゴリと具体例を示す。
【0039】
<カテゴリその1>
成績指標:各科目,全体のこれまでの偏差値全て
【0040】
<カテゴリその2>
志望校指標:その受験機関(塾や予備校)におけるA判定偏差値
ただし「A判定偏差値」は、受験機関の任意の基準によって設定される、志望校
指標の一例である。この志望校指標は、所属する生徒や過去の受験動向によって影響されるため、変動する。
例えば、ある塾では、前年度の在籍生徒の入試結果から、志望校への合格率80パーセント以上の所属生徒の偏差値を「A判定偏差値」と設定しているが、他の塾では、85パーセント以上の生徒の偏差値を「A判定偏差値」としている。
【0041】
<カテゴリその3>
IQ指標:流動性知能(gf),処理速度(gs),作業記憶(gwm)
【0042】
<カテゴリその4>
EQ指標:知的好奇心(o),勤勉性(c),外向性(e),協調性(a),情緒安定性(n)
【0043】
<カテゴリその5>
その他指標:注意(AttKEi/AttADe/AttBDe),GRIT,GRIT-E,GRIT-I,過去の成績がどれくらい取れていたか(GraP),出席に対する自己効力感(EffB/ExpB),実際の出席率(AbsLGe),塾に対する満足度(EvaE),塾の先生に対する満足度(EvaT),科目ごとの目標成績(GoaLGe),成績に対する自己効力感(EffG/ExpG),テスト不安(AnxE),学習におけるGRIT-E(GeL),学習におけるGRIT-I(GiL),セルフコンパッション(SelC),情動の評価と表現(EmoA),情動の制御(EmoR),情動の利用(EmoU),科目ごとの実践的利用価値(MotLP/ForLP),科目ごとの制度的利用価値(MotLS/ForLS),科目ごとの興味(MotLL/ForLL),各科目の先生が実践的利用価値について話しているか(RecP),各科目の先生が制度的利用価値について話しているか(RecS),各科目の先生が利用価値の自己生成について話しているか(RecG),変動性のある動機付け(MotV),テスト観(改善)(TesD),テスト観(強制)(TesF),行動的エンゲージメント(EngB),感情的エンゲージメント(EngE),認知的エンゲージメント(EngC),各科目の先生との関係(RelT),先輩との関係(RelS),家族との関係(RelFa),友人との関係(RelFr),人生に対する満足度(SatL),学校に対する満足度(SatS),家に対する満足度(SatH),自分の時間に対する満足度(SatM),学習に対する競争心(MotLC),ストレス全般(StrAAa),ソーシャルサポート全般(SupAAa),主観的健康感(SymAAa),家庭環境ストレッサー(StrHo),学業ストレス(StrLDe),友人関係ストレス(StrLFr),先輩関係ストレス(StrLSe),先生関係ストレス(StrLTe),友人からのソーシャルサポート(SupLFr),先輩からのソーシャルサポート(SupLSe),先生からのソーシャルサポート(SupLTe),家族からのソーシャルサポート(SupHo),統御力(DisC),楽観性(DisO),社交性(DisS),行動力(DisE),他者心理の理解(ObtO),問題解決志向(ObtP),自己理解(ObtS),不安反応(ReaA),怒り反応(ReaR),無気力(ReaL),身体的反応(ReaP),生年月日(birth)
【0044】
次に、指標の演算例として、上記指標値のうち、例えばカテゴリ4の中の勤勉性(C)の指標、塾の先生に対する満足度(EvaT)指標、先生が実践的利用価値について話しているか(RecP)の指標のそれぞれについて説明する。
各指標は、いずれも以下のように、重加算による係数を乗じた加算項式にて演算する。
・勤勉性(C) = (EQ03+EQ10+EQ36+EQ42+(6-EQ17)+(6-EQ24)+(6-EQ30)+(6-EQ48))/4
・塾の先生に対する満足度(EvaT) = (EvaT1+EvaT2+EvaT3+EvaT4+EvaT5+EvaT6)/6
・先生が実践的利用価値について話しているか(RecP) = (RecP1+RecP2+RecP3)/3
【0045】
(算出式)
アルゴリズム作成ステップにおいて、対象者のIQに関する指標値、EQに関する指標値、及び、対象者が与えられる動機付けの指標値、のそれぞれを変数とするアルゴリズムを作成する。
【0046】
具体的には、過去の生徒のIQ,EQ,動機付けなどの指標の値と全ての成績データ、志望校の偏差値(学校別でやる場合は必要なし)、合否データを用いて合否を予測する機械学習のアルゴリズムを作成する。機械学習における各種分類器のパラメータをaccuracyが最大化するように調整し、各種分類器モデルを用いたアンサンブル学習の結果の中で、accuracyが最大になるアルゴリズムを採用する。
【0047】
(指標取得ステップ)
指標取得ステップでは、対象者の検査テストの入力結果に基づき、IQ・EQ,GRITの各指標値を導出して候補者の識別タグと共に記憶する。なお、本人評価に加えて関係者の検査に基づく対象者評価を行って得られる関係者評価指標を用いてもよい。関係者評価指標を用いる場合は、本人評価による各指標値の導出・記憶に加えて、第三者評価による各指標値の導出値と当該第三者の属性データとからなる追加データが、ギャップ機能として、当該候補者の識別タグデータと共に追加記憶される。
【0048】
(ギャップ機能(測定者による数値差の比較)について)
ギャップ機能とは、例えば、 AさんのIQ・EQをAさん自身が本人測定として検査をして測った数値と、AさんのIQ・EQをAさん以外の人が第三者測定として検査をして測った数値とを比較する機能である。指標取得ステップにおいては、本人測定による各指標値の記憶データに加えて、本人を知る第三者測定者(本人の関係者、例えば父親、母親又は担当教員の特定のいずれか)による各指標値が、第三者測定データとして追加記憶される。また、本人測定による各指標値と第三者測定による各指標値のギャップ(値の差)を追加記憶してもよい。
【0049】
(アルゴリズム作成ステップ及び予測指標値算出ステップ)
機械学習は、
アルゴリズム作成ステップにおいて、
複数の対象者のデータ入力に基づく最尤推定の機械学習によって、予め設定された複数の分類器モデルから尤も近い制度の分類器モデル(線形分類器又は二次分類器等からなる複数の分類器モデル)を算出式として選択すると共に、選択した分類器モデルにおいて算出式の各加算項の係数を決定する。
具体的には、 LogisticRegression,、 XGBClassifier,、 LGBMClassifier, 、KNeighborsClassifier, 、DecisionTreeClassifier,といった各種の分類器モデル(線形分類器モデル又は二次分類器モデル)を予め登録しておき、これらをアルゴリズムの候補として用い、調整された分類器を用いてアンサンブル学習を全ての組み合わせで行うと共に、Accuracyが最大となる分類器モデルを選択する。
【0050】
(標準化及び補完)
入力またはインポートする教育検査データが無ければ、成績データと合否データのみを用いて標準化し、欠損値は多重代入法で補完する。
【0051】
(データの欠損値の多重代入法による補完の具体例)
ここで「データの欠損値の多重代入法の具体例」について、多重代入法による例を説明する。
【0052】
(多重代入法)
多重代入法とは、観測データを条件として、欠測データの事後分布を構築し、この事後分布からの無作為抽出を行うことで、補定にまつわる不確実性を反映させた M 個(M > 1)のシミュレーション値を生成する代入法である。
【0053】
M 個の補定済データセットを別々に使用して統計分析を行い、しかるべき手法により結果を統合し、点推定値を算出する。
【0054】
・アルゴリズム作成ステップ(アルゴリズムの選択)
アルゴリズム作成ステップとして、機械学習における各種分類器のパラメータをaccuracyが最大化するように調整する。
調整された各種分類器モデルを用いてアンサンブル学習を全ての組み合わせで行う。
・アルゴリズムは、test_scoreすなわちaccuracyが最大のものを採用する。
具体的には、各種分類器モデルを用いたアンサンブル学習の結果の中で、accuracyが最大になるアルゴリズムを採用する。
【0055】
・合格率表作成ステップ
合格率表作成ステップは過去の複数の受験生の確信度と実際の合格率とを紐づけた合格率表を作成する表作成ステップである。本ステップでは作成されたアルゴリズムから出される確信度と、実際の合格率の表を段階に分けて作成する。
【0056】
前記アルゴリズム作成ステップの「各分類器のパラメータの具体例」を以下に列挙する。
eval_metric,
logging_level,
depth,
learning_rate,
l2_leaf_reg,
iterations,
random_state
【0057】
アルゴリズム作成ステップの「accuracy 最大化調整手順(調整方法、調整後のパラメータ)の具体例、出力の具体例を以下に挙げる。
params = {'depth': [4],
'learning_rate' : [0.1],
'l2_leaf_reg': [3],
'iterations': list(range(200, 751, 50))}
ctb =
CatBoostClassifier(eval_metric="Accuracy", logging_level='Silent',
random_state=1)
clf9 =
GridSearchCV(ctb,
params,
scoring='accuracy’)
【0058】
調整された各種分類器を用いてアンサンブル学習を全ての組み合わせで行う例について具体例を挙げる。以下は、アンサンブル学習及びアンサンブル学習後の、各分類器モデルの出力CODEの具体例である。
【0059】
(分類器モデル1によるアンサンブル学習CODEの例)
clf1 =
LogisticRegression(random_state=30,
C=2,
penalty='l1',
solver='liblinear')
【0060】
(分類器モデル2によるアンサンブル学習例)
clf2 =
XGBClassifier(n_estimators=140,
random_state=0,
max_depth=12,
min_child_weight=0.01)
【0061】
(分類器モデル3によるアンサンブル学習CODEの例)
clf3 =
lgb.LGBMClassifier(objective='binary',
random_state=1,
metric='accuracy',
verbosity=-1,
colsample_bytree=0.9290041923024333,
learning_rate=0.001,
max_bin=261,
max_depth=10,
min_child_samples=63,
n_estimators=3700,
num_leaves=15,
reg_lambda=0.01,
subsample=0.8847077660854132)
【0062】
(分類器モデル4によるアンサンブル学習CODEの例)
Clf4 =
CatBoostClassifier(eval_metric="Accuracy",
logging_level='Silent',
depth=4,
learning_rate=0.05,
l2_leaf_reg=4,
iterations=250,
random_state=1)
【0063】
上記分類器モデル1~4の比較演算CODEの例を挙げる。すなわちアルゴリズム作成ステップにおける、accuracy最大となる分類器モデルの選択手順である。
models = [clf1, clf2, clf3, clf4]
n = range(1,5)
for j in n:
for team in
itertools.combinations(models,j):
mv_clf = MajorityVoteClassifier(classifiers=team)
mv_clf.fit(x_train, y_train)
y_pred = mv_clf.predict(x_test)
上記のコードから全ての組み合わせのaccuracyを求め、accuracyが最大となる組み合わせを決定する。
【0064】
(アルゴリズム採用について)
アルゴリズム作成ステップにおいては、上記全ての調整後分類器の組み合わせの中でaccuracyが最大になるアルゴリズムを採用する。
【0065】
「実際に使っている分類器モデルのアルゴリズム(5種)の名称(分類)」
分類器モデルは線形分類器だけではなく、以下の分類器を使用している。
(使用している分類器モデル)
LogisticRegression,
XGBClassifier,
LGBMClassifier,
KNeighborsClassifier,
DecisionTreeClassifier,
RandomForestClassifier,
SVC,
AdaBoostClassifier,
GradientBoostingClassifier,
CatBoostClassifier,
【0066】
最大accuracyの採用の手順として、アンサンブル学習をした結果の中でaccuracyが一番高いものが採択される。
【0067】
(予測指標値の算出)
前記予測指標値算出ステップにおいては、
複数の前記指標取得ステップで取得した対象者の指標値と選択されたアルゴリズムとに基づいて、前記設定され調整された各種分類器によって機械学習を行い、各対象者の指標値(確信度)を算出して記録する。
【0068】
また、合格率導出ステップにおいて、
過去の実際の確信度と合格率表とを紐づけて区分した合格率表に基づいて、算出された予測指標値「確信度」から予測合格率を導出して出力する。
【0069】
(検証試験)
検証試験として、模擬テストの偏差値の履歴のみによる尺度判断と、模擬テストの偏差値の履歴に加えて性格検査に基づくIQ・EQの指標を加えた尺度判断と、性格検査に基づくIQ・EQの指標のみによる尺度判断のそれぞれについて、実際の志望校の偏差値との差を比較した(
図4)。公表される志望校の偏差値の区分と、模擬テストの偏差値の区分の比較を含むものとしている。
【0070】
本発明のシステムは上記の実施例又は具体例の説明に限定されず、本発明の趣旨を逸脱しない範囲で適宜の変更、他の機械学習手法の選定、或いは、一部構成要素の抽出又は省略、公知の構成要素への置換、或いは構成要素同士の結合が可能である。
【0071】
(課題及び本発明の特徴)
本発明のシステムの特徴は、IQ,EQ,動機付けなどの能力検査指標・性格検査指標及び本人へのアプローチ環境に関する指標と、複数の期間に亘る過去の複数回の成績データとを用いて機械学習のアルゴリズムを使って予測するところにある。
【0072】
一般的にこれまでは、1回分の成績データを用いて、何人中何人が受かっているかという確率を使って予測していたが、成績データの試験内容の偏りやデータ時期によって影響を受けるため、前記のような確率の数値を合格予測に用いることの危険性があった。
【0073】
これに対し、本発明のシステムにおいては、複数の期間にわたる複数回分の成績データと、本人へのアプローチ環境に関する指標、さらに、本人の能力検査指標・性格検査指標を用いて予測することで、前記影響や危険性を抑制することができる。
すなわち本発明のシステムにおいては、受験生のIQ・EQ及び性格指標検査に基づく教育検査の各指標の検査データと、複数の期間に亘る複数回の模擬試験による偏差値データと、を結合させた結合データを複数の対象者それぞれについて記録し、記録した結合データと過去の合格実績の統計に基づいて、機械学習のアルゴリズムを使って予測することを特徴とする。
【0074】
本発明のシステム態様として、クラウドサーバー上で動作可能なアプリケーションに利用者がアクセスして操作する、WEBサービスソフトウェア(SaaS)のシステム態様が挙げられる。
また、本発明の他のシステム態様として、操作端末へインストールすることで起動可能なアプリケーション単体で用いることができる。
或いは、データを集約する集計サーバーとのデータ送受信を介して各端末にて成績データ、偏差値データ及び性格検査データの蓄積及び補充を行うこともできる。指導実績の評価データを組み合わせてデータ補充するなどの追加データの組合せを行い、フィードバック分析によって比較表を更新し、予測精度を上げることができる。
【0075】
(合否予測方法)
本発明の合否予測方法は、下記の各ステップを順に行うことを特徴とする。
先ず、予め行う準備ステップとして、アルゴリズム作成ステップにて機械学習のアルゴリズムを作成し、合格率表作成ステップにて、作成されたアルゴリズムから出される確信度と、実際の合格率の表を段階区分して関連づけた合格率表を作成しておく。これら準備ステップは、蓄積データとして更新していくことが好ましい。
【0076】
そして、対象者の合格予測方法として下記の各ステップを順に行う。
【0077】
・指標取得ステップ
先ず指標取得ステップとして、対象者に教育検査を受検させてIQ、EQ、本人への動機付けアプローチを含む指標を取得する。また、対象者の関係者への検査によって対象者本人の指標を関係者指標として取得してもよい。教育検査を受けない場合は、教育検査データを用いていないアルゴリズムが適用される。
さらに、対象者の成績データをインポートもしくは入力して、前記教育検査データと成績データを結合する。ただし教育検査データが無ければ、結合はしない。また、欠損値は多重代入法で補完する。
【0078】
・予測指標値算出ステップ
次に予測指標値算出ステップとして、作成された機械学習のアルゴリズムにデータを通し、予測指標値である「確信度」を算出する。
【0079】
・合格率導出ステップ
そして、合格率導出ステップとして、算出された確信度と合格率表から予測合格率を導出する。
【0080】
本発明は上記各実施形態によって実施されるが、必ずしも各実施形態のコード、アルゴリズム又はシステムに限定する趣旨ではなく、本発明の要旨を逸脱しない範囲で適宜の変更、公知要素への置換、一部構成要素の抽出又は省略、各構成要素同士の組合せが可能である。また高校、大学等の受験機関に限らず各種試験の受験生を対象とした合否予測、或いは会社等の団体への合否予測として活用してもよい。