(58)【調査した分野】(Int.Cl.,DB名)
前記サービスサーバで、前記ユーザモデリングベクトルを用いて前記ユーザの苦手問題モデルを生成し、前記問題データベースで前記苦手問題モデルと予め設定された範囲以内の類似性を有する問題を前記ユーザに推薦するステップを含むことを特徴とする、請求項2に記載の学習コンテンツ提供方法。
【発明を実施するための形態】
【0010】
本発明は、以下に記載される実施形態の説明内容に限定されるものではなく、本発明の技術的要旨を逸脱しない範囲内で多様な変形が可能であることは自明である。そして、実施形態を説明するに当たって、本発明が属する技術分野に広く知られており、本発明の技術的要旨と直接的に関連のない技術内容に対しては説明を省略する。
【0011】
一方、添付した図面で同一な構成要素は同一な符号で表現される。そして、添付図面において、一部の構成要素は誇張、省略されるか、または概略的に図示されることもある。これは、本発明の要旨と関連のない不要な説明を省略することによって本発明の要旨を明確に説明するためである。
【0012】
最近、ITデバイスの普及が拡大されるにつれて、ユーザ分析のためのデータ収集が容易になっている。ユーザデータが十分に収集できれば、ユーザの分析がより精密になり、該当ユーザに最も適した形態のコンテンツを提供することができる。
【0013】
このような流れと共に、特に教育業界でオーダーメード型教育コンテンツ提供に対するニーズが高い。
【0014】
簡単な例として、あるユーザが英語科目で“動詞の時制”に対する理解度が劣る場合、“動詞の時制”に対する概念を含んでいる問題が推薦できれば学習効率はより高まるはずである。ところで、このようにオーダーメード型教育コンテンツを提供するためにはそれぞれのコンテンツ及びユーザ個々人に対する精密な分析が必要である。
【0015】
従来にはコンテンツとユーザを分析するために、該当科目の概念を専門家により手作業で定義し、該当科目に対する各問題がどんな概念を含んでいるのか専門家が個別的に判断してタギングする方式に従った。以後、各ユーザが特定概念に対してタギングされた問題を解いてみた結果情報に基づいて学習者の実力を分析するものである。
【0016】
しかしながら、このような方法はタグ情報が人の主観に依存する問題点があった。人の主観が介入されず、数学的に生成されたタグ情報が数学的に問題に与えられるものでないので、結果データに対する信頼度が高くないという問題があった。
【0017】
したがって、本発明の実施形態に係るデータ分析サーバは、学習データ分析にマシン
ラーニングフレームワークを適用してデータ処理過程の人の介入を排除することができる。
【0018】
これによれば、ユーザの問題解釈結果ログを収集し、ユーザと問題で構成された多次元空間を構成し、ユーザが問題を当てたか間違えたかを基準に前記多次元空間に値を与えて、それぞれのユーザ及び問題に対するベクトルを計算する方式によりユーザ及び/又は問題をモデリングすることができる。
【0019】
延いては、前記ユーザベクトル及び/又は問題ベクトルを用いて全体ユーザで特定ユーザの位置、特定ユーザと類似のグループにクラスタリングすることができる他のユーザ、他のユーザと該当ユーザの類似性、全体問題で特定問題の位置、前記問題と類似のグループにクラスタリングすることができる他の問題、他の問題と該当問題の類似性などを数学的に計算することができる。延いては、少なくとも一つ以上の属性を基準にユーザ及び問題をクラスタリングすることができる。
【0020】
この際、本発明で前記ユーザベクトル、前記問題ベクトルがどんな属性、または特徴を含んでいるかは制限して解釈できないことに留意しなければならない。
【0021】
例えば、本発明の実施形態によれば、前記ユーザベクトルは前記ユーザが任意の概念に対して理解している程度、即ち概念の理解度を含むことができる。延いては、前記問題ベクトルは前記問題がどんな概念で構成されているのか、即ち概念構成度を含むことができる。
【0022】
ところで、マシン
ラーニングを適用して学習データを分析すれば、幾つかの解決しなければならない問題が存在する。
【0023】
第1は、問題分析結果として正答か誤答かのみをベクトル値抽出のためのパラメータとして使用する場合には、任意の信頼度以上の分析結果を提供するためには問題解釈結果データを大量収集しなければならないということである。
【0024】
選択式問題は問題文だけでなく、選択肢要素が含まれて構成される。ところで、分析のソースとして正答か誤答かだけを反映する従来の方法によれば、2学生が同一な問題を間違えたが、異なる選択肢を選択した場合、2学生のベクトル値計算に該当問題が及ぼす影響は同一である。
【0025】
言い換えると、ある学生がある問題を“動名詞”に対する選択肢を選択して間違えた場合と“動詞の時制”に対する選択肢を選択して間違えた場合、従来の方式によれば、該当問題のベクトル値の計算に該当学生の解釈結果データが及ぼす影響は同一であり、該当問題の解釈結果はユーザ解釈に十分反映できず、実質的に効果が弱いはずである。
【0026】
したがって、2学生が各々動名詞に対する理解度と動詞の時制に対する理解度が劣るという結果値を得るためには効果が弱い結果を克服できる程度のより多い量の問題解釈結果データの収集が求められる。
【0027】
即ち、正誤答結果のみをデータ分析のための入力値に使用する従来の方式によれば、問題とユーザを任意の範囲以上の信頼度で分析するためには、より多い量の問題解釈結果データが収集されなければならない。
【0028】
本発明の実施形態によれば、前記のような問題を解決することができる。より詳しくは、本発明の実施形態によれば、問題解釈結果データでユーザが選択した選択肢パラメータを適用して、ユーザ及び/又は問題を分析することができる。これを通じて、同一な問題解釈結果データを該当問題の選択肢個数だけ拡張することができるので、同一な結果データで、より精密にユーザと問題を分析することができる効果がある。
【0029】
図1は、本発明の実施形態に従って問題解釈結果データを分析する方法を説明するためのフローチャートである。
【0030】
ステップS110及びステップS115は、本発明の実施形態に従うデータ分析システムで学習データを収集し、問題とユーザをモデリングするステップである。
【0031】
本発明の実施形態によれば、ステップS110で全体問題と全体ユーザに対して解釈結果データが収集できる。
【0032】
より詳しくは、データ分析サーバは問題データベースを構成し、前記問題データベースに属する全体問題に対する全体ユーザの解釈結果データを収集することができる。
【0033】
例えば、データ分析サーバは市販されている各種の問題に対するデータベースを構築し、ユーザが該当問題を解いた結果を収集する方式により解釈結果データを収集することができる。前記問題データベースは聞き取り評価問題を含み、テキスト、イメージ、オーディオ、及び/又は動映像形態でありうる。
【0034】
この際、データ分析サーバは収集された問題解釈結果データをユーザ、問題、結果に対するリスト形態に構成することができる。例えば、Y(u、i)はユーザuが問題iを解いた結果を意味し、正答の場合は1、誤答の場合は0の値が与えられる。
【0035】
延いては、本発明の実施形態に従うデータ分析サーバは、ユーザと問題で構成された多次元空間を構成し、ユーザが問題を当てたか間違えたかを基準に前記多次元空間に値を与えて、それぞれのユーザ及び問題に対するベクトルを計算することができる(ステップS120)。この際、前記ユーザベクトルと問題ベクトルが含む特徴は特定されないことと解釈されなければならない。
【0036】
本発明の実施形態に従うデータ分析フレームワークでユーザと問題をモデリングベクトルで表現する理由は、窮極的には特定ユーザが特定問題を当てるか間違えるかを精密に予測するためのものである。
【0037】
ところで、ユーザの問題に対する正答率は前述したようにユーザの正誤答結果を収集して分析する方式により推定することができるが、選択肢の選択確率を用いて推定することもできる。
【0038】
例えば、第1ユーザが特定問題に対する選択肢の選択確率が(0.1、0.2、0、0.7)の場合、ユーザは高い確率で選択肢4番を選択するはずであり、該当問題の正答が4番の場合、第1ユーザはその問題を当てる確率が高いと予想することができる。
【0039】
延いては、問題の難易度は全体ユーザの正誤答結果を収集して分析する方式により推定することもできるが、選択肢の選択確率を用いて推定することもできる。
【0040】
例えば、四肢択一式で構成された特定問題に対し、ユーザの選択肢の選択確率が(0.5、0.1、0.3、0.6)の場合、ユーザが第2問題から選択肢1番を選ぶ確率と選択肢4番を選ぶ確率が似ているので、第2問題は難易度が高いと分類することができる。
【0041】
このために、
図1の例で、データ分析サーバは全体問題と全体ユーザに対する解釈結果データをユーザが選択した選択肢要素を含んで収集することができる(ステップS130)。より詳しくは、データ分析サーバは問題データベースを構成し、前記問題データベースに属する全体問題に対して全体ユーザがどの選択肢を選択したかに対する結果データを収集することができる。
【0042】
例えば、データ分析サーバは市販されている各種の問題に対するデータベースを構築し、ユーザが該当問題からどの選択肢を選択したか、選択肢選択結果を収集する方式により解釈結果ログを収集することができ、追加的に該当問題に対する正誤答結果を収集することもできる。この際、データ分析サーバは、ユーザ、問題、該当ユーザが該当問題から選択した選択肢に対するリストを構成することができる。
【0043】
以後、データ分析サーバは一つの問題を選択肢単位で拡張してデータ分析処理を遂行することができる(ステップS140)。
【0044】
例えば、問題iが四肢択一式問題の場合、問題iは(i、1)(i、2)(i、3)(i、4)の変数4個に拡張され、各問題−選択肢の各ユーザの選択有無が値として与えられる。
【0045】
例えば、E(i、j)は問題iの選択肢jを意味し、Y’(u、E)はユーザuが問題iの選択肢jを選択したかを意味し、本発明の実施形態によれば、選択した場合は1、選択しない場合は0の値が与えられる。
【0046】
延いては、データ分析サーバはユーザ及び問題−選択肢を変数として多次元空間を構成し、ユーザが該当問題−選択肢を選択したかを基準に前記多次元空間に値を与えて、それぞれのユーザ及び問題−選択肢に対するベクトルを計算することができる。
【0047】
以後、データ分析サーバは、前記ユーザベクトルと前記問題−選択肢ベクトルを用いて任意のユーザが任意の問題−選択肢を選択する確率、即ち選択率を推定することができる(ステップS150)。
【0048】
この際、前記ユーザベクトルと前記問題−選択肢ベクトルに多様なアルゴリズムを適用して前記選択率を推定することができ、本発明を解釈するに当たって選択率を計算するためのアルゴリズムは制限されない。
【0049】
例えば、本発明の実施形態によれば、以下の<数式1>のようなシグモイド関数を適用すれば、ユーザの問題−選択肢の選択率を推定することができる(xは問題−選択肢ベクトル、θはユーザベクトル)
【0050】
hθ(x)=1/(1+e
(−θ*T*X)) <数1>
【0051】
延いては、本発明の実施形態に従うデータ分析サーバはユーザの選択肢の選択率を用いて問題の正答率を推定することができる(ステップS160)。
【0052】
ところで、例えば四肢択一式で構成された特定問題に対し、特定ユーザの選択肢の選択確率が(0.5、0.1、0.3、0.6)であり、正答選択肢が1番の場合、前記ユーザが該当問題を当てる確率はいくらかが問題となる。即ち、該当問題に対する複数の選択肢の選択率を用いて該当問題の正答率を推定する方法を考慮することができる。
【0053】
本発明の実施形態に従って選択肢の選択率を問題正答率に還元する簡単な方式には、全体選択肢の選択率対比正答選択肢の選択率を比較する方法を考慮することができる。この場合、先の例で該当ユーザの該当問題に対する正答率は0.5/(0.5+0.1+0.3+0.6)で計算する。しかしながら、ユーザは問題を解釈する時は選択肢単位で区分して該当問題を理解することでなく、全体選択肢に対する構成及び問題の出題意図を含んで問題単位で理解するため、選択肢の選択率と正答率は単純連結できない。
【0054】
したがって、本発明の実施形態によれば、該当問題の全体選択肢の選択率を平均化し、正答の選択肢の平均化された選択率を全体選択肢の選択率に適用する方式により選択肢の選択率から該当問題の正答率を推定することができる。
【0055】
先の例において、選択肢の選択確率が(0.5、0.1、0.3、0.6)の場合、これを全体選択肢に対して平均化すれば、それぞれの選択肢の選択率は(0.33、0.07、0.20、0.41)にスケールが変更できる。正答選択肢が1番の場合、選択肢1の平均化された選択率は0.33に、該当ユーザの該当問題に対する正答率は33%に推定できる。
【0056】
延いては、本発明の実施形態に従うサービスサーバは、ユーザの問題−選択肢の選択確率を用いて問題の正答率を推定することができ、これを通じて特定概念に対するユーザの理解度を推定することができる。
【0057】
延いては、データ分析サーバは問題の選択肢別の選択率に基づいて該当ユーザの特定問題に対する学習効率を計算することができる(ステップS165)。
【0058】
本発明の実施形態に従うデータ分析サーバは、前述したように、問題の選択肢単位のモデリングベクトルとユーザモデリングベクトルを用いて、それぞれのユーザに対して問題の選択肢単位の選択確率及び該当ユーザの問題単位の正答確率を計算することができる。これに基づいて本発明の実施形態に従うデータ分析サーバは、特定ユーザの任意の問題の選択肢別の選択確率に前記ユーザが該当選択肢を選択した場合、他の問題の正答率変更値の平均値を適用すれば、該当問題の学習効率を計算することができる。
【0059】
例えば、ユーザAの特定問題aの第1選択肢に対する選択率がa1、第2選択肢に対する選択率がa2、第3選択肢に対する選択率がa3、第4選択肢に対する選択率がa4の場合を考慮することができる。
【0060】
その時、ユーザAが該当問題に対して第1選択肢を選択したと仮定すれば、ユーザAのモデリングベクトル及び全体問題のモデリングベクトルはユーザAの第1選択肢の選択イベントを適用して多少変更され、変更されたモデリングベクトルによって各問題の正答率が多少変更される。これによって、データ分析サーバはユーザAの第1選択肢の選択に対する仮想イベントを適用して全体問題の正答率変更平均値AVC_a1を計算することができる。
【0061】
同一な方法によりデータ分析サーバはユーザAが第2選択肢を選択したと仮定してAVC_a2を計算し、第3選択肢を選択したと仮定してAVC_a3を計算し、第4選択肢を選択したと仮定してAVC_a4を計算することができる。
【0062】
以後、データ分析サーバはユーザAの問題aを通じての学習効率E(A,a)を以下の数式により計算することができる。
【0063】
E(A,a)=a1*AVC_a1+a2*AVC_a2+a3*AVC_a3+a4*AVC_a4 <数2>
【0064】
延いては、データ分析サーバは全体問題に対してE(A)を計算し、E(A)が最も高い問題順にオーダーメード型問題を提供することができる(ステップS170)。即ち、本発明の実施形態によれば、任意のユーザに最も学習効率の高い問題を提供することができる。
【0065】
一方、データ分析サーバは、ユーザベクトル、問題−選択肢ベクトル、選択肢の選択率、問題の正答率、ユーザの概念理解度、問題の概念構成度のうち、少なくとも一つ以上を用いてオーダーメード型コンテンツを推薦することができる(ステップS170)。
【0066】
例えば、サービスサーバは特定概念に対する理解度の低いユーザに該当概念に対する深化講座を推薦することができる。
【0067】
更に他の例に、サービスサーバは複数の概念を全て含む問題に対する正答率の低いユーザに前記複数の概念を含むように構成された問題を推薦することができる。
【0068】
延いては、サービスサーバは問題データベースセットのうち、ユーザが既に解いてみた問題を除いて、残りの問題を特定ユーザに対する正答率の低い順に整列して該当ユーザに対する推薦問題リストを作成し、これを提供することができる。
【0069】
例えば、ユーザ−問題の正答率Pの1番行の値が[0.3、0.4、0.1、0.9、0.7]の場合、ユーザ1が問題1、2、3、4、5を当てる確率が各々30%、40%、10%、90%、70%であると解釈される。サービスサーバは、問題3、1、2、5、4の順に優先順位を与えた問題推薦リストをユーザに提供することができる。この際、問題5番をユーザ1が既に解いたならば、サービスサーバは問題5番は除いて問題推薦リストを作成することができる。
【0070】
本明細書と図面に開示された本発明の実施形態は本発明の技術内容を分かり易く説明し、本発明の理解を助けるために特定例を提示したものであり、本発明の範囲を限定しようとするものではない。ここに掲示された実施形態の以外にも本発明の技術的思想に基づいた他の変形例が実施可能であるということは本発明が属する技術分野で通常の知識を有する者に自明である。