IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社リコーの特許一覧

特開2023-23810穴埋め問題生成装置、穴埋め問題生成方法及びプログラム
<>
  • 特開-穴埋め問題生成装置、穴埋め問題生成方法及びプログラム 図1
  • 特開-穴埋め問題生成装置、穴埋め問題生成方法及びプログラム 図2
  • 特開-穴埋め問題生成装置、穴埋め問題生成方法及びプログラム 図3
  • 特開-穴埋め問題生成装置、穴埋め問題生成方法及びプログラム 図4
  • 特開-穴埋め問題生成装置、穴埋め問題生成方法及びプログラム 図5
  • 特開-穴埋め問題生成装置、穴埋め問題生成方法及びプログラム 図6
  • 特開-穴埋め問題生成装置、穴埋め問題生成方法及びプログラム 図7
  • 特開-穴埋め問題生成装置、穴埋め問題生成方法及びプログラム 図8
  • 特開-穴埋め問題生成装置、穴埋め問題生成方法及びプログラム 図9
  • 特開-穴埋め問題生成装置、穴埋め問題生成方法及びプログラム 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023023810
(43)【公開日】2023-02-16
(54)【発明の名称】穴埋め問題生成装置、穴埋め問題生成方法及びプログラム
(51)【国際特許分類】
   G09B 19/00 20060101AFI20230209BHJP
   G06F 40/30 20200101ALI20230209BHJP
   G06Q 50/20 20120101ALI20230209BHJP
【FI】
G09B19/00 Z
G06F40/30
G06Q50/20
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2021129669
(22)【出願日】2021-08-06
(71)【出願人】
【識別番号】000006747
【氏名又は名称】株式会社リコー
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(72)【発明者】
【氏名】岩崎 改
【テーマコード(参考)】
5B091
5L049
【Fターム(参考)】
5B091CA12
5L049CC34
(57)【要約】
【課題】穴埋め問題を生成するコストを低減する。
【解決手段】穴埋め問題生成装置は、問題文中の正答を空欄で隠蔽した穴埋め問題文から誤答を生成する。文脈スコア計算部は、誤答候補それぞれについて空欄の周辺単語に基づいて文脈的な自然さを表す文脈スコアを計算する。意味スコア計算部は、誤答候補それぞれについて正答との意味的な近さを表す意味スコアを計算する。出力部は、文脈スコア及び意味スコアに基づいて誤答候補から選択された誤答を出力する。
【選択図】図3
【特許請求の範囲】
【請求項1】
問題文中の正答を空欄で隠蔽した穴埋め問題文から誤答を生成する穴埋め問題生成装置であって、
誤答候補それぞれについて前記空欄の周辺単語に基づいて文脈的な自然さを表す文脈スコアを計算する文脈スコア計算部と、
前記誤答候補それぞれについて前記正答との意味的な近さを表す意味スコアを計算する意味スコア計算部と、
前記文脈スコア及び前記意味スコアに基づいて前記誤答候補から選択された前記誤答を出力する出力部と、
を備える穴埋め問題生成装置。
【請求項2】
請求項1に記載の穴埋め問題生成装置であって、
前記文脈スコア及び前記意味スコアに基づいて前記誤答候補から前記誤答を選択する誤答選択部をさらに備える、
穴埋め問題生成装置。
【請求項3】
請求項2に記載の穴埋め問題生成装置であって、
前記文脈スコア計算部は、中央単語予測モデルを用いて前記文脈スコアを計算するものであり、
前記中央単語予測モデルは、テキストデータから抽出した中央単語と周辺単語との組を用いて、周辺単語を説明変数とし、中央単語を目的変数として学習したモデルである、
穴埋め問題生成装置。
【請求項4】
請求項2に記載の穴埋め問題生成装置であって、
前記意味スコア計算部は、単語ベクトル変換モデルを用いて生成した単語ベクトルのコサイン類似度を前記意味スコアとして計算するものであり、
前記単語ベクトル変換モデルは、テキストデータから抽出した中央単語と周辺単語との組を用いて、中央単語を説明変数とし、周辺単語を目的変数として学習したモデルである、
穴埋め問題生成装置。
【請求項5】
請求項2に記載の穴埋め問題生成装置であって、
前記誤答選択部は、前記文脈スコアと前記意味スコアの重み付け和である統合スコアが高い所定の件数の前記誤答候補を前記誤答として選択するものである、
穴埋め問題生成装置。
【請求項6】
請求項1から5のいずれかに記載の穴埋め問題生成装置であって、
前記問題文中の各単語の重要度に基づいて前記正答を選択する正答選択部をさらに備える、
穴埋め問題生成装置。
【請求項7】
問題文中の正答を空欄で隠蔽した穴埋め問題文から誤答を生成する穴埋め問題生成方法であって、
文脈スコア計算部が、誤答候補それぞれについて前記空欄の周辺単語に基づいて文脈的な自然さを表す文脈スコアを計算するステップと、
意味スコア計算部が、前記誤答候補それぞれについて前記正答との意味的な近さを表す意味スコアを計算するステップと、
出力部が、前記文脈スコア及び前記意味スコアに基づいて前記誤答候補から選択された前記誤答を出力するステップと、
を備える穴埋め問題生成方法。
【請求項8】
問題文中の正答を空欄で隠蔽した穴埋め問題文から誤答を生成するプログラムであって、
コンピュータを、
誤答候補それぞれについて前記空欄の周辺単語に基づいて文脈的な自然さを表す文脈スコアを計算する文脈スコア計算部、
前記誤答候補それぞれについて前記正答との意味的な近さを表す意味スコアを計算する意味スコア計算部、及び
前記文脈スコア及び前記意味スコアに基づいて前記誤答候補から選択された前記誤答を出力する出力部、
として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
この発明は、穴埋め問題生成装置、穴埋め問題生成方法及びプログラムに関する。
【背景技術】
【0002】
例えば電子機器を用いた学習では、採点の容易性等の理由により、複数の選択肢から正答を選択する選択問題を採用することが多い。選択問題の誤答は正答か否かの判断が困難である必要があるため、問題作成者にとって誤答を作成することは負担となる。
【0003】
特許文献1には穴埋め問題の誤選択肢を自動生成する技術が開示されている。特許文献1に開示された従来技術は、既存の穴埋め問題を機械学習した統計情報に基づいて誤選択肢候補を生成し、その誤選択肢候補から誤選択肢を選択する。
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1に開示された従来技術は、誤選択肢を生成するために既存の穴埋め問題を収集するコストが大きいという課題がある。
【0005】
この発明の一実施形態は、上記のような技術的課題に鑑みて、穴埋め問題を生成するコストを低減することを目的とする。
【課題を解決するための手段】
【0006】
上記の課題を解決するために、この発明の穴埋め問題生成装置は、問題文中の正答を空欄で隠蔽した穴埋め問題文から誤答を生成する穴埋め問題生成装置であって、誤答候補それぞれについて空欄の周辺単語に基づいて文脈的な自然さを表す文脈スコアを計算する文脈スコア計算部と、誤答候補それぞれについて正答との意味的な近さを表す意味スコアを計算する意味スコア計算部と、文脈スコア及び意味スコアに基づいて誤答候補から選択された誤答を出力する出力部と、を備える。
【発明の効果】
【0007】
この発明の一実施形態によれば、穴埋め問題を生成するコストを低減することができる。
【図面の簡単な説明】
【0008】
図1】一実施形態に係る情報処理システムの全体構成を例示する図である。
図2】一実施形態に係る穴埋め問題生成装置のハードウェア構成を例示する図である。
図3】第1実施形態に係る穴埋め問題生成装置の機能構成を例示する図である。
図4】第1実施形態に係る穴埋め問題生成方法の処理手順を例示する図である。
図5】第1実施形態に係る問題文入力画面の一例を示す図である。
図6】一実施形態に係る統合スコアの計算例を示す図である。
図7】第1実施形態に係る穴埋め問題生成結果画面の一例を示す図である。
図8】第2実施形態に係る穴埋め問題生成装置の機能構成を例示する図である。
図9】第2実施形態に係る穴埋め問題生成方法の処理手順を例示する図である。
図10】第2実施形態に係る問題文入力画面の一例を示す図である。
【発明を実施するための形態】
【0009】
以下、図面を参照しながら、この発明の実施の形態について、詳細に説明する。なお、図面中において同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。
【0010】
[第1実施形態]
<情報処理システム100の全体構成>
図1は、この発明の一実施形態である情報処理システム100の全体構成を示す図である。図1に示されているように、情報処理システム100は、例えば、穴埋め問題生成装置1及びユーザ端末5を少なくとも含む。
【0011】
穴埋め問題生成装置1及びユーザ端末5は、それぞれネットワーク9に接続している。ネットワーク9は、接続されている各装置が相互に通信可能となるように構成されている。ネットワーク9は、例えば、インターネット、LAN(Local Area Network)、又はWAN(Wide Area Network)などの有線通信によるネットワークによって構築されている。ネットワーク9は、有線通信だけでなく、例えば、無線LAN、近距離無線通信、3G(3rd Generation)、WiMAX(Worldwide Interoperability for Microwave Access)、又はLTE(Long Term Evolution)等の無線通信又は移動体通信によるネットワークが含まれていてもよい。
【0012】
穴埋め問題生成装置1及びユーザ端末5は、例えば、コンピュータである。なお、穴埋め問題生成装置1及びユーザ端末5は、通信機能を備えた装置であれば、コンピュータに限られない。穴埋め問題生成装置1及びユーザ端末5は、例えば、画像形成装置(プリンタ、FAX装置、MFP(Multifunction Peripheral/Product/Printer:デジタル複合機)、スキャナ装置)、PJ(Projector:プロジェクタ)、IWB(Interactive White Board:相互通信が可能な電子式の黒板機能を有する白板)、デジタルサイネージ等の出力装置、HUD(Head Up Display)装置、産業機械、撮像装置、集音装置、医療機器、ネットワーク家電、自動車(Connected Car)、ノートPC(Personal Computer)、携帯電話、スマートフォン、タブレット端末、ゲーム機、PDA(Personal Digital Assistant)、デジタルカメラ、ウェアラブルPCまたはデスクトップPC等であってもよい。
【0013】
図1は、情報処理システム100をクライアントサーバ構成で構築した場合の全体構成例である。この構成では、穴埋め問題生成装置1は、例えば、遠隔のデータセンタ又はクラウド上に構築されている。ユーザ端末5は、ネットワーク9を介して穴埋め問題生成装置1と通信しながら、穴埋め問題生成装置1に実装された各機能を実行する。
【0014】
情報処理システム100をスタンドアロン構成で構築することも可能である。この構成では、穴埋め問題生成装置1は、問題作成者による操作に応じて、各機能を実行する。以下では、情報処理システム100をスタンドアロン構成で構築した場合の例を中心に説明する。
【0015】
<穴埋め問題生成装置1のハードウェア構成>
図2は、一実施形態に係る穴埋め問題生成装置1のハードウェア構成を示す図である。図2に示されているように、穴埋め問題生成装置1は、コンピュータによって構築されており、図2に示されているように、CPU(Central Processing Unit)1001、ROM(Read Only Memory)1002、RAM(Random Access Memory)1003、HD(Hard Disk)1004、HDD(Hard Disk Drive)コントローラ1005、ディスプレイ1006、外部機器接続I/F(Interface)1008、ネットワークI/F1009、バスライン1010、キーボード1011、ポインティングデバイス1012、DVD-RW(Digital Versatile Disk Rewritable)ドライブ1014、メディアI/F1016を備えている。
【0016】
これらのうち、CPU1001は、コンピュータ全体の動作を制御する。ROM1002は、IPL(Initial Program Loader)等のCPU1001の駆動に用いられるプログラムを記憶する。RAM1003は、CPU1001のワークエリアとして使用される。HD1004は、プログラム等の各種データを記憶する。HDDコントローラ1005は、CPU1001の制御に従ってHD1004に対する各種データの読み出し又は書き込みを制御する。ディスプレイ1006は、カーソル、メニュー、ウィンドウ、文字、又は画像などの各種情報を表示する。外部機器接続I/F1008は、各種の外部機器を接続するためのインターフェースである。この場合の外部機器は、例えば、USB(Universal Serial Bus)メモリやプリンタ等である。ネットワークI/F1009は、ネットワーク9を利用してデータ通信をするためのインターフェースである。バスライン1010は、図2に示されているCPU1001等の各構成要素を電気的に接続するためのアドレスバスやデータバス等である。
【0017】
また、キーボード1011は、文字、数値、各種指示などの入力のための複数のキーを備えた入力手段の一種である。ポインティングデバイス1012は、各種指示の選択や実行、処理対象の選択、カーソルの移動などを行う入力手段の一種である。DVD-RWドライブ1014は、着脱可能な記録媒体の一例としてのDVD-RW1013に対する各種データの読み出し又は書き込みを制御する。なお、DVD-RWに限らず、DVD-R等であってもよい。メディアI/F1016は、フラッシュメモリ等のメディア1015に対するデータの読み出し又は書き込み(記憶)を制御する。
【0018】
なお、上記各プログラムは、インストール可能な形式又は実行可能な形式のファイルで、コンピュータで読み取り可能な記録媒体に記録して流通させるようにしてもよい。記録媒体の例として、CD-R(Compact Disc Recordable)、DVD(Digital Versatile Disk)、ブルーレイディスク、SDカード等が挙げられる。また、記録媒体は、プログラム製品として、国内又は国外へ提供されることができる。例えば、穴埋め問題生成装置1は、一実施形態に係るプログラムが実行されることで一実施形態に係る穴埋め問題生成方法を実現する。
【0019】
さらに、穴埋め問題生成装置1は、単一のコンピュータによって構築されてもよいし、各部(機能、手段又は記憶部)を分割して任意に割り当てられた複数のコンピュータによって構築されていてもよい。
【0020】
<第1実施形態に係る穴埋め問題生成装置1の機能構成>
図3は、第1実施形態に係る穴埋め問題生成装置1の機能構成を示す図である。図3に示されているように、第1実施形態に係る穴埋め問題生成装置1は、モデル記憶部10、入力部11、形態素解析部12、誤答生成部13、及び出力部14を少なくとも備える。誤答生成部13は、文脈スコア計算部131、意味スコア計算部132、スコア統合部133、及び誤答選択部134を少なくとも備える。穴埋め問題生成装置1が備える各処理部(モデル記憶部10を除く)は、図2に示されているCPU1001がHD1004からRAM1003上に展開したプログラムに従って、各種の命令をRAM1003上に読み込まれたデータに対して実行することで実現される機能又は機能する手段である。モデル記憶部10は、図2に示されているHDDコントローラ1005を介してHD1004にデータの読み込み又は書き込みを行うことで実現される機能又は機能する手段である。
【0021】
モデル記憶部10は、中央単語予測モデル及び単語ベクトル変換モデルを記憶する。中央単語予測モデルは、周辺単語から文脈的に自然な中央単語を予測するためのモデルである。単語ベクトル変換モデルは、単語の分散表現(以下、「単語ベクトル」とも呼ぶ)を得るためのモデルである。
【0022】
入力部11は、穴埋め問題文及び正答の入力を受け付ける。穴埋め問題文は、問題文中の単語が空欄で隠蔽された文である。正答は、穴埋め問題文中の空欄で隠蔽された単語である。
【0023】
形態素解析部12は、入力部11が受け付けた穴埋め問題文に対して、形態素解析を行う。
【0024】
誤答生成部13は、モデル記憶部10が記憶する中央単語予測モデル及び単語ベクトル変換モデルを用いて、入力部11が受け付けた穴埋め問題文及び正答に基づいて、誤答を生成する。
【0025】
文脈スコア計算部131は、モデル記憶部10が記憶する中央単語予測モデルを用いて、予め定めた誤答候補それぞれについて、周辺単語に対する中央単語の文脈的な自然さを表す文脈スコアを計算する。
【0026】
意味スコア計算部132は、モデル記憶部10が記憶する単語ベクトル変換モデルを用いて、予め定めた誤答候補それぞれについて、正答との意味的な近さを表す意味スコアを計算する。
【0027】
スコア統合部133は、予め定めた誤答候補それぞれについて、文脈スコア計算部131が計算した文脈スコアと意味スコア計算部132が計算した意味スコアとを統合した統合スコアを計算する。
【0028】
誤答選択部134は、スコア統合部133が計算した統合スコアに基づいて、予め定めた誤答候補から誤答を選択する。
【0029】
出力部14は、誤答選択部134が選択した誤答を出力する。
【0030】
なお、情報処理システム100をクライアントサーバ構成で構築する場合、ユーザ端末5が入力部11及び出力部14を備えることになる。
【0031】
<第1実施形態に係る穴埋め問題生成装置1の処理手順>
以下、図4から図7を参照しながら、第1実施形態に係る穴埋め問題生成装置1が実行する穴埋め問題生成方法の処理手順を説明する。
【0032】
モデル記憶部10には、中央単語予測モデル及び単語ベクトル変換モデルが予め記憶されている。中央単語予測モデル及び単語ベクトル変換モデルは、通常のテキストデータを用いて予め学習されている。通常のテキストデータとは、特許文献1の従来技術で用いる穴埋め問題文とは異なり、単語を隠蔽する空欄を含まない完全な文からなるテキストデータを意味する。通常のテキストデータは、例えば、穴埋め問題の対象とする言語及び科目に関する教科書又は参考書等に記載されたテキストの内容を記録したデータ、又は、Wikipedia(登録商標)等のオンライン辞典サイトに掲載されたテキストデータ等である。ここで、言語とは、例えば、日本語及び英語等であり、科目とは、例えば、歴史、地理、科学等の特定の知識を問う問題が出題される科目である。
【0033】
中央単語予測モデルは、周辺単語から文脈的に自然な中央単語を予測するためのモデルである。中央単語予測モデルの一例は、CBOW(Continuous Bag-of-Words)である。CBOWは、周辺単語を説明変数、中央単語を目的変数として学習したニューラルネットワークである。CBOWは、入力層及び出力層の各ニューロンに単語(以下、「語彙」と呼ぶ)が割り当てられており、周辺単語を入力すると、出力層の語彙に含まれる各単語について文脈スコアを出力する。
【0034】
中央単語予測モデルの他の例は、先行する数語を与えると、後続する単語を予測する文書生成モデルである。文書生成モデルは、例えば、マルコフ連鎖、RNN(Recurrent Neural Network)、LSTM(Long Short-Term Memory)等のアルゴリズムを用いて構成することができる。
【0035】
単語ベクトル変換モデルは、単語の分散表現を得るためのモデルである。単語ベクトル変換モデルの一例は、Word2Vecである。Word2Vecは、中央単語を説明変数、周辺単語を目的変数として学習したニューラルネットワークの重みを、単語ベクトルとして得る手法である。Word2Vecは、入力層及び出力層の各ニューロンに語彙が割り当てられており、中央単語を入力すると、中央単語を分散表現に変換した単語ベクトルを出力する。Word2Vecで得た単語ベクトル同士のコサイン類似度は、単語の意味的な近さを表すスコアとして扱うことができる。
【0036】
単語ベクトル変換モデルの他の例は、ある単語の類義語を収録した類語辞書である。類語辞書は、例えば、一般に公開されているWordNet等を用いることができる。また、公知の類語辞書自動生成技術を用いて、予め収集したテキストデータから類語辞書を生成することも可能である。
【0037】
CBOW及びWord2Vecは、以下のようにして学習することができる。まず、予め収集したテキストデータを形態素解析し、テキストデータに含まれる各単語の出現回数を集計する。次に、出現回数が予め定めた最低出現回数以上である単語を、入力層及び出力層の語彙として決定する。例えば、最低出現回数を1に設定すると、テキストデータに含まれるすべての単語が語彙に含まれる。最低出現回数は、語彙に含まれることになる単語数に応じて調整してもよい。CBOWの語彙とWord2Vecの語彙とは、学習に用いるテキストデータが共通であれば、一致する。
【0038】
その後、予め定めた単語数からなるウィンドウをテキストデータ上でシフトすることで、周辺単語及び中央単語を含む学習データを抽出する。例えば、周辺単語を中央単語の前後1語ずつとする場合であれば、先頭から3語ずつ取り出した単語組が学習データとして抽出される。具体的には、テキストデータが「you say goodbye and I say hello」であれば、「you, say, goodbye」「say, goodbye, and」「goodbye, and, I」「and, I, say」「I, say, hello」という5個の学習データが抽出される。なお、各学習データにおいて、2番目の単語が中央単語であり、1番目と3番目の単語が周辺単語である。
【0039】
そして、これらの学習データを用いてニューラルネットワークを学習する。CBOWを学習する場合には、周辺単語が入力であり、中央単語が出力となるように学習を行う。Word2Vecを学習する場合には、中央単語が入力であり、周辺単語が出力となるように学習を行う。
【0040】
ステップS11において、入力部11は、穴埋め問題文及び正答の入力を受け付ける。入力部11は、例えば、問題文入力画面を用いて、穴埋め問題文及び正答の入力を受け付ける。
【0041】
図5は、第1実施形態に係る問題文入力画面の一例である。第1実施形態に係る問題文入力画面110は、例えば、穴埋め問題文入力欄111、正答入力欄112、及び誤答生成ボタン113を備える。問題作成者は、穴埋め問題文入力欄111へ穴埋め問題文を入力する。穴埋め問題文には少なくとも1個の空欄の位置を表す記号が含まれていなければならない。次に、問題作成者は、正答入力欄112へ正答を入力する。そして、問題作成者は、誤答生成ボタン113を押下する。これにより、入力部11は穴埋め問題文及び正答の入力を受け付ける。
【0042】
図5の例は、「根から吸収した水は□を通って運ばれる」という穴埋め問題文及び「導管」という正答が入力されたことを表している。これは、問題作成者が、「根から吸収した水は導管を通って運ばれる」という問題文に対して、「導管」を正答として選択したことを表している。ここで、「□」は予め定めた空欄の位置を表す記号である。ただし、空欄の位置を表す記号は、問題文の他の箇所で用いられることがない記号であれば、どのような記号であっても構わない。
【0043】
図4に戻って説明する。ステップS12において、形態素解析部12は、入力部11が受け付けた穴埋め問題文に対して形態素解析を行うことで、穴埋め問題文を形態素(単語)単位に分割し、各形態素に品詞情報を付与する。
【0044】
例えば、「根から吸収した水は□を通って運ばれる」という穴埋め問題文に対して形態素解析を行うと、「根/から/吸収/し/た/水/は/□/を/通っ/て/運ばれる」といった形態素解析結果が得られる。ここで、「/」は形態素間の区切りを表している。
【0045】
ステップS131において、誤答生成部13が備える文脈スコア計算部131は、モデル記憶部10が記憶する中央単語予測モデルを用いて、予め定めた誤答候補それぞれについて、文脈スコアを計算する。文脈スコアとは、周辺単語に対する中央単語の文脈的な自然さを表すスコアである。文脈スコアは、0以上1以下の値を取り、値が大きいほど文脈的に自然であることを表す。誤答候補とは、中央単語予測モデルを学習する際に、入力層及び出力層の各ニューロンに割り当てた各単語(すなわち、中央単語予測モデルの語彙)である。文脈スコア計算部131は、穴埋め問題文における空欄の周辺単語を中央単語予測モデルに入力する。ここで、周辺単語とは、穴埋め問題文の形態素解析結果において、空欄の位置を表す記号の前後に存在する所定の数の単語である。中央単語予測モデルは、各誤答候補について計算した文脈スコアを表すベクトルを出力する。
【0046】
ステップS132において、誤答生成部13が備える意味スコア計算部132は、モデル記憶部10が記憶する単語ベクトル変換モデルを用いて、予め定めた誤答候補それぞれについて、意味スコアを計算する。意味スコアとは、正答との意味的な近さを表すスコアである。意味スコアは、0以上1以下の値を取り、値が大きいほど意味的に近いことを表す。誤答候補とは、単語ベクトル変換モデルを学習する際に、入力層及び出力層の各ニューロンに割り当てた各単語(すなわち、単語ベクトル変換モデルの語彙)である。意味スコア計算部132は、正答を単語ベクトル変換モデルに入力し、正答の単語ベクトルを得る。また、意味スコア計算部132は、各誤答候補を単語ベクトル変換モデルに入力し、各誤答候補の単語ベクトルを得る。そして、意味スコア計算部132は、正答の単語ベクトルと各誤答候補の単語ベクトルとのコサイン類似度を計算し、意味スコアとして得る。
【0047】
ステップS133-1において、誤答生成部13が備えるスコア統合部133は、誤答候補それぞれについて、文脈スコア計算部131が計算した文脈スコアに対して、予め定めた第1の重みを乗算する。第1の重みは、文脈スコアの重要度を表す重みであり、文脈スコアと意味スコアのいずれを重視するかを調整するものである。第1の重みは、どのような値でもよいが、通常0以上1以下の値とする。
【0048】
ステップS133-2において、誤答生成部13が備えるスコア統合部133は、誤答候補それぞれについて、意味スコア計算部132が計算した意味スコアに対して、予め定めた第2の重みを乗算する。第2の重みは、意味スコアの重要度を表す重みであり、文脈スコアと意味スコアのいずれを重視するかを調整するものである。第2の重みは、どのような値でもよいが、通常0以上1以下の値とする。
【0049】
文脈スコアの値と意味スコアの値とは共通性がないため、いずれかのスコアが大きな値を取る傾向がある場合、そのスコアの影響が過度に大きくなる。例えば、文脈スコアが0.8程度の値を取り、意味スコアが0.3程度の値を取る傾向があれば、意味的な近さがあまり考慮されず、文脈的な自然さの影響を強く受けることになる。第1の重みと第2の重みは、このようなスコアが取る値の偏りを調整するために設定するものである。両スコアが同程度の値を取るものであれば、重み付けを行わない、又は、同じ重みを与える等と構成しても構わない。
【0050】
ステップS133-3において、誤答生成部13が備えるスコア統合部133は、誤答候補それぞれについて、重み付けした文脈スコアと重み付けした意味スコアとを加算した統合スコアを計算する。すなわち、統合スコアは、文脈スコアと意味スコアの重み付け和である。
【0051】
図6に、統合スコアの計算例を示す。図6の例では、誤答候補として「パイプ」「水道管」「植物」「樹木」「計算機」「蛍光灯」が定められている。文脈スコアの重要度を表す第1の重みは0.5であり、意味スコアの重要度を表す第2の重みは0.5である。例えば、「パイプ」という誤答候補は、文脈スコアが0.85であり、意味スコアが0.90であるため、統合スコアは0.85*0.5+0.90*0.5=0.88(小数第3位四捨五入)となる。
【0052】
図4に戻って説明する。ステップS134において、誤答生成部13が備える誤答選択部134は、スコア統合部133が計算した統合スコアが高い順に所定の数の誤答候補を誤答として選択する。図6に示した例において、3個の誤答を選択するのであれば、統合スコアが最も高い「パイプ」と2番目に高い「水道管」と3番目に高い「植物」とが誤答として選択される。
【0053】
ステップS14において、出力部14は、誤答生成部13が選択した誤答を出力する。出力部14は、例えば、穴埋め問題生成結果画面を用いて、誤答を出力する。
【0054】
図7は、穴埋め問題生成結果画面の一例である。穴埋め問題生成結果画面140は、例えば、穴埋め問題文表示欄141、正答表示欄142、及び誤答表示欄143を備える。穴埋め問題文表示欄141は、入力部11へ入力された穴埋め問題文を表示する。正答表示欄142は、入力部11へ入力された正答を表示する。誤答表示欄143は、誤答生成部13が出力する誤答を表示する。誤答表示欄143は、統合スコアの高い順に誤答を表示してもよいし、ランダムな順番で誤答を表示してもよい。
【0055】
図7の例は、「根から吸収した水は□を通って運ばれる」という穴埋め問題文及び「導管」という正答に対して、「パイプ」「植物」「水道管」という誤答が生成されたことを表している。
【0056】
第1実施形態に係る穴埋め問題生成装置1は、周辺単語との文脈的な自然さ及び正答との意味的な近さに基づいて、予め定めた誤答候補の中から誤答を選択する。文脈的に自然であり、正答と意味が近い単語は、誤答とは言い切れない単語である可能性もある。したがって、最終的にどの単語を誤答として採用するかは問題作成者の判断に委ねられる。すなわち、第1実施形態に係る穴埋め問題生成装置1は、問題作成者が穴埋め問題を作成する支援を行うために用いられることを想定している。図7に示した穴埋め問題生成結果画面は、誤答を3個出力しているが、問題作成者が適切な誤答を選択できるように、より多くの誤答を出力するように構成してもよい。
【0057】
<第1実施形態の効果>
第1実施形態に係る穴埋め問題生成装置1は、穴埋め問題文及び正答を入力とし、周辺単語との文脈的な自然さ及び正答との意味的な近さに基づいて、誤答を生成する。文脈的な自然さ及び意味的な近さは、容易に収集可能な通常のテキストデータに基づいて計算可能なスコアである。特許文献1に開示された従来技術は、既存の穴埋め問題を収集するコストが大きいことが課題であった。第1実施形態に係る穴埋め問題生成装置1によれば、学習データの収集にかかるコストを低減することができる。
【0058】
また、特許文献1に開示された従来技術は、穴埋め問題の対象とする科目ごとに既存の穴埋め問題を収集する必要があった。文脈的な自然さ及び意味的な近さは、言語が同一であれば科目が異なっても共通するため、第1実施形態に係る穴埋め問題生成装置1では、科目ごとに学習データを収集する必要はなく、異なる科目の穴埋め問題を生成する際にも、学習済みのモデルを流用することができる。さらに、一般に公開されている学習済みモデルを利用すれば、モデルを学習するコストも削減することができる。
【0059】
[第2実施形態]
第1実施形態に係る穴埋め問題生成装置1は、問題文中の正答を空欄で隠蔽した穴埋め問題文及び正答を入力とし、誤答を出力するように構成した。第2実施形態に係る穴埋め問題生成装置1は、空欄を含まない完全な問題文を入力とし、空欄で隠蔽するべき正答を自動的に選択した上で、穴埋め問題文、正答、及び誤答を出力するように構成する。
【0060】
以下、この発明の第2実施形態に係る穴埋め問題生成装置1について、第1実施形態との相違点を中心に説明する。
【0061】
<第2実施形態に係る穴埋め問題生成装置1の機能構成>
図8は、第2実施形態に係る穴埋め問題生成装置1の機能構成を示す図である。図8に示されているように、第2実施形態に係る穴埋め問題生成装置1は、第1実施形態と同様に、入力部11、形態素解析部12、誤答生成部13、及び出力部14を備え、正答選択部21をさらに備える。
【0062】
第2実施形態に係る入力部11は、問題文の入力を受け付ける。
【0063】
正答選択部21は、問題文に含まれる各単語の重要度に基づいて、空欄で隠蔽する正答を選択し、穴埋め問題文及び正答を生成する。
【0064】
第2実施形態に係る出力部14は、穴埋め問題文、正答、及び誤答を出力する。
【0065】
<第2実施形態に係る穴埋め問題生成装置1の処理手順>
以下、図9及び図10を参照しながら、第2実施形態に係る穴埋め問題生成装置1が実行する穴埋め問題生成方法の処理手順を説明する。
【0066】
ステップS11において、入力部11は、問題文の入力を受け付ける。問題文とは、単語が隠蔽されていない完全な文である。
【0067】
入力部11は、例えば、問題文入力画面を用いて、問題文の入力を受け付ける。図10は、第2実施形態に係る問題文入力画面の一例である。第2実施形態に係る問題文入力画面110は、例えば、問題文入力欄114及び穴埋め問題生成ボタン115を備える。問題作成者は、問題文入力欄114へ問題文を入力する。問題文には空欄の位置を表す記号が含まれていてはならない。問題作成者は、穴埋め問題生成ボタン115を押下する。これにより、入力部11は問題文の入力を受け付ける。
【0068】
図10の例は、「根から吸収した水は導管を通って運ばれる」という問題文が入力されたことを表している。
【0069】
図9に戻って説明する。ステップS21において、正答選択部21は、形態素解析部12が出力する問題文の形態素解析結果を用いて、問題文に含まれる各単語の重要度を求める。単語の重要度の一例は、TF-IDF(Term Frequency-Inverse Document Frequency)である。TF-IDFは、単語の出現頻度に基づいて、単語の重要度を算出する手法である。
【0070】
次に、正答選択部21は、各単語の重要度及び品詞情報に基づいて、空欄で隠蔽する正答を選択する。例えば、特定の知識と問う穴埋め問題を生成する場合、正答は名詞であることが一般的である。この場合、問題文に含まれる名詞の中で、最も重要度が高い単語を正答として選択すればよい。例えば文法問題等、名詞以外の単語が問われる科目であれば、その名詞以外の単語を正答として選択してもよいし、品詞情報を参照せずに重要度のみに基づいて、正答を選択してもよい。
【0071】
続いて、正答選択部21は、入力部11が受け付けた問題文において、選択した正答を空欄に置き換えることで、穴埋め問題文を生成する。そして、正答選択部21は、生成した穴埋め問題文及び選択した正答を誤答生成部13へ入力する。
【0072】
ステップS14において、出力部14は、穴埋め問題文、正答、及び誤答を出力する。穴埋め問題文は、正答選択部21が生成した穴埋め問題文である。正答は、正答選択部21が選択した正答である。誤答は、誤答生成部13が出力した誤答である。出力部14は、例えば、図7に示した穴埋め問題生成結果画面を用いて、穴埋め問題文、正答、及び誤答を出力する。
【0073】
<第2実施形態の効果>
第1実施形態に係る穴埋め問題生成装置1は、穴埋め問題文及び正答を入力とし、問題作成者が問題文から手動で正答を選択できる。一方、第2実施形態に係る穴埋め問題生成装置1は、問題文から自動的に空欄で隠蔽する正答を選択するため、問題作成者が問題文から正答を選択する手間を省くことができる。第1実施形態に係る穴埋め問題生成装置1は、問題作成者の知見に基づいて、穴埋め問題として適切な知識を問う問題を作成できる。一方、第2実施形態に係る穴埋め問題生成装置1は、より多くの穴埋め問題を短時間で生成することが可能である。
【0074】
<補足>
一実施形態に係る穴埋め問題生成装置1がMFPである場合、以下のようにして穴埋め問題を生成することができる。問題作成者は、穴埋め問題文及び正答を手書き又は印字した用紙を用意し、スキャナでその用紙を読み込む。MFPは、読み込んだデータにOCR(Optical Character Recognition)処理を行うことで、穴埋め問題文及び正答の入力を受け付け、誤答を生成する。また、MFPは、生成された穴埋め問題を所定の用紙へ印刷する。もしくは、生成された穴埋め問題を記載した電子メールを所定のメールアドレスへ送信する。
【0075】
一実施形態に係る穴埋め問題生成装置1がIWBである場合、以下のようにして穴埋め問題を生成することができる。問題作成者は、IWBのディスプレイに映し出された問題文に対して、電子ペン等を用いて丸で囲む又は下線を引く等の操作により、空欄で隠蔽する単語(正答)を指定する。IWBは、問題文において指定された正答を空欄に置き換えた穴埋め問題文及び指定された正答の入力を受け付け、誤答を生成する。また、IWBは、生成された誤答をIWBのディスプレイの所定の位置へ表示する。
【0076】
上記で説明した実施形態の各機能は、一又は複数の処理回路によって実現することが可能である。ここで、本明細書における「処理回路」とは、電子回路により実装されるプロセッサのようにソフトウェアによって各機能を実行するようプログラミングされたプロセッサや、上記で説明した各機能を実行するよう設計されたASIC(Application Specific Integrated Circuit)、DSP(Digital Signal Processor)、FPGA(Field Programmable Gate Array)や従来の回路モジュール等のデバイスを含むものとする。
【0077】
実施例に記載された装置群は、本明細書に開示された実施形態を実施するための複数のコンピューティング環境のうちの1つを示すものにすぎない。ある実施形態では、穴埋め問題生成装置1は、サーバクラスタといった複数のコンピューティングデバイスを含む。複数のコンピューティングデバイスは、ネットワークや共有メモリなどを含む任意のタイプの通信リンクを介して互いに通信するように構成されており、本明細書に開示された処理を実施する。
【0078】
さらに、穴埋め問題生成装置1は、例えば図4又は図9に開示された処理ステップを様々な組み合わせで共有するように構成できる。例えば、所定のユニットによって実行されるプロセスは、穴埋め問題生成装置によって実行され得る。また、穴埋め問題生成装置1の各要素は、1つのサーバ装置にまとめられていても良いし、複数の装置に分けられていても良い。
【0079】
以上、本発明の実施の形態について詳述したが、本発明はこれらの実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形又は変更が可能である。
【符号の説明】
【0080】
1 穴埋め問題生成装置
10 モデル記憶部
11 入力部
12 形態素解析部
13 誤答生成部
131 文脈スコア計算部
132 意味スコア計算部
133 スコア統合部
134 誤答選択部
14 出力部
21 正答選択部
【先行技術文献】
【特許文献】
【0081】
【特許文献1】特開2011-17947号公報
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10