IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 大日本印刷株式会社の特許一覧

特開2024-141589問題作成支援装置、問題作成支援方法及びプログラム
<>
  • 特開-問題作成支援装置、問題作成支援方法及びプログラム 図1
  • 特開-問題作成支援装置、問題作成支援方法及びプログラム 図2
  • 特開-問題作成支援装置、問題作成支援方法及びプログラム 図3
  • 特開-問題作成支援装置、問題作成支援方法及びプログラム 図4
  • 特開-問題作成支援装置、問題作成支援方法及びプログラム 図5
  • 特開-問題作成支援装置、問題作成支援方法及びプログラム 図6
  • 特開-問題作成支援装置、問題作成支援方法及びプログラム 図7
  • 特開-問題作成支援装置、問題作成支援方法及びプログラム 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024141589
(43)【公開日】2024-10-10
(54)【発明の名称】問題作成支援装置、問題作成支援方法及びプログラム
(51)【国際特許分類】
   G09B 19/00 20060101AFI20241003BHJP
   G06F 40/279 20200101ALI20241003BHJP
【FI】
G09B19/00 Z
G06F40/279
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2023053324
(22)【出願日】2023-03-29
(71)【出願人】
【識別番号】000002897
【氏名又は名称】大日本印刷株式会社
(74)【代理人】
【識別番号】110002952
【氏名又は名称】弁理士法人鷲田国際特許事務所
(72)【発明者】
【氏名】松田 雛乃
(72)【発明者】
【氏名】高橋 諒子
(72)【発明者】
【氏名】伊藤 直之
(57)【要約】
【課題】文章内容に適した問題作成を支援するための技術を提供することである。
【解決手段】本開示の一態様は、文章データを取得するデータ取得部と、前記文章データの要約データを生成する要約生成部と、前記要約データからマスク対象箇所を選定するマスク選定部と、前記マスク対象箇所を含む文章を抽出し、マスクした前記文章を問題文として複数の文章を学習した学習済みモデルに入力して前記マスク対象箇所の選択肢候補を取得し、前記問題文と前記選択肢候補およびマスク対象箇所の文字列とに基づいて問題を作成する問題作成部と、を有する、問題作成支援装置に関する。
【選択図】図1
【特許請求の範囲】
【請求項1】
文章データを取得するデータ取得部と、
前記文章データの要約データを生成する要約生成部と、
前記要約データからマスク対象箇所を選定するマスク選定部と、
前記マスク対象箇所を含む文章を抽出し、マスクした前記文章を問題文として複数の文章を学習した学習済みモデルに入力して前記マスク対象箇所の選択肢候補を取得し、前記問題文と前記選択肢候補およびマスク対象箇所の文字列とに基づいて問題を作成する問題作成部と、
を有する、問題作成支援装置。
【請求項2】
前記マスク選定部は、前記文章データに含まれる用語の重要度に基づいて前記マスク対象箇所を選定する、請求項1に記載の問題作成支援装置。
【請求項3】
前記マスク選定部はさらに、前記要約データに含まれる用語の重要度に基づいて前記マスク対象箇所を選定する、請求項2に記載の問題作成支援装置。
【請求項4】
前記問題作成部は、前記取得された選択肢候補の確信度に基づいて前記選択肢候補から選択肢を選定し、前記選定された選択肢を利用して前記問題を作成する、請求項1に記載の問題作成支援装置。
【請求項5】
前記問題作成部は、前記取得された選択肢候補をユーザに提示し、前記ユーザによって前記選択肢候補から選定された選択肢を利用して前記問題を作成する、請求項1に記載の問題作成支援装置。
【請求項6】
前記問題作成部は、1つ以上の問題候補をユーザに提示し、前記ユーザによって選択された問題候補を前記問題として決定する、請求項1に記載の問題作成支援装置。
【請求項7】
前記学習済みモデルは、Transformerベースの機械学習モデルである、請求項1に記載の問題作成支援装置。
【請求項8】
文章データを取得することと、
前記文章データの要約データを生成することと、
前記要約データからマスク対象箇所を選定することと、
前記マスク対象箇所を含む文章を抽出し、マスクした前記文章を問題文として複数の文章を学習した学習済みモデルに入力して前記マスク対象箇所の選択肢候補を取得し、前記問題文と前記選択肢候補およびマスク対象箇所の文字列とに基づいて問題を作成することと、
を有する、コンピュータが実行する問題作成支援方法。
【請求項9】
文章データを取得することと、
前記文章データの要約データを生成することと、
前記要約データからマスク対象箇所を選定することと、
前記マスク対象箇所を含む文章を抽出し、マスクした前記文章を問題文として複数の文章を学習した学習済みモデルに入力して前記マスク対象箇所の選択肢候補を取得し、前記問題文と前記選択肢候補およびマスク対象箇所の文字列とに基づいて問題を作成することと、
をコンピュータに実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、問題作成支援装置、問題作成支援方法及びプログラムに関する。
【背景技術】
【0002】
近年のディープラーニングの進展によって、機械学習技術が広範な技術分野に適用されてきている。例えば、自然言語処理の技術分野では、情報抽出、情報検索、要約生成、機械翻訳、音声認識、対話処理などに利用される機械学習モデルの研究開発が進展している。
【0003】
例えば、モデルの一つであるBERT(Bidirectinal Encoder Representations from Transformers)によると、入力された文章においてマスクされた単語を高精度に予測することが可能である。BERTを利用して、ある1つの問題文における空欄の単語の選択肢を決定し、決定された選択肢を用いて穴埋め問題を作成するための技術が、特許文献1に記載されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2022-175437号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
一方、数ページ以上などのある程度の分量の文章データから文章内容に沿った問題を作成したいケースがある。この場合、例えば、入力された文章データから問題文がランダムに選択されると、文章内容を適切に捉えていない問題が作成される可能性がある。また、入力された文章データの分量が大きい場合、文章全体を確認して問題文を人手によって選択することは、時間と労力がかかってしまう。
【0006】
本開示の課題は、入力文書量が多くてもより適切な問題の作成を支援するための技術を提供することである。
【課題を解決するための手段】
【0007】
本開示の一態様は、文章データを取得するデータ取得部と、前記文章データの要約データを生成する要約生成部と、前記要約データからマスク対象箇所を選定するマスク選定部と、前記マスク対象箇所を含む文章を抽出し、マスクした前記文章を問題文として複数の文章を学習した学習済みモデルに入力して前記マスク対象箇所の選択肢候補を取得し、前記問題文と前記選択肢候補およびマスク対象箇所の文字列とに基づいて問題を作成する問題作成部と、を有する、問題作成支援装置に関する。
【発明の効果】
【0008】
本開示によると、入力文書量が多くてもより適切な問題の作成を支援することができる。
【図面の簡単な説明】
【0009】
図1図1は、本開示の一実施例による問題作成支援処理を示す概略図である。
図2図2は、本開示の一実施例による問題作成支援装置を示す概略図である。
図3図3は、本開示の一実施例による問題作成支援装置のハードウェア構成を示すブロック図である。
図4図4は、本開示の一実施例による問題作成支援装置の機能構成を示すブロック図である。
図5図5は、本開示の一実施例による問題作成支援装置における画面遷移図である。
図6図6は、本開示の一実施例による問題作成支援装置における画面遷移図である。
図7図7は、本開示の一実施例による問題作成支援装置における画面遷移図である。
図8図8は、本開示の一実施例による問題作成支援処理を示すフローチャートである。
【発明を実施するための形態】
【0010】
以下、図面を参照して本開示の実施の形態を説明する。
【0011】
以下の実施例では、文章データから穴埋め問題を作成することを支援する問題作成支援装置が開示される。
【0012】
[本開示の概略]
後述される実施例では、文章データを取得すると、問題作成支援装置はまず、取得した文章データを要約した要約データを生成する。例えば、図1に示されるように、「特許とは企業にとって大切なものです。・・・日本の特許法では、期間は20年となります。」などの文章データを取得すると、問題作成支援装置は、「特許権がある限り、発明の実施を独占することができます。しかし、特許権には有効な期間が設けられており、期間を過ぎるとその特許での発明の実施は独占できません。」などの要約データを生成する。
【0013】
要約データを生成すると、問題作成支援装置は、生成した要約データからマスク対象箇所(図示された例では、「有効」)を決定し、マスク対象箇所を含む問題文(図示された例では、「しかし、特許権には( )な期間が設けられており、期間を過ぎるとその特許での発明の実施は独占できません。」)を抽出する。あるいは、問題作成支援装置は、生成した要約データから問題文を抽出し、抽出した問題文におけるマスク対象箇所を決定してもよい。そして、問題作成支援装置は、BERTなどの自然言語処理のための学習済みモデルを利用して、問題文におけるマスク対象箇所に該当しうる選択肢候補(図示された例では、「自由」、「柔軟」、「不完全」及び「私的」)を決定し、問題文と選択肢候補およびマスク前の文字列(図示された例では、「有効」)とに基づいて穴埋め問題を作成する。
【0014】
このようにして、文章データの内容を要約した要約データに基づいて問題を作成することによって、文章データの内容に適した穴埋め問題を作成することが可能になる。
【0015】
[問題作成支援装置]
図2は、本開示の一実施例による問題作成支援装置100を示す概略図である。問題作成支援装置100は、図2に示されるように、問題作成用の文章データをユーザから取得すると、文章データから要約データを作成し、マスク対象箇所が指定された要約データをサーバ50に送信する。そして、問題作成支援装置100は、サーバ50上のBERTなどの処理手法を用いて学習された学習済みモデルからマスク対象箇所の選択肢候補を取得して、要約データ、選択肢候補及びマスクされた文字列に基づいて問題を作成する。そして、問題作成支援装置100は、作成された問題をユーザに提示する。なお、学習済みモデルは必ずしも別のコンピュータに独立する必要はなく、問題作成支援装置100に格納されていても良い。
【0016】
ここで、文章データは、例えば、インターネット上のウェブページから抽出されたテキストデータやHTML(HyperText Markup Language)データ、WORDファイル、PowerPointファイル、PDF(Portable Document Format)ファイルなど、文章を含む何れかのタイプの電子データなどであってもよい。あるいは、文章データは、オンラインミーティングなどから取得された音声データに対して音声認識を実行することによって生成されるテキストデータや画像ファイルを文字認識した結果のテキストデータなどであってもよい。なお、本開示による文章データは、上述した特定の形態に限定されず、他の何れかのタイプのデータであってもよい。
【0017】
ここで、問題作成支援装置100は、サーバ、パーソナルコンピュータ(PC)、スマートフォン、タブレット等の計算装置によって実現されてもよく、例えば、図3に示されるようなハードウェア構成を有してもよい。すなわち、問題作成支援装置100は、バスBを介し相互接続されるドライブ装置101、ストレージ装置102、メモリ装置103、プロセッサ104、ユーザインタフェース(UI)装置105及び通信装置106を有する。
【0018】
問題作成支援装置100における各種機能及び処理を実現するプログラム又は指示は、CD-ROM(Compact Disk-Read Only Memory)、フラッシュメモリ等の着脱可能な記憶媒体に格納されてもよい。当該記憶媒体がドライブ装置101にセットされると、プログラム又は指示が記憶媒体からドライブ装置101を介しストレージ装置102又はメモリ装置103にインストールされる。ただし、プログラム又は指示は、必ずしも記憶媒体からインストールされる必要はなく、ネットワークなどを介し何れかの外部装置からダウンロードされてもよい。
【0019】
ストレージ装置102は、ハードディスクドライブなどによって実現され、インストールされたプログラム又は指示と共に、プログラム又は指示の実行に用いられるファイル、データ等を格納する。
【0020】
メモリ装置103は、ランダムアクセスメモリ、スタティックメモリ等によって実現され、プログラム又は指示が起動されると、ストレージ装置102からプログラム又は指示、データ等を読み出して格納する。ストレージ装置102、メモリ装置103及び着脱可能な記憶媒体は、非一時的な記憶媒体(non-transitory storage medium)として総称されてもよい。
【0021】
プロセッサ104は、1つ以上のプロセッサコアから構成されうる1つ以上のCPU(Central Processing Unit)、GPU(Graphics Processing Unit)、処理回路(processing circuitry)等によって実現されてもよく、メモリ装置103に格納されたプログラム、指示、当該プログラム若しくは指示を実行するのに必要なパラメータなどのデータ等に従って、問題作成支援装置100の各種機能及び処理を実行する。
【0022】
ユーザインタフェース(UI)装置105は、キーボード、マウス、カメラ、マイクロフォン等の入力装置、ディスプレイ、スピーカ、ヘッドセット、プリンタ等の出力装置、タッチパネル等の入出力装置から構成されてもよく、ユーザと問題作成支援装置100との間のインタフェースを実現する。例えば、ユーザは、ディスプレイ又はタッチパネルに表示されたGUI(Graphical User Interface)をキーボード、マウス等を操作し、問題作成支援装置100を操作する。
【0023】
通信装置106は、外部装置、インターネット、LAN(Local Area Network)、セルラーネットワーク等の通信ネットワークとの有線及び/又は無線通信処理を実行する各種通信回路により実現される。
【0024】
しかしながら、上述したハードウェア構成は単なる一例であり、本開示による問題作成支援装置100は、他の何れか適切なハードウェア構成により実現されてもよい。
【0025】
図4は、本開示の一実施例による問題作成支援装置100の機能構成を示すブロック図である図4に示されるように、問題作成支援装置100は、データ取得部110、要約生成部120、マスク選定部130及び問題作成部140を有する。データ取得部110、要約生成部120、マスク選定部130及び問題作成部140の各機能部は、問題作成支援装置100のメモリ装置103に格納されているコンピュータプログラムがプロセッサ104によって実行されることによって実現されてもよい。
【0026】
データ取得部110は、文章データを取得する。ここで、文章データとは、以下に限定されることなく、日本語、英語などの何れかの言語に使用される文字、英数字、記号などを含むデータを意味してもよい。例えば、データ取得部110は、図5に示されるように、問題作成支援装置100のユーザからの操作指示に応答して文章データを取得し、取得した文章データを問題作成用の文章データとしてディスプレイ上に表示してもよい。具体的には、データ取得部110は、ウェブページなどを閲覧中のユーザによって選択されたウェブページ又はウェブページ上のテキストデータやHTMLデータなどを文章データとして取得してもよい。また、データ取得部110は、取得又は作成されたWORDデータ、PDFデータ、パワーポイントデータなど、文章データを含む電子データ又はその一部などを文章データとして取得してもよい。あるいは、データ取得部110は、音声データ又は映像データを取得し、取得した音声データ又は映像データにおける発話部分などの音声認識結果を文章データとして取得してもよい。
【0027】
要約生成部120は、文章データの要約データを生成する。具体的には、要約生成部120は、何れか公知の要約アルゴリズム/モデルを利用して、データ取得部110によって取得された文章データから、当該文書データの内容の要約を示す要約データを生成する。例えば、要約アルゴリズム/モデルは、文章データの一部を抽出することによって要約データを作成する抽出型と、文章データの内容から要約データを新たに作成する生成型とに大別されうる。抽出型の要約アルゴリズム/モデルとして、Luhn、LSA(Latent Semantic Analysis)、TextRank、Reductionなどがあげられる。一方、生成型の要約アルゴリズム/モデルとして、BERTSUMなどがあげられる。また、要約生成部120は、異なる要約アルゴリズム/モデルを利用して、文章データから異なる複数の要約データを生成してもよい。
【0028】
マスク選定部130は、要約データからマスク対象箇所を選定する。具体的には、マスク選定部130は、所定の選定基準に従って要約データにおける用語を選定し、選定した用語をマスク対象箇所として決定してもよい。例えば、マスク選定部130は、文章データに基づいて要約データからマスク対象箇所を選定してもよい。
【0029】
一実施例では、マスク選定部130は、文章データに含まれる用語の重要度に基づいてマスク対象箇所を選定してもよい。例えば、重要度は、文章データ内の用語の出現回数/頻度であってもよいし、当該出現回数/頻度に基づいて算出されうる何れかの値であってもよい。あるいは、重要度は、tf-idf(term frequency-inverse document frequency)など、文書内における用語の重要性を示す何れか公知の指標であってもよい。文章データに含まれる各用語の重要度を決定すると、マスク選定部130は、要約データに含まれる用語のうち最も高い重要度の用語を特定し、特定された用語を要約データにおけるマスク対象箇所として選定してもよい。あるいは、マスク選定部130は、重要度の降順などによって文章データ内の用語をリスト化し、用語リストをユーザに提示し、提示された用語リストからユーザによって選択された用語をマスク対象箇所として選定してもよい。本実施例によると、文章データにおいて重要な用語を問題作成に利用することができる。
【0030】
また、一実施例では、マスク選定部130は、文章データに含まれる専門用語をマスク対象箇所として選定してもよい。例えば、マスク選定部130は、TermExtractなどの専門用語を抽出するための何れか公知のツール/モジュールを利用して、文章データに含まれる専門用語を抽出し、抽出された専門用語のいずれかをランダムに要約データにおけるマスク対象箇所として選定してもよい。また、マスク選定部130は、抽出された用語をリスト形式でユーザに提示し、用語リストからユーザによって選択された用語をマスク対象箇所として選定してもよい。また、用語リストの各専門用語は、上述した出現回数/頻度、重要性指標などの重要度と関連付けてユーザに提示されてもよい。本実施例によると、文章データにおいて重要であると想定される専門用語を問題作成に利用することができる。
【0031】
また、一実施例では、マスク選定部130は、要約データから用語をランダムに抽出し、抽出された用語をマスク対象箇所として選定してもよい。また、マスク選定部130は、要約データ全体の用語の中からユーザによって選定された用語をマスク対象箇所として選定してもよい。本実施例によると、マスク選定部130は、用語の重要度を計算したり、専門用語の抽出用のツール/モジュールを実行するなどの計算負荷を負うことなく、マスク対象箇所を選定することができる。
【0032】
また、一実施例では、マスク選定部130はさらに、要約データに含まれる用語の重要度に基づいてマスク対象箇所を選定してもよい。すなわち、マスク選定部130は、文章データに含まれる用語の重要度と、要約データに含まれる用語の重要度との双方に基づいて、マスク対象箇所を選定してもよい。例えば、文章データと要約データとの双方において重要度が高い用語は、マスク対象箇所として適していると考えられうる。従って、マスク選定部130は、文章データにおける重要度だけでなく要約データにおける重要度も考慮して、マスク対象箇所を選定してもよい。本実施例によると、文章データと要約データとの用語の双方の重要度を考慮して、文章内容により適したマスク対象箇所を選定することができる。
【0033】
問題作成部140は、マスク対象箇所を含む問題文を学習済みモデルに入力してマスク対象箇所の選択肢候補を取得し、問題文と選択肢候補およびマスク前の用語とに基づいて問題を作成する。ここで、学習済みモデルは、BERT(Bidirectional Encoder Representations from Transformers)などのTransformerベースの機械学習モデルを含む何れか公知の言語モデルであってもよい。当業者によく知られるように、BERTは、文章における前後の文脈を考慮して、ある文においてマスクされた箇所に適した固有表現を予測することができる。具体的には、BERTは、マスクされた箇所に適した固有表現を、確信度(スコアとも呼ばれうる)と共に出力しうる。例えば、学習済みモデルはサーバ50に備えられ、問題作成部140は、マスク対象箇所を含む問題文をサーバ50に送信し、複数の選択肢候補を各自の確信度と関連付けてサーバ50から受信しうる。また、前後の文脈により適した選択肢候補を検出するため、学習済みモデルに入力される問題文は、マスク対象箇所を含む1つの文だけでなく、前後の複数の文を含んでもよい。
【0034】
一実施例では、問題作成部140は、取得された選択肢候補の確信度に基づいて選択肢候補から選択肢を選定し、選定された選択肢を利用して問題を作成してもよい。具体的には、マスク対象箇所の選択肢候補を取得すると、問題作成部140は、取得した選択肢候補から確信度が上位所定数個の選択肢候補とマスクされた用語(問題の正解)とを問題の選択肢として決定し、マスク対象箇所を含む問題文と決定された選択肢とから問題を作成する。例えば、N択の穴埋め問題では、問題作成部140は、マスクされた用語(問題の正解)と、学習済みモデルから提供された正解と異なる上位(N-1)個の確信度の選択肢候補とを選択肢として決定し、N個の選択肢と問題文とから問題を作成し、図5に示されるように、ユーザに提示してもよい。ユーザが提示された問題を承認すると、この問題は、文章データに対する問題として採用されうる。本実施例によると、確信度を用いてマスク対象箇所に適した選択肢を用いて問題を作成することができる。
【0035】
また、一実施例では、問題作成部140は、取得された選択肢候補をユーザに提示し、ユーザによって選択肢候補から選定された選択肢を利用して問題を作成してもよい。例えば、図6に示されるように、問題作成部140は、K個(N<K)の選択肢候補をユーザに提示し、提示した選択肢候補からユーザに選択肢を選択させてもよい。ここで、問題作成部140は、K個の選択肢候補と共に、各選択肢候補の確信度をユーザに提示してもよい。ユーザによって(N-1)個の選択肢が選択されると、問題作成部140は、正解を含むN個の選択肢と問題文とから問題を作成し、図6に示されるように、ユーザに提示してもよい。ユーザが提示された問題を承認すると、この問題は、文章データに対する問題として採用されうる。本実施例によると、マスク対象箇所としてユーザによって選択された選択肢を用いて問題を作成することができる。
【0036】
また、一実施例では、問題作成部140は、1つ以上の問題候補をユーザに提示し、ユーザによって選択された問題候補を問題として決定してもよい。例えば、図7に示されるように、問題作成部140は、L個の問題候補を作成してユーザに提示し、提示した問題候補からユーザに問題を選択させてもよい。具体的には、問題作成部140は、マスク選定部130からL個のマスク対象箇所を取得し、取得したL個のマスク対象箇所のそれぞれに対して問題候補を作成し、図7に示されるように、作成したL個の問題候補をユーザに提示してもよい。提示されたL個の問題候補からユーザによって選択された問題が、文章データに対する問題として採用されうる。本実施例によると、作成された問題候補からユーザが問題を選択することができる。
【0037】
なお、上述した実施例では、マスク対象箇所がまず選定され、選定されたマスク対象箇所を含む問題文に対して問題が作成されたが、本開示は、必ずしもこれに限定されるものでない。例えば、要約データから問題文がまず決定され、決定された問題文においてマスク対象箇所が選定されてもよい。ここで、問題文は、ユーザによって決定されてもよいし、ランダムに決定されてもよい。
【0038】
[問題作成支援処理]
次に、図8を参照して、本開示の一実施例による問題作成支援処理を説明する。図8は、本開示の一実施例による問題作成支援処理を示すフローチャートである。当該問題作成支援処理は、例えば、問題作成支援装置100によって実行され、より詳細には、問題作成支援装置100のプロセッサ104がメモリ装置103に格納されたコンピュータプログラム又は指示を実行することによって実現されてもよい。
【0039】
ステップS101において、問題作成支援装置100は、文章データを取得する。具体的には、問題作成支援装置100は、ウェブページなどを閲覧中のユーザによって選択されたウェブページ又はウェブページ上のテキストデータやHTMLデータ、ユーザによって取得又は作成されたWORDデータ、PDFデータ、パワーポイントデータなどの文章データを含む電子データ又はその一部、取得した音声データ又は映像データにおける発話部分などの音声認識結果などを文章データとして取得してもよい。
【0040】
ステップS102において、問題作成支援装置100は、文章データの要約データを生成する。具体的には、問題作成支援装置100は、何れか公知の要約アルゴリズム/モデルを利用して、文章データの内容の要約を示す要約データを生成する。要約アルゴリズム/モデルの具体例として、Luhn、LSA、TextRank、Reduction、BERTSUMなどがあげられる。また、問題作成支援装置100は、異なる要約アルゴリズム/モデルを利用して、文章データから異なる複数の要約データを生成してもよい。
【0041】
ステップS103において、問題作成支援装置100は、要約データからマスク対象箇所を選定する。マスク対象箇所は、文章データ及び/又は要約データに含まれる用語の重要度に基づいて選定されてもよい。また、マスク対象箇所は、文章データ及び/又は要約データから抽出された専門用語とされてもよい。あるいは、マスク対象箇所は、要約データからユーザによって選定されてもよい。
【0042】
ステップS104において、問題作成支援装置100は、マスク対象箇所を含む問題文を学習済みモデルに入力してマスク対象箇所の選択肢候補を取得する。例えば、学習済みモデルは、BERTなどのTransformerベースの機械学習モデルを含む何れかの言語モデルであってもよい。具体的には、問題作成支援装置100は、要約データにおけるマスク対象箇所を含む1つ以上の文(例えば、マスク対象箇所を含む文と、その前後のいくつかの文など)を学習済みモデルに入力し、マスク対象箇所の複数の選択肢候補を学習済みモデルから取得してもよい。
【0043】
ステップS105において、問題作成支援装置100は、問題文と選択肢候補とに基づいて問題を作成する。具体的には、問題作成支援装置100は、学習済みモデルから取得した選択肢候補から所定数個の選択肢候補を選定し、マスクされた用語(正解)と選定された選択肢候補とを選択肢として決定し、決定された選択肢と問題文とに基づいて問題を作成してもよい。例えば、選択肢は、確信度及び/又はユーザ選択に基づいて選択肢候補から決定されてもよい。作成された問題は、ユーザに提示され、ユーザから承認されると、文章データに対する問題として採用されうる。
【0044】
上述した実施例によると、文章データの内容を要約した要約データに基づいて問題を作成することによって、文章データの内容に適した穴埋め問題を作成することが可能になる。
【0045】
以上、本開示の実施例について詳述したが、本開示は上述した特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本開示の要旨の範囲内において、種々の変形・変更が可能である。
【符号の説明】
【0046】
50 サーバ
100 問題作成支援装置
110 データ取得部
120 要約生成部
130 マスク選定部
140 問題作成部
図1
図2
図3
図4
図5
図6
図7
図8