特許7296029 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ 株式会社エヌ・ティ・ティ・データの特許一覧 ▶ 学校法人慶應義塾の特許一覧

特許7296029語学教材生成システム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2023-06-14

(45)【発行日】2023-06-22

(54)【発明の名称】語学教材生成システム

(51)【国際特許分類】

G09B 19/06 20060101AFI20230615BHJP

G09B 5/06 20060101ALI20230615BHJP

G10L 15/00 20130101ALI20230615BHJP

G10L 15/10 20060101ALI20230615BHJP

【ＦＩ】

G09B19/06

G09B5/06

G10L15/00 200E

G10L15/10 500Z

【請求項の数】 2

(21)【出願番号】P 2019046016

(22)【出願日】2019-03-13

(65)【公開番号】P2020148892

(43)【公開日】2020-09-17

【審査請求日】2022-01-05

(73)【特許権者】

【識別番号】000102728

【氏名又は名称】株式会社エヌ・ティ・ティ・データ

(73)【特許権者】

【識別番号】899000079

【氏名又は名称】慶應義塾

(74)【代理人】

【識別番号】110000752

【氏名又は名称】弁理士法人朝日特許事務所

(72)【発明者】

【氏名】松下正樹

(72)【発明者】

【氏名】寺澤美恵

(72)【発明者】

【氏名】伊藤寛祥

(72)【発明者】

【氏名】奥出直人

(72)【発明者】

【氏名】佐藤千尋

(72)【発明者】

【氏名】浦瀬裕基

(72)【発明者】

【氏名】樋口冴子

【審査官】西村民男

(56)【参考文献】

【文献】特開２０１８－１１６１９０（ＪＰ，Ａ）

【文献】特開２０１７－２１５９４３（ＪＰ，Ａ）

【文献】特開２００４－０２０７３９（ＪＰ，Ａ）

【文献】特開２００２－１４９０５３（ＪＰ，Ａ）

【文献】特開２００２－２７８４４１（ＪＰ，Ａ）

【文献】米国特許出願公開第２０１７／０２２１４７１（ＵＳ，Ａ１）

【文献】米国特許出願公開第２０１４／０２９７２６６（ＵＳ，Ａ１）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０９Ｂ１／００－９／５６

１７／００－１９／２６

Ｇ０６Ｑ５０／２０

Ｇ１０Ｌ１５／００

(57)【特許請求の範囲】

【請求項1】

外国語を用いて行われた会話の音声を解析して、複数の発言と、当該複数の発言の各々がなされた時点を特定する音声解析部と、
前記特定された複数の発言のうち、前記会話が行われた際に使用された資料に記載されている語句を含む複数の発言をゴールとして抽出するゴール抽出部と、
前記抽出された複数のゴールの各々について、前記特定された複数の発言の中から、当該ゴールと当該ゴールに後続する他のゴールの間に位置する発言であって、当該他のゴールから所定の範囲内に位置する発言を当該ゴールの結果として抽出する結果抽出部と、
前記抽出された複数のゴールの各々について、当該ゴールが発言された時点と、当該ゴールに後続する他のゴールが発言された時点の間の時間を当該ゴールの所要時間として特定する所要時間特定部と、
前記抽出された複数のゴールの各々について、前記特定された複数の発言のうち、当該ゴールと当該ゴールに後続する他のゴールの間に位置する複数の発言の各々について、当該ゴール又は当該ゴールについて抽出された結果を構成する語句を含む度合いを示す関連度を判定し、判定した関連度が高い順に所定数以下の発言を当該ゴールの関連発言として抽出する関連発言抽出部と、
前記抽出された複数のゴールの各々について、当該ゴールについて抽出された関連発言を構成する語句の難易度に基づいて、当該ゴールに適した前記外国語の習熟度を判定する習熟度判定部と、
前記抽出された複数のゴールの中から、当該ゴールについて判定された習熟度と前記外国語の学習者の習熟度との間、および、当該ゴールについて判定された習熟度と前記外国語の学習支援者の習熟度との間で所定の条件を満たす複数のゴールを選択するゴール選択部と、
前記選択された複数のゴールを、各グループを構成するゴールの所要時間の合計が所定の学習時間を超えないようにグループ分けするゴールグルーピング部と、
グループ分けされた前記複数のグループの各々について、当該グループを構成する複数のゴールと当該複数のゴールの各々の所要時間を示すファイルを教材として生成する教材生成部と
を備える語学教材生成システム。

【請求項2】

前記抽出された複数のゴールの各々について、当該ゴールが発言された時点と、当該ゴールに後続する他のゴールが発言された時点の間に行われた所定の身体動作を、前記会話の場面を記録した動画を解析して特定する身体動作特定部と、
前記抽出された複数のゴールの各々について、当該ゴールについて特定された身体動作に予め対応付けられている、前記学習者の身体動作又は学習環境に関する注意点を示す補足事項を特定する補足事項特定部と
をさらに備え、
前記教材生成部は、グループ分けされた前記複数のグループの各々について、当該グループを構成する複数のゴールと当該複数のゴールの各々の所要時間と補足事項を示すファイルを教材として生成する
ことを特徴とする請求項１に記載の語学教材生成システム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、語学教材を生成するためのシステムに関する。

【背景技術】

【0002】

従来、コンピュータを用いて語学教材を生成する方法が知られている。例えば、特許文献１には、学習者の操作情報や反応情報を取り込み、初期の学習ストーリーを別の学習ストーリーに変化させる電子学習システムが記載されている。この電子学習システムによれば、学習者オリジナルの学習ストーリーを仕立てることにより、学習効果を飛躍的に高めることができる。

【先行技術文献】

【特許文献】

【0003】

【文献】特開２００６－３０８８１５公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

しかし、従来の方法で生成された語学教材は、学習者が実際に外国語を使用する状況を必ずしも反映したものとはなっていないため、語学教材を用いて学習しても学習の成果が出にくいという問題があった。

【0005】

本発明はこのような事情に鑑みてなされたものであり、学習者が実際に外国語を使用する状況を反映させた語学教材を生成することを目的とする。

【課題を解決するための手段】

【0006】

上記課題を解決するため、本発明は、外国語を用いて行われた会話の音声を解析して、複数の発言と、当該複数の発言の各々がなされた時点を特定する音声解析部と、前記特定された複数の発言のうち、前記会話が行われた際に使用された資料に記載されている語句を含む複数の発言をゴールとして抽出するゴール抽出部と、前記抽出された複数のゴールの各々について、前記特定された複数の発言の中から、当該ゴールと当該ゴールに後続する他のゴールの間に位置する発言であって、当該他のゴールから所定の範囲内に位置する発言を当該ゴールの結果として抽出する結果抽出部と、前記抽出された複数のゴールの各々について、当該ゴールが発言された時点と、当該ゴールに後続する他のゴールが発言された時点の間の時間を当該ゴールの所要時間として特定する所要時間特定部と、前記抽出された複数のゴールの各々について、前記特定された複数の発言のうち、当該ゴールと当該ゴールに後続する他のゴールの間に位置する複数の発言の各々について、当該ゴール又は当該ゴールについて抽出された結果を構成する語句を含む度合いを示す関連度を判定し、判定した関連度が高い順に所定数以下の発言を当該ゴールの関連発言として抽出する関連発言抽出部と、前記抽出された複数のゴールの各々について、当該ゴールについて抽出された関連発言を構成する語句の難易度に基づいて、当該ゴールに適した前記外国語の習熟度を判定する習熟度判定部と、前記抽出された複数のゴールの中から、当該ゴールについて判定された習熟度と前記外国語の学習者の習熟度との間、および、当該ゴールについて判定された習熟度と前記外国語の学習支援者の習熟度との間で所定の条件を満たす複数のゴールを選択するゴール選択部と、前記選択された複数のゴールを、各グループを構成するゴールの所要時間の合計が所定の学習時間を超えないようにグループ分けするゴールグルーピング部と、グループ分けされた前記複数のグループの各々について、当該グループを構成する複数のゴールと当該複数のゴールの各々の所要時間を示すファイルを教材として生成する教材生成部とを備える語学教材生成システムを提供する。

【0007】

好ましい態様において、前記語学教材生成システムは、前記抽出された複数のゴールの各々について、当該ゴールが発言された時点と、当該ゴールに後続する他のゴールが発言された時点の間に行われた所定の身体動作を、前記会話の場面を記録した動画を解析して特定する身体動作特定部と、前記抽出された複数のゴールの各々について、当該ゴールについて特定された身体動作に予め対応付けられている、前記学習者の身体動作又は学習環境に関する注意点を示す補足事項を特定する補足事項特定部とをさらに備え、前記教材生成部は、グループ分けされた前記複数のグループの各々について、当該グループを構成する複数のゴールと当該複数のゴールの各々の所要時間と補足事項を示すファイルを教材として生成する。

【発明の効果】

【0009】

本発明によれば、学習者が実際に外国語を使用する状況を反映させた語学教材を生成することができる。

【図面の簡単な説明】

【0010】

【図1】ディスコースコミュニティ分析に係る機能構成の一例を示すブロック図

【図2】記譜データの一例を示す図

【図3】資料データの一例を示す図

【図4】ゴール／結果リストデータの一例を示す図

【図5】関連発言リストデータの一例を示す図

【図6】判定条件テーブルの一例を示す図

【図7】身体動作リストデータの一例を示す図

【図8】単語リストデータの一例を示す図

【図9】英会話教材の生成に係る機能構成の一例を示すブロック図

【図10】難易度判定テーブルデータの一例を示す図

【図11】習熟度判定テーブルデータの一例を示す図

【図12】ゴールレベルデータの一例を示す図

【図13】レッスン情報テーブルデータの一例を示す図

【図14】教材パターンデータの一例を示す図

【図15】補足事項判定テーブルデータの一例を示す図

【図16】教材ファイルの一例を示す図

【図17】ディスコースコミュニティ分析処理の一例を示すフロー図

【図18】ゴール／結果リストデータ生成処理の一例を示すフロー図

【図19】関連発言抽出処理の一例を示すフロー図

【図20】英会話教材生成処理の一例を示すフロー図

【図21】習熟度判定処理の一例を示すフロー図

【図22】教材パターン特定処理の一例を示すフロー図

【図23】教材ファイル生成処理の一例を示すフロー図

【発明を実施するための形態】

【0011】

１．実施形態
本発明の一実施形態に係る語学教材生成システム１について、図面を参照して説明する。以下に説明する語学教材生成システム１は、特に英会話教材を生成するためのシステムであり、１又は複数のサーバにより構成される。
１－１．構成
語学教材生成システム１を用いて英会話教材を生成するにあたり、学習対象である英会話が実際に行われている環境について民族誌調査を行う。例えば、学習者が、特定の会社の業務で行われている英会話を習得したい場合には、その業務に実際に従事する人を対象者として民族誌調査を行う。この民族誌調査では、その業務に実際に従事する人の音声と動画を記録する。語学教材生成システム１は、この記録された音声と動画に基づいて、ディスコースコミュニティ分析を行う。ここでディスコースとは二人の話者の言葉のやりとりのことで、言語学では談話と訳される。このやりとりを複数の共通する目的をもつ話者（これをコミュニティと呼ぶ）からなる談話の集まりとみたのがディスコースコミュニティである。したがって、ディスコースコミュニティ分析とは複数の特定の目的をもつ話者の間で取り交わされる談話（ディスコース）を分析し、どのようにディスコースを通してコミュニティが目的を達成していくかのプロセスを分析するものである。具体的には、「ゴールと結果」、「ゴール達成に寄与した発言内容」、「ゴール達成に寄与した身体動作及び環境要素」及び「リソース」を抽出することで、その環境の文化的特徴を明らかにする。そして、ディスコースコミュニティ分析の結果に基づいて英会話教材を生成する。生成された英会話教材は、主に英会話学習用の施設で学習者のレッスンに使用される。
以下、語学教材生成システム１により実行されるディスコースコミュニティ分析と英会話教材の生成について説明する。

【0012】

図１は、ディスコースコミュニティ分析に係る機能構成の一例を示すブロック図である。同図に示す機能のうち、音声記憶部２、記譜記憶部４、資料記憶部５、ゴール／結果リスト記憶部７、関連発言リスト記憶部９、動画記憶部１０、身体動作リスト記憶部１２及び単語リスト記憶部１４は、メモリにより実現される。一方、音声解析部３、ゴール／結果リスト生成部６、関連発言リスト生成部８、身体動作リスト生成部１１及び単語リスト生成部１３は、メモリに記憶されるプログラムをプロセッサが実行することにより実現される。なお、このプログラムは、インターネット等のネットワークや非一時的な記録媒体を介して頒布可能なプログラムである。以下、各機能について説明する。

【0013】

音声記憶部２は、学習対象となる英会話であって、実際に行われた英会話の音声データを記憶する。本実施形態の以下の説明では、学習対象の英会話として、会議中の英会話を想定する。この音声記憶部２に記憶される音声データは、ピンマイクを用いて会議の参加者ごとに生成され、参加者の識別情報と対応付けて記憶される。または、会議の参加者全員の音声を１つのマイクで収音し、声紋分析を用いて参加者ごとの音声データを生成する。

【0014】

音声解析部３は、音声記憶部２に記憶される音声データを解析して、会議中の発言内容を特定し、特定した発言内容とその発言者とその発言の時点を対応付けることで、記譜データを生成する。図２は、この記譜データの一例を示す図である。同図に示す記譜データは、例えば、会議の開始後１分２秒経過後の時点でＡ氏により「there should be some pros and cons about the change of the logo design」という発言がなされたことを示している。音声解析部３により生成された記譜データは、記譜記憶部４に記憶される。なお、記譜記憶部４に記憶された記譜データは、音声認識の精度が低い場合には、人間の手により修正されてもよい。

【0015】

資料記憶部５は、上記の会議で使用された資料のデータを記憶する。本実施形態の以下の説明では、上記の会議で使用された資料として、アジェンダ（言い換えると、議事の進行順序）を示す資料を想定する。図３は、この資料データの一例を示す図である。同図に示す資料データは、例えば、会議（１）の最初の議事がSelf-introductionであり、その所要時間が５分の予定であったことを示している。

【0016】

ゴール／結果リスト生成部６は、記譜記憶部４に記憶される記譜データと資料記憶部５に記憶される資料データに基づいて、ゴール、結果及び所要時間を特定して対応付けることで、ゴール／結果リストデータを生成する。ここで、ゴールとは、会議中に行われた議論の目的であり、例えば、「ロゴのデザインを決定したい」といった目的である。結果とは、ゴールについて議論した結果（言い換えると、結論）であり、例えば、「デザインＣに決定」といった結果である。所要時間とは、ゴールについて議論するために費やされた時間である。

【0017】

これらの３つの要素のうち、ゴールを特定するにあたりゴール／結果リスト生成部６は、記譜データにより示される発言のうち、資料データにより示される議事を構成する語句を含む発言を抽出する。例えば、資料データとして図３に示す資料データを想定すると、「logo」や「recruitment」といった語を含む発言を抽出する。その際、ｂｅ動詞と冠詞は無視してよい。また、ゴール／結果リスト生成部６は、記譜データにより示される発言のうち、「please」や「may I ask you」といった、依頼を示す所定の語句を含む発言も抽出する。

【0018】

次に、抽出したゴールの結果を特定するにあたりゴール／結果リスト生成部６は、記譜データにより示される複数の発言のうち、結果の特定対象となっているゴールが、後続する次のゴールに切り替わる直前の発言を抽出する。より具体的には、結果の特定対象となっているゴールと、これに後続する次のゴールの間に位置する発言であって、当該次のゴールから所定の範囲内に位置する発言を抽出する。ここで、当該次のゴールから所定の範囲内に位置する発言とは、具体的には、当該次のゴールの直前の発言である。なお、ゴール／結果リスト生成部６により抽出された発言が不適当である場合には、人間の手により修正されてもよい。

【0019】

次に、抽出したゴールの所要時間を特定するにあたりゴール／結果リスト生成部６は、所要時間の特定対象となっているゴールが、後続する次のゴールに切り替わるまでの時間を特定する。より具体的には、所要時間の特定対象となっているゴールが発言された時点と、後続する次のゴールが発言された時点の間の時間を特定する。例えば、所要時間の特定対象となっているゴールが、会議開始から５分経過後に発言され、後続する次のゴールが、会議開始から１０分経過後に発言された場合には、所要時間として５分が特定される。

【0020】

図４は、ゴール／結果リスト生成部６により生成されるゴール／結果リストデータの一例を示す図である。同図に示すゴール／結果リストデータは、例えば、会議（１）の最初のゴールが「Change the log design」であり、その結果が「Design C fixed」であり、その所要時間が１０分であったことを示している。ゴール／結果リスト生成部６により生成されたゴール／結果リストデータは、ゴール／結果リスト記憶部７に記憶される。なお、ゴール／結果リスト記憶部７に記憶されたゴール／結果リストデータは、データの抽出精度が低い場合には、人間の手により修正されてもよい。

【0021】

次に、関連発言リスト生成部８は、ゴール／結果リスト記憶部７に記憶されるゴール／結果リストデータにより示される各ゴールの達成に寄与した発言（以下、「関連発言」という。）を、記譜記憶部４に記憶される記譜データにより示される発言の中から抽出し、抽出した関連発言のリストデータを生成する。各ゴールについて関連発言を抽出するにあたっては、まず、処理対象のゴールと、これに後続する次のゴールの間に位置する各発言について、処理対象のゴールとの関連度を示すUsage度を算出する。このUsage度は、発言が、処理対象のゴール又は当該ゴールの結果を構成する語句を含む度合いを示す値である。例えば、処理対象のゴールとその結果がそれぞれ「Change the logo design」、「Design C fixed」であり、「there should be some pros and cons about the change of the logo design」という１４個の単語からなる発言についてUsage度を算出する場合を想定すると、この発言には、ゴール又は結果に含まれる「change」、「logo」、「design」という３つの単語が含まれるため、Usage度は「3/14」となる。なお、Usage度を算出するにあたり、ｂｅ動詞と冠詞は無視してよい。

【0022】

各発言についてUsage度を算出すると、次に、Usage度が高い順に所定数の発言を関連発言として抽出する。ここで抽出される関連発言の数は、処理対象のゴールと、これに後続する次のゴールの間に位置する発言の総数の３０％以下とする。なお、この「３０％」という数値はあくまで一例であり、本システムの利用者が求める精度に応じて適宜変更してよい。

【0023】

図５は、関連発言リスト生成部８により生成される関連発言リストデータの一例を示す図である。同図に示す関連発言リストデータは、例えば、会議（１）の最初のゴールが「Change the logo design」であり、その結果が「Design C fixed」であり、その関連発言の１つが「there should be some pros and cons about the change of the logo design」であることを示している。関連発言リスト生成部８により生成された関連発言リストデータは、関連発言リスト記憶部９に記憶される。

【0024】

次に、動画記憶部１０は、上記の会議の場面を記録した動画データを記憶する。動画記憶部１０に記憶される動画データは、会議の参加者全員を撮影可能なように設置されたカメラにより生成される。

【0025】

身体動作リスト生成部１１は、ゴール／結果リスト記憶部７に記憶されるゴール／結果リストデータにより示される各ゴールの達成に寄与した身体動作（以下、単に「身体動作」という。）とその動作者を、動画記憶部１０に記憶される動画データを解析して特定し、特定した身体動作のリストデータを生成する。各ゴールについて身体動作を特定するにあたっては、処理対象のゴールが発言された時点と、これに後続する次のゴールが発言された時点の間に行われた所定の身体動作を、動画データを解析して特定する。ここで所定の身体動作とは、所定の判定条件を満たす身体動作である。図６は、この所定の判定条件を定める判定条件テーブルの一例を示す図である。同図に示す判定条件テーブルは、例えば、「メモを取る」という身体動作に対して、「ペンを持つ指をメモ用紙に触れる位置で動かした」という判定条件を定めている。この判定条件テーブルに定める身体動作を特定するにあたっては、機械学習（より好ましくはディープラーニング）を用いる。具体的には例えば、Language model-based approach、Sequence learning-based approach又はLSTM(Long short-term memory)-Eを用いてもよい（https://www.microsoft.com/en-us/research/wp-content/uploads/2017/10/Tao-Mei-Intelligent-Video-Analysis-ACMMM-2017-Pub.pdf参照）。または、CNN(Convolutional neural network)とRNN(recurrent neural network)を組み合わせたLRCN(Long-term Recurrent Convolutional Networks)と呼ばれるモデルを使用したり、オプティカルフローを検出することで身体動作を特定したりしてもよい（https://www.slideshare.net/YoshitakaUshiku/ss-123687543参考）。身体動作の動作者を特定するにあたっては、身体動作リスト生成部１１は顔認識技術を用いる。

【0026】

図７は、身体動作リスト生成部１１により生成される身体動作リストデータの一例を示す図である。同図に示す身体動作リストデータは、例えば、会議（１）の最初のゴールが「Change the logo design」であり、その結果が「Design C fixed」であり、その身体動作の１つが「資料を確認して読む」であることを示している。身体動作リスト生成部１１により生成された身体動作リストデータは、身体動作リスト記憶部１２に記憶される。

【0027】

次に、単語リスト生成部１３は、記譜記憶部４に記憶される記譜データにより示される各単語を、図示せぬ辞書データベースを用いて語源及び品詞で分類することで、単語リストデータを生成する。図８は、この単語リスト生成部１３により生成される単語リストデータの一例を示す図である。単語リスト生成部１３により生成された単語リストデータは、単語リスト記憶部１４に記憶される。なお、一般の辞書に載っていない専門用語と、一般の辞書に載っている単語であっても特殊な意味で使用されている単語（Contextual）については、人間の手で分類してよい。

【0028】

以上説明した各機能により、英会話教材の生成に使用されるゴール／結果リストデータ、関連発言リストデータ、身体動作リストデータ及び単語リストデータが生成される。これらのデータセットは、学習対象とされる英会話が行われる複数の会議の各々について生成される。

【0029】

次に、英会話教材の生成について説明する。図９は、英会話教材の生成に係る機能構成の一例を示すブロック図である。同図に示す機能のうち、関連発言リスト群記憶部１５、難易度判定テーブル記憶部１６、習熟度判定テーブル記憶部１７、ゴールレベル記憶部１９、ゴール／結果リスト群記憶部２０、レッスン情報テーブル記憶部２１、教材パターン記憶部２３、身体動作リスト群記憶部２４、補足事項判定テーブル記憶部２５、単語リスト群記憶部２６及び教材記憶部２８は、メモリにより実現される。一方、ゴールレベル判定部１８、教材パターン生成部２２及び教材生成部２７は、メモリに記憶されるプログラムをプロセッサが実行することにより実現される。なお、このプログラムは、インターネット等のネットワークや非一時的な記録媒体を介して頒布可能なプログラムである。以下、各機能について説明する。

【0030】

関連発言リスト群記憶部１５は、複数の会議の各々について生成された関連発言リストデータを記憶する。

【0031】

難易度判定テーブル記憶部１６は、単語とその難易度を対応付けるテーブルであって、単語の難易度を判定するために参照されるテーブルのデータを記憶する。図１０は、この難易度判定テーブル記憶部１６に記憶される難易度判定テーブルデータの一例を示す図である。

【0032】

習熟度判定テーブル記憶部１７は、単語の難易度と英会話の習熟度を対応付けるテーブルであって、単語の難易度に基づいて英会話の習熟度を判定するために参照されるテーブルデータを記憶する。ここで、このテーブルに格納される英会話の習熟度としては、CEFR(Common European framework of reference for languages)のレベルを用いる。図１１は、この習熟度判定テーブル記憶部１７に記憶される習熟度判定テーブルデータの一例を示す図である。

【0033】

ゴールレベル判定部１８は、関連発言リスト群記憶部１５に記憶される関連発言リストデータ群により示される各ゴールに適した英会話の習熟度を判定することで、ゴールレベルデータを生成する。各ゴールについて習熟度を判定するにあたっては、処理対象のゴールについて抽出された関連発言に基づいて習熟度を判定する。具体的には、処理対象のゴールについて抽出された関連発言を構成する各単語の難易度を、難易度判定テーブル記憶部１６に記憶される難易度判定テーブルを参照して判定し、その判定した難易度に対応する習熟度を、習熟度判定テーブル記憶部１７に記憶される習熟度判定テーブルを参照して判定する。そして、判定された習熟度の中で最も高い習熟度を、処理対象のゴールの習熟度として特定する。なお、処理対象のゴールについて抽出された関連発言を構成する各単語の難易度を、難易度判定テーブル記憶部１６に記憶される難易度判定テーブルを参照して判定し、その判定した難易度に対応する習熟度を、当該関連発言の習熟度として記憶し、これを関連発言毎に繰り返すことで、記憶された複数の関連発言の習熟度の平均値または最頻値を、処理対象のゴールの習熟度として特定してもよい。

【0034】

図１２は、ゴールレベル判定部１８により生成されるゴールレベルデータの一例を示す図である。同図に示すゴールレベルデータは、例えば、会議（１）のゴール（１）に適した英会話の習熟度がＢ１であることを示している。ゴールレベル判定部１８により生成されたゴールレベルデータは、ゴールレベル記憶部１９に記憶される。

【0035】

次に、ゴール／結果リスト群記憶部２０は、複数の会議の各々について生成されたゴール／結果リストデータを記憶する。

【0036】

レッスン情報テーブル記憶部２１は、英会話のレッスンの各クラスについて、参加者である学習者と学習支援者の英会話の習熟度と、そのクラスの教材パターンを対応付けるテーブルのデータを記憶する。ここで、このテーブルに格納される英会話の習熟度としては、CEFRのレベルを用いる。学習者と学習支援者のCEFRのレベルは、予めテストを行って特定しておく。図１３は、このレッスン情報テーブル記憶部２１に記憶されるレッスン情報テーブルデータの一例を示す図である。同図に示すレッスン情報テーブルデータは、例えば、クラスＧ１に参加する学習者、第１学習支援者、第２学習支援者の習熟度がそれぞれＡ２、Ｂ２、Ｃ１であり、そのクラスの教材パターンが「Ｐ１」であることを示している。

【0037】

教材パターン生成部２２は、レッスン情報テーブル記憶部２１に記憶されるレッスン情報テーブルデータにより示される各クラスに適した教材パターンのデータを生成する。各クラスについて教材パターンを生成するにあたっては、まず、処理対象のクラスに適したゴールを選択する。具体的には、ゴールレベル記憶部１９に記憶されるゴールレベルデータとレッスン情報テーブルデータを参照して、処理対象のクラスに参加する学習者と学習支援者の習熟度との間で所定の条件を満たす習熟度を有するゴールを選択する。ここで所定の条件とは、ゴールの習熟度が学習者の習熟度と同等か１段階高いという第１条件と、ゴールの習熟度がいずれの学習支援者の習熟度も超えないという第２条件の両条件である。例えば、処理対象のクラスとして図１３に示すクラスＧ１を想定し、ゴールレベルデータとして図１２に示すゴールレベルデータを想定すると、上記の所定の条件に従った場合、会議（１）のゴール（２）と、会議（２）のゴール（１）及び（５）が選択されることになる。

【0038】

処理対象のクラスに適したゴールを選択すると、次に、選択したゴールをレッスン単位にグルーピングする。具体的には、ゴールレベル記憶部１９に記憶されるゴール／結果リストデータ群（特に所要時間）を参照して、選択したゴールを、各グループを構成するゴールの所要時間の合計が１回のレッスン時間（例えば５０分）を超えないようにグルーピングし、各グループに教材ＩＤを付与することで教材パターンデータを生成する。図１４は、この教材パターンデータの一例を示す図である。同図に示す教材パターンデータは、例えば、教材パターンＰ１は教材Ａ１－１等により構成され、教材Ａ１－１は、会議（１）のゴール（２）、（３）、（６）及び（８）により構成されることを示している。これらのゴール（２）、（３）、（６）及び（８）の所要時間は、それぞれ５分、１０分、２０分、１０分であり、その合計所要時間である４５分は、５０分のレッスン時間に収まっている。教材パターン生成部２２により生成された教材パターンデータは、教材パターン記憶部２３に記憶され、かつ、レッスン情報テーブルデータにおいて処理対象のクラスと対応付けられる。

【0039】

次に、身体動作リスト群記憶部２４は、複数の会議の各々について生成された身体動作リストデータを記憶する。

【0040】

補足事項判定テーブル記憶部２５は、身体動作と、学習者の身体動作又は学習環境に関する注意点を示す補足事項とを対応付けるテーブルであって、身体動作に基づいて補足事項を判定するために参照されるテーブルのデータを記憶する。図１５は、この補足事項判定テーブル記憶部２５に記憶される補足事項判定テーブルデータの一例を示す図である。

【0041】

単語リスト群記憶部２６は、複数の会議の各々について生成された単語リストデータを記憶する。

【0042】

教材生成部２７は、教材パターン記憶部２３に記憶される教材パターンデータにより示される各教材のファイルを生成する。各教材ファイルを生成するにあたっては、まず、ゴール／結果リスト群記憶部２０に記憶されるゴール／結果リストデータ群を参照して、処理対象の教材を構成する各ゴールとその所要時間を特定する。ゴールと所要時間を特定すると、次に、処理対象の教材を構成する各ゴールについて、身体動作リスト群記憶部２４に記憶される身体動作リストデータを参照して身体動作を特定し、特定した身体動作に対応する補足事項を、補足事項判定テーブル記憶部２５に記憶される補足事項判定テーブルデータを参照して特定する。補足事項を特定すると、次に、処理対象の教材を構成する各ゴールについて、単語リスト群記憶部２６に記憶される単語リストデータを参照して、専門用語とContextualを特定する。専門用語とContextualを特定すると、最後に、特定したゴール、所要時間、補足事項、専門用語及びContextualが記述された教材ファイルを生成する。図１６は、この教材ファイルの一例を示す図である。教材生成部２７により生成された教材ファイルは、教材記憶部２８に記憶される。

【0043】

以上説明した各機能により、英会話のレッスンのカリキュラムを示す教材パターンデータと、英会話のレッスンで使用される各教材ファイルが生成される。生成されたこれらのデータを用いて、学習者に対する英会話レッスンが行われる。

【0044】

１－２．動作
次に、以上説明した語学教材生成システム１により実行される処理の流れについて説明する。具体的には、ディスコースコミュニティ分析処理と英会話教材生成処理の流れについて説明する。

【0045】

図１７は、ディスコースコミュニティ分析処理の一例を示すフロー図である。同図に示すディスコースコミュニティ分析処理が行われるにあたり、音声記憶部２には、学習対象となる会議中の英会話の音声データが記憶される。また、資料記憶部５には、上記の会議で使用された、アジェンダを示す資料のデータが記憶される。また、動画記憶部１０には、上記の会議の場面を記録した動画データが記憶される。

【0046】

この状況において、音声解析部３は、音声記憶部２に記憶される音声データを解析して、会議中の発言内容を特定し、特定した発言内容とその発言者とその発言の時点を対応付けることで、記譜データを生成する（ステップＳａ１）。生成された記譜データ（図２参照）は、記譜記憶部４に記憶される。

【0047】

次に、ゴール／結果リスト生成部６は、記譜記憶部４に記憶される記譜データと資料記憶部５に記憶される資料データに基づいて、ゴール、結果及び所要時間を特定して対応付けることで、ゴール／結果リストデータを生成する（ステップＳａ２）。図１８は、このゴール／結果リストデータを生成する処理の一例を示すフロー図である。

【0048】

同図に示す処理において、ゴール／結果リスト生成部６は、まず、記譜データにより示される発言のうち、資料データにより示される議事を構成する語句を含む発言と、依頼を示す所定の語句を含む発言をゴールとして抽出する（ステップＳａ２１）。

【0049】

次に、ゴール／結果リスト生成部６は、ステップＳａ２１で抽出した各ゴールについて、記譜データにより示される発言のうち、当該ゴールが、後続する次のゴールに切り替わる直前の発言を当該ゴールの結果として抽出する（ステップＳａ２２）。より具体的には、当該ゴールと、これに後続する次のゴールの間に位置する発言であって、当該次のゴールの直前の発言を当該ゴールの結果として抽出する。

【0050】

次に、ゴール／結果リスト生成部６は、ステップＳａ２１で抽出した各ゴールについて、当該ゴールが、後続する次のゴールに切り替わるまでの時間を当該ゴールの所要時間として特定する（ステップＳａ２３）。より具体的には、当該ゴールが発言された時点と、後続する次のゴールが発言された時点の間の時間を当該ゴールの所要時間として特定する。

【0051】

以上のステップＳａ２１～Ｓａ２３を経ることで、ゴール／結果リストデータが生成される。生成されたゴール／結果リストデータ（図４参照）は、ゴール／結果リスト記憶部７に記憶される。

【0052】

ゴール／結果リストデータが生成されると、次に、関連発言リスト生成部８は、ゴール／結果リスト記憶部７に記憶されるゴール／結果リストデータにより示される各ゴールについて、記譜記憶部４に記憶される記譜データにより示される発言の中から関連発言を抽出することで、関連発言リストデータを生成する（ステップＳａ３）。図１９は、ゴールについて関連発言を抽出する処理の一例を示すフロー図である。

【0053】

同図に示す処理において、関連発言リスト生成部８は、まず、処理対象のゴールと、これに後続する次のゴールの間に位置する各発言のUsage度を算出する（ステップＳａ３１）。

【0054】

次に、関連発言リスト生成部８は、ステップＳａ３１で算出したUsage度が高い順に所定数の発言を関連発言として抽出する（ステップＳａ３２）。ここで抽出される関連発言の数は、処理対象のゴールと、これに後続する次のゴールの間に位置する発言の総数の３０％以下とする。

【0055】

以上のステップＳａ３１及びＳａ３２が各ゴールについて行われることで、関連発言リストデータが生成される。生成された関連発言リストデータ（図５参照）は、関連発言リスト記憶部９に記憶される。

【0056】

関連発言リストデータが生成されると、次に、身体動作リスト生成部１１は、ゴール／結果リスト記憶部７に記憶されるゴール／結果リストデータにより示される各ゴールについて、動画記憶部１０に記憶される動画データを解析して所定の身体動作とその動作者を特定し、特定した身体動作のリストデータを生成する（ステップＳａ４）。各ゴールについて身体動作とその動作者を特定するにあたっては、処理対象のゴールが発言された時点と、これに後続する次のゴールが発言された時点の間に行われた所定の身体動作とその動作者を、動画データを解析して特定する。身体動作リスト生成部１１により生成された身体動作リストデータ（図７参照）は、身体動作リスト記憶部１２に記憶される。

【0057】

次に、単語リスト生成部１３は、記譜記憶部４に記憶される記譜データにより示される各単語を、図示せぬ辞書データベースを用いて語源及び品詞で分類することで、単語リストデータを生成する（ステップＳａ５）。生成された単語リストデータ（図８参照）は、単語リスト記憶部１４に記憶される。

【0058】

以上説明したディスコースコミュニティ分析処理の結果、英会話教材の生成に使用されるゴール／結果リストデータ、関連発言リストデータ、身体動作リストデータ及び単語リストデータが生成される。このディスコースコミュニティ分析処理は、学習対象とされる英会話が行われる複数の会議の各々について実行される。

【0059】

次に、図２０は、英会話教材生成処理の一例を示すフロー図である。同図に示す英会話教材生成処理が行われるにあたり、関連発言リスト群記憶部１５には、複数の会議の各々について生成された関連発言リストデータが記憶される。また、ゴール／結果リスト群記憶部２０には、複数の会議の各々について生成されたゴール／結果リストデータが記憶される。また、身体動作リスト群記憶部２４には、複数の会議の各々について生成された身体動作リストデータが記憶される。また、単語リスト群記憶部２６には、複数の会議の各々について生成された単語リストデータが記憶される。

【0060】

この状況において、ゴールレベル判定部１８は、関連発言リスト群記憶部１５に記憶される関連発言リストデータ群により示される各ゴールについて、ゴールに適した英会話の習熟度を判定することで、ゴールレベルデータを生成する（ステップＳｂ１）。図２１は、ゴールに適した英会話の習熟度を判定する処理の一例を示すフロー図である。

【0061】

同図に示す処理において、ゴールレベル判定部１８は、まず、処理対象のゴールについて抽出された関連発言を構成する各単語の難易度を判定する（ステップＳｂ１１）。難易度の判定にあたっては、難易度判定テーブル記憶部１６に記憶される難易度判定テーブルが参照される。

【0062】

次に、ゴールレベル判定部１８は、ステップＳｂ１１で判定した各単語の難易度に対応する英会話の習熟度を判定する（ステップＳｂ１２）。習熟度の判定にあたっては、習熟度判定テーブル記憶部１７に記憶される習熟度判定テーブルが参照される。

【0063】

次に、ゴールレベル判定部１８は、ステップＳｂ１２で判定した習熟度の中で最も高い習熟度を、処理対象のゴールの習熟度として特定する（ステップＳｂ１３）。

【0064】

以上のステップＳｂ１１～Ｓｂ１３が各ゴールについて行われることで、ゴールレベルデータが生成される。生成されたゴールレベルデータ（図１２参照）は、ゴールレベル記憶部１９に記憶される。

【0065】

ゴールレベルデータが生成されると、次に、教材パターン生成部２２は、レッスン情報テーブル記憶部２１に記憶されるレッスン情報テーブルデータにより示される各クラスに適した教材パターンのデータを生成する（ステップＳｂ２）。図２２は、クラスに適した教材パターンを特定する処理の一例を示すフロー図である。

【0066】

同図に示す処理において、教材パターン生成部２２は、まず、処理対象のクラスに適したゴールを選択する（ステップＳｂ２１）。具体的には、ゴールレベル記憶部１９に記憶されるゴールレベルデータとレッスン情報テーブルデータを参照して、処理対象のクラスに参加する学習者と学習支援者の習熟度との間で所定の条件を満たす習熟度を有するゴールを選択する。ここで所定の条件とは、ゴールの習熟度が学習者の習熟度と同等か１段階高いという第１条件と、ゴールの習熟度がいずれの学習支援者の習熟度も超えないという第２条件の両条件である。

【0067】

次に、教材パターン生成部２２は、ステップＳｂ２１で選択したゴールをレッスン単位にグルーピングする（ステップＳｂ２２）。具体的には、ゴールレベル記憶部１９に記憶されるゴール／結果リストデータ群（特に所要時間）を参照して、選択したゴールを、各グループを構成するゴールの所要時間の合計が１回のレッスン時間を超えないようにグルーピングし、各グループに教材ＩＤを付与する。

【0068】

以上のステップＳｂ２１及びＳｂ２２が各クラスについて行われることで、教材パターンデータが生成される。生成された教材パターンデータ（図１４参照）は、教材パターン記憶部２３に記憶され、かつ、レッスン情報テーブルデータにおいて処理対象のクラスと対応付けられる。

【0069】

教材パターンデータが生成されると、次に、教材生成部２７は、教材パターン記憶部２３に記憶される教材パターンデータにより示される各教材のファイルを生成する（ステップＳｂ３）。図２３は、教材ファイルを生成する処理の一例を示すフロー図である。

【0070】

同図に示す処理において、教材生成部２７は、まず、ゴール／結果リスト群記憶部２０に記憶されるゴール／結果リストデータ群を参照して、処理対象の教材を構成する各ゴールとその所要時間を特定する（ステップＳｂ３１）。

【0071】

次に、教材生成部２７は、処理対象の教材を構成する各ゴールについて、身体動作リスト群記憶部２４に記憶される身体動作リストデータを参照して身体動作を特定し、特定した身体動作に対応する補足事項を、補足事項判定テーブル記憶部２５に記憶される補足事項判定テーブルデータを参照して特定する（ステップＳｂ３２）。

【0072】

次に、教材生成部２７は、処理対象の教材を構成する各ゴールについて、単語リスト群記憶部２６に記憶される単語リストデータを参照して、専門用語とContextualを特定する（ステップＳｂ３３）。

【0073】

次に、教材生成部２７は、ステップＳｂ３１で特定したゴール及び所要時間、ステップＳｂ３２で特定した補足事項、並びにステップＳｂ３３で特定した専門用語及びContextualが記述された教材ファイルを生成する（ステップＳｂ３４）。生成された教材ファイル（図１６参照）は、教材記憶部２８に記憶される。

【0074】

以上のステップＳｂ３１～Ｓｂ３３が各教材について行われることで、各教材ファイルが生成される。

【0075】

以上説明した英会話教材生成処理の結果、英会話のレッスンのカリキュラムを示す教材パターンデータと、英会話のレッスンで使用される各教材ファイルが生成される。生成されたこれらのデータを用いて、学習者に対する英会話レッスンが行われる。

【0076】

以上説明した語学教材生成システム１によれば、ディスコースコミュニティ分析を通じて自動的に教材が作成されるため、学習対象である英会話が実際に行われている環境の文化的特徴を反映させた教材を作成することができる。また、教材開発の専門家の助けを借りなくても教材を作成することができる。

【0077】

２．変形例
上記の実施形態は下記のように変形してもよい。なお、以下に記載する２以上の変形例は互いに組み合わせてもよい。

【0078】

２－１．変形例１
上記の実施形態では、学習対象の英会話として、会議中の英会話を想定しているが、学習対象の英会話はこれに限られない。例えば、電話応対や面接等のその他のシチュエーションで行われる英会話を学習対象としてもよい。

【0079】

２－２．変形例２
音声解析部３は、記譜データを生成する際、特定した発言内容に必ずしもその発言者を対応付けなくてもよい。

【0080】

２－３．変形例３
資料記憶部５に記憶される資料データは、必ずしも会議中に使用される資料のデータでなくてもよい。議事の進行順序が記載された資料であれば、例えば、議事録のデータであってもよい。

【0081】

２－４．変形例４
ゴール／結果リスト生成部６は、ゴールを抽出する際、その抽出精度を高めるために、資料データに示される議事を構成する語句を含む発言であって、かつ、依頼を示す所定の語句を含む発言を抽出するようにしてもよい。また、ゴール／結果リスト生成部６は、ゴールを抽出する際、類義語データベースを参照して、資料データに示される議事を構成する語句の類義語を含む発言も抽出するようにしてもよい。

【0082】

２－５．変形例５
ゴール／結果リスト生成部６は、ゴールの結果を抽出する際、当該ゴールの次のゴールの直前の発言を抽出するのに代えて、当該次のゴールよりも前の所定数（２以上）の発言を抽出するようにしてもよい。そして、抽出した各発言について、当該ゴールとの関連度を示すUsage度を算出し、Usage度が最も高い発言を当該ゴールの結果として抽出するようにしてもよい。なおここで、Usage度とは、発言が、当該ゴールを構成する語句を含む度合いを示す値である。

【0083】

２－６．変形例６
関連発言リスト生成部８が抽出する関連発言の数は、ゴール間の発言数に応じて変化させずに、一律固定としてもよい。また、関連発言リスト生成部８は、Usage度を算出する際、類義語データベースを参照して、ゴールとその結果を構成する語句だけでなく、その語句の類義語を含む度合いを算出するようにしてもよい。

【0084】

２－７．変形例７
英会話の習熟度を示す指標として、CEFR以外の他の指標を用いてもよい。

【0085】

２－８．変形例８
ゴールレベル判定部１８は、ゴールに適した習熟度を判定する際、最も高い習熟度をゴールの習熟度として特定するのに代えて、単語の出現数又は出現割合が所定の閾値を超える習熟度の中で最高の習熟度を、ゴールの習熟度として特定するようにしてもよい。または、単純に、単語の出現数又は出現割合が最高の習熟度を、ゴールの習熟度として特定するようにしてもよい。

【0086】

２－９．変形例９
ゴールレベル判定部１８は、ゴールに適した習熟度を判定する際、関連発言を構成する単語の難易度に基づいて習熟度を判定するのに代えて、関連発言が発言された際の話す速度に応じて習熟度を判定するようにしてもよい。ここで、関連発言が発言された際の話す速度は、関連発言を構成する単語数を、関連発言を行うのに要した時間（言い換えると、関連発言の開始時と終了時の時間差）で除することにより求められる。ゴールレベル判定部１８は、話す速度と習熟度を対応付けた習熟度判定テーブルを予め記憶しておき、この習熟度判定テーブルを参照して、求めた話す速度を習熟度に変換する。

【0087】

２－１０．変形例１０
ゴールレベル判定部１８は、ゴールに適した習熟度を判定する際、関連発言を構成する単語の難易度に基づいて習熟度を判定するのに代えて、当該ゴールと後続する次のゴールの間に位置するすべての発言の難易度に基づいて習熟度を判定するようにしてもよい。この変形例が採用された場合、関連発言リスト生成部８、関連発言リスト記憶部９及び関連発言リスト群記憶部１５は不要となる。

【0088】

２－１１．変形例１１
教材パターン生成部２２がゴールを選択される際に基づく条件は、上記の第１条件及び第２条件の組に限られない。教材パターン生成部２２は、第１条件と第２条件のうちの一方のみに基づいて、ゴールを選択するようにしてもよい。または、ゴールの習熟度が学習者の習熟度と同等であるといった条件や、特定の発言者により発言されたゴールであるといった条件のような別の条件に基づいて、ゴールを選択するようにしてもよい。なお、特定の発言者により発言されたゴールであるという条件が設定された場合には、教材パターン生成部２２は、記譜データを参照して、その特定の発言者により発言されたゴールを選択する。

【0089】

２－１２．変形例１２
教材生成部２７は、教材ファイルを生成する際、専門用語とContextual以外の単語も、単語リストデータを参照して特定して教材ファイルに記述するようにしてもよい。

【0090】

２－１３．変形例１３
上記の実施形態では、学習対象として英会話が想定されているが、学習者の母語と異なる言語であれば、他の言語による会話であってもよい。

【符号の説明】

【0091】

１…語学教材生成システム、２…音声記憶部、３…音声解析部、４…記譜記憶部、５…資料記憶部、６…ゴール／結果リスト生成部、７…ゴール／結果リスト記憶部、８…関連発言リスト生成部、９…関連発言リスト記憶部、１０…動画記憶部、１１…身体動作リスト生成部、１２…身体動作リスト記憶部、１３…単語リスト生成部、１４…単語リスト記憶部、１５…関連発言リスト群記憶部、１６…難易度判定テーブル記憶部、１７…習熟度判定テーブル記憶部、１８…ゴールレベル判定部、１９…ゴールレベル記憶部、２０…ゴール／結果リスト群記憶部、２１…レッスン情報テーブル記憶部、２２…教材パターン生成部、２３…教材パターン記憶部、２４…身体動作リスト群記憶部、２５…補足事項判定テーブル記憶部、２６…単語リスト群記憶部、２７…教材生成部、２８…教材記憶部

【図1】