(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-11-25
(45)【発行日】2024-12-03
(54)【発明の名称】情報処理方法、情報処理装置、およびプログラム
(51)【国際特許分類】
G10L 15/00 20130101AFI20241126BHJP
G09B 5/06 20060101ALI20241126BHJP
【FI】
G10L15/00 200Z
G09B5/06
(21)【出願番号】P 2023532903
(86)(22)【出願日】2021-07-05
(86)【国際出願番号】 JP2021025358
(87)【国際公開番号】W WO2023281605
(87)【国際公開日】2023-01-12
【審査請求日】2023-11-21
(73)【特許権者】
【識別番号】000004226
【氏名又は名称】日本電信電話株式会社
(74)【代理人】
【識別番号】110003708
【氏名又は名称】弁理士法人鈴榮特許綜合事務所
(72)【発明者】
【氏名】井元 麻衣子
(72)【発明者】
【氏名】瀬下 仁志
【審査官】大野 弘
(56)【参考文献】
【文献】特開2014-085998(JP,A)
【文献】特開2007-086592(JP,A)
【文献】特開2004-037849(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 15/00
G09B 5/06
(57)【特許請求の範囲】
【請求項1】
ハードウェアプロセッサおよびメモリを備える装置が実行する情報処理方法であって、
ユーザ端末から第1データを取得する取得過程と、
前記第1データに係る第1文書コンテンツの第1部分と、発話音声に係る第2文書コンテンツの第2部分との類似度を算出する算出過程と、
前記類似度が第1閾値を超えていることに基づいて、前記第1部分のデータに、前記第2部分のデータと、前記第2文書コンテンツ中で前記第2部分に続く第3部分のデータと、の少なくとも一方を含む第2データを対応付けた、第3データを生成する生成過程と、
前記第3データを前記ユーザ端末へ出力する出力過程と
を備える、情報処理方法。
【請求項2】
前記第2データは、前記第3部分のデータを含む、請求項1に記載の情報処理方法。
【請求項3】
前記類似度が、前記第1閾値を超えていないが第2閾値を超えている場合、前記第1文書コンテンツ中での前記第1部分の位置と、前記発話音声中での前記第2部分に係る発話音声の位置との近似度を算出する算出過程と、
前記近似度が第3閾値を下回っていることに基づいて、前記第3データを生成する生成過程と
をさらに備える、請求項1又は2に記載の情報処理方法。
【請求項4】
前記第1文書コンテンツ中での前記第1部分の位置と、前記発話音声中での前記第2部分に係る発話音声の位置との近似度を算出する算出過程と、
前記類似度が、前記第1閾値を超えていないが第2閾値を超えている場合、前記近似度が第3閾値を下回っていることに基づいて、前記第3データを生成する生成過程と
をさらに備える、請求項1又は2に記載の情報処理方法。
【請求項5】
記憶部に記憶される、前記発話音声を含む音声コンテンツに係る第4データ、に基づいて、前記第2文書コンテンツのデータを生成する生成過程をさらに備える、請求項1乃至4のいずれかに記載の情報処理方法。
【請求項6】
ユーザ端末から第1データを取得する、取得部と、
前記第1データに係る第1文書コンテンツの第1部分と、発話音声に係る第2文書コンテンツの第2部分との類似度を算出する、算出部と、
前記類似度が第1閾値を超えていることに基づいて、前記第1部分のデータに、前記第2部分のデータと、前記第2文書コンテンツ中で前記第2部分に続く第3部分のデータと、の少なくとも一方を含む第2データを対応付けた、第3データを生成する、生成部と、
前記第3データを前記ユーザ端末へ出力する、出力部と
を備える、情報処理装置。
【請求項7】
請求項1乃至5のいずれかに記載の情報処理方法が備える各過程を前記ハードウェアプロセッサに実現させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
この発明の実施形態は、情報処理方法、情報処理装置、およびプログラムに関する。
【背景技術】
【0002】
画像コンテンツおよび音声コンテンツからなるコンテンツを視聴して学習するサービスが普及してきている。受講者は、このようなコンテンツを視聴して学習しながら、後々の復習のためにコンテンツの内容を書き留める。
【0003】
受講者が、音声コンテンツ中で発話される音声(以下、発話音声とも称する。)を聞きながら、発話される内容を自分なりに整理して、発話された言葉とは別の言葉を用いてその内容を書き留めることがある。このように書き留められた部分については、受講者がその部分を深く理解できている可能性が高い。
【0004】
しかしながら、受講者がコンテンツを視聴しながらこの作業を行うのは容易ではない。このため、受講者の意識は、発話される内容をそのまま書き留めることに向いてしまいやすい(例えば、非特許文献1を参照)。
【先行技術文献】
【非特許文献】
【0005】
【文献】Pam A. Mueller and Daniel M. Oppenheimer. “The Pen Is Mightier Than the Keyboard: Advantages of Longhand Over Laptop Note Taking”, Psychological Science published online 23 April 2014
【発明の概要】
【発明が解決しようとする課題】
【0006】
発話される内容をそのまま書き留めることに受講者の意識が向いている間に、受講者が、発話されている内容を聞き逃してしまうことがある。このように聞き逃した内容を、受講者は書き留めることができない。このため、受講者は、このように聞き逃してしまった内容を復習できない。
【0007】
この発明は上記事情に着目してなされたもので、音声コンテンツ中で発話される内容をユーザが記録している間に当該ユーザが聞き逃した可能性がある発話音声に関係するデータを抽出する技術を提供しようとするものである。
【課題を解決するための手段】
【0008】
上記課題を解決するために、この発明の一態様の情報処理方法は、ハードウェアプロセッサおよびメモリを備える装置により実行され、ユーザ端末から第1データを取得する取得過程と、前記第1データに係る第1文書コンテンツの第1部分と、発話音声に係る第2文書コンテンツの第2部分との類似度を算出する算出過程と、前記類似度が第1閾値を超えていることに基づいて、前記第1部分のデータに、前記第2部分のデータと、前記第2文書コンテンツ中で前記第2部分に続く第3部分のデータと、の少なくとも一方を含む第2データを対応付けた、第3データを生成する生成過程と、前記第3データを前記ユーザ端末へ出力する出力過程とを含む。
【発明の効果】
【0009】
この発明の一態様によれば、音声コンテンツ中で発話される内容をユーザが記録している間に当該ユーザが聞き逃した可能性がある発話音声に関係するデータを抽出する技術を提供することが可能とされる。
【図面の簡単な説明】
【0010】
【
図1】
図1は、この発明の第1実施形態に係る情報処理装置として用いられるサーバ装置およびユーザ端末の概略的な構成を示す図である。
【
図2】
図2は、この発明の第1実施形態に係る情報処理装置として用いられるサーバ装置およびユーザ端末のハードウェア構成の一例を示すブロック図である。
【
図3】
図3は、この発明の第1実施形態に係る情報処理装置として用いられるサーバ装置の制御部のソフトウェア構成の一例を示すブロック図である。
【
図4】
図4は、この発明の第1実施形態に係るユーザ端末の制御部のソフトウェア構成の一例を示すブロック図である。
【
図5】
図5は、この発明の第1実施形態に係るユーザ端末のユーザ文書データ記憶部に記憶されるデータの構造を示す図である。
【
図6】
図6は、この発明の第1実施形態に係る情報処理装置として用いられるサーバ装置のコンテンツデータ記憶部に記憶されるデータの構造を示す図である。
【
図7】
図7は、この発明の第1実施形態に係る情報処理装置として用いられるサーバ装置の支援データ記憶部に記憶されるデータの構造を示す図である。
【
図8】
図8は、この発明の第1実施形態に係る情報処理装置として用いられるサーバ装置およびユーザ端末により実行される動作の一例を示すフローチャートである。
【
図9】
図9は、この発明の第1実施形態に係る情報処理装置として用いられるサーバ装置が支援データ生成部の制御の下で行う動作の詳細を説明するための図である。
【
図10】
図10は、この発明の第1実施形態に係るユーザ端末が表示データ出力部の制御の下で行う動作の詳細を説明するための図である。
【発明を実施するための形態】
【0011】
以下、図面を参照してこの発明に係る実施形態を説明する。なお、図面中に示される各機能ブロックは、示されているように区別されていることは必須ではない。例えば、一部の機能が例示の機能ブロックとは別の機能ブロックにより実行されてもよい。さらに、例示の機能ブロックがさらに細かい機能サブブロックに分割されていてもよい。また、以下の説明における各機能ブロックおよび各構成要素の名称は便宜的なものであり、各機能ブロックおよび各構成要素の構成および動作を限定するものではない。
【0012】
[第1実施形態]
(構成例)
(1)概略構成図
図1は、この発明の第1実施形態に係るサーバ装置SVおよびユーザ端末UTの概略的な構成を示す。
【0013】
ユーザ端末UTは、例えば、スマートフォン、携帯端末(例えばタブレット端末)、およびパーソナルコンピュータ等である。ユーザ端末UTは、サーバ装置SVとの間でデータを送受信可能である。ユーザ端末UTには、例えば表示部DPが接続されている。本明細書では、ユーザ端末UTに表示部DPが接続されているものとして説明を行うが、ユーザ端末UTと表示部DPとが一体となっていてもよい。表示部DPは、例えば、CRT(Cathode Ray Tube)ディスプレイ、液晶ディスプレイ、および有機EL(Electroluminescence)ディスプレイ等である。
【0014】
例えば、ユーザ端末UTを用いて、ユーザは、学習することを望むコンテンツ(以下、学習コンテンツとも称する。)を視聴する。より具体的には、ユーザ端末UTは、例えば、学習コンテンツに係るコンテンツデータCTDを再生することにより、表示部DPの表示画面上に画像コンテンツを表示させ、(図示していない)出力部から音声コンテンツを出力する。当該画像コンテンツおよび音声コンテンツを通してユーザは学習する。ユーザ端末UTは、例えば、学習中のユーザによるキーボード等を介した入力に基づいて、ユーザ文書データ生成部51の制御の下、ユーザ文書データUDを生成する。本実施形態では、学習コンテンツが画像コンテンツと音声コンテンツとを含むものとして説明を行うが、学習コンテンツは、例えば音声コンテンツのみからなるものであってもよい。画像コンテンツは、例えば、スライドコンテンツまたは動画コンテンツであり、それらを組み合わせたものであってもよい。音声コンテンツには発話音声が含まれる。
【0015】
ユーザ端末UTは、ユーザ文書データUDに係る文書コンテンツを表示部DPに表示させ得る。表示部DPに表示される当該文書コンテンツを通して、ユーザは、過去に学習した学習コンテンツを復習し得る。
【0016】
ユーザ端末UTは、このような復習に先立ち、ユーザ文書データUDをサーバ装置SVに送信し得る。サーバ装置SVは、比較部133の制御の下、当該ユーザ文書データUDに係る文書コンテンツと、コンテンツデータCTDに係る発話音声の内容とを比較し、当該比較に基づく支援データADを生成する。支援データADは、文書コンテンツのデータを含む。当該文書コンテンツは、上記発話音声の内容のうち、例えば、ユーザが学習中に聞き逃した可能性がある部分に係るものである。サーバ装置SVは、ユーザ端末UTに当該支援データADを送信する。
【0017】
ユーザ端末UTは、ユーザ文書データUDに係る文書コンテンツとともに、当該支援データADに係る文書コンテンツを、表示部DPに表示させる。表示部DPに表示されるこれら文書コンテンツを通して、ユーザは、過去に学習したコンテンツを復習し得る。
【0018】
(2)サーバ装置およびユーザ端末のハードウェア構成
図2は、サーバ装置SVおよびユーザ端末UTのハードウェア構成の一例を示すブロック図である。本明細書では、サーバ装置SVとユーザ端末UTとを組み合わせたものをシステムSYSとも称する。
【0019】
サーバ装置SVは、制御部1、プログラム記憶部2、データ記憶部3、入出力インタフェース(入出力I/F)4、およびバスBUS1を含む。プログラム記憶部2、データ記憶部3、および入出力インタフェース4、の各々は、バスBUS1を介して制御部1に接続される。
【0020】
制御部1は、中央処理ユニット(Central Processing Unit:CPU)等のハードウェアプロセッサを有する。
【0021】
プログラム記憶部2は、記憶媒体として、例えば、HDD(Hard Disk Drive)またはSSD(Solid State Drive)等の随時書込みおよび読出しが可能な不揮発性メモリと、ROM(Read Only Memory)等の不揮発性メモリとを組み合わせたものである。プログラム記憶部2は、OS(Operating System)等のミドルウェアに加えて、本実施形態に係る各種制御処理の実行のために用いられるプログラムを格納する。
【0022】
データ記憶部3は、記憶媒体として、例えば、HDDまたはSSD等の随時書込みおよび読出しが可能な不揮発性メモリと、RAM(Random Access Memory)等の揮発性メモリとを組み合わせたものである。データ記憶部3は、制御部1が有するハードウェアプロセッサの作業領域として使用され、データを一時的に保持し、バッファおよびキャッシュとして機能する。
【0023】
入出力インタフェース4は、制御部1による制御の下、通信ネットワークNWにより定義される通信プロトコルを使用して、ユーザ端末UTとの間で伝送されるデータの送受信を行う。入出力インタフェース4は、例えば有線LANまたは無線LANに対応するインタフェースにより構成される。
【0024】
ユーザ端末UTは、制御部5、プログラム記憶部6、データ記憶部7、入出力インタフェース8、およびバスBUS2を含む。プログラム記憶部6、データ記憶部7、および入出力インタフェース8、の各々は、バスBUS2を介して制御部5に接続される。
【0025】
制御部5については、制御部1について説明したのと同様の説明が成り立つ。プログラム記憶部6については、プログラム記憶部2について説明したのと同様の説明が成り立つ。データ記憶部7については、データ記憶部3について行った説明において、制御部1を制御部5に置き換えた説明が成り立つ。入出力インタフェース8については、入出力インタフェース4について行った説明において、制御部1を制御部5に、ユーザ端末UTをサーバ装置SVに置き換えた説明が成り立つ。
【0026】
入出力インタフェース8には、例えば入力部IPおよび表示部DPが接続される。入力部IPは、例えば、キーボード、マウス、およびタッチパッド等である。入力部IPと表示部DPが、タッチパネルにより実現されていてもよい。
【0027】
(3)サーバ装置に係るソフトウェア構成
図3は、サーバ装置SVの制御部1のソフトウェア構成の一例を示すブロック図である。
図3では、当該ソフトウェア構成の制御の下で行われる各処理に係るデータの送受信等に関連する構成も併せて示されている。以下の同様の図面についても同じである。
【0028】
制御部1は、例えば、コンテンツ要求取得部11、コンテンツデータ出力部12、支援データ生成部13、および支援データ出力部14を含む。制御部1が含む各部の処理機能は、制御部1が、プログラム記憶部2に格納されるプログラムを、制御部1のハードウェアプロセッサに実行させることにより実現される。プログラム記憶部2に格納されるプログラムが用いられるものとして説明を行ったが、用いられるプログラムは、通信ネットワークNWを通して提供されるものであってもよい。
【0029】
入出力インタフェース4は、ユーザ端末UTから通信ネットワークNWを介して送信されるコンテンツ要求を受け取り、当該コンテンツ要求を制御部1に入力する。入出力インタフェース4は、制御部1から出力されるデータを受け取り、制御部1からの指示にしたがって、当該データを上記ユーザ端末UTに通信ネットワークNWを介して送信する。
【0030】
データ記憶部3は、例えば、ユーザ文書データ記憶部31、コンテンツデータ記憶部32、ユーザ文書分割データ記憶部33、発話文書分割データ記憶部34、および支援データ記憶部35を含む。
【0031】
ユーザ文書データ記憶部31は、ユーザ文書データUD、および、ユーザ文書データUDに係る学習コンテンツの識別子を記憶する。
【0032】
コンテンツデータ記憶部32は、コンテンツデータCTD、および、コンテンツデータCTDに係る学習コンテンツの識別子を記憶する。コンテンツデータ記憶部32はサーバ装置SVに含まれているものとして説明するが、例えばクラウドコンピューティング上に設けられていてもよい。
【0033】
ユーザ文書分割データ記憶部33および発話文書分割データ記憶部34は、支援データ生成部13による処理の途中のデータを記憶する。
【0034】
支援データ記憶部35は、支援データADを記憶する。
【0035】
コンテンツ要求取得部11は、入出力インタフェース4を介して、ユーザ端末UTから送信されるコンテンツ要求を取得する処理を行う。コンテンツ要求には、ユーザ文書データUDと、当該ユーザ文書データUDに係る学習コンテンツの識別子とが含まれる。コンテンツ要求取得部11は、例えば、当該ユーザ文書データUDおよび当該識別子を、ユーザ文書データ記憶部31に記憶させる処理を行う。当該記憶処理では、当該ユーザ文書データUDが当該識別子に対応付けされる。
【0036】
コンテンツデータ出力部12は、コンテンツデータ記憶部32から、当該識別子に対応付けられたコンテンツデータCTDを読み出し、当該コンテンツデータCTDを、入出力インタフェース4を介してサーバ装置SVの外部に出力し、ユーザ端末UTに送信する処理を行う。
【0037】
支援データ生成部13は、上記ユーザ文書データUDおよび上記コンテンツデータCTDに基づいて支援データADを生成する処理を行う。より具体的には次の通りである。
【0038】
支援データ生成部13は、例えば、ユーザ文書データ分割部131、コンテンツデータ処理部132、および比較部133を含む。
【0039】
ユーザ文書データ分割部131は、ユーザ文書データ記憶部31から上記ユーザ文書データUDを読み出し、当該ユーザ文書データUDを分割したデータ(以下、ユーザ文書分割データとも称する。)を生成する処理を行う。より具体的には、次の通りである。ユーザ文書データ分割部131は、当該ユーザ文書データUDに係る文書コンテンツをいくつかの部分に分割した各部分について、当該部分のデータであるユーザ文書分割データを生成する処理を行う。ユーザ文書データ分割部131は、生成したユーザ文書分割データをユーザ文書分割データ記憶部33に記憶させる処理を行う。
【0040】
コンテンツデータ処理部132は、コンテンツデータ記憶部32から上記コンテンツデータCTDを読み出し、当該コンテンツデータCTDに係る発話音声の内容を文書で表した文書コンテンツのデータ(以下、発話文書データとも称する。)を生成する処理を行う。
【0041】
コンテンツデータ処理部132は、当該発話文書データを分割したデータ(以下、発話文書分割データとも称する。)を生成する処理を行う。より具体的には、次の通りである。コンテンツデータ処理部132は、当該発話文書データに係る文書コンテンツをいくつかの部分に分割した各部分について、当該部分のデータである発話文書分割データを生成する処理を行う。コンテンツデータ処理部132は、生成した発話文書分割データを発話文書分割データ記憶部34に記憶させる処理を行う。
【0042】
比較部133は、ユーザ文書分割データ記憶部33から或るユーザ文書分割データを読み出し、発話文書分割データ記憶部34から或る発話文書分割データを読み出し、当該ユーザ文書分割データに係る文書コンテンツと、当該発話文書分割データに係る文書コンテンツとを比較する処理を行う。当該比較処理では、当該2つの文書コンテンツの類似度を算出する処理が行われる。比較部133は、当該類似度に基づいて、当該ユーザ文書分割データに、当該発話文書分割データが対応するか否かを判定する処理を行う。比較部133は、当該ユーザ文書分割データに当該発話文書分割データが対応すると判定した場合、次に説明する処理を行う。なお、当該判定が行われた発話文書分割データのことを、以下、対応する発話文書分割データとも称する。
【0043】
比較部133は、発話文書分割データ記憶部34から或る発話文書分割データを読み出す処理を行う。当該発話文書分割データは、元の発話文書データに係る文書コンテンツのうち、上記対応する発話文書分割データに係る部分に後続する部分のデータ(以下、後続する発話文書分割データとも称する。)である。比較部133は、当該ユーザ文書分割データ、当該対応する発話文書分割データ、および、当該後続する発話文書分割データを、支援データ記憶部35に記憶させる処理を行う。当該記憶処理では、当該ユーザ文書分割データに、当該対応する発話文書分割データおよび当該後続する発話文書分割データが対応付けされる。
【0044】
比較部133は、ユーザ文書分割データと発話文書分割データとの他の組み合わせについても、上記で説明したのと同様の処理を行い得る。これにより、支援データ記憶部35に、ユーザ文書分割データと、当該ユーザ文書分割データに対応付けられた、対応する発話文書分割データおよび後続する発話文書分割データと、の組み合わせが、順次記憶されていく。このように支援データ記憶部35に記憶されるデータが、本実施形態で用いられる支援データADである。
【0045】
支援データ出力部14は、支援データ記憶部35から支援データADを読み出し、当該支援データADを、入出力インタフェース4を介してサーバ装置SVの外部に出力し、ユーザ端末UTに送信する処理を行う。
【0046】
(4)ユーザ端末に係るソフトウェア構成
図4は、ユーザ端末UTの制御部5のソフトウェア構成の一例を示すブロック図である。
【0047】
制御部5は、例えば、ユーザ文書データ生成部51、コンテンツ要求送信部52、コンテンツデータ取得部53、支援データ取得部54、および表示データ出力部55を含む。制御部5が含む各部の処理機能は、制御部5が、プログラム記憶部6に格納されるプログラムを、制御部5のハードウェアプロセッサに実行させることにより実現される。プログラム記憶部6に格納されるプログラムが用いられるものとして説明を行ったが、用いられるプログラムは、通信ネットワークNWを通して提供されるものであってもよい。
【0048】
入出力インタフェース8は、制御部5から出力されるコンテンツ要求を受け取り、制御部5からの指示にしたがって、当該コンテンツ要求をサーバ装置SVに通信ネットワークNWを介して送信する。入出力インタフェース8は、サーバ装置SVから通信ネットワークNWを介して送信される、コンテンツデータCTDおよび支援データADを受け取り、当該コンテンツデータCTDおよび支援データADを制御部5に入力する。
【0049】
データ記憶部7は、例えば、ユーザ文書データ記憶部71、コンテンツデータ記憶部72、および支援データ記憶部73を含む。
【0050】
ユーザ文書データ記憶部71は、ユーザ文書データUD、および、ユーザ文書データUDに係る学習コンテンツの識別子を記憶する。
【0051】
コンテンツデータ記憶部72は、コンテンツデータCTDを記憶する。
【0052】
支援データ記憶部73は、支援データADを記憶する。
【0053】
ユーザ文書データ生成部51は、ユーザ文書データUDを生成し、当該ユーザ文書データUD、および、当該ユーザ文書データUDに係る学習コンテンツの識別子を、ユーザ文書データ記憶部71に記憶させる処理を行う。当該記憶処理では、当該ユーザ文書データUDが当該識別子に対応付けされる。
【0054】
ユーザ文書データUDの当該生成処理は、例えば、当該学習コンテンツを学習中のユーザによる入力部IPを介した入力に基づくものである。このように生成されるユーザ文書データUDは、当該データUDに係る文書コンテンツ中のいくつかの箇所について、当該箇所に関係するユーザからの入力が行われていた時刻の情報を含むものであってもよい。
【0055】
コンテンツ要求送信部52は、例えば、入力部IPを介したユーザによる入力に応じて次の処理を行う。すなわち、コンテンツ要求送信部52は、ユーザ文書データ記憶部71から、ユーザ文書データUDと、当該ユーザ文書データUDに係る学習コンテンツの識別子とを読み出し、当該ユーザ文書データUDおよび当該識別子を含むコンテンツ要求を生成する処理を行う。コンテンツ要求送信部52は、当該コンテンツ要求を、入出力インタフェース8を介してサーバ装置SVに送信する処理を行う。
【0056】
コンテンツデータ取得部53は、入出力インタフェース8を介して、サーバ装置SVから送信されるコンテンツデータCTDを取得する処理を行う。サーバ装置SVによる当該コンテンツデータCTDの送信は、サーバ装置SVが上記コンテンツ要求を取得したことに応じて行ったものである。当該コンテンツデータCTDは、サーバ装置SVが、上記識別子に対応付けて記憶していたものである。コンテンツデータ取得部53は、当該コンテンツデータCTDをコンテンツデータ記憶部72に記憶させる処理を行う。
【0057】
支援データ取得部54は、入出力インタフェース8を介して、サーバ装置SVから送信される支援データADを取得する処理を行う。サーバ装置SVによる当該支援データADの送信は、サーバ装置SVが上記コンテンツ要求を取得したことに応じて行ったものである。当該支援データADは、サーバ装置SVが、例えば上記ユーザ文書データUDに基づいて生成したものである。支援データ取得部54は、当該支援データADを支援データ記憶部73に記憶させる処理を行う。
【0058】
表示データ出力部55は、ユーザ文書データ記憶部71から上記ユーザ文書データUDを読み出し、コンテンツデータ記憶部72から上記コンテンツデータCTDを読み出し、支援データ記憶部73から当該支援データADを読み出す処理を行う。表示データ出力部55は、当該ユーザ文書データUD、当該コンテンツデータCTD、および当該支援データADに基づく情報を、入出力インタフェース8を介して表示部DPに出力する処理を行う。より具体的には次の通りである。
【0059】
表示データ出力部55は、例えば、コンテンツデータ出力部551、要約候補情報出力部552、および要約支援情報出力部553を含む。
【0060】
コンテンツデータ出力部551は、当該コンテンツデータCTDを表示部DPに出力する処理を行う。
【0061】
要約候補情報出力部552は、当該ユーザ文書データUDと、支援データAD中のユーザ文書分割データとに基づく情報を、表示部DPに出力する処理を行う。
【0062】
要約支援情報出力部553は、支援データAD中の発話文書分割データを表示部DPに出力する処理を行う。
【0063】
(5)データ構造
図5は、ユーザ文書データ記憶部71に記憶されるデータの構造を示す。
ユーザ文書データ記憶部71は、学習コンテンツの識別子(以下、コンテンツ識別子とも称する。)のカラムと、ユーザ文書データのカラムとを有する。ユーザ文書データ記憶部71には、各レコードとして、1つの学習コンテンツに関係するデータが記憶される。
図5では、次に説明するようにユーザ文書データ記憶部71中に記憶されるいくつかのレコードの例が示されている。
【0064】
ユーザ文書データ記憶部71への或るユーザ文書データUDの記憶に際して、或るレコードとして、コンテンツ識別子のカラムに当該ユーザ文書データUDに係る学習コンテンツの識別子が記憶され、ユーザ文書データのカラムに当該ユーザ文書データUDが記憶される。
【0065】
当該識別子は、当該学習コンテンツを一意的に識別するために用いられる。
【0066】
当該ユーザ文書データUDは、例えば、当該学習コンテンツを学習中のユーザによるキーボード等の入力部IPを介した入力に基づいて生成されたものであるが、これに限定されない。当該データUDは、例えば、ユーザ端末UTが例えばスマートフォンのようにカメラを備えている場合、ユーザが物理的に存在するノートに書き留めた文字情報が当該カメラを用いて撮影されて生成されるような、画像コンテンツに係るものであってもよい。あるいは、当該データUDは、例えば、ユーザ端末がタブレット型やラップトップのパーソナルコンピュータ等である場合、スタイラスペンや指で書き留められた文字情報が保存されて生成されるような、画像コンテンツに係るものであってもよい。このように生成されるデータUDのファイル形式は、例えば拡張子「.doc」、拡張子「.pdf」、および拡張子「.png」等で表されるものであるが、これらに限定されない。
【0067】
このように、ユーザ文書データ記憶部71では、1つのレコードとして、当該識別子および当該ユーザ文書データUDが、互いに対応付けられて記憶される。
【0068】
本実施形態では、一例として、ユーザ文書データUDが、例えばテキスト情報からなる文書コンテンツに係るような場合について説明を行っている。しかしながら、本実施形態はこれに限定されない。ユーザ文書データUDが画像コンテンツに係るものである場合、ユーザ文書データ分割部131が、ユーザ文書分割データの生成処理の前に、例えば光学文字認識(Optical Character Recognition:OCR)の技術を用いて、当該画像コンテンツから文字情報を抽出した文書コンテンツのデータを生成する処理を行う。ユーザ文書データ分割部131は、当該データに対して、ユーザ文書データUDに対して行うと説明している処理を行う。
【0069】
図6は、コンテンツデータ記憶部32に記憶されるデータの構造を示す。
コンテンツデータ記憶部32は、コンテンツ識別子のカラムと、コンテンツデータのカラムとを有する。コンテンツデータ記憶部32には、各レコードとして、1つの学習コンテンツに関係するデータが記憶されている。
図6では、次に説明するようにコンテンツデータ記憶部32中に記憶されているいくつかのレコードの例が示されている。
【0070】
コンテンツデータ記憶部32中の1つのレコードとして、コンテンツ識別子のカラムに或る学習コンテンツの識別子が記憶され、コンテンツデータのカラムに当該学習コンテンツに係るコンテンツデータCTDが記憶されている。
【0071】
当該識別子は、当該学習コンテンツを一意的に識別するために用いられる。
図6の例では、或る学習コンテンツの識別子として、当該学習コンテンツの識別子として
図5の例で用いられていたのと同一の識別子が用いられている。
【0072】
当該コンテンツデータCTDは1つのファイルで構成されていてもよいし、複数のファイルで構成されていてもよい。コンテンツデータCTDを構成するファイルは、スライドコンテンツおよび動画コンテンツ等のような画像コンテンツに係るものであってもよいし、音声コンテンツに係るものであってもよい。このようなファイルのファイル形式は、例えば拡張子「.mp4」、拡張子「.mov」、拡張子「.pdf」、および拡張子「.pptx」等で表されるものであるが、これらに限定されない。
【0073】
このように、コンテンツデータ記憶部32では、1つのレコードとして、当該識別子および当該コンテンツデータCTDが、互いに対応付けられて記憶されている。
【0074】
図7は、支援データ記憶部35に記憶されるデータの構造を示す。
支援データ記憶部35は、例えば、ユーザ文書分割データのカラムと、対応する発話文書分割データのカラムと、後続する発話文書分割データのカラムとを有する。
図7では、次に説明するように支援データ記憶部35中に記憶されるいくつかのレコードの例が示されている。
【0075】
支援データ記憶部35への或るユーザ文書分割データUDDの記憶に際して、或るレコードとして、ユーザ文書分割データのカラムに当該データUDDが記憶され、対応する発話文書分割データのカラムに、当該データUDDに対応する発話文書分割データCDDが記憶され、後続する発話文書分割データのカラムに、当該データUDDに係る後続する発話文書分割データCDDが記憶される。
【0076】
このように、支援データ記憶部35では、1つのレコードとして、当該データUDD、当該対応する発話文書分割データCDD、および当該後続する発話文書分割データCDDが、互いに対応付けられて記憶される。
【0077】
本実施形態では、このように支援データ記憶部35に、支援データADとして、ユーザ文書分割データUDDに対応付けられて、対応する発話文書分割データCDDおよび後続する発話文書分割データが記憶されるものとして説明する。しかしながら、支援データADとして、対応する発話文書分割データCDDと、後続する発話文書分割データと、のうち一方のみが記憶されるようにしてもよい。この場合、支援データ記憶部35は、上述した、対応する発話文書分割データのカラムと、後続する発話文書分割データのカラムとのうち、一方を有していなくてもよい。
【0078】
(動作例)
次に、以上のように構成されたシステムSYSの動作例を説明する。
【0079】
(1)動作フロー
図8は、サーバ装置SVおよびユーザ端末UTにより実行される動作の一例を示すフローチャートである。以下で説明する動作は一例に過ぎず、本実施形態に係る動作はこれに限定されるものではない。
【0080】
当該動作に先立ち、ユーザ端末UTを用いて、ユーザが、例えば、学習コンテンツを視聴する。例えば学習中のユーザによる入力部IPを介した入力に基づいて、ユーザ端末UTの制御部5が、ユーザ文書データ生成部51の制御の下、ユーザ文書データUDを生成し、当該ユーザ文書データUD、および、上記学習コンテンツの識別子を、ユーザ文書データ記憶部71に記憶させる。ユーザは、当該学習コンテンツの復習を行う際に、例えば、入力部IPを介してユーザ端末UTに入力を行う。例えば、ユーザからの当該入力により、
図8のフローチャートに示される動作が開始される。
【0081】
ユーザ端末UTの制御部5は、コンテンツ要求送信部52の制御の下、ユーザ文書データ記憶部71から上記ユーザ文書データUDを読み出し、当該ユーザ文書データUDを含むコンテンツ要求をサーバ装置SVに送信する(ST01)。当該コンテンツ要求には、上記識別子も含まれる。
【0082】
サーバ装置SVの制御部1は、コンテンツ要求取得部11の制御の下、当該コンテンツ要求を介して当該ユーザ文書データUDを取得する(ST02)。制御部1は、当該コンテンツ要求に応じて、コンテンツデータ出力部12の制御の下、コンテンツデータ記憶部32から、上記識別子に対応付けられたコンテンツデータCTDを読み出し、当該コンテンツデータCTDをユーザ端末UTに送信してもよい。
【0083】
制御部1は、ユーザ文書データ分割部131の制御の下、当該ユーザ文書データUDに係る文書コンテンツをいくつかの部分に分割した各部分について、当該部分のデータであるユーザ文書分割データUDDを生成する(ST03)。このように生成されるユーザ文書分割データUDDのうち、元のユーザ文書データUDに係る文書コンテンツ中でユーザにより先に記録された部分に係るものから順に、ユーザ文書分割データUDD0、ユーザ文書分割データUDD1、ユーザ文書分割データUDD2、・・・、ユーザ文書分割データUDD(p-1)(pは2以上の整数)と称する。制御部1は、ユーザ文書データ分割部131の制御の下、生成したユーザ文書分割データUDDをユーザ文書分割データ記憶部33に記憶させる。
【0084】
続いて、制御部1は、コンテンツデータ処理部132の制御の下、発話文書分割データCDDを生成する(ST04)。より具体的には、次の通りである。
【0085】
制御部1は、コンテンツデータ記憶部32から、上記識別子に対応付けられたコンテンツデータCTDを読み出し、当該コンテンツデータCTDに係る発話音声の内容を文書で表した文書コンテンツのデータである発話文書データを生成する。当該発話文書データの生成処理は、例えば何らかの音声認識技術を用いて行われる。制御部1は、当該発話文書データに係る文書コンテンツをいくつかの部分に分割した各部分について、当該部分のデータである発話文書分割データCDDを生成する。このように生成される発話文書分割データCDDのうち、元のコンテンツデータCTDに係る発話音声中で先に発話される部分に係るものから順に、発話文書分割データCDD0、発話文書分割データCDD1、発話文書分割データCDD2、・・・、発話文書分割データCDD(q-1)(qは2以上の整数)と称する。制御部1は、生成した発話文書分割データCDDを発話文書分割データ記憶部34に記憶させる。
【0086】
なお、上記でST03を付して説明した動作(以下、ST03の動作とも称する。類似する他の記載についても同じである。)と、ST04の動作は、逆の順序で行われてもよいし、部分的にオーバーラップして行われてもよい。
【0087】
続いて、制御部1は、次のように支援データADを生成する。
【0088】
先ず、制御部1は、比較部133の制御の下、変数iの値を0に設定する(ST05)。
【0089】
続いて、制御部1は、比較部133の制御の下、ユーザ文書分割データ記憶部33からユーザ文書分割データUDDiを読み出す。この時点では、ユーザ文書分割データUDD0が読み出される。制御部1は、比較部133の制御の下、発話文書分割データ記憶部34から例えば発話文書分割データCDD0を読み出す。制御部1は、比較部133の制御の下、ユーザ文書分割データUDDiに係る文書コンテンツと、発話文書分割データCDD0に係る文書コンテンツと、の類似度を算出する。算出される類似度は、対象の2つの文書コンテンツが類似しているほど高い値となる。制御部1は、同様に、発話文書分割データ記憶部34から例えば発話文書分割データCDD1を読み出し、ユーザ文書分割データUDDiに係る文書コンテンツと、発話文書分割データCDD1に係る文書コンテンツと、の類似度を算出する。以下、同様であり、制御部1は、比較部133の制御の下、このようにして、整数jが0から(q-1)の整数の各々のケースについて、ユーザ文書分割データUDDiに係る文書コンテンツと、発話文書分割データCDDjに係る文書コンテンツと、の類似度を算出する(ST06)。
【0090】
制御部1は、このように算出した類似度のうち、例えば最も高い類似度に関して、次に説明する動作を行う。
【0091】
制御部1は、比較部133の制御の下、当該類似度が閾値VSHを超えているか否かを判定する(ST07)。
【0092】
当該類似度が閾値VSHを超えていると判定された場合(ST07,Yes)、制御部1は、比較部133の制御の下、当該類似度の算出に用いられた発話文書分割データCDDが、ユーザ文書分割データUDDiに対応する発話文書分割データCDDであると判定し、次に説明する動作を行う。
【0093】
制御部1は、発話文書分割データ記憶部34から、後続する発話文書分割データCDDを読み出す。当該後続する発話文書分割データCDDは、元の発話文書データに係る文書コンテンツのうち、上記対応する発話文書分割データCDDに係る部分に後続する部分のデータである。制御部1は、当該ユーザ文書分割データUDDi、当該対応する発話文書分割データCDD、および、当該後続する発話文書分割データCDDを、支援データ記憶部35に記憶させる。当該記憶処理では、当該データUDDiに、当該対応する発話文書分割データCDDおよび当該後続する発話文書分割データCDDが対応付けされる。支援データ記憶部35に記憶されるデータが、本実施形態で用いられる支援データADであり、当該記憶処理により、支援データADが生成または更新される(ST11)。
【0094】
上記類似度が閾値VSHを超えていないと判定された場合(ST07,No)、制御部1は、比較部133の制御の下、当該類似度が、閾値VSMを超えているか否かを判定する(ST08)。閾値VSMは閾値VSHより低い。
【0095】
当該類似度が閾値VSMを超えていると判定された場合(ST08,Yes)、制御部1は、比較部133の制御の下、ユーザ文書分割データUDDiに係る文書コンテンツの、元のユーザ文書データUDに係る文書コンテンツ中での位置と、当該類似度の算出に用いられた発話文書分割データCDDに係る発話音声の、コンテンツデータCTDに係る発話音声中での位置との近似度を算出する(ST09)。算出される近似度は、対象の2つの位置が近いほど低い値となる。制御部1は、比較部133の制御の下、当該近似度が閾値VNを下回っているか否かを判定する(ST10)。
【0096】
当該近似度が閾値VNを下回っていると判定された場合(ST10,Yes)、制御部1は、比較部133の制御の下、当該発話文書分割データCDDが、ユーザ文書分割データUDDiに対応する発話文書分割データCDDであると判定し、ST11の動作を行う。
【0097】
ST11の動作に続いて、または、上記類似度が閾値VSMを超えていないと判定された場合(ST08,No)、あるいは、上記近似度が閾値VNを下回っていないと判定された場合(ST10,No)、制御部1は、比較部133の制御の下、全てのiについて処理が完了したか否かを判定する(ST12)。この時点では、iが0以外のケースについては処理が行われていない。制御部1は、このように全てのiについて処理が完了しているわけではない場合(ST12,No)、比較部133の制御の下、変数iの値を1だけインクリメントする(ST13)。
【0098】
続いて、制御部1は、次のユーザ文書分割データUDDに関係する処理を、ST06の動作から繰り返す。制御部1は、このようにST06からST13までの動作を繰り返し続け、ST11の動作を行う都度、支援データ記憶部35に記憶される支援データADを更新する。
【0099】
制御部1は、ユーザ文書分割データUDD(p-1)に関係する処理に続くST12の動作において、全てのiについて処理が完了したと判定する。この場合(ST12,Yes)、制御部1は、支援データ出力部14の制御の下、支援データ記憶部35から支援データADを読み出し、当該支援データADをユーザ端末UTに送信する(ST14)。
【0100】
ユーザ端末UTの制御部5は、支援データ取得部54の制御の下、当該支援データADを取得する(ST15)。
【0101】
制御部5は、表示データ出力部55の制御の下、当該支援データADに基づく情報を、表示部DPに出力する(ST16)。表示部DPの表示画面上に表示されるコンテンツを通して、ユーザは、過去に学習したコンテンツを復習し得る。
【0102】
上述した動作例は、サーバ装置SVおよびユーザ端末UTが実行する動作の一例に過ぎない。
上記では、ST07からST11の動作が、算出された類似度のうちもっとも高い類似度に関して行われる場合について説明した。しかしながら、算出された類似度の各々に関してこれらの動作が行われてもよい。この場合、算出された類似度の各々に関してこれらの動作が行われた後に、ST12の動作に進む。
【0103】
さらに、上述したST07の動作とST08の動作は逆の順序で行われてもよい。この場合、次のように動作が行われる。先ず、類似度が閾値VSMを超えているか否かの判断が先にされる。当該類似度が閾値VSMを超えていないと判断された場合には、ST12の動作に進むが、当該類似度が閾値VSMを超えていると判断された場合には、当該類似度が閾値VSHを超えているか否かが判断される。当該類似度が閾値VSHを超えていると判断された場合には、ST11の動作に進む。当該類似度が閾値VSHを超えていないと判断された場合には、ST09の動作に進む。
【0104】
さらに、上述したST09の動作は、例えば、ST07の動作およびST08の動作より先に行われてもよい。例えば、ST06の動作に続いて、最も高い類似度の算出に用いられた発話文書分割データCDDについてST09の動作が行われる。当該動作に続いて、ST07以降の動作が行われる。
【0105】
さらに、上述したように、算出された類似度の各々に関してST07からST11の動作が行われる場合には、ST09の動作が、ST06の動作の前に、または、ST06の動作と並行して、各発話文書分割データCDDについて行われてもよい。
【0106】
(2)サーバ装置による支援データ生成処理の詳細
図9は、
図8を参照して説明した、サーバ装置SVの支援データ生成部13の制御の下で行われる各STの動作の詳細を説明するための図である。
【0107】
先ず、ST03の動作について説明する。
ユーザ文書データUDに係る文書コンテンツでは、
図9に示されるように、複数の領域URを用いたグループ分けが行われる。より具体的には、当該文書コンテンツが、ユーザにより先に記録された方から順に、領域UR0内の文書コンテンツ、領域UR1内の文書コンテンツ、領域UR2内の文書コンテンツ、領域UR3内の文書コンテンツ、・・・、領域UR(p-1)内の文書コンテンツに分けられる。
【0108】
このようなグループ分けは、例えば次のように行われる。
例えば、当該文書コンテンツの各行について、当該行に含まれる文字情報が1つのグループを構成するように、グループ分けが行われてもよい。あるいは、当該文書コンテンツ中の隣接する単語間の共起頻度に基づいてグループ分けが行われてもよい。あるいは、当該文書コンテンツ中の余白に基づいてグループ分けが行われてもよい。あるいは、何らかのトピック分析技術に基づいてグループ分けが行われてもよい。あるいは、複数の領域URそれぞれの面積が実質的に同一となるようにグループ分けが行われてもよい。
【0109】
図8の例のST03の動作では、ユーザ文書データ分割部131の制御の下、領域UR0内の文書コンテンツのデータであるユーザ文書分割データUDD0が生成され、領域UR1内の文書コンテンツのデータであるユーザ文書分割データUDD1が生成され、領域UR2内の文書コンテンツのデータであるユーザ文書分割データUDD2が生成され、領域UR3内の文書コンテンツのデータであるユーザ文書分割データUDD3が生成され、・・・、領域UR(p-1)内の文書コンテンツのデータであるユーザ文書分割データUDD(p-1)が生成される。
【0110】
次に、ST04の動作について説明する。
コンテンツデータCTDに基づいて発話文書データが生成される。当該発話文書データに係る文書コンテンツにおいても、
図9に示されるように、複数の領域CRを用いたグループ分けが行われる。より具体的には、当該文書コンテンツが、元のコンテンツデータCTDに係る発話音声中で先に発話される方に係るものから順に、領域CR0内の文書コンテンツ、領域CR1内の文書コンテンツ、領域CR2内の文書コンテンツ、領域CR3内の文書コンテンツ、・・・、領域CR(q-1)内の文書コンテンツに分けられる。
【0111】
このようなグループ分けは、例えば次のように行われる。
例えば、当該文書コンテンツの各行について、当該行に含まれる文字情報が1つのグループを構成するように、グループ分けが行われてもよい。あるいは、当該文書コンテンツ中の隣接する単語間の共起頻度に基づいてグループ分けが行われてもよい。あるいは、当該文書コンテンツ中の余白に基づいてグループ分けが行われてもよい。当該余白は、例えば、発話音声が無い区間に対応する。あるいは、何らかのトピック分析技術に基づいてグループ分けが行われてもよい。あるいは、複数の領域URそれぞれの面積が実質的に同一となるようにグループ分けが行われてもよい。各領域URの面積は、例えば、当該領域内の文書コンテンツの発話時間に比例し得る。
【0112】
図8の例のST04の動作では、コンテンツデータ処理部132の制御の下、領域CR0内の文書コンテンツのデータである発話文書分割データCDD0が生成され、領域CR1内の文書コンテンツのデータである発話文書分割データCDD1が生成され、領域CR2内の文書コンテンツのデータである発話文書分割データCDD2が生成され、領域CR3内の文書コンテンツのデータである発話文書分割データCDD3が生成され、・・・、領域CR(q-1)内の文書コンテンツのデータである発話文書分割データCDD(q-1)が生成される。
【0113】
次に、比較部133の制御の下で行われるいくつかのSTの動作について、これらの動作がユーザ文書分割データUDD1に関して行われる場合の例を説明する。
【0114】
図8の例のST06の動作では、例えば、整数jが0から(q-1)の整数の各々のケースについて、ユーザ文書分割データUDD1に係る文書コンテンツと、発話文書分割データCDDjに係る文書コンテンツと、の類似度が算出される。
図9では、このうちの、整数jが2の場合が示されている。
【0115】
当該類似度の算出処理は、対象の2つの文書コンテンツの間で文字列および/またはトピックがどれだけ類似しているかに基づくものであってもよい。当該類似度の算出処理は、グループ分けの粒度によって異なる技術に基づくものであってもよい。例えば、当該類似度の算出処理は、対象の2つの文書コンテンツの間の最長共通文字列の長さに基づくものであってもよい。あるいは、当該類似度の算出処理は、対象の2つの文書コンテンツの間での単語の共起割合に基づくものであってもよい。当該単語の共起割合は、例えば(共起文字数)/(文書コンテンツ内の文字数)に基づく。あるいは、当該類似度の算出処理は、何らかのトピック分析技術に基づくものであってもよい。
【0116】
このように算出された類似度のうち、ユーザ文書分割データUDD1に係る文書コンテンツと、発話文書分割データCDD2に係る文書コンテンツと、の類似度が最も高かったものとして説明する。
【0117】
図8の例のST07およびST08の動作では、当該最も高い類似度が閾値と比較される。
【0118】
当該類似度が閾値VSHを超えている場合、ユーザ文書分割データUDD1に、当該最も高い類似度の算出に用いられた発話文書分割データCDD2が対応すると判定され、ST11の動作が行われる。
【0119】
当該類似度が閾値VSHを超えていないが、
図8の例のST08の動作において閾値VSMを超えている場合、
図8の例のST09の動作において、次に説明する処理が行われる。
【0120】
ユーザ文書分割データUDD1に係る文書コンテンツの、元のユーザ文書データUDに係る文書コンテンツ中での位置と、発話文書分割データCDD2に係る発話音声の、コンテンツデータCTDに係る発話音声中での位置との近似度が算出される。
【0121】
ユーザ文書分割データUDD1に係る文書コンテンツの、ユーザ文書データUDに係る文書コンテンツ中での位置は、例えば、(データUDD1に係る領域UR1より前にある領域UR0の面積)/(領域URの面積の総和)の数値で示される。
【0122】
あるいは、ユーザ文書データUDが、当該データUDに係る文書コンテンツ中のいくつかの箇所について、当該箇所に関係するユーザからの入力が行われていた時刻の情報を含む場合、当該位置は次のように求められてもよい。すなわち、当該位置は、(データUDに係る文書コンテンツのための入力をユーザが始めてからデータUDD1に係る文書コンテンツのための入力をユーザが始めるまでの時間)/(データUDに係る文書コンテンツのための入力をユーザが初めてから終わるまでの時間)の数値で示されてもよい。
【0123】
発話文書分割データCDD2に係る発話音声の、コンテンツデータCTDに係る発話音声中での位置は、例えば、(コンテンツデータCTDに係る発話音声の開始からデータCDD2に係る発話音声の開始までの時間)/(コンテンツデータCTDに係る発話音声の開始から終了までの時間)の数値で示される。
【0124】
あるいは、当該位置は、例えば、(データCDD2に係る領域CR2より前にある領域CR0およびCR1の面積の和)/(領域CRの面積の総和)の数値で示されてもよい。
【0125】
この2つの数値の差の絶対値により上記近似度が算出される。
【0126】
当該近似度が閾値VNを下回っている場合、ユーザ文書分割データUDD1に発話文書分割データCDD2が対応すると判定され、ST11の動作が行われる。
【0127】
図8の例のST11の動作では、当該データUDD1、当該対応する発話文書分割データCDD2、および、後続する発話文書分割データCDD3が、支援データAD中のデータとして記憶される。支援データADでは、当該データUDD1に、当該対応する発話文書分割データCDD2、および、当該後続する発話文書分割データCDD3が、対応付けされている。
【0128】
支援データAD中でこのように対応付けされている、ユーザ文書分割データUDD1、発話文書分割データCDD2、および、発話文書分割データCDD3は、
図8の例のST16の動作において利用される。より具体的には、要約候補情報出力部552の制御の下でユーザ文書分割データUDD1が利用され、要約支援情報出力部553の制御の下で発話文書分割データCDD2およびCDD3が利用される。次の図を参照しながらより詳細に説明する。
【0129】
(3)ユーザ端末による支援データに基づく情報出力処理の詳細
図10は、
図8を参照して説明した、ユーザ端末UTの表示データ出力部55の制御の下で行われるST16の動作の詳細を説明するための図である。図中の破線の枠および一点鎖線の枠は、説明のために示されているものであり、表示部DPの表示画面上に表示される画像ではない。
【0130】
ユーザ端末UTに接続される表示部DPの表示画面では、例えば表示領域DR1および表示領域DR2が表示される。
表示領域DR1には、要約候補情報出力部552の制御の下、ユーザ文書データUDに係る文書コンテンツが表示される。表示領域DR2には、コンテンツデータ出力部551の制御の下、例えば、コンテンツデータCTDに係る画像コンテンツが表示される。
【0131】
表示領域DR1では、要約候補情報出力部552の制御の下、ユーザ文書データUDに係る文書コンテンツのうち、支援データAD中のユーザ文書分割データUDDに係る文書コンテンツがハイライト表示される。
図10では、当該ハイライト表示される文書コンテンツは<< >>で囲まれている。
図10では、支援データAD中のユーザ文書分割データUDD1に係る文書コンテンツがハイライト表示される様子が破線の枠で囲まれて示されている。なお、表示領域DR1では、要約候補情報出力部552の制御の下、ユーザ文書データUDに係る文書コンテンツが表示されることなく、支援データAD中のユーザ文書分割データUDDに係る文書コンテンツのみが表示されてもよい。
【0132】
例えば、表示部DPの表示画面中に表示されるカーソルが、ユーザによる操作に基づいて、ハイライト表示される或る文書コンテンツに合わされた場合、要約支援情報出力部553の制御の下、当該表示画面において、例えば、当該文書コンテンツの上下左右のいずれかに表示領域DR3、表示領域DR4が表示される。
図10では、ハイライト表示されるユーザ文書分割データUDD1に係る文書コンテンツにカーソルが合わされた場合の例が示されている。
【0133】
表示領域DR3では、要約支援情報出力部553の制御の下、支援データAD中で当該データUDD1に対応付けられている、対応する発話文書分割データCDD2、に係る文書コンテンツが表示される。
【0134】
表示領域DR4では、要約支援情報出力部553の制御の下、支援データAD中で当該データUDD1に対応付けられている、後続する発話文書分割データCDD3、に係る文書コンテンツが表示される。
【0135】
(効果)
第1実施形態に係るサーバ装置SVは、ユーザ端末UTからユーザ文書データUDを取得する。ユーザ文書データUDは、或る学習コンテンツを学習中のユーザによる入力に基づいて生成されたものである。サーバ装置SVは、当該ユーザ文書データUDに基づいて或るユーザ文書分割データUDDを生成する。当該ユーザ文書分割データUDDは、元のユーザ文書データUDに係る文書コンテンツ中の或る部分のデータである。一方、サーバ装置SVは、上記学習コンテンツに係るコンテンツデータCTDを読み出し、当該コンテンツデータCTDに係る発話音声の内容を文書で表した文書コンテンツのデータである発話文書データを生成する。サーバ装置SVは、当該発話文書データに基づいて或る発話文書分割データCDDを生成する。当該発話文書分割データCDDは、元の発話文書データに係る文書コンテンツ中の或る部分のデータである。サーバ装置SVは、当該ユーザ文書分割データUDDに係る文書コンテンツと、当該発話文書分割データCDDに係る文書コンテンツとの類似度を算出する。
【0136】
サーバ装置SVは、当該類似度に基づいて、当該ユーザ文書分割データUDDに当該発話文書分割データCDDが対応するか否かを判定する。サーバ装置SVは、当該ユーザ文書分割データUDDに当該発話文書分割データCDDが対応すると判定した場合、当該ユーザ文書分割データUDD、当該対応する発話文書分割データCDD、および、後続する発話文書分割データCDDを、支援データ記憶部35に記憶させる。当該後続する発話文書分割データCDDは、元の発話文書データに係る文書コンテンツのうち、当該対応する発話文書分割データCDDに係る部分に後続する部分のデータである。当該記憶処理では、当該ユーザ文書分割データUDDに、当該対応する発話文書分割データCDDおよび当該後続する発話文書分割データCDDが対応付けされる。このようにして、支援データ記憶部35内に支援データADが生成される。サーバ装置SVは、支援データADをユーザ端末UTに送信する。
【0137】
支援データAD中のユーザ文書分割データUDDに係る文書コンテンツは、ユーザが、学習コンテンツ中で発話される内容をそのまま記録したものである可能性が高い。このように記録された部分については、ユーザがその部分を深くは理解できていない可能性がある。したがって、
図10を参照して説明したように当該データUDDに係る文書コンテンツを表示部DPの表示画面上でハイライト表示させると、ユーザは、発話音声の内容をそのまま記録していた箇所が容易にわかり、上記学習コンテンツの内容を効率的に復習することが可能となり得る。ユーザは、例えば、ハイライト表示される文書の内容を自分なりに整理してから、その内容を要約して別の表現で記録しなおすことができる。
【0138】
さらに、
図10を参照して説明したように、支援データAD中で当該データUDDに対応付けられている発話文書分割データCDDに係る文書コンテンツが、当該表示画面上で表示され得る。具体的には次の通りである。上記対応する発話文書分割データCDDに係る文書コンテンツが表示され得る。さらに、上記後続する発話文書分割データCDDに係る文書コンテンツが表示され得る。このように表示される文書コンテンツは、発話される内容をそのまま記録するのにユーザの意識が向いているあまり、ユーザが聞き逃してしまった可能性がある発話音声を文書で表したものである。したがって、このように表示される文書コンテンツを利用すると、ユーザは、聞き逃してしまった部分を再度聞くために学習コンテンツを視聴しなおす必要が無く、ゆえに効率的に復習をすることができる。ユーザは、このように表示される文書コンテンツを参照しながら、上述したようにハイライト表示される文書の内容を要約することができる。
図9を参照して説明したグループ分けの粒度が大きい場合には、例えば、上記対応する発話文書分割データCDDに係る文書コンテンツの表示が、ユーザにとって、より有用になり得る。一方、グループ分けの粒度が小さい場合には、例えば、上記後続する発話文書分割データCDDに係る文書コンテンツの表示が、ユーザにとって、より有用になり得る。
【0139】
サーバ装置SVは、上記ユーザ文書分割データUDDに上記発話文書分割データCDDが対応するか否かの判定を、より具体的には次のように行う。上記類似度が、閾値VSHを超えている場合に、サーバ装置SVは、当該データUDDに当該データCDDが対応すると判定する。上記類似度が閾値VSHを超えていないが閾値VSMを超えている場合には、次の処理が行われる。サーバ装置SVは、当該データUDDに係る文書コンテンツの、元のユーザ文書データUDに係る文書コンテンツ中での位置と、当該データCDDに係る発話音声の、コンテンツデータCTDに係る発話音声中での位置との近似度を算出する。当該近似度が閾値VNを下回っていれば、サーバ装置SVは、当該データUDDに当該データCDDが対応すると判定する。
【0140】
例えば、発話される内容をユーザがそのまま記録する場合、発話される内容を一言一句違えずに記録することは難しい。発話された内容とは部分的に異なって記録された箇所は、発話された内容との単純な文字列比較では抽出されないことがある。これは、このような文字列比較は、対象の文字情報の間で完全に一致する文字列を見つけるものだからである。一方、上述したように、第1実施形態に係るサーバ装置SVによると、ユーザ文書分割データUDDに発話文書分割データCDDが対応するか否かの判定が、データUDDに係る文書コンテンツと当該データCDDに係る文書コンテンツとの類似度に加えて、上述したような近似度にも基づいて行われ得る。また、類似度の算出処理は、文字列比較に基づくものに限定されない。このため、第1実施形態に係るサーバ装置SVによると、従来の技術では抽出されないようなデータUDDを抽出し、支援データADに含めるようにすることができる。
【0141】
なお、本発明は、上記実施形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で種々に変形することが可能である。また、各実施形態は適宜組み合わせて実施してもよく、その場合組み合わせた効果が得られる。更に、上記実施形態には種々の発明が含まれており、開示される複数の構成要件から選択された組み合わせにより種々の発明が抽出され得る。例えば、実施形態に示される全構成要件からいくつかの構成要件が削除されても、課題が解決でき、効果が得られる場合には、この構成要件が削除された構成が発明として抽出され得る。
【符号の説明】
【0142】
SYS…システム
SV…サーバ装置
UT…ユーザ端末
NW…通信ネットワーク
1,5…制御部
2,6…プログラム記憶部
3,7…データ記憶部
4,8…入出力インタフェース
BUS…バス
IP…入力部
DP…表示部
11…コンテンツ要求取得部
12…コンテンツデータ出力部
13…支援データ生成部
131…ユーザ文書データ分割部
132…コンテンツデータ処理部
133…比較部
14…支援データ出力部
31…ユーザ文書データ記憶部
32…コンテンツデータ記憶部
33…ユーザ文書分割データ記憶部
34…発話文書分割データ記憶部
35…支援データ記憶部
51…ユーザ文書データ生成部
52…コンテンツ要求送信部
53…コンテンツデータ取得部
54…支援データ取得部
55…表示データ出力部
551…コンテンツデータ出力部
552…要約候補情報出力部
553…要約支援情報出力部
71…ユーザ文書データ記憶部
72…コンテンツデータ記憶部
73…支援データ記憶部
CTD…コンテンツデータ
UD…ユーザ文書データ
AD…支援データ
UDD…ユーザ文書分割データ
CDD…発話文書分割データ
UR,CR…領域
DR…表示領域