(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023181593
(43)【公開日】2023-12-25
(54)【発明の名称】情報処理装置及び情報処理方法
(51)【国際特許分類】
G06F 16/9035 20190101AFI20231218BHJP
G09B 19/00 20060101ALI20231218BHJP
G06F 16/9038 20190101ALI20231218BHJP
G06F 3/0484 20220101ALI20231218BHJP
G06F 16/34 20190101ALI20231218BHJP
【FI】
G06F16/9035
G09B19/00 H
G06F16/9038
G06F3/0484
G06F16/34
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2022094803
(22)【出願日】2022-06-13
(71)【出願人】
【識別番号】000005049
【氏名又は名称】シャープ株式会社
(74)【代理人】
【識別番号】100147304
【弁理士】
【氏名又は名称】井上 知哉
(74)【代理人】
【識別番号】100148493
【弁理士】
【氏名又は名称】加藤 浩二
(72)【発明者】
【氏名】後藤 航輝
【テーマコード(参考)】
5B175
5E555
【Fターム(参考)】
5B175HA01
5B175JB02
5E555AA22
5E555AA25
5E555AA26
5E555AA71
5E555BA02
5E555BA04
5E555BB02
5E555BB04
5E555BC20
5E555BE09
5E555CA02
5E555CA12
5E555CA18
5E555CB64
5E555DB05
5E555DB39
5E555DB41
5E555DB53
5E555DC13
5E555DC33
5E555DC35
5E555DD07
5E555EA05
5E555EA23
5E555FA00
(57)【要約】
【課題】ユーザーの習熟度を考慮した態様でテキストを表示する情報処理装置及び情報処理方法等の提供。
【解決手段】情報処理装置は、キーワードに対して難易度が対応付けられた難易度情報、及び、ユーザーに対して習熟度が対応付けられたユーザー情報を取得する取得部と、入力テキストと難易度情報に基づいて、入力テキストに含まれるキーワードの難易度を求める処理、及び、ユーザー情報に基づいて、ユーザーの習熟度を求める処理を行い、難易度と習熟度に基づいて、入力テキストの表示態様を制御する処理部と、を含む。
【選択図】
図1
【特許請求の範囲】
【請求項1】
キーワードに対して、前記キーワードの難易度が対応付けられた難易度情報、及び、ユーザーに対して、前記ユーザーの習熟度が対応付けられたユーザー情報を取得する取得部と、
入力テキストと前記難易度情報に基づいて、前記入力テキストに含まれる前記キーワードの前記難易度を求める処理、及び、前記ユーザー情報に基づいて、前記ユーザーの前記習熟度を求める処理を行い、前記難易度と前記習熟度に基づいて、前記入力テキストの表示態様を制御する処理部と、
を含む情報処理装置。
【請求項2】
請求項1において、
前記処理部は、
前記難易度および前記習熟度に基づいて、前記ユーザーにとって難解であると推定される不明語を特定し、
前記表示態様の制御として、前記不明語に対して付加される付加情報を、前記不明語に対応付けて表示する制御を行う情報処理装置。
【請求項3】
請求項2において、
前記処理部は、
前記表示態様の制御として、前記不明語を、前記不明語以外の語句のフォントとは異なるフォントを用いて表示する制御を行う情報処理装置。
【請求項4】
請求項1乃至3の何れか一項において、
前記処理部は、
前記難易度および前記習熟度に基づいて、前記入力テキストが前記ユーザーにとって難解であると推定された場合、前記入力テキストが前記ユーザーにとって平易であると推定された場合に比べて、前記入力テキストの表示時間を長くする制御を、前記表示態様の制御として行う情報処理装置。
【請求項5】
請求項1乃至3の何れか一項において、
前記ユーザー情報は、分野に応じた前記ユーザーの前記習熟度を表す情報を含み、
前記処理部は、
前記入力テキストが属する前記分野を特定する処理を行い、前記入力テキストが属する前記分野と前記ユーザー情報に基づいて、前記習熟度を求める情報処理装置。
【請求項6】
請求項1乃至3の何れか一項において、
前記ユーザーの学歴、職歴、自認するレベル、及び所定言語の言語圏での在住履歴の少なくとも1つを含む項目に関するユーザー入力を受け付けるユーザー入力受付部を含み、
前記取得部は、
前記ユーザー入力に基づいて前記ユーザー情報を求める情報処理装置。
【請求項7】
請求項6において、
前記ユーザー入力受付部は、
前記入力テキストの表示後に、表示内容の評価に関する前記ユーザー入力を受け付け、
前記取得部は、
前記表示内容の前記評価に関する前記ユーザー入力に基づいて、前記難易度情報及び前記ユーザー情報の少なくとも一方を更新する情報処理装置。
【請求項8】
請求項2または3において、
前記入力テキスト及び前記付加情報の表示後に、前記付加情報が十分であったか否か、及び、前記不明語を知っていたか否か、の少なくとも一方に関するユーザー入力を受け付けるユーザー入力受付部を含み、
前記取得部は、
前記ユーザー入力に基づいて、前記難易度情報及び前記ユーザー情報の少なくとも一方を更新する情報処理装置。
【請求項9】
請求項1乃至3の何れか一項において、
前記取得部は、
サンプルテキストにおける前記キーワードの出現頻度、及び、試験における前記キーワードに関する問題の正解率の少なくとも一方に基づいて、前記難易度情報を求める情報処理装置。
【請求項10】
キーワードに対して、前記キーワードの難易度が対応付けられた難易度情報、及び、ユーザーに対して、前記ユーザーの習熟度が対応付けられたユーザー情報を取得し、
入力テキストと前記難易度情報に基づいて、前記入力テキストに含まれる前記キーワードの前記難易度を求め、
前記ユーザー情報に基づいて、前記ユーザーの前記習熟度を求め、
前記難易度と前記習熟度に基づいて、前記入力テキストの表示態様を制御する、
情報処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置及び情報処理方法等に関する。
【背景技術】
【0002】
従来、テキストを表示する際に、当該テキストに含まれる単語の意味を表示する手法が知られている。例えば特許文献1には、ユーザーが不明語を指定した場合に、当該不明語の説明文を端末に表示する手法が開示されている。また特許文献2には、初出の単語や、既出の単語のうちユーザーによる参照率が高い単語を対象として、当該単語の意味を表示する手法が開示されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2003-16088号公報
【特許文献2】特開2014-115908号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1の手法では、不明語をユーザーが指定する必要がある。またユーザーが単語の意味を誤解している場合、ユーザーは当該単語を不明語と認識しないため、当該誤解の解消が難しい。また特許文献2の手法では、過去の提示に基づいて初出の単語が判定される。よって、例えばユーザーにとって平易な単語であっても、初回には意味の表示が行われてしまう。
【0005】
本開示のいくつかの態様によれば、ユーザーの習熟度を考慮した態様でテキストを表示する情報処理装置及び情報処理方法等を提供できる。
【課題を解決するための手段】
【0006】
本開示の一態様は、キーワードに対して、前記キーワードの難易度が対応付けられた難易度情報、及び、ユーザーに対して、前記ユーザーの習熟度が対応付けられたユーザー情報を取得する取得部と、入力テキストと前記難易度情報に基づいて、前記入力テキストに含まれる前記キーワードの前記難易度を求める処理、及び、前記ユーザー情報に基づいて、前記ユーザーの前記習熟度を求める処理を行い、前記難易度と前記習熟度に基づいて、前記入力テキストの表示態様を制御する処理部と、を含む情報処理装置に関係する。
【0007】
本開示の他の態様は、キーワードに対して、前記キーワードの難易度が対応付けられた難易度情報、及び、ユーザーに対して、前記ユーザーの習熟度が対応付けられたユーザー情報を取得し、入力テキストと前記難易度情報に基づいて、前記入力テキストに含まれる前記キーワードの前記難易度を求め、前記ユーザー情報に基づいて、前記ユーザーの前記習熟度を求め、前記難易度と前記習熟度に基づいて、前記入力テキストの表示態様を制御する、情報処理方法に関係する。
【図面の簡単な説明】
【0008】
【
図3】情報処理装置における処理を説明するフローチャートである。
【
図4】難易度情報の作成処理を説明するフローチャートである。
【
図6】ユーザー情報の作成処理を説明するフローチャートである。
【
図7A】習熟度に関するユーザー入力を受け付ける画面例である。
【
図7B】習熟度に関するユーザー入力を受け付ける画面例である。
【
図10B】表示態様が変更された入力テキストの表示画面例である。
【
図10C】表示態様が変更された入力テキストの表示画面例である。
【
図11】難易度情報及びユーザー情報の少なくとも一方の更新処理を説明するフローチャートである。
【
図12A】表示内容に関するユーザー入力を受け付ける画面例である。
【
図12B】表示内容に関するユーザー入力を受け付ける画面例である。
【発明を実施するための形態】
【0009】
以下、本実施形態について図面を参照しつつ説明する。図面については、同一又は同等の要素には同一の符号を付し、重複する説明は省略する。なお、以下に説明する本実施形態は、特許請求の範囲に記載された内容を不当に限定するものではない。また本実施形態で説明される構成の全てが、本開示の必須構成要件であるとは限らない。
【0010】
1.システム構成例
図1は、本実施形態に係る情報処理装置100の構成例を示す図である。本実施形態に係る情報処理装置100は、入力テキストを取得し、当該入力テキストの表示制御を行う装置である。例えば情報処理装置100は、PC(Personal Computer)であってもよいし、スマートフォンであってもよい。また情報処理装置100は、AR(Augmented Reality)グラスやMR(Mixed Reality)グラス等のウェアラブルデバイスであってもよいし、表示部を有する他のデバイスであってもよい。
【0011】
図1に示したように、情報処理装置100は、取得部110と、処理部120を含む。取得部110は、キーワードに対して、当該キーワードの難易度が対応付けられた難易度情報、及び、ユーザーに対して、当該ユーザーの習熟度が対応付けられたユーザー情報を取得する。処理部120は、入力テキストと難易度情報に基づいて、入力テキストに含まれるキーワードの難易度を求める処理、及び、ユーザー情報に基づいて、ユーザーの習熟度を求める処理を行う。そして処理部120は、難易度と習熟度に基づいて、入力テキストの表示態様を制御する。ここで難易度とは、対象のキーワードの読み方や意味を理解する困難さの程度を表す。また習熟度とは、対象のユーザーがテキストやキーワードの内容を理解する能力の程度を表す。
【0012】
本実施形態の手法によれば、表示対象となるキーワードの難易度と、当該キーワードを含む入力テキストを閲覧するユーザーの習熟度の両方に基づいて、入力テキストの表示態様が制御される。入力テキストの表示態様の制御とは、例えば当該入力テキストに含まれる各キーワードの表示態様を制御することを表す。
【0013】
例えば処理部120は、ユーザーにとって難解と推定されるキーワード(以下、不明語とも記載)が検出された場合、当該不明語を説明する情報等を表示してもよい。このようにすれば、ユーザーはキーワードの意味等を検索する必要がないため、ユーザー負担を軽減できる。また習熟度が低いユーザーはキーワードの意味を誤解している場合もあるため、ユーザー選択を説明表示のトリガーとする手法では、当該キーワードの説明等が表示されない可能性がある。その点、本実施形態では処理部120が入力テキストの表示態様を自動的に決定するため、当該誤解を解消できる。また同じ入力テキストであっても、習熟度の低いユーザーにとっては不明語が多く、習熟度の高いユーザーにとっては不明語が少ないといったように、ユーザーに応じた個人差が生じることが想定される。その点、本実施形態の手法では表示制御に習熟度が用いられるため、対象ユーザーに最適化された態様で入力テキストを表示することが可能になる。例えば、キーワードが不明語であるかをユーザー毎に判定できるため、当該ユーザーにとって難解であるキーワードに関する説明等が省略されてしまうこと、あるいは、当該ユーザーにとって平易であるキーワードに関して過剰な説明等が表示されてしまうことを抑制できる。
【0014】
なお本実施形態の手法は、テキストを表示する種々の場面に適用可能である。例えば会議システムにおける資料の表示、Webブラウザ等を用いたWebページの閲覧、テキスト編集アプリケーション等におけるテキストデータの表示、映像信号や音声信号の再生アプリケーションにおける字幕の表示等、種々の場面において、本実施形態の手法に基づいて表示態様が制御されてもよい。例えば、本実施形態の手法は、情報処理装置100で動作するアプリケーションソフトウェアとして実現されてもよい。当該アプリケーションソフトウェアは、会議システム、Webブラウザ、テキスト編集アプリケーション、映像再生アプリケーション等の一部として実現されてもよいし、これらと連動して動作するソフトウェアであってもよい。
【0015】
図2は、情報処理装置100の詳細な構成例を示す図である。情報処理装置100は、取得部110、処理部120、記憶部130、表示部140、ユーザー入力受付部150を含む。ただし、情報処理装置100の構成は
図2に限定されず、一部の構成を省略する、他の構成を追加する等の種々の変形実施が可能である。
【0016】
取得部110は、難易度情報を取得する難易度情報取得部111と、ユーザー情報を取得するユーザー情報取得部112を含む。例えば難易度情報取得部111は、
図4を用いて後述するように、サンプルテキスト等の情報に基づいて難易度情報131を作成する処理を行ってもよい。難易度情報取得部111は、作成した難易度情報131を記憶部130に記憶する。またユーザー情報取得部112は、
図6を用いて後述するように、ユーザー入力等に基づいてユーザー情報132を作成する処理を行ってもよい。ユーザー情報取得部112は、作成したユーザー情報132を記憶部130に記憶する。
【0017】
ただし本実施形態の手法では、難易度情報131が、情報処理装置100とは異なる装置において作成されてもよい。この場合、難易度情報取得部111は、当該異なる装置と通信を行うことによって、難易度情報131を受信する処理を行う。なおここでの通信は、USB(Universal Serial Bus)やLAN(Local Area Network)等を用いた有線接続であってもよいし、WiFi(登録商標)等を用いた無線接続であってもよく、種々の変形実施が可能である。即ち、本実施形態における難易度情報131の取得処理とは、難易度情報131を作成する処理であってもよいし、異なる装置で作成された難易度情報131を通信により受信する処理であってもよい。
【0018】
ユーザー情報132についても同様である。ユーザー情報132が、情報処理装置100とは異なる装置において作成され、ユーザー情報取得部112は、当該異なる装置と通信を行うことによって、ユーザー情報132を受信する処理を行ってもよい。また難易度情報とユーザー情報の一方が情報処理装置100において作成され、他方が他の装置において作成されることも妨げられない。
【0019】
以上のように、本実施形態に係る取得部110は、情報の作成処理を行うプロセッサーにより実現されてもよいし、他の装置との通信を行う通信インターフェイスにより実現されてもよい。ここでのプロセッサーは、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、DSP(Digital Signal Processor)等、各種のプロセッサーを用いることが可能である。またプロセッサーは、ASIC(application specific integrated circuit)、FPGA(Field Programmable Gate Array)等のハードウェアを含んでもよい。また通信インターフェイスは、所与の通信方式に従った通信を行うインターフェイスであり、狭義には当該通信方式に従った通信を行うための回路を含む通信チップである。
【0020】
処理部120は、入力テキスト解析部121、難易度決定部122、習熟度決定部123、表示制御部124を含む。
【0021】
本実施形態の処理部120は、下記のハードウェアによって構成される。ハードウェアは、デジタル信号を処理する回路及びアナログ信号を処理する回路の少なくとも一方を含むことができる。例えば、ハードウェアは、回路基板に実装された1又は複数の回路装置や、1又は複数の回路素子によって構成できる。1又は複数の回路装置は例えばIC(Integrated Circuit)、FPGA等である。1又は複数の回路素子は例えば抵抗、キャパシター等である。
【0022】
また処理部120は、下記のプロセッサーによって実現されてもよい。本実施形態の情報処理装置100は、情報を記憶するメモリーと、メモリーに記憶された情報に基づいて動作するプロセッサーと、を含む。情報は、例えばプログラムと各種のデータ等である。プロセッサーは、ハードウェアを含む。プロセッサーは、CPU、GPU、DSP等、各種のプロセッサーを用いることが可能である。メモリーは、SRAM(Static Random Access Memory)、DRAM(Dynamic Random Access Memory)、フラッシュメモリなどの半導体メモリーであってもよいし、レジスタであってもよいし、ハードディスク装置(HDD:Hard Disk Drive)等の磁気記憶装置であってもよいし、光学ディスク装置等の光学式記憶装置であってもよい。例えば、メモリーはコンピューターによって読み取り可能な命令を格納しており、当該命令をプロセッサーが実行することによって、処理部120の各部の機能が処理として実現される。処理部120の各部とは、例えば入力テキスト解析部121、難易度決定部122、習熟度決定部123、表示制御部124である。ここでの命令は、プログラムを構成する命令セットの命令でもよいし、プロセッサーのハードウェア回路に対して動作を指示する命令であってもよい。なお、上述した取得部110がプロセッサーにより実現される場合、取得部110と処理部120は1つのプロセッサーにより実現されてもよいし、異なるプロセッサーにより実現されてもよい。
【0023】
入力テキスト解析部121は、入力テキストの解析処理を行うことによって、入力テキストからキーワードを抽出する。例えば入力テキスト解析部121は、自然言語処理における形態素解析を行ってもよい。なお形態素解析等の自然言語処理の手法は種々知られており、本実施形態ではそれらの手法を広く適用可能である。よって、入力テキストからキーワードを抽出する処理の詳細については説明を省略する。また
図4等を用いて後述するように、難易度情報131の作成処理の一部として、サンプルテキストのテキスト解析が行われる場合もある。よってテキスト解析を行う機能は、入力テキスト解析部121と難易度情報取得部111とで共通であってもよい。
【0024】
難易度決定部122は、入力テキストに含まれるキーワードと、難易度情報とに基づいて、キーワードの難易度を決定する。詳細については後述する。
【0025】
習熟度決定部123は、ユーザー情報に基づいて、ユーザーの習熟度を決定する。なおここでのユーザーとは、情報処理装置100にログインしているユーザーであってもよい。また情報処理装置100自体のログインとは別に、本実施形態に係るアプリケーションソフトウェア等へのログインが行われてもよい。ここでのユーザーは、アプリケーションソフトウェアにログインしているユーザーであってもよい。
【0026】
表示制御部124は、決定された難易度及び習熟度に基づいて、入力テキストの表示態様を決定する。具体的な表示態様については、
図10Bや
図10C等を用いて後述する。
【0027】
記憶部130は、処理部120のワーク領域であって、種々の情報を記憶する。記憶部130は、種々のメモリーによって実現が可能であり、メモリーは、半導体メモリーであってもよいし、レジスタであってもよいし、磁気記憶装置であってもよいし、光学式記憶装置であってもよい。
【0028】
記憶部130は、難易度情報131、ユーザー情報132、辞書情報133を記憶してもよい。難易度情報131はキーワードと難易度を対応付けた情報である。難易度情報の具体例については
図5を用いて後述する。ユーザー情報132はユーザーと習熟度を対応付けた情報である。ユーザー情報の具体例については
図8を用いて後述する。辞書情報133は、キーワードと、当該キーワードの読み方、説明等を対応付けた情報である。辞書情報133は、公知の国語辞書、英和辞書等であってもよい。
【0029】
表示部140は、画像を表示するディスプレイである。表示部140は、例えば液晶ディスプレイや有機ELディスプレイなどにより実現できる。表示部140は、処理部120の表示制御に基づいて、入力テキストを表示する。
【0030】
ユーザー入力受付部150は、ユーザー入力を受け付ける。ユーザー入力受付部150は、例えばキーボード、マウス、タッチパネル等の操作インターフェイスであってもよい。ユーザー入力に用いられる画面や、入力される情報の具体例については
図7A、
図7B、
図12A、
図12B等を用いて後述する。
【0031】
なお以上では情報処理装置100が、入力テキストを表示する表示部140を有するデバイスである例を説明したが、本実施形態の手法はこれには限定されない。例えば、本実施形態の情報処理装置100は、表示部を有するデバイス(例えばPC等)と接続される機器であってもよく、例えばサーバシステムであってもよい。例えばサーバシステムは入力テキストの表示態様を決定する処理を行い、PC等のデバイスは、サーバシステムにおける制御に基づいて、当該入力テキストを表示部に表示する。また本実施形態の情報処理装置100の機能は、複数のデバイスの分散処理によって実現されてもよい。例えば、PCとサーバシステムが連携して処理を行うことによって、本実施形態の情報処理装置100が実現されてもよい。その他、本実施形態の情報処理装置100の具体的な構成は、種々の変形実施が可能である。
【0032】
また、本実施形態の情報処理装置100(狭義には取得部110、処理部120)が行う処理の一部又は全部は、プログラムによって実現されてもよい。本実施形態に係るプログラムは、例えばコンピューターによって読み取り可能な媒体である非一時的な情報記憶媒体(情報記憶装置)に格納できる。情報記憶媒体は、例えば光ディスク、メモリーカード、HDD、或いは半導体メモリーなどによって実現できる。半導体メモリーは例えばROMである。情報処理装置100は、情報記憶媒体に格納されるプログラムに基づいて本実施形態の種々の処理を行う。即ち情報記憶媒体は、情報処理装置100の各部としてコンピューターを機能させるためのプログラムを記憶する。コンピューターは、入力装置、処理部、記憶部、出力部を備える装置である。具体的には本実施形態に係るプログラムは、
図3、
図4、
図6、
図9、
図11等を用いて後述する各ステップを、コンピューターに実行させるためのプログラムである。
【0033】
また本実施形態の手法は、以下の各ステップを含む情報処理方法に適用できる。情報処理方法は、キーワードに対して、当該キーワードの難易度が対応付けられた難易度情報、及び、ユーザーに対して、当該ユーザーの習熟度が対応付けられたユーザー情報を取得するステップと、入力テキストと難易度情報に基づいて、入力テキストに含まれるキーワードの難易度を求めるステップと、ユーザー情報に基づいて、ユーザーの習熟度を求めるステップと、難易度と習熟度に基づいて、入力テキストの表示態様を制御するステップと、を含む。
【0034】
2.処理の流れ
図3は、情報処理装置100における処理を説明するフローチャートである。まずステップS101において、取得部110は、入力テキストの表示制御に先立って難易度情報131及びユーザー情報132を取得する。
【0035】
ステップS102において、処理部120は、入力テキストを取得し、当該入力テキストと、ステップS101で取得した難易度情報131及びユーザー情報132に基づいて、入力テキストの表示態様を決定する。またステップS102において、処理部120は、決定した表示態様を用いて入力テキストの表示処理を実行する。
【0036】
ステップS103において、表示内容に対するユーザーのフィードバック等に基づいて、難易度情報及びユーザー情報の更新処理が行われる。ステップS103の処理は、例えば難易度情報取得部111及びユーザー情報取得部112によって行われる。
【0037】
なお
図3では省略しているが、入力テキストの取得状況に応じて、ステップS102の処理が繰り返し実行されてもよい。以下、各ステップについて詳細に説明する。
【0038】
2.1 難易度情報及びユーザー情報の取得
図4は、
図3のステップS101における難易度情報131の取得処理を説明するフローチャートであリ、特に、難易度情報取得部111が難易度情報131を作成する場合の処理の例を表す。上述したように、以下の処理が情報処理装置100とは異なる装置において実行され、難易度情報取得部111は、当該異なる装置から難易度情報131を受信してもよい。
【0039】
例えば取得部110(難易度情報取得部111)は、サンプルテキストにおけるキーワードの出現頻度に基づいて、難易度情報を求めてもよい。このようにすれば、具体的なテキストの中で各キーワードがどの程度用いられているかに基づいて、各キーワードの難易度を推定できる。
【0040】
ここでのサンプルテキストとは、難易度情報の作成に用いられるテキストである。サンプルテキストは、インターネット等を用いて取得されるWebページのテキストであってもよいし、学術論文であってもよいし、教科書等の書籍をデジタル化したデータであってもよく、種々のテキストデータを利用可能である。またサンプルテキストは、日本語、英語等、種々の言語のテキストを含んでもよい。
【0041】
例えば
図4のステップS201において、難易度情報取得部111は、サンプルテキストを取得する。ステップS202において、難易度情報取得部111は、サンプルテキストに基づいて、当該サンプルテキストに含まれるキーワードの難易度を算出する。
【0042】
例えばステップS202において、難易度情報取得部111は、サンプルテキストに対して形態素解析等を行い、サンプルテキストをキーワード(単語)に分割し、各キーワードの出現回数をカウントする。例えば難易度情報取得部111は、出現回数を変数xとしたとき、xの値が大きいほど値が小さくなる関数fを用いて難易度を求めてもよい。換言すれば、x1<x2を満たす2つの数x1及びx2を考えたとき、fは、f(x1)≧f(x2)を満たす関数である。例えば出現回数がxであるキーワードの難易度の値は、f(x)であってもよい。またここでのxは出現回数そのものに限定されず、出現頻度であってもよい。
【0043】
またテキストマイニングの分野においては、tf-idfを用いた手法が知られている。tf(term frequency)はテキスト内における単語の出現頻度を表す指標である。idf(inverse document frequency)は、複数のテキストの中で対象の単語を含む文書がどれだけ少ないかを表す指標である。tf-idfでは例えばtfとidfの値の積を用いて、各単語のスコアが算出される。本実施形態における出現頻度とは、tf-idfを用いて求められるスコア等、出現頻度に基づく情報を広く含んでもよい。例えば上述した関数f(x)を用いて難易度を求める際に、xの値としてtf-idfによって求められるスコアが用いられてもよい。
【0044】
例えば、あるキーワード「abc」について、サンプルテキストでの出現頻度xがx_abcであったとすると、難易度情報取得部111は、当該キーワード「abc」の難易度をf(x_abc)により求める。またあるキーワード「def」について、サンプルテキストでの出現頻度xがx_defであったとすると、難易度情報取得部111は、当該キーワード「def」の難易度をf(x_def)により求める。他のキーワードについても同様である。fをxの増加に伴って減少する関数とすることによって、出現頻度が低いキーワードの難易度が高くなりやすくなる。即ち、テキストを閲覧していてあまり目にする機会のないキーワードの難易度が高くなるため、難易度を適切に設定することが可能である。なお、ここでは関数fを用いる手法を例示したがこれには限定されない。例えば記憶部130は、出現頻度と難易度を対応付けるテーブルを記憶しており、難易度情報取得部111は、当該テーブルと出現頻度に基づいて、各キーワードの難易度を求めてもよい。
【0045】
ステップS203において、難易度情報取得部111は、難易度情報131のレコードの作成または更新を行う。
図5は難易度情報131のデータ構造の例を示す図である。
図5に示すように、難易度情報131は、キーワードを表す文字列と、難易度を表す数値とを含むレコードの集合であってもよい。
【0046】
例えばステップS202において、難易度情報取得部111は、キーワード「abc」の難易度が0.5であると判定したとする。この場合、難易度情報取得部111は、難易度情報131に(キーワード,難易度)=(abc,0.5)というレコードを追加する処理を行う。また既にキーワード「abc」に関するレコードが存在する場合、難易度情報取得部111は、新たに求めた難易度を用いて当該レコードを更新する処理を行ってもよい。例えば、難易度情報131に(キーワード,難易度)=(abc,0.3)というレコードが既に存在した場合、難易度情報取得部111は、当該レコードを(abc,0.5)に置き換える処理を行う。なお、新たに求められた難易度と、既存の難易度の平均値等に基づいて新たな難易度が求められてもよく、レコードの更新手法は種々の変形実施が可能である。
【0047】
また取得部110(難易度情報取得部111)は、試験におけるキーワードに関する問題の正解率に基づいて、難易度情報を求めてもよい。例えばステップS201において、難易度情報取得部111は、試験結果を取得する。試験結果とは、例えば試験問題と、当該問題の正答率を対応付けた情報である。このようにすれば、キーワードに関する理解を問う問題の正答率を用いることができるため、難易度を精度よく算出することが可能になる。
【0048】
ステップS202において、難易度情報取得部111は、試験結果に基づいてキーワードの難易度を求める。例えば難易度情報取得部111は、問題文に含まれるキーワードを抽出することによって、キーワードと問題を対応付ける処理を行う。難易度情報取得部111は、特定のキーワードの意味を問う問題を当該キーワードと対応付けてもよいし、問題文に特定のキーワードが含まれる問題を当該キーワードと対応付けてもよい。1つのキーワードに対応付けられた問題が複数存在する場合、難易度情報取得部111は、当該複数の問題のそれぞれの正答率の平均値や中央値等を求めることによって、当該キーワードに関する正答率を求めてもよい。例えば正答率が0以上1以下の数値データである場合、難易度情報取得部111は、(1-正答率)の値を難易度としてもよい。また難易度情報取得部111は、正答率が低いほど難易度が高くなるような関数やテーブルデータを用いて、難易度を求めてもよい。
【0049】
難易度が求められた後のステップS203の処理については、サンプルテキストを用いる場合と同様である。
【0050】
なお、難易度情報取得部111は、サンプルテキストと試験結果の一方を用いて難易度を求めてもよいし、この両方を用いて難易度を求めてもよい。両方を用いる場合、難易度情報取得部111は、それぞれから求められた難易度の重み付け平均等から最終的な難易度を決定してもよいし、出現頻度と正答率を引数とする何らかの関数等を用いて難易度を求めてもよく、具体的な手法は種々の変形実施が可能である。
【0051】
図6は、
図3のステップS101におけるユーザー情報132の取得処理を説明するフローチャートであリ、特に、ユーザー情報取得部112がユーザー情報132を作成する場合の処理の例を表す。上述したように、以下の処理が情報処理装置100とは異なる装置において実行され、ユーザー情報取得部112は、当該異なる装置からユーザー情報132を受信してもよい。
【0052】
まずステップS301において、ユーザー情報取得部112は、ユーザー入力を取得する。具体的には、ユーザー入力受付部150がユーザーの能力に関する操作入力を受け付け、その結果をユーザー情報取得部112に出力する。
【0053】
例えばユーザー入力受付部150は、ユーザーの学歴、職歴、自認するレベル、及び所定言語の言語圏での在住履歴の少なくとも1つを含む項目に関するユーザー入力を受け付けてもよい。取得部110(ユーザー情報取得部112)は、当該ユーザー入力に基づいてユーザー情報を求める。このようにすれば、テキストを理解する上での習熟度に関連しうる客観的な事実(学歴、職歴、在住履歴)や、ユーザー自身の主観的な判断(自認するレベル)を取得できるため、対象ユーザーの習熟度を精度よく判定できる。
【0054】
図7A、
図7Bは、ユーザー入力を受け付ける際に表示部140に表示される画面例である。
図7Aは、例えば学歴に関するユーザー入力を受け付ける画面例である。
図7Aに示す画面は、学歴の入力を促すテキストと、学歴を入力するためのテキストボックスを含んでもよい。また学歴の入力には「高卒」、「短大卒」、「大卒」、「修士課程修了」等の候補のうち、何れかを選択するためのプルダウンメニュー等が用いられてもよい。
【0055】
図7Bは、例えば自認するレベルに関するユーザー入力を受け付ける画面例である。
図7Bに示す画面は、初級、中級、上級の何れかを選択するラジオボタンを含んでもよい。ユーザー入力受付部150は、ユーザーが自認するレベルが初級、中級、上級の何れであるかを特定するユーザー入力を受け付ける。
【0056】
また上述したように、ユーザー入力受付部150は職歴や在住履歴に関するユーザー入力を受け付けてもよい。例えばユーザー入力受付部150は、在籍した企業等の産業分類、勤続年数等のユーザー入力を受け付ける。またユーザー入力受付部150は、例えば英語圏での在住履歴の入力を促す画面に基づいて、滞在国、滞在期間等に関するユーザー入力を受け付ける。またユーザー入力受付部150は、英語検定等の認定結果、TOEIC(Test of English for International Communication)やTOEFL(Test of English as a Foreign Language)のスコア等、広く用いられる認定試験、資格試験の結果に関するユーザー入力を受け付けてもよい。
【0057】
図6のステップS302において、ユーザー情報取得部112は、ユーザー入力に基づいて対象ユーザーの習熟度を決定する。例えばユーザー情報取得部112は、学歴に関するユーザー入力を取得した場合、学歴が高いほど習熟度が高くなるように、対象ユーザーの習熟度を決定する。またユーザー情報取得部112は、職歴が長いほど習熟度を高くしてもよいし、職歴における業種や業務内容(研究開発、営業、経理等)に基づいて習熟度を判定してもよい。またユーザー情報取得部112は、自認するレベルが高いほど、習熟度を高く判定する。またユーザー情報取得部112は、所定言語圏での滞在期間が長いほど習熟度を高く判定してもよい。またユーザー情報取得部112は、具体的な滞在目的や、現地での就業・就学状況等に基づいて習熟度を判定してもよい。ユーザー情報取得部112は、上述した種々のユーザー入力のうち、何れか1つに基づいて習熟度を判定してもよいし、2以上の組み合わせに基づいて習熟度を判定してもよい。2以上を組み合わせる際、各習熟度の重み付け平均等が用いられてもよいし、関数やテーブルデータが用いられてもよい点は難易度を求める場合と同様である。
【0058】
ステップS303において、ユーザー情報取得部112は、ユーザー情報132のレコードの作成または更新を行う。
図8はユーザー情報132のデータ構造の例を示す図である。
図8に示すように、ユーザー情報132は、ユーザーを表す値(例えば氏名を表す文字列)と、習熟度を表す数値とを含むレコードの集合であってもよい。
【0059】
例えばステップS302において、ユーザー情報取得部112は、ユーザーAの習熟度が0.3であると判定したとする。この場合、ユーザー情報取得部112は、ユーザー情報132に(ユーザー,習熟度)=(A,0.3)というレコードを追加する処理を行う。また既にユーザーAに関するレコードが存在する場合、ユーザー情報取得部112は、新たに求めた習熟度を用いて当該レコードを更新する処理を行ってもよい。
【0060】
なお
図5及び
図8では、難易度と習熟度はいずれも0以上1以下の値となるように正規化された例を示している。ただし、難易度及び習熟度の表現は種々の変形実施が可能である。例えば難易度の取り得る数値範囲と、習熟度の取り得る数値範囲は異なってもよい。また難易度と習熟度の少なくとも一方は、例えば複数の段階の何れの段階であるかを特定する離散的なデータであってもよい。
【0061】
なお以上ではユーザー入力に基づいてユーザー情報132を作成する処理を説明したがこれには限定されない。例えば、他のアプリケーションやシステムにおいて、ユーザーの学歴、職歴、TOEIC等のスコア、試験結果等がデータベース化されている場合がある。例えば企業に属するユーザーであれば人事データとしてこれらのデータがユーザーIDと対応付けられている場合もある。またユーザーが利用するSNS等において、プロフィール欄にこれらの情報が入力されている場合もある。よってユーザー情報取得部112は、これらのアプリケーションやシステムのデータベースにアクセスすることによって、ユーザー情報を作成するためのデータを取得してもよい。この場合、ユーザー入力を省略できるため、ユーザーの操作負担の軽減等が可能である。また、ユーザー入力とデータベースを用いた検索の両方に基づいてユーザー情報が作成されてもよい。
【0062】
2.2 表示制御
次に
図3のステップS102で実行される入力テキストの具体的な表示制御の例について説明する。
図9は、ステップS102における情報処理装置100の処理を説明するフローチャートである。
【0063】
まずステップS401において、取得部110は入力テキストを取得する。例えば取得部110は、
図2には不図示の入力テキスト取得部を含んでもよい。入力テキスト取得部は、会議システム、Webブラウザ等から表示対象となるテキストを、入力テキストとして取得し、入力テキスト解析部121に出力する。
【0064】
ステップS402において、入力テキスト解析部121は、入力テキストに対する形態素解析等を行うことによって、入力テキストに含まれるキーワードを抽出する。
【0065】
ステップS403において、難易度決定部122は、入力テキストと難易度情報131に基づいて、入力テキストに含まれるキーワードの難易度を決定する。具体的には、難易度決定部122は、入力テキスト解析部121の解析結果に基づいて、入力テキストに含まれる1または複数のキーワードを特定し、当該キーワードのそれぞれについて、難易度情報131から対応するレコードを読み出すことによって、難易度を求める。例えば
図5に示す難易度情報131が取得済であり、入力テキストにキーワード「abc」及び「def」が含まれる場合、「abc」の難易度が0.5、「def」の難易度が0.8と決定される。
【0066】
ステップS404において、習熟度決定部123は、ユーザーの習熟度を求める。例えば習熟度決定部123は、情報処理装置100そのもの、または、本実施形態に係るアプリケーションソフトウェアにログインしているユーザーを特定し、ユーザー情報132から対応するレコードを読み出すことによって、習熟度を求める。例えば
図8に示すユーザー情報132が取得済であり、ユーザーAがログインしていると判定された場合、習熟度は0.3と決定される。
【0067】
ステップS405において、表示制御部124は、難易度と習熟度に基づいて入力テキストの表示態様を決定する。ステップS406において、表示制御部124は、決定した表示態様を用いて入力テキストを表示部140に表示する制御を行う。以下、表示態様の例について説明する。
【0068】
例えば処理部120(表示制御部124)は、難易度および習熟度に基づいて、入力テキストに含まれるキーワードのなかから、ユーザーにとって難解であると推定される不明語を特定してもよい。処理部120は、不明語に対して付加される付加情報を、不明語に対応付けて表示する制御を行う。このようにすれば、対象のユーザーにとって難解と推定される不明語を適切に特定すること、及び、当該不明語に付加情報を表示することで、ユーザーの理解をサポートすることが可能になる。
【0069】
例えば表示制御部124は、入力テキストに含まれるキーワードの難易度と、ユーザーの習熟度を比較し、難易度が習熟度よりも大きい場合に、対象のキーワードを不明語と判定してもよい。
図5及び
図8の例であれば、キーワード「abc」の難易度の値である0.5、及びキーワード「def」の難易度の値である0.8は、いずれもユーザーAの習熟度の値である0.3より大きい。よって対象ユーザーがユーザーAである場合、「abc」と「def」の両方が不明語と判定される。またユーザーBを対象とした場合、キーワード「abc」の難易度の値である0.5は、ユーザーBの習熟度の値である0.7以下であるため、「abc」は不明語と判定されない。一方、キーワード「def」の難易度の値である0.8は、ユーザーBの習熟度の値である0.7より大きいため、「def」はユーザーBにとって不明語であると判定される。なお、ここでは難易度と習熟度の値を単純に比較する例を示したが、不明語の判定手法はこれに限定されず、種々の変形実施が可能である。例えば表示制御部124は、難易度及び習熟度を引数とする関数を用いて判定スコアを求め、当該判定スコアと所与の閾値の比較処理に基づいて不明語を判定してもよい。
【0070】
図10Aは、入力テキストの表示画面の例であって、付加情報が付加される前の画面例を表す。
図10Aの画面は例えば会議システムにおける表示画面の例であり、発表者が提示する資料に含まれるテキストに対応するオブジェクトOB1と、参加者を撮像した撮像画像等に対応するオブジェクトOB2と、当該参加者の発話内容が自動で書き起こしされたテキストに対応するオブジェクトOB3が表示される。なお、
図10Aは会議システムにおける表示画面の一例であり、具体的な画面構成は種々の変形実施が可能である。
【0071】
本実施形態の手法では、例えばオブジェクトOB1に含まれるテキスト、及び、オブジェクトOB3に含まれるテキストが入力テキストとして用いられる。例えば表示制御部124は、ステップS405の処理によって、「先物」及び「需給逼迫」の2つのキーワードが、対象ユーザーにとっての不明語であると判定した。
【0072】
図10Bは、不明語に対して付加情報が付加された場合の、入力テキストの表示画面の例である。
図10Bの例では、「先物」という不明語に対して、当該不明語の意味を説明する説明情報が付加情報として付加される。例えば
図10BのオブジェクトOB4が「先物」の付加情報の一例である。例えば表示制御部124は、記憶部130に記憶された辞書情報133を対象として、不明語である「先物」を検索ワードとする検索処理を行うことによって、当該不明語の説明情報を取得する。
【0073】
また、
図10Bに示すように、「先物」という不明語に対して、当該不明語の読み方を表すルビが付加情報として付加されてもよい。例えば
図10BのオブジェクトOB5に示すルビ「さきもの」は、「先物」という不明語に付加される付加情報の一例である。
図10Bに示すように、付加情報を不明語に対応付けて表示することによって、ユーザーによる入力テキストの理解をサポートできる。なお、不明語に対応付けた表示とは、不明語の近傍に表示することであってもよいし、不明語から引出線を引いて表示することであってもよいし、他の手法を用いた表示であってもよい。
【0074】
図10Bの例では、同様に、「需給逼迫」という不明語に対して、当該不明語の意味を説明する説明情報が付加情報として付加される。例えば
図10Bに示すオブジェクトOB6が、「需給逼迫」に関する説明情報に対応する。この例では、話者の発話内容の書き起こしという短期的に表示される入力テキストについても、適切な付加情報を付与することでユーザーの理解をサポートすることが可能である。
【0075】
また付加情報は、ユーザーの母国語とは異なる言語を用いた入力テキストを対象とする場合に、不明語を母国語に翻訳した翻訳結果であってもよい。例えば、日本語を母国語とするユーザーが英語の入力テキストを閲覧する場合に、難解な英単語や英熟語の日本語訳が付加情報として表示されてもよい。当然、ここでの日本語、英語は言語の一例であり、他の言語が用いられてもよい。
【0076】
図10Cは、表示態様が変更された入力テキストの表示画面の他の例である。
図10Cは、Webブラウザ等を用いてWebページを表示する画面の例であるが、入力テキストを表示するアプリケーションに種々の変形実施が可能であることは上述したとおりである。
図10Cにおける入力テキストは
図10AのオブジェクトOB1と同様であり、付加情報である説明情報(オブジェクトOB8)及びルビ(オブジェクトOB7)については、
図10Bと同様である。
【0077】
図10Cに示すように、処理部120(表示制御部124)は、不明語を、不明語以外の語句の表示態様とは異なる表示態様を用いて表示する制御を行ってもよい。例えば表示制御部124は、不明語を、不明語以外の語句のフォントとは異なるフォントを用いて表示する制御を行ってもよい。例えば
図10Cでは、不明語であるキーワード「先物」が、入力テキストのそれ以外の語句に比べて太いフォントで表示されている。これにより、不明語の視認性を高くすることが可能である。なおフォントの変更は太さを変更するものに限定されず、文字の色が変更されてもよいし、文字のサイズが変更されてもよいし、文字が斜体で表現されてもよい。また
図10Cに示すように、不明語にアンダーラインが付加されてもよい。また不明語に対してマーカーの付加(背景色の変更)が行われてもよい。
【0078】
また不明語に関する表示制御は、説明情報、ルビ、フォント、翻訳結果に限定されない。例えば、
図10AのオブジェクトOB3に示したように、入力テキストとして字幕が表示される場合がある。ここでの字幕は、会議等における発話がリアルタイムでテキストに変換される情報であってもよいし、映画等の映像コンテンツのように、当該映像コンテンツに予め含まれる情報であってもよい。なお発話内容の書き起こしとしては音声認識処理、自然言語処理を組み合わせた手法が種々知られており、本実施形態ではそれらを広く適用可能である。また書き起こし処理は情報処理装置100とは異なる装置において実行されてもよい。
【0079】
処理部120(表示制御部124)は、難易度および習熟度に基づいて、入力テキストがユーザーにとって難解であると推定された場合、入力テキストがユーザーにとって平易であると推定された場合に比べて、入力テキストの表示時間を長くする制御を行ってもよい。
【0080】
この制御は、上記のように字幕の表示等に好適である。話者による発話はある程度継続して行われることが想定される。また字幕の表示領域はある程度決まっていることから、字幕である入力テキストは一定時間経過等の条件が満たされた場合に非表示となることが想定される。その点、入力テキストがユーザーにとって難解である場合に相対的に表示時間を長くすることによって、ユーザーが入力テキストを閲覧する時間を長くできる。結果として、ユーザーによる入力テキストの理解をサポートできる。この際、字幕の表示領域のサイズを一時的に拡張する等、他の表示制御が合わせて実行されてもよい。
【0081】
なお入力テキストが難解か否かの判定は、当該入力テキストに含まれるキーワードの難易度に基づいて決定される。例えば、表示制御部124は、入力テキストに含まれる複数のキーワードの難易度のうち、最も高い難易度を当該入力テキストの難易度としてもよい。あるいは表示制御部124は、入力テキストに含まれる複数のキーワードの難易度の平均値等を演算することによって、入力テキストの難易度を求めてもよい。表示制御部124は、求められた入力テキストの難易度とユーザーの習熟度に基づいて、入力テキストがユーザーにとって難解か否かを推定する。なお、ここでの推定は難解か平易かの2段階に限定されるものではなく、3段階以上の判定が行われてもよい。また表示制御部124は、入力テキストの表示時間を3段階以上で調整してもよい。
【0082】
以上のように、本実施形態における表示態様の制御は、付加情報、フォント、表示速度等、種々の制御により実現できる。本実施形態では、予めいずれの制御を行うかが決定されていてもよい。あるいは、ユーザー入力に基づいて、その都度、何れの制御を行うかが決定されてもよい。また、処理部120が自動的にいずれの制御を行うかを決定してもよい。例えば表示制御部124は、難易度と習熟度の差が所定閾値以下の場合には第1表示制御を行い、難易度と習熟度の差が所定閾値より大きい場合には第2表示制御を行ってもよい。ここで第2表示制御は、例えば第1表示制御に比べてユーザーにとって分かりやすい表示態様による制御である。例えば第1表示制御は、付加情報、フォント、表示速度等のうちの何れか1つを用いた制御であり、第2表示制御は、これらのうちの2以上を用いた制御であってもよい。また表示制御部124は、入力テキストに含まれるキーワードや、入力テキストの分野に基づいて、具体的な表示態様を決定する処理を行ってもよい。その他、本実施形態における具体的な表示態様の決定は、種々の手法により実現できる。
【0083】
2.3 難易度情報及びユーザー情報の更新
次に
図3のステップS103で実行される難易度情報131及び/またはユーザー情報132の更新処理の例について説明する。
図11は、ステップS103における更新処理を説明するフローチャートである。
【0084】
まずステップS501において、取得部110はステップS102における表示制御に対するユーザーのフィードバックを取得する。例えばユーザー入力受付部150は、入力テキストの表示後に、表示内容の評価に関するユーザー入力を受け付けてもよい。このようにすれば、説明情報、ルビ、フォント、翻訳結果、表示時間等に関する表示が適切であったか否かに関するフィードバックを取得できる。フィードバックを取得することによって、例えば表示によるサポートが不足しているのか、適量であるのか、サポートが過剰であるのか等を判定することが可能になる。
【0085】
例えばステップS502において、取得部110(難易度情報取得部111及び/またはユーザー情報取得部112)は、表示内容の評価に関するユーザー入力に基づいて、難易度情報及びユーザー情報の少なくとも一方を更新する。例えばサポートが不足している旨のフィードバックが取得された場合、よりサポートが充実する方向の更新処理が実行される。例えば、サポートが不足しているのはユーザーの習熟度を高く見積もってしまったためである可能性があるため、ユーザー情報取得部112は、対象のユーザーの習熟度を下げる処理を実行する。一方、サポートが過剰である旨のフィードバックが取得された場合、サポートを減らす方向の更新処理が実行される。例えば、サポートが過剰であるのはユーザーの習熟度を低く見積もってしまったためである可能性があるため、ユーザー情報取得部112は、対象のユーザーの習熟度を上げる処理を実行する。具体的には、ステップS503において、ユーザー情報取得部112は、ユーザー情報132のうち、対象のユーザーに対応するレコードの習熟度の値を更新する。
【0086】
また、同じ又は類似する入力テキストに対して、複数のユーザーからサポートが不足する旨のフィードバックがあった場合、ユーザーの習熟度を高く見積もってしまったのではなく、入力テキストに含まれるキーワードの難易度を低く見積もってしまった可能性もある。よって難易度情報取得部111は、サポートが不足する旨のフィードバックがあった場合、入力テキストに含まれるキーワードの難易度を高くする更新処理を実行してもよい。ここで入力テキストに含まれるキーワードとは、不明語と判定されたキーワードであってもよいし、不明語ではないと判定されたキーワードであってもよいし、この両方であってもよい。同様に、難易度情報取得部111は、サポートが過剰である旨のフィードバックがあった場合、入力テキストに含まれるキーワードの難易度を低くする更新処理を実行してもよい。具体的には、ステップS503において、難易度情報取得部111は、難易度情報131のうち、入力テキストに含まれるキーワードに対応するレコードの難易度の値を更新する。
【0087】
図12A、
図12Bは、ステップS501に示したフィードバックの取得処理に用いられるユーザー入力の受付画面の例である。
図12Aに示すように、ユーザー入力受付部150は、入力テキスト及び付加情報の表示後に、付加情報が十分であったか否かに関するユーザー入力を受け付けてもよい。
図12Aの例では、提示が十分であるか否かを問い合わせるテキストと、yesまたはnoを選択可能なラジオボタンが表示される。取得部110は、ユーザー入力に基づいて、難易度情報及びユーザー情報の少なくとも一方を更新する。例えばyesが選択された場合、ユーザー情報取得部112が、対象のユーザーの習熟度を上げる更新処理を実行してもよいし、難易度情報取得部111が、入力テキストに含まれるキーワードの難易度を下げる更新処理を実行してもよいし、この両方が行われてもよい。またnoが選択された場合、ユーザー情報取得部112が、対象のユーザーの習熟度を下げる更新処理を実行してもよいし、難易度情報取得部111が、入力テキストに含まれるキーワードの難易度を上げる更新処理を実行してもよいし、この両方が行われてもよい。
【0088】
また
図12Bに示すように、ユーザー入力受付部150は、入力テキスト及び付加情報の表示後に、不明語を知っていたか否かに関するユーザー入力を受け付けてもよい。
図12Bの例では、提示ワード(不明語に対応)が既知であるか否かを問い合わせるテキストと、yesまたはnoを選択可能なラジオボタンが表示される。yesが選択された場合、ユーザーにとって不要な情報を表示していたことになる。よってyesが選択された場合、ユーザー情報取得部112が、対象のユーザーの習熟度を上げる更新処理を実行してもよいし、難易度情報取得部111が、入力テキストに含まれるキーワードの難易度を下げる更新処理を実行してもよいし、この両方が行われてもよい。またnoが選択された場合、ユーザー情報取得部112が、対象のユーザーの習熟度を下げる更新処理を実行してもよいし、難易度情報取得部111が、入力テキストに含まれるキーワードの難易度を上げる更新処理を実行してもよいし、この両方が行われてもよい。
【0089】
2.4 変形例
図13はユーザー情報の他の例である。
図13に示すように、ユーザー情報は、ユーザー、分野、及び習熟度が対応付けられたレコードの集合であってもよい。
図13の例ではユーザーAの習熟度として、医療分野における習熟度と、英語分野における習熟度の2つが記憶されている。当然、1人のユーザーに対して3以上の分野が対応付けられてもよい。また他のユーザーについても同様に、分野に応じた習熟度が記憶される。
【0090】
このようにユーザー情報は、分野に応じたユーザーの習熟度を表す情報を含んでもよい。そして処理部120(習熟度決定部123)は、
図9のステップS404において、入力テキストが属する分野を特定する処理を行い、入力テキストが属する分野とユーザー情報に基づいて、習熟度を求めてもよい。このように、入力テキストの分野に応じて習熟度を決定することによって、分野に応じた習熟度の違いを考慮できるため、習熟度を精度よく求めることが可能になる。結果として、不明語の判定等の精度向上が可能になる。
【0091】
例えば習熟度決定部123は、入力テキストに対するテキスト解析処理を行うことによって当該入力テキストの分野を特定してもよい。例えば習熟度決定部123は、所定のテキストに含まれる複数のキーワードについて、上述したtf-idfを求めることによって、当該テキストのベクトル表現を求めてもよい。ここでのベクトル表現は、キーワード数に相当する次元を有し、各要素の値がtf-idfを用いて求められたキーワードのスコアとなるベクトルである。習熟度決定部123は、テキスト間のベクトルの類似度(例えば内積)に基づいてテキスト間の類似度を求めてもよい。例えば習熟度決定部123は、入力テキストから求められるベクトルと、それぞれが異なる分野に属する複数の参考テキストのベクトルとの比較処理を行うことによって、入力テキストの分野を特定する処理を行ってもよい。
【0092】
あるいは、入力テキストに対して、メタデータとして分野を特定する情報が対応付けられてもよい。例えば入力テキストが会議システムにおいて発表者が提供する資料である場合、発表者や会議の主催者が、当該資料に対して分野を表すメタデータを付与してもよい。あるいは会議の内容(例えば特定の学会発表等)に基づいて、会議システムが分野を示すメタデータを自動的に付与してもよい。
【0093】
またテキストの言語を自動判定する手法は広く知られており、習熟度決定部123は、言語の判定結果に基づいて入力テキストの分野を判定してもよい。以上のように、入力テキストの分野を特定する処理とは、テキスト解析であってもよいし、メタデータの読取りであってもよいし、言語の判定であってもよいし、これ以外の処理であってもよい。
【0094】
習熟度決定部123は、ユーザー情報と、特定された入力テキストの分野に基づいてユーザーの習熟度を判定する。例えば
図13のユーザー情報が取得されている場合であって、分野が医療と判定された入力テキストをユーザーAに提示する場合、ユーザーの習熟度は0.3であると判定される。同様に、分野が英語と判定された入力テキストをユーザーAに提示する場合、ユーザーの習熟度は0.8であると判定される。
【0095】
なお
図13に示すような分野に関する情報を含むユーザー情報を用いる場合、ユーザー情報取得部112は、当該ユーザー情報を求める際に分野に関する情報を取得する。例えばユーザー入力受付部150は、学歴に関するユーザー入力を受け付ける際に、専門分野の入力を受け付けてもよい。ユーザー情報取得部112は、例えば専門分野での習熟度を高く判定し、それ以外の分野での習熟度を相対的に低く判定してもよい。
【0096】
同様に、ユーザー入力受付部150は、職歴に関するユーザー入力を受け付ける際に、業種や職務内容の入力を受け付けてもよい。ユーザー情報取得部112は、例えば業種に対応する分野での習熟度を高く判定し、それ以外の分野での習熟度を相対的に低く判定してもよい。
【0097】
またユーザー入力受付部150は、母国語と異なる言語圏での在住履歴に関するユーザー入力を受け付ける際に、具体的な言語の入力を受け付けてもよい。ユーザー情報取得部112は、英語圏での在住履歴に基づいて英語分野での習熟度を判定し、フランス語圏での在住履歴に基づいてフランス語分野での習熟度を判定する。その他の言語についても同様である。
【0098】
また
図3のステップS103におけるユーザー情報の更新処理においても、分野が考慮されてもよい。例えば医療分野の入力テキストの表示に対してフィードバックが行われた場合、ユーザー情報取得部112は、対象ユーザーの医療分野に関する習熟度を更新し、他の分野に関する習熟度の更新をスキップしてもよい。ただし、分野間の関連度合いを考慮し、所与の分野の入力テキストの表示に対してフィードバックが行われた場合、ユーザー情報取得部112が、対象ユーザーの他の分野に関する習熟度を更新することも妨げられない。
【0099】
なお、上記のように本実施形態について詳細に説明したが、本実施形態の新規事項および効果から実体的に逸脱しない多くの変形が可能であることは当業者には容易に理解できるであろう。従って、このような変形例はすべて本開示の範囲に含まれるものとする。例えば、明細書又は図面において、少なくとも一度、より広義または同義な異なる用語と共に記載された用語は、明細書又は図面のいかなる箇所においても、その異なる用語に置き換えることができる。また本実施形態及び変形例の全ての組み合わせも、本開示の範囲に含まれる。また情報処理装置等の構成及び動作等も、本実施形態で説明したものに限定されず、種々の変形実施が可能である。
【符号の説明】
【0100】
100…情報処理装置、110…取得部、111…難易度情報取得部、112…ユーザー情報取得部、120…処理部、121…入力テキスト解析部、122…難易度決定部、123…習熟度決定部、124…表示制御部、130…記憶部、131…難易度情報、132…ユーザー情報、133…辞書情報、140…表示部、150…ユーザー入力受付部、OB1-OB8…オブジェクト