IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ カシオ計算機株式会社の特許一覧

特許7379968学習支援装置、学習支援方法及びプログラム
<>
  • 特許-学習支援装置、学習支援方法及びプログラム 図1
  • 特許-学習支援装置、学習支援方法及びプログラム 図2
  • 特許-学習支援装置、学習支援方法及びプログラム 図3
  • 特許-学習支援装置、学習支援方法及びプログラム 図4
  • 特許-学習支援装置、学習支援方法及びプログラム 図5
  • 特許-学習支援装置、学習支援方法及びプログラム 図6
  • 特許-学習支援装置、学習支援方法及びプログラム 図7
  • 特許-学習支援装置、学習支援方法及びプログラム 図8
  • 特許-学習支援装置、学習支援方法及びプログラム 図9
  • 特許-学習支援装置、学習支援方法及びプログラム 図10
  • 特許-学習支援装置、学習支援方法及びプログラム 図11
  • 特許-学習支援装置、学習支援方法及びプログラム 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-11-07
(45)【発行日】2023-11-15
(54)【発明の名称】学習支援装置、学習支援方法及びプログラム
(51)【国際特許分類】
   G09B 5/04 20060101AFI20231108BHJP
   G09B 19/06 20060101ALI20231108BHJP
   G10L 21/057 20130101ALI20231108BHJP
   G10L 21/0364 20130101ALI20231108BHJP
   G06F 3/16 20060101ALI20231108BHJP
【FI】
G09B5/04
G09B19/06
G10L21/057
G10L21/0364
G06F3/16 540
【請求項の数】 7
(21)【出願番号】P 2019164749
(22)【出願日】2019-09-10
(65)【公開番号】P2021043306
(43)【公開日】2021-03-18
【審査請求日】2022-09-02
(73)【特許権者】
【識別番号】000001443
【氏名又は名称】カシオ計算機株式会社
(74)【代理人】
【識別番号】110003708
【氏名又は名称】弁理士法人鈴榮特許綜合事務所
(74)【代理人】
【識別番号】100108855
【弁理士】
【氏名又は名称】蔵田 昌俊
(74)【代理人】
【識別番号】100103034
【弁理士】
【氏名又は名称】野河 信久
(74)【代理人】
【識別番号】100179062
【弁理士】
【氏名又は名称】井上 正
(74)【代理人】
【識別番号】100153051
【弁理士】
【氏名又は名称】河野 直樹
(74)【代理人】
【識別番号】100199565
【弁理士】
【氏名又は名称】飯野 茂
(74)【代理人】
【識別番号】100162570
【弁理士】
【氏名又は名称】金子 早苗
(72)【発明者】
【氏名】北地 誠
【審査官】池田 剛志
(56)【参考文献】
【文献】国際公開第2013/118387(WO,A1)
【文献】特開平09-006392(JP,A)
【文献】特開2014-038140(JP,A)
【文献】特開2016-212374(JP,A)
【文献】特開2007-148235(JP,A)
【文献】特開2015-025842(JP,A)
【文献】特開2007-248750(JP,A)
【文献】特開2006-139162(JP,A)
【文献】韓国公開特許第10-2019-0065683(KR,A)
(58)【調査した分野】(Int.Cl.,DB名)
G09B 1/00- 9/56
17/00-19/56
G10L 13/00-13/10
19/00-99/00
G06F 3/16
(57)【特許請求の範囲】
【請求項1】
学習の対象とされた単語に所定の発音となる音素が含まれているか否かを判定する判定手段と、
前記判定手段により前記所定の発音となる音素が前記単語に含まれていると判定された場合に、前記単語を音声再生するときの再生速度を、前記所定の発音となる音素での再生速度が他の音素での再生速度よりも遅くなるように、設定する設定手段と、
を備えることを特徴とする学習支援装置。
【請求項2】
予め対応付けられた一対の発音のうち一方の発音となる音素が含まれた第1単語と他方の発音となる音素が含まれた第2単語とを学習の対象として選択する選択手段と、
前記選択手段により選択された前記第1単語と前記第2単語とを音声再生するときの再生速度を、前記一方の発音となる音素での再生速度と前記他方の発音となる音素での再生速度とが他の音素での再生速度よりも遅くなるように、設定する設定手段と、
を備え、
前記選択手段は、前記一方の発音となる音素または前記他方の発音となる音素を除いて互いに対応する位置の音素間で発音が一致するように、前記学習の対象として前記第1単語と前記第2単語とを選択する、
ことを特徴とする学習支援装置。
【請求項3】
前記設定手段により設定された再生速度で前記単語を音声再生する再生手段を備え、
前記再生手段は、音程を変えずに再生速度を変化させる話速変換により再生速度を変化させる、
ことを特徴とする請求項1または2に記載の学習支援装置。
【請求項4】
学習支援装置が実行する学習支援方法であって、
学習の対象とされた単語に所定の発音となる音素が含まれているか否かを判定する判定処理と、
前記判定処理により前記所定の発音となる音素が前記単語に含まれていると判定された場合に、前記単語を音声再生するときの再生速度を、前記所定の発音となる音素での再生速度が他の音素での再生速度よりも遅くなるように、設定する設定処理と、
を含むことを特徴とする学習支援方法。
【請求項5】
学習支援装置が実行する学習支援方法であって、
予め対応付けられた一対の発音のうち一方の発音となる音素が含まれた第1単語と他方の発音となる音素が含まれた第2単語とを学習の対象として選択する選択処理と、
前記選択処理により選択された前記第1単語と前記第2単語とを音声再生するときの再生速度を、前記一方の発音となる音素での再生速度と前記他方の発音となる音素での再生速度とが他の音素での再生速度よりも遅くなるように、設定する設定処理と、
を含み、
前記選択処理は、前記一方の発音となる音素または前記他方の発音となる音素を除いて互いに対応する位置の音素間で発音が一致するように、前記学習の対象として前記第1単語と前記第2単語とを選択する、
ことを特徴とする学習支援方法。
【請求項6】
コンピュータを
学習の対象とされた単語に所定の発音となる音素が含まれているか否かを判定する判定手段、
前記判定手段により前記所定の発音となる音素が前記単語に含まれていると判定された場合に、前記単語を音声再生するときの再生速度を、前記所定の発音となる音素での再生速度が他の音素での再生速度よりも遅くなるように、設定する設定手段、
として機能させることを特徴とするプログラム。
【請求項7】
コンピュータを、
予め対応付けられた一対の発音のうち一方の発音となる音素が含まれた第1単語と他方の発音となる音素が含まれた第2単語とを学習の対象として選択する選択手段、
前記選択手段により選択された前記第1単語と前記第2単語とを音声再生するときの再生速度を、前記一方の発音となる音素での再生速度と前記他方の発音となる音素での再生速度とが他の音素での再生速度よりも遅くなるように、設定する設定手段、
として機能させ、
前記選択手段は、前記一方の発音となる音素または前記他方の発音となる音素を除いて互いに対応する位置の音素間で発音が一致するように、前記学習の対象として前記第1単語と前記第2単語とを選択する、
ことを特徴とするプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、学習支援装置、学習支援方法及びプログラムに関する。
【背景技術】
【0002】
例えば、語学学習機などの学習装置において、学習対象となる言語のネイティブによる発音の音声データを再生する機能がある。ユーザは、単語、熟語、文章など、様々なテキストの中から任意のテキストを選択し、当該テキストに対応する音声データを聞くことで、リスニングの学習を行なうことができる。
【0003】
従来の学習装置では、選択したテキストに対応する音声データの全体(先頭から末尾まで)の再生速度を変化させ、ユーザは、当該音声データをゆっくり聞いたり速く聞いたりして学習できる。
【0004】
また、一般的に日本人が苦手な音素である「L」及び「R」の発音の聞き取りを練習するために、当該音素を含む発音区間で再生速度を変化させた専用の音声データを用いて、聞き取り練習を行なうことのできる英語の音素「L」及び「R」の学習装置が考えられている(例えば、特許文献1参照。)。
【先行技術文献】
【特許文献】
【0005】
【文献】特開2004-334164号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
従来、苦手な音素の発音の聞き取りを練習するための学習装置では、当該苦手な音素(「L」及び「R」など)を含む専用の音声データを用いる必要がある。
【0007】
このため、従来の学習装置では、ユーザが、例えば任意のテキストの音声データを再生させて聞いているときに、ユーザの苦手な音素を含む発音部分の聞き取り練習を行なうことはできない。
【0008】
本発明は、このような課題に鑑みてなされたもので、ユーザによるテキスト全体の聞き取りが妨げられることなく、ユーザが自然に苦手な音素を含む発音部分の聞き取り練習を行なうことが可能になる学習支援装置、学習支援方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0009】
本発明に係る第1の態様の学習支援装置は、学習の対象とされた単語に所定の発音となる音素が含まれているか否かを判定する判定手段と、前記判定手段により前記所定の発音となる音素が前記単語に含まれていると判定された場合に、前記単語を音声再生するときの再生速度を、前記所定の発音となる音素での再生速度が他の音素での再生速度よりも遅くなるように、設定する設定手段と、を備えることを特徴とする。
また、本発明に係る第2の態様の学習支援装置は、予め対応付けられた一対の発音のうち一方の発音となる音素が含まれた第1単語と他方の発音となる音素が含まれた第2単語とを学習の対象として選択する選択手段と、前記選択手段により選択された前記第1単語と前記第2単語とを音声再生するときの再生速度を、前記一方の発音となる音素での再生速度と前記他方の発音となる音素での再生速度とが他の音素での再生速度よりも遅くなるように、設定する設定手段と、を備え、前記選択手段は、前記一方の発音となる音素または前記他方の発音となる音素を除いて互いに対応する位置の音素間で発音が一致するように、前記学習の対象として前記第1単語と前記第2単語とを選択する、ことを特徴とする。
また、本発明に係る第1の態様の学習支援方法は、学習支援装置が実行する学習支援方法であって、学習の対象とされた単語に所定の発音となる音素が含まれているか否かを判定する判定処理と、前記判定処理により前記所定の発音となる音素が前記単語に含まれていると判定された場合に、前記単語を音声再生するときの再生速度を、前記所定の発音となる音素での再生速度が他の音素での再生速度よりも遅くなるように、設定する設定処理と、を含むことを特徴とする。
また、本発明に係る第2の態様の学習支援方法は、学習支援装置が実行する学習支援方法であって、予め対応付けられた一対の発音のうち一方の発音となる音素が含まれた第1単語と他方の発音となる音素が含まれた第2単語とを学習の対象として選択する選択処理と、前記選択処理により選択された前記第1単語と前記第2単語とを音声再生するときの再生速度を、前記一方の発音となる音素での再生速度と前記他方の発音となる音素での再生速度とが他の音素での再生速度よりも遅くなるように、設定する設定処理と、を含み、前記選択処理は、前記一方の発音となる音素または前記他方の発音となる音素を除いて互いに対応する位置の音素間で発音が一致するように、前記学習の対象として前記第1単語と前記第2単語とを選択する、ことを特徴とする。
また、本発明に係る第1の態様のプログラムは、コンピュータを学習の対象とされた単語に所定の発音となる音素が含まれているか否かを判定する判定手段、前記判定手段により前記所定の発音となる音素が前記単語に含まれていると判定された場合に、前記単語を音声再生するときの再生速度を、前記所定の発音となる音素での再生速度が他の音素での再生速度よりも遅くなるように、設定する設定手段、として機能させることを特徴とする。
また、本発明に係る第2の態様のプログラムは、コンピュータを、予め対応付けられた一対の発音のうち一方の発音となる音素が含まれた第1単語と他方の発音となる音素が含まれた第2単語とを学習の対象として選択する選択手段、前記選択手段により選択された前記第1単語と前記第2単語とを音声再生するときの再生速度を、前記一方の発音となる音素での再生速度と前記他方の発音となる音素での再生速度とが他の音素での再生速度よりも遅くなるように、設定する設定手段、として機能させ、前記選択手段は、前記一方の発音となる音素または前記他方の発音となる音素を除いて互いに対応する位置の音素間で発音が一致するように、前記学習の対象として前記第1単語と前記第2単語とを選択する、ことを特徴とする。
【図面の簡単な説明】
【0010】
図1】本発明の電子機器の実施形態に係る学習支援装置10の外観構成を示す図。
図2】学習支援装置10の電子回路の構成を示すブロック図。
図3】苦手発音テーブル(22g)に3段階の語学レベルに区分して記述されたユーザが苦手な複数の音素の発音記号の一例を示す図。
図4】学習支援装置10の第1実施形態の音声再生処理(1)を示すフローチャート。
図5】音声再生処理(1)に含まれる音声選択処理(S1)を示すフローチャート。
図6】音声再生処理(1)に含まれる苦手発音要素特定処理(S3)を示すフローチャート。
図7】音声再生処理(1)に含まれる発音タイミング特定処理(S4)を示すフローチャート。
図8】音声再生処理(1)に含まれる話速変換区間設定方法特定処理(S5)を示すフローチャート。
図9】音声再生処理(1)に従った再生対象の音声データの通常の再生タイミングと、苦手な発音要素の発音部分に対応して再生速度を変化させ話速変換して再生する再生タイミングとを対比して示す図。
図10】学習支援装置10の第2実施形態の音声再生処理(2)を示すフローチャート。
図11】音声再生処理(2)に含まれる話速変換発音区間特定処理(A4)を示すフローチャート。
図12】音声再生処理(2)に従った2つの類似音素をそれぞれ含む2つの単語の音声データの通常の再生タイミングと、類似音素の発音部分に対応して再生速度を変化させ話速変換して再生する再生タイミングとを対比して示す図。
【発明を実施するための形態】
【0011】
以下図面を参照して本発明の実施の形態について説明する。
【0012】
図1は、本発明の電子機器の実施形態に係る学習支援装置10の外観構成を示す図である。
【0013】
電子機器は、以下に説明する学習支援専用の学習支援装置10(実施形態では電子辞書)として構成されるか、学習支援機能を備えたタブレット型のPDA(personal digital assistants)、PC(personal computer)、携帯電話、電子ブック、携帯ゲーム機などとして構成される。
【0014】
学習支援装置10は、その本体ケース11と蓋体ケース12とがヒンジ部13を介して展開/閉塞可能な折り畳み型ケースを備えて構成される。折り畳み型ケースを展開した本体ケース11の表面には、[ホーム]キー14a、機能指定キー14b、文字入力キー14c、[訳/決定]キー14d、[戻る/リスト]キー14e、カーソルキー14f、[シフト]キー14g、[音声]キー14S、などを含むキー入力部(キーボード)14、音声出力部(スピーカを含む)15、および音声入力部(マイクを含む)16が設けられる。
【0015】
また、蓋体ケース12の表面には、タッチパネル式表示部(ディスプレイ)17が設けられる。タッチパネル式表示部17は、ユーザがペンや指などでタッチした位置を検出するタッチ位置検出装置と表示装置が一体となった構造であり、バックライト付きのカラー液晶表示画面に透明タッチパネルを重ねて構成される。
【0016】
そして、タッチパネル式表示部17の右端には、キー入力部14における一部のキーの押下操作や本学習支援装置10の一部の機能の指定操作を、タッチ操作により行うためのキーや機能の表記([ホーム][音声][訳/決定]など)が固定印刷されたタッチキーエリア17Aが設けられる。
【0017】
キー入力部14の機能指定キー14bは、各キーに表記されている辞書コンテンツ([大辞典]など)、辞書コンテンツのカテゴリ([国語][古語][漢和][英和]など)、学習コンテンツのカテゴリ([学習1][学習2])、[コンテンツ一覧]、ツールの一つのカテゴリ[学習帳]を、それぞれ直接指定するためのキーである。
【0018】
また、キー入力部14のキーは、[シフト]キー14gが操作された後に続けて操作されることで、そのキートップに枠囲み無しで記載されたキー機能ではなく、枠囲みして記載されたキーとして機能できるようになっている。例えば、[シフト]キー14gの操作後に[訳/決定]キー14dが操作(以下、[シフト]+[決定]キーと記す。)されると、登録対象として指定されているデータを登録する機能を起動させるための[登録]キーとなる。[シフト]+[削除]キーは[設定]キーとなる。
【0019】
キー入力部14の[音声]キー14Sおよびタッチキーエリア17Aの[音声]タッチキーBSは、何れも、タッチパネル式表示部17に表示されているテキストや項目の内容に対応する音声データを出力させるための音声再生機能を起動させるキーである。
【0020】
例えば、図1に示すように、英和辞典の見出し語検索に従い、見出し語“establish”の見出し語説明画面GEをタッチパネル式表示部17に表示させた状態で、[音声]キー14S(又は[音声]タッチキーBS)の操作により音声再生機能を起動させる。そして、見出し語説明画面GE上の見出し語“establish”を再生対象として選択して反転表示(識別表示)hさせた状態で、[訳/決定]キー14dを操作すると、選択された見出し語“establish”に対応する音声データ(見出し語“establish”を読み上げる、例えばネイティブの音声データ)が再生され、音声出力部15から出力される。
【0021】
本実施形態の学習支援装置10は、音声再生機能に基づき音声データを再生する際、当該音声データにユーザが苦手な音素の発音(例えば“establish”の“sh”[∫]に対応する発音)が含まれている場合に、当該苦手な音素を含む発音部分に対応する音声データの再生区間を特定し、特定された再生区間での音声データの再生速度を変化させる(例えば遅くする)と共に、話速変換して再生する機能を有する。
【0022】
これにより、本実施形態の学習支援装置10では、再生対象としてユーザが選択した音声データの全体を再生する過程において、ユーザが苦手な音素を含む発音部分の音声データを、当該ユーザが聞き取り易いようにその再生速度を変化させて再生できる。
【0023】
図2は、学習支援装置10の電子回路の構成を示すブロック図である。
【0024】
学習支援装置10の電子回路は、コンピュータであるCPU(プロセッサ)21を備える。
【0025】
CPU21は、フラッシュROMなどの記憶部(ストレージ)22に予め記憶されたプログラム(学習支援処理プログラム22aおよび音声再生処理プログラム22bを含む)、あるいはメモリカードなどの外部記録媒体23から記録媒体読取部24により読み取られて記憶部22に記憶されたプログラム、あるいは通信ネットワークN上のWebサーバ(ここではプログラムサーバ)30から通信部25を介してダウンロードされ記憶部22に記憶されたプログラム、に従って回路各部の動作を制御する。
【0026】
CPU21には、データ及び制御バスを介して、記憶部22、記録媒体読取部24、通信部25を接続するほか、キー入力部14、音声出力部15、音声入力部16、表示部17、を接続する。
【0027】
音声出力部15は、記憶部22に記憶されているかあるいは録音された音声データに基づく音声を出力する本体スピーカ15Sを備える。
【0028】
音声入力部16は、ユーザ等の音声を入力する本体マイク16Mを備える。
【0029】
音声出力部15および音声入力部16は、共用の外部接続端子(EX)26を備え、外部接続端子26には、ユーザが必要に応じてイヤホンマイク27を接続する。
【0030】
イヤホンマイク27は、イヤホンを有すると共に、マイク27mを備えたリモコン部27Rを有する。
【0031】
記憶部22は、プログラム(学習支援処理プログラム22aおよび音声再生処理プログラム22bを含む)を記憶するプログラム記憶部のほか、学習コンテンツ記憶部22c、辞書データ記憶部22d、他のコンテンツ記憶部22e、語学レベルデータ記憶部22f、苦手発音テーブル記憶部22g、発音変化イディオムテーブル記憶部22h、音声再生モードデータ記憶部22i、話速変換区間設定データ記憶部22j、および話速変換再生区間データ記憶部22kを備える。
【0032】
学習支援処理プログラム22aとしては、学習支援装置10の全体の動作を司るシステムプログラム、通信部25を介して外部の電子機器と通信接続するためのプログラム、および音声再生処理プログラム22bと併せて学習コンテンツ記憶部22c、辞書データ記憶部22d、および他のコンテンツ記憶部22eに記憶されている各種のコンテンツデータに応じた学習機能を実行するためのプログラムなどを記憶する。
【0033】
音声再生処理プログラム22bは、ユーザ操作に応じして選択された再生対象の音声データを再生するためのプログラム、および再生対象の音声データを再生する際、当該音声データにユーザが苦手な音素の発音が含まれている場合に、当該苦手な音素を含む発音部分に対応する音声データの再生区間を特定し、特定された再生区間での音声データの再生速度を変化させると共に、話速変換して再生するためのプログラムを含む。
【0034】
学習コンテンツ記憶部22cは、例えば、リスニングレッスンデータ22c1、スピーキングレッスンデータ22c2、などの学習コンテンツデータを記憶する。
【0035】
リスニングレッスンデータ22c1は、例えば、リスニングレッスンの模範となる単語と文章に対応するテキストデータ(テキストデータには発音記号が付加されている)と当該テキストデータに対応する音声データを有し、単語または文章のテキストデータを表示部17に表示させ、音声データを音声出力部15から出力する機能を有する。
【0036】
スピーキングレッスンデータ22c2は、例えば、スピーキングレッスンの模範となるテキストデータ(テキストデータには発音記号が付加されている)と当該テキストデータに対応する音声データを有し、テキストデータを表示部17に表示させ、音声データを音声出力部15から出力した後に、音声入力部16から入力したユーザの音声データを解析し、正誤等の判定結果を表示や音声により出力する機能を有する。
【0037】
辞書データ記憶部22dは、例えば、英和辞書、和英辞書、英英辞書、国語辞書などの各種の辞書コンテンツデータを記憶し、辞書コンテンツデータは、例えば、ユーザ操作に応じてキー入力または音声入力される辞書検索の対象となる見出し語に基づいて、当該見出し語に対応する説明情報を辞書検索して表示や音声により出力する機能を有する。
【0038】
なお、辞書コンテンツデータは、各種の辞書のそれぞれにおいて、見出し語、見出し語の意味,内容を含む説明情報、見出し語を含む例文などのテキストデータ、および当該テキストデータに対応する音声データを有し、そのうち例えば見出し語および例文のテキストデータには、発音記号が付加されている。
【0039】
他のコンテンツ記憶部22eは、学習コンテンツデータ(22c)、辞書コンテンツデータ(22d)以外の、例えば書籍、新聞、雑誌などの他のコンテンツデータを記憶する。他のコンテンツデータは、各コンテンツデータのテキストデータ、および当該テキトデータに対応する音声データを有する。
【0040】
語学レベルデータ記憶部22fは、ユーザの語学レベルのデータを、例えば、初級:1、中級:2、上級:3として記憶する。語学レベルは、ユーザ操作に応じてユーザ自身の語学レベルが入力されて記憶されるか、あるいは学習コンテンツデータ(22c)や辞書コンテンツデータ(22d)に応じた学習機能が実行された際に、当該学習機能の中で判定されたユーザの語学レベルが自動更新されて記憶される。
【0041】
苦手発音テーブル記憶部22gは、ユーザが苦手な音素の発音記号および当該発音記号に対応する音声データを、例えば3段階の語学レベル(初級:1、中級:2、上級:3)に区分けして対応付けたテーブルとして記憶する(図3参照)。
【0042】
図3は、苦手発音テーブル(22g)に3段階の語学レベルに区分して記述されたユーザが苦手な複数の音素の発音記号の一例を示す図である。
【0043】
図3に示す苦手発音テーブル(22g)では、ユーザが苦手な音素の発音記号として、ユーザが苦手で且つ聞き分けるのが難しい2つの類似する音素の発音記号の組みが、複数組み記述され、語学レベル1(初級)のユーザは当該テーブルに記述された全ての音素の組み(16組み)が聞き分けの苦手な類似音素であることを示し、語学レベル2(中級)のユーザは当該テーブルに記述された全ての音素の組みのうち下から9組みが聞き分けの苦手な類似音素であることを示し、語学レベル3(上級)のユーザは当該テーブルに記述された全ての音素の組みのうち下から4組みが聞き分けの苦手な類似音素であることを示している。
【0044】
発音変化イディオムテーブル記憶部22hは、熟語や成句など、複数の単語を連結して構成される語句のうち、単語を単一で発音した場合と比較して発音が変化する複数の発音変化語句(例えば“there is”:ゼァ・イズ→ゼァリズと発音変化)のデータをテーブルにして記憶する。発音変化語句のデータは、発音変化語句のテキストデータ、およびテキストデータに対応する音声データを有し、テキストデータには、発音が変化するテキストの範囲に対応して発音記号が付加(ユーザが苦手な音素の発音記号として付加)されている。
【0045】
音声再生モードデータ記憶部22iは、音声データの再生モード(通常再生モードまたは苦手発音聞き取り(練習)モードまたは類似音素聞き分け(練習)モードなど)を示すデータを記憶する。音声データの再生モードは、例えばユーザ操作に応じて選択される。
【0046】
話速変換区間設定データ記憶部22jは、再生対象の音声データのうち、ユーザが苦手な音素を含む発音部分として再生速度を変化させ話速変換して再生する再生区間を、音素単位に設定するか、単語単位に設定するか、文単位に設定するか、の設定方法を示すデータ(話速変換区間設定データ)を記憶する。話速変換区間設定データ(音素単位/単語単位/文単位)は、ユーザ操作に応じて任意に特定されるか、またはユーザの語学レベルに応じて特定される。
【0047】
話速変換再生区間データ記憶部22kは、再生対象の音声データの先頭(開始時間)から末尾(終了時間)までの再生タイミング(例えば先頭(開始時間)を0msecとした末尾(終了時間)までの時間で管理される:図9参照)において、話速変換区間設定データ(22j)に基づき特定された話速変換の再生区間に対応する再生タイミング(例えばN msec~M msec)のデータを記憶する。
【0048】
このように構成された学習支援装置10は、CPU21が学習支援処理プログラム22aおよび音声再生処理プログラム22bに記述された命令に従い回路各部の動作を制御し、ソフトウエアとハードウエアとが協働して動作することにより、以下の動作説明で述べるような、音声再生機能を実現する。
【0049】
次に、実施形態の学習支援装置(電子辞書)10の動作について説明する。
【0050】
(第1実施形態)
図4は、学習支援装置10の第1実施形態の音声再生処理(1)を示すフローチャートである。
【0051】
図5は、音声再生処理(1)に含まれる音声選択処理(S1)を示すフローチャートである。
【0052】
図6は、音声再生処理(1)に含まれる苦手発音要素特定処理(S3)を示すフローチャートである。
【0053】
図7は、音声再生処理(1)に含まれる発音タイミング特定処理(S4)を示すフローチャートである。
【0054】
図8は、音声再生処理(1)に含まれる話速変換区間設定方法特定処理(S5)を示すフローチャートである。
【0055】
図9は、音声再生処理(1)に従った再生対象の音声データの通常の再生タイミングと、苦手な発音要素の発音部分に対応して再生速度を変化させ話速変換して再生する再生タイミングとを対比して示す図である。
【0056】
再生対象の音声データを選択するための音声選択処理(S1)(図5参照)において、例えばユーザによる機能指定キー14bの操作に応じて辞書が選択されると(ステップS101(Yes))、CPU21は、選択された辞書データに対応して検索対象の見出し語を入力するための見出し語入力画面(図示せず)を表示部17に表示させる(ステップS102)。
【0057】
見出し語入力画面において、ユーザ操作に応じて検索対象の見出し語が入力されると、CPU21は、入力された見出し語のデータを、選択された辞書データから検索し(ステップS103)、検索された見出し語とその意味,内容のデータを展開した見出し語説明画面GE(図1参照)を表示部17に表示させる(ステップS104)。
【0058】
見出し語説明画面GEにおいて、例えば当該画面GEに対するユーザのタッチ操作に応じてテキストが選択され、選択されたテキストが反転表示(識別表示)hされると(ステップS105(Yes))、CPU21は、選択されたテキストに対応する音声データを再生対象に設定する(ステップS106)。
【0059】
一方、ユーザ操作に応じて、学習コンテンツ記憶部22cに記憶されているリスニングレッスンデータ22c1の学習コンテンツが選択されると(ステップS107(Yes))、CPU21は、選択された学習コンテンツが有する、例えばリスニング練習の対象となる単語や文章の項目の一覧を表示部17に表示させる(ステップS108)。
【0060】
表示された項目の一覧から、ユーザの例えばタッチ操作に応じて任意の項目が選択されると(ステップS109(Yes))、CPU21は、選択された項目に対応する単語や文章のテキストの音声データを再生対象に設定する(ステップS110)。
【0061】
また、ユーザ操作に応じて、他のコンテンツ記憶部22eに記憶されている他のコンテンツが選択されると(ステップS111(Yes))、CPU21は、選択された他のコンテンツのテキストデータを表示部17に表示させる(ステップS112)。
【0062】
表示された他のコンテンツのテキストデータの中から、ユーザの例えばタッチ操作に応じて単語や文章などの任意のテキストが選択されると(ステップS113(Yes))、CPU21は、選択されたテキストに対応する音声データを再生対象に設定する(ステップS114)。
【0063】
このように、音声選択処理(S1)に従い再生対象の音声データが選択されると、CPU21は、音声再生モードデータ記憶部22iに記憶されている再生モードのデータに基づき、苦手発音聞き取りモードか通常再生モードかを判定する(ステップS2)。
【0064】
ここで、通常再生モードと判定されると(ステップS2(No))、CPU21は、再生対象の音声データをその先頭から末尾まで通常の再生速度タイミングに従い通常の再生速度で再生する(ステップS11)。
【0065】
一方、苦手発音聞き取りモードと判定されると(ステップS2(Yes))、CPU21は、ユーザが苦手な発音の要素(音素)を特定するための苦手発音要素特定処理(S2)(図6参照)に移行する。
【0066】
苦手発音要素特定処理に移行されると、CPU21は、ユーザが苦手な発音の要素を、当該ユーザが任意に特定するか、または当該ユーザの語学レベルに応じて自動で特定するか、または発音変化イディオムテーブル(22h)に基づき自動で特定するかの何れかの項目について、ユーザに選択させる項目選択画面を表示部17に表示させる。
【0067】
項目選択画面において、ユーザが苦手な発音の要素を、ユーザが任意に特定する項目が選択されると(ステップS31(Yes))、CPU21は、例えば英語系の辞書データから読み出した発音記号の一覧を表示部17に表示させる(ステップS32)。
【0068】
発音記号の一覧において、ユーザ操作に応じて、当該ユーザが苦手な一つまたは複数の音素の発音記号が選択されると(ステップS33(Yes))、CPU21は、選択された発音記号の発音要素を苦手発音要素として特定する(ステップS34)。
【0069】
一方、項目選択画面において、ユーザが苦手な発音の要素を、ユーザの語学レベルに応じて自動で特定する項目が選択されると(ステップS35(Yes))、CPU21は、語学レベルデータ記憶部22fからユーザの語学レベル(初級:1、または中級:2、または上級:3)のデータを取得し(ステップS36)、苦手発音テーブル(22g:図3参照)の中から、当該ユーザの語学レベルに応じた複数の発音記号の発音要素を苦手発音要素として特定する(ステップS37)。
【0070】
また、項目選択画面において、ユーザが苦手な発音の要素を、発音変化イディオムテーブル(22h)に基づき自動で特定する項目が選択されると(ステップS35(No))、CPU21は、発音変化イディオムテーブル(22h)にある複数の発音変化語句のテキストデータにそれぞれ対応付けられた、発音が変化するテキストの範囲に対応した発音記号の発音要素を苦手発音要素として特定する(ステップS38)。
【0071】
このように、苦手発音要素特定処理(S3)に従いユーザが苦手な発音の要素(音素)が特定されると、CPU21は、音声選択処理(S1)に従い選択された再生対象の音声データのうち、苦手発音要素特定処理(S3)に従い特定された苦手発音要素に対応する発音タイミングを特定するための発音タイミング特定処理(S4)(図7参照)に移行する。
【0072】
発音タイミング特定処理に移行されると、CPU21は、再生対象の音声データに対応するテキストデータに発音記号が付加されているか否かを判定する(ステップS41)。
【0073】
音声選択処理(S1)に従い選択された再生対象の音声データが、例えば辞書データ(22d)または学習コンテンツデータ(22c)から選択された音声データである場合に、当該音声データに対応するテキストデータに発音記号が付加されていると判定されると(ステップS41(Yes))、CPU21は、苦手発音要素特定処理(S3)に従い特定されたユーザが苦手な発音要素が、発音変化イディオムテーブル(22h)を利用して特定されたものか否かを判定する(ステップS42)。
【0074】
苦手発音要素特定処理(S3)に従い特定されたユーザが苦手な発音要素が、発音変化イディオムテーブル(22h)を利用して特定されたものではない、すなわち、ユーザにより任意に特定された発音記号の発音要素であるか、ユーザの語学レベルに応じて苦手発音テーブル(22g)から特定された発音記号の発音要素であると判定されると(ステップS42(No))、CPU21は、再生対象の音声データのうち、当該ユーザが苦手な発音要素の発音記号に対応する発音タイミングを、当該音声データに対応するテキストデータに付加された発音記号の位置に基づき特定する(ステップS44)。
【0075】
また、苦手発音要素特定処理(S3)に従い特定されたユーザが苦手な発音要素が、発音変化イディオムテーブル(22h)を利用して特定されたものであると判定された場合(ステップS42(Yes))、CPU21は、再生対象の音声データに対応するテキストデータに、発音変化イディオムテーブル(22h)にある発音変化イディオム(発音変化語句)のテキストデータと一致する部分があるか、すなわち、再生対象の音声データに発音変化語句と同じく発音が変化する部分が含まれているかを判定する(ステップS43)。
【0076】
再生対象の音声データに対応するテキストデータに、発音変化イディオム(発音変化語句)のテキストデータと一致する部分があると判定されると(ステップS43(Yes))、CPU21は、再生対象の音声データのうち、発音変化イディオムテーブル(22h)を利用して特定されたユーザが苦手な発音要素の発音記号に対応する発音タイミングを、当該音声データに対応するテキストデータに付加された発音記号の位置に基づき特定する(ステップS44)。
【0077】
一方、音声選択処理(S1)に従い選択された再生対象の音声データが、例えば他のコンテンツデータ(22e)から選択された音声データである場合に、当該音声データに対応するテキストデータに発音記号が付加されていないと判定されると(ステップS41(No))、CPU21は、再生対象の音声データを音声認識し、当該音声データをその先頭(開始時間)から末尾(終了時間)までに含まれる複数の音素毎の音素区間に分解する(ステップS45)。
【0078】
そして、CPU21は、苦手発音要素特定処理(S3)に従い特定されたユーザが苦手な発音要素が、発音変化イディオムテーブル(22h)を利用して特定されたものか否かを判定する(ステップS46)。
【0079】
苦手発音要素特定処理(S3)に従い特定されたユーザが苦手な発音要素が、発音変化イディオムテーブル(22h)を利用して特定されたものではない、すなわち、ユーザにより任意に特定された発音記号の発音要素であるか、ユーザの語学レベルに応じて苦手発音テーブル(22g)から特定された発音記号の発音要素であると判定されると(ステップS46(No))、CPU21は、ステップS45にて音素区間に分解された再生対象の音声データの中に、任意または苦手発音テーブル(22g)から特定された苦手な発音要素の音声データに一致する音素区間があるかを判定する(ステップS49)。
【0080】
再生対象の音声データの中に、任意または苦手発音テーブル(22g)から特定された苦手な発音要素の音声データに一致する音素区間があると判定されると(ステップS49(Yes))、CPU21は、再生対象の音声データの中の、任意または苦手発音テーブル(22g)から特定された苦手な発音要素の音声データに一致した音素区間の発音タイミングを特定する(ステップS48)。
【0081】
また、苦手発音要素特定処理(S3)に従い特定されたユーザが苦手な発音要素が、発音変化イディオムテーブル(22h)を利用して特定されたものであると判定された場合(ステップS46(Yes))、CPU21は、ステップS45にて音素区間に分解された再生対象の音声データの中に、発音変化イディオムテーブル(22h)から特定された苦手な発音要素の音声データに一致する音素区間があるかを判定する(ステップS47)。
【0082】
再生対象の音声データの中に、発音変化イディオムテーブル(22h)から特定された苦手な発音要素の音声データに一致する音素区間があると判定されると(ステップS47(Yes))、CPU21は、再生対象の音声データの中の、発音変化イディオムテーブル(22h)から特定された苦手な発音要素の音声データに一致した音素区間の発音タイミングを特定する(ステップS48)。
【0083】
このように、発音タイミング特定処理(S4)に従い、再生対象の音声データの中のユーザが苦手な発音要素(音素)に対応する発音タイミングが特定されると、CPU21は、再生対象の音声データのうち、当該ユーザが苦手な発音要素(音素)の発音タイミングを含む発音部分として再生速度を変化させ話速変換して再生する再生区間を、音素単位に設定するか、単語単位に設定するか、文単位に設定するか、の設定方法を特定するための話速変換区間設定方法特定処理(S5)(図8参照)に移行する。
【0084】
話速変換区間設定方法特定処理に移行されると、CPU21は、当該話速変換区間の設定方法について、ユーザが任意に特定するか、またはユーザの語学レベルに応じて自動で特定するかの何れかの設定方法特定項目について、ユーザに選択させる設定方法特定項目選択画面を表示部17に表示させる。
【0085】
設定方法特定項目選択画面において、ユーザが任意に設定方法を特定する項目が選択されると(ステップS51(Yes))、CPU21は、話速変換して再生する再生区間を、音素単位に設定するか、単語単位に設定するか、文単位に設定するか、の設定方法の一覧を表示部17に表示させる(ステップS52)。
【0086】
設定方法の一覧において、ユーザ操作に応じて、音素単位または単語単位または文単位のうち何れかの設定方法が選択されると(ステップS53(Yes))、CPU21は、選択された設定方法を話速変換区間の設定方法として特定し、話速変換区間設定データ記憶部22jに記憶させる(ステップS54)。
【0087】
一方、設定方法特定項目選択画面において、ユーザの語学レベルに応じて自動で特定する項目が選択されると(ステップS51(No))、CPU21は、語学レベルデータ記憶部22fからユーザの語学レベル(初級:1、または中級:2、または上級:3)のデータを取得する(ステップS56)。
【0088】
そして、話速変換区間の設定方法を、ユーザの語学レベルが(初級:1)である場合は<文単位>として特定し(ステップS56→S57a)、また、(中級:2)である場合は<単語単位>として特定し(ステップS56→S57b)、また、(上級:3)である場合は<音素単位>として特定し(ステップS56→S57c)、話速変換区間設定データ記憶部22jに記憶させる。
【0089】
CPU21は、話速変換区間設定方法特定処理(S5)に従い特定された話速変換区間の設定方法に基づいて、再生対象の音声データにおけるユーザが苦手な発音要素(音素)の発音タイミングを含む再生区間を特定する(ステップS6)。
【0090】
例えば、音声選択処理(S1)にて選択された再生対象の音声データが、図9の(A)に示すように、学習コンテンツデータ(22c)または辞書データ(22d)から選択された英単語“think”に対応する音声データであり、苦手発音要素特定処理(S3)に従い特定されたユーザが苦手な発音要素が、当該英単語“think”の“th”に対応する発音記号[θ]の発音要素(音素)であり、発音タイミング特定処理(S4)に従い特定された発音タイミングが、音声データ“think”のうち0~100msecの発音タイミングであり、話速変換区間設定方法特定処理(S5)に従い特定された話速変換区間の設定方法が<音素単位>である場合、CPU21は、再生対象の音声データ“think”におけるユーザが苦手な発音要素(音素)[θ]を含む再生区間を、当該<音素単位>である0~100msecとして特定し、話速変換再生区間データ記憶部22kに記憶させる(ステップS6)。
【0091】
CPU21は、再生対象の音声データ“think”の音声出力部15からの通常再生を開始すると共に(ステップS7)、当該音声データ“think”の再生区間が、話速変換再生区間データ記憶部22kに記憶された話速変換の対象となる再生区間0~100msecであるか否かを判定する(ステップS8)。
【0092】
そして、音声データ“think”の再生区間が、話速変換の対象となる再生区間0~100msecであると判定される状態では(ステップS8(Yes))、CPU21は、図9の(A)(B)に示すように、音声データ“think”の“th”に対応する発音部分について、再生速度を遅く(ここでは2.7倍に遅く)切り換えて変化させると共に話速変換して再生する(ステップS9a)。
【0093】
また、音声データ“think”の再生区間が、話速変換の対象となる再生区間0~100msecではない再生区間100~400msecと判定される状態では(ステップS8(No))、CPU21は、図9の(A)(B)に示すように、音声データ“think”の“ink”に対応する発音部分について、再生速度を通常の再生速度に切り換えて話速変換せずに再生する(ステップS9b)。
【0094】
そして、再生対象の音声データ“think”(0~400msec)の全ての再生が終了したと判定されると(ステップS10(Yes))、CPU21は、一連の音声再生処理(1)を終了する。
【0095】
これにより、再生対象の音声データ“think”は、ユーザが苦手な“th”の発音記号[θ]に対応する発音要素(音素)を含む発音部分の再生区間において、再生速度が遅く切り換えられ話速変換されて再生されるので、当該再生対象の音声データ“think”の全体のユーザによる聞き取りが妨げられることなく、ユーザが自然に苦手な音素を含む発音部分の聞き取り練習を行なうことが可能になる。
【0096】
なお、ここでは、再生対象の音声データが単語であり、話速変換区間設定方法特定処理(S5)により特定された話速変換区間の設定方法が<音素単位>である場合の例について説明したが、再生対象の音声データが複数の単語からなる文であり(例えば英単語“think”を含む例文“Where do you think she lives?”)、当該話速変換区間の設定方法が<単語単位>として特定された場合には、再生対象の音声データ“ Where do you think she lives?”におけるユーザが苦手な発音要素(音素)[θ]を含む単語単位の発音部分である“think”の再生区間が特定され(図9の(A)参照)、再生対象の音声データの全体である“ Where do you think she lives?”のうちの“think”の単語の再生区間において、再生速度が遅く(例えば2.7倍に遅く)切り換えられ話速変換して再生され、その他の単語の再生区間については話速変換せずに通常の再生速度で再生される(ステップS8,S9a,S10)。
【0097】
これによれば、話速変換区間の設定方法が<音素単位>である場合と比較して、ユーザが苦手な発音要素(音素)[θ]を含む英単語“think”の音声データを、再生対象の文に含まれる他の単語よりもユーザにより聞き取り易く再生できる。
【0098】
また、音声選択処理(S1)にて選択された再生対象の音声データが、例えば他のコンテンツ(22e)から選択された複数の文が連なる文章の音声データであって、話速変換区間の設定方法が<文単位>として特定された場合には、再生対象の音声データ(ここでは文章)におけるユーザが苦手な発音要素(音素)[θ]を含む単語を有した文単位の発音部分である文の再生区間が特定される。そして、再生対象の音声データの全体である文章のうちの苦手な発音要素(音素)[θ]を含む単語を有した文の再生区間において、再生速度が遅く(例えば2.7倍に遅く)切り換えられ話速変換して再生され、その他の文の再生区間については話速変換せずに通常の再生速度で再生される(ステップS8,S9a,S10)。
【0099】
これによれば、話速変換区間の設定方法が<音素単位>である場合、および<単語単位>である場合と比較して、ユーザが苦手な発音要素(音素)[θ]を含む単語を有した文の音声データを、再生対象の文章に含まれる他の文よりもユーザにより聞き取り易く再生できる。
また、複数の単語を連結して構成される語句であって、複数の単語が連続する部分で音が変化するような場合に、その複数の単語の発音部分を聞き取り易くすることができる。
【0100】
なお、図7を参照して説明した発音タイミング特定処理(S4)において、再生対象の音声データに、ユーザが苦手な発音要素に対応する発音部分が含まれないと判定された場合(ステップS43(No)/S47(No)/S49(No))には、当該音声データに話速変換の対象となる再生区間は特定されないので、同音声データはその全体の再生区間において通常の再生速度で再生される(ステップS5~S8(No),S9b,S10,終了)。
【0101】
以上のように構成した学習支援装置10の第1実施形態の音声再生処理(1)によれば、辞書データ(22d)や学習コンテンツデータ(22c)などからユーザにより任意に選択された、例えば英語のテキストデータに対応する音声データを再生する際に、音声再生モード(22i)が苦手発音聞き取りモードに設定されている場合には、ユーザにより発音記号の一覧から任意に選択されるか、または苦手発音テーブル(22g)や発音変化イディオムテーブル(22h)に登録されている、ユーザが苦手な発音記号の発音要素が特定される。
【0102】
すると、再生対象の音声データにおける苦手な発音要素に対応する発音タイミングが、当該音声データに対応するテキストデータに付加された発音記号の位置に基づき特定されるか、または当該音声データを音声認識して同音声データを構成する音素区間に分解し、苦手な発音要素の音声データと一致する音素区間を判定することで特定され、特定された苦手な発音要素の発音タイミングを含む発音部分の音声データの再生区間が特定される。
【0103】
そして、再生対象の音声データの通常の再生が開始され、当該音声データの苦手な発音要素の発音タイミングを含む発音部分の再生区間では、再生速度が遅く切り換えられると共に話速変換されて再生される。
【0104】
これにより、ユーザにより選択されたテキスト全体の聞き取りが妨げられることなく、ユーザが自然に苦手な音素を含む発音部分の聞き取り練習を行なうことが可能になる。
【0105】
また、学習支援装置10の第1実施形態の音声再生処理(1)によれば、再生対象の音声データにおける苦手な発音要素の発音タイミングを含む発音部分の再生区間は、ユーザにより任意に選択されて特定されるか、ユーザの語学レベル(22f)に応じて特定される、話速変換区間の設定方法(<音素単位>または<単語単位>または<文単位>)に従い特定される。
【0106】
このため、例えばユーザが語学上級者である場合は、再生対象の音声データのうち、ユーザが苦手な発音要素(音素)を含む当該音素の発音部分のみ話速変換の対象となる再生区間として特定され、また、例えばユーザが語学中級者や語学初級者である場合は、再生対象の音声データのうち、ユーザが苦手な発音要素(音素)を含む発音部分として、単語全体や文全体が話速変換の対象となる再生区間として特定されるので、ユーザの語学レベルに応じて、当該ユーザが苦手な発音要素(音素)を含む音声データの発音部分を、当該ユーザが聞き取り易く且つ学習に効果的な範囲に特定して再生できる。
【0107】
以上、第1実施形態の音声再生処理(1)では、再生対象の音声データを再生する際に、当該音声データうち、ユーザが苦手な発音要素(音素)を含む発音部分の再生区間を特定し、特定した再生区間の再生速度を遅く切り換えて(変化させて)再生する実施例について説明した。
【0108】
以下、第2実施形態の音声再生処理(2)では、2つの類似の発音要素(音素)をそれぞれ含む2つの単語(熟語、成句等でもよい)の音声データをそれぞれ再生し、ユーザが類似音素を聞き分ける練習を行なう際に、当該2つの単語それぞれの音声データにおいて、2つの類似の発音要素(音素)を含む発音部分の再生区間を特定し、特定した再生区間の再生速度を遅く変化させ話速変換して再生する実施例について説明する。
【0109】
(第2実施形態)
図10は、学習支援装置10の第2実施形態の音声再生処理(2)を示すフローチャートである。
【0110】
図11は、音声再生処理(2)に含まれる話速変換発音区間特定処理(A4)を示すフローチャートである。
【0111】
図12は、音声再生処理(2)に従った2つの類似音素をそれぞれ含む2つの単語の音声データの通常の再生タイミングと、類似音素の発音部分に対応して再生速度を変化させ話速変換して再生する再生タイミングとを対比して示す図である。
【0112】
ユーザ操作に応じて音声再生処理(2)が開始されると、CPU21は、音声再生モードデータ記憶部22iに記憶されている再生モードのデータに基づき、再生モードが、類似音素の聞き分けモードであるかを判定する(ステップA1)。
【0113】
類似音素の聞き分けモードであると判定されると(ステップA1(Yes))、CPU21は、例えば苦手発音テーブル(22g:図3参照)に記述されている、ユーザが苦手で且つ聞き分けるのが難しい2つの類似する音素の発音記号の組み(16組み)を、表示部17に一覧にして表示させ、聞き分け対象となる2つの類似する音素の発音記号の組みをユーザに選択させる(ステップA2)。
【0114】
ここでは、聞き分け対象となる2つの類似する音素の発音記号の組みとして、苦手発音テーブル(22g)の語学レベル1(初級)に区分けされている発音記号の組み([∫]:[θ])が選択されたと仮定する。
【0115】
CPU21は、選択された聞き分け対象となる2つの類似する音素をそれぞれ含む音声データを選択する(ステップA3)。
【0116】
ここでは、ステップA2にて選択された2つの類似する音素の発音記号([∫]:[θ])に基づいて、辞書データ(22d)あるいは学習コンテンツデータ(22c)から、それぞれの音素が含まれる2つの単語(“sink”と“think”)に対応する音声データが選択されたと仮定する。
【0117】
すると、CPU21は、話速変換発音区間特定処理(A4:図11参照)に移行し、選択された2つの単語(“sink”と“think”)に対応する音声データを対象に、それぞれの音声データ内の類似する発音要素([∫]:[θ])に対応する発音タイミングを特定し、特定された発音タイミングに対応する部分の音声データを、再生速度を遅くして話速変換処理する。
【0118】
すなわち、話速変換発音区間特定処理(A4)に移行されると、CPU21は、先ず、聞き分け対象として選択された2つの音声データが類似の音声であるか否かを、例えば各音声データに対応するテキストに付加された発音記号の一致度に基づき判定する(ステップA41)。
【0119】
聞き分け対象として選択された2つの音声データが、2つの単語(“sink”と“think”)に対応する音声データである場合に、当該各音声データに対応する発音記号の一致度に基づき類似の音声であると判定されると(ステップA41(Yes))、CPU21は、2つの音声データをそれぞれ音声認識して、例えば図12の(A1)(B1)に示すように、開始時間0msecから終了時間400msecまでを構成する各音素区間の発音タイミング(0-100-170-270-400msec)に分解する(ステップA42)。
【0120】
そして、2つの音声データを比較して差異のある部分(“sink”の“s”[∫]の部分と“think”の“th”[θ]の部分)の音素区間に対応する発音タイミング(0-100msec)を特定し、例えば図12の(A2)(B2)に示すように、特定された発音タイミングに対応する部分の音声データを、再生速度を遅く(ここでは2.7倍に遅く)して話速変換処理する(ステップA43)。
【0121】
一方、聞き分け対象として選択された2つの音声データが、類似の音声ではないと判定された場合(ステップA41(No))、CPU21は、2つの音声データそれぞれにおいて、選択された類似音素の発音記号([∫]:[θ])に対応する発音タイミングを特定し、特定された発音タイミングに対応する部分の音声データを、再生速度を遅くして話速変換処理する(ステップA44)。
【0122】
CPU21は、話速変換発音区間特定処理(A4)に従い、図12の(A2)(B2)に示すように、話速変換処理された2つの音声データ(“sink”と“think”)のうち、一方の音声データ“sink”と他方の音声データ“think”とを順番に再生する(ステップA5,A6)。
【0123】
ここで、CPU21は、一方の音声データ“sink”と他方の音声データ“think”が、ユーザにより順番に指定される毎に再生するよう処理してもよいし、自動で順次再生するよう処理してもよい。
【0124】
以上のように構成した学習支援装置10の第2実施形態の音声再生処理(2)によれば、2つの類似の発音要素(音素)をそれぞれ含む2つの単語(熟語、成句等でもよい)の音声データが、聞き分け対象の音声データとして選択されると、当該2つの単語それぞれの音声データにおいて、2つの類似の発音要素(音素)を含む発音部分の再生区間が特定され、特定された再生区間の再生速度が遅く変化され話速変換されて再生される。
【0125】
これにより、ユーザによる聞き取りが苦手な2つの類似の発音要素(音素)をそれぞれ含む2つの英単語等の音声データの再生において、ユーザは、当該類似の発音要素(音素)の部分を容易に聞き取って、効果的に聞き分ける練習を行なうことが可能になる。
【0126】
なお、以上の学習支援装置10による第1および第2実施形態の音声再生処理において、再生対象の音声データを再生する際に、ユーザが苦手なあるいは聞き分け対象の発音要素(音素)を含む発音部分の再生区間を特定し、当該特定した再生区間の再生速度を遅く切り換えるタイミングと、元の通常の再生速度に切り換えるタイミングでは、当該再生速度を段階的に切り換えることで、ユーザに聞き取りの違和感を与えないよう処理してもよい。
【0127】
また、第1および第2実施形態の音声再生処理では、再生対象の音声データの、ユーザが苦手なあるいは聞き分け対象の発音要素(音素)を含む特定の再生区間において、再生速度を遅く切り換える(変化させる)ことで、当該ユーザが苦手なあるいは聞き分け対象の発音要素(音素)を含む発音部分をユーザに聞き取り易く再生し、ユーザが効果的に練習を行えるよう構成した。
【0128】
これとは逆に、再生対象の音声データの、特定の再生区間の再生速度を早く切り換える(変化させる)ことで、ユーザが苦手なあるいは聞き分け対象の発音要素(音素)を含む発音部分を、ユーザにより聞き取り難く再生し、例えば語学レベルの高いユーザにとって効果的な練習が行えるよう構成してもよい。
【0129】
さらに、再生対象の音声データの、特定の再生区間の再生速度を変化させるのではなく、当該特定の再生区間の再生音量を大きくまたは小さく変化させ強調して再生することで、ユーザが苦手なあるいは聞き分け対象の発音要素(音素)を含む発音部分の聞き取り練習を行なう構成としてもよい。
【0130】
前記各実施形態において記載した電子機器(学習支援装置10)による各処理の手法、すなわち、図4図8のフローチャートに示す第1実施形態の音声再生処理(1)、図10図11のフローチャートに示す第2実施形態の音声再生処理(2)などの各手法は、何れもコンピュータに実行させることができるプログラムとして、メモリカード(ROMカード、RAMカードなど)、磁気ディスク(フロッピ(登録商標)ディスク、ハードディスクなど)、光ディスク(CD-ROM、DVDなど)、半導体メモリなどの外部記録装置の媒体に格納して配布することができる。そして、電子機器のコンピュータ(CPU)は、この外部記録装置の媒体に記録されたプログラムを記憶装置に読み込み、この読み込んだプログラムによって動作が制御されることにより、前記各実施形態において説明した音声再生機能を実現し、前述した手法による同様の処理を実行することができる。
【0131】
また、前記各手法を実現するためのプログラムのデータは、プログラムコードの形態として通信ネットワーク(N)上を伝送させることができ、この通信ネットワーク(N)に接続されたコンピュータ装置(プログラムサーバ)から、前記プログラムのデータを電子機器に取り込んで記憶装置に記憶させ、前述した音声再生機能を実現することもできる。
【0132】
本願発明は、前記各実施形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で種々に変形することが可能である。さらに、前記各実施形態には種々の段階の発明が含まれており、開示される複数の構成要件における適宜な組み合わせにより種々の発明が抽出され得る。例えば、各実施形態に示される全構成要件から幾つかの構成要件が削除されたり、幾つかの構成要件が異なる形態にして組み合わされても、発明が解決しようとする課題の欄で述べた課題が解決でき、発明の効果の欄で述べられている効果が得られる場合には、この構成要件が削除されたり組み合わされた構成が発明として抽出され得るものである。
【0133】
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
【0134】
[付記1]
プロセッサを備え、
前記プロセッサは、
学習対象となる発音要素を特定し、
再生対象の音声データ内で、前記特定された発音要素を含む一部の再生区間を対象区間として特定し、
前記音声データの再生中に、前記特定された前記対象区間での再生状態を他の再生区間の再生状態に対して変化させる、
ように構成されている電子機器。
【0135】
[付記2]
前記プロセッサは、
ユーザが再生対象として任意に指定したテキストに対応する音声データを再生し、
学習モードが設定されている場合には、前記特定された対象区間での再生状態を他の再生区間の再生状態に対して変化させ、学習モードが設定されていない場合には、前記音声データの全体を同じ再生状態で再生する、
ように構成されている付記1に記載の電子機器。
【0136】
[付記3]
前記プロセッサは、
前記音声データの再生中に、前記特定された前記対象区間で再生される音声を他の再生区間で再生される音声よりも強調するか、前記特定された対象区間での再生速度を他の再生区間の再生速度よりも遅くする、
ように構成されている付記1または付記2に記載の電子機器。
【0137】
[付記4]
前記プロセッサは、
前記特定された対象区間で、音程を変えずに再生速度を変化させる話速変換により再生速度を変化させる、
ように構成されている付記1ないし付記3の何れかに記載の電子機器。
【0138】
[付記5]
前記プロセッサは、
再生対象のテキストが単語を含む場合に、前記単語に含まれる一部の発音要素の発音部分を前記対象区間として特定する第1処理と、
再生対象のテキストが文を含む場合に、前記文に含まれる一部の単語の発音部分を前記対象区間として特定する第2処理と、
再生対象のテキストが文章である場合に、前記文章に含まれる一部の文の発音部分を前記対象区間として特定する第3処理、
のうちの少なくとも1つの処理を実行する、
ように構成されている付記1乃至付記4のいずれかに記載の電子機器。
【0139】
[付記6]
前記プロセッサは、
前記第1処理と、前記第2処理と、前記第3処理、のいずれかをユーザに選択させる、
付記5に記載の電子機器。
【0140】
[付記7]
ディスプレイと、
ストレージと、を備え、
前記プロセッサは、
学習対象となる発音要素を、前記ディスプレイに表示させた複数の発音記号の中からユーザに選択させて特定するか、または前記ストレージに予め記憶された前記ユーザにとって苦手な発音要素のデータに基づき特定する、
ように構成されている付記1ないし付記6の何れかに記載の電子機器。
【0141】
[付記8]
前記ストレージは、音声データを対応付けたテキストデータを記憶し、
前記プロセッサは、
前記ストレージに記憶されたテキストデータのテキストを前記ディスプレイに表示させる、ように構成され、
前記再生対象の音声データは、前記ディスプレイに表示されたテキストの中からユーザにより任意に選択されたテキストに対応する音声データである、
付記7に記載の電子機器。
【0142】
[付記9]
前記プロセッサは、
前記音声データの前記特定された苦手な発音要素を含む再生区間を、当該苦手な発音要素としての音素を含む音素単位または単語単位または文単位の再生区間として特定する、
ように構成されている付記7または付記8に記載の電子機器。
【0143】
[付記10]
前記プロセッサは、
前記苦手な発音要素としての音素を含む音素単位または単語単位または文単位の再生区間を、ディスプレイに表示させた当該音素単位または単語単位または文単位の選択項目をユーザに選択させて特定するか、またはストレージに記憶されたユーザの語学レベルのデータに応じて特定する、
付記9に記載の電子機器。
【0144】
[付記11]
前記ストレージに予め記憶された苦手な発音要素のデータは、複数の単語を連結して構成される語句のうち、当該単語を単一で発音した場合と比較して発音が変化する発音変化語句の当該発音が変化する部分の発音要素のデータである、
付記7または付記8に記載の電子機器。
【0145】
[付記12]
前記プロセッサは、
前記音声データの前記特定された再生区間での再生速度を、当該特定された再生区間以外での再生速度よりも遅く変化させる、
ように構成されている付記1ないし付記11の何れかに記載の電子機器。
【0146】
[付記13]
前記プロセッサは、
聞き分け練習の対象となる2つの発音要素を特定し、
前記特定された2つの発音要素をそれぞれ含む2つの単語の音声データを再生する際に、前記2つの音声データそれぞれの前記2つの発音要素を含む再生区間を特定し、
前記2つの音声データの前記特定されたそれぞれの再生区間での再生速度を変化させる、
ように構成されている付記1ないし付記12の何れかに記載の電子機器。
【0147】
[付記14]
電子機器のプロセッサにより、
学習対象となる発音要素を特定し、
再生対象の音声データ内で、前記特定された発音要素を含む一部の再生区間を対象区間として特定し、
前記音声データの再生中に、前記特定された前記対象区間での再生状態を他の再生区間の再生状態に対して変化させる、
ようにした音声再生方法。
【0148】
[付記15]
電子機器のプロセッサを、
学習対象となる発音要素を特定し、
再生対象の音声データ内で、前記特定された発音要素を含む一部の再生区間を対象区間として特定し、
前記音声データの再生中に、前記特定された前記対象区間での再生状態を他の再生区間の再生状態に対して変化させる、
ように機能させるためのプログラム。
【符号の説明】
【0149】
10 …学習支援装置(電子機器)
14 …キー入力部(キーボード)
14S…[音声]キー
BS …[音声]タッチキー
15 …音声出力部
15S…本体スピーカ
17 …タッチパネル式表示部(ディスプレイ)
21 …CPU(プロセッサ)
22 …記憶部(ストレージ)
22a…学習支援処理プログラム
22b…音声再生処理プログラム
22c…学習コンテンツ記憶部
22d…辞書データ記憶部
22e…他のコンテンツ記憶部
22f…語学レベルデータ記憶部
22g…苦手発音テーブル記憶部
22h…発音変化イディオムテーブル記憶部
22i…音声再生モードデータ記憶部
22j…話速変換区間設定データ記憶部
22k…話速変換再生区間データ記憶部
23 …外部記録媒体
24 …記録媒体読取部
25 …通信部
27 …イヤホンマイク
30 …Webサーバ(プログラムサーバ)
N …通信ネットワーク(インターネット)
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12