IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 溝口 さとしの特許一覧

特許7121411二次元コードエンコーダ及び教育用二次元コード読取装置
<>
  • 特許-二次元コードエンコーダ及び教育用二次元コード読取装置 図1
  • 特許-二次元コードエンコーダ及び教育用二次元コード読取装置 図2
  • 特許-二次元コードエンコーダ及び教育用二次元コード読取装置 図3
  • 特許-二次元コードエンコーダ及び教育用二次元コード読取装置 図4
  • 特許-二次元コードエンコーダ及び教育用二次元コード読取装置 図5
  • 特許-二次元コードエンコーダ及び教育用二次元コード読取装置 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-08-09
(45)【発行日】2022-08-18
(54)【発明の名称】二次元コードエンコーダ及び教育用二次元コード読取装置
(51)【国際特許分類】
   G09B 5/04 20060101AFI20220810BHJP
   G09B 19/06 20060101ALI20220810BHJP
   G09B 19/04 20060101ALI20220810BHJP
   G10L 13/00 20060101ALI20220810BHJP
   G10L 13/10 20130101ALI20220810BHJP
   G06F 3/16 20060101ALI20220810BHJP
【FI】
G09B5/04
G09B19/06
G09B19/04
G10L13/00 100R
G10L13/10 112B
G06F3/16 690
G06F3/16 610
【請求項の数】 4
(21)【出願番号】P 2020171231
(22)【出願日】2020-10-09
(65)【公開番号】P2022062983
(43)【公開日】2022-04-21
【審査請求日】2020-12-04
(73)【特許権者】
【識別番号】594160485
【氏名又は名称】溝口 さとし
(74)【代理人】
【識別番号】110002022
【氏名又は名称】弁理士法人コスモ国際特許事務所
(72)【発明者】
【氏名】溝口 ▲さとし▼
【審査官】前地 純一郎
(56)【参考文献】
【文献】特開2010-256821(JP,A)
【文献】特開2020-027132(JP,A)
【文献】特開2005-321706(JP,A)
【文献】特開2019-061442(JP,A)
【文献】特開2015-114559(JP,A)
【文献】中国特許出願公開第108091182(CN,A)
(58)【調査した分野】(Int.Cl.,DB名)
G09B 1/00- 9/56
G09B 17/00-19/26
G10L 13/00-13/10
G10L 19/00-99/00
(57)【特許請求の範囲】
【請求項1】
複数人に対応する複数のテキスト情報を表示可能なディスプレイと、
前記複数のテキスト情報が音声のデータに音声合成されるデータと、前記テキスト情報を音声のデータとして読み上げる際に選択させる話者及び言語とを、当該話者及び言語に関するタグにより関連付けるタグ付回路と、
前記タグ付回路により関連付けられた前記音声合成されるデータ並びに前記話者及び前記言語に関するタグを二次元コードに符号化する二次元符号化回路と、
を備えることを特徴とする二次元コードエンコーダ。
【請求項2】
複数人に対応する複数のテキスト情報が音声のデータに音声合成されるデータと、前記テキスト情報を音声のデータとして読み上げる際に選択される話者とが前記テキスト情報を読み上げる声質の種類を示す当該話者に関するタグにより関連付けられて符号化された二次元コードを撮像する撮像装置と、
前記撮像装置で撮像した前記二次元コードに基づいて、前記音声合成されるデータ及び前記話者に関するタグにデコードするデコード回路と、
前記デコード回路でデコードされた前記音声合成されるデータ及び前記話者に関するタグに基づいて、前記話者に関するタグに対応する前記声質を選択して、前記音声合成されるデータを、前記音声のデータに音声合成する音声合成回路と、
前記音声合成回路で音声合成された音声を出力するスピーカと、
を備えることを特徴とする教育用二次元コード読取装置。
【請求項3】
前記デコード回路でデコードされた前記音声合成されるデータの前記複数のテキスト情報を表示するディスプレイを、さらに備える
ことを特徴とする請求項2に記載の教育用二次元コード読取装置。
【請求項4】
前記テキスト情報は、言語に関するタグに関連付けられており、
前記音声合成回路は、前記複数のテキスト情報を複数の前記言語に関するタグに基づいて読み上げる言語を選択して、前記音声合成されるデータを前記音声のデータに音声合成する、
ことを特徴とする請求項2または3に記載の教育用二次元コード読取装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、二次元コードエンコーダ及び教育用二次元コード読取装置に関する。
【背景技術】
【0002】
近年、QRコード(登録商標)に関連する二次元コードが、様々な分野で利用されている。例えば、カメラ付き携帯電話などの情報処理装置を利用して、QRコードを撮像し、QRコードの情報を認識することができる。一般的には、QRコードの情報にはURLが記録されており、詳細な情報が表示可能なサイトへのアクセスを容易にする。
【0003】
また、QRコードに関し、情報処理装置にテキスト情報のデータやイメージデータを格納し、QRコードに関連付けられたテキスト情報を音声合成によって読み上げる装置も検討されている。例えば、特許文献1に記載された二次元コードの読取装置は、読取装置が二次元コードを解析し、二次元コードに関連付けられたテキスト情報を複数の言語で音声合成する旨が開示されている。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2015-114559号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
上述した特許文献1に開示されている二次元コードの読取装置は、予め関連付けられた複数の言語でテキスト情報を音声合成することができる。ここで、近年、音声合成による音質が改善・向上し、従来よりもデジタル合成音声の品質が高くなっている。そのため、複数人に対応する音声合成による音声を出力し、語学教育での活用に最適な音声合成読取装置が望まれるようになってきた。
【0006】
本発明は、上記課題に鑑みてなされたものであり、複数人に対応する音声合成により、語学教育において効果的に学習することのできる二次元コードエンコーダ及び教育用二次元コード読取装置を提供することを目的としている。
【課題を解決するための手段】
【0007】
本発明の実施形態に係る二次元コードエンコーダは、複数人に対応する複数のテキスト情報を表示可能なディスプレイと、前記複数のテキスト情報が音声のデータに音声合成されるデータと、前記テキスト情報を音声のデータとして読み上げる際に選択させる話者及び言語とを、当該話者及び言語に関するタグにより関連付けるタグ付回路と、前記タグ付回路により関連付けられた前記音声合成されるデータ並びに前記話者及び前記言語に関するタグを二次元コードに符号化する二次元符号化回路と、を備えることを特徴とする。
【0008】
本発明の実施形態に係る教育用二次元コード読取装置は、複数人に対応する複数のテキスト情報が音声のデータに音声合成されるデータと、前記テキスト情報を音声のデータとして読み上げる際に選択させる話者とが当該話者に関するタグにより関連付けられて符号化された二次元コードを撮像する撮像装置と、前記撮像装置で撮像した前記二次元コードに基づいて、前記音声合成されるデータ及び前記話者に関するタグにデコードするデコード回路と、前記デコード回路でデコードされた前記音声合成されるデータ及び前記話者に関するタグに基づいて、前記話者に関するタグに対応する声質を選択して、前記音声合成されるデータを、前記音声のデータに音声合成する音声合成回路と、前記音声合成回路で音声合成された音声を出力するスピーカと、を備えることを特徴とする。
【発明の効果】
【0009】
本発明によれば、複数人に対応する音声合成により、語学教育において効果的に学習することができる。
【図面の簡単な説明】
【0010】
図1】本発明の実施形態に係る二次元エンコーダと、教育用二次元コード読取装置の構成を示した説明図であり、(a)は、二次元エンコーダの構成を示し、(b)は、教育用二次元コード読取装置の構成を示している。
図2】本発明の実施形態に係る二次元エンコーダが、二次元コードを生成する二次元コード生成処理の動作を示したフローチャートである。
図3】本発明の実施形態に係る二次元エンコーダのディスプレイ上で、ワープロソフトを使用して、英会話教材として使用するテキストを作成し、そのテキストにおけるテキスト情報に音声のデータとして読み上げる話者に関するタグを付す操作の一例を示した図であり、(a)は、二次元エンコーダのワープロソフトで作成された英会話教材のテキストを示しており、(b)は、テキストの複数の英語の文章(テキスト情報)に音声のデータとして読み上げる話者のタグを付し、二次元コードを生成するまでのディスプレイ上の操作画面を示した図である。
図4】本発明の実施形態に係る教育用二次元コード読取装置が、二次元コードの画像データを撮像して、その二次元コードをデコードする二次元コードデコード処理の動作を示したフローチャートである。
図5】本発明の実施形態に係る教育用二次元コード読取装置が、紙媒体の英会話教材のテキストに貼付された二次元コードを読み取って、音声合成の音声を出力する状態を示す説明図であり、(a)は、二次元コードが貼付された英会話教材のテキストを示したものであり、(b)は、教育用二次元コード読取装置の音声合成の音声を出力中の状態を示した説明図である。
図6】本発明の実施形態に係る二次元エンコーダにおいて、複数の言語に対応し、テキスト情報の言語に対応する言語で音声合成するための二次元コードの設定を示した説明図である。
【発明を実施するための形態】
【0011】
以下、本発明の実施形態について、図を用いて説明する。図1は、本発明の実施形態に係る二次元エンコーダ101と、教育用二次元コード読取装置102の構成を示した説明図である。図1(a)は、二次元エンコーダ101の構成を示し、図1(b)は、教育用二次元コード読取装置102の構成を示している。
【0012】
図1(a)に示す二次元エンコーダ101と図1(b)に示す教育用二次元コード読取装置102は、それぞれ情報処理装置100の構成(機能)により実現することができる。また、教育用二次元コード読取装置102は、図1(a)に示す二次元エンコーダ101の構成を更に備えることもできる。なお、二次元エンコーダ101と教育用二次元コード読取装置102とにおいて、同一の構成要素については同一の符号を付し、説明を適宜、省略する。
【0013】
図1(a)に示す二次元エンコーダ101は、ディスプレイ10、記憶回路12、タグ付回路14、入力回路16、二次元符号化回路18及び内部バス19を備えている。
【0014】
ディスプレイ10は、液晶ディスプレイ(LCD:Liquid Crystal Display)によって構成され、タッチパネルが積層されて形成される。ディスプレイ10は、複数人に対応する複数のテキスト情報を表示する。また、ディスプレイ10は、表示される複数のテキスト情報に関連付けてイメージデータの画像を表示することもできる。また、ディスプレイ10は、入力回路16による入力機能も備えている。
【0015】
記憶回路12は、ROM(Read Only Memory)、RAM(Random Access Memory)及びHDD(Hard Disk Drive)等を含む記憶装置により構成される。記憶回路12は、複数人に対応する複数のテキスト情報のデータを格納する。また、記憶回路12は、ディスプレイ10に表示可能なイメージデータを格納する。
【0016】
入力回路16は、ディスプレイ10に積層されたタッチパネルに対するユーザの操作を検出し、ユーザの操作の内容を示す情報をタグ付回路14に入力する。即ち、ユーザの操作に従った入力信号は、入力回路16からタグ付回路14に送られる。
【0017】
タグ付回路14は、複数のテキスト情報が音声のデータに音声合成されるデータと、テキスト情報を音声のデータとして読み上げる話者とを、その話者に関するタグにより関連付ける。ここで、話者に関するタグは、テキスト情報を読み上げる声質の種類を示すものである。そのため、音声合成されるデータに対し、話者に関するタグによって関連付けることにより、その音声合成されるデータに関連付けられた話者により音声合成することができる。なお、音声合成されるデータとは、音声合成されるテキスト情報のデータを意味し、また、音声合成されるテキスト情報のデータの所在と関連付けられるデータであってもよい。なお、テキスト情報のデータは、記憶回路12に格納されているものとする。
【0018】
二次元符号化回路18は、タグ付回路14により関連付けられた音声合成されるデータ及び話者に関するタグを二次元コードに符号化する。なお、内部バス19は、各構成要素に接続されている。
【0019】
一方、図1(b)に示す教育用二次元コード読取装置102は、記憶回路12、撮像装置20、デコード回路22、ディスプレイ10、音声合成回路24、スピーカ26、画像生成回路28、入力回路16及び内部バス29を備えている。
【0020】
撮像装置20は、CCD(Charge Coupled Device)イメージスキャナーにより形成され、二次元コードを撮像する。撮像された二次元コードは、複数人に対応する複数のテキスト情報が音声のデータに音声合成されるデータと、テキスト情報を音声のデータとして読み上げる話者とがその話者に関するタグにより関連付けられて符号化されている。
【0021】
デコード回路22は、撮像装置20で撮像した二次元コードに基づいて、音声のデータに音声合成されるデータ及び話者に関するタグにデコード(復号化)する。
【0022】
入力回路16は、ディスプレイ10に積層されたタッチパネルに対するユーザの操作を検出し、ユーザの操作の内容を示す情報を音声合成回路24に入力する。即ち、ユーザの操作に従った入力信号は、入力回路16から音声合成回路24に送られる。
【0023】
音声合成回路24は、デコード回路22でデコードされた音声合成されるデータ及び話者に関するタグに基づいて、話者に関するタグに対応する声質で、音声合成されるデータを、音声のデータに音声合成する。音声合成は、教育用二次元コード読取装置102の記憶回路12に記憶されているTTS(Text to Speech)プログラムにより行うことができる。
【0024】
スピーカ26は、音声合成回路24で音声合成された音声を出力する。
【0025】
画像生成回路28は、任意の構成要素であって、音声合成されるデータを音声合成回路24において音声合成している間、音声合成されているデータのテキスト情報や、表示可能なイメージデータの画像を生成し、ディスプレイ10に表示させることができる。
【0026】
ディスプレイ10は、任意の構成要素であって、デコード回路22でデコードされた音声合成されるデータに対応する複数のテキスト情報を表示することができる。また、ディスプレイ10は、画像生成回路28で生成されたイメージデータの画像を表示することもできる。なお、内部バス29は、各構成要素に接続されている。
【0027】
(二次元コード生成処理)
次に、本発明の実施形態に係る二次元エンコーダ101において、二次元コードを生成する二次元コード生成処理について、図2に示すフローチャートを用いて説明する。
【0028】
まず、二次元エンコーダ101は、音声合成により自動的に読み上げるテキスト情報をディスプレイ10に表示する(ステップS001)。二次元エンコーダ101は、ワープロソフトを起動して、テキスト情報の入力を受け付ける。ユーザは、ディスプレイ10上でタッチパネルを操作し、入力回路16によりテキスト情報を入力する。二次元エンコーダ101のディスプレイ10上には、テキスト情報の内容である英語の文章が表示される。
【0029】
次に、二次元エンコーダ101は、複数のテキスト情報が音声のデータに音声合成されるデータと、テキスト情報を音声のデータとして読み上げる話者とを、話者に関するタグにより関連付ける(ステップS003)。この場合、ユーザがディスプレイ10上でタッチパネルを操作して、テキスト情報ごとにそれぞれ話者に関するタグを付ける。以下に、テキスト情報ごとにタグを付ける操作方法について、図面を用いて説明する。
【0030】
図3は、二次元エンコーダ101のディスプレイ10上で、ワープロソフトを使用して、英会話教材として使用するテキストを作成して、そのテキストにおけるテキスト情報に、音声のデータとして読み上げる話者に関するタグを付す操作の一例を示している。なお、図3(a)は、二次元エンコーダ101のワープロソフトで作成された英会話教材のテキストTXT1を示している。図3(b)は、テキストTXT1の複数の英語の文章(テキスト情報)に音声のデータとして読み上げる話者のタグを付し、二次元コードを生成するまでのディスプレイ10上の操作画面を示している。
【0031】
図3(a)に示す二次元エンコーダ101のディスプレイ10には、ワープロソフトのテキストTXT1と、二次元エンコーダ101の独自の機能であるエンコードダイアログボックスEDとが表示される。テキストTXT1が作成された段階で、図3(a)に示すエンコードダイアログボックスEDが押圧されると、図3(b)に示す話者のタグを付し二次元コードを生成するための操作画面に移行する。
【0032】
ここで、二次元エンコーダ101は、図3(a)に示すエンコードダイアログボックスEDが押圧されたとき、テキストTXT1の内容が図3(b)に示す会話エリアECにコピーされ、図3(b)の操作画面において、複数の英語の文章(テキスト情報SN1~SN5)と、その英語の文章(テキスト情報SN1~SN5)を読み上げる話者との関連付けを受け付ける。
【0033】
この場合、二次元エンコーダ101は、まず英語の文章(テキスト情報SN1)を読み上げる話者E1を設定する。会話エリアECにおいて、話者の選択はプルダウンメニューで選択できるものとし、話者W1の欄において、話者E1,E2の中から話者E1を選択する。
【0034】
二次元エンコーダ101は、英語の文章(テキスト情報SN1)を読み上げる話者として、話者W1の欄において話者E1に選択した後、ディスプレイ10の会話エリアECの右側にある話者設定ボタンTBがユーザにより押圧されると、英語の文章(テキスト情報SN1)と、話者E1とが関連付けられる。即ち、英語の文章(テキスト情報SN1)の音声合成されるデータと、英語の文章(テキスト情報SN1)を音声データとして読み上げる話者E1とが、タグにより関連付けられる。
【0035】
同様に、英語の文章(テキスト情報SN2)を読み上げる話者として、話者W2の欄において話者E2に選択した後、話者設定ボタンTBがユーザにより押圧されると、英語の文章(テキスト情報SN2)と、話者E2とが関連付けられる。この場合、英語の文章(テキスト情報SN2)の音声合成されるデータと、英語の文章(テキスト情報SN2)を音声のデータとして読み上げる話者E2とが、タグにより関連付けられる。
【0036】
このタグの関連付けを、英語の文章(テキスト情報SN1)から英語の文章(テキスト情報SN5)まで繰り返して、複数の英語の文章(テキスト情報SN1~SN5)に音声合成されるデータと、英語の文章(テキスト情報SN1~SN5)を音声のデータとして読み上げる話者E1,E2とを、タグにより関連付ける。
【0037】
なお、会話エリアECの英語の文章(テキスト情報SN1~SN5)の修正や変更を行う場合には、英語の文章(テキスト情報SN1~SN5)をユーザが直接修正して、文章設定ボタンSBがユーザにより押圧されると、タグの関連付けを維持したまま、修正した内容が反映される。なお、この時同時に、テキストTXT1の対応する英語の文章も修正内容が反映されるものとする。また、話者の数は一例として2人の場合について説明しているが、この人数に限定されるものではなく、1人又は3人以上でも適用可能である。
【0038】
図2のフローチャートに戻り、二次元エンコーダ101は、ディスプレイ10の会話エリアECにおいて、複数の英語の文章(テキスト情報SN1~SN5)が音声のデータに音声合成されるデータと、英語の文章(テキスト情報SN1~SN5)を音声のデータとして読み上げる話者E1,E2とがタグにより関連付けられると、二次元コードの生成を受け付ける(ステップS005)。
【0039】
二次元エンコーダ101のディスプレイ10は、図3(b)に示す二次元コードを生成するコード生成ボタンGNがユーザにより押圧されると、タグ付回路14により関連付けられた音声合成されるデータ及び話者に関するタグを二次元コードに符号化する(ステップS005)。
【0040】
そして、二次元エンコーダ101は、符号化された二次元コードCEXを生成すると、図3(a)に示すテキストTXT1の下欄に相当する位置に、グレースケール画像による二次元コードCEXが貼付される。二次元エンコーダ101は、二次元コードCEXを、グレースケール画像として出力することができ、ワープロソフトや表計算ソフトで作成された表示可能なデータに視覚的に貼付することができる。本発明の実施形態の場合には、ディスプレイ10上で表示されるテキストTXT1の下欄に貼付する。
【0041】
二次元エンコーダ101は、二次元符号化回路18で符号化した二次元コードCEXを記憶回路12に保存するとともに、二次元コードCEXが貼付されたテキストTXT1を上書きして記憶回路12に保存し(ステップS007)、二次元コード生成処理を終了する。
【0042】
これにより、本発明の実施形態に係る二次元コードCEXは、テキストTXT1に貼付された状態で紙媒体に印刷されたり、情報処理装置100のディスプレイ10に表示されると、グレースケール画像として符号化された、音声合成されるデータ及び話者に関するタグの情報として提供される。
【0043】
(二次元コードデコード処理)
次に、本発明の実施形態に係る教育用二次元コード読取装置102が、符号化された二次元コードCEXを撮像して、その撮像した二次元コードCEXをデコードする二次元コードデコード処理について、図4に示すフローチャートを用いて説明する。
【0044】
まず、教育用二次元コード読取装置102は、二次元コードCEXが英会話教材のテキストTXT2に貼付され、紙媒体として印刷されたテキストTXT2の二次元コードCEXを撮像装置20により撮像して、二次元コードCEXを取得する(ステップS101)。教育用二次元コード読取装置102は、撮像によって、複数人に対応する複数の英語の文章(テキスト情報SN1~SN5)が音声合成されるデータと、英語の文章(テキスト情報SN1~SN5)を音声のデータとして読み上げる話者E1,E2とが、話者に関するタグにより関連付けられて符号化された二次元コードを取得する。
【0045】
教育用二次元コード読取装置102は、取得した二次元コードCEXに基づいて、画像を切り出す画像切り出し処理を行う(ステップS103)。
【0046】
教育用二次元コード読取装置102は、切り出した画像(撮像装置20で撮像した二次元コードCEXの一部)に基づいて、デコード回路22で音声のデータに音声合成されるデータ(テキスト情報SN~SN5のデータ)及び話者に関するタグにデコードする(ステップS105)。
【0047】
教育用二次元コード読取装置102は、デコード回路22でデコードされた音声合成されるデータ(テキスト情報SN~SN5のデータ)及び話者に関するタグに基づいて、話者に関するタグに対応する声質で、音声合成されるデータ(テキスト情報SN~SN5のデータ)を、音声のデータに音声合成する。そして、教育用二次元コード読取装置102は、音声合成回路24で音声合成された音声をスピーカ26から出力する(ステップS107)。
【0048】
図5は、教育用二次元コード読取装置102が、紙媒体のテキストTXT2の二次元コードCEXを読み取って、音声合成の音声を出力する状態を示した説明図である。図5(a)は、二次元コードCEXが貼付された紙媒体の英会話教材のテキストTXT2を示したものであり、図5(b)は、教育用二次元コード読取装置102の音声合成の音声を出力中の状態を示している。この場合、教育用二次元コード読取装置102の会話エリアECでは、複数の英語の文章(テキスト情報SN1~SN5)が表示され、話者欄T1~T5に示す話者に従って、音声合成された音声が出力される。
【0049】
教育用二次元コード読取装置102は、複数のテキスト情報SN1~SN5のデータの音声合成の音声の出力が終了すると、二次元コードデコード処理を終了する。
【0050】
以上説明したように、本発明の実施形態に係る二次元エンコーダ101は、複数のテキスト情報が音声のデータに音声合成されるデータ(テキスト情報SN1~SN5のデータ)と、テキスト情報(テキスト情報SN1~SN5)を音声のデータとして読み上げる話者とを、話者に関するタグにより関連付け、音声のデータに音声合成されるデータ(テキスト情報SN1~SN5のデータ)及び話者に関するタグを二次元コードに符号化する。
【0051】
一方、本発明の実施形態に係る教育用二次元コード読取装置102は、撮像装置20で撮像した二次元コードに基づいて、音声のデータに音声合成されるデータ(テキスト情報SN1~SN5のデータ)及び話者に関するタグにデコードし、デコードされた音声合成されるデータ(テキスト情報SN1~SN5のデータ)及び話者に関するタグに基づいて、話者に関するタグに対応する声質で、音声合成されるデータ(テキスト情報SN1~SN5のデータ)を、音声のデータに音声合成する。
【0052】
このように、本発明の実施形態によれば、教育用二次元コード読取装置102は、複数人の話者E1,E2に対応する音声のデータに音声合成されるデータ(テキスト情報SN1~SN5のデータ)を音声合成して、その音声を出力することができるので、語学教育において効果的に学習することができる。
【0053】
また、本発明の実施形態では、話者に関するタグに基づいて、話者に関するタグに対応する声質で、音声合成されるデータ(テキスト情報SN1~SN5のデータ)を、音声のデータに音声合成するようになっていた。本実施形態では、さらに、デコード回路22でデコードされた複数のテキスト情報をディスプレイ10に表示することができる。
【0054】
図5(b)に示すように、教育用二次元コード読取装置102は、ディスプレイ10の会話エリアECに複数の英語の文章(テキスト情報SN1~SN5)と、画像エリアIMGに画像とを出力することができる。このため、教育用二次元コード読取装置102は、例えば、複数の英語の文章(テキスト情報SN1~SN5)を音声合成と同期させ、音声合成のタイミングに合わせたテロップ表示を行うことができる。これにより、より一層、語学を効率的に学習することができる。
【0055】
また、本発明の実施形態に係る二次元エンコーダ101及び教育用二次元コード読取装置102は、テキストTXT1の英語の文章(テキスト情報SN1~SN5)の言語と、音声合成回路24により音声合成される言語は同一の言語である。ここで、テキストTXT1における文章(テキスト情報SN1~SN5)と、音声合成される音声の出力が同一の言語で対応していれば、英語以外の言語であっても適用することができる。即ち、音声合成回路24は、複数の言語に対応し、予め設定された言語により、音声合成されるデータ(テキスト情報SN1~SN5のデータ)を、音声のデータに音声合成することができる。
【0056】
図6は、本発明の実施形態に係る二次元エンコーダ101Aにおいて、複数の言語に対応し、複数の文章(テキスト情報SN1~SN5)に対応する言語で音声合成するための二次元コードの設定を示した説明図である。なお、二次元エンコーダ101Aの内部構成は、図1(a)の二次元エンコーダ101と同様とすることができる。
【0057】
図6に示すように、二次元エンコーダ101Aは、音声合成する言語を選択する言語選択LSをさらに備えるようになっている。二次元エンコーダ101Aは、言語選択LSにおいて、英語EN、仏語FR又は伊語IT等の複数の言語から何れかを選択することにより、タグ付回路14は、複数のテキスト情報SN1~SN5と、複数の話者と、複数の言語を示すタグとを対応させて、二次元符号化回路18により二次元コードCEXに符号化することができる。このように、音声合成されるデータを複数の言語でタグにより関連付けることができる。なお、話者を示すタグと言語を示すタグとは、一つのタグとして又は複数の組み合わせたタグとして付与することができる。
【0058】
教育用二次元コード読取装置102は、上述の二次元エンコーダ101Aによって符号化された二次元コードCEXを読み取る際に、音声合成されるデータ(テキスト情報SN1~SN5)毎にタグが示す話者及び言語を選択して、TTSプログラムを実行することができる。したがって、教育用二次元コード読取装置102は、二次元コードCEXを読み取ることで、複数のテキスト情報SN1~SN5(音声合成されるデータ)を、エンコードの際にタグ付けされた複数の異なる言語により音声合成することができる。
【0059】
例えば、二次元エンコーダ101Aが言語選択LSにおいて、仏語FRを選択した場合には、二次元コードCEXには仏語FRで音声合成する旨の設定が符号化され、教育用二次元コード読取装置102の音声合成回路24は、仏語FRにより音声合成する。同様に、二次元エンコーダ101Aが伊語ITを選択した場合には、二次元コードCEXには伊語ITで音声合成する旨の設定が符号化され、教育用二次元コード読取装置102の音声合成回路24は、伊語ITにより音声合成する。
【0060】
また、複数のテキスト情報SN1~SN5を複数の言語で関連付けた二次元コードCEXは、図5(a)に示したような紙媒体の教材のテキストTXT2に印字や貼付により表示させておくことができる。これにより、二次元コードCEXを読み取った教育用二次元コード読取装置102から音声が出力されるので、あたかもテキストTXT2から発音されたように教材を利用でき、例えばテキストTXT2に描画された人物等の絵が発声するように構成することができる。
【0061】
このように、本発明の実施形態に係る二次元エンコーダ101A及び教育用二次元コード読取装置102は、テキスト情報の言語に対応する言語によって音声合成することができるので、語学教育において、より柔軟な語学の学習方法を提供することができる。さらに、教育用二次元コード読取装置102において自動翻訳機能を備え、例えば、英語ENから仏語FRへの自動翻訳読み上げや、仏語FRから伊語ITへの自動翻訳読み上げを行うようにしてもよい。
【0062】
また、本発明の実施形態において、二次元エンコーダ101と教育用二次元コード読取装置102は、テキスト情報SN1~SN5のデータやイメージデータの画像を記憶回路12に格納するようになっていたが、本実施形態は、これに限定されるものではない。例えば、テキスト情報SN1~SN5のデータやイメージデータの画像は、二次元エンコーダ101又は教育用二次元コード読取装置102を構成する情報処理装置100の外部記憶回路として、USB(Universal Serial Bus)メモリにデータが格納されるようにしてもよく、また、ネットワークを介して、外部記憶装置にイメージデータが記憶されるようにしてもよい。
【0063】
なお、教育用二次元コード読取装置102は、スピーカ26から音声合成された音声を出力する際に、ディスプレイ10に現在位置を示す画像を拡張現実画像としてリアルタイムに表示させてもよい。現在位置を示す画像としては、GPS信号で取得した現在位置を含めた地図画像としたり、撮像装置20により撮像して取得した教育用二次元コード読取装置102の周辺の画像としてもよい。
【0064】
また、教育用二次元コード読取装置102は、スピーカ26から音声合成された音声を出力する際に、ディスプレイ10にその音声に関連する仮想現実画像を表示させてもよい。教育用二次元コード読取装置102は、内像するジャイロセンサ等の姿勢検出器により教育用二次元コード読取装置102のディスプレイ10の向いている方角や傾きによって仮想現実画像の表示を変動させることができる。なお、ディスプレイ10に表示させる拡張現実画像や仮想現実画像にはスピーカ26から出力される音声のテキスト情報を重畳して表示させてもよい。また、拡張現実画像や仮想現実画像は、教育用二次元コード読取装置102の記憶回路12内に予め記憶しておくことができる。
【0065】
以上示した実施形態によると、教育用二次元コード読取装置102は、二次元コードを撮像してその二次元コードに含まれるテキスト情報を所望の話者による声質でスピーカから出力させることができる。今日における地球規模で展開するインターネット社会は、国際組織のような多言語社会であり、教育現場においてもこのような多言語社会に対応させることが望まれる。本実施形態の教育用二次元コード読取装置102を用いた語学教育システムは、このような多言語社会に対応して、語学教育における学習を効果的に行うことができる。
【0066】
また、以上説明した実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の趣旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これらの実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
【符号の説明】
【0067】
10 ディスプレイ 12 記憶回路
14 タグ付回路 16 入力回路
18 二次元符号化回路 19,29 内部バス
20 撮像装置 22 デコード回路
24 音声合成回路 26 スピーカ
28 画像生成回路
100 情報処理装置 101 二次元エンコーダ
102 教育用二次元コード読取装置
BT 設定画面ボタン SN1~SN5 文章(テキスト情報)
IMG 画像エリア IS 画像設定ボタン
SB 文章設定ボタン TB 話者設定ボタン
GN コード生成ボタン LS 言語選択項目
EN 英語 FR 仏語
IT 伊語 E1,E2 話者
図1
図2
図3
図4
図5
図6