IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 三和書籍有限会社の特許一覧

特開2023-43552電子書籍読上装置及び電子書籍読上プログラム
<>
  • 特開-電子書籍読上装置及び電子書籍読上プログラム 図1
  • 特開-電子書籍読上装置及び電子書籍読上プログラム 図2
  • 特開-電子書籍読上装置及び電子書籍読上プログラム 図3
  • 特開-電子書籍読上装置及び電子書籍読上プログラム 図4
  • 特開-電子書籍読上装置及び電子書籍読上プログラム 図5
  • 特開-電子書籍読上装置及び電子書籍読上プログラム 図6
  • 特開-電子書籍読上装置及び電子書籍読上プログラム 図7
  • 特開-電子書籍読上装置及び電子書籍読上プログラム 図8
  • 特開-電子書籍読上装置及び電子書籍読上プログラム 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023043552
(43)【公開日】2023-03-29
(54)【発明の名称】電子書籍読上装置及び電子書籍読上プログラム
(51)【国際特許分類】
   G10L 13/02 20130101AFI20230322BHJP
   G10L 13/00 20060101ALI20230322BHJP
   G10L 13/10 20130101ALI20230322BHJP
【FI】
G10L13/02 130Z
G10L13/00 100K
G10L13/10 112B
G10L13/10 111A
G10L13/10 111Z
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2021151244
(22)【出願日】2021-09-16
(71)【出願人】
【識別番号】521307266
【氏名又は名称】三和書籍有限会社
(74)【代理人】
【識別番号】100114775
【弁理士】
【氏名又は名称】高岡 亮一
(74)【代理人】
【識別番号】100121511
【弁理士】
【氏名又は名称】小田 直
(74)【代理人】
【識別番号】100208580
【弁理士】
【氏名又は名称】三好 玲奈
(74)【代理人】
【識別番号】100142158
【弁理士】
【氏名又は名称】岩田 啓
(72)【発明者】
【氏名】高橋 考
(57)【要約】
【課題】ユーザの動作や嗜好に合わせて電子書籍の読上げを行うことが可能な電子書籍読上装置を提供する。
【解決手段】電子書籍読上装置は、電子書籍のテキストデータを読み込む読込部と、読込部によって読み込まれたテキストデータを文字情報としてページごとに表示部に表示させる表示制御部と、テキストデータから合成音声に変換する音声変換部14と、合成音声を出力する音声出力部16と、音声出力部16により出力される合成音声を制御する音声制御部と、表示制御部または音声制御部に対する指示に関するユーザの操作を受付ける操作受付部15と、を有する。音声制御部は、操作受付部15が所定のページに移動する操作を受付けた場合、所定のページの先頭に対応する位置から、音声出力部16によって合成音声を出力するように制御する。
【選択図】図1

【特許請求の範囲】
【請求項1】
電子書籍のテキストデータを読み込む読込部と、
前記読込部によって読み込まれた前記テキストデータを文字情報としてページごとに表示部に表示させる表示制御部と、
前記テキストデータから合成音声に変換する音声変換部と、
前記合成音声を出力する音声出力部と、
前記音声出力部により出力される前記合成音声を制御する音声制御部と、
前記表示制御部または前記音声制御部に対する指示に関するユーザの操作を受付ける操作受付部と、を有し、
前記音声制御部は、前記操作受付部が所定のページに移動する操作を受付けた場合、前記所定のページの先頭に対応する位置から、前記音声出力部によって前記合成音声を出力するように制御する
ことを特徴とする電子書籍読上装置。
【請求項2】
前記操作受付部は、ユーザによる前記ページをめくる動作であるページめくり動作を受付けることが可能であり、
前記音声制御部は、前記ページめくり動作が行われて前記所定のページに移動した場合に、前記所定のページの先頭に対応する位置から、前記音声出力部によって前記合成音声を出力するように制御する
ことを特徴とする請求項1に記載の電子書籍読上装置。
【請求項3】
前記操作受付部は、ユーザが設定した前記合成音声の種類設定を受付けることが可能であり、
前記音声変換部は、前記種類設定に応じて、変換する前記合成音声の種類を変更する
ことを特徴とする請求項1または2に記載の電子書籍読上装置。
【請求項4】
前記操作受付部は、ユーザが設定した前記合成音声の高さ設定を受付けることが可能であり、
前記音声変換部は、前記高さ設定に応じて、変換する前記合成音声の高さを変更する
ことを特徴とする請求項1乃至3のいずれか1項に記載の電子書籍読上装置。
【請求項5】
前記操作受付部は、ユーザが設定した前記合成音声の速さ設定を受付けることが可能であり、
前記音声出力部は、前記速さ設定に応じて、出力する前記合成音声の速さを変更する
ことを特徴とする請求項1乃至4のいずれか1項に記載の電子書籍読上装置。
【請求項6】
前記操作受付部は、前記合成音声の読みの誤りを訂正するために前記テキストデータの一部を訂正する訂正設定を受付けることが可能であり、
前記音声制御部は、前記訂正設定を反映したテキストデータに基づいて前記音声変換部によって前記合成音声を変換するように制御する
ことを特徴とする請求項1乃至5のいずれか1項に記載の電子書籍読上装置。
【請求項7】
前記表示制御部は、前記文字情報を強調して前記表示部に表示させることが可能であり、
前記表示制御部は、前記音声出力部にて出力されている合成音声と対応する文を強調して表示する
ことを特徴とする請求項1乃至6のいずれか1項に記載の電子書籍読上装置。
【請求項8】
前記テキストデータを格納する記憶部をさらに有し、
前記音声変換部は、前記記憶部に格納された前記テキストデータを合成音声に変換する
ことを特徴とする請求項1乃至7のいずれか1項に記載の電子書籍読上装置。
【請求項9】
請求項1乃至8のいずれか1項に記載の電子書籍読上装置の各手段としてコンピュータを機能させることを特徴とする電子書籍読上プログラム。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、電子書籍のテキストデータを読み上げる電子書籍読上装置及び電子書籍読上プログラムに関する。
【背景技術】
【0002】
従来、テキスト読上装置は、印刷、出版業界において、文章中の誤字、脱字を検出、修正するために用いられてきた。テキストデータを文字情報として画面表示する一方で、必要に応じてテキストデータを合成音声に変換し、音声出力をする技術がある(例えば、特許文献1参照)。特許文献1では、タッチパネル等の画面に表示された文字をなぞると、なぞられた文字の部分に対応する音声合成がなされることで、音声出力される。これにより、簡便な方法で、文章の校正の一助とすることができる。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開平9-265299号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、現在は、電子書籍に付帯したPDFやePUB等の形式のデータからテキストデータを得ることができる。このため、これらのテキストデータを合成音声に変換することで、電子書籍を文字情報として読むと同時に、合成音声をも得ることができる。しかしながら、得られた全てのテキストデータを合成音声として出力させるだけでは、合成音声が電子書籍を読む動作と連動しないため、使い勝手が悪いという問題があった。
【0005】
そこで、本発明は、ユーザの動作や嗜好に合わせて電子書籍の読上げを行うことが可能な電子書籍読上装置を提供する。
【課題を解決するための手段】
【0006】
上記目的を達成するために、請求項1に係る発明は、電子書籍読上装置であって、電子書籍のテキストデータを読み込む読込部(CPU11)と、前記読込部によって読み込まれた前記テキストデータを文字情報としてページごとに表示部(表示部12)に表示させる表示制御部(CPU11)と、前記テキストデータから合成音声に変換する音声変換部(音声変換部14)と、前記合成音声を出力する音声出力部(音声出力部16)と、前記音声出力部により出力される前記合成音声を制御する音声制御部(CPU11)と、前記表示制御部または前記音声制御部に対する指示に関するユーザの操作を受付ける操作受付部(操作受付部15)と、を有し、前記音声制御部は、前記操作受付部が所定のページに移動する操作を受付けた場合、前記所定のページの先頭に対応する位置から、前記音声出力部によって前記合成音声を出力するように制御することを特徴とする。
【0007】
請求項2に係る発明は、請求項1に記載の電子書籍読上装置であって、前記操作受付部は、ユーザによる前記ページをめくる動作であるページめくり動作を受付けることが可能であり、前記音声制御部は、前記ページめくり動作が行われて前記所定のページに移動した場合に、前記所定のページの先頭に対応する位置から、前記音声出力部によって前記合成音声を出力するように制御することを特徴とする。
【0008】
請求項3に係る発明は、請求項1または2に記載の電子書籍読上装置であって、前記操作受付部は、ユーザが設定した前記合成音声の種類設定を受付けることが可能であり、前記音声変換部は、前記前記種類設定に応じて、変換する前記合成音声の種類を変更することを特徴とする。
【0009】
請求項4に係る発明は、請求項1乃至3のいずれか1項に記載の電子書籍読上装置であって、前記操作受付部は、ユーザが設定した前記合成音声の高さ設定を受付けることが可能であり、前記音声変換部は、前記高さ設定に応じて、変換する前記合成音声の高さを変更することを特徴とする。
【0010】
請求項5に係る発明は、請求項1乃至4のいずれか1項に記載の電子書籍読上装置であって、前記操作受付部は、ユーザが設定した前記合成音声の速さ設定を受付けることが可能であり、前記音声出力部は、前記速さ設定に応じて、出力する前記合成音声の速さを変更することを特徴とする。
【0011】
請求項6に係る発明は、請求項1乃至5のいずれか1項に記載の電子書籍読上装置であって、前記操作受付部は、前記合成音声の読みの誤りを訂正するために前記テキストデータの一部を訂正する訂正設定を受付けることが可能であり、前記音声制御部は、前記訂正設定を反映したテキストデータに基づいて前記音声変換部によって前記合成音声を変換するように制御することを特徴とする。
【0012】
請求項7に係る発明は、請求項1乃至6のいずれか1項に記載の電子書籍読上装置であって、前記表示制御部は、前記文字情報を強調して前記表示部に表示させることが可能であり、前記表示制御部は、前記音声出力部にて出力されている合成音声と対応する文を強調して表示することを特徴とする。
【0013】
請求項8に係る発明は、請求項1乃至7のいずれか1項に記載の電子書籍読上装置であって、前記テキストデータを格納する記憶部(記憶部13)をさらに有し、前記音声変換部は、前記記憶部に格納された前記テキストデータを合成音声に変換することを特徴とする。
【0014】
請求項9に係る発明は、電子書籍読上プログラムであって、請求項1乃至8のいずれか1項に記載の電子書籍読上装置の各手段としてコンピュータを機能させることを特徴とする。
【発明の効果】
【0015】
本発明によれば、ユーザの動作や嗜好に合わせて電子書籍の読上げを行うことができる。
【図面の簡単な説明】
【0016】
図1】電子書籍読上げシステムの全体構成図。
図2】表示部に表示される読上げ画面の一例を示す図。
図3】ページめくりがされる場合の読上げ画面の一例を示す図。
図4】ユーザ端末がテキストデータを読込んでから合成音声を出力するまでの全体の手順を説明するフローチャート。
図5】ページ変更指示の確認処理の詳細を説明するフローチャート。
図6】音声種類変更機能に係る処理を説明するフローチャート。
図7】音声高さ変更機能に係る処理を説明するフローチャート。
図8】音声速さ変更機能に係る処理を説明するフローチャート。
図9】音声内容訂正機能に係る処理を説明するフローチャート。
【発明を実施するための形態】
【0017】
以下に、本発明に係る電子書籍読上装置の好ましい実施形態を添付の図面に基づいて詳細に説明する。以下の説明では、まず、電子書籍読上装置が機能する電子書籍読上システム1の全体の構成を説明した後、電子書籍読上装置が有する各機能を順に説明する。
【0018】
電子書籍読上げシステムの全体構成を説明する。図1は、電子書籍読上システムの全体構成図である。図1に示すように、電子書籍読上システム1は、少なくとも、ユーザ端末10、電子書籍情報提供サーバ21から構成される。電子書籍読上システム1の各構成要素は、ネットワーク20を介して、相互に通信可能となっている。以下、各部について詳細に説明する。
【0019】
ユーザ端末10は、CPU11、表示部12、記憶部13、音声変換部14、操作受付部15、音声出力部16、通信部17を有する。ユーザ端末10は、本実施形態において、電子書籍読上装置の一例である。ユーザ端末10は、電子書籍を表示可能な書籍程度の大きさのタブレット端末が、書籍内容の見やすさや携帯性に優れるため好ましい。しかしながら、これに限るものではなく、少なくとも電子書籍を表示できる大きさがあればよいので、ノート型その他のPCのようなものであってもよいし、携帯電話やスマートフォンのような小型の端末でもよい。
【0020】
CPU(Central Processing Unit)11は、ユーザ端末10において起動する電子書籍読上プログラムに基づいて、ユーザ端末10内の各ハードウェア手段と協働してユーザ端末10に関連する制御を行う制御手段である。ユーザ端末10が行う処理は、CPU11によって行われる。
【0021】
その他、本実施形態では、CPU11は、ネットワーク20から電子書籍のテキストデータを読み込む読込部の機能を有する。また、CPU11は、読込部によって読み込まれたテキストデータを文字情報としてページごとに表示部12に表示させる表示制御部の機能を有する。また、CPU11は、音声出力部により出力される合成音声を制御する音声制御部の機能を有する。
【0022】
表示部12は、ユーザ端末10の画面としてのディスプレイで構成される。ディスプレイとしては、液晶ディスプレイや有機ELディスプレイ等があるが、これらに限るものではない。表示部12には、主に、CPU11からユーザへの通知内容や処理内容が表示される。表示部12は、本実施形態では、ユーザ端末10が読み込んだテキストデータを文字情報として表示する表示部として機能する。
【0023】
記憶部13は、主に、処理に関するデータを一時的に記憶するRAM(Random Access Memory)や、プログラムやデータ等を不揮発的に格納するROM(Read Only Memory)から構成される。なお、記憶部13は、必ずしもユーザ端末10の内部のものでなくともよく、USB等のコネクタを介して接続される外部記憶装置であってもよい。本実施形態にて動作する電子書籍読上プログラムは、記憶部13のROMに格納される。ただし、これに限るものではなく、記憶部13は、ネットワーク20を介して接続されるクラウドサーバの記憶部に格納されるものとしてもよい。
【0024】
音声変換部14は、ユーザ端末10が読み込んだテキストデータから合成音声を生成することで、テキストデータを合成音声に変換する。音声変換部14は、テキストデータを合成音声に変換する独自のプログラムを搭載して、独自のプロセッサによって音声変換を行う構成であってもよい。また、音声変換部14は、必ずしもユーザ端末10に搭載されるものに限るものではなく、ネットワーク20を介して接続される音声変換を行うサーバ等のコンピュータであってもよい。この場合は、CPU11が、音声変換部14との連絡を行うことで、CPU11が音声変換部として機能する。また、音声変換を行うプログラムに独自のAI(Artificial Intelligence)を搭載して、より確実な音声変換を行えるように構成することとしてもよい。
【0025】
操作受付部15は、ユーザ端末10のユーザからのCPU11に対する指示や操作の入力を受付けるものである。操作受付部15は、ユーザがユーザ端末10の操作部30等を介して入力した操作を受付ける。なお、操作受付部15が受付ける操作は、操作部30以外の入力もある。例えば、操作受付部15は、タッチパネルに対するスワイプ等のユーザの操作を総合的に受付ける。操作受付部15により受付けられた操作は、CPU11に伝えられる。操作部30の形態は、タッチパネル上に表示されたものであってもよいし、ユーザ端末10を操作し得る物理的なボタン等であってもよい。
【0026】
音声出力部16は、ユーザ端末10に付帯されるスピーカ等で構成され、音声変換部14において生成される合成音声を出力する。ユーザは、音声出力部16から出力された合成音声を聴くことで、文字情報に対応する音声情報を得る。
【0027】
通信部17は、ユーザ端末10と外部の装置やサーバとをネットワーク20を介して通信する通信インターフェースである。通信部17は、電子書籍情報提供サーバ21等、ネットワーク20に接続される各要素との間で指令のやり取りやデータの送受信が行われる。通信部17における通信は、主に無線通信にて行われるが、これに限るものではなく、有線通信を一部に用いても構わない。
【0028】
ネットワーク20は、公衆通信網であるインターネット等の通信ネットワークである。ネットワーク20には、少なくとも、ユーザ端末10、電子書籍情報提供サーバ21が接続されている。
【0029】
電子書籍情報提供サーバ21は、ネットワーク20を介してユーザ端末10と情報の送受信をする。電子書籍情報提供サーバ21は、ユーザ端末10からの電子書籍のテキストデータの送信依頼に応じて、ユーザ端末10に対して電子書籍のテキストデータを送信する。電子書籍のデータとしては、PDFやePUB等に含まれるテキストデータが一般的であるが、これ以外の形式のテキストデータ、例えばTXT等であってもよい。
【0030】
図2を用いて、ユーザ端末10の表示部12の表示画面を説明する。図2は、表示部12に表示される読上げ画面の一例を示す図である。表示部12には、ユーザ端末10において読み込まれたテキストデータが、文字情報としてページごとに表示される。本実施形態では、この文字情報は、文章であるため、ページごとに表示される表示文章41と呼ぶ。表示文章41は、書体(フォント)と文字の大きさを事前に設定可能である。表示文章41の一部で、音声情報に対応する部分(読上げ部分)は、強調表示42がなされる。
【0031】
強調表示42は、他の表示文章41の部分の表示よりも、強調された表示であり、本実施形態では、表示文章41が白地に黒文字で表示される場合に、強調表示42は、黄色等のハイライトで表示される。なお、強調表示42の具体的方法は、これに限るものではない。例えば、文字情報の周辺に網掛けがなされたり、文字情報自体を太字で表示したりすることとしてもよい。また、強調表示42は、文章中における一文単位で行われることが、ユーザの理解のし易さのため、好ましい。
【0032】
表示部12には、音声出力部16から出力される合成音声に対しての操作を入力する操作部30が表示される。操作部30では、ユーザは、合成音声の調整機能に対応した選択可能なボタンやゲージ上の目盛である。本実施形態では、操作部30を構成するものとして、音声の種類選択部31、音声の高さ選択部32、音声の速さ選択部33、音声の内容訂正選択部34、設定表示部35がある。各部は、機能が一目でわかる機能表示がなされることが好ましいが、機能表示は、ボタン、目盛、文字、アイコン、記号のいずれの表示でなされてもよい。なお、操作部30の表示は、表示部12に常に表示されている必要はなく、ユーザの何らかのユーザ端末10に対する操作に応じて、現れるものとしてもよい。また、操作部30の一部(例えば、設定表示部35)が常に表示されていて、当該一部をユーザが選択すると、図2のように複数のボタン等が表示される構成としてもよい。
【0033】
図3は、ページめくりがされる場合の読上げ画面の一例を示す図である。図3に示すように、ユーザが指Fでページめくり動作をするとき、電子書籍のページがめくられるような表示であるページめくり表示43がなされる。本実施形態では、ページめくり動作が行われて、第2ページに移動した場合に、第2ページの先頭に対応する文に、強調表示42が移動する。なお、ページめくり動作は、本実施形態のように実際の紙をめくるような動作でなくともよく、電子書籍のページをめくるために必要な操作であればよい。例えば、ページの所定の位置をタップするような動作であってもよく、音声にて次のページに移動する指示をする操作であってもよい。また、本実施形態では、ページめくり動作に伴って、あたかも紙のページがめくられるような画像効果を伴うページめくり表示43がなされたが、これに限るものではない。すなわち、ユーザによってページめくり動作がなされた場合に、紙がスライドするような画像効果がなされてもよい。同様の場合に、何の画像効果もなく次のページに移動することとしてもよい。
【0034】
次に、ユーザ端末10が有する、電子書籍を表示・操作する上での基本的機能について説明する。ユーザ端末10が有する機能は、合成音声出力機能、ページめくり連動機能、音声種類調整機能、音声高さ調整機能、音声速さ調整機能、音声内容訂正機能である。以下に詳細に説明する。
【0035】
図4は、ユーザ端末10がテキストデータを読込んでから合成音声を出力するまでの全体の手順を説明するフローチャートである。図4のフローチャートの処理は、電子書籍読上プログラムに基づいてCPU11が各部と協働して行う。
【0036】
ステップS01において、電子書籍情報提供サーバ21からユーザ端末10に電子書籍のテキストデータが読込まれる。このテキストデータの読込みは、ユーザ端末10から電子書籍情報提供サーバ21への電子書籍の提供依頼に基づいて行われてもよいし、ユーザ端末10以外からの指示によってなされてもよい。
【0037】
ステップS02において、ユーザ端末10に読込まれた電子書籍のテキストデータが格納される。格納先は、本実施形態においては、ユーザ端末10が有する記憶部13であるが、これに限るものではない。以上が、電子書籍読上げのための予備的な手順となる。なお、電子書籍の一部のみを合成音声に変換する場合には、ステップS02の工程にて、電子書籍一冊分の全てのテキストデータを格納する必要はない。ただし、電子書籍のテキストデータをユーザ端末10の記憶部13に格納しておくことで、ネットワーク20に接続していない場合であっても、合成音声に変換することが可能となる。
【0038】
<合成音声出力機能>
次に、ステップS10の音声出力フローに移行する。音声出力フローを具体的に説明する。音声出力フローの処理は、ユーザ端末10において電子書籍がユーザにより閲覧されている場合に、CPU11によってなされる。
【0039】
ステップS11において、CPU11が、ユーザ端末10において音声出力設定(ユーザにより音声出力をすることの設定)がされているか否かを判断する。音声出力設定がされている場合、ステップS12に遷移する。一方、音声出力設定がされていない場合、音声出力フローは、終了する。
【0040】
ステップS12において、音声出力指示があるか否かを判断する。音声出力指示がある場合とは、ユーザによる音声出力指示があった場合の他、ユーザが電子書籍を閲覧している場合など、音声出力をすることが適切な場合であってもよい。音声出力指示がある場合、ステップS13に遷移する。一方、音声出力指示がない場合は、音声出力指示があるまで待機する。
【0041】
ステップS13において、テキストデータが合成音声データに変換される。この合成音声データへの変換は、本実施形態においては、ユーザ端末10の音声変換部14が用いられる。ただし、合成音声への変換の主体は、必ずしもユーザ端末10に搭載された音声変換部14でなくともよく、ネットワーク20を介して接続される合成音声変換サービス等であってもよい。また、ここでは、テキストデータの全てを合成音声データに変換することとしているが、これに限るものではない。例えば、テキストデータの一部のみを合成音声データに変換することとしてもよい。この場合、後述の音声出力の開始位置を取得する工程を経てから、所定の長さのテキストデータを所定の長さの合成音声データへ変換することとしてもよい。
【0042】
ステップS14において、CPU11は、合成音声データの中から音声出力の開始位置を決定する。開始位置の決定の基準としては、ユーザにより所定のページが指定された場合は、その所定のページの先頭となる。また、表示部12に表示されている電子書籍のページの先頭など、予め電子書籍読上プログラムに設定されている場合には、設定されているページの先頭が開始位置となる。
【0043】
ステップS15において、CPU11は、変換された合成音声データを、音声出力の開始位置から出力する。合成音声の出力は、音声出力部16を用いて行われる。音声出力は、特に、ユーザ等からページ変更指示等の操作がない限り継続する。
【0044】
ステップS16において、ステップS15の音声出力が継続している状況で、ページ変更指示の有無を確認をする。ページ変更指示の詳細については後述する。
【0045】
ステップS17において、ステップS16におけるページ変更指示があった場合には、ステップS14に戻り、ページ変更指示内容に基づいて、新たに音声出力を開始する。一方、ステップS17において、ステップS16におけるページ変更指示がないと判断した場合には、音声出力フローは終了する。
【0046】
<ページめくり連動機能>
次に、ページめくり連動機能を、上述のステップS16のページ変更指示の確認についての説明を行う中で説明する。図5は、ページ変更指示の確認処理の詳細を説明するフローチャートである。ページ変更指示の確認処理は、音声出力が継続している場合において、なんらかのページ変更の指示がユーザからなされたか否かを確認する処理である。
【0047】
ステップS161において、CPU11は、ページめくり動作が操作受付部15により受付けられたか否かを判断する。ページめくり動作とは、ユーザによる電子書籍のページをめくる動作である。ページめくり動作があった場合は、ステップS162に遷移する。一方、ページめくり動作がなかった場合は、ステップS163に遷移する。
【0048】
ステップS162では、ページめくり動作がされた場合におけるめくり先のページへの変更指示があったとする。例えば、図3の例においては、ユーザの指Fがめくった先が第2ページとなるので、第2ページへの変更指示があったとする。この場合、上述のステップS17において、第2ページへの変更指示があったとされ、ステップS14において、音声出力の開始位置が第2ページの先頭に対応する位置となる。これにより、合成音声が、第2ページの先頭に対応する位置から出力される。これが、ページめくり連動機能である。
【0049】
ステップS163において、CPU11は、ユーザによるページ指示があるか否かを判断する。ページ指示は、不図示の入力画面にて行われる。ユーザがページ数を入力すると、CPU11は、ユーザによるページ指示があったことを把握する。ユーザによるページ指示があった場合は、ステップS164に遷移する。一方、ユーザによるページ指示がなかった場合は、ステップS165に遷移する。
【0050】
ステップS164において、ユーザによるページ指示があった場合、ページ指示に係るページへの変更指示があったとする。この場合、上述のステップS17において、ページ指示に係るページへの変更指示があったとされ、ステップS14において、音声出力の開始位置がページ指示に係るページの先頭に対応する位置となる。これにより、合成音声が、ページ指示に係るページの先頭に対応する位置から出力される。
【0051】
ステップS165において、CPU11は、音声出力の終了位置に到達か否かを判断する。音声出力の終了位置とは、必ずしも電子書籍の最後の文言に対応する位置に限らず、電子書籍における章の最後などであってもよい。音声出力の終了位置に到達した場合、ステップS166にて、変更指示がなかったと判断する。一方、音声出力の終了位置に到達していない場合は、ステップS161に戻って、ユーザからのページ変更指示を再度確認する。
【0052】
<音声種類調整機能>
次に、音声種類調整機能について説明する。図6は、音声種類変更機能に係る処理を説明するフローチャートである。音声種類調整機能では、例えば、女性音声、男性音声を選択することができる。なお、音声の種類は、必ずしも性別の種類に応じたものでなくともよい。
【0053】
ステップS21において、音声種類変更画面を表示部12に表示する。音声種類変更画面は、本実施形態では、図2における音声の種類選択部31である。本実施形態においては、種類選択部31として、男性音声のボタンと女性音声のボタンとから構成され、いずれかをユーザが選択することで、出力される合成音声の種類が決定する。
【0054】
ステップS22において、CPU11は、音声種類変更指示があったか否かを判断する。すなわち、現在設定の音声種類とは異なる音声種類へ変更する指示があったか否かを判断する。音声種類変更指示があった場合は、ステップS23へ遷移する。一方、音声種類変更指示がなかった場合は、ステップS24へ遷移する。
【0055】
ステップS23において、変更後の音声種類へ変更する。すなわち、この設定の後に合成音声を出力する場合は、変更後の音声種類にて合成音声を出力する。例えば、音声種類が、女性音声から男性音声へ変更された場合、この後に出力される合成音声は、男性音声にて出力される。
【0056】
ステップS24において、音声種類の変更はなされず、現在設定中の音声種類にて合成音声が出力される。例えば、現在設定中の音声種類が女性音声であった場合、この後に出力される合成音声は、女性音声にて出力される。
【0057】
<音声高さ調整機能>
次に、音声高さ調整機能について説明する。図7は、音声高さ変更機能に係る処理を説明するフローチャートである。音声高さ調整機能では、より声帯振動数が高いまたは低いような声にすることができる。高さ調整は、例えば、初期設定の音声高さ(上記音声種類にて選択した声の高さ)を基準として、本実施形態では、上は5段階、下は4段階の高さから選択することができる。なお、高さの種類は、必ずしもこれに限るものではない。また、本実施形態では、各段階に対応する数値が記載されていないが、対応する数値を記載してもよい。例えば、本実施形態において、各目盛に左から、0.2、0.4、0.6、0.8、1.0、1.2、1.4、1.6、1.8、2.0、のような数字を付してもよい。
【0058】
ステップS31において、音声高さ変更画面を表示部12に表示する。音声高さ変更画面は、本実施形態では、図2における音声の高さ選択部32である。本実施形態においては、本実施形態においては、音声の高さ選択部32として、低音から高音まで10段階の目盛が表示され、いずれかの目盛をユーザが選択することで、出力される合成音声の高さが決定する。
【0059】
ステップS32において、CPU11は、音声高さ変更指示があったか否かを判断する。すなわち、現在設定の音声高さとは異なる音声高さへ変更する指示があったか否かを判断する。音声高さ変更指示があった場合は、ステップS33へ遷移する。一方、音声高さ変更指示がなかった場合は、ステップS34へ遷移する。
【0060】
ステップS33において、変更後の音声高さへ変更する。すなわち、この設定の後に合成音声を出力する場合は、変更後の音声高さにて合成音声を出力する。例えば、音声速さを高速にすると音声が高く聞こえることがあるが、このような場合に、音声高さを現在設定値よりも低く調整することで、より自然な音声で出力することができる。
【0061】
ステップS34においては、音声高さの変更はなされず、現在設定中の音声高さにて合成音声が出力される。
【0062】
<音声速さ調整機能>
次に、音声速さ調整機能について説明する。図8は、音声速さ変更機能に係る処理を説明するフローチャートである。音声速さ調整機能では、合成音声の出力速度(読上速度)を初期設定より速くまたは遅くすることができる。速さ調整は、初期設定の速さと比較して、0.5倍速、等速(1.0倍速)、1.5倍速、2倍速、2.5倍速、3倍速、3.5倍速、4倍速、4.5倍速、5倍速、5.5倍速、6倍速、6.5倍速、7倍速、7.5倍速、8倍速から選択することができる。本実施形態では、0.5倍速ごとに速めることができる。なお、速さの種類は、必ずしもこれに限るものではない。また、本実施形態では、各倍速に対応する数値が記載されていないが、対応する数値を記載してもよい。例えば、本実施形態において、各目盛に左から順に、0.5倍速から8倍速までの数字を付してもよい。
【0063】
ステップS41において、音声速さ変更画面を表示部12に表示する。音声速さ変更画面は、本実施形態では、図2における音声の速さ選択部33である。本実施形態において、音声の速さ選択部33には、低速から高速まで16段階の目盛が表示され、いずれかの目盛をユーザが選択することで、出力される合成音声の速さが決定する。
【0064】
ステップS42において、CPU11は、音声速さ変更指示があったか否かを判断する。すなわち、現在設定の音声速さとは異なる音声速さへ変更する指示があったか否かを判断する。音声速さ変更指示があった場合は、ステップS43へ遷移する。一方、音声速さ変更指示がなかった場合は、ステップS44へ遷移する。
【0065】
ステップS43において、変更後の音声速さへ変更する。すなわち、この設定の後に合成音声を出力する場合は、変更後の音声速さにて合成音声を出力する。
【0066】
ステップS44においては、音声速さの変更はなされず、現在設定中の音声速さにて合成音声が出力される。
【0067】
<音声内容訂正機能>
次に、音声内容訂正機能について説明する。図9は、音声内容訂正機能に係る処理を説明するフローチャートである。音声内容訂正機能では、合成音声の内容を訂正することができる。具体的には、テキストデータに含まれる単語の読みを、合成音声データに変換される過程で間違えて変換されてしまった場合に、正しい読みをユーザが入力することで、音声の内容を訂正する。なお、訂正の方法は、必ずしもこれに限るものではない。ここで、正しい読みを入力した場合、その読み方を、すべての合成音声データに反映してもいいし、テキストデータを訂正した箇所に対応する合成音声データのみ、訂正内容を反映することとしてもよい。
【0068】
ステップS51において、音声内容訂正画面を表示部12に表示する。音声内容訂正画面は、本実施形態では、図2における音声の内容訂正選択部34である。
【0069】
ステップS52において、CPU11は、音声内容訂正指示があったか否かを判断する。すなわち、現在設定の音声内容(読み方)とは異なる音声内容へ変更する指示があったか否かを判断する。音声内容訂正指示があった場合は、ステップS53へ遷移する。一方、音声内容訂正指示がなかった場合は、ステップS54へ遷移する。
【0070】
ステップS53において、変更後の音声内容へ変更する。すなわち、この設定の後に合成音声を出力する場合は、変更後の音声内容にて合成音声を出力する。なお、音声内容の訂正があった場合、訂正箇所のみの読みを変更することもできるし、訂正箇所に対応する読みを、すべての合成音声データに反映することもできるように、必要に応じて選択可能に設定することが好ましい。
【0071】
ステップS54においては、音声内容の訂正はなされず、現在設定中の音声内容にて合成音声が出力される。
【0072】
以上のように、本実施形態によれば、CPU11が、操作受付部15が所定のページに移動する操作を受付けた場合、所定のページの先頭に対応する位置から、音声出力部16によって合成音声を出力するように制御する。このため、ユーザによって移動したページから合成音声が出力されるので、ユーザが電子書籍を読む動作と連動して、ユーザは合成音声を聴くことができる。これにより、ユーザ端末10は、ユーザの動作や嗜好に合わせて電子書籍の読上げを行うことが可能な電子書籍読上装置となる。
【0073】
また、本実施形態によれば、操作受付部15は、ユーザによるページめくり動作を受付けることが可能な構成である。また、CPU11は、ページめくり動作が行われて所定のページに移動した場合に、所定のページの先頭に対応する位置から、音声出力部16によって合成音声を出力するように制御する。このため、ユーザのページめくり動作と連動して、ユーザは合成音声を聴くことができる。
【0074】
また、本実施形態によれば、操作受付部15は、ユーザが設定した合成音声の種類設定を受付けることが可能であり、音声変換部14は、種類設定に応じて、変換する合成音声の種類を変更する。これにより、ユーザは、ユーザの好みの合成音声の種類に対応した合成音声を聴くことができる。
【0075】
また、本実施形態によれば、操作受付部15は、ユーザが設定した合成音声の高さ設定を受付けることが可能であり、音声変換部14は、高さ設定に応じて、変換する合成音声の高さを変更する。これにより、ユーザは、ユーザの好みの合成音声の高さに対応した合成音声を聴くことができる。
【0076】
また、本実施形態によれば、操作受付部15は、ユーザが設定した合成音声の速さ設定を受付けることが可能であり、音声出力部16は、速さ設定に応じて、出力する合成音声の速さを変更する。これにより、ユーザは、ユーザの好みの合成音声の速さに対応した合成音声を聴くことができる。
【0077】
また、本実施形態によれば、操作受付部15は、合成音声の読みの誤りを訂正するためにテキストデータの一部を訂正する訂正設定を受付けることが可能であり、CPU11は、訂正設定を反映したテキストデータに基づいて音声変換部14によって合成音声を変換するように制御する。これにより、テキストデータの合成音声への変換過程での誤りを訂正することができる。
【0078】
また、本実施形態によれば、CPU11は、文字情報を強調して表示部12に表示させることが可能であり、CPU11は、音声出力部16にて出力されている合成音声と対応する文を強調して表示する。これにより、ユーザは、電子書籍に表示されているどの文が、出力される合成音声と対応しているかを容易に把握することができる。
【0079】
また、本実施形態によれば、テキストデータを格納する記憶部13を有し、音声変換部14は、記憶部13に格納されたテキストデータを合成音声に変換する。このように、テキストデータをユーザ端末10の記憶部13に格納することで、ネットワーク20に接続されていなくとも、ユーザ端末10の音声変換部14にて合成音声に変換することができる。
【0080】
[その他の実施形態]
以上、本発明の好ましい実施形態について説明したが、本発明は、これらの実施形態に限定されず、その要旨の範囲内で種々の変形及び変更が可能である。特に、それぞれの実施形態や変形例の構成は、可能な範囲で相互に適用することができる。
【0081】
本発明は、上述の実施形態の1つ以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。
【符号の説明】
【0082】
10…ユーザ端末、11…CPU、12…表示部、13…記憶部、14…音声変換部、15…操作受付部、16…音声出力部、21…電子書籍情報提供サーバ、30…操作部、41…表示文章、42…強調表示

図1
図2
図3
図4
図5
図6
図7
図8
図9