特開2019-194834 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ＳｐｅｅｃｈＮｅｗｓ株式会社の特許一覧

特開2019-194834テキスト読み上げ再生装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】特開2019-194834(P2019-194834A)

(43)【公開日】2019年11月7日

(54)【発明の名称】テキスト読み上げ再生装置

(51)【国際特許分類】

G06F 3/16 20060101AFI20191011BHJP

G10L 13/00 20060101ALI20191011BHJP

G10L 15/10 20060101ALI20191011BHJP

G10L 13/02 20130101ALI20191011BHJP

【ＦＩ】

G06F3/16 690

G10L13/00 100K

G10L15/10 200W

G10L13/02 130Z

G06F3/16 630

G06F3/16 540

【審査請求】未請求

【請求項の数】29

【出願形態】ＯＬ

【全頁数】70

(21)【出願番号】特願2018-224150(P2018-224150)

(22)【出願日】2018年11月29日

(31)【優先権主張番号】特願2018-86418(P2018-86418)

(32)【優先日】2018年4月27日

(33)【優先権主張国】JP

(71)【出願人】

【識別番号】517307636

【氏名又は名称】ＳｐｅｅｃｈＮｅｗｓ株式会社

(74)【代理人】

【識別番号】110000408

【氏名又は名称】特許業務法人高橋・林アンドパートナーズ

(72)【発明者】

【氏名】吉井清敏

(57)【要約】（修正有）

【課題】ユーザにとって利便性の向上したデータ音声再生装置を提供する。
【解決手段】データ音声再生装置１０は、テキストデータ又はＨＴＭＬデータの読み上げ再生を行うデータ音声再生部１０２と、データ音声再生部がデータを読み上げ再生中に、ユーザの音声による命令を受信する音声受信部１０３と、音声受信部が音声による命令内容を認識する音声認識部１０４を有する。データ音声再生装置は、音声認識部によって認識された命令内容に応じて、テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止し、音声による命令内容を実行し、音声による命令内容を実行した後、テキストデータ又はＨＴＭＬデータの読み上げ再生を再開する。テキストデータ又はＨＴＭＬデータの読み上げ再生が再開される場合、データ音声再生部は読み上げ再生が一時停止されたテキストデータ又はＨＴＭＬデータの位置よりも前の位置から読み上げ再生を再開する。
【選択図】図２

【特許請求の範囲】

【請求項1】

単一または複数のコンテンツからなるテキストデータ又はＨＴＭＬデータの読み上げ再生を行うデータ音声再生部と、
前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータを読み上げ再生中に、ユーザの音声による命令を受信する音声受信部と、
前記音声受信部が受信した前記音声による命令内容を認識する音声認識部を有し、
前記音声認識部によって認識された命令内容に応じて、前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止し、前記音声による命令内容を実行し、
前記音声による命令内容を実行した後、テキストデータ又はＨＴＭＬデータの読み上げ再生を再開するデータ音声再生装置であって、
前記テキストデータ又はＨＴＭＬデータの読み上げ再生が再開される場合、前記データ音声再生部は読み上げ再生が一時停止されたテキストデータ又はＨＴＭＬデータの位置よりも前の位置から前記テキストデータ又はＨＴＭＬデータの読み上げ再生を再開することを特徴とするデータ音声再生装置。

【請求項2】

単一または複数のコンテンツからなるテキストデータ又はＨＴＭＬデータの読み上げ再生を行うデータ音声再生部と、
前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータを読み上げ再生中に、ユーザの音声による命令を受信する音声受信部と、
前記音声受信部が受信した前記音声による命令内容を認識する音声認識部を有し、
前記音声認識部によって認識された命令内容に応じて、前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止し、前記音声による命令内容を実行し、
前記音声による命令内容を実行した後、テキストデータ又はＨＴＭＬデータの読み上げ再生を再開するデータ音声再生装置であって、
前記テキストデータ又はＨＴＭＬデータの読み上げ再生が再開される場合、前記読み上げ再生が再開されるテキストデータ又はＨＴＭＬデータの位置は、前記音声受信部が受信した前記ユーザの音声による命令が発話された時点に対応する前記テキストデータ又はＨＴＭＬデータと同じ位置もしくはそれよりも前の位置であることを特徴するデータ音声再生装置。

【請求項3】

単一または複数のコンテンツからなるテキストデータ又はＨＴＭＬデータの読み上げ再生を行うデータ音声再生部と、
前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータを読み上げ再生中に、ユーザの音声による命令を受信する音声受信部と、
前記音声受信部が受信した前記音声による命令内容を認識する音声認識部と、
前記テキストデータ又はＨＴＭＬデータにおいて、一文または文節の単位を識別する識別部を有し、
前記音声認識部によって認識された命令内容に応じて、前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止し、前記音声による命令内容を実行し、
前記音声による命令内容を実行した後、テキストデータ又はＨＴＭＬデータの読み上げ再生を再開するデータ音声再生装置であって、
前記テキストデータ又はＨＴＭＬデータの読み上げ再生が再開される場合、前記読み上げ再生が再開されるテキストデータ又はＨＴＭＬデータの位置は、前記音声受信部が受信した前記ユーザの音声による命令が発話された時点に対応する前記テキストデータ又はＨＴＭＬデータと同じ位置よりも前に位置する一文または文節の先頭であることを特徴するデータ音声再生装置。

【請求項4】

データを保存する保存領域を有し、
前記音声認識部によって認識された命令内容がテキストデータ又はＨＴＭＬデータの保存命令である場合、前記音声受信部が前記ユーザの音声による命令を受信したときの読み上げ再生対象のコンテンツに対応するテキストデータ又はＨＴＭＬデータである保存対象を前記保存領域に保存する保存部をさらに有することを特徴する請求項１〜３のいずれかに記載のデータ音声再生装置。

【請求項5】

前記保存部により前記保存領域に前記保存対象が保存されると、音声により保存完了通知を発する保存完了通知部をさらに有することを特徴とする請求項４に記載のデータ音声再生装置。

【請求項6】

テキストデータ又はＨＴＭＬデータの読み上げ再生の音量を調整する音量調整部をさらに有し、
前記音声認識部によって認識された命令内容がテキストデータ又はＨＴＭＬデータの読み上げ再生の音量の調節命令である場合、前記音量調整部は前記音量の調節命令に応じて音量を調節することを特徴する請求項１〜３のいずれかに記載のデータ音声再生装置。

【請求項7】

前記保存領域に保存された前記テキストデータ又はＨＴＭＬデータを表示する表示部をさらに有することを特徴とする請求項４又は５に記載のデータ音声再生装置。

【請求項8】

検索語に関連する情報を収集する検索部と前記検索部によって収集された前記検索語に関連する情報を音声により通知する情報通知部をさらに有し、
前記音声認識部により認識された前記音声による命令内容が前記検索語に関連する情報の取得である場合、前記検索部は前記検索語に関連する情報を収集し、前記情報通知部により前記検索部により収集された前記検索語に関連する情報を音声により通知することを特徴とする請求項１〜３のいずれかに記載のデータ音声再生装置。

【請求項9】

単一または複数のコンテンツからなるテキストデータ又はＨＴＭＬデータの読み上げ再生を行うデータ音声再生部と、
前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータの読み上げ再生中または読み上げ再生を一時停止している間、ユーザの音声による命令を受信する音声受信部と、
前記音声受信部が受信した前記音声による命令内容を認識する音声認識部を有するデータ音声再生装置であって、
前記音声認識部によって認識された命令内容が前記テキストデータ又はＨＴＭＬデータの音声再生の一時停止である場合、前記データ音声再生部は前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止し、
前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止している間に前記音声認識部によって認識された命令内容が前記テキストデータ又はＨＴＭＬデータの読み上げ再生の再開である場合、前記データ音声再生部は前記テキストデータ又はＨＴＭＬデータの音声再生が一時停止された位置よりも前の位置から前記テキストデータ又はＨＴＭＬデータの読み上げ再生を再開することを特徴とするデータ音声再生装置。

【請求項10】

単一または複数のコンテンツからなるテキストデータ又はＨＴＭＬデータの読み上げ再生を行うデータ音声再生部と、
前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータの読み上げ再生中または読み上げ再生を一時停止している間、ユーザの音声による命令を受信する音声受信部と、
前記音声受信部が受信した前記音声による命令内容を認識する音声認識部を有するデータ音声再生装置であって、
前記音声認識部によって認識された命令内容が前記テキストデータ又はＨＴＭＬデータの音声再生の一時停止である場合、前記データ音声再生部は前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止し、
前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止している間に前記音声認識部によって認識された命令内容が前記テキストデータ又はＨＴＭＬデータの読み上げ再生の再開である場合に、前記読み上げ再生が再開されるテキストデータ又はＨＴＭＬデータの位置は、前記音声受信部が受信した前記ユーザの音声による命令が発話された時点に対応する前記テキストデータ又はＨＴＭＬデータと同じ位置もしくはそれよりも前の位置であることを特徴するデータ音声再生装置。

【請求項11】

単一または複数のコンテンツからなるテキストデータ又はＨＴＭＬデータの読み上げ再生を行うデータ音声再生部と、
前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータの読み上げ再生中または読み上げ再生を一時停止している間、ユーザの音声による命令を受信する音声受信部と、
前記テキストデータ又はＨＴＭＬデータにおいて、一文または文節の単位を識別する識別部と、
前記音声受信部が受信した前記音声による命令内容を認識する音声認識部を有するデータ音声再生装置であって、
前記音声認識部によって認識された命令内容が前記テキストデータ又はＨＴＭＬデータの読み上げ再生の一時停止である場合、前記データ音声再生部は前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止し、
前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止している間に前記音声認識部によって認識された命令内容が前記テキストデータ又はＨＴＭＬデータの読み上げ再生の再開である場合に、前記読み上げ再生が再開されるテキストデータ又はＨＴＭＬデータの位置は、前記音声受信部が受信した前記ユーザの音声による命令が発話された時点に対応する前記テキストデータ又はＨＴＭＬデータの位置よりも前に位置する一文または文節の先頭であることを特徴するデータ音声再生装置。

【請求項12】

単一または複数のコンテンツからなるテキストデータ又はＨＴＭＬデータを読み上げ再生し、前記読み上げ再生を一時停止後に読み上げ再生を再開するデータ音声再生部及び通話のための通信を行う通話部を有する無線通信端末であって、
前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータを読み上げ再生中に前記通話部が通話の着信を受けて通話のための通信が開始すると、前記データ音声再生部は前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止し、
前記通話部による通話のための通信が終了すると、前記データ音声再生部はテキストデータ又はＨＴＭＬデータの読み上げ再生が一時停止された位置よりも前の位置から前記テキストデータ又はＨＴＭＬデータの読み上げ再生を再開することを特徴とする無線通信端末。

【請求項13】

単一または複数のコンテンツからなるテキストデータ又はＨＴＭＬデータを読み上げ再生し、前記読み上げ再生を一時停止した後に読み上げ再生を再開するデータ音声再生部及び通話のための通信を行う通話部を有する無線通信端末であって、
前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータを読み上げ再生中に前記通話部が通話の着信を受けて通話のための通信が開始すると、前記データ音声再生部は前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止し、
前記通話部による通話のための通信が終了すると、前記データ音声再生部は、前記通話部が前記通話の着信を受けた時点に対応する前記テキストデータ又はＨＴＭＬデータと同じ位置もしくはそれよりも前の位置から前記テキストデータ又はＨＴＭＬデータの読み上げ再生を再開することを特徴する無線通信端末。

【請求項14】

単一または複数のコンテンツからなるテキストデータ又はＨＴＭＬデータを読み上げ再生し、前記読み上げ再生を一時停止後に読み上げ再生を再開するデータ音声再生部と、通話のための通信を行う通話部と、前記テキストデータ又はＨＴＭＬデータにおいて、一文または文節の単位を識別する識別部を有する無線通信端末であって、
前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータを読み上げ再生中に前記通話部が通話の着信を受けて通話のための通信が開始すると、前記データ音声再生部は前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止し、
前記通話部による通話のための通信が終了すると、
前記データ音声再生部は、前記通話部が前記通話の着信を受けた時点に対応する前記テキストデータ又はＨＴＭＬデータの位置よりも前に位置する一文または文節の先頭から前記テキストデータ又はＨＴＭＬデータの読み上げ再生を再開することを特徴する無線通信端末。

【請求項15】

単一または複数のコンテンツからなるテキストデータ又はＨＴＭＬデータを読み上げ再生し、前記読み上げ再生を一時停止した後に読み上げ再生を再開するデータ音声再生部と、前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止している間ユーザの音声による命令を受信する音声受信部と、前記音声受信部が前記音声による命令内容を認識する音声認識部と、通話のための通信を行う通話部を有する無線通信端末であって、
前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータを読み上げ再生中に前記通話部が通話の着信を受けて通話のための通信が開始すると、前記データ音声再生部は前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止し、
前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止している間に前記音声受信部が受信したユーザの音声による命令の内容が前記音声認識部によって前記テキストデータ又はＨＴＭＬデータの読み上げ再生の再開であると認識された場合、
前記データ音声再生部はテキストデータ又はＨＴＭＬデータの読み上げ再生が一時停止された位置よりも前の位置から前記テキストデータ又はＨＴＭＬデータの読み上げ再生を再開することを特徴とする無線通信端末。

【請求項16】

単一または複数のコンテンツからなるテキストデータ又はＨＴＭＬデータを読み上げ再生し、前記読み上げ再生を一時停止後に読み上げ再生を再開するデータ音声再生部と、前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止している間、ユーザの音声による命令を受信する音声受信部と、前記音声受信部が前記音声による命令内容を認識する音声認識部と、通話のための通信を行う通話部と、前記テキストデータ又はＨＴＭＬデータにおいて、一文または文節の単位を識別する識別部を有する無線通信端末であって、
前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータを読み上げ再生中に前記通話部が通話の着信を受けて通話のための通信が開始すると、前記データ音声再生部は前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止し、
前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止している間に前記音声受信部が受信したユーザの音声による命令の内容が前記音声認識部によって前記テキストデータ又はＨＴＭＬデータの読み上げ再生の再開または読み上げ再生の一時停止の解除であると認識された場合、前記データ音声再生部は、前記通話部が前記通話の着信を受けた時点に対応する前記テキストデータ又はＨＴＭＬデータの位置よりも前に位置する一文または文節の先頭から前記テキストデータ又はＨＴＭＬデータの読み上げ再生を再開することを特徴する無線通信端末。

【請求項17】

単一または複数のコンテンツからなるテキストデータ又はＨＴＭＬデータの読み上げ再生を行い、前記読み上げ再生を一時停止した後に読み上げ再生を再開するデータ音声再生部と、前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止している間読み上げ再生の一時停止の解除コマンド又は読み上げ再生の再開コマンドを受け付けるコマンド受付部と、通話のための通信を行う通話部を有する無線通信端末であって、
前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータを読み上げ再生中に前記通話部が通話の着信を受けて通話のための通信が開始すると、前記データ音声再生部は前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止し、
前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止している間に、前記コマンド受付部が前記読み上げ再生の一時停止の解除コマンド又は前記読み上げ再生の再開コマンドを受け付けると、
前記データ音声再生部はテキストデータ又はＨＴＭＬデータの読み上げ再生が一時停止された位置よりも前の位置から前記テキストデータ又はＨＴＭＬデータの読み上げ再生を再開することを特徴とする無線通信端末。

【請求項18】

単一または複数のコンテンツからなるテキストデータ又はＨＴＭＬデータの読み上げ再生、前記読み上げ再生の一時停止、前記読み上げ再生の一時停止した後に読み上げ再生を再開するデータ音声再生部と、前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止している間、読み上げ再生の一時停止の解除コマンド又は読み上げ再生の再開のコマンドを受け付けるコマンド受付部と、通話のための通信を行う通話部と、前記テキストデータ又はＨＴＭＬデータにおいて、一文または文節の単位を識別する識別部を有する無線通信端末であって、
前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータを読み上げ再生中に前記通話部が通話の着信を受けて通話のための通信が開始すると、前記データ音声再生部は前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止し、
前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止している間に、前記コマンド受付部が読み上げ再生の一時停止の解除コマンド又は読み上げ再生の再開コマンドを受け付けると、
前記データ音声再生部はテキストデータ又はＨＴＭＬデータの読み上げ再生が一時停止された位置よりも前に位置する一文または文節の先頭から前記テキストデータ又はＨＴＭＬデータの読み上げ再生を再開することを特徴とする無線通信端末。

【請求項19】

単一または複数のコンテンツからなるテキストデータ又はＨＴＭＬデータの読み上げ再生を行うデータ音声再生部と、
ユーザの音声による命令を受信する音声受信部と、
前記音声受信部が受信したユーザの音声による命令の音声信号と前記データ音声再生部が再生した音声の音声信号に基づいて、前記音声受信部が受信したユーザの音声による命令の音声信号に対応する処理済み音声信号を生成する既再生成分除去部と、
前記既再生成分除去部が生成する前記処理済み音声信号に基づいて、前記音声受信部が受信した前記音声による命令内容を認識する音声認識部を有し、
前記音声認識部によって認識された命令内容に応じて、前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止し、前記音声による命令内容を実行し、
前記音声による命令内容を実行した後、テキストデータ又はＨＴＭＬデータの読み上げ再生を再開するデータ音声再生装置であって、
前記テキストデータ又はＨＴＭＬデータの読み上げ再生が再開される場合、前記データ音声再生部は読み上げ再生が一時停止されたテキストデータ又はＨＴＭＬデータの位置よりも前の位置から前記テキストデータ又はＨＴＭＬデータの読み上げ再生を再開することを特徴とするデータ音声再生装置。

【請求項20】

単一または複数のコンテンツからなるテキストデータ又はＨＴＭＬデータの読み上げ再生を行うデータ音声再生部と、
ユーザの音声による命令を受信する音声受信部と、
前記音声受信部が受信したユーザの音声による命令の音声信号と前記データ音声再生部が再生した音声の音声信号に基づいて、前記音声受信部が受信したユーザの音声による命令の音声信号に対応する処理済み音声信号を生成する既再生成分除去部と、
前記既再生成分除去部が生成する前記処理済み音声信号に基づいて、前記音声受信部が受信した前記音声による命令内容を認識する音声認識部を有し、
前記音声認識部によって認識された命令内容に応じて、前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止し、前記音声による命令内容を実行し、
前記音声による命令内容を実行した後、テキストデータ又はＨＴＭＬデータの読み上げ再生を再開するデータ音声再生装置であって、
前記テキストデータ又はＨＴＭＬデータの読み上げ再生が再開される場合、前記読み上げ再生が再開されるテキストデータ又はＨＴＭＬデータの位置は、前記音声受信部が受信した前記ユーザの音声による命令が発話された時点に対応する前記テキストデータ又はＨＴＭＬデータと同じ位置もしくはそれよりも前の位置であることを特徴するデータ音声再生装置。

【請求項21】

単一または複数のコンテンツからなるテキストデータ又はＨＴＭＬデータの読み上げ再生を行うデータ音声再生部と、
ユーザの音声による命令を受信する音声受信部と、
前記音声受信部が受信したユーザの音声による命令の音声信号と前記データ音声再生部が再生した音声の音声信号に基づいて、前記音声受信部が受信したユーザの音声による命令の音声信号に対応する処理済み音声信号を生成する既再生成分除去部と、
前記既再生成分除去部が生成する前記処理済み音声信号に基づいて、前記音声受信部が受信した前記音声による命令内容を認識する音声認識部を有し、
前記テキストデータ又はＨＴＭＬデータにおいて、一文または文節の単位を識別する識別部を有し、
前記音声認識部によって認識された命令内容に応じて、前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止し、前記音声による命令内容を実行し、
前記音声による命令内容を実行した後、テキストデータ又はＨＴＭＬデータの読み上げ再生を再開するデータ音声再生装置であって、
前記テキストデータ又はＨＴＭＬデータの読み上げ再生が再開される場合、前記読み上げ再生が再開されるテキストデータ又はＨＴＭＬデータの位置は、前記音声受信部が受信した前記ユーザの音声による命令が発話された時点に対応する前記テキストデータ又はＨＴＭＬデータと同じ位置よりも前に位置する一文または文節の先頭であることを特徴とするデータ音声再生装置。

【請求項22】

単一または複数のコンテンツからなるテキストデータ又はＨＴＭＬデータの読み上げ再生を行うデータ音声再生部と、
ユーザの音声による命令を受信する音声受信部と、
前記音声受信部が受信したユーザの音声による命令の音声信号と前記データ音声再生部が再生した音声の音声信号に基づいて、前記音声受信部が受信したユーザの音声による命令の音声信号に対応する処理済み音声信号を生成する既再生成分除去部と、
前記既再生成分除去部が生成する前記処理済み音声信号に基づいて、前記音声受信部が受信した前記音声による命令内容を認識する音声認識部を有するデータ音声再生装置であって、
前記音声認識部によって認識された命令内容が前記テキストデータ又はＨＴＭＬデータの音声再生の一時停止である場合、前記データ音声再生部は前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止し、
前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止している間に前記音声認識部によって認識された命令内容が前記テキストデータ又はＨＴＭＬデータの読み上げ再生の再開である場合、前記データ音声再生部は前記テキストデータ又はＨＴＭＬデータの音声再生が一時停止された位置よりも前の位置から前記テキストデータ又はＨＴＭＬデータの読み上げ再生を再開することを特徴とするデータ音声再生装置。

【請求項23】

単一または複数のコンテンツからなるテキストデータ又はＨＴＭＬデータの読み上げ再生を行うデータ音声再生部と、
ユーザの音声による命令を受信する音声受信部と、
前記音声受信部が受信したユーザの音声による命令の音声信号と前記データ音声再生部が再生した音声の音声信号に基づいて、前記音声受信部が受信したユーザの音声による命令の音声信号に対応する処理済み音声信号を生成する既再生成分除去部と、
前記既再生成分除去部が生成する前記処理済み音声信号に基づいて、前記音声受信部が受信した前記音声による命令内容を認識する音声認識部を有するデータ音声再生装置であって、
前記音声認識部によって認識された命令内容が前記テキストデータ又はＨＴＭＬデータの音声再生の一時停止である場合、前記データ音声再生部は前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止し、
前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止している間に前記音声認識部によって認識された命令内容が前記テキストデータ又はＨＴＭＬデータの読み上げ再生の再開である場合に、前記読み上げ再生が再開されるテキストデータ又はＨＴＭＬデータの位置は、前記音声受信部が受信した前記ユーザの音声による命令が発話された時点に対応する前記テキストデータ又はＨＴＭＬデータと同じ位置もしくはそれよりも前の位置であることを特徴するデータ音声再生装置。

【請求項24】

単一または複数のコンテンツからなるテキストデータ又はＨＴＭＬデータの読み上げ再生を行うデータ音声再生部と、
ユーザの音声による命令を受信する音声受信部と、
前記音声受信部が受信したユーザの音声による命令の音声信号と前記データ音声再生部が再生した音声の音声信号に基づいて、前記音声受信部が受信したユーザの音声による命令の音声信号に対応する処理済み音声信号を生成する既再生成分除去部と、
前記テキストデータ又はＨＴＭＬデータにおいて、一文または文節の単位を識別する識別部と、
前記既再生成分除去部が生成する前記処理済み音声信号に基づいて、前記音声受信部が受信した前記音声による命令内容を認識する音声認識部を有するデータ音声再生装置であって、
前記音声認識部によって認識された命令内容が前記テキストデータ又はＨＴＭＬデータの読み上げ再生の一時停止である場合、前記データ音声再生部は前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止し、
前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止している間に前記音声認識部によって認識された命令内容が前記テキストデータ又はＨＴＭＬデータの読み上げ再生の再開である場合に、前記読み上げ再生が再開されるテキストデータ又はＨＴＭＬデータの位置は、前記音声受信部が受信した前記ユーザの音声による命令が発話された時点に対応する前記テキストデータ又はＨＴＭＬデータの位置よりも前に位置する一文または文節の先頭であることを特徴するデータ音声再生装置。

【請求項25】

ユーザから読み上げ再生開始命令の入力を受けると、前記音声受信部に音声受信開始命令を送る再生指示入力部をさらに含み、
前記音声受信部は、前記音声受信開始命令を受信すると、前記ユーザの音声による命令の受信を開始する請求項１９から２４のいずれかに記載のデータ音声再生装置。

【請求項26】

データを保存する保存領域を有し、
前記音声認識部によって認識された命令内容がテキストデータまたはＨＴＭＬデータの保存命令である場合、前記音声受信部が前記ユーザの音声による命令を受信したときの読み上げ再生対象のコンテンツに対応するテキストデータ又はＨＴＭＬデータである保存対象を前記保存領域に保存する保存部と、
前記音声認識部によって認識された命令内容がテキストデータまたはＨＴＭＬデータの保存命令であり、前記音声受信部が前記ユーザの音声による命令を受信したときの読み上げ再生対象のコンテンツに対応するテキストデータ又はＨＴＭＬデータである保存対象が前記保存領域に保存されている場合、保存済み通知を発する保存済み通知部とを有する請求項１９から２１のいずれかに記載のデータ音声再生装置。

【請求項27】

テキストデータ又はＨＴＭＬデータの読み上げ再生の音量を調整する音量調整部をさらに有し、
前記音声認識部によって認識された命令内容がテキストデータ又はＨＴＭＬデータの読み上げ再生の音量の調節命令である場合、前記音量調整部は前記音量の調節命令に応じて音量を調節することを特徴する請求項１９から２１のいずれかに記載のデータ音声再生装置。

【請求項28】

検索語に関連する情報を収集する検索部と前記検索部によって収集された前記検索語に関連する情報を音声により通知する情報通知部をさらに有し、
前記音声認識部により認識された前記音声による命令内容が前記検索語に関連する情報の取得である場合、前記検索部は前記検索語に関連する情報を収集し、前記情報通知部により前記検索部により収集された前記検索語に関連する情報を音声により通知することを特徴とする請求項１９から２１のいずれかに記載のデータ音声再生装置。

【請求項29】

単一または複数のコンテンツからなるテキストデータ又はＨＴＭＬデータの読み上げ再生を行うデータ音声再生部と、
前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータを読み上げ再生中に、前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止し、再びテキストデータ又はＨＴＭＬデータの読み上げ再生を再開するデータ音声再生装置であって、
前記テキストデータ又はＨＴＭＬデータの読み上げ再生が再開される場合、前記データ音声再生部は読み上げ再生が一時停止されたテキストデータ又はＨＴＭＬデータの位置よりも前の位置から前記テキストデータ又はＨＴＭＬデータの読み上げ再生を再開することを特徴とするデータ音声再生装置。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、テキスト読み上げ再生装置に関する。

【背景技術】

【0002】

近年、テキストデータなどを読み上げ再生するテキスト読み上げ再生装置が知られている。テキスト読み上げ再生装置の操作性を改善するため、特許文献１には、操作者からの聞き直しの命令を受け付けると音声読み上げを停止させ、音声読み上げを停止した文の文頭、またはそれより前の文の文頭から音声読み上げを再開する音声読み上げ装置が記載されている。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特開２００２−３５１４８４号明細書

【発明の概要】

【発明が解決しようとする課題】

【0004】

テキスト読み上げ再生装置には、ユーザが音声で命令（例えば、読み上げ中のテキストの保存や読み上げ再生の音量の大きさの調整）を入力することができることが多い。しかし、ユーザは、音声による命令を発音している間、装置が読み上げたテキストを聞き取れないことがしばしば起こる。

【0005】

本発明は、ユーザにとって利便性の向上したテキスト読み上げ再生装置を提供することを目的の一つとする。

【課題を解決するための手段】

【0006】

本発明の一実施形態に係るデータ音声再生装置は、単一または複数のコンテンツからなるテキストデータ又はＨＴＭＬデータの読み上げ再生を行うデータ音声再生部と、前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータを読み上げ再生中に、ユーザの音声による命令を受信する音声受信部と、前記音声受信部が前記音声による命令内容を認識する音声認識部を有し、前記音声認識部によって認識された命令内容に応じて、前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止し、前記音声による命令内容を実行し、前記音声による命令内容を実行した後、テキストデータ又はＨＴＭＬデータの読み上げ再生を再開するデータ音声再生装置であって、前記テキストデータ又はＨＴＭＬデータの読み上げ再生が再開される場合、前記データ音声再生部は読み上げ再生が一時停止されたテキストデータ又はＨＴＭＬデータの位置よりも前の位置から前記テキストデータ又はＨＴＭＬデータの読み上げ再生を再開することを特徴とするデータ音声再生装置である。

【0007】

また、本発明の一実施形態に係るデータ音声再生装置は、単一または複数のコンテンツからなるテキストデータ又はＨＴＭＬデータの読み上げ再生を行うデータ音声再生部と、前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータを読み上げ再生中に、ユーザの音声による命令を受信する音声受信部と、前記音声受信部が前記音声による命令内容を認識する音声認識部を有し、前記音声認識部によって認識された命令内容に応じて、前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止し、前記音声による命令内容を実行し、前記音声による命令内容を実行した後、テキストデータ又はＨＴＭＬデータの読み上げ再生を再開するデータ音声再生装置であって、前記テキストデータ又はＨＴＭＬデータの読み上げ再生が再開される場合、前記読み上げ再生が再開されるテキストデータ又はＨＴＭＬデータの位置は、前記音声受信部が受信した前記ユーザの音声による命令が発話された時点に対応する前記テキストデータ又はＨＴＭＬデータと同じ位置もしくはそれよりも前の位置であることを特徴するデータ音声再生装置である。

【0008】

また、本発明の一実施形態に係るデータ音声再生装置は、単一または複数のコンテンツからなるテキストデータ又はＨＴＭＬデータの読み上げ再生を行うデータ音声再生部と、前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータを読み上げ再生中に、ユーザの音声による命令を受信する音声受信部と、前記音声受信部が前記音声による命令内容を認識する音声認識部と、前記テキストデータ又はＨＴＭＬデータにおいて、一文または文節の単位を識別する識別部を有し、前記音声認識部によって認識された命令内容に応じて、前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止し、前記音声による命令内容を実行し、前記音声による命令内容を実行した後、テキストデータ又はＨＴＭＬデータの読み上げ再生を再開するデータ音声再生装置であって、前記テキストデータ又はＨＴＭＬデータの読み上げ再生が再開される場合、前記読み上げ再生が再開されるテキストデータ又はＨＴＭＬデータの位置は、前記音声受信部が受信した前記ユーザの音声による命令が発話された時点に対応する前記テキストデータ又はＨＴＭＬデータと同じ位置よりも前に位置する一文または文節の先頭であることを特徴するデータ音声再生装置である。

【0009】

また、データを保存する保存領域を有し、前記音声認識部によって認識された命令内容がテキストデータ又はＨＴＭＬデータの保存命令である場合、前記音声受信部が前記ユーザの音声による命令を受信したときの読み上げ再生対象のコンテンツに対応するテキストデータ又はＨＴＭＬデータである保存対象を前記保存領域に保存する保存部をさらに有していてもよい。

【0010】

前記保存部により前記保存領域に前記保存対象はテキストデータ又はＨＴＭＬデータが保存されると、音声により保存完了通知を発する保存完了通知部をさらに有していてもよい。

【0011】

テキストデータ又はＨＴＭＬデータの読み上げ再生の音量を調整する音量調整部をさらに有し、前記音声認識部によって認識された命令内容がテキストデータ又はＨＴＭＬデータの読み上げ再生の音量の調節命令である場合、前記音量調整部は前記音量の調節命令に応じて音量を調節してもよい。

【0012】

前記記憶領域に保存された前記保存対象テキストデータ又はＨＴＭＬデータを表示する表示部をさらに有してもよい。

【0013】

検索語に関連する情報を収集する検索部と前記検索部によって収集された前記検索語に関連する情報を音声により通知する情報通知部をさらに有し、前記音声認識部により認識された前記音声による命令内容が前記検索語に関連する情報の取得である場合、前記検索部は前記検索語に関連する情報を収集し、前記情報通知部により前記検索部により収集された前記検索語に関連する情報を音声により通知してもよい。

【0014】

また、本発明の一実施形態に係るデータ音声再生装置は、単一または複数のコンテンツからなるテキストデータ又はＨＴＭＬデータの読み上げ再生を行うデータ音声再生部と、前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータの読み上げ再生中または読み上げ再生を一時停止している間、ユーザの音声による命令を受信する音声受信部と、前記音声受信部が前記音声による命令内容を認識する音声認識部を有するデータ音声再生装置であって、前記音声認識部によって認識された命令内容が前記テキストデータ又はＨＴＭＬデータの音声再生の一時停止である場合、前記データ音声再生部は前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止し、前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止している間に前記音声認識部によって認識された命令内容が前記テキストデータ又はＨＴＭＬデータの読み上げ再生の再開である場合、前記データ音声再生部は前記テキストデータ又はＨＴＭＬデータの音声再生が一時停止された位置よりも前の位置から前記テキストデータ又はＨＴＭＬデータの読み上げ再生を再開することを特徴とするデータ音声再生装置である。

【0015】

また、本発明の一実施形態に係るデータ音声再生装置は、単一または複数のコンテンツからなるテキストデータ又はＨＴＭＬデータの読み上げ再生を行うデータ音声再生部と、前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータの読み上げ再生中または読み上げ再生を一時停止している間、ユーザの音声による命令を受信する音声受信部と、前記音声受信部が前記音声による命令内容を認識する音声認識部を有するデータ音声再生装置であって、前記音声認識部によって認識された命令内容が前記テキストデータ又はＨＴＭＬデータの音声再生の一時停止である場合、前記データ音声再生部は前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止し、前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止している間に前記音声認識部によって認識された命令内容が前記テキストデータ又はＨＴＭＬデータの読み上げ再生の再開である場合に、前記読み上げ再生が再開されるテキストデータ又はＨＴＭＬデータの位置は、前記音声受信部が受信した前記ユーザの音声による命令が発話された時点に対応する前記テキストデータ又はＨＴＭＬデータと同じ位置もしくはそれよりも前の位置であることを特徴するデータ音声再生装置である。

【0016】

また、本発明の一実施形態に係るデータ音声再生装置は、単一または複数のコンテンツからなるテキストデータ又はＨＴＭＬデータの読み上げ再生を行うデータ音声再生部と、前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータの読み上げ再生中または読み上げ再生を一時停止している間、ユーザの音声による命令を受信する音声受信部と、前記テキストデータ又はＨＴＭＬデータにおいて、一文または文節の単位を識別する識別部と、前記音声受信部が前記音声による命令内容を認識する音声認識部を有するデータ音声再生装置であって、前記音声認識部によって認識された命令内容が前記テキストデータ又はＨＴＭＬデータの読み上げ再生の一時停止である場合、前記データ音声再生部は前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止し、前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止している間に前記音声認識部によって認識された命令内容が前記テキストデータ又はＨＴＭＬデータの読み上げ再生の再開である場合に、前記読み上げ再生が再開されるテキストデータ又はＨＴＭＬデータの位置は、前記音声受信部が受信した前記ユーザの音声による命令が発話された時点に対応する前記テキストデータ又はＨＴＭＬデータの位置よりも前に位置する一文または文節の先頭であることを特徴するデータ音声再生装置である。

【0017】

また、本発明の一実施形態に係る無線通信端末は、単一または複数のコンテンツからなるテキストデータ又はＨＴＭＬデータを読み上げ再生し、前記音声再生を一時停止後に読み上げ再生を再開するデータ音声再生部及び通話のための通信を行う通話部を有する無線通信端末であって、前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータを読み上げ再生中に前記通話部が通話の着信を受けて通話のための通信が開始すると、前記データ音声再生部は前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止し、前記通話部による通話のための通信が終了すると、前記データ音声再生部はテキストデータ又はＨＴＭＬデータの読み上げ再生が一時停止された位置よりも前の位置から前記テキストデータ又はＨＴＭＬデータの読み上げ再生を再開することを特徴とする無線通信端末である。

【0018】

また、本発明の一実施形態に係る無線通信端末は、単一または複数のコンテンツからなるテキストデータ又はＨＴＭＬデータを読み上げ再生し、前記音声再生を一時停止した後に読み上げ再生を再開するデータ音声再生部及び通話のための通信を行う通話部を有する無線通信端末であって、前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータを読み上げ再生中に前記通話部が通話の着信を受けて通話のための通信が開始すると、前記データ音声再生部は前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止し、前記通話部による通話のための通信が終了すると、前記データ音声再生部は、前記通話部が前記通話の着信を受けた時点に対応する前記テキストデータ又はＨＴＭＬデータと同じ位置もしくはそれよりも前の位置から前記テキストデータ又はＨＴＭＬデータの読み上げ再生を再開することを特徴する無線通信端末である。

【0019】

また、本発明の一実施形態に係る無線通信端末は、単一または複数のコンテンツからなるテキストデータ又はＨＴＭＬデータを読み上げ再生し、前記読み上げ再生を一時停止後に読み上げ再生を再開するデータ音声再生部と、通話のための通信を行う通話部と、前記テキストデータ又はＨＴＭＬデータにおいて、一文または文節の単位を識別する識別部を有する無線通信端末であって、前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータを読み上げ再生中に前記通話部が通話の着信を受けて通話のための通信が開始すると、前記データ音声再生部は前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止し、前記通話部による通話のための通信が終了すると、前記データ音声再生部は、前記通話部が前記通話の着信を受けた時点に対応する前記テキストデータ又はＨＴＭＬデータの位置よりも前に位置する一文または文節の先頭から前記テキストデータ又はＨＴＭＬデータの読み上げ再生を再開することを特徴する無線通信端末である。

【0020】

また、本発明の一実施形態に係る無線通信端末は、単一または複数のコンテンツからなるテキストデータ又はＨＴＭＬデータを読み上げ再生し、前記読み上げ再生を一時停止した後に読み上げ再生を再開するデータ音声再生部と、前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止している間ユーザの音声による命令を受信する音声受信部と、前記音声受信部が前記音声による命令内容を認識する音声認識部と、通話のための通信を行う通話部を有する無線通信端末であって、前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータを読み上げ再生中に前記通話部が通話の着信を受けて通話のための通信が開始すると、前記データ音声再生部は前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止し、前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止している間に前記音声受信部が受信したユーザの音声による命令の内容が前記音声認識部によって前記テキストデータ又はＨＴＭＬデータの読み上げ再生の再開であると認識された場合、前記データ音声再生部はテキストデータ又はＨＴＭＬデータの読み上げ再生が一時停止された位置よりも前の位置から前記テキストデータ又はＨＴＭＬデータの読み上げ再生を再開することを特徴とする無線通信端末である。

【0021】

また、本発明の一実施形態に係る無線通信端末は、単一または複数のコンテンツからなるテキストデータ又はＨＴＭＬデータを読み上げ再生し、前記読み上げ再生を一時停止後に読み上げ再生を再開するデータ音声再生部と、前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止している間、ユーザの音声による命令を受信する音声受信部と、前記音声受信部が前記音声による命令内容を認識する音声認識部と、通話のための通信を行う通話部と、前記テキストデータ又はＨＴＭＬデータにおいて、一文または文節の単位を識別する識別部を有する無線通信端末であって、前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータを読み上げ再生中に前記通話部が通話の着信を受けて通話のための通信が開始すると、前記データ音声再生部は前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止し、前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止している間に前記音声受信部が受信したユーザの音声による命令の内容が前記音声認識部によって前記テキストデータ又はＨＴＭＬデータの読み上げ再生の再開または読み上げ再生の一時停止の解除であると認識された場合、前記データ音声再生部は、前記通話部が前記通話の着信を受けた時点に対応する前記テキストデータ又はＨＴＭＬデータの位置よりも前に位置する一文または文節の先頭から前記テキストデータ又はＨＴＭＬデータの読み上げ再生を再開することを特徴する無線通信端末である。

【0022】

また、本発明の一実施形態に係る無線通信端末は、単一または複数のコンテンツからなるテキストデータ又はＨＴＭＬデータの読み上げ再生を行い、前記読み上げ再生を一時停止した後に読み上げ再生を再開するデータ音声再生部と、前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止している間読み上げ再生の一時停止の解除コマンド又は読み上げ再生の再開コマンドを受け付けるコマンド受付部と、通話のための通信を行う通話部を有する無線通信端末であって、前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータを読み上げ再生中に前記通話部が通話の着信を受けて通話のための通信が開始すると、前記データ音声再生部は前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止し、前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止している間に、前記コマンド受付部が前記読み上げ再生の一時停止の解除コマンド又は前記読み上げ再生の再開コマンドを受け付けると、前記データ音声再生部はテキストデータ又はＨＴＭＬデータの読み上げ再生が一時停止された位置よりも前の位置から前記テキストデータ又はＨＴＭＬデータの読み上げ再生を再開することを特徴とする無線通信端末である。

【0023】

また、本発明の一実施形態に係る無線通信端末は、単一または複数のコンテンツからなるテキストデータ又はＨＴＭＬデータの読み上げ再生、前記読み上げ再生の一時停止、前記読み上げ再生の一時停止した後に読み上げ再生を再開するデータ音声再生部と、前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止している間、読み上げ再生の一時停止の解除コマンド又は読み上げ再生の再開のコマンドを受け付けるコマンド受付部と、通話のための通信を行う通話部と、前記テキストデータ又はＨＴＭＬデータにおいて、一文または文節の単位を識別する識別部を有する無線通信端末であって、前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータを読み上げ再生中に前記通話部が通話の着信を受けて通話のための通信が開始すると、前記データ音声再生部は前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止し、前記データ音声再生部が前記テキストデータ又はＨＴＭＬデータの読み上げ再生を一時停止している間に、前記コマンド受付部が読み上げ再生の一時停止の解除コマンド又は読み上げ再生の再開コマンドを受け付けると、前記データ音声再生部はテキストデータ又はＨＴＭＬデータの読み上げ再生が一時停止された位置よりも前に位置する一文または文節の先頭から前記テキストデータ又はＨＴＭＬデータの読み上げ再生を再開することを特徴とする無線通信端末である。

【発明の効果】

【0024】

本発明によれば、ユーザにとって利便性の向上したテキスト読み上げ再生装置を提供することができる。

【図面の簡単な説明】

【0025】

【図1】本発明の一実施形態に係るデータ音声再生装置を含むデータ音声再生システムの構成を示す図である。

【図2】本発明の一実施形態に係るデータ音声再生装置のデータ音声再生機能を示すブロック図である。

【図3】本発明の一実施形態におけるデータ音声再生装置において実行されるデータ読み上げ再生処理を示すフローチャートである。

【図4】本発明の一実施形態におけるＨＴＭＬデータ保存処理を示すフローチャートである。

【図5】本発明の一実施形態におけるデータ音声再生装置において読み上げ再生を実行中に、ユーザが保存命令を入力してから読み上げ再生が再開されるまでの処理を示すフローチャートである。

【図6】本発明の一実施形態における表示部を示す図である。

【図7】本発明の一実施形態における表示部において保存対象を選択して詳細を表示させたときの表示部を示す図である。

【図8】本発明の一実施形態に係るデータ音声再生装置のデータ音声再生機能を示すブロック図である。

【図9】本発明の一実施形態におけるデータ音声再生装置において実行されるデータ読み上げ再生処理を示すフローチャートである。

【図10】本発明の一実施形態におけるデータ音声再生装置において読み上げ再生を実行中に、ユーザが保存命令を入力してから読み上げ再生が再開されるまでの処理を示すフローチャートである。

【図11】本発明の一実施形態に係るデータ音声再生装置のデータ音声再生機能を示すブロック図である。

【図12】本発明の一実施形態におけるデータ音声再生装置において実行されるデータ読み上げ再生処理を示すフローチャートである。

【図13】本発明の一実施形態におけるデータ音声再生装置において読み上げ再生を実行中に、ユーザが音量調整命令を入力してから読み上げ再生が再開されるまでの処理を示すフローチャートである。

【図14】本発明の一実施形態におけるデータ音声再生装置のデータ音声再生機能を示すブロック図である。

【図15】本発明の一実施形態におけるデータ音声再生装置において実行されるデータ読み上げ再生処理を示すフローチャートである。

【図16】本発明の一実施形態におけるデータ音声再生装置において読み上げ再生を実行中に、ユーザが検索命令を入力してから読み上げ再生が再開されるまでの処理を示すフローチャートである。

【図17】本発明の一実施形態におけるデータ音声再生装置のデータ音声再生機能を示すブロック図である。

【図18】本発明の一実施形態におけるデータ音声再生装置において実行されるデータ読み上げ再生処理を示すフローチャートである。

【図19】本発明の一実施形態におけるデータ音声再生装置において読み上げ再生を実行中に、ユーザが一時停止命令を入力してから読み上げ再生が再開されるまでの処理を示すフローチャートである。

【図20】本発明の一実施形態に係る無線通信端末を含むデータ音声再生システムの構成を示す図である。

【図21】本発明の一実施形態における無線通信端末のデータ音声再生機能を示すブロック図である。

【図22】本発明の一実施形態における無線通信端末において実行されるデータ読み上げ再生処理を示すフローチャートである。

【図23】本発明の一実施形態における無線通信端末において実行されるデータ読み上げ再生処理を示すフローチャートである。

【図24】本発明の一実施形態における無線通信端末において実行されるデータ読み上げ再生処理を示すフローチャートである。

【図25】本発明の一実施形態における無線通信端末のデータ音声再生機能を示すブロック図である。

【図26】本発明の一実施形態における無線通信端末において実行されるデータ読み上げ再生処理を示すフローチャートである。

【図27】本発明の一実施形態に係るデータ音声再生装置を含むデータ音声再生システムの構成を示す図である。

【図28】本発明の一実施形態に係るデータ音声再生装置のデータ音声再生機能を示すブロック図である。

【図29】本発明の一実施形態におけるデータ音声再生装置において実行されるデータ読み上げ再生処理を示すフローチャートである。

【図30】本発明の一実施形態におけるデータ音声再生装置において読み上げ再生を実行中に、ユーザが保存命令を入力してから読み上げ再生が再開されるまでの処理を示すフローチャートである。

【図31】本発明の一実施形態に係るデータ音声再生装置のデータ音声再生機能を示すブロック図である。

【図32】本発明の一実施形態におけるデータ音声再生装置において実行されるデータ読み上げ再生処理を示すフローチャートである。

【図33】本発明の一実施形態におけるデータ音声再生装置において読み上げ再生を実行中に、ユーザが保存命令を入力してから読み上げ再生が再開されるまでの処理を示すフローチャートである。

【図34】本発明の一実施形態に係るデータ音声再生装置のデータ音声再生機能を示すブロック図である。

【図35】本発明の一実施形態におけるデータ音声再生装置において実行されるデータ読み上げ再生処理を示すフローチャートである。

【図36】本発明の一実施形態におけるデータ音声再生装置において読み上げ再生を実行中に、ユーザが音量調整命令を入力してから読み上げ再生が再開されるまでの処理を示すフローチャートである。

【図37】本発明の一実施形態に係るデータ音声再生装置のデータ音声再生機能を示すブロック図である。

【図38】本発明の一実施形態におけるデータ音声再生装置において実行されるデータ読み上げ再生処理を示すフローチャートである。

【図39】本発明の一実施形態におけるデータ音声再生装置において読み上げ再生を実行中に、ユーザが検索命令を入力してから読み上げ再生が再開されるまでの処理を示すフローチャートである。

【図40】本発明の一実施形態に係るデータ音声再生装置のデータ音声再生機能を示すブロック図である。

【図41】本発明の一実施形態におけるデータ音声再生装置において実行されるデータ読み上げ再生処理を示すフローチャートである。

【図42】本発明の一実施形態におけるデータ音声再生装置において読み上げ再生を実行中に、ユーザが一時停止命令を入力してから読み上げ再生が再開されるまでの処理を示すフローチャートである。

【発明を実施するための形態】

【0026】

以下、本発明の一実施形態について、図面を参照しながら説明する。以下に示す実施形態は本発明の実施形態の一例であって、本発明はこれらの実施形態に限定されるものではない。なお、本実施形態で参照する図面において、同一部分または同様な機能を有する部分には同一の符号または類似の符号（数字の後にＡ、Ｂなどを付しただけの符号）を付し、その繰り返しの説明は省略する場合がある。

【0027】

＜実施形態１＞
本発明の実施形態１に係るデータ音声再生装置１０を含むデータ音声再生システム１について、図面を参照しながら詳細に説明する。

【0028】

［概要］
図１は、本発明の実施形態１に係るデータ音声再生装置１０を含むデータ音声再生システム１の構成を示す図である。データ音声再生システム１は、データ音声再生装置１０と、メディアサイトサーバー２０とを有する。データ音声再生装置１０と、メディアサイトサーバー２０とは、インターネット、通信回線などのネットワーク３０に接続されている。

【0029】

データ音声再生装置１０は、データ音声再生サービスを提供する装置である。データ音声再生装置１０は、ネットワーク３０に接続し、メディアサイトサーバー２０と通信可能であってもよい。データ音声再生装置１０は、ユーザが操作可能な端末であり、具体的には、デスクトップ型コンピュータ、ノート型コンピュータ、あるいは携帯電話やタブレット、スマートフォンなどの携帯通信端末などが挙げられる。

【0030】

メディアサイトサーバー２０は、ユーザがインターネットを介してアクセスすることができるコンテンツを配信するメディアサイトが保有するサーバーである。なお、当該コンテンツはテキストデータまたはＨＴＭＬデータより構成され、当該テキストデータまたはＨＴＭＬデータは単一または複数のコンテンツからなる。なお、コンテンツとは、例えば、「今日の天気」「政治情報」「スポーツ情報」など、１つの情報の集合として、ユーザに提供されるものを指す。

【0031】

図１に示すように、データ音声再生装置１０と、メディアサイトサーバー２０とがネットワーク３０に接続されているとき、データ音声再生装置１０はメディアサイトサーバー２０から単一または複数のコンテンツからなるテキストデータ又はＨＴＭＬデータを取得することができる。

【0032】

［データ音声再生装置１０のハードウエア構成］
図１に示すように、データ音声再生装置１０は、制御部１１、記憶部１２、通信部１３、音声入力部１４、音声出力部１５、表示部１６を有する。

【0033】

制御部１１は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）などの演算処理回路を有する。制御部１１は、記憶部１２に記憶されたプログラムをＣＰＵにより実行して、プログラムに対応した機能をデータ音声再生装置１０において実現させる。

【0034】

記憶部１２は、ハードディスク、半導体メモリ等のメモリデバイスによって構成される記憶装置である。記憶部１２は、ＲＯＭ（Ｒｅａｄｏｎｌｙｍｅｍｏｒｙ）を含んでもよい。記憶部１２には、制御部１１によって実行される各種プログラムが記憶されている。記憶部１２に記憶されているプログラムには、例えば、後述するデータ音声再生処理を実現するためのプログラムが含まれる。各プログラムは、磁気記録媒体、光記録媒体、光磁気記録媒体、半導体メモリなどのコンピュータ読み取り可能な記録媒体に記憶した状態で提供されてもよい。また、各プログラムは、ネットワーク３０経由でデータ音声再生装置１０にダウンロードされてもよい。

【0035】

通信部１３は、制御部１１の制御によりネットワーク３０と接続して、メディアサイトサーバー２０などの外部装置と情報の送受信を行う。

【0036】

音声入力部１４は、アナログマイク、デジタルマイクなど、データ音声再生装置１０に対してユーザが音声を発し、その音声信号を入力するための装置である。

【0037】

音声出力部１５は、データ音声再生装置１０から音声を発するための装置であり、例えばスピーカーからなる音声出力装置である。

【0038】

表示部１６は、液晶ディスプレイや有機ＥＬディスプレイなどの表示装置であり、テキストデータやＨＴＭＬデータを表示することが可能な装置である。

【0039】

［データ音声再生装置１０の機能構成］
図２は、本発明の実施形態１に係るデータ音声再生装置１０のデータ音声再生機能を示すブロック図である。本実施形態では、保存領域１０７は、データ音声再生装置１０の内部に含まれるものとするが、保存領域１０７は、ネットワーク３０を介してデータ音声再生装置１０と接続された外部の記憶装置であってもよい。

【0040】

データ取得部１０１は、ネットワーク３０を介して、メディアサイトサーバー２０などの外部装置から単一または複数のコンテンツからなるテキストデータまたはＨＴＭＬデータを取得する。

【0041】

データ音声再生部１０２は、データ取得部１０１が取得した単一または複数のコンテンツからなるテキストデータまたはＨＴＭＬデータを取得し、当該データを音声信号に変換したうえ、読み上げ再生を行う。データ音声再生部１０２が行う読み上げ再生は、一時停止すること及び再開することができる。また、本実施形態においては、データ音声再生部１０２は、テキストデータまたはＨＴＭＬデータを読み上げ再生する際、当該データを一時的に保存するものとする。

【0042】

本実施形態においては、データ音声再生部１０２は、音声認識部１０４によって認識された命令内容に応じて、テキストデータまたはＨＴＭＬデータの読み上げ再生を一時停止し、当該命令内容が実行された後、テキストデータまたはＨＴＭＬデータの読み上げ再生を再開するものとする。また、読み上げ再生が一時停止されたテキストデータまたはＨＴＭＬデータの位置よりも前の位置（以下、「一時停止前位置」ということがある。）から読み上げ再生の再開を行うものとする。

【0043】

具体的には、データ音声再生部１０２は、読み上げ再生を一時停止する際、テキストデータまたはＨＴＭＬデータのうち、どの位置で読み上げ再生を一時停止したかを記憶する。そして、読み上げ再生を再開するときは、読み上げ再生が一時停止されたテキストデータまたはＨＴＭＬデータの位置よりも前の位置（すなわち、一時停止前位置）から読み上げ再生の再開を行う。

【0044】

例えば、「おはようございます。今日の天気は全国的に晴れです。残念ながら今日の東京は曇りです。名古屋は雨が降ります」とのテキストデータのうち、「おはようございます。今日の天気は」を読み上げた時点で読み上げ再生を一時停止したとすると、データ音声再生部１０２は、「今日の天気は」と読み上げた時点で読み上げ再生を一時停止したことを記憶する。そして、読み上げ再生を再開するときは、例えば、「今日の天気は全国的に晴れです。」の文頭から読み上げ再生の再開を行う。

【0045】

また、データ音声再生部１０２は、本実施形態においては、テキストデータまたはＨＴＭＬデータの読み上げ再生を行う際、どの箇所を読み上げているのかの情報と時刻の情報を対応付けて記憶しているものとする。例えば、午前１０時００分００秒から「おはようございます。今日の天気は全国的に晴れです。残念ながら今日の東京は曇りです。名古屋は雨が降ります」と読み上げたとすると、「おはようございます。」との文を読み終わった時点が午前１０時００分０５秒であること、「晴れ」と言った時点が午前１０時００分１５秒であることなどを記憶する。以下、この情報を「テキスト時刻対応データ」と呼ぶことがある。

【0046】

音声受信部１０３は、データ音声再生部１０２がテキストデータまたはＨＴＭＬデータを読み上げ再生中に、ユーザの音声（音声信号）による命令を受信する。本実施形態においては、音声受信部１０３は、ユーザの音声による命令を受信した時刻を記録するものとする（以下この時刻を「命令受信時刻」ということがある。）。

【0047】

音声認識部１０４は、音声受信部１０３が受信した音声信号を取得し、音声による命令の内容を認識する。この音声認識の方法は、既に公知の方法を使用することができ、例えば、人の音声を一連のデジタル周波数に変換し、あらかじめ記憶した音素と呼ばれる語や音声要素と照合される方法などにより、音声認識を行うことができる。音声認識部１０４は、認識した命令内容に応じて、データ音声再生装置１０に一定の処理を行わせる。

【0048】

本実施形態においては、音声認識部１０４は、ユーザの保存命令を認識すると、保存命令を保存部１０５に送り、データ音声再生装置１０にテキストデータまたはＨＴＭＬデータを保存させる。また、音声認識部１０４は、ユーザの保存命令を認識すると、一時停止命令をデータ音声再生部１０２に送り、読み上げ再生を一時停止させる。

【0049】

ここで、「保存命令」とは、データ音声再生装置１０に対するユーザの、現在読み上げ中のコンテンツに対応するテキストデータまたはＨＴＭＬデータを保存する旨の命令である。例えば、ユーザがデータ音声再生装置１０に対し「クリップ」と音声により入力すると、音声認識部１０４に、保存命令として認識されるようにしてもよい。

【0050】

保存領域１０７は、データを保存する領域である。保存領域１０７には、保存部１０５によって保存対象が保存される。

【0051】

保存部１０５は、音声認識部１０４によって認識された命令内容がテキストデータ又はＨＴＭＬデータの保存命令である場合に、音声受信部１０３がユーザの音声による命令を受信したときの読み上げ再生対象のコンテンツに対応するテキストデータ又はＨＴＭＬデータである保存対象を保存領域１０７に保存する。

【0052】

具体的には、保存部１０５は、音声認識部１０４から保存命令を受け取ると、音声受信部１０３からユーザの音声による命令を受信した時点（命令受信時刻）の情報を取得する。そして、当該命令受信時刻にデータ音声再生部１０２が読み上げ再生をしていたコンテンツに対応するテキストデータまたはＨＴＭＬデータの提供を求める信号（以下「データ提供要求信号」ということがある。）をデータ音声再生部１０２に送る。次に、データ提供要求信号を受けとったデータ音声再生部１０２は、命令受信時刻の情報とテキスト時刻対応データに基づいて、命令受信時刻に読み上げ再生をしていたテキストデータまたはＨＴＭＬデータを保存部１０５に提供する。そして、保存部１０５はデータ音声再生部１０２から提供されたテキストデータまたはＨＴＭＬデータを保存領域１０７に保存する。

【0053】

また、本実施形態においては、保存部１０５は、保存領域１０７に保存対象であるテキストデータ又はＨＴＭＬデータを保存すると、保存完了通知部１０６に、保存完了通知を行う旨の命令（以下「保存完了通知命令」ということがある）を行うものとする。

【0054】

保存完了通知部１０６は、保存部１０５により保存領域１０７に保存対象であるテキストデータ又はＨＴＭＬデータが保存されると、音声により保存完了通知を発する。例えば、「保存を完了しました。」などと音声により発する。

【0055】

本実施形態においては、保存完了通知部１０６は、保存部１０５が保存領域１０７に保存対象を保存した後に発する保存完了通知命令を受け取ると、保存完了通知を発するものとする。また、保存完了通知部１０６は、保存完了通知を発したのち、データ音声再生部１０２に再生を再開すべき旨の命令である再生再開命令を送る。再生再開命令を受け取ったデータ音声再生部１０２は、読み上げ再生が一時停止されたテキストデータまたはＨＴＭＬデータの位置よりも前の位置（すなわち、一時停止前位置）から読み上げ再生の再開を行う。

【0056】

表示部１０８は、保存領域１０７に保存された保存対象を表示することができる。

【0057】

［データ読み上げ再生処理］
続いて、データ音声再生装置１０におけるデータ読み上げ再生処理について説明する。

【0058】

図３は、本実施形態におけるデータ音声再生装置１０において実行されるデータ読み上げ再生処理を示すフローチャートである。この処理は、データ音声再生装置１０が起動し、データ取得部１０１が単一または複数のコンテンツからなるテキストデータまたはＨＴＭＬデータを取得し、データ音声再生部１０２が当該テキストデータまたはＨＴＭＬデータの読み上げ再生を開始すると実行される。

【0059】

まず、音声受信部１０３が音声（音声信号）を受信しているかを判断する（ステップＳ１０１）。音声受信部１０３が音声を受信していないと判断した場合（ステップＳ１０１；Ｎｏ）、ステップＳ１０３に進む。ステップＳ１０３においては、データ音声再生部１０２によるテキストデータまたはＨＴＭＬデータの読み上げが終了しているかどうかが判断される。終了していないと判断された場合は、ステップＳ１０１に戻り、再び、音声受信部１０３が音声を受信しているかを判断する。すなわち、本実施形態では、テキストデータまたはＨＴＭＬデータの読み上げが終了するまで、音声の受信を行う（ステップＳ１０１；ＮｏかつステップＳ１０３；Ｎｏ）。また、テキストデータまたはＨＴＭＬデータの読み上げが終了したとき、データ音声再生装置１０におけるデータ音声再生処理は終了する（ステップＳ１０３；Ｙｅｓ）。

【0060】

ステップＳ１０１において、音声受信部１０３が音声を受信していると判断したとき（ステップＳ１０１；Ｙｅｓ）、音声認識部１０４が、音声受信部１０３が受信した音声の内容を認識する（ステップＳ１０５）。受信した音声が、ユーザの音声による保存命令ではないと認識されると（ステップＳ１０７；Ｎｏ）、ステップＳ１０３に進み、データ音声再生部１０２によるテキストデータまたはＨＴＭＬデータの読み上げが終了しているかどうかが判断されることとなる。

【0061】

ステップＳ１０７において、受信した音声がユーザの音声による保存命令であると認識されると、データ音声再生部１０２による読み上げ再生が一時停止する（ステップＳ１０９）。続いて、ステップＳ１０１において音声受信部１０３がユーザの音声による保存命令を受信したときにデータ音声再生部１０２によって読み上げられていたコンテンツに対応するテキストデータまたはＨＴＭＬデータが保存領域１０７に保存される（ステップＳ１１１）。

【0062】

図４は、ステップＳ１１１において行われる、データ音声再生部１０２によって読み上げられていたコンテンツに対応するＨＴＭＬデータの保存の方法の一例である、ＨＴＭＬデータ保存処理を示すフローチャートである。この処理は、データ音声再生部１０２による読み上げが一時停止すると実行される。

【0063】

まず、データ音声再生部１０２によって読み上げられていたＨＴＭＬデータをダウンロードする（ステップＳ１１１−１）。

【0064】

次に、ステップＳ１１１−１においてダウンロードしたＨＴＭＬデータをパースする（ステップＳ１１１−２）。

【0065】

次に、スタイルシートの保存を行う。すなわち、スタイルシートをダウンロードし（ステップＳ１１１−３）、当該スタイルシートをファイルとして保存する（ステップＳ１１１−４）。

【0066】

次に、画像の保存を行う。すなわち、画像をダウンロードし（ステップＳ１１１−５）、当該画像を保存する（ステップＳ１１１−６）。

【0067】

最後に、ＨＴＭＬをファイルとして保存する（ステップＳ１１１−７）

【0068】

図３に戻って説明を続ける。ステップＳ１１１においてテキストデータまたはＨＴＭＬデータが保存領域１０７に保存された後、保存完了通知部１０６が音声により保存完了通知を行う（ステップＳ１１３）。例えば、「保存を完了しました。」などと音声により発する。

【0069】

ステップＳ１１３において、保存完了通知が行われると、データ音声再生部１０２は一時停止前位置より読み上げ再開を行う（ステップＳ１１５）。そして、ステップＳ１０３に進み、データ音声再生部１０２によるテキストデータまたはＨＴＭＬデータの読み上げが終了しているかどうかが判断される。終了していないと判断された場合は、ステップＳ１０１に戻り、再び、音声受信部１０３が音声を受信しているかを判断する。テキストデータまたはＨＴＭＬデータの読み上げが終了したとき、データ音声再生装置１０におけるデータ音声再生処理は終了する（ステップＳ１０３；Ｙｅｓ）。

【0070】

［読み上げ再生再開の処理］
続いて、本発明の実施形態１に係るデータ音声再生装置１０において、ユーザが保存命令を入力してから読み上げ再生が再開されるまでの処理について説明する。

【0071】

図５は、データ音声再生装置１０において読み上げ再生を実行中に、ユーザが保存命令を入力してから読み上げ再生が再開されるまでの処理を示すフローチャートである。また、この説明においては、データ音声再生装置１０は、「おはようございます。今日の天気は全国的に晴れです」と読み上げるものとし、「おはようございます。」の文を第１文、「今日の天気は全国的に晴れです。」との文を第２文という。

【0072】

まずは、データ音声再生装置１０が、第１文のテキストデータまたはＨＴＭＬデータを音声信号に変換し読み終わったものとする（ステップＳ１２１）。続いて、データ音声再生装置１０は第２文のテキストデータまたはＨＴＭＬデータを音声信号に変換し第２文の読み上げを開始するが（ステップＳ１２３）、「きょうのてんきはぜん」と読み上げたところで、ユーザが「クリップ」と言い、音声受信部１０３に保存命令を入力したものとする（ステップＳ１２５）。

【0073】

続いて、音声認識部１０４は、音声受信部１０３が受信した音声信号を取得し（ステップＳ１２７）、音声認識を行う（ステップＳ１２９）。

【0074】

音声認識部１０４は、ユーザの保存命令を認識すると、一時停止命令をデータ音声再生部１０２に送り（ステップＳ１３１）、一時停止命令を受け取ったデータ音声再生部１０２は、読み上げを一時停止する（ステップＳ１３３）。本実施形態においては、データ音声再生部１０２は、読み上げ再生を一時停止する際、テキストデータまたはＨＴＭＬデータのうち、どの位置で読み上げ再生を一時停止したかを記憶するため、「きょうのてんきはぜん」まで読み上げた位置で一時停止したことを記憶する。

【0075】

また、音声認識部１０４は、ユーザの保存命令を認識すると、保存命令を保存部１０５に送る（ステップＳ１３５）。保存命令を受け取った保存部１０５は、音声受信部からユーザの音声による命令を受信した時点（命令受信時刻）の情報を取得し（ステップＳ１３７）、また、当該命令受信時刻にデータ音声再生部１０２が読み上げ再生をしていたコンテンツに対応するテキストデータまたはＨＴＭＬデータの提供を求める信号（データ提供要求信号）をデータ音声再生部１０２に送る（ステップＳ１３９）。

【0076】

続いて、保存部１０５は、データ音声再生部１０２から命令受信時刻の情報とテキスト時刻対応データに基づいて、命令受信時刻に読み上げ再生をしていたテキストデータまたはＨＴＭＬデータの提供を受け（ステップＳ１４１）、当該データを保存領域１０７に提供し（ステップＳ１４３）、保存させる（ステップＳ１４５）。当該保存が終了すると、保存部１０５は保存完了通知命令を保存完了通知部１０６に提供し（ステップＳ１４７）、これを受け取った保存完了通知部１０６は、保存完了通知を行い（ステップＳ１４９）、また、データ音声再生部１０２に再生再開命令を送る（ステップＳ１５１）。

【0077】

再生再開命令を受け取ったデータ音声再生部１０２は、ステップＳ１３３において記憶していた一時停止した位置よりも前の位置（一時停止前位置）から読み上げ再生の再開を行う（ステップＳ１５３）。本実施形態においては、一時停止した位置は「きょうのてんきはぜん」まで読み上げた位置であるから、例えば、一時停止した位置の直前の文頭から読み上げを再開してもよい。例えば、「今日の天気は全国的に晴れです。」の文頭から読み上げを再開してもよい。また、これに限られるものではなく、例えば、「天気は」から読み上げを再開してもよい。

【0078】

［表示部１０８の表示］
図６は、保存領域１０７に保存された保存対象を表示する表示部１０８の一例を示す。当該図においては、保存領域１０７に保存された保存対象が、第１保存対象１０９−Ａ、第２保存対象１０９−Ｂ、第３保存対象１０９−Ｃの３つある場合を示す。ユーザは、データ音声再生部１０２による読み上げが終了したのちに、表示部１０８に、保存しておいた保存対象１０９を図６のように表示させることができる。

【0079】

図７は、図６に示す表示部１０８において、第１保存対象１０９−Ａを選択して詳細を表示させたときの表示部１０８を示す図である。第１保存対象１０９−Ａは、「今日の天気」とのタイトルに対応するＨＴＭＬデータである。図７に示すとおり、タイトルの下に保存を行った時刻１１０が表示されてもよい。

【0080】

以上説明したとおり、本発明の実施形態１におけるデータ音声再生装置１０を用いると、データ音声再生装置１０がユーザの命令の入力を受け、読み上げを一時停止したのち読み上げを再開する際、読み上げ再生が一時停止されたテキストデータまたはＨＴＭＬデータの位置よりも前の位置（一時停止前位置）から読み上げ再生の再開を行うこととなる。

【0081】

ここで、ユーザは、データ音声再生装置１０に対して入力する命令を発音している間、データ音声再生装置１０が読み上げている音声を聞き取ることは難しい。したがって、ユーザがデータ音声再生装置１０に対して入力する命令を発音し、データ音声再生装置１０が命令を処理し、読み上げを再開する際、読み上げ再生が一時停止されたテキストデータまたはＨＴＭＬデータの位置と同じ位置から読み上げを再開すると、ユーザはデータ音声再生装置１０が読み上げた文の中に聞き取れなかった部分が生じる。

【0082】

本発明の実施形態１におけるデータ音声再生装置１０を用いると、データ音声再生装置１０がユーザの命令の入力を受け、読み上げを一時停止したのち読み上げを再開する際、読み上げ再生が一時停止されたテキストデータまたはＨＴＭＬデータの位置よりも前の位置（一時停止前位置）から読み上げ再生の再開を行うこととなるから、ユーザが命令を発音している間にデータ音声再生装置１０が読み上げていた文を、再度、データ音声再生装置１０が読み上げることになるため、ユーザが、データ音声再生装置１０が読み上げた文が聞き取れないという事態を減少させることができる。

【0083】

＜実施形態２＞
本発明の実施形態２に係るデータ音声再生装置１０を含むデータ音声再生システム１について、図面を参照しながら詳細に説明する。なお、実施形態１における説明と重複する説明については適宜省略する。

【0084】

［データ音声再生装置１０の機能構成］
図８は、本発明の実施形態２に係るデータ音声再生装置１０のデータ音声再生機能を示すブロック図である。以下、主に本発明の実施形態１に係るデータ音声再生装置１０のデータ音声再生機能を示すブロック図との違いについて説明する。

【0085】

識別部１２０は、データ取得部１０１が取得したテキストデータまたはＨＴＭＬデータにおいて、一文または文節の単位を識別する。さらに、本実施形態においては、識別部１２０は、識別した一文または文節の単位の情報を、テキストデータまたはＨＴＭＬデータとともに、データ音声再生部１０２に提供する。

【0086】

識別部１２０がテキストデータまたはＨＴＭＬデータにおいて、一文または文節の単位を識別する機能は、文節や句読点を判断する茶筌などのフリーソフトやその他商用のソフトウェアを使用して形態素解析などを行うことにより可能である。

【0087】

なお、文節とは言語単位の１つであり、文を読む際、自然な発音によって区切られる最小の単位をいう。例えば、「白い花が庭に咲く。」という文は、「白い」「花が」「庭に」「咲く」という４つの文節から成り立っている。また、例えば、「雨が屋根に激しく打ち付ける」という文は、「雨が」「屋根に」「激しく」「打ち付ける」という４つの文節から成り立っている。

【0088】

データ音声再生部１０２は、実施形態１と同様、データ取得部１０１が取得した単一または複数のコンテンツからなるテキストデータまたはＨＴＭＬデータを取得し、当該音声信号に変換したうえ読み上げ再生を行うものであって、データ音声再生部１０２は、音声認識部１０４によって認識された命令内容に応じて、テキストデータまたはＨＴＭＬデータの読み上げ再生を一時停止し、当該命令内容が実行された後、テキストデータまたはＨＴＭＬデータの読み上げ再生を再開するものとする。

【0089】

もっとも、実施形態１とは異なり、データ音声再生部１０２が読み上げ再生の再開を行う位置は、読み上げ再生が一時停止されたテキストデータまたはＨＴＭＬデータの位置よりも前の位置（一時停止前位置）として特定されるのではなく、音声受信部１０３が受信したユーザの音声による命令が発話された時点に対応するテキストデータまたはＨＴＭＬデータと同じ位置もしくはそれよりも前の位置（以下「発話前位置」ということがある）として特定される。ここで、「音声受信部１０３が受信したユーザの音声による命令が発話された時点」とは、ユーザの音声による命令が音声受信部１０３によって受信が開始した時点をいう。例えば、ユーザが「クリップ」との保存命令をしたときにおいては、音声受信部１０３が「ク」との音声を受信し始めた時点を意味する。

【0090】

具体的には、データ音声再生部１０２は、音声認識部１０４から一時停止命令を受け取ると、音声受信部１０３から、ユーザの音声による命令を受信した時刻（命令受信時刻）の情報を取得し、自身が記憶しているテキスト時刻対応データと命令受信時刻の情報に基づいて、音声受信部１０３が受信したユーザの音声による命令が発話された時点に対応するテキストデータまたはＨＴＭＬデータと同じ位置を特定し、当該同じ位置もしくはそれよりも前の位置から読み上げ再生を再開する。

【0091】

本実施形態においては、特に、音声受信部１０３が受信したユーザの音声による命令が発話された時点に対応するテキストデータまたはＨＴＭＬデータと同じ位置よりも前に位置する一文又は文節の先頭（以下「区切り位置」ということがある）から、データ音声再生部１０２による読み上げ再生の再開が行われるものとする。当該区切り位置は、識別部１２０によって提供された一文または文節の単位の情報による。

【0092】

例えば、「おはようございます。今日の天気は全国的に晴れです。残念ながら今日の東京は曇りです。名古屋は雨が降ります」とのテキストデータのうち、「おはようございます。今日の天気」を読み上げた時点で音声受信部１０３がユーザの保存命令の受信を開始し、「おはようございます。今日の天気は全国的に晴れです。残念ながら」まで読み上げた時点で読み上げ再生が停止した後、読み上げ再生が再開される場合について説明する。

【0093】

この例の場合に、区切り位置が一文の単位によるならば、区切り位置は「今日の天気は全国的に晴れです。」の文の文頭なので、データ音声再生部１０２は、「今日の天気は全国的に晴れです。」の文の文頭から読み上げ再生を再開する。

【0094】

また、この例の場合に、区切り位置が文節の単位によるならば、「今日の天気は全国的に晴れです。」との文を文節に区切ると「今日の」「天気は」「全国的に」「晴れです。」と区切ることができ、音声受信部１０３がユーザの保存命令の受信を開始したのは「おはようございます。今日の天気」を読み上げた時点であるので、データ音声再生部１０２は「天気は」から読み上げを再開する。

【0095】

データ音声再生部１０２に関するその他の説明、データ取得部１０１、音声受信部１０３、音声認識部１０４、保存部１０５、保存領域１０７、保存完了通知部１０６及び表示部１０８についての説明は実施形態１においてした説明と共通なので省略する。

【0096】

［データ読み上げ再生処理］
続いて、実施形態２における、データ音声再生装置１０が行うデータ読み上げ再生処理について説明する。

【0097】

図９は、実施形態２におけるデータ音声再生装置１０において実行されるデータ読み上げ再生処理を示すフローチャートである。この処理は、データ音声再生装置１０が起動し、データ取得部１０１が単一または複数のコンテンツからなるテキストデータまたはＨＴＭＬデータを取得し、識別部１２０が当該データの一文または文節の単位を識別し、データ音声再生部１０２が当該テキストデータまたはＨＴＭＬデータの読み上げ再生を開始すると実行される。

【0098】

ステップＳ１０１からステップＳ１１３までの処理は、実施形態１における説明と共通である。ステップＳ１１３において保存完了通知部１０６が音声により保存完了通知を行うと、ステップＳ１１５Ｂに進み、データ音声再生部１０２は区切り位置から読み上げを再開する。そして、ステップＳ１０３に進み、データ音声再生部１０２によるテキストデータまたはＨＴＭＬデータの読み上げが終了しているかどうかが判断される。終了していないと判断された場合は、ステップＳ１０１に戻り、再び、音声受信部１０３が音声を受信しているかを判断する。テキストデータまたはＨＴＭＬデータの読み上げが終了したとき、データ音声再生装置１０におけるデータ音声再生処理は終了する（ステップＳ１０３；Ｙｅｓ）。

【0099】

［読み上げ再生再開の処理］
続いて、本発明の実施形態２に係るデータ音声再生装置１０において、ユーザが保存命令を入力してから読み上げ再生が再開されるまでの処理について説明する。

【0100】

図１０は、本発明の実施形態２に係るデータ音声再生装置１０において読み上げ再生を実行中に、ユーザが保存命令を入力してから読み上げ再生が再開されるまでの処理を示すフローチャートである。また、この説明においては、データ音声再生装置１０は、「おはようございます。今日の天気は全国的に晴れです」と読み上げるものとし、「おはようございます。」の文を第１文、「今日の天気は全国的に晴れです。」との文を第２文という。

【0101】

ステップＳ１２１からステップＳ１３７までの処理は、実施形態１における説明と共通であるから省略する。

【0102】

ステップＳ１３７の後、データ音声再生部１０２は、音声受信部１０３から命令受信時刻の情報を取得する（ステップＳ１３７−２）。

【0103】

その後、ステップＳ１３９に進む。ステップＳ１３９からステップＳ１５１は、実施形態１における説明と共通であるから省略する。

【0104】

ステップＳ１５１において再生再開命令を受け取ったデータ音声再生部１０２は、ステップＳ１３７−２において受け取っている命令受信時刻の情報と、自身が記憶しているテキスト時刻対応データの情報に基づいて、区切り位置を特定し、読み上げ再生を再開する（ステップＳ１５３Ｂ）。

【0105】

以上説明したとおり、本発明の実施形態２におけるデータ音声再生装置１０を用いると、データ音声再生装置１０がユーザの命令の入力を受け、読み上げを一時停止したのち読み上げを再開する際、音声受信部１０３が受信したユーザの音声による命令が発話された時点に対応するテキストデータまたはＨＴＭＬデータと同じ位置もしくはそれよりも前の位置から読み上げ再生を再開することができる。

【0106】

したがって、本発明の実施形態２におけるデータ音声再生装置１０を用いると、例えば、「おはようございます。今日の天気は全国的に晴れです。残念ながら今日の東京は曇りです。名古屋は雨が降ります」とのテキストデータのうち、「おはようございます。今日の天気」を読み上げた時点で音声受信部１０３がユーザの保存命令の受信を開始し、「おはようございます。今日の天気は全国的に晴れです。残念ながら」まで読み上げた時点で読み上げ再生が停止した後、読み上げ再生が再開される場合のように、音声受信部１０３がユーザの命令の受信を開始した時刻と読み上げ再生が一時停止した時刻にずれがある場合であっても、データ音声再生部１０２は、ユーザの音声による命令が発話された時点以前に読み上げた内容を再度読み上げるため、ユーザが、データ音声再生装置１０が読み上げた文が聞き取れないという事態を減少させることができる。

【0107】

また、本発明の実施形態２におけるデータ音声再生装置１０を用いると、音声受信部１０３が受信したユーザの音声による命令が発話された時点に対応するテキストデータまたはＨＴＭＬデータと同じ位置よりも前に位置する一文又は文節の先頭（区切り位置）から、データ音声再生部１０２による読み上げ再生の再開が行われる。区切り位置から読み上げ再生が再開されると、そうでない場合と比べて、ユーザはデータ音声再生装置１０の読み上げ内容をより理解しやすくなる。特に、一文の先頭からデータ音声再生部１０２による読み上げ再生の再開が行われる場合、そうでない場合と比べ、ユーザはデータ音声再生装置１０の読み上げ内容をより理解することができる。

【0108】

＜実施形態３＞
本発明の実施形態３に係るデータ音声再生装置１０を含むデータ音声再生システム１について、図面を参照しながら詳細に説明する。なお、実施形態１における説明と重複する説明については適宜省略する。

【0109】

［データ音声再生装置１０の機能構成］
図１１は、本発明の実施形態３に係るデータ音声再生装置１０のデータ音声再生機能を示すブロック図である。以下、主に本発明の実施形態１に係るデータ音声再生装置１０のデータ音声再生機能を示すブロック図との違いについて説明する。

【0110】

データ音声再生部１０２は、実施形態１と同様、データ取得部１０１が取得した単一または複数のコンテンツからなるテキストデータまたはＨＴＭＬデータを取得し、読み上げ再生を行う。また、読み上げ再生が一時停止されたテキストデータまたはＨＴＭＬデータの位置よりも前の位置（一時停止前位置）から読み上げ再生の再開を行うものとする。

【0111】

本実施形態においては、データ音声再生部１０２は、読み上げ再生を行う音声についての音量データを有しているものとし、当該音量データに応じた音量で読み上げ再生を行うものとする。

【0112】

音声認識部１０４は、実施形態１と同様、音声受信部１０３が受信した音声信号を取得し、音声による命令の内容を認識する。本実施形態においては、音声認識部１０４は、ユーザの音量調整命令を認識すると、音量調整命令を音量調整部１２２に送り、データ音声再生部１０２の読み上げ再生の音量を変化させる。また、音声認識部１０４は、ユーザの音量調整命令を認識すると、一時停止命令をデータ音声再生部１０２に送り、読み上げ再生を一時停止させる。

【0113】

ここで、「音量調整命令」とは、データ音声再生装置１０に対するユーザの、読み上げ再生の音量を変更する旨の命令である。例えば、ユーザがデータ音声再生装置１０に対し「音量あげて」と入力すると、音量データを大きくする旨の音量調整命令であると音声認識部１０４に認識されてもよいし、「音量さげて」と入力すると、音量データを小さくする旨の音量調整命令であると音声認識部１０４に認識されてもよい。

【0114】

本実施形態においては、音声認識部１０４は、ユーザの音量調整命令を認識すると、音量調整命令を音量調整部１２２に送る。音声認識部１０４は、ユーザの音量調整命令が音量データを大きくする旨の音量調整命令であると認識すると、音量データを大きくする旨の音量調整命令を音量調整部１２２に送り、音量データを小さくする旨の音量調整命令であると認識すると、音量データを小さくする旨の音量調整命令を音量調整部１２２に送る。

【0115】

音量調整部１２２は、音声認識部１０４によって認識された命令内容がテキストデータまたはＨＴＭＬデータの読み上げ再生の音量の調整命令である場合、当該音量の調整命令に応じて音量を調整する。具体的には、音量調整部１２２は、音声認識部１０４から音量調整命令を受け取ると、当該音量調整命令にしたがって、データ音声再生部１０２に対し、音量調整命令を送る。当該音量調整命令を受け取ったデータ音声再生部１０２は、当該命令にしたがって、読み上げ再生を行う音声についての音量データを変更し、一時停止前位置から読み上げ再生を再開する。

【0116】

データ取得部１０１及び音声受信部１０３についての説明は実施形態１と同様であるから省略する。

【0117】

［データ読み上げ再生処理］
続いて、実施形態３のデータ音声再生装置１０におけるデータ読み上げ再生処理について説明する。

【0118】

図１２は、実施形態３におけるデータ音声再生装置１０において実行されるデータ読み上げ再生処理を示すフローチャートである。この処理は、データ音声再生装置１０が起動し、データ取得部１０１が単一または複数のコンテンツからなるテキストデータまたはＨＴＭＬデータを取得し、データ音声再生部１０２が当該テキストデータまたはＨＴＭＬデータの読み上げ再生を開始すると実行される。

【0119】

ステップＳ２０１からステップＳ２０５についての説明は、実施形態１についてのステップＳ１０１からステップＳ１０５についての説明と共通するので適宜省略する。

【0120】

ステップＳ２０１において、音声受信部１０３が音声を受信していると判断したとき（ステップＳ２０１；Ｙｅｓ）、音声認識部１０４が、音声受信部１０３が受信した音声の内容を認識する（ステップＳ２０５）。受信した音声が、ユーザの音声による音量調整命令ではないと認識されると（ステップＳ２０７；Ｎｏ）、ステップＳ２０３に進み、データ音声再生部１０２によるテキストデータまたはＨＴＭＬデータの読み上げが終了しているかどうかが判断されることとなる。

【0121】

ステップＳ２０７において、受信した音声がユーザの音声による音量調整命令であると認識されると、データ音声再生部１０２による読み上げ再生が一時停止する（ステップＳ２０９）。続いて、音量調整命令にしたがって、読み上げ再生の音量データが変更される（ステップＳ２１１）。

【0122】

ステップＳ２１１において読み上げ再生の音量データが変更されると、データ音声再生部１０２は一時停止前位置より読み上げ再生を行う（ステップＳ２１３）。そして、ステップＳ２０３に進み、データ音声再生部１０２によるテキストデータまたはＨＴＭＬデータの読み上げが終了しているかどうかが判断される。終了していないと判断された場合は、ステップＳ２０１に戻り、再び、音声受信部１０３が音声を受信しているかを判断する。テキストデータまたはＨＴＭＬデータの読み上げが終了したとき、データ音声再生装置１０におけるデータ音声再生処理は終了する（ステップＳ２０３；Ｙｅｓ）。

【0123】

［読み上げ再生再開の処理］
続いて、本発明の実施形態３に係るデータ音声再生装置１０において、ユーザが音量調整命令を入力してから読み上げ再生が再開されるまでの処理について説明する。

【0124】

図１３は、データ音声再生装置１０において読み上げ再生を実行中に、ユーザが音量調整命令を入力してから読み上げ再生が再開されるまでの処理を示すフローチャートである。また、この説明においては、データ音声再生装置１０は、「おはようございます。今日の天気は全国的に晴れです」と読み上げるものとし、「おはようございます。」の文を第１文、「今日の天気は全国的に晴れです。」との文を第２文という。

【0125】

まずは、データ音声再生装置１０が、第１文のテキストデータまたはＨＴＭＬデータを音声信号に変換し読み終わったものとする（ステップＳ２２１）。続いて、データ音声再生装置１０は第２文のテキストデータまたはＨＴＭＬデータを音声信号に変換し第２文の読み上げを開始するが（ステップＳ２２３）、「きょうのてんきはぜん」と読み上げたところで、ユーザが「音量あげて」と言い、音声受信部１０３に音量調整命令を入力したものとする（ステップＳ２２５）。

【0126】

続いて、音声認識部１０４は、音声受信部１０３が受信した音声信号を取得し（ステップＳ２２７）、音声認識を行う（ステップＳ２２９）。

【0127】

音声認識部１０４は、ユーザの音量調整命令を認識すると、一時停止命令をデータ音声再生部１０２に送り（ステップＳ２３１）、一時停止命令を受け取ったデータ音声再生部１０２は、読み上げを一時停止する（ステップＳ２３３）。本実施形態においては、データ音声再生部１０２は、読み上げ再生を一時停止する際、テキストデータまたはＨＴＭＬデータのうち、どの位置で読み上げ再生を一時停止したかを記憶するため、「きょうのてんきはぜん」まで読み上げた位置で一時停止したことを記憶する。

【0128】

また、音声認識部１０４は、ユーザの音量調整命令を認識すると、音量調整命令を音量調整部１２２に送る（ステップＳ２３５）。音量調整命令を受け取った音量調整部１２２は、当該音量調整命令にしたがって、音量調整命令をデータ音声再生部１０２に送る（ステップＳ２３７）。

【0129】

音量調整命令を受け取ったデータ音声再生部１０２は、当該音量調整命令にしたがって音量データを調整したうえ、ステップＳ２３３において記憶していた一時停止した位置よりも前の位置（一時停止前位置）から読み上げ再生の再開を行う（ステップＳ２３９）。本実施形態においては、一時停止した位置は「きょうのてんきはぜん」まで読み上げた位置であるから、例えば、一時停止した位置の直前の文頭から読み上げを再開してもよい。例えば、「今日の天気は全国的に晴れです。」の文頭から読み上げを再開してもよい。

【0130】

以上説明したとおり、本発明の実施形態３におけるデータ音声再生装置１０を用いると、データ音声再生装置１０がユーザの音量調整命令の入力を受け、読み上げを一時停止したのち読み上げを再開する際、読み上げ再生が一時停止されたテキストデータまたはＨＴＭＬデータの位置よりも前の位置（一時停止前位置）から読み上げ再生の再開を行うこととなるから、ユーザが音量調整命令を発音している間にデータ音声再生装置１０が読み上げていた文を、再度、データ音声再生装置１０が読み上げることになるため、ユーザが、データ音声再生装置１０が読み上げた文が聞き取れないという事態を減少させることができる。

【0131】

＜実施形態４＞
本発明の実施形態４に係るデータ音声再生装置１０を含むデータ音声再生システム１について、図面を参照しながら詳細に説明する。なお、実施形態１における説明と重複する説明については適宜省略する。

【0132】

［データ音声再生装置１０の機能構成］
図１４は、本発明の実施形態４に係るデータ音声再生装置１０のデータ音声再生機能を示すブロック図である。以下、主に本発明の実施形態１に係るデータ音声再生装置１０のデータ音声再生機能を示すブロック図との違いについて説明する。

【0133】

データ音声再生部１０２は、実施形態１と同様、データ取得部１０１が取得した単一または複数のコンテンツからなるテキストデータまたはＨＴＭＬデータを取得し、当該データを音声信号に変換したうえ、読み上げ再生を行う。また、読み上げ再生が一時停止されたテキストデータまたはＨＴＭＬデータの位置よりも前の位置（一時停止前位置）から読み上げ再生の再開を行うものとする。

【0134】

音声認識部１０４は、実施形態１と同様、音声受信部１０３が受信した音声信号を取得し、音声による命令の内容を認識する。本実施形態においては、音声認識部１０４は、ユーザの検索命令を認識すると、当該検索命令が含む検索語に関連する情報を検索する旨の検索命令を検索部１２４に送り、検索語に関連する情報を収集させる。

【0135】

ここで、ユーザの「検索命令」とは、データ音声再生装置１０に対するユーザの、検索命令が含む検索語に関連する情報を検索する旨の命令である。例えば、ユーザがデータ音声再生装置１０に対し「今日のＡ社の株価は？」と音声信号を入力すると、今日のＡ社の株価という検索語に関連する情報を検索する旨の検索命令であると音声認識部１０４に認識されてもよい。

【0136】

検索部１２４は、音声認識部１０４によって認識された命令内容が検索命令である場合、当該検索命令に基づいて情報を収集する。具体的には、検索部１２４は、音声認識部１０４から検索命令を受け取ると、当該命令にしたがって、検索語に関連する情報を収集する。検索部１２４は、例えば、ネットワーク３０を介して外部のサーバーから情報を収集してもよい。

【0137】

情報通知部１２６は、検索部１２４によって収集された、検索語に関連する情報を音声により通知する。

【0138】

例えば、ユーザがデータ音声再生装置１０に対し「今日のＡ社の株価を教えて」と入力し、検索部が今日のＡ社の株価は１０，０００円であるとの情報を収集したとき、情報通知部１２６はその情報を公知の方法を用いて音声信号に変換し、「今日のＡ社の株価は１０，０００円です」と音声により通知してもよい。

【0139】

また、本実施形態においては、情報通知部１２６は、検索部１２４によって収集された、検索語に関連する情報を音声により通知した後、データ音声再生部１０２に読み上げ再生を再開する旨の再生再開命令を送り、これを受け取ったデータ音声再生部１０２は読み上げ再生を再開するものとする。

【0140】

データ取得部１０１及び音声受信部１０３についての説明は実施形態１と同様であるから省略する。

【0141】

［データ読み上げ再生処理］
続いて、実施形態４のデータ音声再生装置１０におけるデータ読み上げ再生処理について説明する。

【0142】

図１５は、実施形態４におけるデータ音声再生装置１０において実行されるデータ読み上げ再生処理を示すフローチャートである。この処理は、データ音声再生装置１０が起動し、データ取得部１０１が単一または複数のコンテンツからなるテキストデータまたはＨＴＭＬデータを取得し、データ音声再生部１０２が当該テキストデータまたはＨＴＭＬデータの読み上げ再生を開始すると実行される。

【0143】

ステップＳ３０１からステップＳ３０５についての説明は、実施形態１についてのステップＳ１０１からステップＳ１０５についての説明と共通するので適宜省略する。

【0144】

ステップＳ３０１において、音声受信部１０３が音声を受信していると判断したとき（ステップＳ３０１；Ｙｅｓ）、音声認識部１０４が、音声受信部１０３が受信した音声の内容を認識する（ステップＳ３０５）。受信した音声が、ユーザの音声による検索命令ではないと認識されると（ステップＳ３０７；Ｎｏ）、ステップＳ３０３に進み、データ音声再生部１０２によるテキストデータまたはＨＴＭＬデータの読み上げが終了しているかどうかが判断されることとなる。

【0145】

ステップＳ３０７において、受信した音声がユーザの音声による検索命令であると認識されると（ステップＳ３０７；Ｙｅｓ）、データ音声再生部１０２による読み上げ再生が一時停止する（ステップＳ３０９）。続いて、検索命令にしたがって、検索語に関連する情報が収集され（ステップＳ３１１）、当該情報が音声信号に変換され音声により通知される（ステップＳ３１３）。

【0146】

ステップＳ３１３において検索語に関連する情報の音声による通知が行われると、データ音声再生部１０２は一時停止前位置より読み上げ再生を行う（ステップＳ３１５）。そして、ステップＳ３０３に進み、データ音声再生部１０２によるテキストデータまたはＨＴＭＬデータの読み上げが終了しているかどうかが判断される。終了していないと判断された場合は、ステップＳ３０１に戻り、再び、音声受信部１０３が音声を受信しているかを判断する。テキストデータまたはＨＴＭＬデータの読み上げが終了したとき、データ音声再生装置１０におけるデータ音声再生処理は終了する（ステップＳ３０３；Ｙｅｓ）。

【0147】

［読み上げ再生再開の処理］
続いて、本発明の実施形態４に係るデータ音声再生装置１０において、ユーザが検索命令を入力してから読み上げ再生が再開されるまでの処理について説明する。

【0148】

図１６は、データ音声再生装置１０において読み上げ再生を実行中に、ユーザが検索命令を入力してから読み上げ再生が再開されるまでの処理を示すフローチャートである。また、この説明においては、データ音声再生装置１０は、「おはようございます。今日の天気は全国的に晴れです」と読み上げるものとし、「おはようございます。」の文を第１文、「今日の天気は全国的に晴れです。」との文を第２文という。

【0149】

まずは、データ音声再生装置１０が、第１文のテキストデータまたはＨＴＭＬデータを音声信号に変換し読み終わったものとする（ステップＳ３２１）。続いて、データ音声再生装置１０は第２文のテキストデータまたはＨＴＭＬデータを音声信号に変換し第２文の読み上げを開始するが（ステップＳ３２３）、「きょうのてんきはぜん」と読み上げたところで、ユーザが「今日のＡ社の株価を教えて」と言い、音声受信部１０３に検索命令を入力したものとする（ステップＳ３２５）。

【0150】

続いて、音声認識部１０４は、音声受信部１０３が受信した音声信号を取得し（ステップＳ３２７）、音声認識を行う（ステップＳ３２９）。

【0151】

音声認識部１０４は、ユーザの検索命令を認識すると、一時停止命令をデータ音声再生部１０２に送り（ステップＳ３３１）、一時停止命令を受け取ったデータ音声再生部１０２は、読み上げを一時停止する（ステップＳ３３３）。本実施形態においては、データ音声再生部１０２は、読み上げ再生を一時停止する際、テキストデータまたはＨＴＭＬデータのうち、どの位置で読み上げ再生を一時停止したかを記憶するため、「きょうのてんきはぜん」まで読み上げた位置で一時停止したことを記憶する。

【0152】

また、音声認識部１０４は、ユーザの検索命令を認識すると、当該検索命令が含む検索語に関連する情報を検索する旨の検索命令を検索部１２４に送り（ステップＳ３３５）、検索命令を受け取った検索部１２４は、当該検索命令に基づいて情報を収集し（ステップＳ３３７）、情報通知部１２６に提供する（ステップＳ３３９）。

【0153】

ステップＳ３３９の後、情報通知部１２６は、検索部１２４によって収集された、検索語に関連する情報を音声により通知する（ステップＳ３４１）。そして、情報通知部１２６は、再生再開命令をデータ音声再生部１０２に送る（ステップＳ３４３）。

【0154】

情報通知部１２６から再生再開命令を受け取ったデータ音声再生部１０２は、ステップＳ３３３において記憶していた一時停止した位置よりも前の位置（一時停止前位置）から読み上げ再生の再開を行う（ステップＳ３４５）。本実施形態においては、一時停止した位置は「きょうのてんきはぜん」まで読み上げた位置であるから、例えば、一時停止した位置の直前の文頭から読み上げを再開してもよい。例えば、「今日の天気は全国的に晴れです。」の文頭から読み上げを再開してもよい。

【0155】

以上説明したとおり、本発明の実施形態４におけるデータ音声再生装置１０を用いると、データ音声再生装置１０がユーザの検索命令の入力を受け、読み上げを一時停止したのち読み上げを再開する際、読み上げ再生が一時停止されたテキストデータまたはＨＴＭＬデータの位置よりも前の位置（一時停止前位置）から読み上げ再生の再開を行うこととなるから、ユーザが検索命令を発音している間にデータ音声再生装置１０が読み上げていた文を、再度、データ音声再生装置１０が読み上げることになるため、ユーザが、データ音声再生装置１０が読み上げた文が聞き取れないという事態を減少させることができる。

【0156】

＜実施形態５＞
本発明の実施形態５に係るデータ音声再生装置１０を含むデータ音声再生システム１について、図面を参照しながら詳細に説明する。なお、実施形態１における説明と重複する説明については適宜省略する。

【0157】

［データ音声再生装置１０の機能構成］
図１７は、本発明の実施形態５に係るデータ音声再生装置１０のデータ音声再生機能を示すブロック図である。以下、主に本発明の実施形態１に係るデータ音声再生装置１０のデータ音声再生機能を示すブロック図との違いについて説明する。

【0158】

音声認識部１０４は、実施形態１と同様、音声受信部１０３が受信した音声信号を取得し、音声による命令の内容を認識する。本実施形態においては、音声認識部１０４は、ユーザの音声による一時停止命令を認識すると、一時停止命令をデータ音声再生部１０２に送り、読み上げ再生を一時停止させる。また、音声認識部１０４は、ユーザの音声による再生再開命令を認識すると、再生再開命令をデータ音声再生部１０２に送り、読み上げ再生を再開させる。

【0159】

ここで、ユーザの音声による「一時停止命令」とは、データ音声再生装置１０に対するユーザの、読み上げ再生を一時停止する旨の命令である。例えば、ユーザがデータ音声再生装置１０に対し「一時停止して」と音声により入力すると、音声認識部１０４に、一時停止命令として認識されるようにしてもよい。

【0160】

また、ユーザの音声による「再生再開命令」とは、読み上げ再生を一時停止した状態にあるデータ音声再生装置１０に対するユーザの、読み上げ再生を再開する旨の命令である。例えば、ユーザがデータ音声再生装置１０に対し「再生再開して」と音声により入力すると、音声認識部１０４に、再生再開命令として認識されるようにしてもよい。

【0161】

データ音声再生部１０２は、実施形態１と同様、データ取得部１０１が取得した単一または複数のコンテンツからなるテキストデータまたはＨＴＭＬデータを取得し、読み上げ再生を行う。データ音声再生部１０２が行う読み上げ再生は、一時停止すること及び再開することができる。また、本実施形態においては、実施形態１と同様、読み上げ再生が一時停止されたテキストデータまたはＨＴＭＬデータの位置よりも前の位置（一時停止前位置）から読み上げ再生の再開を行うものとする。

【0162】

また、本実施形態においては、データ音声再生部１０２は、音声認識部１０４から一時停止命令を受け取ると読み上げ再生を一時停止し、音声認識部１０４から再生再開命令を受け取ると読み上げ再生を再開する。

【0163】

データ取得部１０１及び音声受信部１０３についての説明は実施形態１と同様であるから省略する。

【0164】

［データ読み上げ再生処理］
続いて、実施形態５のデータ音声再生装置１０におけるデータ読み上げ再生処理について説明する。

【0165】

図１８は、実施形態５におけるデータ音声再生装置１０において実行されるデータ読み上げ再生処理を示すフローチャートである。この処理は、データ音声再生装置１０が起動し、データ取得部１０１が単一または複数のコンテンツからなるテキストデータまたはＨＴＭＬデータを取得し、データ音声再生部１０２が当該テキストデータまたはＨＴＭＬデータの読み上げ再生を開始すると実行される。

【0166】

ステップＳ４０１からステップＳ４０５についての説明は、実施形態１における、ステップＳ１０１からステップＳ１０５についての説明と共通するので適宜省略する。

【0167】

ステップＳ４０１において、音声受信部１０３が音声を受信していると判断したとき（ステップＳ４０１；Ｙｅｓ）、音声認識部１０４が、音声受信部１０３が受信した音声の内容を認識する（ステップＳ４０５）。受信した音声が、ユーザの音声による一時停止命令ではないと認識されると（ステップＳ４０７；Ｎｏ）、ステップＳ４０３に進み、データ音声再生部１０２によるテキストデータまたはＨＴＭＬデータの読み上げが終了しているかどうかが判断されることとなる。

【0168】

ステップＳ４０７において、受信した音声がユーザの音声による一時停止命令であると認識されると、データ音声再生部１０２による読み上げ再生を一時停止し（ステップＳ４０９）、ステップＳ４１１に進み、音声受信部１０３が音声を受信していると判断するまで待機する（ステップＳ４１１；Ｎｏ）。

【0169】

ステップＳ４１１において、音声受信部１０３が音声を受信していると判断したとき（ステップＳ４１１；Ｙｅｓ）、音声認識部１０４が、音声受信部１０３が受信した音声の内容を認識する（ステップＳ４１３）。受信した音声が、ユーザの音声による再生再開命令ではないと認識されると（ステップＳ４１５；Ｎｏ）、ステップＳ４１１に戻り、音声受信部１０３が音声を受信していると判断するまで待機する。

【0170】

ステップＳ４１５において、受信した音声がユーザの音声による再生再開命令であると認識されると（ステップＳ４１５；Ｙｅｓ）、ステップＳ４１７に進み、一時停止前位置から読み上げを再開する。そして、ステップＳ４０３に進み、データ音声再生部１０２によるテキストデータまたはＨＴＭＬデータの読み上げが終了しているかどうかが判断される。終了していないと判断された場合は、ステップＳ４０１に戻り、再び、音声受信部１０３が音声を受信しているかを判断する。テキストデータまたはＨＴＭＬデータの読み上げが終了したとき、データ音声再生装置１０におけるデータ音声再生処理は終了する（ステップＳ４０３；Ｙｅｓ）。

【0171】

［読み上げ再生再開の処理］
続いて、本発明の実施形態５に係るデータ音声再生装置１０において、ユーザが一時停止命令を入力してから、再生再開命令を入力して読み上げ再生が再開されるまでの処理について説明する。

【0172】

図１９は、データ音声再生装置１０において読み上げ再生を実行中に、ユーザが一時停止命令を入力してから読み上げ再生が再開されるまでの処理を示すフローチャートである。また、この説明においては、データ音声再生装置１０は、「おはようございます。今日の天気は全国的に晴れです」と読み上げるものとし、「おはようございます。」の文を第１文、「今日の天気は全国的に晴れです。」との文を第２文という。

【0173】

まずは、データ音声再生装置１０が、第１文のテキストデータまたはＨＴＭＬデータを音声信号に変換し読み終わったものとする（ステップＳ４２１）。続いて、データ音声再生装置１０は第２文のテキストデータまたはＨＴＭＬデータを音声信号に変換し第２文の読み上げを開始するが（ステップＳ４２３）、「きょうのてんきはぜん」と読み上げたところで、ユーザが「一時停止して」と言い、音声受信部１０３に一時停止命令を入力したものとする（ステップＳ４２５）。

【0174】

続いて、音声認識部１０４は、音声受信部１０３が受信した音声信号を取得し（ステップＳ４２７）、音声認識を行う（ステップＳ４２９）。

【0175】

音声認識部１０４は、ユーザの一時停止命令を認識すると、一時停止命令をデータ音声再生部１０２に送り（ステップＳ４３１）、一時停止命令を受け取ったデータ音声再生部１０２は、読み上げを一時停止する（ステップＳ４３３）。本実施形態においては、データ音声再生部１０２は、読み上げ再生を一時停止する際、テキストデータまたはＨＴＭＬデータのうち、どの位置で読み上げ再生を一時停止したかを記憶するため、「きょうのてんきはぜん」まで読み上げた位置で一時停止したことを記憶する。

【0176】

その後、ユーザが「再生再開して」と言い、音声受信部１０３に再生再開命令を入力すると（ステップＳ４３５）、音声認識部１０４がその音声信号を取得し（ステップＳ４３７）、音声認識を行う（ステップＳ４３９）。

【0177】

音声認識部１０４は、ユーザの再生再開命令を認識すると、再生再開命令をデータ音声再生部１０２に送り（ステップＳ４４１）、これを受け取ったデータ音声再生部１０２は、ステップＳ４３３において記憶していた一時停止した位置よりも前の位置（一時停止前位置）から読み上げ再生の再開を行う（ステップＳ４４３）。本実施形態においては、一時停止した位置は「きょうのてんきはぜん」まで読み上げた位置であるから、例えば、一時停止した位置の直前の文頭から読み上げを再開してもよい。

【0178】

以上説明したとおり、本発明の実施形態５におけるデータ音声再生装置１０を用いると、データ音声再生装置１０がユーザの一時停止命令の入力を受け、読み上げを一時停止したのち読み上げを再開する際、読み上げ再生が一時停止されたテキストデータまたはＨＴＭＬデータの位置よりも前の位置（一時停止前位置）から読み上げ再生の再開を行うこととなるから、ユーザが一時停止命令を発音している間にデータ音声再生装置１０が読み上げていた文を、再度、データ音声再生装置１０が読み上げることになるため、ユーザが、データ音声再生装置１０が読み上げた文が聞き取れないという事態を減少させることができる。

【0179】

また、本発明の実施形態５におけるデータ音声再生装置１０を用いると、ユーザは、読み上げ再生の一時停止と再開を音声により操作できるため便利である。

【0180】

実施形態５においては、データ音声再生装置１０がユーザの一時停止命令の入力を受け、読み上げを一時停止したのち読み上げを再開する際、読み上げ再生が一時停止されたテキストデータまたはＨＴＭＬデータの位置よりも前の位置（一時停止前位置）から読み上げ再生の再開を行うこととしたが、実施形態２と同様に、音声受信部１０３が受信したユーザの音声による命令が発話された時点に対応するテキストデータまたはＨＴＭＬデータと同じ位置もしくはそれよりも前の位置（発話前位置）から読み上げ再生を再開してもよい。

【0181】

すなわち、データ音声再生部１０２が、音声認識部１０４から一時停止命令を受け取ると、音声受信部１０３から、ユーザの音声による命令を受信した時刻（命令受信時刻）の情報を取得し、自身が記憶しているテキスト時刻対応データと命令受信時刻の情報に基づいて、音声受信部１０３が受信したユーザの音声による命令が発話された時点に対応するテキストデータまたはＨＴＭＬデータと同じ位置を特定し、当該同じ位置もしくはそれよりも前の位置から読み上げ再生を再開してもよい。

【0182】

また、特に、音声受信部１０３が受信したユーザの音声による命令が発話された時点に対応するテキストデータまたはＨＴＭＬデータと同じ位置よりも前に位置する一文又は文節の先頭（区切り位置）から、データ音声再生部１０２による読み上げ再生の再開が行われるものとしてもよい。この場合、データ音声再生装置１０の機能構成としては、実施形態２と同様、データ取得部１０１が取得したテキストデータまたはＨＴＭＬデータにおいて、一文または文節の単位を識別し、識別した一文または文節の単位の情報を、テキストデータまたはＨＴＭＬデータとともに、データ音声再生部１０２に提供する識別部１２０を含む。

【0183】

＜実施形態６＞
本発明の実施形態６に係る無線通信端末４０を含むデータ音声再生システム１について、図面を参照しながら詳細に説明する。実施形態１と同様の説明については省略することがある。

【0184】

［概要］
図２０は、本発明の実施形態６に係る無線通信端末４０を含むデータ音声再生システム１の構成を示す図である。データ音声再生システム１は、無線通信端末４０と、相手方無線通信端末５０と、メディアサイトサーバー２０を有する。無線通信端末４０と、相手方無線通信端末５０とは、インターネット、通信回線などのネットワーク３０に接続されている。

【0185】

無線通信端末４０は、他の無線通信端末と通信をすることができる端末であり、かつ、データ音声再生装置１０と同様、データ音声再生サービスを提供する装置である。具体的には、スマートフォンなどの携帯通信端末が挙げられる。

【0186】

相手方無線通信端末５０は、無線通信端末４０と同様、他の無線通信端末と通信をすることができる端末である。

【0187】

図２０に示すように、無線通信端末４０と、メディアサイトサーバー２０とがネットワーク３０に接続されているとき、無線通信端末４０はメディアサイトサーバー２０から記事を取得することができる。また、無線通信端末４０と、相手方無線通信端末５０がネットワーク３０に接続されているとき、無線通信端末４０と相手方無線通信端末５０は互いに通信することができる。

【0188】

［無線通信端末４０のハードウエア構成］
図２０に示すように、無線通信端末４０は、制御部４１、記憶部４２、通信部４３、音声入力部４４、音声出力部４５、物理的入力部４６を有する。制御部４１、記憶部４２、通信部４３、音声入力部４４、音声出力部４５についての説明は実施形態１における説明と同様であるので省略する。

【0189】

物理的入力部４６は、例えば、押しボタンスイッチであり、このボタンを押すと、物理的に、無線通信端末４０に何らかの命令を入力できる装置である。

【0190】

［無線通信端末４０の機能構成］
図２１は、本発明の実施形態６に係る無線通信端末４０のデータ音声再生機能を示すブロック図である。

【0191】

データ音声再生部１０２は、実施形態１と同様、データ取得部１０１が取得した単一または複数のコンテンツからなるテキストデータまたはＨＴＭＬデータを取得し、当該データを音声信号に変換したうえ、読み上げ再生を行う。データ音声再生部１０２が行う読み上げ再生は、一時停止すること及び再開することができる。

【0192】

本実施形態においては、データ音声再生部１０２は、通話部１２８から一時停止命令を受け取ると、読み上げ再生を一時停止し、テキストデータまたはＨＴＭＬデータのうち、どの位置で読み上げ再生を一時停止したかを記憶する。そして、データ音声再生部１０２が再生再開命令を受け取ると、読み上げ再生が一時停止されたテキストデータまたはＨＴＭＬデータの位置よりも前の位置（一時停止前位置）から読み上げ再生を再開するものとする。

【0193】

通話部１２８は、通話のための通信を行い、データ音声再生部１０２がテキストデータまたはＨＴＭＬデータを読み上げ再生中に通話の着信を受けて通信を開始することができる。本実施形態においては、通話部１２８は、通話の着信を受けて通信を開始すると、データ音声再生部１０２に一時停止命令を送るものとする。また、通話部１２８は、通話のための通信が終了すると、データ音声再生部１０２に再生再開命令を送るものとする。

【0194】

データ取得部１０１についての説明は、実施形態１と同様であるため省略する。

【0195】

［データ読み上げ再生処理］
続いて、無線通信端末４０におけるデータ読み上げ再生処理について説明する。

【0196】

図２２は、本実施形態における無線通信端末４０において実行されるデータ読み上げ再生処理を示すフローチャートである。この処理は、無線通信端末４０が起動し、データ取得部１０１が単一または複数のコンテンツからなるテキストデータまたはＨＴＭＬデータを取得し、データ音声再生部１０２が当該テキストデータまたはＨＴＭＬデータの読み上げ再生を開始すると実行される。

【0197】

まず、通話部１２８が通話の着信を受けているかを判断する（ステップＳ５０１）。通話部１２８が通話の着信を受けていないと判断した場合（ステップＳ５０１；Ｎｏ）、ステップＳ５０３に進む。ステップＳ５０３においては、データ音声再生部１０２によるテキストデータまたはＨＴＭＬデータの読み上げが終了しているかどうかが判断される。終了していないと判断された場合は、ステップＳ５０１に戻り、再び、通話部１２８が通話の着信を受けているかを判断する。また、テキストデータまたはＨＴＭＬデータの読み上げが終了したと判断されたとき、無線通信端末４０におけるデータ音声再生処理は終了する（ステップＳ５０３；Ｙｅｓ）。

【0198】

ステップＳ５０１において、通話部１２８が通話の着信を受けていると判断したとき（ステップＳ５０１；Ｙｅｓ）、通話部１２８は一時停止命令をデータ音声再生部１０２に送り、データ音声再生部１０２は読み上げ再生を一時停止する（ステップＳ５０５）。

【0199】

その後、ステップＳ５０７に進み、通話部１２８は通話のための通信が終了したかを判断する。通話のための通信が終了していないと判断した場合（ステップＳ５０７；Ｎｏ）、通話が終了するまで待機する。通話のための通信が終了したと判断した場合（ステップＳ５０７；Ｙｅｓ）、通話部１２８は再生再開命令をデータ音声再生部１０２に送り、これを受け取ったデータ音声再生部１０２は、一時停止前位置から読み上げ再生を再開する（ステップＳ５０９）。そして、ステップＳ５０３に進み、データ音声再生部１０２によるテキストデータまたはＨＴＭＬデータの読み上げが終了しているかどうかが判断される。終了していないと判断された場合は、ステップＳ５０１に戻り、再び、通話部１２８が通話の着信を受けているかを判断する。テキストデータまたはＨＴＭＬデータの読み上げが終了したとき、データ音声再生装置１０におけるデータ音声再生処理は終了する（ステップＳ５０３；Ｙｅｓ）。

【0200】

本発明の実施形態６における無線通信端末４０を用いると、無線通信端末４０が読み上げ再生を行っている間に通話のための通信が開始し、読み上げを一時停止したのち読み上げを再開する際、読み上げ再生が一時停止されたテキストデータまたはＨＴＭＬデータの位置よりも前の位置（一時停止前位置）から読み上げ再生の再開を行うこととなるから、ユーザは、通話のための通信が開始する前にデータ音声再生装置１０が読み上げていた文を、再度聞くことができ、通話前にどのコンテンツについて読み上げ再生されていたかを思い出しつつ、再開した読み上げ再生を聞くことができ、便利である。

【0201】

実施形態６においては、無線通信端末４０が読み上げ再生を一時停止し、再開するときに、読み上げ再生が一時停止されたテキストデータまたはＨＴＭＬデータの位置よりも前の位置（一時停止前位置）から読み上げ再生を再開するものとしたが、通話の着信を受けた時点に対応するテキストデータまたはＨＴＭＬデータと同じ位置もしくはそれよりも前の位置（着信前位置）から読み上げ再生を再開してもよい。

【0202】

すなわち、データ音声再生部１０２がテキストデータまたはＨＴＭＬデータの読み上げ再生を行う際、どの箇所を読み上げているのかの情報と時刻の情報を対応付けて、テキスト時刻対応データとして記憶し、データ音声再生部１０２が、通話部１２８から一時停止命令を受け取ると、通話部１２８から、通話の着信を受けた時刻の情報を取得し、テキスト時刻対応データに基づいて、通話の着信を受けた時刻に対応するテキストデータまたはＨＴＭＬデータと同じ位置を特定し、当該同じ位置もしくはそれよりも前の位置から読み上げ再生を再開してもよい。

【0203】

また、特に、通話部１２８が通話の着信を受けた時点に対応するテキストデータまたはＨＴＭＬデータの位置よりも前に位置する一文又は文節の先頭（区切り位置）から、データ音声再生部１０２による読み上げ再生の再開が行われるものとしてもよい。この場合、無線通信端末４０の機能構成としては、実施形態２と同様、データ取得部１０１が取得したテキストデータまたはＨＴＭＬデータにおいて、一文または文節の単位を識別し、識別した一文または文節の単位の情報を、テキストデータまたはＨＴＭＬデータとともに、データ音声再生部１０２に提供する識別部１２０を含む。

【0204】

＜実施形態７＞
本発明の実施形態７に係る無線通信端末４０を含むデータ音声再生システム１について、図面を参照しながら詳細に説明する。実施形態１または実施形態６と同様の説明については省略することがある。

【0205】

［無線通信端末４０の機能構成］
図２３は、本発明の実施形態７に係る無線通信端末４０のデータ音声再生機能を示すブロック図である。

【0206】

音声受信部１０３は、データ音声再生部１０２がテキストデータまたはＨＴＭＬデータを読み上げ再生中に、ユーザの音声による命令を受信する。

【0207】

音声認識部１０４は、音声受信部１０３が受信した音声信号を取得し、音声による命令の内容を認識する。本実施形態においては、音声認識部１０４は、ユーザの再生再開命令を認識すると、再生再開命令をデータ音声再生部１０２に送り、読み上げ再生を再開させる。

【0208】

データ音声再生部１０２は、実施形態６と同様、通話部１２８から一時停止命令を受け取ると、読み上げ再生を一時停止し、テキストデータまたはＨＴＭＬデータのうち、どの位置で読み上げ再生を一時停止したかを記憶する。そして、データ音声再生部１０２が再生再開命令を受け取ると、読み上げ再生が一時停止されたテキストデータまたはＨＴＭＬデータの位置よりも前の位置（一時停止前位置）から読み上げ再生を再開するものとする。

【0209】

データ取得部１０１、通話部１２８についての説明は実施形態６における説明と共通するので省略する。

【0210】

［データ読み上げ再生処理］
続いて、無線通信端末４０におけるデータ読み上げ再生処理について説明する。

【0211】

図２４は、本実施形態における無線通信端末４０において実行されるデータ読み上げ再生処理を示すフローチャートである。この処理は、無線通信端末４０が起動し、データ取得部１０１が単一または複数のコンテンツからなるテキストデータまたはＨＴＭＬデータを取得し、データ音声再生部１０２が当該テキストデータまたはＨＴＭＬデータの読み上げ再生を開始すると実行される。

【0212】

ステップＳ６０１からステップＳ６０５の説明は実施形態６におけるステップＳ５０１からステップＳ５０５についての説明と共通するので適宜省略する。

【0213】

ステップＳ６０５において読み上げ再生が一時停止すると、ステップＳ６０７に進む。ステップＳ６０７においては、音声受信部１０３が音声を受信しているかを判断する。受信していないと判断した場合、音声を受信するまで待機する（ステップＳ６０７；Ｎｏ）。

【0214】

ステップＳ６０７において音声受信部１０３が音声を受信したと判断したとき（ステップＳ６０７；Ｙｅｓ）、ステップＳ６０９に進み、当該音声についての音声認識が行われる。

【0215】

ステップＳ６０９の音声認識の結果、当該音声が再生再開命令だと認識されなかった場合（ステップＳ６１１；Ｎｏ）、ステップＳ６０７に戻り、音声を受信するまで待機する。

【0216】

ステップＳ６０９の音声認識の結果、当該音声が再生再開命令だと認識された場合（ステップＳ６１１；Ｙｅｓ）、ステップＳ６１３に進み、一時停止前位置から読み上げ再生を再開する。そして、ステップＳ６０３に進み、データ音声再生部１０２によるテキストデータまたはＨＴＭＬデータの読み上げが終了しているかどうかが判断される。終了していないと判断された場合は、ステップＳ６０１に戻り、再び、通話部１２８が通話の着信を受けているかを判断する。テキストデータまたはＨＴＭＬデータの読み上げが終了したとき、データ音声再生装置１０におけるデータ音声再生処理は終了する（ステップＳ６０３；Ｙｅｓ）。

【0217】

本発明の実施形態７における無線通信端末４０を用いると、実施形態６と同様、無線通信端末４０が読み上げ再生を行っている間に通話のための通信が開始し、読み上げを一時停止したのち読み上げを再開する際、読み上げ再生が一時停止されたテキストデータまたはＨＴＭＬデータの位置よりも前の位置（一時停止前位置）から読み上げ再生の再開を行うこととなるから、ユーザは、通話のための通信が開始する前にデータ音声再生装置１０が読み上げていた文を、再度聞くことができ、通話前にどのコンテンツについて読み上げ再生されていたかを思い出しつつ再開した読み上げ再生を聞くことができ、便利である。

【0218】

また、本発明の実施形態７における無線通信端末４０を用いると、実施形態６と異なり、ユーザは、無線通信端末４０が読み上げ再生を再開するタイミングを自ら設定することができ、便利である。

【0219】

実施形態７においては、無線通信端末４０が読み上げ再生を一時停止し、再開するときに、読み上げ再生が一時停止されたテキストデータまたはＨＴＭＬデータの位置よりも前の位置（一時停止前位置）から読み上げ再生を再開するものとしたが、通話の着信を受けた時点に対応するテキストデータまたはＨＴＭＬデータと同じ位置もしくはそれよりも前の位置（着信前位置）から読み上げ再生を再開してもよい。

【0220】

【0221】

【0222】

＜実施形態８＞
本発明の実施形態８に係る無線通信端末４０を含むデータ音声再生システム１について、図面を参照しながら詳細に説明する。実施形態１または実施形態６と同様の説明については省略することがある。

【0223】

［無線通信端末４０の機能構成］
図２５は、本発明の実施形態８に係る無線通信端末４０のデータ音声再生機能を示すブロック図である。

【0224】

コマンド受付部１３０は、データ音声再生部１０２がテキストデータまたはＨＴＭＬデータの読み上げ再生を一時停止している間、読み上げ再生の一時停止の解除コマンド又は読み上げ再生の再開コマンドを受け付ける。

【0225】

ここで、読み上げ再生の一時停止の解除コマンド又は読み上げ再生の再開コマンドとは、いずれも、データ音声再生部１０２が読み上げ再生を一時停止しているときに、その一時停止を解除し、再生を再開する旨の入力である。どちらも、実際は、無線通信端末４０の物理的入力部４６によって入力される。以下では、まとめて再開コマンドとして説明する。

【0226】

コマンド受付部１３０は、再開コマンドを受け付けると、データ音声再生部１０２に再生再開命令を送る。

【0227】

データ音声再生部１０２は、実施形態６と同様、実施形態６と同様、通話部１２８から一時停止命令を受け取ると、読み上げ再生を一時停止し、テキストデータまたはＨＴＭＬデータのうち、どの位置で読み上げ再生を一時停止したかを記憶する。そして、データ音声再生部１０２が再生再開命令を受け取ると、読み上げ再生が一時停止されたテキストデータまたはＨＴＭＬデータの位置よりも前の位置（一時停止前位置）から読み上げ再生を再開するものとする。

【0228】

データ取得部１０１、通話部１２８についての説明は実施形態６における説明と共通するので省略する。

【0229】

［データ読み上げ再生処理］
続いて、無線通信端末４０におけるデータ読み上げ再生処理について説明する。

【0230】

図２６は、本実施形態における無線通信端末４０において実行されるデータ読み上げ再生処理を示すフローチャートである。この処理は、無線通信端末４０が起動し、データ取得部１０１が単一または複数のコンテンツからなるテキストデータまたはＨＴＭＬデータを取得し、データ音声再生部１０２が当該テキストデータまたはＨＴＭＬデータの読み上げ再生を開始すると実行される。

【0231】

ステップＳ７０１からステップＳ７０５の説明は実施形態６におけるステップＳ５０１からステップＳ５０５についての説明と共通するので適宜省略する。

【0232】

ステップＳ７０５において読み上げ再生が一時停止すると、ステップＳ７０７に進む。ステップＳ７０７においては、コマンド受付部１３０に再生コマンドが入力されているかを判断する。入力されていないと判断した場合、再生コマンドが入力されるまで待機する（ステップＳ７０７；Ｎｏ）。

【0233】

ステップＳ７０７において再生コマンドが入力されたと判断したとき、コマンド受付部１３０がデータ音声再生部１０２に再生再開命令を送るため、ステップＳ７０９に進み、データ音声再生部１０２によるテキストデータまたはＨＴＭＬデータの読み上げが終了しているかどうかが判断される。終了していないと判断された場合は、ステップＳ７０１に戻り、再び、通話部１２８が通話の着信を受けているかを判断する。テキストデータまたはＨＴＭＬデータの読み上げが終了したとき、データ音声再生装置１０におけるデータ音声再生処理は終了する（ステップＳ７０３；Ｙｅｓ）。

【0234】

本発明の実施形態８における無線通信端末４０を用いると、実施形態６と同様、無線通信端末４０が読み上げ再生を行っている間に通話のための通信が開始し、読み上げを一時停止したのち読み上げを再開する際、読み上げ再生が一時停止されたテキストデータまたはＨＴＭＬデータの位置よりも前の位置（一時停止前位置）から読み上げ再生の再開を行うこととなるから、ユーザは、通話のための通信が開始する前にデータ音声再生装置１０が読み上げていた文を、再度聞くことができ、通話前にどのコンテンツについて読み上げ再生されていたかを思い出しつつ再開した読み上げ再生を聞くことができ、便利である。

【0235】

また、本発明の実施形態８における無線通信端末４０を用いると、実施形態６と異なり、ユーザは、無線通信端末４０が読み上げ再生を再開するタイミングを自ら設定することができ、便利である。

【0236】

なお、実施形態７において説明したとおり、通話の着信を受けた時点に対応するテキストデータまたはＨＴＭＬデータと同じ位置もしくはそれよりも前の位置（着信前位置）から読み上げ再生を再開してもよいし、特に、通話部１２８が通話の着信を受けた時点に対応するテキストデータまたはＨＴＭＬデータの位置よりも前に位置する一文又は文節の先頭（区切り位置）から、データ音声再生部１０２による読み上げ再生の再開が行われるものとしてもよい。

【0237】

＜実施形態９＞
本発明の実施形態９に係るデータ音声再生装置１０を含むデータ音声再生システム１について、図面を参照しながら詳細に説明する。なお、実施形態１における説明と重複する説明については適宜省略する。

【0238】

［概要］
図２７は、本発明の実施形態９に係るデータ音声再生装置１０を含むデータ音声再生システムの構成を示す図である。実施形態１と同様、データ音声再生システム１は、データ音声再生装置１０と、メディアサイトサーバー２０とを有し、データ音声再生装置１０と、メディアサイトサーバー２０とは、インターネット、通信回線などのネットワーク３０に接続されている。

【0239】

実施形態１と同様、データ音声再生装置１０は、データ音声再生サービスを提供する装置であり、メディアサイトサーバー２０は、ユーザがインターネットを介してアクセスすることができるコンテンツを配信するメディアサイトが保有するサーバーであり、データ音声再生装置１０と、メディアサイトサーバー２０とがネットワーク３０に接続されているとき、データ音声再生装置１０はメディアサイトサーバー２０から単一または複数のコンテンツからなるテキストデータ又はＨＴＭＬデータを取得することができる。

【0240】

［データ音声再生装置１０のハードウエア構成］
図２７に示すように、データ音声再生装置１０は、制御部１１、記憶部１２、通信部１３、音声入力部１４、音声出力部１５、表示部１６、指示入力部１７、既再生成分除去部１８を有する。

【0241】

制御部１１、記憶部１２、通信部１３、音声入力部１４、音声出力部１５及び表示部１６についての説明は実施形態１と同様であるので省略する。

【0242】

指示入力部１７は、例えば、押しボタンスイッチであり、このボタンを押すと、データ音声再生装置１０に何らかの命令を入力できる装置である。また、指示入力部１７は、タッチパネルである表示部１６によって代替されてもよい。この場合、ユーザは、タッチパネルである表示部１６に表示されたボタンを押すことでデータ音声再生装置１０に何らかの命令を入力できる。

【0243】

既再生成分除去部１８は、音声入力部１４が音声信号の入力を受けると、当該音声信号を用いて、データ音声再生装置１０が音声を再生していなければ音声入力部１４に入力されていたと推定される音声信号（以下「処理済み音声信号」という。）を生成する装置である。既再生成分除去部１８が当該処理済み音声信号を生成する手法としては、たとえば、特開２００２−１３５１７０に記載されているエコーキャンセラ技術などを用いることができる。エコーキャンセラ技術とは、音響・通話機器などで、機器が発した音が、当該機器が有する音声入力部に拾われてしまい、反響（エコー）やハウリングが起きるのを防止・緩和する技術である。当該処理済み音声信号の生成手法としては、本実施形態では、具体的には、音声出力部１５が発する音声に由来して音声入力部１４に入力されると推定される音声信号を生成し、さらに、現実に音声入力部１４に入力された音声信号から当該推定音声信号を減算することで処理済み音声信号を生成する方法を用いるものとするが、処理済み音声信号の生成方法はこれに限られるものではない。

【0244】

［データ音声再生装置１０の機能構成］
図２８は、本発明の実施形態９に係るデータ音声再生装置１０のデータ音声再生機能を示すブロック図である。本実施形態では、保存領域１０７は、データ音声再生装置１０の内部に含まれるものとするが、保存領域１０７は、ネットワーク３０を介してデータ音声再生装置１０と接続された外部の記憶装置であってもよい。

【0245】

再生指示入力部１３２は、ユーザからの読み上げ再生を開始する旨の命令（以下「読み上げ再生開始命令」という。）の入力を受け付ける。

【0246】

再生指示入力部１３２は、ユーザから読み上げ再生開始命令の入力を受け付けると、データ取得部１０１に、ネットワーク３０を介して、メディアサイトサーバー２０などの外部装置から単一または複数のコンテンツからなるテキストデータまたはＨＴＭＬデータを取得する旨の命令（以下「データ取得命令」という。）を送る。データ取得命令を受け取ったデータ取得部１０１は、ネットワーク３０を介して、メディアサイトサーバー２０などの外部装置から単一または複数のコンテンツからなるテキストデータまたはＨＴＭＬデータを取得する。

【0247】

再生指示入力部１３２は、ユーザから読み上げ再生開始命令の入力を受け付けると、音声受信部１０３にユーザの音声による命令の受信を開始する旨の命令（以下「音声受信開始命令」という。）を送る。音声受信開始命令を受け取った音声受信部１０３は、ユーザの音声による命令の受信を開始する。

【0248】

データ取得部１０１は、再生指示入力部１３２からデータ取得命令を受け取ると、ネットワーク３０を介して、メディアサイトサーバー２０などの外部装置から単一または複数のコンテンツからなるテキストデータまたはＨＴＭＬデータを取得する。

【0249】

データ音声再生部１０２は、実施形態１と同様、データ取得部１０１が取得した単一または複数のコンテンツからなるテキストデータまたはＨＴＭＬデータを取得し、音声信号に変換し、読み上げ再生を行う。データ音声再生部１０２はさらに、読み上げ再生を行ったテキストデータまたはＨＴＭＬデータを変換して生成した当該音声信号を既再生成分除去部１３４に送る。

【0250】

本実施形態においては、データ音声再生部１０２は、音声認識部１０４によって認識された命令内容に応じて、テキストデータまたはＨＴＭＬデータの読み上げ再生を一時停止し、当該命令内容が実行された後、テキストデータまたはＨＴＭＬデータの読み上げ再生を一時停止前位置から再開するものとする。その他のデータ音声再生部１０２についての説明は実施形態１と同様であるため省略する。

【0251】

音声受信部１０３は、音声受信開始命令を受け取ると、ユーザの音声による命令の受信を開始する。本実施形態においては、音声受信部１０３は、ユーザの音声による命令を受信した時刻を記録するものとする（以下この時刻を「命令受信時刻」ということがある）。

【0252】

既再生成分除去部１３４は、データ音声再生部１０２から、読み上げ再生に用いたテキストデータまたはＨＴＭＬデータの音声信号を受け取り、当該音声信号に由来して音声受信部１０３に入力されると推定される音声信号（以下「推定音声信号」という。）を生成する。また、既再生成分除去部１３４は、音声受信部１０３から、音声受信部１０３が受信した音声信号を受信する。

【0253】

既再生成分除去部１３４は、音声受信部１０３が現実に受信した音声信号と、データ音声再生部１０２が読み上げ再生に用いたテキストデータまたはＨＴＭＬデータの音声信号を用いて処理済み音声信号を生成する。具体的には、たとえば、既再生成分除去部１３４は、データ音声再生部１０２が読み上げ再生を行ったテキストデータまたはＨＴＭＬデータの音声信号から推定音声信号を生成し、音声受信部１０３が受信した音声信号から当該推定音声信号を減算することで処理済み音声信号の生成を行う。

【0254】

音声認識部１０４は、既再生成分除去部１３４が生成した処理済み音声信号を取得し、音声による命令の内容を認識する。その他の音声認識部１０４についての説明は実施形態１と同様であるため省略する。

【0255】

保存領域１０７は、データを保存する領域である。また、保存部１０５は、音声認識部１０４によって認識された命令内容がテキストデータ又はＨＴＭＬデータの保存命令である場合に、音声受信部１０３がユーザの音声による命令を受信したときの読み上げ再生対象のコンテンツに対応するテキストデータ又はＨＴＭＬデータである保存対象を保存領域１０７に保存する。保存完了通知部１０６は、保存部１０５により保存領域１０７に保存対象であるテキストデータ又はＨＴＭＬデータが保存されると、音声により保存完了通知を発する。

【0256】

本実施形態においては、保存部１０５は、音声認識部１０４によって認識された命令内容がテキストデータ又はＨＴＭＬデータの保存命令である場合に、音声受信部１０３がユーザの音声による命令を受信したときの読み上げ再生対象のコンテンツに対応するテキストデータ又はＨＴＭＬデータである保存対象が既に保存領域１０７に保存されている場合、保存済み通知部１３６に、保存済み通知を行う旨の命令（以下「保存済み通知命令」ということがある）を行う。具体的には、保存部１０５は、音声認識部１０４から保存命令を受け取ると、保存領域１０７に、保存命令の対象である保存対象が既に保存されているかどうかについて問い合わせを行い、既に保存されている旨の回答を得た場合、保存済み通知部１３６に保存済み通知命令を行う。

【0257】

保存済み通知部１３６は、保存部１０５から保存済み通知命令を受け取ると、音声により保存済み通知を発する。例えば、「この記事は既に保存されています」などと音声により発する。

【0258】

保存部１０５、保存完了通知部１０６、保存領域１０７についてのその他の説明は実施形態１と同様であるため省略する。

【0259】

表示部１０８は、保存領域１０７に保存された保存対象を表示することができる。

【0260】

［データ読み上げ再生処理］
続いて、実施形態９に係るデータ音声再生装置１０におけるデータ読み上げ再生処理について説明する。

【0261】

図２９は、本実施形態におけるデータ音声再生装置１０において実行されるデータ読み上げ再生処理を示すフローチャートである。この処理は、データ音声再生装置１０が起動すると実行される。

【0262】

まず、再生指示入力部１３２が読み上げ再生開始命令をユーザから入力されているかを判断する（ステップＳ８０１）。再生指示入力部１３２が読み上げ再生開始命令をユーザから入力されていないと判断した場合、読み上げ再生開始命令が入力されるまで待機する（ステップＳ８０１；Ｎｏ）。再生指示入力部１３２が読み上げ再生開始命令をユーザから入力されたと判断した場合（ステップＳ８０３；Ｙｅｓ）、ステップＳ８０３に進む。

【0263】

ステップＳ８０３においては、再生指示入力部１３２がデータ取得部１０１にデータ取得命令を送り、かつ、音声受信部１０３に音声受信開始命令を送る。データ取得命令を受け取ったデータ取得部１０１はネットワーク３０を介して、メディアサイトサーバー２０などの外部装置から単一または複数のコンテンツからなるテキストデータまたはＨＴＭＬデータを取得する。また、音声受信開始命令を受け取った音声受信部１０３は、ユーザの音声による命令の受信を開始する。再生指示入力部１３２がデータ取得部１０１にデータ取得命令を送り、かつ、音声受信部１０３に音声受信開始命令を送ると、ステップＳ８０５に進む。

【0264】

ステップＳ８０５においては、データ音声再生部１０２が、データ取得部１０１が取得した単一または複数のコンテンツからなるテキストデータまたはＨＴＭＬデータを取得し、音声信号に変換したうえ、読み上げ再生を開始する。データ音声再生部１０２は、読み上げ再生を行ったテキストデータまたはＨＴＭＬデータを変換して生成した音声信号を適宜、既再生成分除去部１３４に送る。

【0265】

続いて、音声受信部１０３が音声を受信しているかを判断する（ステップＳ８０７）。音声受信部１０３が音声を受信していないと判断した場合（ステップＳ８０７；Ｎｏ）、ステップＳ８０９に進む。ステップＳ８０９においては、データ音声再生部１０２によるテキストデータまたはＨＴＭＬデータの読み上げが終了しているかどうかが判断される。終了していないと判断された場合は、ステップＳ８０７に戻り、再び、音声受信部１０３が音声を受信しているかを判断する。すなわち、本実施形態では、テキストデータまたはＨＴＭＬデータの読み上げが終了するまで、音声の受信を行う（ステップＳ８０７；ＮｏかつステップＳ８０９；Ｎｏ）。また、テキストデータまたはＨＴＭＬデータの読み上げが終了したとき、データ音声再生装置１０におけるデータ音声再生処理は終了する（ステップＳ８０９；Ｙｅｓ）。

【0266】

ステップＳ８０７において、音声受信部１０３が音声を受信していると判断したとき（ステップＳ８０７；Ｙｅｓ）、既再生成分除去部１３４が既再生成分の除去を行う（ステップＳ８１１）。すなわち、既再生成分除去部１３４は、音声受信部１０３が受信した音声信号と、データ音声再生部１０２が読み上げ再生を行ったテキストデータまたはＨＴＭＬデータの音声信号を用いて処理済み音声信号を生成する。

【0267】

既再生成分除去部１３４が既再生成分の除去を行い、処理済み音声信号を生成すると（ステップＳ８１１）、音声認識部１０４が、当該処理済み音声信号の内容を認識する（ステップＳ８１３）。処理済み音声信号が、ユーザの音声による保存命令ではないと認識されると（ステップＳ８１５；Ｎｏ）、ステップＳ８０９に進み、データ音声再生部１０２によるテキストデータまたはＨＴＭＬデータの読み上げが終了しているかどうかが判断されることとなる。

【0268】

ステップＳ８１５において、受信した音声がユーザの音声による保存命令であると認識されると、データ音声再生部１０２による読み上げ再生が一時停止する（ステップＳ８１７）。続いて、ステップＳ８０７において音声受信部１０３がユーザの音声による保存命令を受信したときにデータ音声再生部１０２によって読み上げられていたコンテンツに対応するテキストデータまたはＨＴＭＬデータが保存領域１０７に保存される（ステップＳ８１９）。ステップＳ８１９において行われるデータの保存方法は、実施形態１のステップＳ１１１について説明した内容と同様であるため省略する。

【0269】

ステップＳ８１９においてテキストデータまたはＨＴＭＬデータが保存領域１０７に保存された後、保存完了通知部１０６が音声により保存完了通知を行う（ステップＳ８２１）。例えば、「保存を完了しました。」などと音声により発する。

【0270】

ステップＳ８２３において保存完了通知が行われると、データ音声再生部１０２は一時停止前位置より読み上げ再開を行う（ステップＳ８２３）。そして、ステップＳ１０３に進み、データ音声再生部１０２によるテキストデータまたはＨＴＭＬデータの読み上げが終了しているかどうかが判断される。終了していないと判断された場合は、ステップＳ８０７に戻り、再び、音声受信部１０３が音声を受信しているかを判断する。テキストデータまたはＨＴＭＬデータの読み上げが終了したとき、データ音声再生装置１０におけるデータ音声再生処理は終了する（ステップＳ８０９；Ｙｅｓ）。

【0271】

［読み上げ再生再開の処理］
続いて、本発明の実施形態９に係るデータ音声再生装置１０において、ユーザが保存命令を入力してから読み上げ再生が再開されるまでの処理について説明する。

【0272】

図３０は、本発明の実施形態９に係るデータ音声再生装置１０において読み上げ再生を実行中に、ユーザが保存命令を入力してから読み上げ再生が再開されるまでの処理を示すフローチャートである。また、この説明においては、データ音声再生装置１０は、「おはようございます。今日の天気は全国的に晴れです」と読み上げるものとし、「おはようございます。」の文を第１文、「今日の天気は全国的に晴れです。」との文を第２文という。

【0273】

まずは、データ音声再生部１０２が第１文を読み終わったものとする（ステップＳ５２１）。本実施形態では、例として、データ音声再生部１０２が第１文を読み上げるのと並行して、データ音声再生部１０２は第１文のうち、自らが読み上げた箇所のテキストデータまたはＨＴＭＬデータを変換して生成した音声信号を既再生成分除去部１３４に送るものとする（ステップＳ５２３）。既再生成分除去部１３４は、当該第１文を変換して生成した音声信号を保持する。なお、ここでは、データ音声再生部１０２は、自らが読み上げた箇所のテキストデータまたはＨＴＭＬデータを変換して生成した音声信号を既再生成分除去部１３４に送るものとするが、ステップＳ５２３においてデータ音声再生部１０２が音声信号を既再生成分除去部１３４に送る方法に特に限定はない。

【0274】

データ音声再生部１０２は、第１文のテキストデータまたはＨＴＭＬデータを変換して生成した音声信号を既再生成分除去部１３４に送ると（ステップＳ５２３）、第２文の読み上げを開始し、並行して、読み上げた箇所のテキストデータから生成した音声信号を既再生成分除去部１３４に送るが（ステップＳ５２５）、「きょうのてんきはぜん」と読み上げたところで、ユーザが「クリップ」と言い、音声受信部１０３に保存命令を入力したものとする（ステップＳ５２７）。

【0275】

音声受信部１０３に保存命令が入力されると（ステップＳ５２７）、既再生成分除去部１３４は、音声受信部１０３から、音声受信部１０３が受信した音声信号を受信する（ステップＳ５２９）。そして、既再生成分除去部１３４は、ステップＳ５２７において音声受信部１０３が受信した音声信号と、ステップＳ５２３及びステップＳ５２５において受け取っている、データ音声再生部１０２が読み上げ再生を行ったテキストデータまたはＨＴＭＬデータを変換して生成した音声信号を用いて処理済み音声信号を生成する（ステップＳ５３１）。

【0276】

既再生成分除去部１３４が処理済み音声信号を生成すると（ステップＳ５３１）、音声認識部１０４は、既再生成分除去部１３４が生成した処理済み音声信号を取得し（ステップＳ５３３）、音声による命令の内容を認識する（ステップＳ５３５）。

【0277】

音声認識部１０４は、ユーザの保存命令を認識すると、一時停止命令をデータ音声再生部１０２に送り（ステップＳ５３７）、一時停止命令を受け取ったデータ音声再生部１０２は、読み上げを一時停止する（ステップＳ５３９）。本実施形態においては、データ音声再生部１０２は、読み上げ再生を一時停止する際、テキストデータまたはＨＴＭＬデータのうち、どの位置で読み上げ再生を一時停止したかを記憶するため、「きょうのてんきはぜん」まで読み上げた位置で一時停止したことを記憶する。

【0278】

また、音声認識部１０４は、ユーザの保存命令を認識すると、保存命令を保存部１０５に送る（ステップＳ５４１）。保存命令を受け取った保存部１０５は、音声受信部１０３からユーザの音声による命令を受信した時点（命令受信時刻）の情報を取得し（ステップＳ５４３）、また、当該命令受信時刻にデータ音声再生部１０２が読み上げ再生をしていたコンテンツに対応するテキストデータまたはＨＴＭＬデータの提供を求める信号（データ提供要求信号）をデータ音声再生部１０２に送る（ステップＳ５４５）。

【0279】

続いて、保存部１０５は、データ音声再生部１０２から、命令受信時刻の情報とテキスト時刻対応データに基づいて、命令受信時刻に読み上げ再生をしていたテキストデータまたはＨＴＭＬデータの提供を受け（ステップＳ５４７）、当該データを保存領域１０７に提供し（ステップＳ５４９）、保存させる（ステップＳ５５１）。当該保存が終了すると、保存部１０５は保存完了通知命令を保存完了通知部１０６に提供し（ステップＳ５５３）、これを受け取った保存完了通知部１０６は、保存完了通知を行い（ステップＳ５５５）、また、データ音声再生部１０２に再生再開命令を送る（ステップＳ５５７）。

【0280】

再生再開命令を受け取ったデータ音声再生部１０２は、ステップＳ５３９において記憶していた一時停止した位置よりも前の位置（一時停止前位置）から読み上げ再生の再開を行う（ステップＳ５５９）。本実施形態においては、一時停止した位置は「きょうのてんきはぜん」まで読み上げた位置であるから、例えば、一時停止した位置の直前の文頭から読み上げを再開してもよい。例えば、「今日の天気は全国的に晴れです。」の文頭から読み上げを再開してもよい。また、これに限られるものではなく、例えば、「天気は」から読み上げを再開してもよい。

【0281】

本発明の実施形態９におけるデータ音声再生装置１０を用いると、実施形態１と同様、データ音声再生装置１０がユーザの命令の入力を受け、読み上げを一時停止したのち読み上げを再開する際、読み上げ再生が一時停止されたテキストデータまたはＨＴＭＬデータの位置よりも前の位置（一時停止前位置）から読み上げ再生の再開を行うこととなるから、ユーザが命令を発音している間にデータ音声再生装置１０が読み上げていた文を、再度、データ音声再生装置１０が読み上げることになるため、ユーザが、データ音声再生装置１０が読み上げた文が聞き取れないという事態を減少させることができる。

【0282】

実施形態９と異なり、本発明に係るデータ音声再生機能を実現するコンピュータプログラムをデータ音声再生装置１０が読み込むこと（すなわち、データ音声再生機能を実現するアプリケーションの立ち上げ）に応じて、音声の受信が開始されるよう構成することも考えられる。このように構成すると、データ音声再生装置１０はユーザの音声による命令を確実に受信することができる。

【0283】

もっとも、本発明に係るデータ音声再生装置１０は、再生指示入力部１３２が、ユーザから読み上げ再生開始命令の入力を受け、読み上げ再生を開始した時点以降にユーザの音声による命令が入力されることが想定されている。したがって、読み上げ再生が始まっていないときにデータ音声再生装置１０が音声の受信を行うと、音声入力部１４に入力される音はユーザの音声による命令ではない雑音である蓋然性が高く、この雑音をユーザの命令であるとデータ音声再生装置１０が誤って音声認識をすることによる誤作動を起こす可能性がある。しかし、実施形態９におけるデータ音声再生装置１０は、ユーザから読み上げ再生開始命令の入力を受けると音声の受信を開始するので、雑音を受信する蓋然性が高いとき（すなわち、読み上げ再生が始まっていないとき）に音声の受信を行わない。したがって、実施形態９におけるデータ音声再生装置１０は、雑音をユーザの命令であると誤って音声認識をすることによる誤動作を抑制することができる。

【0284】

さらに、実施形態９におけるデータ音声再生装置１０は、実施形態１と異なり、音声受信部１０３が受信した音声信号と、データ音声再生部１０２が読み上げ再生を行ったテキストデータまたはＨＴＭＬデータの音声信号を用いることで処理済み音声信号を生成し、当該処理済み音声信号について音声認識を行い、ユーザの命令であるかどうかを判断するため、高い精度で音声認識を行うことが可能となり、誤動作などの不具合の発生を抑制することができる。

【0285】

加えて、実施形態９におけるデータ音声再生装置１０は、実施形態１と異なり、ユーザから保存命令の入力を受けた場合、保存対象が既に保存領域に保存されているときは、音声による保存済み通知を発するため、ユーザは当該保存対象が既に保存されていることを認識することができる。

【0286】

＜実施形態１０＞
本発明の実施形態１０に係るデータ音声再生システム１について、図面を参照しながら詳細に説明する。なお、実施形態１及び２並びに実施形態９における説明と重複する説明については適宜省略する。

【0287】

［データ音声再生装置１０のハードウエア構成］
本発明の実施形態１０に係るデータ音声再生システム１は、実施形態９に係るデータ音声再生システムと同様、制御部１１、記憶部１２、通信部１３、音声入力部１４、音声出力部１５、表示部１６、指示入力部１７、既再生成分除去部１８を有する。

【0288】

［データ音声再生装置１０の機能構成］
図３１は、本発明の実施形態１０に係るデータ音声再生装置１０のデータ音声再生機能を示すブロック図である。以下、主に本発明の実施形態９に係るデータ音声再生装置１０のデータ音声再生機能を示すブロック図との違いについて説明する。

【0289】

識別部１２０は、実施形態２と同様、データ取得部１０１が取得したテキストデータまたはＨＴＭＬデータにおいて、一文または文節の単位を識別する。さらに、本実施形態においては、識別部１２０は、識別した一文または文節の単位の情報を、テキストデータまたはＨＴＭＬデータとともに、データ音声再生部１０２に提供する。

【0290】

データ音声再生部１０２は、実施形態９と同様、データ取得部１０１が取得した単一または複数のコンテンツからなるテキストデータまたはＨＴＭＬデータを取得し、当該データを音声信号に変換したうえ、読み上げ再生を行うものであって、データ音声再生部１０２は、音声認識部１０４によって認識された命令内容に応じて、テキストデータまたはＨＴＭＬデータの読み上げ再生を一時停止し、当該命令内容が実行された後、テキストデータまたはＨＴＭＬデータの読み上げ再生を再開するものとする。

【0291】

もっとも、実施形態９とは異なり、データ音声再生部１０２が読み上げ再生の再開を行う位置は、音声受信部１０３が受信したユーザの音声による命令が発話された時点に対応するテキストデータまたはＨＴＭＬデータと同じ位置もしくはそれよりも前の位置（発話前位置）として特定される。

【0292】

【0293】

本実施形態においては、特に、音声受信部１０３が受信したユーザの音声による命令が発話された時点に対応するテキストデータまたはＨＴＭＬデータと同じ位置よりも前に位置する一文又は文節の先頭（区切り位置）から、データ音声再生部１０２による読み上げ再生の再開が行われるものとする。当該区切り位置は、識別部１２０によって提供された一文または文節の単位の情報による。

【0294】

データ音声再生部１０２に関するその他の説明並びにデータ取得部１０１、音声受信部１０３、音声認識部１０４、保存部１０５、保存領域１０７、保存完了通知部１０６、表示部１０８、既再生成分除去部１３４及び保存済み通知部１３６についての説明は実施形態９においてした説明と共通なので省略する。

【0295】

［データ読み上げ再生処理］
続いて、実施形態１０に係るデータ音声再生装置１０におけるデータ読み上げ再生処理について説明する。

【0296】

図３２は、本実施形態におけるデータ音声再生装置１０において実行されるデータ読み上げ再生処理を示すフローチャートである。この処理は、データ音声再生装置１０が起動すると実行される。

【0297】

ステップＳ８０１からステップＳ８２１までの処理は、実施形態９における説明と共通である。ステップＳ８２１において保存完了通知部１０６が音声により保存完了通知を行うと、ステップＳ８２３Ｂに進み、データ音声再生部１０２は区切り位置から読み上げを再開する。そして、ステップＳ８０９に進み、データ音声再生部１０２によるテキストデータまたはＨＴＭＬデータの読み上げが終了しているかどうかが判断される。終了していないと判断された場合は、ステップＳ８０７に戻り、再び、音声受信部１０３が音声を受信しているかを判断する。テキストデータまたはＨＴＭＬデータの読み上げが終了したとき、データ音声再生装置１０におけるデータ音声再生処理は終了する（ステップＳ８０９；Ｙｅｓ）。

【0298】

［読み上げ再生再開の処理］
続いて、本発明の実施形態１０に係るデータ音声再生装置１０において、ユーザが保存命令を入力してから読み上げ再生が再開されるまでの処理について説明する。

【0299】

図３３は、本発明の実施形態１０に係るデータ音声再生装置１０において読み上げ再生を実行中に、ユーザが保存命令を入力してから読み上げ再生が再開されるまでの処理を示すフローチャートである。この説明においては、データ音声再生装置１０は、「おはようございます。今日の天気は全国的に晴れです」と読み上げるものとし、「おはようございます。」の文を第１文、「今日の天気は全国的に晴れです。」との文を第２文という。

【0300】

ステップＳ５２１からステップＳ５４３までの処理は、実施形態９と共通であるから省略する。

【0301】

ステップＳ５４３の後、データ音声再生部１０２は、音声受信部１０３から命令受信時刻の情報を取得する（ステップＳ５４３−２）。

【0302】

その後、ステップＳ５４５に進む。ステップＳ５４５からステップＳ５５７は、実施形態１における説明と共通であるから省略する。

【0303】

ステップＳ５５７において再生再開命令を受け取ったデータ音声再生部１０２は、ステップＳ５４３−２において受け取っている命令受信時刻の情報と、自身が記憶しているテキスト時刻対応データの情報に基づいて、区切り位置を特定し、読み上げ再生を再開する（ステップＳ５５９Ｂ）。

【0304】

本発明の実施形態１０におけるデータ音声再生装置１０を用いると、実施形態９と同様、データ音声再生装置１０がユーザの命令の入力を受け、読み上げを一時停止したのち読み上げを再開する際、読み上げ再生が一時停止されたテキストデータまたはＨＴＭＬデータの位置よりも前の位置（一時停止前位置）から読み上げ再生の再開を行うこととなるから、ユーザが命令を発音している間にデータ音声再生装置１０が読み上げていた文を、再度、データ音声再生装置１０が読み上げることになるため、ユーザが、データ音声再生装置１０が読み上げた文が聞き取れないという事態を減少させることができる。

【0305】

また、本発明の実施形態１０におけるデータ音声再生装置１０を用いると、実施形態２と同様、音声受信部１０３が受信したユーザの音声による命令が発話された時点に対応するテキストデータまたはＨＴＭＬデータと同じ位置よりも前に位置する一文又は文節の先頭（区切り位置）から、データ音声再生部１０２による読み上げ再生の再開が行われる。区切り位置から読み上げ再生が再開されると、そうでない場合と比べて、ユーザはデータ音声再生装置１０の読み上げ内容をより理解しやすくなる。特に、一文の先頭からデータ音声再生部１０２による読み上げ再生の再開が行われる場合、そうでない場合と比べ、ユーザはデータ音声再生装置１０の読み上げ内容をより理解することができる。

【0306】

また、実施形態１０におけるデータ音声再生装置１０は、実施形態２と異なり、ユーザから再生開始命令の入力を受け付けることで音声の受信を開始する。したがって、実施形態９におけるデータ音声再生装置１０は、読み上げ再生を行っていないときにユーザの声ではない雑音を受信しユーザの命令であると誤って音声認識をすることによる誤動作などの不具合の発生を抑制することができる。また、実施形態９におけるデータ音声再生装置１０と同様、コンピュータプログラムの読み込みの段階で音声の受信を開始するデータ音声再生装置１０と比べて本実施形態におけるデータ音声再生装置１０の方が誤った音声認識をすることなどによる誤動作などの不具合の発生を抑制する効果は大きい。

【0307】

さらに、実施形態１０におけるデータ音声再生装置１０は、実施形態２と異なり、音声受信部１０３が受信した音声信号と、からデータ音声再生部１０２が読み上げ再生を行ったテキストデータまたはＨＴＭＬデータの音声信号を用いることで処理済み音声信号を生成し、当該処理済み音声信号について音声認識を行い、ユーザの命令であるかどうかを判断するため、高い精度で音声認識を行うことが可能となり、誤動作などの不具合の発生を抑制することができる。

【0308】

加えて、実施形態１０におけるデータ音声再生装置１０は、実施形態２と異なり、ユーザから保存命令の入力を受けた場合、保存対象が既に保存領域に保存されているときは、音声による保存済み通知を発するため、ユーザは当該保存対象が既に保存されていることを認識することができる。

【0309】

＜実施形態１１＞
本発明の実施形態１１に係るデータ音声再生システム１について、図面を参照しながら詳細に説明する。なお、実施形態１及び３並びに実施形態９から１０における説明と重複する説明については適宜省略する。

【0310】

［データ音声再生装置１０の機能構成］
図３４は、本発明の実施形態１１に係るデータ音声再生装置１０のデータ音声再生機能を示すブロック図である。以下、主に本発明の実施形態９に係るデータ音声再生装置１０のデータ音声再生機能を示すブロック図との違いについて説明する。

【0311】

再生指示入力部１３２、音声受信部１０３、データ取得部１０１、既再生成分除去部１３４についての説明は実施形態９と同様であるため省略する。

【0312】

データ音声再生部１０２は、実施形態９と同様、データ取得部１０１が取得した単一または複数のコンテンツからなるテキストデータまたはＨＴＭＬデータを取得し、当該データを音声信号に変換したうえ、読み上げ再生を行う。また、読み上げ再生が一時停止されたテキストデータまたはＨＴＭＬデータの位置よりも前の位置（一時停止前位置）から読み上げ再生の再開を行うものとする。

【0313】

【0314】

音声認識部１０４は、実施形態９と同様、既再生成分除去部１３４が生成した処理済み音声信号を取得し、音声による命令の内容を認識する。本実施形態においては、音声認識部１０４は、ユーザの音量調整命令を認識すると、音量調整命令を音量調整部１２２に送り、データ音声再生部１０２の読み上げ再生の音量を変化させる。また、音声認識部１０４は、ユーザの音量調整命令を認識すると、一時停止命令をデータ音声再生部１０２に送り、読み上げ再生を一時停止させる。

【0315】

【0316】

【0317】

［データ読み上げ再生処理］
続いて、実施形態１１のデータ音声再生装置１０におけるデータ読み上げ再生処理について説明する。

【0318】

図３５は、本実施形態におけるデータ音声再生装置１０において実行されるデータ読み上げ再生処理を示すフローチャートである。この処理は、データ音声再生装置１０が起動すると実行される。

【0319】

ステップＳ９０１からステップＳ９１３までの説明は、実施形態９についてのステップＳ８０１からステップＳ８１３までと共通するので適宜省略する。

【0320】

既再生成分除去部１３４が既再生成分の除去を行い、処理済み音声信号を生成すると（ステップＳ９１１）、音声認識部１０４が、当該処理済み音声信号の内容を認識する（ステップＳ９１３）。処理済み音声信号が、ユーザの音声による音量調整命令でないと認識されると（ステップＳ９１５；Ｎｏ）、ステップＳ９０９に進み、データ音声再生部１０２によるテキストデータまたはＨＴＭＬデータの読み上げが終了しているかどうかが判断されることとなる。

【0321】

ステップＳ９１５において、受信した音声がユーザの音声による音量調整命令であると認識されると、データ音声再生部１０２による読み上げ再生が一時停止する（ステップＳ９１７）。続いて、音量調整命令にしたがって、読み上げ再生の音量データが変更される（ステップＳ９１９）。

【0322】

ステップＳ９１９において読み上げ再生の音量データが変更されると、データ音声再生部１０２は一時停止前位置より読み上げ再生を行う（ステップＳ９２１）。そして、ステップＳ９０９に進み、データ音声再生部１０２によるテキストデータまたはＨＴＭＬデータの読み上げが終了しているかどうかが判断される。終了していないと判断された場合は、ステップＳ９０７に戻り、再び、音声受信部１０３が音声を受信しているかを判断する。テキストデータまたはＨＴＭＬデータの読み上げが終了したとき、データ音声再生装置１０におけるデータ音声再生処理は終了する（ステップＳ９０９；Ｙｅｓ）。

【0323】

［読み上げ再生再開の処理］
続いて、本発明の実施形態１１に係るデータ音声再生装置１０において、ユーザが音量調整命令を入力してから読み上げ再生が再開されるまでの処理について説明する。

【0324】

図３６は、本発明の実施形態１１に係るデータ音声再生装置１０において読み上げ再生を実行中に、ユーザが音量調整命令を入力してから読み上げ再生が再開されるまでの処理を示すフローチャートである。また、この説明においては、データ音声再生装置１０は、「おはようございます。今日の天気は全国的に晴れです」と読み上げるものとし、「おはようございます。」の文を第１文、「今日の天気は全国的に晴れです。」との文を第２文という。

【0325】

まずは、データ音声再生装置１０が、第１文を読み終わったものとする（ステップＳ６２１）。本実施形態では、実施形態９と同様、例として、データ音声再生部１０２が第１文を読み上げるのと並行して、データ音声再生部１０２は第１文のうち、自らが読み上げた箇所のテキストデータまたはＨＴＭＬデータを変換して生成した音声信号を既再生成分除去部１３４に送るものとする（ステップＳ６２３）。既再生成分除去部１３４は、受け取った第１文の音声信号を保持する。

【0326】

データ音声再生部１０２は、第１文のテキストデータまたはＨＴＭＬデータを変換して生成した音声信号を既再生成分除去部１３４に送ると（ステップＳ６２３）、第２文の読み上げを開始し、並行して、読み上げた箇所のテキストデータから生成した音声信号を既再生成分除去部１３４に送るが（ステップＳ６２５）、「きょうのてんきはぜん」と読み上げたところで、ユーザが「音量あげて」と言い、音声受信部１０３に音量調整命令を入力したものとする（ステップＳ６２７）。

【0327】

音声受信部１０３に音量調整命令が入力されると（ステップＳ６２７）、既再生成分除去部１３４は、音声受信部１０３から、音声受信部１０３が受信した音声信号を受信する（ステップＳ６２９）。そして、既再生成分除去部１３４は、ステップＳ６２７において音声受信部１０３が受信した音声信号と、ステップＳ６２３及びステップＳ６２５において受け取っている、データ音声再生部１０２が読み上げ再生を行ったテキストデータまたはＨＴＭＬデータを変換して生成した音声信号を用いて処理済み音声信号を生成する（ステップＳ６３１）。

【0328】

既再生成分除去部１３４が処理済み音声信号を生成すると（ステップＳ６３１）、音声認識部１０４は、既再生成分除去部１３４が生成した処理済み音声信号を取得し（ステップＳ６３３）、音声による命令の内容を認識する（ステップＳ６３５）。

【0329】

音声認識部１０４は、ユーザの音量調整命令を認識すると、一時停止命令をデータ音声再生部１０２に送り（ステップＳ６３７）、一時停止命令を受け取ったデータ音声再生部１０２は、読み上げを一時停止する（ステップＳ６３９）。本実施形態においては、データ音声再生部１０２は、読み上げ再生を一時停止する際、テキストデータまたはＨＴＭＬデータのうち、どの位置で読み上げ再生を一時停止したかを記憶するため、「きょうのてんきはぜん」まで読み上げた位置で一時停止したことを記憶する。

【0330】

また、音声認識部１０４は、ユーザの音量調整命令を認識すると、音量調整命令を音量調整部１２２に送る（ステップＳ６４１）。音量調整命令を受け取った音量調整部１２２は、当該音量調整命令にしたがって、音量調整命令をデータ音声再生部１０２に送る（ステップＳ６４３）。

【0331】

音量調整命令を受け取ったデータ音声再生部１０２は、当該音量調整命令にしたがって音量データを調整したうえ、ステップＳ６３９において記憶していた一時停止した位置よりも前の位置（一時停止前位置）から読み上げ再生の再開を行う（ステップＳ６４５）。本実施形態においては、一時停止した位置は「きょうのてんきはぜん」まで読み上げた位置であるから、例えば、一時停止した位置の直前の文頭から読み上げを再開してもよい。例えば、「今日の天気は全国的に晴れです。」の文頭から読み上げを再開してもよい。

【0332】

本発明の実施形態１１におけるデータ音声再生装置１０を用いると、実施形態１と同様、データ音声再生装置１０がユーザの命令の入力を受け、読み上げを一時停止したのち読み上げを再開する際、読み上げ再生が一時停止されたテキストデータまたはＨＴＭＬデータの位置よりも前の位置（一時停止前位置）から読み上げ再生の再開を行うこととなるから、ユーザが命令を発音している間にデータ音声再生装置１０が読み上げていた文を、再度、データ音声再生装置１０が読み上げることになるため、ユーザが、データ音声再生装置１０が読み上げた文が聞き取れないという事態を減少させることができる。

【0333】

また、実施形態１１におけるデータ音声再生装置１０は、実施形態３と異なり、ユーザから再生開始命令の入力を受け付けることで音声の受信を開始する。したがって、実施形態１１におけるデータ音声再生装置１０は、読み上げ再生を行っていないときにユーザの声ではない雑音を受信しユーザの命令であると誤って音声認識をすることによる誤動作などの不具合の発生を抑制することができる。また、実施形態９におけるデータ音声再生装置１０と同様、コンピュータプログラムの読み込みの段階で音声の受信を開始するデータ音声再生装置１０と比べて本実施形態におけるデータ音声再生装置１０の方が誤った音声認識をすることなどによる誤動作などの不具合の発生を抑制する効果は大きい。

【0334】

さらに、実施形態１１におけるデータ音声再生装置１０は、実施形態３と異なり、音声受信部１０３が受信した音声信号からデータ音声再生部１０２が読み上げ再生を行ったテキストデータまたはＨＴＭＬデータの音声信号を用いることで処理済み音声信号を生成し、当該処理済み音声信号について音声認識を行い、ユーザの命令であるかどうかを判断するため、高い精度で音声認識を行うことが可能となり、誤動作などの不具合の発生を抑制することができる。

【0335】

＜実施形態１２＞
本発明の実施形態１２に係るデータ音声再生システム１について、図面を参照しながら詳細に説明する。なお、実施形態１及び４並びに実施形態９から１１における説明と重複する説明については適宜省略する。

【0336】

［データ音声再生装置１０の機能構成］
図３７は、本発明の実施形態１２に係るデータ音声再生装置１０のデータ音声再生機能を示すブロック図である。以下、主に本発明の実施形態９に係るデータ音声再生装置１０のデータ音声再生機能を示すブロック図との違いについて説明する。

【0337】

【0338】

【0339】

音声認識部１０４は、実施形態９と同様、既再生成分除去部１３４が生成した処理済み音声信号を取得し、音声による命令の内容を認識する。本実施形態においては、音声認識部１０４は、ユーザの検索命令を認識すると、当該検索命令が含む検索語に関連する情報を検索する旨の検索命令を検索部１２４に送り、検索語に関連する情報を収集させる。

【0340】

ここで、ユーザの「検索命令」とは、データ音声再生装置１０に対するユーザの、検索命令が含む検索語に関連する情報を検索する旨の命令である。例えば、ユーザがデータ音声再生装置１０に対し「今日のＡ社の株価は？」と入力し、既再生成分除去部１３４が「今日のＡ社の株価は？」という処理済み音声信号を生成すると、今日のＡ社の株価という検索語に関連する情報を検索する旨の検索命令であると音声認識部１０４に認識されてもよい。

【0341】

【0342】

情報通知部１２６は、検索部１２４によって収集された、検索語に関連する情報を音声により通知する。

【0343】

【0344】

［データ読み上げ再生処理］
続いて、実施形態１２のデータ音声再生装置１０におけるデータ読み上げ再生処理について説明する。

【0345】

図３８は、本実施形態におけるデータ音声再生装置１０において実行されるデータ読み上げ再生処理を示すフローチャートである。この処理は、データ音声再生装置１０が起動すると実行される。

【0346】

ステップＳ１００１からステップＳ１０１３についての説明は、実施形態９についてのステップＳ８０１からステップＳ８１３までと共通するので適宜省略する。

【0347】

既再生成分除去部１３４が既再生成分の除去を行い、処理済み音声信号を生成すると（ステップＳ１０１１）、音声認識部１０４が、当該処理済み音声信号の内容を認識する（ステップＳ１０１３）。処理済み音声信号が、ユーザの音声による検索命令でないと認識されると（ステップＳ１０１５；Ｎｏ）、ステップＳ１００９に進み、データ音声再生部１０２によるテキストデータまたはＨＴＭＬデータの読み上げが終了しているかどうかが判断されることとなる。

【0348】

ステップＳ１０１５において、受信した音声がユーザの音声による検索命令であると認識されると（ステップＳ１０１５；Ｙｅｓ）、データ音声再生部１０２による読み上げ再生が一時停止する（ステップＳ１０１７）。続いて、検索命令にしたがって、検索語に関連する情報が収集され（ステップＳ１０１９）、当該情報が音声により通知される（ステップＳ１０２１）。

【0349】

ステップＳ１０１９において検索語に関連する情報の音声による通知が行われると、データ音声再生部１０２は一時停止前位置より読み上げ再生を行う（ステップＳ１０２３）。そして、ステップＳ１００９に進み、データ音声再生部１０２によるテキストデータまたはＨＴＭＬデータの読み上げが終了しているかどうかが判断される。終了していないと判断された場合は、ステップＳ１００７に戻り、再び、音声受信部１０３が音声を受信しているかを判断する。テキストデータまたはＨＴＭＬデータの読み上げが終了したとき、データ音声再生装置１０におけるデータ音声再生処理は終了する（ステップＳ１００９；Ｙｅｓ）。

【0350】

［読み上げ再生再開の処理］
続いて、本発明の実施形態１２に係るデータ音声再生装置１０において、ユーザが検索命令を入力してから読み上げ再生が再開されるまでの処理について説明する。

【0351】

図３９は、本発明の実施形態１２に係るデータ音声再生装置１０において読み上げ再生を実行中に、ユーザが検索命令を入力してから読み上げ再生が再開されるまでの処理を示すフローチャートである。また、この説明においては、データ音声再生装置１０は、「おはようございます。今日の天気は全国的に晴れです」と読み上げるものとし、「おはようございます。」の文を第１文、「今日の天気は全国的に晴れです。」との文を第２文という。

【0352】

まずは、データ音声再生装置１０が、第１文を読み終わったものとする（ステップＳ７２１）。本実施形態では、実施形態９と同様、例として、データ音声再生部１０２が第１文を読み上げるのと並行して、データ音声再生部１０２は第１文のうち、自らが読み上げた箇所のテキストデータまたはＨＴＭＬデータを変換して生成した音声信号を既再生成分除去部１３４に送るものとする（ステップＳ７２３）。既再生成分除去部１３４は、当該第１文を変換して生成した音声信号を保持する。

【0353】

データ音声再生部１０２は、第１文のテキストデータまたはＨＴＭＬデータを変換して生成した音声信号を既再生成分除去部１３４に送ると（ステップＳ７２３）、第２文の読み上げを開始し、並行して、読み上げた箇所のテキストデータから生成した音声信号を既再生成分除去部１３４に送るが（ステップＳ７２５）、「きょうのてんきはぜん」と読み上げたところで、ユーザが「今日のＡ社の株価を教えて」と言い、音声受信部１０３に検索命令を入力したものとする（ステップＳ７２７）。

【0354】

音声受信部１０３に検索命令が入力されると（ステップＳ７２７）、既再生成分除去部１３４は、音声受信部１０３から、音声受信部１０３が受信した音声信号を受信する（ステップＳ７２９）。そして、既再生成分除去部１３４は、ステップＳ７２７において音声受信部１０３が受信した音声信号と、ステップＳ７２３及びステップＳ７２５において受け取っている、データ音声再生部１０２が読み上げ再生を行ったテキストデータまたはＨＴＭＬデータを変換して生成した音声信号を用いて処理済み音声信号を生成する（ステップＳ７３１）。

【0355】

既再生成分除去部１３４が処理済み音声信号を生成すると（ステップＳ７３１）、音声認識部１０４は、既再生成分除去部１３４が生成した処理済み音声信号を取得し（ステップＳ７３３）、音声による命令の内容を認識する（ステップＳ７３５）。

【0356】

音声認識部１０４は、ユーザの検索命令を認識すると、一時停止命令をデータ音声再生部１０２に送り（ステップＳ７３７）、一時停止命令を受け取ったデータ音声再生部１０２は、読み上げを一時停止する（ステップＳ７３９）。本実施形態においては、データ音声再生部１０２は、読み上げ再生を一時停止する際、テキストデータまたはＨＴＭＬデータのうち、どの位置で読み上げ再生を一時停止したかを記憶するため、「きょうのてんきはぜん」まで読み上げた位置で一時停止したことを記憶する。

【0357】

また、音声認識部１０４は、ユーザの検索命令を認識すると、当該検索命令が含む検索語に関連する情報を検索する旨の検索命令を検索部１２４に送り（ステップＳ７４１）、検索命令を受け取った検索部１２４は、当該検索命令に基づいて情報を収集し（ステップＳ７４３）、情報通知部１２６に提供する（ステップＳ７４５）。

【0358】

ステップＳ７４５の後、情報通知部１２６は、検索部１２４によって収集された、検索語に関連する情報を音声により通知する（ステップＳ７４７）。そして、情報通知部１２６は、再生再開命令をデータ音声再生部１０２に送る（ステップＳ７４９）。

【0359】

情報通知部１２６から再生再開命令を受け取ったデータ音声再生部１０２は、ステップＳ７３９において記憶していた一時停止した位置よりも前の位置（一時停止前位置）から読み上げ再生の再開を行う（ステップＳ７５１）。本実施形態においては、一時停止した位置は「きょうのてんきはぜん」まで読み上げた位置であるから、例えば、一時停止した位置の直前の文頭から読み上げを再開してもよい。例えば、「今日の天気は全国的に晴れです。」の文頭から読み上げを再開してもよい。

【0360】

本発明の実施形態１２におけるデータ音声再生装置１０を用いると、実施形態１と同様、データ音声再生装置１０がユーザの命令の入力を受け、読み上げを一時停止したのち読み上げを再開する際、読み上げ再生が一時停止されたテキストデータまたはＨＴＭＬデータの位置よりも前の位置（一時停止前位置）から読み上げ再生の再開を行うこととなるから、ユーザが命令を発音している間にデータ音声再生装置１０が読み上げていた文を、再度、データ音声再生装置１０が読み上げることになるため、ユーザが、データ音声再生装置１０が読み上げた文が聞き取れないという事態を減少させることができる。

【0361】

また、実施形態１２におけるデータ音声再生装置１０は、実施形態４と異なり、ユーザから再生開始命令の入力を受け付けることで音声の受信を開始する。したがって、実施形態１１におけるデータ音声再生装置１０は、読み上げ再生を行っていないときにユーザの声ではない雑音を受信しユーザの命令であると誤って音声認識をすることによる誤動作などの不具合の発生を抑制することができる。また、実施形態９におけるデータ音声再生装置１０と同様、コンピュータプログラムの読み込みの段階で音声の受信を開始するデータ音声再生装置１０と比べて本実施形態におけるデータ音声再生装置１０の方が誤った音声認識をすることなどによる誤動作などの不具合の発生を抑制する効果は大きい。

【0362】

さらに、実施形態１２におけるデータ音声再生装置１０は、実施形態４と異なり、音声受信部１０３が受信した音声信号と、データ音声再生部１０２が読み上げ再生を行ったテキストデータまたはＨＴＭＬデータの音声信号を用いることで処理済み音声信号を生成し、当該処理済み音声信号について音声認識を行い、ユーザの命令であるかどうかを判断するため、高い精度で音声認識を行うことが可能となり、誤動作などの不具合の発生を抑制することができる。

【0363】

＜実施形態１３＞
本発明の実施形態１３に係るデータ音声再生システム１について、図面を参照しながら詳細に説明する。なお、実施形態１及び５並びに実施形態９から１２における説明と重複する説明については適宜省略する。

【0364】

［データ音声再生装置１０の機能構成］
図４０は、本発明の実施形態１３に係るデータ音声再生装置１０のデータ音声再生機能を示すブロック図である。以下、主に本発明の実施形態５に係るデータ音声再生装置１０のデータ音声再生機能を示すブロック図との違いについて説明する。

【0365】

【0366】

【0367】

音声認識部１０４は、実施形態９と同様、既再生成分除去部１３４が生成した処理済み音声信号を取得し、音声による命令の内容を認識する。本実施形態においては、音声認識部１０４は、ユーザの音声による一時停止命令を認識すると、一時停止命令をデータ音声再生部１０２に送り、読み上げ再生を一時停止させる。また、音声認識部１０４は、ユーザの音声による再生再開命令を認識すると、再生再開命令をデータ音声再生部１０２に送り、読み上げ再生を再開させる。

【0368】

ここで、ユーザの音声による「一時停止命令」とは、データ音声再生装置１０に対するユーザの、読み上げ再生を一時停止する旨の命令であり、ユーザの音声による「再生再開命令」とは、読み上げ再生を一時停止した状態にあるデータ音声再生装置１０に対するユーザの、読み上げ再生を再開する旨の命令である。

【0369】

データ音声再生部１０２は、実施形態９と同様、データ取得部１０１が取得した単一または複数のコンテンツからなるテキストデータまたはＨＴＭＬデータを取得し、当該データを音声信号に変換したうえ、読み上げ再生を行う。データ音声再生部１０２が行う読み上げ再生は、一時停止すること及び再開することができる。また、本実施形態においては、実施形態９と同様、読み上げ再生が一時停止されたテキストデータまたはＨＴＭＬデータの位置よりも前の位置（一時停止前位置）から読み上げ再生の再開を行うものとする。

【0370】

【0371】

［データ読み上げ再生処理］
続いて、実施形態１３のデータ音声再生装置１０におけるデータ読み上げ再生処理について説明する。

【0372】

図４１は、本実施形態におけるデータ音声再生装置１０において実行されるデータ読み上げ再生処理を示すフローチャートである。この処理は、データ音声再生装置１０が起動すると実行される。

【0373】

ステップＳ１１０１からステップＳ１１１３についての説明は、実施形態９についてのステップＳ８０１からステップＳ８１３までと共通するので適宜省略する。

【0374】

既再生成分除去部１３４が既再生成分の除去を行い、処理済み音声信号を生成すると（ステップＳ１１１１）、音声認識部１０４が、当該処理済み音声信号の内容を認識する（ステップＳ１１１３）。処理済み音声信号が、ユーザの音声による一時停止命令でないと認識されると（ステップＳ１１１５；Ｎｏ）、ステップＳ１１０９に進み、データ音声再生部１０２によるテキストデータまたはＨＴＭＬデータの読み上げが終了しているかどうかが判断されることとなる。

【0375】

ステップＳ１１１５において、受信した音声がユーザの音声による検索命令であると認識されると（ステップＳ１１１５；Ｙｅｓ）、データ音声再生部１０２による読み上げ再生が一時停止し（ステップＳ１１１７）、ステップＳ１１１９に進み音声受信部１０３が音声を受信していると判断するまで待機する（ステップＳ１１１９；Ｎｏ）。

【0376】

ステップＳ１１１９において、音声受信部が音声を受信していると判断したとき（ステップＳ１１２１；Ｙｅｓ）、既再生成分除去部１３４が既再生成分の除去を行い、ステップＳ１１２１で受信した音声に対応する処理済み音声信号を生成する（ステップＳ１１２１）。既再生成分除去部１３４がステップＳ１１２１で受信した音声に対応する処理済み音声信号を生成すると、音声認識部１０４がこの処理済み音声信号の内容を認識する（ステップＳ１１２５）。ステップＳ１１２５において音声認識部１０４がこの処理済み音声信号は再生再開命令ではないと認識すると（ステップＳ１１２５；Ｎｏ）、ステップＳ１１１９に戻り、音声受信部１０３が音声を受信していると判断するまで待機する。

【0377】

ステップＳ１１２５において、処理済み音声信号が再生再開命令であると認識されると（ステップＳ１１２５；Ｙｅｓ）、ステップＳ１１２７に進み、一時停止前位置から読み上げを再開する。そして、ステップＳ１１０９に進み、データ音声再生部１０２によるテキストデータまたはＨＴＭＬデータの読み上げが終了しているかどうかが判断される。終了していないと判断された場合は（ステップＳ１１０９；Ｎｏ）、ステップＳ１１０７に戻り、再び、音声受信部１０３が音声を受信しているかを判断する。テキストデータまたはＨＴＭＬデータの読み上げが終了したとき、データ音声再生装置１０におけるデータ音声再生処理は終了する（ステップＳ１１０９；Ｙｅｓ）。

【0378】

［読み上げ再生再開の処理］
続いて、本発明の実施形態１３に係るデータ音声再生装置１０において、ユーザが一時停止命令を入力してから読み上げ再生が再開されるまでの処理について説明する。

【0379】

図４２は、本発明の実施形態１３に係るデータ音声再生装置１０において読み上げ再生を実行中に、ユーザが一時停止命令を入力してから読み上げ再生が再開されるまでの処理を示すフローチャートである。また、この説明においては、データ音声再生装置１０は、「おはようございます。今日の天気は全国的に晴れです」と読み上げるものとし、「おはようございます。」の文を第１文、「今日の天気は全国的に晴れです。」との文を第２文という。

【0380】

まずは、データ音声再生装置１０が、第１文を読み終わったものとする（ステップＳ８２１）。本実施形態では、実施形態９と同様、データ音声再生部１０２が第１文を読み上げるのと並行して、データ音声再生部１０２は第１文のうち、自らが読み上げた箇所のテキストデータまたはＨＴＭＬデータを変換して生成した音声信号を既再生成分除去部１３４に送るものとする（ステップＳ８２３）。既再生成分除去部１３４は、当該第１文を変換して生成した音声信号を保持する。

【0381】

データ音声再生部１０２は、第１文のテキストデータまたはＨＴＭＬデータを変換して生成した音声信号を既再生成分除去部１３４に送ると（ステップＳ８２３）、第２文の読み上げを開始し、並行して、読み上げた箇所のテキストデータから生成した音声信号を既再生成分除去部１３４に送るが（ステップＳ８２５）、「きょうのてんきはぜん」と読み上げたところで、ユーザが「一時停止して」と言い、音声受信部１０３に一時停止命令を入力したものとする（ステップＳ８２７）。

【0382】

音声受信部１０３に一時停止命令が入力されると、既再生成分除去部１３４は、音声受信部１０３から、音声受信部１０３が受信した音声信号を受信する（ステップＳ８２９）。そして、既再生成分除去部１３４は、ステップＳ８２７において音声受信部１０３が受信した音声信号と、ステップＳ８２３及びステップＳ８２５において受け取っている、データ音声再生部１０２が読み上げ再生を行ったテキストデータまたはＨＴＭＬデータを変換して生成した音声信号を用いて処理済み音声信号を生成する（ステップＳ８３１）。

【0383】

既再生成分除去部１３４が処理済み音声信号を生成すると（ステップＳ８３１）、音声認識部１０４は、既再生成分除去部１３４が生成した処理済み音声信号を取得し（ステップＳ８３３）、音声による命令の内容を認識する（ステップＳ８３５）。

【0384】

音声認識部１０４は、ユーザの一時停止命令を認識すると、一時停止命令をデータ音声再生部１０２に送り（ステップＳ８３７）、一時停止命令を受け取ったデータ音声再生部１０２は、読み上げを一時停止する（ステップＳ８３９）。本実施形態においては、データ音声再生部１０２は、読み上げ再生を一時停止する際、テキストデータまたはＨＴＭＬデータのうち、どの位置で読み上げ再生を一時停止したかを記憶するため、「きょうのてんきはぜん」まで読み上げた位置で一時停止したことを記憶する。

【0385】

その後、ユーザが「再生再開して」と言い、音声受信部１０３に再生再開命令を入力すると（ステップＳ８４１）、既再生成分除去部１３４は、音声受信部１０３から、ステップＳ８４１において音声受信部１０３が受信した音声信号を受信する（ステップＳ８４３）。そして、既再生成分除去部１３４は、ステップＳ８４１において音声受信部１０３が受信した音声信号と、ステップＳ８２３及びステップＳ８２５において受け取ったデータ音声再生部１０２が読み上げ再生を行ったテキストデータまたはＨＴＭＬデータの音声信号を用いて、ステップＳ８４１において音声受信部１０３が受信した音声信号に対応する処理済み音声信号を生成する（ステップＳ８４５）。

【0386】

ステップＳ８４５において既再生成分除去部１３４がステップＳ８４１において音声受信部１０３が受信した音声信号に対応する処理済み音声信号を生成すると、音声認識部１０４は、既再生成分除去部１３４がステップＳ８４５において生成した処理済み音声信号を取得し（ステップＳ８４７）、音声による命令の内容を認識する（ステップＳ８４９）。

【0387】

ステップＳ８４９において音声認識部１０４がユーザの再生再開命令を認識すると、音声認識部１０４は再生再開命令をデータ音声再生部１０２に送り（ステップＳ８５１）、再生再開命令を受け取ったデータ音声再生部１０２は、ステップＳ８３９において記憶していた一時停止した位置よりも前の位置（一時停止前位置）から読み上げ再生の再開を行う（ステップＳ８５３）。本実施形態においては、一時停止した位置は「きょうのてんきはぜん」まで読み上げた位置であるから、例えば、一時停止した位置の直前の文頭から読み上げを再開してもよい。

【0388】

本発明の実施形態１３におけるデータ音声再生装置１０を用いると、実施形態１と同様、データ音声再生装置１０がユーザの命令の入力を受け、読み上げを一時停止したのち読み上げを再開する際、読み上げ再生が一時停止されたテキストデータまたはＨＴＭＬデータの位置よりも前の位置（一時停止前位置）から読み上げ再生の再開を行うこととなるから、ユーザが命令を発音している間にデータ音声再生装置１０が読み上げていた文を、再度、データ音声再生装置１０が読み上げることになるため、ユーザが、データ音声再生装置１０が読み上げた文が聞き取れないという事態を減少させることができる。

【0389】

また、実施形態１３におけるデータ音声再生装置１０は、実施形態５と異なり、ユーザから再生開始命令の入力を受け付けることで音声の受信を開始する。したがって、実施形態１１におけるデータ音声再生装置１０は、読み上げ再生を行っていないときにユーザの声ではない雑音を受信しユーザの命令であると誤って音声認識をすることによる誤動作などの不具合の発生を抑制することができる。また、実施形態９におけるデータ音声再生装置１０と同様、コンピュータプログラムの読み込みの段階で音声の受信を開始するデータ音声再生装置１０と比べて本実施形態におけるデータ音声再生装置１０の方が誤った音声認識をすることなどによる誤動作などの不具合の発生を抑制する効果は大きい。

【0390】

さらに、実施形態１３におけるデータ音声再生装置１０は、実施形態５と異なり、音声受信部１０３が受信した音声信号と、データ音声再生部１０２が読み上げ再生を行ったテキストデータまたはＨＴＭＬデータの音声信号を用いることで処理済み音声信号を生成し、当該処理済み音声信号について音声認識を行い、ユーザの命令であるかどうかを判断するため、高い精度で音声認識を行うことが可能となり、誤動作などの不具合の発生を抑制することができる。

【0391】

また、実施形態１３におけるデータ音声再生装置１０を用いると、ユーザは、読み上げ再生の一時停止と再開を音声により操作できるため便利である。

【0392】

実施形態１３においては、データ音声再生装置１０がユーザの一時停止命令の入力を受け、読み上げを一時停止したのち読み上げを再開する際、読み上げ再生が一時停止されたテキストデータまたはＨＴＭＬデータの位置よりも前の位置（一時停止前位置）から読み上げ再生の再開を行うこととしたが、実施形態２と同様に、音声受信部１０３が受信したユーザの音声による命令が発話された時点に対応するテキストデータまたはＨＴＭＬデータと同じ位置もしくはそれよりも前の位置（発話前位置）から読み上げ再生を再開してもよい。

【0393】

【0394】

【0395】

上述した各実施形態の態様によりもたらされる作用効果とは異なる他の作用効果であっても、本明細書の記載から明らかなもの、または、当業者において容易に予測し得るものについては、当然に本発明によりもたらされるものと解される。

【符号の説明】

【0396】

１・・・データ音声再生システム、１０・・・データ音声再生装置、１１・・・制御部、１２・・・記憶部、１３・・・通信部、１４・・・音声入力部、１５・・・音声出力部、１６・・・表示部、２０・・・メディアサイトサーバー、３０・・・ネットワーク、４０・・・無線通信端末、４１・・・制御部、４２・・・記憶部、４３・・・通信部、４４・・・音声入力部、４５・・・音声出力部、４６・・・物理的入力部、５０・・・相手方無線通信端末、１０１・・・データ取得部、１０２・・・データ音声再生部、１０３・・・音声受信部、１０４・・・音声認識部、１０５・・・保存部、１０６・・・保存完了通知部、１０７・・・保存領域、１０８・・・表示部、１０９・・・保存対象、１１０・・・時刻、１２０・・・識別部、１２２・・・音量調整部、１２４・・・検索部、１２６・・・情報通知部、１２８・・・通話部、１３０・・・コマンド受付部、１３２・・・再生指示入力部、１３４・・・既再生成分除去部、１３６・・・保存済み通知部

【図1】