(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023086309
(43)【公開日】2023-06-22
(54)【発明の名称】情報処理装置
(51)【国際特許分類】
G10L 13/00 20060101AFI20230615BHJP
G06F 3/16 20060101ALI20230615BHJP
【FI】
G10L13/00 100K
G10L13/00 100M
G06F3/16 650
G06F3/16 690
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2021200736
(22)【出願日】2021-12-10
(71)【出願人】
【識別番号】000005016
【氏名又は名称】パイオニア株式会社
(74)【代理人】
【識別番号】100134832
【弁理士】
【氏名又は名称】瀧野 文雄
(74)【代理人】
【識別番号】100165308
【弁理士】
【氏名又は名称】津田 俊明
(74)【代理人】
【識別番号】100115048
【弁理士】
【氏名又は名称】福田 康弘
(72)【発明者】
【氏名】高橋 宏幸
(72)【発明者】
【氏名】太田 圭祐
(57)【要約】
【課題】コストを抑制する。
【解決手段】端末装置からテキストデータを受信し、テキストデータに対応する音声データを端末装置に送信し、複数の音声データを記憶する記憶装置に、テキストデータに対応する音声データが記憶されているのか否かを確認し、テキストデータに対応する音声データが記憶装置に記憶されているならば、テキストデータに対応する音声データとして、記憶装置に記憶された音声データを、端末装置に送信し、テキストデータに対応する音声データが記憶装置に記憶されていないならば、テキストデータに対応する音声データを従量課金で作成する音声データ作成装置に、テキストデータを送信し、音声データ作成装置からテキストデータに対応する音声データを受信し、テキストデータに対応する音声データとして、音声データ作成装置から受信した音声データを、端末装置に送信し、記憶装置に記憶する。
【選択図】
図6
【特許請求の範囲】
【請求項1】
端末装置からテキストデータを受信するテキストデータ受信処理部と、
前記テキストデータに対応する音声データを前記端末装置に送信する音声データ送信処理部であって、
複数の音声データを記憶する記憶装置に、前記テキストデータに対応する音声データが記憶されているのか否かを確認し、
前記テキストデータに対応する音声データが前記記憶装置に記憶されているならば、前記テキストデータに対応する音声データとして、前記記憶装置に記憶された音声データを、前記端末装置に送信し、
前記テキストデータに対応する音声データが前記記憶装置に記憶されていないならば、テキストデータに対応する音声データを従量課金で作成する音声データ作成装置に、前記テキストデータを送信し、前記音声データ作成装置から前記テキストデータに対応する音声データを受信し、前記テキストデータに対応する音声データとして、前記音声データ作成装置から受信した音声データを、前記端末装置に送信する、音声データ送信処理部と、
前記音声データ作成装置から受信した音声データを、前記記憶装置に記憶する記憶処理部と、を有する情報処理装置。
【請求項2】
前記テキストデータは、当該テキストデータに対応する音声データが前記端末装置に記憶されていないと確認されたテキストデータである、請求項1に記載の情報処理装置。
【請求項3】
前記テキストデータは、前記端末装置に入力されたユーザの発話に対する応答に対応するテキストデータである、請求項1または2に情報処理装置。
【請求項4】
前記端末装置は、複数である、請求項1から3のいずれか一項に記載の情報処理装置。
【請求項5】
前記記憶処理部は、前記受信した音声データを前記記憶装置に記憶するためにかかるコストを含む第1のコストと、前記受信した音声データを前記音声データ作成装置により作成するためにかかるコストを含む第2のコストと、を比較し、前記第1のコストが前記第2のコストより低いときのみ、前記受信した音声データを前記記憶装置に記憶する、請求項1から4のいずれか一項に記載の情報処理装置。
【請求項6】
前記第2のコストは、前記音声データ作成装置から受信したテキストデータの量に基づいて決定される、請求項5に記載の情報処理装置。
【請求項7】
所定の期間における前記第2のコストは、当該所定の期間において前記音声データ作成装置から受信したテキストデータの量が所定の量に達するまでは、ゼロである、請求項6に記載の情報処理装置。
【請求項8】
コンピュータにより実行される情報処理方法であって、
端末装置からテキストデータを受信するテキストデータ受信処理工程と、
前記テキストデータに対応する音声データを前記端末装置に送信する音声データ送信処理工程であって、
複数の音声データを記憶する記憶装置に、前記テキストデータに対応する音声データが記憶されているのか否かを確認し、
前記テキストデータに対応する音声データが前記記憶装置に記憶されているならば、前記テキストデータに対応する音声データとして、前記記憶装置に記憶された音声データを、前記端末装置に送信し、
前記テキストデータに対応する音声データが前記記憶装置に記憶されていないならば、テキストデータに対応する音声データを従量課金で作成する音声データ作成装置に、前記テキストデータを送信し、前記音声データ作成装置から前記テキストデータに対応する音声データを受信し、前記テキストデータに対応する音声データとして、前記音声データ作成装置から受信した音声データを、前記端末装置に送信する、前記音声データ送信処理工程と、
前記音声データ作成装置から受信した音声データを、前記記憶装置に記憶する記憶処理工程と、を有する情報処理方法。
【請求項9】
請求項8に記載の情報処理方法を、コンピュータに実行させる情報処理プログラム。
【請求項10】
請求項9に記載の情報処理プログラムを記憶しているコンピュータ読み取り可能な記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置に関する。
【背景技術】
【0002】
深層学習を用いた音声合成技術が発達し、より自然な人間の音声を合成することが可能になってきている(例えば、特許文献1)。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、このような技術を個々のユーザが開発することは難しい。そこで、多くのユーザは、テキストデータを音声データに変換するために、他の企業が提供するサービスを使用することになる。このようなサービスは、従量課金で提供されることが多く、コスト抑制のためには、サービスの使用量を抑える必要がある。
【0005】
本発明が解決しようとする課題としては、コストを抑制することが一例として挙げられる。
【課題を解決するための手段】
【0006】
上記課題を解決するために、請求項1に記載の発明は、端末装置からテキストデータを受信するテキストデータ受信処理部と、
前記テキストデータに対応する音声データを前記端末装置に送信する音声データ送信処理部であって、
複数の音声データを記憶する記憶装置に、前記テキストデータに対応する音声データが記憶されているのか否かを確認し、
前記テキストデータに対応する音声データが前記記憶装置に記憶されているならば、前記テキストデータに対応する音声データとして、前記記憶装置に記憶された音声データを、前記端末装置に送信し、
前記テキストデータに対応する音声データが前記記憶装置に記憶されていないならば、テキストデータに対応する音声データを従量課金で作成する音声データ作成装置に、前記テキストデータを送信し、前記音声データ作成装置から前記テキストデータに対応する音声データを受信し、前記テキストデータに対応する音声データとして、前記音声データ作成装置から受信した音声データを、前記端末装置に送信する、音声データ送信処理部と、
前記音声データ作成装置から受信した音声データを、前記記憶装置に記憶する記憶処理部と、を有する。
【0007】
請求項8に記載の発明は、コンピュータにより実行される情報処理方法であって、端末装置からテキストデータを受信するテキストデータ受信処理工程と、前記テキストデータに対応する音声データを前記端末装置に送信する音声データ送信処理工程であって、複数の音声データを記憶する記憶装置に、前記テキストデータに対応する音声データが記憶されているのか否かを確認し、前記テキストデータに対応する音声データが前記記憶装置に記憶されているならば、前記テキストデータに対応する音声データとして、前記記憶装置に記憶された音声データを、前記端末装置に送信し、前記テキストデータに対応する音声データが前記記憶装置に記憶されていないならば、テキストデータに対応する音声データを従量課金で作成する音声データ作成装置に、前記テキストデータを送信し、前記音声データ作成装置から前記テキストデータに対応する音声データを受信し、前記テキストデータに対応する音声データとして、前記音声データ作成装置から受信した音声データを、前記端末装置に送信する、前記音声データ送信処理工程と、前記音声データ作成装置から受信した音声データを、前記記憶装置に記憶する記憶処理工程と、を有する。
【0008】
請求項9に記載の発明は、請求項8に記載の情報処理方法を、コンピュータに実行させる情報処理プログラム。
【0009】
請求項10に記載の発明は、請求項9に記載の情報処理プログラムを記憶している。
【図面の簡単な説明】
【0010】
【
図1】本発明の実施例に係る音声応答システムを示す図である。
【
図2】音声応答システムにおける処理動作を説明する図である。
【
図4】端末装置100の制御部110を示す図である。
【
図6】サーバ装置200の制御部210を示す図である。
【
図7】本実施例に係る音声応答システムにおける処理動作の一例を示す図である。
【発明を実施するための形態】
【0011】
本発明の一実施形態に係る情報処理装置は、端末装置からテキストデータを受信するテキストデータ受信処理部と、前記テキストデータに対応する音声データを前記端末装置に送信する音声データ送信処理部であって、複数の音声データを記憶する記憶装置に、前記テキストデータに対応する音声データが記憶されているのか否かを確認し、前記テキストデータに対応する音声データが前記記憶装置に記憶されているならば、前記テキストデータに対応する音声データとして、前記記憶装置に記憶された音声データを、前記端末装置に送信し、前記テキストデータに対応する音声データが前記記憶装置に記憶されていないならば、テキストデータに対応する音声データを従量課金で作成する音声データ作成装置に、前記テキストデータを送信し、前記音声データ作成装置から前記テキストデータに対応する音声データを受信し、前記テキストデータに対応する音声データとして、前記音声データ作成装置から受信した音声データを、前記端末装置に送信する、音声データ送信処理部と、前記音声データ作成装置から受信した音声データを、前記記憶装置に記憶する記憶処理部と、を有する。このように、本実施形態では、テキストデータに対応する音声データが記憶されているならば、音声データ作成装置に音声データの作成の要求をしない。また、本実施例では、記憶される音声データの種類を増やすことが可能である。このため、本実施形態では、音声データ作成装置に音声データの作成を要求する回数を抑えることが可能になり、結果、コストを抑制することが可能になる。
【0012】
前記テキストデータは、当該テキストデータに対応する音声データが前記端末装置に記憶されていないと確認されたテキストデータであるようにしても良い。このようにすることで、テキストデータに対応する音声データが端末装置に記憶されているならば、端末装置と情報処理装置との間でデータのやりとりを行う必要がなくなる。
【0013】
前記テキストデータは、前記端末装置に入力されたユーザの発話に対する応答に対応するテキストデータであるようにしても良い。このようにすることで、端末装置において、ユーザの発話に対する応答を音声で行うことが可能になる。
【0014】
前記端末装置は、複数であるようにしても良い。このようにすることで、情報処理装置には、多くの端末装置から要求された音声データが記憶されることになり、記憶される音声データの種類をより増やすことが可能になる。
【0015】
前記記憶処理部は、前記受信した音声データを前記記憶装置に記憶するためにかかるコストを含む第1のコストと、前記受信した音声データを前記音声データ作成装置により作成するためにかかるコストを含む第2のコストと、を比較し、前記第1のコストが前記第2のコストより低いときのみ、前記受信した音声データを前記記憶装置に記憶するようにしても良い。このようにすることで、全体でかかるコストを考慮した上で、音声データ作成装置を使用するのか否かを決定することが可能になり、結果、全体でかかるコストを抑制することが可能になる。
【0016】
前記第2のコストは、前記音声データ作成装置から受信したテキストデータの量に基づいて決定されるようにしても良い。このようにすることで、音声データの作成の料金を、音声データに変換されるテキストデータの量(例えば、テキストデータの文字数)に基づいて決定するサービスに対応することが可能になる。
【0017】
所定の期間における前記第2のコストは、当該所定の期間において前記音声データ作成装置から受信したテキストデータの量が所定の量に達するまでは、ゼロであるようにしても良い。このようにすることで、所定の期間(例えば、一か月)における音声データの作成の料金を、この所定の期間において音声データに変換されるテキストデータの量が所定の量に達するまではゼロにするサービスに対応することが可能になる。
【0018】
また、本発明の一実施形態にかかる情報処理方法は、コンピュータにより実行される情報処理方法であって、端末装置からテキストデータを受信するテキストデータ受信処理工程と、前記テキストデータに対応する音声データを前記端末装置に送信する音声データ送信処理工程であって、複数の音声データを記憶する記憶装置に、前記テキストデータに対応する音声データが記憶されているのか否かを確認し、前記テキストデータに対応する音声データが前記記憶装置に記憶されているならば、前記テキストデータに対応する音声データとして、前記記憶装置に記憶された音声データを、前記端末装置に送信し、前記テキストデータに対応する音声データが前記記憶装置に記憶されていないならば、テキストデータに対応する音声データを従量課金で作成する音声データ作成装置に、前記テキストデータを送信し、前記音声データ作成装置から前記テキストデータに対応する音声データを受信し、前記テキストデータに対応する音声データとして、前記音声データ作成装置から受信した音声データを、前記端末装置に送信する、前記音声データ送信処理工程と、
前記音声データ作成装置から受信した音声データを、前記記憶装置に記憶する記憶処理工程と、を有する。このように、本実施形態では、テキストデータに対応する音声データが記憶されているならば、音声データ作成装置に音声データの作成の要求をしない。また、本実施例では、記憶される音声データの種類を増やすことが可能である。このため、本実施形態では、音声データ作成装置に音声データの作成を要求する回数を抑えることが可能になり、結果、コストを抑制することが可能になる。
【0019】
また、本発明の一実施形態に係るプログラム情報処理は、上記の情報処理方法を、コンピュータに実行させる。このため、本実施形態では、コンピュータを用いて、音声データ作成装置に音声データの作成を要求する回数を抑えることが可能になり、結果、コストを抑制することが可能になる。
【0020】
また、本発明の一実施形態に係るコンピュータ読み取り可能な記憶媒体は、上記の情報処理プログラムを記憶している。このようにすることで、上記の情報処理プログラムを、機器に組み込む以外にも単体で流通することが可能になり、バージョンアップ等を容易に行うことが可能になる。
【実施例0021】
<音声応答システム>
図1は、本発明の一実施例に係る音声応答システムを示す図である。本実施例に係る音声応答システムは、一以上の端末装置100と、サーバ装置200と、音声データ作成装置300と、を有する。サーバ装置200は、上記実施形態に係る情報処理装置の一例である。
【0022】
図2は、音声応答システムにおける処理動作を説明する図である。端末装置100は、ユーザによる発話の入力を受け、ユーザによる発話に対する応答を音声で出力する。端末装置100は、応答に対応する音声データを記憶しているならば、この記憶している当該音声データに基づいた音声を出力する。一方、端末装置100は、応答に対応する音声データが記憶していないならば、応答に対応する音声データの要求をサーバ装置200に送信し、サーバ装置200から音声データを受信し、この受信した音声データに基づいた音声を出力する。
【0023】
サーバ装置200は、端末装置100から要求された、応答に対応する音声データが記憶されているならば、この記憶された音声データを端末装置100に送信する。一方、サーバ装置200は、端末装置100から要求された、応答に対応する音声データが記憶されていないならば、応答に対応する音声データの作成の要求を音声データ作成装置300に送信し、音声データ作成装置300から音声データを受信し、この受信した音声データを端末装置100に送信する。
【0024】
音声データ作成装置300は、テキストデータに対応する音声データを従量課金で作成する。端末装置100からサーバ装置200に送信される応答に対応する音声データの要求、サーバ装置200から音声作成装置300に送信される応答に対応する音声データの作成の要求は、応答に対応するテキストデータを含んでいる。音声データ作成装置300は、サーバ装置200からの応答に対応する音声データの作成の要求を受信したならば、例えば、このテキストデータに対応する音声データを作成し、この作成した音声データを、サーバ装置200に送信する。
【0025】
このように、本実施例では、応答に対応する音声データが記憶されているならば、音声データ作成装置に音声データの作成の要求をしない。このため、本実施例では、音声データ作成装置に音声データの作成を要求する回数を抑えることが可能になり、結果、コストを抑制することが可能になる。
【0026】
<端末装置100>
図3は、端末装置100を示す図である。端末装置100は、制御部110と、音声入力部120と、通信部130と、音声出力部140と、記憶部150と、を有する。制御部110は、コンピュータにより構成される。音声入力部120は、マイクなどの音声の入力を受けるための音声入力装置である。通信部130は、他の装置と情報の送受信を行うための通信装置である。音声出力部140は、スピーカなどの音声を出力するための音声出力装置である。記憶部150は、ハードディスクや、メモリなどの情報を記憶するための記憶装置である。
【0027】
図4は、端末装置100の制御部110を示す図である。制御部110は、応答作成部111と、応答音声出力処理部112と、記憶処理部113と、を有する。
【0028】
応答作成部111は、音声入力部120により入力されたユーザの発話の内容を認識し、ユーザの発話に対する応答に対応するテキストデータを作成する。
【0029】
応答作成部111は、ユーザの発話の内容を認識する機能を自ら有するようにしても良いし、通信部130による通信を行うことで他の装置を用いて、ユーザの発話の内容を認識するようにしても良い。また、応答作成部111は、ユーザの発話に対する応答を作成する機能を有するようにしても良いし、通信部130による通信を行うことで他の装置を用いて、ユーザの発話に対する応答を作成するようにしても良い。
【0030】
応答音声出力処理部112は、ユーザの発話に対する応答の音声を音声出力部140により出力する。つまり、応答作成部111により作成されたテキストデータに対応する音声データ(つまり、応答に対応する音声データ)に基づいた音声を音声出力部140により出力する。
【0031】
例えば、ユーザの発話の内容が検索の依頼(例えば、「コンビニエンスストアを探して」との発話)であれば、応答作成部111は、ユーザの発話の内容を認識し、ユーザの発話に対する応答を作成するために依頼された検索(例えば、ユーザの近辺のコンビニエンスストアの検索)を行い、検索結果に基づいて、ユーザの発話に対する応答に対応するテキストデータ(例えば、「AストアとBストアが見つかりました。どちらに行きますか?」とのテキストデータ)を作成する。そして、応答音声出力処理部112は、この作成されたテキストデータに対応する音声(例えば、「AストアとBストアが見つかりました。どちらに行きますか?」との音声)を出力する。
【0032】
応答に対応する音声データに基づいた音声を出力する際、応答音声出力処理部112は、応答に対応する音声データが記憶部150に記憶されているのか否かを確認する。そして、応答に対応する音声データが記憶部150に記憶されているならば、応答音声出力処理部112は、記憶部150に記憶された音声データに基づいた音声を音声出力部140により出力する。一方、応答に対応する音声データが記憶部150に記憶されていないならば、応答音声出力処理部112は、応答に対応する音声データの要求をサーバ装置200に通信部130により送信し、サーバ装置200から音声データを通信部130により受信し、この受信した音声データに基づいた音声を音声出力部140により出力する。
【0033】
このように、本実施例では、応答に対応する音声データが記憶されているならば、サーバ装置に音声データの要求を行わず、記憶された音声データに基づいた音声を出力する。このため、本実施例では、応答に対応する音声データが端末装置に記憶されているならば、端末装置とサーバ装置との間でデータのやりとりを行う必要がなくなり、ユーザの発話に対する応答を出力するまでの時間を短くすることが可能である。
【0034】
記憶処理部113は、サーバ装置200から受信した音声データを、記憶部150に記憶する。このため、本実施例では、記憶部に記憶される音声データの種類を増やすことが可能であり、結果、端末装置とサーバ装置との間でデータのやりとりを行う必要がより少なくなり、ユーザの発話に対する応答を出力するまでの時間をより短くすることが可能である。
【0035】
上記では、応答作成部111は、音声入力部120により入力されたユーザの発話に対する応答を作成するが、キーボードなどの情報の入力を受ける他の種類の入力装置により入力された情報に対する応答を作成するようにしても良い。
【0036】
<サーバ装置200>
図5は、サーバ装置200を示す図である。サーバ装置200は、制御部210と、通信部220と、記憶部230と、を有する。制御部210は、コンピュータにより構成される。通信部220は、他の装置と情報の送受信を行うための通信装置である。記憶部230は、ハードディスクや、メモリなどの情報を記憶するための記憶装置である。
【0037】
図6は、サーバ装置200の制御部210を示す図である。制御部210は、テキストデータ受信処理部211と、音声データ送信処理部212と、記憶処理部213と、を有する。
【0038】
テキストデータ受信処理部211は、応答に対応する音声データの要求を端末装置100から通信部220により受信する。応答に対応する音声データの要求には、応答に対応するテキストデータが含まれている。
【0039】
音声データ送信処理部212は、応答に対応する音声データを端末装置100に通信部220により送信する。
【0040】
このとき、音声データ送信処理部212は、応答に対応する音声データ(つまり、応答に対応するテキストデータに応答に対応する音声データ)が記憶されているのか否かを確認する。音声データ送信処理部212は、サーバ装置200の記憶部230に、応答に対応する音声データが記憶されているのか否かを確認するようにしても良いし、サーバ装置200とは別個の記憶装置(例えば、他のサーバ装置の記憶部や、応答に対応する音声データの要求を送信した端末装置100とは別の端末装置100の記憶部150)に、応答に対応する音声データが記憶されているのか否かを確認するようにしても良い。
【0041】
そして、応答に対応する音声データが記憶されているならば、音声データ送信処理部212は、この記憶された音声データを送信する。一方、応答に対応する音声データが記憶されていないならば、音声データ送信処理部212は、応答に対応する音声データの作成の要求を音声データ作成装置300に通信部220により送信し、応答に対応する音声データを音声データ作成装置300から通信部220により受信し、この受信した音声データを端末装置100に通信部220により送信する。応答に対応する音声データの作成の要求には、応答に対応するテキストデータが含まれており、音声データ作成装置300は、このテキストデータに対応する音声データをサーバ装置200に送信する。
【0042】
このように、本実施例では、応答に対応する音声データが記憶されているならば、音声データ作成装置に音声データの作成の要求をしない。このため、本実施例では、音声データ作成装置に音声データの作成を要求する回数を抑えることが可能になり、結果、コストを抑制することが可能になる。
【0043】
記憶処理部213は、音声データ作成装置300から受信した音声データを記憶する。このとき、音声データ送信処理部212は、サーバ装置200の記憶部230に、音声データ作成装置300から受信した音声データを記憶するようにしても良いし、サーバ装置200とは別個の記憶装置に、音声データ作成装置300から受信した音声データを記憶するようにしても良い。このため、本実施例では、記憶される音声データの種類を増やすことが可能であり、音声データ作成装置に音声データの作成の要求を行う回数をより抑制することが可能である。
【0044】
例えば、端末装置100は複数であるとすると良い。このようにすることで、サーバ装置には、多くの端末装置から要求された音声データが記憶されることになり、記憶される音声データの種類をより増やすことが可能になる。
【0045】
記憶処理部213は、音声データ作成装置300から音声データを受信したときに、この受信した音声データを記憶するためにかかるコストを含む第1のコストと、この受信した音声データを音声データ作成装置300により作成するためにかかるコストを含む第2のコストと、を比較し、第1のコストが第2のコストより低いときのみ、この受信した音声データを記憶するようにしても良い。このようにすることで、全体でかかるコストを考慮した上で、音声データ作成装置を使用するのか否かを決定することが可能になり、結果、全体でかかるコストを抑制することが可能になる。
【0046】
音声データを作成するサービスの中には、音声データの作成の料金を、音声データに変換されるテキストデータの量(例えば、テキストデータの文字数)に基づいて決定するサービスが存在する。そこで、第2のコストは、例えば、音声データ作成装置300から受信したテキストデータの量(例えば、テキストデータの文字数)により決定されるようにすると良い。
【0047】
また、音声データを作成するサービスの中には、所定の期間(例えば、一か月)における音声データの作成の料金を、この所定の期間において音声データに変換されるテキストデータの量が所定の量に達するまではゼロにするサービスも存在する。そこで、所定期間における第2のコストは、例えば、当該所定の期間において音声データ作成装置300から受信した音声データに対応するテキストデータの量が所定の量に達するまでは、ゼロであるようにすると良い。
【0048】
<音声応答システムにおける処理動作>
図7は、本実施例に係る音声応答システムにおける処理動作の一例を示す図である。
図7の処理動作は、端末装置100がユーザの発話の入力を音声入力部120により受けるごとに実行される。
【0049】
端末装置100の応答作成部111が、入力されたユーザの発話に対する応答に対応するテキストデータを作成する(ステップS701)。端末装置100の応答音声出力処理部112が、応答に対応する音声データが、端末装置100の記憶部150に記憶されているのか否かを確認する(ステップS702)。応答に対応する音声データが記憶部150に記憶されているならば(ステップS702、YES)、端末装置100の応答音声出力処理部112が、この記憶部130に記憶された音声データに基づいた音声を音声出力部140により出力する(ステップS703)。応答に対応する音声データが記憶部150に記憶されていないならば(ステップS702、NO)、端末装置100の応答音声出力処理部112が、応答に対応する音声データの要求をサーバ装置200に通信部130により送信する(ステップS704)。
【0050】
サーバ装置200のテキストデータ受信処理部211が、応答に対応する音声データの要求を端末装置100から通信部220により受信する(ステップ705)。サーバ装置200の音声データ送信処理部212が、応答に対応する音声データが記憶されているのか否かを確認する(ステップS706)。応答データに対応する音声データが記憶されているならば(ステップS706、YES)、サーバ装置200の音声データ送信処理部212は、この記憶された音声データを端末装置100に通信部220により送信する(ステップS707)。応答に対応する音声データが記憶されていないならば(ステップS706、NO)、サーバ装置200の音声データ送信処理部212が、応答に対応する音声データの作成の要求を音声データ作成装置300に送信する(ステップS708)。
【0051】
音声データ作成装置300が、応答に対応する音声データの作成の要求をサーバ装置200から受信し、応答に対応する音声データをサーバ装置200に送信する(ステップS709)。
【0052】
サーバ装置200の音声データ送信処理部212が、応答に対応する音声データを音声データ作成装置300から通信部220により受信し、この受信した音声データを端末装置100に通信部220により送信し、記憶処理部213は、この受信した音声データを記憶する(ステップ710)。
【0053】
端末装置100の応答音声出力処理部112は、応答に対応する音声データをサーバ装置200から通信部130により受信し、この受信した音声データに基づいた音声を音声出力部140により出力し、記憶処理部113は、この受信した音声データを記憶部150に記憶する(ステップS711)。
【0054】
以上、本発明の好適な実施の形態により本発明を説明した。ここでは特定の具体例を示して本発明を説明したが、特許請求の範囲に記載した本発明の趣旨および範囲から逸脱することなく、これら具体例に様々な修正および変更が可能である。