特開2023-86309 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ パイオニア株式会社の特許一覧

特開2023-86309情報処理装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2023086309

(43)【公開日】2023-06-22

(54)【発明の名称】情報処理装置

(51)【国際特許分類】

G10L 13/00 20060101AFI20230615BHJP

G06F 3/16 20060101ALI20230615BHJP

【ＦＩ】

G10L13/00 100K

G10L13/00 100M

G06F3/16 650

G06F3/16 690

【審査請求】未請求

【請求項の数】10

【出願形態】ＯＬ

(21)【出願番号】P 2021200736

(22)【出願日】2021-12-10

(71)【出願人】

【識別番号】000005016

【氏名又は名称】パイオニア株式会社

(74)【代理人】

【識別番号】100134832

【弁理士】

【氏名又は名称】瀧野文雄

(74)【代理人】

【識別番号】100165308

【弁理士】

【氏名又は名称】津田俊明

(74)【代理人】

【識別番号】100115048

【弁理士】

【氏名又は名称】福田康弘

(72)【発明者】

【氏名】高橋宏幸

(72)【発明者】

【氏名】太田圭祐

(57)【要約】

【課題】コストを抑制する。
【解決手段】端末装置からテキストデータを受信し、テキストデータに対応する音声データを端末装置に送信し、複数の音声データを記憶する記憶装置に、テキストデータに対応する音声データが記憶されているのか否かを確認し、テキストデータに対応する音声データが記憶装置に記憶されているならば、テキストデータに対応する音声データとして、記憶装置に記憶された音声データを、端末装置に送信し、テキストデータに対応する音声データが記憶装置に記憶されていないならば、テキストデータに対応する音声データを従量課金で作成する音声データ作成装置に、テキストデータを送信し、音声データ作成装置からテキストデータに対応する音声データを受信し、テキストデータに対応する音声データとして、音声データ作成装置から受信した音声データを、端末装置に送信し、記憶装置に記憶する。
【選択図】図６

【特許請求の範囲】

【請求項1】

端末装置からテキストデータを受信するテキストデータ受信処理部と、
前記テキストデータに対応する音声データを前記端末装置に送信する音声データ送信処理部であって、
複数の音声データを記憶する記憶装置に、前記テキストデータに対応する音声データが記憶されているのか否かを確認し、
前記テキストデータに対応する音声データが前記記憶装置に記憶されているならば、前記テキストデータに対応する音声データとして、前記記憶装置に記憶された音声データを、前記端末装置に送信し、
前記テキストデータに対応する音声データが前記記憶装置に記憶されていないならば、テキストデータに対応する音声データを従量課金で作成する音声データ作成装置に、前記テキストデータを送信し、前記音声データ作成装置から前記テキストデータに対応する音声データを受信し、前記テキストデータに対応する音声データとして、前記音声データ作成装置から受信した音声データを、前記端末装置に送信する、音声データ送信処理部と、
前記音声データ作成装置から受信した音声データを、前記記憶装置に記憶する記憶処理部と、を有する情報処理装置。

【請求項2】

前記テキストデータは、当該テキストデータに対応する音声データが前記端末装置に記憶されていないと確認されたテキストデータである、請求項１に記載の情報処理装置。

【請求項3】

前記テキストデータは、前記端末装置に入力されたユーザの発話に対する応答に対応するテキストデータである、請求項１または２に情報処理装置。

【請求項4】

前記端末装置は、複数である、請求項１から３のいずれか一項に記載の情報処理装置。

【請求項5】

前記記憶処理部は、前記受信した音声データを前記記憶装置に記憶するためにかかるコストを含む第１のコストと、前記受信した音声データを前記音声データ作成装置により作成するためにかかるコストを含む第２のコストと、を比較し、前記第１のコストが前記第２のコストより低いときのみ、前記受信した音声データを前記記憶装置に記憶する、請求項１から４のいずれか一項に記載の情報処理装置。

【請求項6】

前記第２のコストは、前記音声データ作成装置から受信したテキストデータの量に基づいて決定される、請求項５に記載の情報処理装置。

【請求項7】

所定の期間における前記第２のコストは、当該所定の期間において前記音声データ作成装置から受信したテキストデータの量が所定の量に達するまでは、ゼロである、請求項６に記載の情報処理装置。

【請求項8】

コンピュータにより実行される情報処理方法であって、
端末装置からテキストデータを受信するテキストデータ受信処理工程と、
前記テキストデータに対応する音声データを前記端末装置に送信する音声データ送信処理工程であって、
複数の音声データを記憶する記憶装置に、前記テキストデータに対応する音声データが記憶されているのか否かを確認し、
前記テキストデータに対応する音声データが前記記憶装置に記憶されているならば、前記テキストデータに対応する音声データとして、前記記憶装置に記憶された音声データを、前記端末装置に送信し、
前記テキストデータに対応する音声データが前記記憶装置に記憶されていないならば、テキストデータに対応する音声データを従量課金で作成する音声データ作成装置に、前記テキストデータを送信し、前記音声データ作成装置から前記テキストデータに対応する音声データを受信し、前記テキストデータに対応する音声データとして、前記音声データ作成装置から受信した音声データを、前記端末装置に送信する、前記音声データ送信処理工程と、
前記音声データ作成装置から受信した音声データを、前記記憶装置に記憶する記憶処理工程と、を有する情報処理方法。

【請求項9】

請求項８に記載の情報処理方法を、コンピュータに実行させる情報処理プログラム。

【請求項10】

請求項９に記載の情報処理プログラムを記憶しているコンピュータ読み取り可能な記憶媒体。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、情報処理装置に関する。

【背景技術】

【0002】

深層学習を用いた音声合成技術が発達し、より自然な人間の音声を合成することが可能になってきている（例えば、特許文献１）。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特開２０１７－３２８３９号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

しかしながら、このような技術を個々のユーザが開発することは難しい。そこで、多くのユーザは、テキストデータを音声データに変換するために、他の企業が提供するサービスを使用することになる。このようなサービスは、従量課金で提供されることが多く、コスト抑制のためには、サービスの使用量を抑える必要がある。

【0005】

本発明が解決しようとする課題としては、コストを抑制することが一例として挙げられる。

【課題を解決するための手段】

【0006】

上記課題を解決するために、請求項１に記載の発明は、端末装置からテキストデータを受信するテキストデータ受信処理部と、
前記テキストデータに対応する音声データを前記端末装置に送信する音声データ送信処理部であって、
複数の音声データを記憶する記憶装置に、前記テキストデータに対応する音声データが記憶されているのか否かを確認し、
前記テキストデータに対応する音声データが前記記憶装置に記憶されているならば、前記テキストデータに対応する音声データとして、前記記憶装置に記憶された音声データを、前記端末装置に送信し、
前記テキストデータに対応する音声データが前記記憶装置に記憶されていないならば、テキストデータに対応する音声データを従量課金で作成する音声データ作成装置に、前記テキストデータを送信し、前記音声データ作成装置から前記テキストデータに対応する音声データを受信し、前記テキストデータに対応する音声データとして、前記音声データ作成装置から受信した音声データを、前記端末装置に送信する、音声データ送信処理部と、
前記音声データ作成装置から受信した音声データを、前記記憶装置に記憶する記憶処理部と、を有する。

【0007】

請求項８に記載の発明は、コンピュータにより実行される情報処理方法であって、端末装置からテキストデータを受信するテキストデータ受信処理工程と、前記テキストデータに対応する音声データを前記端末装置に送信する音声データ送信処理工程であって、複数の音声データを記憶する記憶装置に、前記テキストデータに対応する音声データが記憶されているのか否かを確認し、前記テキストデータに対応する音声データが前記記憶装置に記憶されているならば、前記テキストデータに対応する音声データとして、前記記憶装置に記憶された音声データを、前記端末装置に送信し、前記テキストデータに対応する音声データが前記記憶装置に記憶されていないならば、テキストデータに対応する音声データを従量課金で作成する音声データ作成装置に、前記テキストデータを送信し、前記音声データ作成装置から前記テキストデータに対応する音声データを受信し、前記テキストデータに対応する音声データとして、前記音声データ作成装置から受信した音声データを、前記端末装置に送信する、前記音声データ送信処理工程と、前記音声データ作成装置から受信した音声データを、前記記憶装置に記憶する記憶処理工程と、を有する。

【0008】

請求項９に記載の発明は、請求項８に記載の情報処理方法を、コンピュータに実行させる情報処理プログラム。

【0009】

請求項１０に記載の発明は、請求項９に記載の情報処理プログラムを記憶している。

【図面の簡単な説明】

【0010】

【図1】本発明の実施例に係る音声応答システムを示す図である。

【図2】音声応答システムにおける処理動作を説明する図である。

【図3】端末装置１００を示す図である。

【図4】端末装置１００の制御部１１０を示す図である。

【図5】サーバ装置２００を示す図である。

【図6】サーバ装置２００の制御部２１０を示す図である。

【図7】本実施例に係る音声応答システムにおける処理動作の一例を示す図である。

【発明を実施するための形態】

【0011】

本発明の一実施形態に係る情報処理装置は、端末装置からテキストデータを受信するテキストデータ受信処理部と、前記テキストデータに対応する音声データを前記端末装置に送信する音声データ送信処理部であって、複数の音声データを記憶する記憶装置に、前記テキストデータに対応する音声データが記憶されているのか否かを確認し、前記テキストデータに対応する音声データが前記記憶装置に記憶されているならば、前記テキストデータに対応する音声データとして、前記記憶装置に記憶された音声データを、前記端末装置に送信し、前記テキストデータに対応する音声データが前記記憶装置に記憶されていないならば、テキストデータに対応する音声データを従量課金で作成する音声データ作成装置に、前記テキストデータを送信し、前記音声データ作成装置から前記テキストデータに対応する音声データを受信し、前記テキストデータに対応する音声データとして、前記音声データ作成装置から受信した音声データを、前記端末装置に送信する、音声データ送信処理部と、前記音声データ作成装置から受信した音声データを、前記記憶装置に記憶する記憶処理部と、を有する。このように、本実施形態では、テキストデータに対応する音声データが記憶されているならば、音声データ作成装置に音声データの作成の要求をしない。また、本実施例では、記憶される音声データの種類を増やすことが可能である。このため、本実施形態では、音声データ作成装置に音声データの作成を要求する回数を抑えることが可能になり、結果、コストを抑制することが可能になる。

【0012】

前記テキストデータは、当該テキストデータに対応する音声データが前記端末装置に記憶されていないと確認されたテキストデータであるようにしても良い。このようにすることで、テキストデータに対応する音声データが端末装置に記憶されているならば、端末装置と情報処理装置との間でデータのやりとりを行う必要がなくなる。

【0013】

前記テキストデータは、前記端末装置に入力されたユーザの発話に対する応答に対応するテキストデータであるようにしても良い。このようにすることで、端末装置において、ユーザの発話に対する応答を音声で行うことが可能になる。

【0014】

前記端末装置は、複数であるようにしても良い。このようにすることで、情報処理装置には、多くの端末装置から要求された音声データが記憶されることになり、記憶される音声データの種類をより増やすことが可能になる。

【0015】

前記記憶処理部は、前記受信した音声データを前記記憶装置に記憶するためにかかるコストを含む第１のコストと、前記受信した音声データを前記音声データ作成装置により作成するためにかかるコストを含む第２のコストと、を比較し、前記第１のコストが前記第２のコストより低いときのみ、前記受信した音声データを前記記憶装置に記憶するようにしても良い。このようにすることで、全体でかかるコストを考慮した上で、音声データ作成装置を使用するのか否かを決定することが可能になり、結果、全体でかかるコストを抑制することが可能になる。

【0016】

前記第２のコストは、前記音声データ作成装置から受信したテキストデータの量に基づいて決定されるようにしても良い。このようにすることで、音声データの作成の料金を、音声データに変換されるテキストデータの量（例えば、テキストデータの文字数）に基づいて決定するサービスに対応することが可能になる。

【0017】

所定の期間における前記第２のコストは、当該所定の期間において前記音声データ作成装置から受信したテキストデータの量が所定の量に達するまでは、ゼロであるようにしても良い。このようにすることで、所定の期間（例えば、一か月）における音声データの作成の料金を、この所定の期間において音声データに変換されるテキストデータの量が所定の量に達するまではゼロにするサービスに対応することが可能になる。

【0018】

また、本発明の一実施形態にかかる情報処理方法は、コンピュータにより実行される情報処理方法であって、端末装置からテキストデータを受信するテキストデータ受信処理工程と、前記テキストデータに対応する音声データを前記端末装置に送信する音声データ送信処理工程であって、複数の音声データを記憶する記憶装置に、前記テキストデータに対応する音声データが記憶されているのか否かを確認し、前記テキストデータに対応する音声データが前記記憶装置に記憶されているならば、前記テキストデータに対応する音声データとして、前記記憶装置に記憶された音声データを、前記端末装置に送信し、前記テキストデータに対応する音声データが前記記憶装置に記憶されていないならば、テキストデータに対応する音声データを従量課金で作成する音声データ作成装置に、前記テキストデータを送信し、前記音声データ作成装置から前記テキストデータに対応する音声データを受信し、前記テキストデータに対応する音声データとして、前記音声データ作成装置から受信した音声データを、前記端末装置に送信する、前記音声データ送信処理工程と、
前記音声データ作成装置から受信した音声データを、前記記憶装置に記憶する記憶処理工程と、を有する。このように、本実施形態では、テキストデータに対応する音声データが記憶されているならば、音声データ作成装置に音声データの作成の要求をしない。また、本実施例では、記憶される音声データの種類を増やすことが可能である。このため、本実施形態では、音声データ作成装置に音声データの作成を要求する回数を抑えることが可能になり、結果、コストを抑制することが可能になる。

【0019】

また、本発明の一実施形態に係るプログラム情報処理は、上記の情報処理方法を、コンピュータに実行させる。このため、本実施形態では、コンピュータを用いて、音声データ作成装置に音声データの作成を要求する回数を抑えることが可能になり、結果、コストを抑制することが可能になる。

【0020】

また、本発明の一実施形態に係るコンピュータ読み取り可能な記憶媒体は、上記の情報処理プログラムを記憶している。このようにすることで、上記の情報処理プログラムを、機器に組み込む以外にも単体で流通することが可能になり、バージョンアップ等を容易に行うことが可能になる。

【実施例0021】

＜音声応答システム＞
図１は、本発明の一実施例に係る音声応答システムを示す図である。本実施例に係る音声応答システムは、一以上の端末装置１００と、サーバ装置２００と、音声データ作成装置３００と、を有する。サーバ装置２００は、上記実施形態に係る情報処理装置の一例である。

【0022】

図２は、音声応答システムにおける処理動作を説明する図である。端末装置１００は、ユーザによる発話の入力を受け、ユーザによる発話に対する応答を音声で出力する。端末装置１００は、応答に対応する音声データを記憶しているならば、この記憶している当該音声データに基づいた音声を出力する。一方、端末装置１００は、応答に対応する音声データが記憶していないならば、応答に対応する音声データの要求をサーバ装置２００に送信し、サーバ装置２００から音声データを受信し、この受信した音声データに基づいた音声を出力する。

【0023】

サーバ装置２００は、端末装置１００から要求された、応答に対応する音声データが記憶されているならば、この記憶された音声データを端末装置１００に送信する。一方、サーバ装置２００は、端末装置１００から要求された、応答に対応する音声データが記憶されていないならば、応答に対応する音声データの作成の要求を音声データ作成装置３００に送信し、音声データ作成装置３００から音声データを受信し、この受信した音声データを端末装置１００に送信する。

【0024】

音声データ作成装置３００は、テキストデータに対応する音声データを従量課金で作成する。端末装置１００からサーバ装置２００に送信される応答に対応する音声データの要求、サーバ装置２００から音声作成装置３００に送信される応答に対応する音声データの作成の要求は、応答に対応するテキストデータを含んでいる。音声データ作成装置３００は、サーバ装置２００からの応答に対応する音声データの作成の要求を受信したならば、例えば、このテキストデータに対応する音声データを作成し、この作成した音声データを、サーバ装置２００に送信する。

【0025】

このように、本実施例では、応答に対応する音声データが記憶されているならば、音声データ作成装置に音声データの作成の要求をしない。このため、本実施例では、音声データ作成装置に音声データの作成を要求する回数を抑えることが可能になり、結果、コストを抑制することが可能になる。

【0026】

＜端末装置１００＞
図３は、端末装置１００を示す図である。端末装置１００は、制御部１１０と、音声入力部１２０と、通信部１３０と、音声出力部１４０と、記憶部１５０と、を有する。制御部１１０は、コンピュータにより構成される。音声入力部１２０は、マイクなどの音声の入力を受けるための音声入力装置である。通信部１３０は、他の装置と情報の送受信を行うための通信装置である。音声出力部１４０は、スピーカなどの音声を出力するための音声出力装置である。記憶部１５０は、ハードディスクや、メモリなどの情報を記憶するための記憶装置である。

【0027】

図４は、端末装置１００の制御部１１０を示す図である。制御部１１０は、応答作成部１１１と、応答音声出力処理部１１２と、記憶処理部１１３と、を有する。

【0028】

応答作成部１１１は、音声入力部１２０により入力されたユーザの発話の内容を認識し、ユーザの発話に対する応答に対応するテキストデータを作成する。

【0029】

応答作成部１１１は、ユーザの発話の内容を認識する機能を自ら有するようにしても良いし、通信部１３０による通信を行うことで他の装置を用いて、ユーザの発話の内容を認識するようにしても良い。また、応答作成部１１１は、ユーザの発話に対する応答を作成する機能を有するようにしても良いし、通信部１３０による通信を行うことで他の装置を用いて、ユーザの発話に対する応答を作成するようにしても良い。

【0030】

応答音声出力処理部１１２は、ユーザの発話に対する応答の音声を音声出力部１４０により出力する。つまり、応答作成部１１１により作成されたテキストデータに対応する音声データ（つまり、応答に対応する音声データ）に基づいた音声を音声出力部１４０により出力する。

【0031】

例えば、ユーザの発話の内容が検索の依頼（例えば、「コンビニエンスストアを探して」との発話）であれば、応答作成部１１１は、ユーザの発話の内容を認識し、ユーザの発話に対する応答を作成するために依頼された検索（例えば、ユーザの近辺のコンビニエンスストアの検索）を行い、検索結果に基づいて、ユーザの発話に対する応答に対応するテキストデータ（例えば、「ＡストアとＢストアが見つかりました。どちらに行きますか？」とのテキストデータ）を作成する。そして、応答音声出力処理部１１２は、この作成されたテキストデータに対応する音声（例えば、「ＡストアとＢストアが見つかりました。どちらに行きますか？」との音声）を出力する。

【0032】

応答に対応する音声データに基づいた音声を出力する際、応答音声出力処理部１１２は、応答に対応する音声データが記憶部１５０に記憶されているのか否かを確認する。そして、応答に対応する音声データが記憶部１５０に記憶されているならば、応答音声出力処理部１１２は、記憶部１５０に記憶された音声データに基づいた音声を音声出力部１４０により出力する。一方、応答に対応する音声データが記憶部１５０に記憶されていないならば、応答音声出力処理部１１２は、応答に対応する音声データの要求をサーバ装置２００に通信部１３０により送信し、サーバ装置２００から音声データを通信部１３０により受信し、この受信した音声データに基づいた音声を音声出力部１４０により出力する。

【0033】

このように、本実施例では、応答に対応する音声データが記憶されているならば、サーバ装置に音声データの要求を行わず、記憶された音声データに基づいた音声を出力する。このため、本実施例では、応答に対応する音声データが端末装置に記憶されているならば、端末装置とサーバ装置との間でデータのやりとりを行う必要がなくなり、ユーザの発話に対する応答を出力するまでの時間を短くすることが可能である。

【0034】

記憶処理部１１３は、サーバ装置２００から受信した音声データを、記憶部１５０に記憶する。このため、本実施例では、記憶部に記憶される音声データの種類を増やすことが可能であり、結果、端末装置とサーバ装置との間でデータのやりとりを行う必要がより少なくなり、ユーザの発話に対する応答を出力するまでの時間をより短くすることが可能である。

【0035】

上記では、応答作成部１１１は、音声入力部１２０により入力されたユーザの発話に対する応答を作成するが、キーボードなどの情報の入力を受ける他の種類の入力装置により入力された情報に対する応答を作成するようにしても良い。

【0036】

＜サーバ装置２００＞
図５は、サーバ装置２００を示す図である。サーバ装置２００は、制御部２１０と、通信部２２０と、記憶部２３０と、を有する。制御部２１０は、コンピュータにより構成される。通信部２２０は、他の装置と情報の送受信を行うための通信装置である。記憶部２３０は、ハードディスクや、メモリなどの情報を記憶するための記憶装置である。

【0037】

図６は、サーバ装置２００の制御部２１０を示す図である。制御部２１０は、テキストデータ受信処理部２１１と、音声データ送信処理部２１２と、記憶処理部２１３と、を有する。

【0038】

テキストデータ受信処理部２１１は、応答に対応する音声データの要求を端末装置１００から通信部２２０により受信する。応答に対応する音声データの要求には、応答に対応するテキストデータが含まれている。

【0039】

音声データ送信処理部２１２は、応答に対応する音声データを端末装置１００に通信部２２０により送信する。

【0040】

このとき、音声データ送信処理部２１２は、応答に対応する音声データ（つまり、応答に対応するテキストデータに応答に対応する音声データ）が記憶されているのか否かを確認する。音声データ送信処理部２１２は、サーバ装置２００の記憶部２３０に、応答に対応する音声データが記憶されているのか否かを確認するようにしても良いし、サーバ装置２００とは別個の記憶装置（例えば、他のサーバ装置の記憶部や、応答に対応する音声データの要求を送信した端末装置１００とは別の端末装置１００の記憶部１５０）に、応答に対応する音声データが記憶されているのか否かを確認するようにしても良い。

【0041】

そして、応答に対応する音声データが記憶されているならば、音声データ送信処理部２１２は、この記憶された音声データを送信する。一方、応答に対応する音声データが記憶されていないならば、音声データ送信処理部２１２は、応答に対応する音声データの作成の要求を音声データ作成装置３００に通信部２２０により送信し、応答に対応する音声データを音声データ作成装置３００から通信部２２０により受信し、この受信した音声データを端末装置１００に通信部２２０により送信する。応答に対応する音声データの作成の要求には、応答に対応するテキストデータが含まれており、音声データ作成装置３００は、このテキストデータに対応する音声データをサーバ装置２００に送信する。

【0042】

【0043】

記憶処理部２１３は、音声データ作成装置３００から受信した音声データを記憶する。このとき、音声データ送信処理部２１２は、サーバ装置２００の記憶部２３０に、音声データ作成装置３００から受信した音声データを記憶するようにしても良いし、サーバ装置２００とは別個の記憶装置に、音声データ作成装置３００から受信した音声データを記憶するようにしても良い。このため、本実施例では、記憶される音声データの種類を増やすことが可能であり、音声データ作成装置に音声データの作成の要求を行う回数をより抑制することが可能である。

【0044】

例えば、端末装置１００は複数であるとすると良い。このようにすることで、サーバ装置には、多くの端末装置から要求された音声データが記憶されることになり、記憶される音声データの種類をより増やすことが可能になる。

【0045】

記憶処理部２１３は、音声データ作成装置３００から音声データを受信したときに、この受信した音声データを記憶するためにかかるコストを含む第１のコストと、この受信した音声データを音声データ作成装置３００により作成するためにかかるコストを含む第２のコストと、を比較し、第１のコストが第２のコストより低いときのみ、この受信した音声データを記憶するようにしても良い。このようにすることで、全体でかかるコストを考慮した上で、音声データ作成装置を使用するのか否かを決定することが可能になり、結果、全体でかかるコストを抑制することが可能になる。

【0046】

音声データを作成するサービスの中には、音声データの作成の料金を、音声データに変換されるテキストデータの量（例えば、テキストデータの文字数）に基づいて決定するサービスが存在する。そこで、第２のコストは、例えば、音声データ作成装置３００から受信したテキストデータの量（例えば、テキストデータの文字数）により決定されるようにすると良い。

【0047】

また、音声データを作成するサービスの中には、所定の期間（例えば、一か月）における音声データの作成の料金を、この所定の期間において音声データに変換されるテキストデータの量が所定の量に達するまではゼロにするサービスも存在する。そこで、所定期間における第２のコストは、例えば、当該所定の期間において音声データ作成装置３００から受信した音声データに対応するテキストデータの量が所定の量に達するまでは、ゼロであるようにすると良い。

【0048】

＜音声応答システムにおける処理動作＞
図７は、本実施例に係る音声応答システムにおける処理動作の一例を示す図である。図７の処理動作は、端末装置１００がユーザの発話の入力を音声入力部１２０により受けるごとに実行される。

【0049】

端末装置１００の応答作成部１１１が、入力されたユーザの発話に対する応答に対応するテキストデータを作成する（ステップＳ７０１）。端末装置１００の応答音声出力処理部１１２が、応答に対応する音声データが、端末装置１００の記憶部１５０に記憶されているのか否かを確認する（ステップＳ７０２）。応答に対応する音声データが記憶部１５０に記憶されているならば（ステップＳ７０２、ＹＥＳ）、端末装置１００の応答音声出力処理部１１２が、この記憶部１３０に記憶された音声データに基づいた音声を音声出力部１４０により出力する（ステップＳ７０３）。応答に対応する音声データが記憶部１５０に記憶されていないならば（ステップＳ７０２、ＮＯ）、端末装置１００の応答音声出力処理部１１２が、応答に対応する音声データの要求をサーバ装置２００に通信部１３０により送信する（ステップＳ７０４）。

【0050】

サーバ装置２００のテキストデータ受信処理部２１１が、応答に対応する音声データの要求を端末装置１００から通信部２２０により受信する（ステップ７０５）。サーバ装置２００の音声データ送信処理部２１２が、応答に対応する音声データが記憶されているのか否かを確認する（ステップＳ７０６）。応答データに対応する音声データが記憶されているならば（ステップＳ７０６、ＹＥＳ）、サーバ装置２００の音声データ送信処理部２１２は、この記憶された音声データを端末装置１００に通信部２２０により送信する（ステップＳ７０７）。応答に対応する音声データが記憶されていないならば（ステップＳ７０６、ＮＯ）、サーバ装置２００の音声データ送信処理部２１２が、応答に対応する音声データの作成の要求を音声データ作成装置３００に送信する（ステップＳ７０８）。

【0051】

音声データ作成装置３００が、応答に対応する音声データの作成の要求をサーバ装置２００から受信し、応答に対応する音声データをサーバ装置２００に送信する（ステップＳ７０９）。

【0052】

サーバ装置２００の音声データ送信処理部２１２が、応答に対応する音声データを音声データ作成装置３００から通信部２２０により受信し、この受信した音声データを端末装置１００に通信部２２０により送信し、記憶処理部２１３は、この受信した音声データを記憶する（ステップ７１０）。

【0053】

端末装置１００の応答音声出力処理部１１２は、応答に対応する音声データをサーバ装置２００から通信部１３０により受信し、この受信した音声データに基づいた音声を音声出力部１４０により出力し、記憶処理部１１３は、この受信した音声データを記憶部１５０に記憶する（ステップＳ７１１）。

【0054】

以上、本発明の好適な実施の形態により本発明を説明した。ここでは特定の具体例を示して本発明を説明したが、特許請求の範囲に記載した本発明の趣旨および範囲から逸脱することなく、これら具体例に様々な修正および変更が可能である。

【符号の説明】

【0055】

１００端末装置
１１０制御部
１１１応答作成部
１１２応答音声出力処理部
１１３記憶処理部
１２０音声入力部
１３０通信部
１４０音声出力部
１５０記憶部
２００サーバ装置
２１０制御部
２１１テキストデータ受信処理部
２１２音声データ送信処理部
２１３記憶処理部
２２０通信部
２３０記憶部
３００音声データ作成装置

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

【図7】

IP Force 特許公報掲載プロジェクト 2022.1.31 β版