(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-05-23
(45)【発行日】2023-05-31
(54)【発明の名称】音声再生システムおよびプログラム
(51)【国際特許分類】
G10L 19/00 20130101AFI20230524BHJP
G06F 3/16 20060101ALI20230524BHJP
G10L 25/66 20130101ALN20230524BHJP
【FI】
G10L19/00 312E
G06F3/16 540
G10L25/66
(21)【出願番号】P 2018217272
(22)【出願日】2018-11-20
【審査請求日】2021-07-27
(73)【特許権者】
【識別番号】000220262
【氏名又は名称】東京瓦斯株式会社
(74)【代理人】
【識別番号】100104880
【氏名又は名称】古部 次郎
(74)【代理人】
【識別番号】100125346
【氏名又は名称】尾形 文雄
(74)【代理人】
【識別番号】100166981
【氏名又は名称】砂田 岳彦
(72)【発明者】
【氏名】松本 遥香
(72)【発明者】
【氏名】町田 智治
(72)【発明者】
【氏名】宮本 登
【審査官】菊池 智紀
(56)【参考文献】
【文献】特開2010-028515(JP,A)
【文献】特開2013-034057(JP,A)
【文献】特開平06-334457(JP,A)
【文献】特開2003-345399(JP,A)
【文献】特開2003-345375(JP,A)
【文献】特開2012-029099(JP,A)
【文献】特開2014-064093(JP,A)
【文献】特開2006-038705(JP,A)
【文献】特開2007-327993(JP,A)
【文献】特開2007-003835(JP,A)
【文献】特開2017-192457(JP,A)
【文献】特開2020-064151(JP,A)
【文献】山崎信行 他,"パーソナルロボットのためのアクティブインタフェースの設計と実装",日本ロボット学会誌,1996年04月15日,Vol.14, No.3,pp.461-469
【文献】小暮計貴 他,"周囲の雑音やユーザーの聞き返しに基づいて音量調節を行う音声対話システム",情報処理学会研究報告,2014年05月17日,Vol.2014-MUS-103, No.28,pp.1-5
(58)【調査した分野】(Int.Cl.,DB名)
G10L 13/00-13/10,19/00
G06F 3/16
H04M 1/00- 1/82
H04B 7/24- 7/26
H04W 4/00-99/00
(57)【特許請求の範囲】
【請求項1】
送信された音声を受信するロボットが、当該送信された音声の再生を行う再生システムであり、
前記送信された音声の聞き手の再生操作に基づき、当該送信された音声の再生を行う再生手段と、
前記ロボットに向かって話しかけた前記聞き手の音声を取得するとともに、前記再生手段により前記送信された音声が再生されている際に当該聞き手が発した音を含む当該ロボットの周囲の音を取得する取得手段と、
前記取得手段が取得した前記聞き手の音声および前記ロボットの周囲の音に基づく、前記再生手段により前記送信された音声の再生を行うときの当該聞き手の状態および当該ロボットの周囲の状態から、前記再生手段で音声の再生を行う条件である再生条件を決定する決定手段と、
を有し、
前記決定手段は、前記取得手段が取得した前記聞き手の音声および前記ロボットの周囲の音のうちの当該聞き手の健康状態に関する音に応じて、前記再生条件を変更することを特徴とす
る音声再生システム。
【請求項2】
送信された音声を受信するロボットが、当該送信された音声の再生を行うプログラムであり、
コンピュータに、
前記送信された音声の聞き手の再生操作に基づき、当該送信された音声の再生を行う再生機能と、
前記ロボットに向かって話しかけた前記聞き手の音声を取得するとともに、前記再生機能により前記送信された音声が再生されている際に当該聞き手が発した音を含む当該ロボットの周囲の音を取得する取得機能と、
前記取得機能が取得した前記聞き手の音声および前記ロボットの周囲の音に基づく、前記再生機能により前記送信された音声の再生を行うときの当該聞き手の
状態および当該ロボットの周囲の
状態から、前記再生機能で音声の再生を行う条件である再生条件を決定する決定機能と、
前記取得機能が取得した前記聞き手の音声および前記ロボットの周囲の音のうちの当該聞き手の健康状態に関する音に応じて、前記再生条件を変更する変更機能と、
を実現させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声再生システム、プログラムに関する。
【背景技術】
【0002】
音声を録音し、録音した音声を別の人物が再生することでコミュニケーションを図る装置が存在する。
【0003】
特許文献1に記載の情報処理装置では、変化判定部は、キー情報と、再生対象である楽曲データの楽曲テンポとに基づいて、再生対象である楽曲データの再生テンポを変更するかどうかを判定する。テンポ変更予告部は、変化判定部により再生テンポを変更すると判定された場合、その変更をユーザに予告する。検索結果出力部は、再生対象である楽曲データの再生テンポを、いまの再生テンポから、キー情報が表す再生テンポに変更し、その再生テンポで再生対象である楽曲データを再生する。
【0004】
また、特許文献2に記載の音響再生装置は、撮像部に設けられたカメラにおいて観覧者の聴取空間を撮像し、このカメラにおいて撮像された画像データに基づいて観覧者の聴取位置を検出する。そして、検出結果に基づいて信号処理部において信号処理を行う際のフィルタ係数を算出し、算出されたフィルタ係数により音響データに信号処理を施して、SPアレイシステムに出力する。また、観覧者の聴取位置の変化を検出し、変化に合わせてフィルタ係数を変更する。
【先行技術文献】
【特許文献】
【0005】
【文献】特開2007-58048号公報
【文献】国際公開第2006/057131号
【発明の概要】
【発明が解決しようとする課題】
【0006】
音声の再生を行う際に、この音声を聞く聞き手の聴力が弱かったり、周囲が騒がしい場合など、聞き取りにくい場合がある。ところがこのような、聞き手の身体状態や周囲の状況は現状では考慮されていない。
本発明の目的は、聞き手の身体状態や周囲の状況を加味して音声の再生条件を決定する音声再生システム等を提供することを目的とする。
【課題を解決するための手段】
【0007】
かくして本発明によれば、送信された音声を受信するロボットが、送信された音声の再生を行う再生システムであり、送信された音声の聞き手の再生操作に基づき、送信された音声の再生を行う再生手段と、ロボットに向かって話しかけた聞き手の音声を取得するとともに、再生手段により送信された音声が再生されている際に聞き手が発した音を含むロボットの周囲の音を取得する取得手段と、取得手段が取得した聞き手の音声およびロボットの周囲の音に基づく、再生手段により送信された音声の再生を行うときの聞き手の状態およびロボットの周囲の状態から、再生手段で音声の再生を行う条件である再生条件を決定する決定手段と、を有する音声再生システムが提供される。
【0008】
ここで、決定手段は、取得手段が取得した聞き手の音声およびロボットの周囲の音のうちの聞き手の健康状態に関する音に応じて、再生条件を変更するようにすることができる。この場合、風邪等に罹患している聞き手が音声を聞きやすくなる。
【0009】
さらに、本発明によれば、送信された音声を受信するロボットが、送信された音声の再生を行うプログラムであり、コンピュータに、送信された音声の聞き手の再生操作に基づき、送信された音声の再生を行う再生機能と、ロボットに向かって話しかけた聞き手の音声を取得するとともに、再生機能により送信された音声が再生されている際に聞き手が発した音を含むロボットの周囲の音を取得する取得機能と、取得機能が取得した聞き手の音声およびロボットの周囲の音に基づく、再生機能により送信された音声の再生を行うときの聞き手の状態およびロボットの周囲の状態から、再生機能で音声の再生を行う条件である再生条件を決定する決定機能と、取得機能が取得した聞き手の音声およびロボットの周囲の音のうちの聞き手の健康状態に関する音に応じて、再生条件を変更する変更機能と、を実現させるためのプログラムが提供される。
【発明の効果】
【0010】
本発明によれば、周囲の状況だけでなく、聞き手の健康状態を加味して音声の再生条件を決定する音声再生システム等を提供することができる。
【図面の簡単な説明】
【0011】
【
図1】本実施の形態における音声再生システムの構成例を示す図である。
【
図2】端末装置をロボットとした場合について説明した図である。
【
図3】音声再生システムの概略動作の例について示した図である。
【
図4】音声再生システムの機能構成例を示したブロック図である。
【
図5】本実施形態の音声再生システムの動作の例について説明したフローチャートである。
【
図6】ユーザの年齢を推定する方法の一例を示した図である。
【
図7】(a)~(b)は、音声の周波数変換について示した図である。
【
図8】(a)~(b)は、ユーザの健康状態を推定する方法の第1の例を示した図である。
【
図9】(a)~(c)は、ユーザの健康状態を推定する方法の第2の例を示した図である。
【発明を実施するための形態】
【0012】
以下、添付図面を参照して、本発明の実施の形態について詳細に説明する。
【0013】
<音声再生システム1全体の説明>
図1は、本実施の形態における音声再生システム1の構成例を示す図である。
図示するように本実施の形態の音声再生システム1は、携帯端末20と、端末装置30とが、ネットワーク70およびアクセスポイント90を介して接続されることにより構成されている。
図1では、携帯端末20は、1つのみ示したが、個数はいくつでもよい。
【0014】
携帯端末20は、例えば、モバイルコンピュータ、携帯電話、スマートフォン、タブレット等のモバイル端末である。携帯端末20は、無線通信を行うためにアクセスポイント90に接続する。そして、携帯端末20は、アクセスポイント90を介して、有線で通信を行うネットワーク70に接続する。
【0015】
携帯端末20は、演算手段であるCPU(Central Processing Unit)と、記憶手段であるメインメモリを備える。ここで、CPUは、OS(基本ソフトウェア)やアプリ(応用ソフトウェア)等の各種ソフトウェアを実行する。また、メインメモリは、各種ソフトウェアやその実行に用いるデータ等を記憶する記憶領域である。さらに、携帯端末20は、外部との通信を行うための通信インタフェース(以下、「通信I/F」と表記する)と、ビデオメモリやディスプレイ等からなる表示機構と、入力ボタン、タッチパネル、キーボード等の入力機構とを備える。そして、携帯端末20は、音声の出力を行うスピーカと、音声の入力を行うマイクロフォンとを備える。
【0016】
端末装置30は、例えば、ロボットとすることができる。このロボットは、ロボットを所有するユーザの住居に置かれる。
図2は、端末装置30をロボットとした場合について説明した図である。
図2に示した、ロボットとしての端末装置30は、歩行等を行うことで移動する機能を有する移動式としてもよいが、移動しない非移動式としてもよい。
端末装置30は、送信情報の送信および受信を行う通信アンテナ301と、音声を取得するマイクロフォン302と、音声等の音を出力するスピーカ303と、ユーザが操作を行う操作ボタン304と、端末装置30の全体の制御を行う制御部305とを備える。また、操作ボタン304は、録音を行う録音ボタン304aと、送られた送信情報を再生する再生ボタン304bと、端末装置30の設定などを行うためのメニューボタン304cとを備える。
【0017】
ネットワーク70は、携帯端末20および端末装置30の情報通信に用いられる通信手段であり、例えば、インターネットである。
【0018】
アクセスポイント90は、有線で通信を行うネットワーク70に対して、無線通信回線を利用して無線通信を行う機器である。アクセスポイント90は、携帯端末20や端末装置30とネットワーク70との間の情報の送受信を媒介する。
無線通信回線の種類としては、携帯電話回線、PHS(Personal Handy-phone System)回線、Wi-Fi(Wireless Fidelity)、Bluetooth(登録商標)、ZigBee、UWB(Ultra Wideband)等の各回線が使用可能である。
【0019】
<音声再生システム1の動作の概略説明>
図3は、音声再生システム1の概略動作の例について示した図である。
まず、端末装置30を所有するユーザAが、送信情報を作成する(1A)。送信情報は、端末装置30と携帯端末20との間で、やりとりを行う際に用いられる電子情報である。送信情報は、詳しくは後述するが、音声の情報である。ユーザAは、携帯端末20を所有するユーザBへのメッセージを、音声により作成する。なお、ユーザAとユーザBとは、予め定められた人物であり、所定の交友関係がある。例えば、親子の関係であったり、友人同士の関係である。
【0020】
音声の情報は、ユーザAが、端末装置30に向かって話しかけ、この際に、マイクロフォン302により音声を取得し、録音を行うことで、作成することができる。具体的には、ユーザAは、例えば、端末装置30に対し相対する位置に自らの顔を向ける。そして、ユーザAが、操作ボタン304の録音ボタン304aを押下すると、押下している間だけマイクロフォン302により、録音が行われる。録音を停止したい場合は、録音ボタン304aから手を離せばよい。そして、ユーザAは、録音ボタン304aを押下している間に、自らの音声によりユーザBに対し伝えたい内容を話す。録音した音声の情報は、制御部305のメモリに保存される。
【0021】
そして、制御部305は、この音声の情報を送信情報として、携帯端末20に対し送信する。送信情報は、通信アンテナ301、アクセスポイント90、ネットワーク70を介し、携帯端末20に送られる(1B)。
携帯端末20では、音声再生システム1を実現するための専用のアプリが動作しており、この送信情報を、通信I/Fが取得する。CPUは、この送信情報をメモリに保存する(1C)。またこのとき、ロボットにLEDなどからなる発光源を別途設け、この発光源を点滅等させることで、ユーザAから送信情報が到着した旨を、ユーザBに対し知らせてもよい。また、ユーザAから送信情報が到着した旨の案内を、着信音や音声等で出力してもよい。
【0022】
ユーザBは、送信情報の再生を行うことができる。具体的には、ユーザBが、携帯端末20のタッチパネル等の入力機構において、再生ボタン等を押下する。これにより、ユーザAから送信された音声が、メモリから読み出され、スピーカから出力される(1D)。これにより、ユーザBは、ユーザAから送信されたメッセージを聞くことができる。
【0023】
そして、ユーザBは、ユーザAへ返信を行うための送信情報を作成する(1E)。この送信情報の作成方法は、上述したユーザAの場合で説明した方法と同様である。
【0024】
そして、携帯端末20のCPUは、この音声の情報を送信情報として、端末装置30に対し送信する(1F)。送信情報は、通信I/F、アクセスポイント90、ネットワーク70を介し、端末装置30に送られる。
端末装置30では、この送信情報を、通信アンテナ301で受け、制御部305が取得して、メモリに記憶する(1G)。ユーザAの操作により、ユーザBから送られた送信情報をメモリから読み出し、再生を行う(1H)。
そして、以下、同様の動作が繰り返される。即ち、ユーザAとユーザBとの間で、送信情報のやりとりが行われる。
【0025】
次に、本実施の形態の音声再生システム1の詳細な機能構成および動作について説明する。
【0026】
<音声再生システム1の機能構成の説明>
図4は、音声再生システム1の機能構成例を示したブロック図である。
なおここでは、音声再生システム1が有する種々の機能のうち本実施の形態に関係するものを選択して図示している。
音声再生システム1において、携帯端末20は、情報の送受信を行う送受信部21と、画像の表示を行う表示部22と、情報を入力する入力部23と、音声を取得する音声出力部24とを備える。
【0027】
送受信部21は、例えば、通信I/Fであり、アクセスポイント90およびネットワーク70を介し、端末装置30と情報の送受信を行う。
【0028】
表示部22は、各種情報が表示される表示機構であり、例えば、タッチパネル等のディスプレイである。
入力部23は、テキストや音声等の入力を行う入力機構であり、例えば、上述したタッチパネルや、入力ボタン・キーボード等である。また、入力部23は、ユーザBの音声を入力する入力機構であり、例えば、マイクロフォンである。
音声出力部24は、音声の出力を行うスピーカである。
【0029】
端末装置30は、送信情報の送受信を行う送受信部31と、送信情報を記憶する記憶部32と、音声の取得を行う取得部33と、音声を再生する再生部34と、音の分析を行う分析部35と、音声の再生の条件を決定する決定部36と、ユーザAの操作を受け付ける操作部37と、音声の再生の制御を行う再生制御部38とを備える。
【0030】
送受信部31は、携帯端末20を所有するユーザBからの送信情報を受信する。また、送受信部31は、ユーザAからユーザBへの送信情報を送信する。送受信部31は、例えば、通信I/Fであり、制御部305に含まれる。また、通信アンテナ301もこれに含まれる。送受信部31は、アクセスポイント90およびネットワーク70を介し、端末装置30および携帯端末20の間で送信情報の送受信を行う。
【0031】
記憶部32は、受信された送信情報を記憶する。また、記憶部32は、必要な場合にこれを出力する。記憶部32は、例えば、メモリ、HDD(Hard Disk Drive)、SSD(Solid State Drive)などであり、制御部305に含まれる。
【0032】
取得部33は、取得手段の一例であり、音声等の音を取得する。取得部33は、マイクロフォン302に対応する。マイクロフォンの種類としては、ダイナミック型、コンデンサ型等、既存の種々のものを用いてよい。また、マイクロフォンとして、無指向性のMEMS(Micro Electro Mechanical Systems)型マイクロフォンであることが好ましい。
再生部34は、再生手段の一例であり、ユーザBから送信された音声の再生を行う。再生部34は、スピーカ303に対応する。
【0033】
分析部35は、分析手段の一例であり、音声の聞き手の状態と、再生部34により音声の再生を行うときの自装置の周囲の状態と、を分析する。この場合、分析部35は、音声の聞き手の状態として、ユーザAの状態を分析する。
決定部36は、決定手段の一例であり、分析部35による分析の結果から、再生部34で音声の再生を行う条件である再生条件を決定する。再生条件は、詳しくは後述するが、音量の調整、再生の速度および周波数変換の少なくとも一つである。
分析部35および決定部36は、例えば、CPUであり、制御部305に含まれる。
【0034】
操作部37は、録音や再生を行うためのユーザAによる操作を受け付ける。操作部37は、操作ボタン304に対応する。また、操作部37は、キーボードやマウス等で構成されていてもよい。
再生制御部38は、再生部34で音声の再生を行う際に、決定部36により決定された再生条件により、音声の再生の制御を行う。再生制御部38は、例えば、CPUであり、制御部305に含まれる。
【0035】
<音声再生システム1の動作の説明>
次に、本実施の形態の音声再生システム1の動作について、より詳細に説明を行う。
図5は、本実施形態の音声再生システム1の動作の例について説明したフローチャートである。
まず、ユーザAが、端末装置30の操作部37を操作し、取得部33を使用して、音声の録音を行う(ステップ101)。音声の情報は、送信情報として記憶部32に記憶される(ステップ102)。さらに、送受信部31が、送信情報を携帯端末20に向け、送信する(ステップ103)。なお、送信情報には、送信情報を作成した際の日時の情報等を含めてもよい。
【0036】
端末装置30から送信された送信情報は、アクセスポイント90およびネットワーク70を介して、携帯端末20に送られる。携帯端末20では、送信情報を、送受信部21が取得する(ステップ104)。そして、携帯端末20のCPUは、この送信情報をメモリに保存する(ステップ105)。
【0037】
一方、ユーザBは、携帯端末20の表示部22および入力部23に対応するタッチパネル等の入力機構において、専用アプリから再生ボタン等を押下する。その結果、携帯端末20の音声出力部24であるスピーカにより、ユーザAから送信された音声が、再生される(ステップ106)。
【0038】
そして、ユーザBは、ユーザAへ返信を行うための送信情報を作成する(ステップ107)。この送信情報の作成方法は、ユーザAの場合で上述した方法と同様であり、入力部23に対応するマイクロフォンを使用して、ユーザBの音声を録音することで行う。録音した音声は、送信情報としてメモリに保存される(ステップ108)。
【0039】
そして、携帯端末20の送受信部21は、この音声の情報を送信情報として、端末装置30に対し送信する(ステップ109)。送信情報は、携帯端末20の送受信部21、アクセスポイント90、ネットワーク70を介し、端末装置30に送られる。
端末装置30では、送受信部31が、この送信情報を受信する(ステップ110)。そして、送られた送信情報は、記憶部32が記憶する(ステップ111)。
【0040】
さらに、端末装置30では、ユーザAが、操作部37を操作し、再生部34によりユーザBから返信された音声の再生を行う(ステップ112)。このとき、音声の再生の制御は、再生制御部38が行う。
そして、再生の際に、取得部33が、自装置の周囲の音を取得する(ステップ113)。さらに、分析部35が、自装置の周囲の音を基に、ユーザAの状態と、再生部34により音声の再生を行うときの自装置の周囲の状態とを分析する(ステップ114)。
【0041】
そして、決定部36は、分析部35による分析の結果から、再生部34で音声の再生を行う条件である再生条件を決定する(ステップ115)。これにより、次に再生部34で音声の再生を行う際に、この再生条件が適用される。
なお、詳しくは後述するが、ステップ114~ステップ115の処理は、ユーザAが録音した音声に基づき、ステップ102とステップ103の間で行われることがある。
【0042】
<分析部35および決定部36の動作の詳細説明>
次に、分析部35が、自装置の周囲の音を基に、ユーザAの状態と、再生部34により音声の再生を行うときの自装置の周囲の状態とを分析する方法について、詳細に説明を行う。また併せて、分析部35が分析した結果に応じて、決定部36が決定する再生条件について説明を行う。決定部36が決定する再生条件は、音量の調整、再生の速度および周波数変換の少なくとも一つである。
【0043】
(ユーザAの年齢の分析)
ここでは、分析部35は、ユーザAの音声の取得時に取得部33が取得したユーザAの音声から、ユーザAの状態として、ユーザAの年齢を推定する。そして、決定部36は、推定された年齢に応じて再生条件を変更する。
【0044】
図6は、ユーザAの年齢を推定する方法の一例を示した図である。
図6は、音声の周波数スペクトルについて示している。ここで、横軸は、周波数を表し、縦軸は、スペクトル強度を表す。即ち、周波数スペクトルは、音声に含まれる周波数成分について、周波数とその強度との関係を示している。
ここでは、音声について、40歳、50歳、60歳、70歳の人物の周波数スペクトルの一例を示している。図示するように、年齢が上昇するに従い、4kHz以上のスペクトル強度が増加することがわかる。実際には、4kHz以上のスペクトル強度が増加することで、音声が、よりかれた状態となる嗄声(させい)となる。
よって、分析部35は、周波数スペクトルのうち、4kHz以上のスペクトル強度を見ることで、ユーザAの年齢を推定することができる。
【0045】
そして、決定部36は、例えば、ユーザAの年齢が高いほど、再生する際の音量を大きくする。また、決定部36は、例えば、年齢が60歳以上と推定された場合は、再生の速度を遅くする。
さらに、決定部36は、例えば、年齢が60歳以上と推定された場合は、音声の周波数変換を行ってもよい。つまり、高齢者の場合は、低音域および中音域は聞こえるが、高音域が聞こえにくくなることが多い。そのため高音域の音について、中音域への周波数変換を行い、音声に高音域の音が含まれていても、聞こえるようにする。
【0046】
図7(a)~(b)は、音声の周波数変換について示した図である。
ここで、横軸は、周波数を示し、縦軸は、強度を示す。
このうち、
図7(a)は、音声の周波数変換として、周波数の圧縮を行った場合を示している。この場合、実線で示した音声の波形について、高音域として、4000Hz以上の周波数領域について、圧縮し、点線で示す波形にしている。
また、
図7(b)は、音声の周波数変換として、周波数の移行を行った場合を示している。この場合、実線で示した音声の波形について、高音域として、4000Hz以上の周波数領域について、中音域にスライド(移行)させ、点線で示す波形にしている。
このような音声の周波数変換を行うことで、本来聞こえない領域の音も聞こえるようになり、音声をより聞きやすくなる。
【0047】
(再生時におけるユーザAの音声の分析)
ここでは、分析部35は、音声の再生時に取得部33が取得した聞き手の音声の意味から、音声の聞き手の状態を分析する。そして、決定部36は、分析の結果に応じて再生条件を決定する。
ユーザBの音声を再生する際に、ユーザAの発話する音声を取得部33で取得する。つまり、再生される音声の音量が小さいような場合、ユーザAは、例えば、「えっ?」、「今、なんて言ったの?」等の音声を無意識に発することがある。また、ユーザAの聴力が弱くなっている場合も同様である。分析部35は、取得部33で取得したユーザAの音声から、このような聞き返すような意味を含む発話がなかったか否かを分析する。具体的には、分析部35は、取得部33で取得した音から、ユーザBの音声をできるだけ消去する。さらに、分析部35は、残った音にユーザAの音声が含まれる場合、聞き返すような意味を含む発話があるか否かを判断する。
【0048】
そして、決定部36は、このような発話があった場合は、再生する際の音量を大きくしたり、再生の速度を遅くする。さらに、決定部36は、音声の周波数変換を行ってもよい。
【0049】
(ユーザAの健康状態の分析)
ここでは、分析部35は、音声の取得時および/または音声の再生時に、取得部33が取得したユーザAの健康状態に関する音を識別し、決定部36は、識別された音に応じて再生条件を変更する。
【0050】
図8(a)~(b)は、ユーザAの健康状態を推定する方法の第1の例を示した図である。
図8(a)は、ユーザAが咳をしたときの音の波形を示している。また、
図8(b)は、ユーザAがくしゃみをしたときの音の波形を示している。両図は、ともに横軸が時間を表し、縦軸が、音に含まれる周波数成分を示している。
図8(a)に示す咳の場合、30kHz付近までの周波数成分を含み、そして、この周波数成分が含まれる時間は、約0.1sと短い。また、
図8(b)に示すくしゃみの場合、45kHz付近までの周波数成分を含み、そして、この周波数成分が含まれる時間は、同様に約0.1sと短い。
よって、この特徴により、分析部35は、ユーザAが、咳やくしゃみをしたか否かを判断できる。そして、この回数が、予め定められた時間内で予め定められた回数以上検出されたときは、分析部35は、ユーザAが風邪等に罹患していると判断する。つまり、この場合、分析部35は、健康状態に関する音として、咳およびくしゃみの音を識別する。
【0051】
図9(a)~(c)は、ユーザAの健康状態を推定する方法の第2の例を示した図である。
ここで、横軸は、時間を示し、縦軸は、強さを示す。
図9(a)で示す音声の信号は、
図9(b)で示す基本周波数と、
図9(c)で示す非周期成分の2つに分けることができる。基本周波数は、声の高さを表す。例えば、男声の基本周波数は、100Hz~200Hzであり、女声の基本周波数は、250Hz~500Hzである。また、非周期成分は、声色を表す。また、非周期成分は、声のかすれについて表し、非周期成分が小さいほどかすれは小さく、大きいほどかすれが大きくなる。
よって、分析部35は、取得した音声を基本周波数と非周期成分の2つに分け、非周期成分の大きさを分析し、ユーザAの音声にかすれがあるか否かを判断する。そして、分析部35は、かすれが大きいと判断したときは、ユーザAが風邪等に罹患していると判断する。つまり、この場合、分析部35は、健康状態に関する音として、音声のかすれを識別する。
【0052】
そして、決定部36は、ユーザAが風邪等に罹患していると判断された場合は、再生する際の音量を大きくしたり、再生の速度を遅くする。さらに、決定部36は、音声の周波数変換を行ってもよい。
【0053】
(環境音の分析)
ここでは、分析部35は、自装置の周囲の状態として、音声の取得時および/または音声の再生時に取得された自装置の周囲の環境音を識別し、決定部36は、環境音に応じて再生条件を変更する。
この環境音は、ユーザAの周囲から聞こえる音であり、雨の音、波の音、風の音、鳥や蝉の鳴き声、雑踏の音、自動車、電車、飛行機が通過する音等である。そして、この環境音が大きい場合、ユーザAは、音声を聞き取りにくくなる。
よって、分析部35は、環境音の音圧を分析する。
【0054】
そして、決定部36は、環境音の音圧が大きいと判断された場合は、それに応じて再生する際の音量を大きくしたり、再生の速度を遅くする。
【0055】
<変形例>
本実施の形態では、決定部36は、取得部33が取得した音声に基づき、自装置の周辺の状況を把握し、把握した状況に基づき、設定を行う。
例えば、決定部36は、時間帯に合わせ、音声を再生する際の音量を設定する。例えば、夜間には、音量を小さくする。
また、決定部36は、取得部33が取得した音声に基づき、自装置の周辺の状況を把握し、把握した状況に基づき、設定を行ってもよい。例えば、自装置の周辺が騒がしいときは、音量を大きくする。
【0056】
以上詳述した音声再生システム1によれば、聞き手の身体状態や周囲の状況を加味して音声の再生条件を決定する。そのため、聞き手にとって、音声が、より聞き取りやすい音声再生システム1を提供することができる。
【0057】
また、以上詳述した形態では、音声再生システム1は、携帯端末20および端末装置30が、ネットワーク70、アクセスポイント90を介して接続されることにより構成されていたが、端末装置30だけでも音声再生システムであるとして捉えることができる。また端末装置30で行う処理は、携帯端末20でも同様のことができる。よって携帯端末20を音声再生システムとして捉えることもできる。
さらに、上述した例では、端末装置30は、ロボットである例を示したが、これに限られるものではない。例えば、モバイルコンピュータ、携帯電話、スマートフォン、タブレット等のモバイル端末であってもよく、デスクトップコンピュータであってもよい。
さらに、上述した例では、端末装置30と携帯端末20とは、ネットワーク70、アクセスポイント90を介してピアツーピア接続していたが、これに限られるものではなく、サーバを介して接続していてもよい。なおこの場合、端末装置30で行う処理は、サーバでも同様のことができる。よって、このサーバを再生システムとして捉えることもできる。
【0058】
<プログラムの説明>
ここで、以上説明を行った本実施の形態における端末装置30が行う処理は、例えば、アプリケーションソフトウェア等のプログラムとして用意される。そして、この処理は、ソフトウェアとハードウェア資源とが協働することにより実現される。即ち、端末装置30に設けられたコンピュータ内部の図示しないCPUが、上述した各機能を実現するプログラムを実行し、これらの各機能を実現させる。
【0059】
よって、本実施の形態で、端末装置30が行う処理は、コンピュータに、音声を取得する取得機能と、送信された音声の再生を行う再生機能と、音声の聞き手の状態と、再生機能により音声の再生を行うときの自装置の周囲の状態と、を分析する分析機能と、分析機能による分析の結果から、再生機能で音声の再生を行う条件である再生条件を決定する決定機能と、を実現させるためのプログラムとして捉えることもできる。
【0060】
なお、本実施の形態を実現するプログラムは、通信手段により提供することはもちろんCD-ROM等の記録媒体に格納して提供することも可能である。
【0061】
以上、本実施の形態について説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、種々の変更または改良を加えたものも、本発明の技術的範囲に含まれることは、特許請求の範囲の記載から明らかである。
【符号の説明】
【0062】
1…音声再生システム、20…携帯端末、30…端末装置、31…送受信部、32…記憶部、33…取得部、34…再生部、35…分析部、36…決定部、37…操作部、38…再生制御部