特開2021-175004(P2021-175004A)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ サクサ株式会社の特許一覧

特開2021-175004電話制御装置および体調判定プログラム
<>
  • 特開2021175004-電話制御装置および体調判定プログラム 図000003
  • 特開2021175004-電話制御装置および体調判定プログラム 図000004
  • 特開2021175004-電話制御装置および体調判定プログラム 図000005
  • 特開2021175004-電話制御装置および体調判定プログラム 図000006
  • 特開2021175004-電話制御装置および体調判定プログラム 図000007
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】特開2021-175004(P2021-175004A)
(43)【公開日】2021年11月1日
(54)【発明の名称】電話制御装置および体調判定プログラム
(51)【国際特許分類】
   H04M 3/42 20060101AFI20211004BHJP
   H04Q 3/58 20060101ALI20211004BHJP
   G10L 15/10 20060101ALI20211004BHJP
   G10L 17/00 20130101ALI20211004BHJP
【FI】
   H04M3/42 P
   H04Q3/58 101
   H04M3/42 R
   G10L15/10 500Z
   G10L17/00 200C
【審査請求】未請求
【請求項の数】7
【出願形態】OL
【全頁数】14
(21)【出願番号】特願2020-74611(P2020-74611)
(22)【出願日】2020年4月20日
(71)【出願人】
【識別番号】304020498
【氏名又は名称】サクサ株式会社
(74)【代理人】
【識別番号】100098394
【弁理士】
【氏名又は名称】山川 茂樹
(74)【代理人】
【識別番号】100064621
【弁理士】
【氏名又は名称】山川 政樹
(72)【発明者】
【氏名】上家 聖来
(72)【発明者】
【氏名】浦山 慎太郎
(72)【発明者】
【氏名】佐藤 佑樹
(72)【発明者】
【氏名】浜野 幸浩
【テーマコード(参考)】
5K049
5K201
【Fターム(参考)】
5K049BB04
5K049BB12
5K049FF01
5K049KK02
5K049KK12
5K201BA19
5K201BC19
5K201CA08
5K201DC02
5K201DC05
5K201EC03
5K201ED01
5K201EF09
(57)【要約】
【課題】利用者の音声を音声認識して得られた認識結果に基づいて、利用者の体調を判定する。
【解決手段】記憶部15が、予め利用者音声を音声認識部14で音声認識して得られた認識結果を基準認識結果15Aとして記憶しておき、制御部16が、音声認識部14で得られた新たな利用者音声に関する新たな認識結果を基準認識結果15Aと比較し、得られた比較結果に基づいて利用者に関する体調の良否を判定する。
【選択図】 図1
【特許請求の範囲】
【請求項1】
複数の電話端末を電話網に交換接続する電話制御装置であって、
前記電話端末から出力された、当該電話端末を利用する利用者の利用者音声を音声認識してテキストデータに変換する音声認識部と、
予め前記利用者音声を前記音声認識部で音声認識して得られた認識結果を基準認識結果として記憶する記憶部と、
前記音声認識部で得られた新たな利用者音声に関する新たな認識結果を前記基準認識結果と比較し、得られた比較結果に基づいて前記利用者に関する体調の良否を判定する制御部とを備えることを特徴とする電話制御装置。
【請求項2】
請求項1に記載の電話制御装置において、
前記基準認識結果および前記新たな認識結果は、前記利用者音声を前記音声認識部で音声認識して得られたテキストデータの正誤率からなり、
前記制御部は、前記基準認識結果の正誤率と前記新たな認識結果の正誤率との差分が所定の許容値以上の場合、前記利用者の体調を不良と判定することを特徴とする電話制御装置。
【請求項3】
請求項2に記載の電話制御装置において、
前記基準認識結果および前記新たな認識結果は、前記利用者音声のうち使用頻度の高い特定のフレーズを前記音声認識部で音声認識して得られたテキストデータの正誤率からなることを特徴とする電話制御装置。
【請求項4】
請求項1に記載の電話制御装置において、
前記基準認識結果および前記新たな認識結果は、前記利用者音声を前記音声認識部で音声認識して得られた声紋データからなり、
前記制御部は、前記新たな認識結果の声紋データと前記基準認識結果の声紋データとの整合度が所定の判定値より低い場合、前記利用者の体調を不良と判定することを特徴とする電話制御装置。
【請求項5】
請求項1に記載の電話制御装置において、
前記基準認識結果および前記新たな認識結果は、予め設定された対象フレーズの検知頻度からなり、
前記制御部は、前記新たな認識結果の検知頻度と前記基準認識結果の検知頻度の差分が所定の許容値以上の場合、前記利用者の体調を不良と判定することを特徴とする電話制御装置。
【請求項6】
請求項1〜請求項5のいずれかに記載の電話制御装置において、
前記制御部は、得られた判定結果を、前記利用者の管理者の電話端末へ通知し、または、前記利用者管理者のに対して予め設定されているメールアドレスへ電子メールで通知することを特徴とする電話制御装置。
【請求項7】
音声認識部、記憶部、および制御部を有する装置で実行される体調判定プログラムであって、
前記音声認識部が、入力された利用者の利用者音声を音声認識してテキストデータに変換するステップと、
前記記憶部が、予め前記利用者音声を前記音声認識部で音声認識して得られた認識結果を基準認識結果として記憶するステップと、
前記制御部が、前記音声認識部で得られた新たな利用者音声に関する新たな認識結果を前記基準認識結果と比較し、得られた比較結果に基づいて前記利用者に関する体調の良否を判定するステップと
を実行させることを特徴とする体調判定プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、利用者の音声を音声認識して得られた認識結果に基づいて、利用者の体調を判定する体調判定技術に関する。
【背景技術】
【0002】
一般に、ビジネスホンシステムの主装置やPBXシステムのPBX装置などの電話制御装置では、音声通話の音声を認識してテキストデータに変換する音声認識機能を有しているものがある。
従来、このような音声認識機能を利用した技術として、配下に接続された電話端末を用いて利用者が音声通話した際、その通話音声を音声認識機能でテキストデータに変換し、音声通話の会話内容を文書で記録する技術が提案されている(例えば、特許文献1など参照)。また、通話音声を認識する際、通話回線の種別に応じて、通話回線に応じた音響モデルを用いて認識させることにより、認識率が改善されることが知られている(例えば、特許文献2など参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2006−303921号公報
【特許文献2】特開2000−284792号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
近年、電話制御装置の機能も多岐にわたり、電話制御装置の配下に接続された電話端末を利用する利用者に対して、個人的なサービスを提供する機能も検討されつつある。しかしながら、このような従来技術は、会話内容をテキストデータで記録したり、音声認識の精度を改善したりすることを目的としており、音声認識の結果に基づいて利用者への個人的なサービスを提供することはできない。
【0005】
本発明はこのような課題を解決するためのものであり、利用者の音声を音声認識して得られた認識結果に基づいて、利用者の体調を判定する体調判定技術を提供することを目的としている。
【課題を解決するための手段】
【0006】
このような目的を達成するために、本発明にかかる電話制御装置は、複数の電話端末を電話網に交換接続する電話制御装置であって、前記電話端末から出力された、当該電話端末を利用する利用者の利用者音声を音声認識してテキストデータに変換する音声認識部と、予め前記利用者音声を前記音声認識部で音声認識して得られた認識結果を基準認識結果として記憶する記憶部と、前記音声認識部で得られた新たな利用者音声に関する新たな認識結果を前記基準認識結果と比較し、得られた比較結果に基づいて前記利用者に関する体調の良否を判定する制御部とを備えている。
【0007】
また、本発明にかかる上記電話制御装置の一構成例は、前記基準認識結果および前記新たな認識結果が、前記利用者音声を前記音声認識部で音声認識して得られたテキストデータの正誤率からなり、前記制御部は、前記基準認識結果の正誤率と前記新たな認識結果の正誤率との差分が所定の許容値以上の場合、前記利用者の体調を不良と判定するようにしたものである。
【0008】
また、本発明にかかる上記電話制御装置の一構成例は、前記基準認識結果および前記新たな認識結果が、前記利用者音声のうち使用頻度の高い特定のフレーズを前記音声認識部で音声認識して得られたテキストデータの正誤率からなるものである。
【0009】
また、本発明にかかる上記電話制御装置の一構成例は、前記基準認識結果および前記新たな認識結果が、前記利用者音声を前記音声認識部で音声認識して得られた声紋データからなり、前記制御部は、前記新たな認識結果の声紋データと前記基準認識結果の声紋データとの整合度が所定の判定値より低い場合、前記利用者の体調を不良と判定するようにしたものである。
【0010】
また、本発明にかかる上記電話制御装置の一構成例は、前記基準認識結果および前記新たな認識結果が、予め設定された対象フレーズの検知頻度からなり、前記制御部は、前記新たな認識結果の検知頻度と前記基準認識結果の検知頻度の差分が所定の許容値以上の場合、前記利用者の体調を不良と判定するようにしたものである。
【0011】
また、本発明にかかる上記電話制御装置の一構成例は、前記制御部が、得られた判定結果を、前記利用者の管理者の電話端末へ通知し、または、前記利用者の管理者に対して予め設定されているメールアドレスへ電子メールで通知するようにしたものである。
【0012】
また、本発明にかかる体調判定プログラムは、音声認識部、記憶部、および制御部を有する装置で実行される体調判定プログラムであって、前記音声認識部が、入力された利用者の利用者音声を音声認識してテキストデータに変換するステップと、前記記憶部が、予め前記利用者音声を前記音声認識部で音声認識して得られた認識結果を基準認識結果として記憶するステップと、前記制御部が、前記音声認識部で得られた新たな利用者音声に関する新たな認識結果を前記基準認識結果と比較し、得られた比較結果に基づいて前記利用者に関する体調の良否を判定するステップとを実行させる。
【発明の効果】
【0013】
本発明によれば、利用者の利用者音声を音声認識して得られた認識結果に基づいて、利用者の体調を判定することができる。このため、電話制御装置において、音声認識の結果に基づいて利用者の健康に関する個人的なサービスを提供することが可能となる。また、医療関係者などの管理者に電子メールで利用者の体調不良を自動的に通知することができ、利用者の体調不良を早期に検知して最適な対応をとることが可能となる。
【図面の簡単な説明】
【0014】
図1】第1の実施の形態にかかる電話制御装置の構成を示すブロック図である。
図2】体調判定動作を示すシーケンス図である。
図3】第1の実施の形態にかかる体調判定処理を示すフローチャートである。
図4】第2の実施の形態にかかる体調判定処理を示すフローチャートである。
図5】第3の実施の形態にかかる体調判定処理を示すフローチャートである。
【発明を実施するための形態】
【0015】
次に、本発明の実施の形態について図面を参照して説明する。
[第1の実施の形態]
まず、図1を参照して、本発明の第1の実施の形態にかかる電話制御装置10について説明する。図1は、第1の実施の形態にかかる電話制御装置の構成を示すブロック図である。
この電話制御装置10は、ビジネスホンシステムの主装置やPBXシステムのPBX装置からなり、内線回線L2を介して配下に接続されている複数の電話端末20を、通信回線L1を介して電話網NWに交換接続する装置である。
【0016】
一般に、人の音声は、その人の体調によって変化する。例えば、風邪を引いた場合には喉が炎症して、通常よりしゃがれたりかすれたりする傾向がある。また、体調によって気分が変化するため、声が高く明るく大きくなったり、低く暗く小さくなったりと、音声が大きく変化する。また、脳梗塞など、脳に障害が発生した場合には、呂律が回らなくなるなど、音声が大きく変化する。
【0017】
一方、音声をテキストデータに変換する音声認識の認識結果は、人の音声に左右される。例えば、音声が小さくてはっきりしない場合、本来とは異なるテキストデータに変換されてしまい、正誤率が低下する。正誤率とは、ある音声の元のテキストデータと、音声認識して得られたテキストデータとを、文字や単語を単位として比較し、その正解率あるいは誤り率を算出したものである。
【0018】
本発明は、このような人の音声がその人の体調によって変化することに着目し、電話端末20を利用する利用者の音声を電話制御装置10で音声認識し、得られた認識結果を当該利用者の基準となる基準認識結果と比較し、得られた比較結果に基づいて利用者に関する体調の良否を判定するようにしたものである。
【0019】
[電話制御装置]
次に、図1を参照して、本実施の形態にかかる電話制御装置10の構成について詳細する。
図1に示すように、電話制御装置10は、主な回路構成として、網I/F11、内線I/F12、音声処理部13、音声認識部14、記憶部15、および制御部16を備えている。
【0020】
[網I/F]
網I/F11は、通信回線L1を介して電話網NWとの間でデータ通信を行うことにより、呼制御メッセージや音声データをやり取りする機能を有している。
以下では、電話網NWがIP(Internet Protocol)電話網、ISDN(Integrated Services Digital Network)網、携帯電話網などのデジタル電話網からなる場合を例として説明する。電話網NWについてはPSTN(Public Switched Telephone Network)網などのアナログ電話網であってもよい。アナログ電話網の場合、網I/F11は、呼制御メッセージや音声データに代えて呼制御信号や音声信号をアナログ電話網との間でやり取りする。
【0021】
[内線I/F]
内線I/F12は、内線回線L2を介して電話端末20との間でデータ通信を行うことにより、電話端末20で利用者が操作した内容を示す操作データ、電話端末20を制御するための制御データや、通話のための音声データをやり取りする機能を有している。
【0022】
[音声処理部]
音声処理部13は、網I/F11を介して電話網NWとやり取りする通話などの音声データと、内線I/F12を介して電話端末20とやり取りする通話などの音声データとを相互に変換する機能と、着信音などの各種の信号音を示す音声データを網I/F11や内線I/F12へ出力する機能とを有している。なお、音声処理部13については、制御部16の処理部により実現してもよい。
【0023】
[音声認識部]
音声認識部14は、音声処理部13でやり取りする音声(音声データ)を音声認識処理することにより、テキストデータに変換する機能と、当該音声の元のテキストデータと、当該音声を音声認識して得られたテキストデータとを、文字や単語を単位として比較し、その正解率あるいは誤り率からなる正誤率を算出する機能とを有している。音声認識する音声については、予め設定されている特定フレーズを用いればよい。例えば、利用者の音声通話で使用されやすい「サクサの○○ですが、××さんはいらっしゃいますか」などのフレーズを特定フレーズとして用いればよい。
【0024】
[記憶部]
記憶部15は、半導体メモリやハードディスクなどの記憶装置からなり、電話制御装置10の処理動作に用いる各種の処理データやプログラム15Pを記憶する機能を有している。
プログラム15Pは、制御部16のCPUと協働することにより、制御部16での呼制御処理や告知制御処理を実行するための各種処理部を実現するプログラムである。プログラム15Pは、電話制御装置10に接続された外部装置や記録媒体(ともに図示せず)から、予め読み込まれて記憶部15に保存される。
【0025】
[基準認識結果]
記憶部15で記憶する主な処理データとして、基準認識結果15Aがある。基準認識結果15Aは、予め設定されている特定フレーズに関する利用者の音声認識結果を、利用者ごとに予め算出して登録したものである。例えば、利用者の体調が良好である状態で、電話端末20で登録操作して、特定フレーズを数回繰り返して音声入力し、これら音声を音声認識部14で音声認識して得られた正誤率などの認識結果を、その電話端末20の内線番号と対応付けて基準認識結果15Aとして記憶部15に保存しておけばよい。
【0026】
[制御部]
制御部16は、CPUとその周辺回路を有し、CPUと記憶部15のプログラム15Pとを協働させることにより、呼制御処理や通話規制処理を実行するための各種処理部を実現する機能を有している。制御部16で実現する主な処理部として呼制御部16Aと体調判定部16Bがある。
[呼制御部]
呼制御部16Aは、網I/F11および通信回線L1を介して電話網NWとの間で呼制御メッセージや音声データをやり取りするとともに、内線I/F12および内線回線L2を介して電話端末20との間で制御データや音声データをやり取りすることにより、電話網NWを用いた、発信・着信・保留・転送などの一般的な各種の電話サービスを電話端末20に提供する機能を有している。
[体調判定部]
体調判定部16Bは、音声認識部14から出力された利用者の新たな利用者音声に関する新たな認識結果を、記憶部15から取得した当該利用者の基準認識結果と比較し、得られた比較結果に基づいて当該利用者に関する体調の良否を判定する機能と、得られた判定結果を当該利用者の電話端末20へ通知する機能と、利用者の上司や社内の保健師など予め設定されている管理者の電話端末に通知したり、メールアドレスへ電子メールで通知する機能とを有している。
【0027】
具体的には、体調判定部16Bは、基準認識結果および新たな認識結果として正誤率を用いる場合、新たな認識結果の正誤率が基準認識結果の正誤率より所定の許容値以上低い場合、すなわち、基準認識結果の正誤率と新たな認識結果の正誤率の差分が所定の許容値以上の場合に、利用者の体調を不良と判定するようにしてもよい。この際、許容値として10%を用いた場合には、新たな認識結果である正誤率が、基準認識結果である正誤率より、10%以上低い場合に、体調不良と判定される。これにより、正誤率のばらつきによる判定誤差を抑制することができる。なお、許容値として0%を用いてもよく、この場合には、新たな認識結果である正誤率が、基準認識結果である正誤率より低い場合に、体調不良と判定されることになる。許容値については、管理者あるいは各利用者が運用状況に応じて設定すればよい。
【0028】
体調判定に用いる利用者音声としては、電話網NWからの着信に応じた音声通話時や、電話網NWに対する発信に応じた音声通話時に、電話端末20から出力された利用者の利用者音声を用いればよい。また、体調判定用内線番号を用意しておき、利用者が自分の体調を判定したいときに、電話端末20から体調判定用内線番号への内線発信に応じて呼制御部16Aで自動応答して音声通話を開始し、電話端末20から出力された利用者の利用者音声に基づき、当該利用者の体調を判定するようにしてもよい。
【0029】
[第1の実施の形態の動作]
次に、図2を参照して、本実施の形態にかかる電話制御装置10の体調判定方法の動作について説明する。体調判定方法は、記憶部に記憶した体調判定プログラムにより実行することができる。図2は、体調判定動作を示すシーケンス図である。以下では、電話網NWからの着信に応じた音声通話において、電話端末20から出力された利用者の利用者音声に基づき、当該利用者の体調を判定する場合を例として説明する。
【0030】
相手電話装置30での発信操作に応じて電話網NWから着信要求メッセージが通知された場合(ステップS100)、電話制御装置10は、制御部16の呼制御部16Aにより、内線I/F12および内線回線L2を介して電話端末20へ着信要求メッセージを通知する(ステップS101)。
これにより、電話端末20で着信表示が行われ(ステップS102)、利用者の応答操作に応じて(ステップS103)、電話端末20から内線回線L2を介して電話制御装置10へ着信応答メッセージが返送される(ステップS104)。
【0031】
呼制御部16Aは、内線I/F12で受信された電話端末20からの着信応答メッセージに応じて、網I/F11から通信回線L1を介して電話網NWへ着信応答メッセージを返送する(ステップS105)。これにより、電話制御装置10を介して、電話網NWに接続された相手電話装置30と電話端末20との音声通話が開始される(ステップS106)。
【0032】
音声認識部14は、音声通話が開始された後、電話端末20から出力された利用者音声に関する音声データを音声処理部13から取得し(ステップS110)、音声認識を実行することにより、利用者音声をテキストデータに変換し、得られた認識結果、ここでは正誤率を計算する(ステップS111)。
体調判定部16Bは、音声認識部14で得られた正誤率を新たな認識結果として取得して(ステップS112)、利用者の体調を判定するための体調判定を行い(ステップS113)、得られた判定結果を記憶部15に一時保存する(ステップS114)。
【0033】
この後、電話端末20で終話操作が行われて(ステップS120)、相手電話装置30と電話端末20との音声通話が終話した場合(ステップS121)、体調判定部16Bは、記憶部15に保存しておいた判定結果を取得して(ステップS122)、電話端末20へ通知する(ステップS123)。これにより、電話端末20の表示画面に利用者の体調に関する判定結果が画面表示され(ステップS124)、利用者は自己の体調を把握することができる。
【0034】
[体調判定処理]
次に、図3を参照して、図2のステップS110−S113における体調判定処理について詳細に説明する。図3は、第1の実施の形態にかかる体調判定処理を示すフローチャートである。
以下では、音声認識部14で得られる認識結果が、予め設定されている特定フレーズに関する正誤率からなるものとし、記憶部15の基準認識結果15Aには、特定フレーズに関する基準正誤率が登録されている場合を例として説明する。なお、許容値Rthについては、予め記憶部15に設定されているものとする。
【0035】
まず、音声認識部14は、電話端末20から出力された利用者音声に関する音声データを音声処理部13から取得し(ステップS130)、音声認識を実行することにより、利用者音声をテキストデータに変換し(ステップS131)、特定フレーズに関する新たな正誤率R1を計算する(ステップS132)。
体調判定部16Bは、音声認識部14から新たな正誤率R1を取得するとともに(ステップS133)、記憶部15の基準認識結果15Aから電話端末20の内線番号に基づいて利用者の基準正誤率R0を取得し(ステップS134)、これら新たな正誤率R1と基準正誤率R0とを比較する(ステップS135)。
【0036】
この際、体調判定部16Bは、基準正誤率R0と新たな正誤率R1との差分(R0−R1)が所定の許容値Rth以上か確認し(ステップS136)、所定の許容値Rth以上の場合(ステップS136:YES)、利用者の体調は不良であると判定する(ステップS137)。一方、所定の許容値Rth未満の場合(ステップS136:NO)、利用者の体調は正常であると判定する(ステップS138)。
【0037】
[第1の実施の形態の効果]
このように、本実施の形態は、電話制御装置10において、記憶部15が、予め利用者音声を音声認識部14で音声認識して得られた認識結果を基準認識結果15Aとして記憶しておき、制御部16が、音声認識部14で得られた新たな利用者音声に関する新たな認識結果を基準認識結果15Aと比較し、得られた比較結果に基づいて利用者に関する体調の良否を判定するようにしたものである。
さらには、制御部16が、得られた判定結果を、利用者の電話端末20へ通知し、または、予め設定されているメールアドレスへ電子メールで通知するようにしたものである。
【0038】
これにより、利用者の利用者音声を音声認識して得られた認識結果に基づいて、利用者の体調を判定することができる。このため、電話制御装置10において、音声認識の結果に基づいて利用者の健康に関する個人的なサービスを提供することが可能となる。また、利用者の上司や社内の保健師などの管理者に電話したり、電子メールで利用者の体調不良を自動的に通知することができ、利用者の体調不良を早期に検知して最適な対応をとることが可能となる。この際、管理者が、既知の技術であるボイスメモにより録音しておいた利用者音声を確認できるようにしておけば、利用者の体調をより正確に判定できる。
【0039】
また、本実施の形態において、基準認識結果および新たな認識結果として、利用者音声を音声認識部14で音声認識して得られたテキストデータの正誤率を用い、制御部16が、新たな認識結果の正誤率が基準認識結果の正誤率から許容値Rth以上低い場合、利用者の体調を不良と判定するようにしてもよい。これにより、比較的簡素な計算処理で、体調良否を判定できるとともに、音声認識誤差による誤判定を容易に抑制することができる。
【0040】
また、本実施の形態において、基準認識結果および新たな認識結果として、利用者音声のうち使用頻度の高い特定のフレーズを音声認識部14で音声認識して得られたテキストデータの正誤率を用いてもよい。これにより、利用者が意識することなく、利用者の自然な会話音声に基づいて体調良否を判定でき、判定精度を高めることができる。
【0041】
[第2の実施の形態]
次に、本発明の第2の実施の形態にかかる電話制御装置10について説明する。
第1の実施の形態では、認識結果として利用者音声を認識処理した際の正誤率を用いた場合を例として説明した。本実施の形態では、認識結果として利用者音声の声紋データを用いる場合について説明する。
【0042】
前述したように、人の音声は、その人の体調によって変化する。例えば、風邪を引いた場合には喉が炎症して、通常よりしゃがれたりかすれたりする傾向がある。また、体調によって気分が変化するため、声の高く明るく大きくなったり、低く暗く小さくなったりと、音声が大きく変化する。また、脳梗塞など、脳に障害が発生した場合には、呂律が回らなくなるなど、音声が大きく変化する。
【0043】
一方、声紋データは、声紋認証に用いられるデータであり、音声の特徴を示すデータである。具体例としては、個人によって異なる音声の波形形状を各周波数のスペクトルで表した、周波数スペクトルが用いられる。
本実施の形態は、このような人の音声がその人の体調によって変化することに着目し、利用者音声から新たに得られた声紋データを当該利用者の基準となる声紋データと比較し、得られた比較結果に基づいて利用者に関する体調の良否を判定するようにしたものである。
【0044】
すなわち、本実施の形態において、音声認識部14は、音声処理部13でやり取りする利用者音声(音声データ)から声紋データを抽出する機能を有している。
体調判定部16Bは、新たな認識結果の声紋データと基準認識結果15Aの声紋データとの整合度が所定の許容値より低い場合、利用者の体調を不良と判定する機能を有している。
本実施の形態にかかるその他の構成については、第1の実施の形態と同様であり、ここでの説明は省略する。また、本実施の形態にかかる電話制御装置10の体調判定動作については、前述した図2と同様であり、ここでの説明は省略する。
【0045】
[第2の実施の形態の動作]
次に、図4を参照して、本実施の形態にかかる体調判定処理について説明する。図4は、第2の実施の形態にかかる体調判定処理を示すフローチャートである。
以下では、音声認識部14で得られる認識結果が利用者音声の声紋データからなるものとし、記憶部15の基準認識結果15Aには、利用者の体調が良好である状態で音声認識して得られた基準声紋データが登録されている場合を例として説明する。なお、許容値MMthについては、予め記憶部15に設定されているものとする。
【0046】
まず、音声認識部14は、電話端末20から出力された利用者音声に関する音声データを音声処理部13から取得し(ステップS200)、音声認識を実行することにより、利用者音声をテキストデータに変換し(ステップS201)、利用者音声に関する新たな声紋データD1を計算する(ステップS202)。
体調判定部16Bは、音声認識部14から新たな声紋データD1を取得するとともに(ステップS203)、記憶部15の基準認識結果15Aから電話端末20の内線番号に基づいて利用者の基準声紋データD0を取得し(ステップS204)、これら新たな声紋データD1と基準声紋データD0とを比較して整合度Mを計算する(ステップS205)。
【0047】
ここで、体調判定部16Bは、整合度Mが所定の判定値Mthより低いかどうか確認し(ステップS206)、整合度Mが判定値Mthより低い場合(ステップS206:YES)、利用者の体調は不良であると判定する(ステップS207)。一方、整合度Mが判定値Mth以上である場合(ステップS206:NO)、利用者の体調は正常であると判定する(ステップS208)。
【0048】
[第2の実施の形態の効果]
このように、本実施の形態は、基準認識結果および新たな認識結果として、利用者音声を音声認識部14で音声認識して得られた声紋データを用い、制御部16が、新たな認識結果の声紋データと基準認識結果の声紋データとの整合度が所定の許容値より低い場合、利用者の体調を不良と判定するようにしたものである。
これにより、前述の正誤率を用いた場合と同様に、音声認識時に得られる声紋データに基づいて、利用者の体調を判定することができる。このため、電話制御装置10において、音声認識の結果に基づいて利用者の健康に関する個人的なサービスを提供することが可能となる。
【0049】
[第3の実施の形態]
次に、本発明の第3の実施の形態にかかる電話制御装置10について説明する。
第1の実施の形態では、認識結果として利用者音声を認識処理した際の正誤率を用いた場合を例として説明した。本実施の形態では、認識結果として特定フレーズの出現頻度を用いる場合について説明する。
【0050】
一般に、人の会話に出現するフレーズの出現頻度は、その人の体調によって変化する。例えば、体調がすぐれない場合、「聞き取れない」、「もう一度お願いします」等のような、同じようなフレーズが繰り返し出現する傾向がある。
本実施の形態は、このような人の会話に出現するフレーズの出現頻度がその人の体調によって変化することに着目し、利用者音声から新たに得られた出現頻度を当該利用者の基準となる出現頻度と比較し、得られた比較結果に基づいて利用者に関する体調の良否を判定するようにしたものである。
【0051】
すなわち、本実施の形態において、音声認識部14は、音声処理部13でやり取りする利用者音声(音声データ)から、予め設定されている対象フレーズの出現頻度を計算する機能を有している。対象フレーズについては、「聞き取れない」、「もう一度お願いします」等のような、体調不良の場合に出現しやすいフレーズを用いればよく、利用者ごとに設定してもよい。
【0052】
体調判定部16Bは、新たな認識結果の出現頻度が基準認識結果15Aの出現頻度より所定の許容値以上高い場合、すなわち、新たな認識結果の出現頻度と基準認識結果の出現頻度との差分が所定の許容値以上の場合に、利用者の体調を不良と判定する機能を有している。
本実施の形態にかかるその他の構成については、第1の実施の形態と同様であり、ここでの説明は省略する。また、本実施の形態にかかる電話制御装置10の体調判定動作については、前述した図2と同様であり、ここでの説明は省略する。
【0053】
[第3の実施の形態の動作]
次に、図5を参照して、図2のステップS110−S113における体調判定処理について詳細に説明する。図5は、第3の実施の形態にかかる体調判定処理を示すフローチャートである。
以下では、音声認識部14で得られる認識結果が、予め設定されている対象フレーズに関する出現頻度からなるものとし、記憶部15の基準認識結果15Aには、対象フレーズに関する基準出現頻度が登録されている場合を例として説明する。なお、許容値Fthについては、予め記憶部15に設定されているものとする。
【0054】
まず、音声認識部14は、電話端末20から出力された利用者音声に関する音声データを音声処理部13から取得し(ステップS300)、音声認識を実行することにより、利用者音声をテキストデータに変換し(ステップS301)、対象フレーズに関する新たな出現頻度F1を計算する(ステップS302)。
体調判定部16Bは、音声認識部14から新たな出現頻度F1を取得するとともに(ステップS303)、記憶部15の基準認識結果15Aから電話端末20の内線番号に基づいて利用者の基準出現頻度F0を取得し(ステップS304)、これら新たな出現頻度F1と基準出現頻度F0とを比較する(ステップS305)。
【0055】
この際、体調判定部16Bは、新たな出現頻度F1と基準出現頻度F0の差分(F1−F0)が所定の許容値Fth以上か確認し(ステップS306)、所定の許容値Fth以上の場合(ステップS306:YES)、利用者の体調は不良であると判定する(ステップS307)。一方、所定の許容値Fth未満の場合(ステップS306:NO)、利用者の体調は正常であると判定する(ステップS308)。
【0056】
[第3の実施の形態の効果]
このように、本実施の形態は、電話制御装置10において、基準認識結果および新たな認識結果として、予め設定された対象フレーズの検知頻度からなり、制御部16が、新たな認識結果の検知頻度が基準認識結果の検知頻度より所定の許容値以上高い場合、利用者の体調を不良と判定するようにしたものである。
これにより、前述の正誤率を用いた場合と同様に、音声認識時に得られる対象フレーズの出現頻度に基づいて、利用者の体調を判定することができる。このため、電話制御装置10において、音声認識の結果に基づいて利用者の健康に関する個人的なサービスを提供することが可能となる。
【0057】
[実施の形態の拡張]
以上、実施形態を参照して本発明を説明したが、本発明は上記実施形態に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解しうる様々な変更をすることができる。また、各実施形態については、矛盾しない範囲で任意に組み合わせて実施することができる。
【符号の説明】
【0058】
10…電話制御装置、11…網I/F、12…内線I/F、13…音声処理部、14…音声認識部、15…記憶部、15A…基準認識結果、15P…プログラム、16…制御部、16A…呼制御部、16B…体調判定部、20…電話端末、30…相手電話装置、L1…通信回線、L2…内線回線、NW…電話網。
図1
図2
図3
図4
図5