IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社ナカヨの特許一覧

<>
  • 特許-主装置および内線電話機の割り当て方法 図1
  • 特許-主装置および内線電話機の割り当て方法 図2
  • 特許-主装置および内線電話機の割り当て方法 図3
  • 特許-主装置および内線電話機の割り当て方法 図4
  • 特許-主装置および内線電話機の割り当て方法 図5
  • 特許-主装置および内線電話機の割り当て方法 図6
  • 特許-主装置および内線電話機の割り当て方法 図7
  • 特許-主装置および内線電話機の割り当て方法 図8
  • 特許-主装置および内線電話機の割り当て方法 図9
  • 特許-主装置および内線電話機の割り当て方法 図10
  • 特許-主装置および内線電話機の割り当て方法 図11
  • 特許-主装置および内線電話機の割り当て方法 図12
  • 特許-主装置および内線電話機の割り当て方法 図13
  • 特許-主装置および内線電話機の割り当て方法 図14
  • 特許-主装置および内線電話機の割り当て方法 図15
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-10-31
(45)【発行日】2022-11-09
(54)【発明の名称】主装置および内線電話機の割り当て方法
(51)【国際特許分類】
   H04Q 3/58 20060101AFI20221101BHJP
   H04M 3/42 20060101ALI20221101BHJP
   H04M 3/44 20060101ALI20221101BHJP
【FI】
H04Q3/58 101
H04M3/42 P
H04M3/44
H04M3/42 E
【請求項の数】 11
(21)【出願番号】P 2019055729
(22)【出願日】2019-03-22
(65)【公開番号】P2020156065
(43)【公開日】2020-09-24
【審査請求日】2021-08-30
(73)【特許権者】
【識別番号】000134707
【氏名又は名称】株式会社ナカヨ
(74)【代理人】
【識別番号】100104570
【弁理士】
【氏名又は名称】大関 光弘
(72)【発明者】
【氏名】田中 佑季
(72)【発明者】
【氏名】城田 翔平
(72)【発明者】
【氏名】星野 敦史
【審査官】田畑 利幸
(56)【参考文献】
【文献】特開2009-302997(JP,A)
【文献】特開2008-177884(JP,A)
【文献】国際公開第2006/107034(WO,A1)
【文献】特開平10-013546(JP,A)
【文献】特表2005-502277(JP,A)
【文献】国際公開第2018/213381(WO,A1)
【文献】特表2020-529744(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04Q 3/58- 3/62
H04M 3/38- 3/58
(57)【特許請求の範囲】
【請求項1】
内線電話機を収容する主装置であって、
オフフックされた前記内線電話機を捕捉して、当該内線電話機から指示内容を表す音声データを受信する音声取得手段と、
前記音声取得手段により取得された前記音声データの声紋情報から認識されるユーザを、当該音声データの送信元である前記内線電話機に割り当てる設定手段と、
前記音声取得手段により取得された前記音声データの音声認識結果から前記指示内容を解析する解析手段と、
前記解析手段により解析された前記指示内容に応じた処理を実施する指示処理手段と、
前記指示処理手段による前記指示内容に応じた処理の実施結果を、前記設定手段により前記音声データの送信元である前記内線電話機に割り当てられた前記ユーザの操作履歴に記録する履歴記録手段と、を備える
ことを特徴とする主装置。
【請求項2】
請求項1に記載の主装置であって、
連絡先毎に名称および電話番号を含む電話帳データを記憶する電話帳記憶手段をさらに備え、
前記指示処理手段は、
前記解析手段により解析された前記指示内容が発信先の指定を伴う発信指示である場合に、前記電話帳記憶手段から前記発信先を名称として含む電話帳データを検索し、検出した電話帳データに含まれている電話番号への発信処理を実施する
ことを特徴とする主装置。
【請求項3】
請求項2に記載の主装置であって、
前記指示処理手段は、
前記発信処理の実施に際し、発信元情報として、前記設定手段により前記音声データの送信元である前記内線電話機に割り当てられた前記ユーザの情報を含める
ことを特徴とする主装置。
【請求項4】
請求項2または3に記載の主装置であって、
前記指示処理手段は、
前記指示内容に応じた処理が発信処理である場合に、発信先と前記音声データの送信元である前記内線電話機との通話を録音し、
前記履歴記録手段は、
前記通話の録音データおよび前記発信先を含む発信処理の実施結果を、前記設定手段により当該内線電話機に割り当てられた前記ユーザの操作履歴に記録する
ことを特徴とする主装置。
【請求項5】
請求項2ないし4のいずれか一項に記載の主装置であって、
前記指示処理手段は、
前記解析手段により解析された前記指示内容が発信履歴の表示指示である場合に、前記履歴記録手段に記録されている、前記設定手段により前記音声データの送信元である前記内線電話機に割り当てられた前記ユーザの操作履歴から、発信処理の実施結果を抽出して、抽出した発信処理の実施結果を当該内線電話機に一覧表示し、当該内線電話機から発信処理の実施結果の選択を受け付けたならば、選択された発信処理の実施結果で指定されている発信先への発信処理を実施する
ことを特徴とする主装置。
【請求項6】
請求項5に記載の主装置であって、
前記指示処理手段は、
前記解析手段により解析された前記指示内容が発信履歴の表示指示である場合に、前記音声データの送信元である前記内線電話機に割り当てられた前記ユーザの操作履歴から抽出した発信処理の実施結果を、発信先毎にまとめて、発信回数の多い順に当該内線電話機に一覧表示する
ことを特徴とする主装置。
【請求項7】
請求項2ないし6のいずれか一項に記載の主装置であって、
ユーザ毎に、前記履歴記憶手段に記録されている、当該ユーザの操作履歴に含まれている発信処理の実施結果で指定されている発信先を、当該ユーザの電話帳データに登録する電話帳データ更新手段をさらに備え、
前記指示処理手段は、
前記解析手段により解析された前記指示内容が電話帳データの表示指示である場合に、前記設定手段により前記音声データの送信元である前記内線電話機に割り当てられた前記ユーザの前記電話帳データを当該内線電話機に表示し、当該内線電話機から連絡先の選択を受け付けたならば、選択された連絡先への発信処理を実施する
ことを特徴とする主装置。
【請求項8】
請求項2ないし7のいずれか一項に記載の主装置であって、
ユーザ毎に、当該ユーザに固定的に割り当てられている前記内線電話機の内線番号を記憶する番号情報記憶手段と、
内線番号の指定を伴う呼が着信した場合に、当該内線番号により特定される前記内線電話機を呼び出す呼び出し手段と、をさらに備え、
前記履歴記憶手段は、
前記指示処理手段による前記指示内容に応じた処理が発信処理である場合に、発信先と前記音声データの送信元である前記内線電話機の内線番号とを含む発信処理の実施結果を、前記設定手段により当該内線電話機に割り当てられた前記ユーザの操作履歴に記録し、
前記呼び出し手段は、
前記内線電話機の呼び出しに対して所定時間内に応答がなかった場合に、前記番号情報記憶手段において当該内線電話機の内線番号に対応付けられている前記ユーザの操作履歴から、直前の発信処理の実施結果を抽出し、当該実施結果に含まれている内線番号により特定される前記内線電話機に前記着信を転送する
ことを特徴とする主装置。
【請求項9】
請求項1ないし8のいずれか一項に記載の主装置であって、
ユーザ毎に、ユーザ情報をユーザIDに対応付けて記憶するユーザ情報記憶手段と、
ユーザ毎に声紋情報をユーザIDに対応付けて記憶する声紋認証機能付きの音声認識サーバに、前記音声取得手段により取得された前記音声データを送信して、当該音声認識サーバから、当該音声データの声紋情報に対応付けられているユーザIDおよび当該音声データに対する音声認識結果を取得する音声認識結果取得手段と、を備え、
前記設定手段は、
前記音声認識結果取得手段により前記音声認識サーバから取得されたユーザIDに対応付けられて前記ユーザ情報記憶手段に記憶されているユーザ情報により特定されるユーザを、前記音声データの送信元である前記内線電話機に割り当て、
前記解析手段は、
前記音声認識結果取得手段により前記音声認識サーバから取得された音声認識結果から前記指示内容を解析する
ことを特徴とする主装置。
【請求項10】
請求項9に記載の主装置であって、
前記音声認識サーバは、
前記音声取得手段により取得された前記音声データの声紋情報に対応付けられているユーザIDが存在しない場合、あらたなユーザIDを発行して当該ユーザIDに前記声紋情報を対応付けて記憶するとともに、当該ユーザIDを前記主装置に送信し、
前記音声取得手段は、
前記音声認識結果取得手段により前記音声認識サーバから取得されたユーザIDが前記ユーザ情報記憶手段に記憶されていない場合、前記音声データの送信元である前記内線電話機にユーザ情報の音声入力を促す音声ガイダンスを送出して、当該内線電話機からユーザ情報を表す音声データを取得し、
前記音声認識結果取得手段は、
前記音声取得手段が取得したユーザ情報を表す音声データを前記音声認識サーバに送信して、当該音声認識サーバからユーザIDおよび前記ユーザ情報を表す音声データの音声認識結果を取得し、
前記解析手段は、
前記音声認識結果取得手段により前記音声認識サーバから取得された前記ユーザ情報を表す音声データの音声認識結果からユーザ情報を抽出し、
前記設定手段は、
前記音声認識結果取得手段により前記音声認識サーバから取得されたユーザIDが前記ユーザ情報記憶手段に記憶されていない場合、前記解析手段により、前記音声認識結果取得手段によって当該ユーザIDとともに取得された音声認識結果から抽出されたユーザ情報を、当該ユーザIDに対応付けて、前記ユーザ情報記憶手段に記憶する
ことを特徴とする主装置。
【請求項11】
内線電話機を収容する主装置による内線電話機の割り当て方法であって、
前記主装置は、
オフフックされた前記内線電話機を捕捉して、当該内線電話機から指示内容を表す音声データを受信し、
受信した前記音声データの声紋情報から認識されるユーザを、当該音声データの送信元である前記内線電話機に割り当て、
受信した前記音声データの音声認識結果から前記指示内容を解析し、
解析された前記指示内容に応じた処理を実施し、
前記指示内容に応じた処理の実施結果を、前記音声データの送信元である前記内線電話機に割り当てられた前記ユーザの操作履歴に記録する
ことを特徴とする内線電話機の割り当て方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、内線電話機を収容する主装置に関し、特に、主装置による内線電話機のユーザへの割り当て技術に関する。
【背景技術】
【0002】
特許文献1には、フリーアドレスオフィスのデスク上に設置されたIP電話機を一時的に自分の電話機として使用することを可能とするフリーアドレス対応IP電話システムが開示されている。この電話システムにおいて、フリーアドレスオフィスのデスク上に設置されたIP電話機は、ユーザからユーザIDおよびパスワードの入力を受け付けると、この受け付けたユーザIDおよびパスワードを自IP電話機のIPアドレスとともに、設定管理サーバに送信して、ログイン要求を行う。これを受けて、設定管理サーバは、ユーザIDおよびパスワードを用いてユーザ認証を行い、認証成立したならば、ユーザIDに紐付けられて管理されているユーザの電話番号を、ログイン要求元のIP電話機のIPアドレスに対応付けて登録するとともに、この電話番号を含む設定情報をログイン要求元のIP電話機に送信する。これにより、IP電話機に、ユーザの電話番号が設定され、ユーザは、このIP電話機を自分の電話機として使用することができる。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2007-142621号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1において、ユーザは、フリーアドレスオフィスのデスク上に設置されたIP電話機を使用して電話をかけたい場合、まず、このIP電話機にユーザIDおよびパスワードを入力し、このIP電話機に自分の電話番号を割り当てる設定処理を実施してから、発信先ダイヤル番号の入力等の発信操作を行わなければならず、手順が多く煩雑である。
【0005】
本発明は上記事情に鑑みてなされたものであり、本発明の目的は、より効率的に電話機をユーザに割り当てることにある。
【課題を解決するための手段】
【0006】
上記課題を解決するために、本発明において、主装置は、収容する内線電話機がオフフックされると、この内線電話機を捕捉して、この内線電話機との間に通話路を確立し、この内線電話機から指示内容を表す音声データを受け付ける。そして、この音声データの声紋情報により特定されるユーザに、この内線電話機を割り当てる。また、この音声データの音声認識結果からユーザの指示内容を解析して、この指示内容に応じた処理を実施するとともに、その実施結果をユーザの操作履歴に記録する。
【0007】
例えば、本発明は、
内線電話機を収容する主装置であって、
オフフックされた前記内線電話機を捕捉して、当該内線電話機から指示内容を表す音声データを受信する音声取得手段と、
前記音声取得手段により取得された前記音声データの声紋情報から認識されるユーザを、当該音声データの送信元である前記内線電話機に割り当てる設定手段と、
前記音声取得手段により取得された前記音声データの音声認識結果から前記指示内容を解析する解析手段と、
前記解析手段により解析された前記指示内容に応じた処理を実施する指示処理手段と、
前記指示処理手段による前記指示内容に応じた処理の実施結果を、前記設定手段により前記音声データの送信元である前記内線電話機に割り当てられた前記ユーザの操作履歴に記録する履歴記録手段と、を備える。
【発明の効果】
【0008】
本発明によれば、ユーザが内線電話機をオフフックして、この内線電話機に指示内容を表す音声を入力することにより、この内線電話機がユーザに割り当てられて、指示内容に応じた処理が実施されるので、ユーザは、内線電話機に所望の処理を実施させるための操作(指示内容を表す音声を入力)とは別に、この内線電話機を自身に割り当てるための特別な操作を行う必要がない。したがって、手順が少なく簡素であり、より効率的に電話機をユーザに割り当てることができる。また、ユーザの指示内容に応じた実施結果がこのユーザの操作履歴に記録されるので、ユーザが使用した内線電話機に依存することなく、このユーザの操作履歴を把握することができる。
【図面の簡単な説明】
【0009】
図1図1は、本発明の一実施の形態に係る電話システムの概略構成図である。
図2図2は、本発明の一実施の形態に係る電話システムの動作例を説明するためのシーケンス図である。
図3図3は、本発明の一実施の形態に係る電話システムの動作例を説明するためのシーケンス図であり、図2の続きである。
図4図4は、主装置1の概略機能構成図である。
図5図5は、ユーザ情報記憶部104の登録内容例を模式的に表した図である。
図6図6は、電話帳データ記憶部105の登録内容例を模式的に表した図である。
図7図7は、操作履歴記憶部106の登録内容例を模式的に表した図である。
図8図8は、主装置1の動作を説明するためのフロー図である。
図9図9は、図8に示す発信処理(S206)を説明するためのフロー図である。
図10図10は、図8に示す履歴表示処理(S207)を説明するためのフロー図である。
図11図11は、図8に示す電話帳表示処理(S208)を説明するためのフロー図である。
図12図12は、音声認識サーバ3の概略機能構成図である。
図13図13は、声紋情報記憶部301の登録内容例を模式的に表した図である。
図14図14は、音声認識サーバ3の動作を説明するためのフロー図である。
図15図15は、本発明の一実施の形態に係る電話システムにおけるユーザ情報登録処理の一例を説明するためのシーケンス図である。
【発明を実施するための形態】
【0010】
以下に、本発明の一実施の形態について図面を参照して説明する。
【0011】
図1は、本実施の形態に係る電話システムの概略構成図である。
【0012】
図示するように、本実施の形態に係る電話システムは、WAN(Wide Area Network)4に接続された主装置1と、主装置1に収容された複数の内線電話機2-1~2-n(以下、単に内線電話機2とも呼ぶ)と、声紋照合機能を有する音声認識サーバ3と、を備えて構成されている。
【0013】
音声認識サーバ3は、ユーザ毎に、ユーザの声紋情報をユーザIDに対応付けて記憶しており、主装置1から受信した音声データに対して音声認識処理を実施するとともに、この音声データから声紋情報を抽出して、抽出した声紋情報に対応付けられているユーザIDを特定する。そして、音声認識結果および特定したユーザIDを主措置1に送信する。
【0014】
主装置1は、ユーザ毎に、ユーザID、ユーザ名を含むユーザ情報を記憶しており、内線電話機2がオフフックされると、この内線電話機2を捕捉して、この内線電話機2から指示内容を表す音声データを受け付け、この音声データを音声認識サーバ3に送信する。そして、音声認識サーバ3から受信したユーザIDを含むユーザ情報により特定されるユーザに、この内線電話機2を割り当てる。また、音声認識サーバ3からユーザIDとともに受信した音声認識結果からユーザの指示内容を解析し、この指示内容に応じた処理を実施するとともに、その実施結果をユーザの操作履歴に記録する。
【0015】
図2および図3は、本実施の形態に係る電話システムの動作例を説明するためのシーケンス図である。
【0016】
内線電話機2は、ユーザによりオフフック操作されると(S100)、オフフック信号を主装置1に送信する(S101)。これにより、主装置1は、内線電話機2を捕捉して、内線電話機2との間に通話路を確立する(S102)。つぎに、内線電話機2は、ユーザから指示内容を表す音声が入力されると(S103)、主装置1との間の通話路を介して、この音声データを主装置1に送信する(S104)。
【0017】
主装置1は、内線電話機2から指示内容を表す音声データを受信すると、WAN4を介して音声認識サーバ3に、この音声データを含む音声認識要求を送信する(S105)。これを受けて、音声認識サーバ3は、音声認識要求に含まれている音声データから声紋情報を抽出して予め登録されている声紋情報と照合し、抽出した声紋情報と一致する声紋情報に対応付けられているユーザIDを特定する(S106)。また、音声認識要求に含まれている音声データに対して音声認識処理を実施する(S107)。それから、音声認識サーバ3は、音声認識結果を、特定したユーザIDとともに、主装置1に送信する(S108)。
【0018】
つぎに、主装置1は、予め登録されているユーザ情報のなかから、音声認識サーバ3より受信したユーザIDを含むユーザ情報を検索し、検出したユーザ情報により特定されるユーザに内線電話機2を割り当てる(S109)。また、主装置1は、ユーザIDともに音声認識サーバ3より受信した音声認識結果に含まれている指示内容を解析する(S110)。具体的には、指示内容毎に所定のキーワードを少なくとも一つ予め登録しておき、音声認識結果に含まれている所定のキーワードを検出することにより、指示内容を特定する。ここでは、音声認識結果に含まれている所定のキーワードが「〇〇へ発信」、「〇〇に電話」といった発信先の固有名称「〇〇」を伴う発信指示を表すものとする。
【0019】
つぎに、主装置1は、予め登録されている電話帳データを参照して、発信先の固有名称「〇〇」により特定される連絡先の電話番号を特定する(S111)。それから、主装置1は、特定した電話番号を発信先番号とし、内線電話機2に割り当てられたユーザのユーザ情報を含む発信元情報が付加された接続要求を発信する(S112)。この接続要求は、WAN4を介して、発信先番号が割り当てられた外線電話機5に送られる。
【0020】
つぎに、外線電話機5は、接続要求を受信すると、着信鳴動するとともに、外線電話機5に発信元表示機能が備えられているならば、この接続要求に付加されている発信元情報を表示する(S113)。
【0021】
それから、外線電話機5は、応答操作を受け付けると(S114)、主装置1に接続応答を返信する(S115)。これにより、主装置1と外線電話機5との間に通話路が確立される(S116)。主装置1は、外線電話機5との間に確立された通話路と、内線電話機2との間に確立されている通話路とを接続して、両者間を中継する(S117)。これにより、内線電話機2に割り当てられたユーザと、外線電話機5のユーザである通話相手との間で通話が可能となり、主装置1は、この通話の録音を開始する(S118)。
【0022】
つぎに、内線電話機2は、通話が終了して、ユーザによりオンフック操作されると(S119)、オンフック信号を主装置1に送信する(S120)。これにより、主装置1は、WAN4を介して外線電話機5に切断要求を送信し(S121)、外線電話機5は、主装置1に切断応答を返信する(S122)。これにより、内線電話機2、外線電話機5各々との間に確立された通話路が解放され、主装置1は、これらの通話路間の中継を終了する(S123)。
【0023】
その後、主装置1は、通話の録音を終了する(S124)。そして、発信日時、発信先番号、内線電話機2の内線番号、および録音データを含む発信処理の実施結果を、この内線電話機2に割り当てられたユーザの操作履歴に記録して、ユーザの操作履歴を更新する(S125)。
【0024】
つぎに、本実施の形態に係る電話システムを構成する主装置1および音声認識サーバ3の詳細を説明する。なお、内線電話機2には、既存の装置を利用することができるので、その詳細な説明を省略する。
【0025】
まず、主装置1の詳細を説明する。
【0026】
図4は、主装置1の概略機能構成図である。
【0027】
図示するように、主装置1は、内線インターフェース部100と、WANインターフェース部101と、呼制御部102と、中継部103と、ユーザ情報記憶部104と、電話帳データ記憶部105と、操作履歴記憶部106と、音声取得部107と、音声認識要求部108と、ユーザ割当設定部109と、指示内容解析部110と、指示処理部111と、を備えている。
【0028】
内線インターフェース部100は、内線電話機2と接続するためのインターフェースであり、WANインターフェース部101は、WAN4に接続するためのインターフェースである。
【0029】
呼制御部102は、SIP(Session Initiation Protocol)等の所定の呼制御プロトコルに従い、内線電話機2と外線電話機5との間、および内線電話機2同士間の通話路の確立・解放を実施する。
【0030】
中継部103は、RTP(Realtime Transport Protocol)等の所定の伝送プロトコルに従い、内線電話機2と外線電話機5との間、および内線電話機2同士間に確立された通話路を中継する。
【0031】
ユーザ情報記憶部104には、本実施の形態に係る電話システムのユーザ毎に、ユーザID、ユーザ名を含むユーザ情報が記憶されている。
【0032】
図5は、ユーザ情報記憶部104の登録内容例を模式的に表した図である。
【0033】
図示するように、ユーザ情報記憶部104には、本実施の形態に係る電話システムのユーザ毎にユーザ情報のレコード1040が記憶されている。ユーザ情報のレコード1040は、ユーザIDが登録されたフィールド1041と、ユーザのユーザ名が登録されたフィールド1042と、ユーザに固定的に割り当てられた内線電話機(着信呼び出し用の内線電話機)2の電話番号が登録されたフィールド1043と、を有する。
【0034】
電話帳データ記憶部105には、連絡先毎に、連絡先の氏名、電話番号を含む電話帳データが記憶されている。
【0035】
図6は、電話帳データ記憶部105の登録内容例を模式的に表した図である。
【0036】
図示するように、電話帳データ記憶部105には、連絡先毎に電話帳データのレコード1050が記憶されている。電話帳データのレコード1050は、連絡先の氏名または名称(固有名称)が登録されたフィールド1051と、連絡先の電話番号が登録されたフィールド1052と、連絡先の住所が登録されたフィールド1053と、を有する。
【0037】
操作履歴記憶部106には、本実施の形態に係る電話システムのユーザ毎にユーザの操作履歴が記憶される。
【0038】
図7は、操作履歴記憶部106の登録内容例を模式的に表した図である。
【0039】
図示するように、操作履歴記憶部106には、本実施の形態に係る電話システムのユーザ毎に、操作履歴のテーブル1060がユーザIDに対応付けられて記憶されている。操作履歴のテーブル1060には、該当するユーザに割り当てられた内線電話機2を介してこのユーザから受け付けた指示(操作)毎に、操作履歴のレコード1061が記憶される。操作履歴のレコード1061は、指示(操作)内容に応じた処理の実施日時が登録されたフィールド1062と、指示内容が登録されたフィールド1063と、利用した内線電話2の内線番号が登録されたフィールド1064と、指示内容が発信指示である場合に、発信先番号が登録されたフィールド1065と、指示内容が発信指示である場合に、通話の録音データあるいはその格納先が登録されたフィールド1066と、を有する。
【0040】
音声取得部107は、捕捉中の内線電話機2からユーザの指示内容を表す音声データを取得する。
【0041】
音声認識要求部108は、音声取得部107が取得した音声データを含む音声認識要求を音声認識サーバ3送信して、音声認識サーバ3からこの音声データに対する音声認識結果を、この音声データの声紋情報から特定されるユーザのユーザIDとともに取得する。
【0042】
ユーザ割当設定部109は、ユーザ情報記憶部104を参照して、音声認識要求部108によって音声認識サーバ3から取得されたユーザIDを含むユーザ情報のレコード1040により特定されるユーザを、音声取得部107が取得した音声データの送信元の内線電話機2に割り当てる。
【0043】
指示内容解析部110は、音声認識要求部108によって音声認識サーバ3から取得された音声認識結果に含まれている指示内容を解析する。具体的には、指示内容解析部110には、指示内容毎に所定のキーワードが少なくとも一つ登録されており、指示内容解析部110は、いずれかの所定のキーワードを音声認識結果から検出することにより、指示内容を特定する。
【0044】
指示処理部111は、WANインターフェース部101、呼制御部102等と連携して、指示内容解析部110により解析された指示内容に応じた処理を実施する。また、指示処理部111は、音声取得部107が取得した音声データの送信元の内線電話機2に割り当てられたユーザに対応付けられて操作履歴記憶部106に記憶されている操作履歴のテーブル1060に、指示内容に応じた処理の実施結果を記録する。
【0045】
図8は、主装置1の動作を説明するためのフロー図である。
【0046】
このフローは、呼制御部102が内線インターフェース部100を介して内線電話機2からオフフック信号を受信することにより開始される。
【0047】
まず、呼制御部102は、オフフック信号の送信元の内線電話機2(以下、割当対象電話機2と呼ぶ)を捕捉して、この内線電話機2と中継部103との間に通話路を確立する(S200)。それから、音声取得部107は、この通話路を介して割当対象電話機2から、指示内容を表す音声データを受信する(S201)。
【0048】
つぎに、音声認識要求部108は、WANインターフェース部101を介して音声認識サーバ3に、音声取得部107が受信した音声データを含む音声認識要求を送信する(S202)。それから、音声認識要求部108は、音声認識サーバ3から、この音声データに対する音声認識結果を、この音声データの声紋情報から特定されるユーザのユーザIDとともに受信する(S203)。
【0049】
つぎに、ユーザ割当設定部109は、ユーザ情報記憶部104から、音声認識要求部108が音声認識サーバ3から取得したユーザIDを含むユーザ情報のレコード1040を検索する。そして、検出したユーザ情報のレコード1040により特定されるユーザを、割当対象電話機2に割り当てる(S204)。
【0050】
つぎに、指示内容解析部110は、音声認識要求部108が音声認識サーバ3から取得した音声認識結果に含まれている指示内容を解析する(S205)。具体的には、指示内容毎に予め登録されている所定のキーワードを音声認識結果から検索し、検出したキーワードに対応付けられている指示内容を、音声認識結果に含まれている指示内容と判断する。
【0051】
ここで、指示内容解析部110は、音声認識結果から「〇〇へ発信」、「〇〇に電話」といった所定のキーワードが検出された場合、音声認識結果に含まれている指示内容が発信先の固有名称「〇〇」を伴う発信指示であると判断し、指示処理部111に、発信先の固有名称「〇〇」への発信を指示する(S205で「発信」)。また、音声認識結果から「履歴表示」、「履歴出力」といった所定のキーワードが検出された場合、音声認識結果に含まれている指示内容が履歴表示指示であると判断し、指示処理部111に、履歴表示を指示する(S205で「履歴表示」)。また、音声認識結果から「電話帳表示」、「電話帳出力」といった所定のキーワードが検出された場合、音声認識結果に含まれている指示内容が電話帳表示指示であると判断し、指示処理部111に、電話帳表示を指示する(S205で「電話帳表示」)。
【0052】
つぎに、指示処理部111は、指示内容解析部110より通知された指示内容に従い処理を実施する(S206~S208)。具体的には、指示内容解析部110より通知された指示が発信指示ならば(S205で「発信」)、呼制御部102と連携して後述の発信処理を実施し(S206)、履歴表示指示ならば(S205で「履歴表示」)、操作履歴記憶部106と連携して後述の履歴表示処理を実施し(S207)、そして、電話帳表示指示ならば(S205で「電話帳表示」)、電話帳データ記憶部105と連携して後述の電話帳表示を実施する(S208)。
【0053】
それから、指示処理部111は、指示内容解析部110より通知された指示内容の実施結果を示す操作履歴のレコード1061を生成し、割当対象電話機2に割り当てられたユーザのユーザIDに対応付けられて操作履歴記憶部106に記憶されている操作履歴のテーブル1060に登録する(S209)。具体的には、発信処理を実施した場合、フィールド1062に実施日時が登録され、フィールド1063に指示内容「発信」が登録され、フィールド1064に割当対象電話機2の内線番号が登録され、フィールド1065に発信先番号が登録され、そして、通話の録音データがある場合に録音データあるいはその格納先がフィールド1066に登録された操作履歴のレコード1061を生成し、該当する操作履歴のテーブル1060に登録する。また、履歴表示処理を実施した場合、フィールド1062に実施日時が登録され、フィールド1063に指示内容「履歴表示」が登録され、フィールド1064に割当対象電話機2の内線番号が登録された操作履歴のレコード1061を生成し、該当する操作履歴のテーブル1060に登録する。また、電話帳表示処理を実施した場合、フィールド1062に実施日時が登録され、フィールド1063に指示内容「電話帳表示」が登録され、フィールド1064に割当対象電話機2の内線番号が登録された操作履歴のレコード1061を生成し、該当する操作履歴のテーブル1060に登録する。
【0054】
図9は、図8に示す発信処理(S206)を説明するためのフロー図である。
【0055】
まず、指示処理部111は、電話帳データ記憶部105から、指示内容解析部110より通知された発信先の固有名称がフィールド1051に登録されている電話帳データのレコード1050を検索し、検出したレコード1050のフィールド1052に登録されている電話番号を発信先番号として特定する(S2060)。それから、指示処理部111は、発信先番号を、割当対象電話機2に割り当てられたユーザのユーザ情報とともに、呼制御部102に通知して、発信を指示する。
【0056】
これを受けて、呼制御部102は、指示処理部111から通知されたユーザ情報が発信元情報として付加された、指示処理部111から通知された発信先番号への接続要求を発信する(S2061)。
【0057】
つぎに、呼制御部102は、接続要求に対する返信として接続応答を受信すると(S2062でYES)、中継部103と発信先番号により特定される電話機(外線電話機5あるいは割当対象電話機2以外の内線電話機2)との間に通話路を確立するとともに、この通話路と、中継部103と割当対象電話機2との間に確立されている通話路とを接続して、中継部103に両者間を中継させる(S2064)。これにより、割当対象電話機2が割り当てられたユーザと発信先番号により特定される電話機の通話相手との通話が可能となる。
【0058】
つぎに、指示処理部111は、中継部103により、割当対象電話機2との通話路および発信先番号により特定される電話機との通話路間の中継が開始されると、この中継を介してやりとりされる通話データの録音を開始する(S2065)。
【0059】
その後、呼制御部102が、割当対象電話機2からオンフック信号を受信し、あるいは、発信先番号により特定される電話機から切断要求を受信することにより、割当対象電話機2との通話路および発信先番号により特定される電話機との通話路が解放されて、両者間の中継が終了すると(S2066でYES)、指示処理部111は、通話データの録音を終了し(S2067)、それから図8のS209に進む。
【0060】
一方、呼制御部102は、接続要求に対する返信として接続応答を受信することなく(S2062でNO)、割当対象電話機2からオンフック信号を受信すると(S2063でYES)、中継部103と割当対象電話機2との通話路を解放し、それから図8のS209に進む。
【0061】
図10は、図8に示す履歴表示処理(S207)を説明するためのフロー図である。
【0062】
まず、指示処理部111は、割当対象電話機2に割り当てられたユーザのユーザIDに対応付けられて操作履歴記憶部106に記憶されている操作履歴のテーブル1060から、フィールド1063に指示内容「発信」が登録されている操作履歴(発信履歴)のレコード1061を抽出する(S2070)。
【0063】
つぎに、指示処理部111は、抽出した操作履歴(発信履歴)のレコード1061を、フィールド1065に登録されている発信先番号毎にグループ化し(S2071)、各グループの優先度を、そのグループに属する操作履歴(発信履歴)のレコード1061のレコード数(該当する発信先番号への発信回数)の多い順番に決定する(S2072)。
【0064】
それから、指示処理部111は、発信先番号毎にグループ化された操作履歴(発信履歴)のレコード1061のグループが優先度に従って掲載され、ユーザに所望のグループ(発信先番号)を選択させるための履歴選択画面を生成し、内線インターフェース部100を介して割当対象電話機2に、この履歴選択画面を送信する(S2073)。これを受けて、割当対象電話機2は、履歴選択画面を表示する。そして、ユーザから履歴選択画面内のいずれかのグループの選択を受け付けると、受け付けたグループの情報を主装置1に送信する。
【0065】
つぎに、指示処理部111は、内線インターフェース部100を介して割当対象電話機2から選択されたグループの情報を受信すると(S2074でYES)、このグループに属する操作履歴(発信履歴)のレコード1061に共通する発信先番号を特定する(S2076)。それから、指示処理部111は、発信先番号を、割当対象電話機2に割り当てられたユーザのユーザ情報とともに、呼制御部102に通知して、発信を指示する。その後、図9のS2061に進む。
【0066】
一方、指示処理部111が割当対象電話機2からグループの情報を受信することなく(S2074でNO)、呼制御部102が割当対象電話機2からオンフック信号を受信すると(S2075でYES)、呼制御部102は、中継部103と割当対象電話機2との通話路を解放し、それから図8のS209に進む。
【0067】
図11は、図8に示す電話帳表示処理(S208)を説明するためのフロー図である。
【0068】
まず、指示処理部111は、電話帳データ記憶部105に記憶されているすべての電話帳データのレコード1050を含み、ユーザに所望の電話帳データを選択させるための電話帳選択画面を生成し、内線インターフェース部100を介して割当対象電話機2に、この電話帳選択画面を送信する(S2081)。これを受けて、割当対象電話機2は、電話帳選択画面を表示する。そして、ユーザから電話帳選択画面内のいずれかの電話帳データの選択を受け付けると、受け付けた電話帳データのレコード1050の情報を主装置1に送信する。
【0069】
つぎに、指示処理部111は、内線インターフェース部100を介して割当対象電話機2から選択された電話帳データのレコード1050の情報を受信すると(S2082でYES)、このレコード1050に登録されている電話番号を発信先番号として特定する(S2084)。それから、指示処理部111は、発信先番号を、割当対象電話機2に割り当てられたユーザのユーザ情報とともに、呼制御部102に通知して、発信を指示する。その後、図9のS2061に進む。
【0070】
一方、指示処理部111が割当対象電話機2から電話帳データのレコード1050の情報を受信することなく(S2082でNO)、呼制御部102が割当対象電話機2からオンフック信号を受信すると(S2083でYES)、呼制御部102は、中継部103と割当対象電話機2との通話路を解放し、それから図8のS209に進む。
【0071】
つぎに、音声認識サーバ3の詳細を説明する。
【0072】
図12は、音声認識サーバ3の概略機能構成図である。
【0073】
図示するように、音声認識サーバ3は、WANインターフェース部300と、声紋情報記憶部301と、声紋照合処理部302と、音声認識処理部303と、音声認識要求受付部304と、を備えている。
【0074】
WANインターフェース部300は、WAN4に接続するためのインターフェースである。
【0075】
声紋情報記憶部301には、本実施の形態に係る電話システムのユーザ毎に、声紋情報がユーザIDに対応付けられて記憶されている。
【0076】
図13は、声紋情報記憶部301の登録内容例を模式的に表した図である。
【0077】
図示するように、声紋情報記憶部301には、本実施の形態に係る電話システムのユーザ毎に声紋情報のレコード3010が記憶されている。声紋情報のレコード3010は、ユーザIDが登録されたフィールド3011と、ユーザの声紋情報あるいはその格納先が登録されたフィールド3012と、を有する。
【0078】
声紋照合処理部302は、音声認識要求受付部304から受け取った音声データから声紋情報を抽出し、抽出した声紋情報を、声紋情報記憶部301に記憶されている声紋情報と照合する。そして、抽出した声紋情報と一致する声紋情報に対応付けられているユーザIDを音声認識要求受付部304に渡す。
【0079】
音声認識処理部303は、音声認識要求受付部304から受け取った音声データに対する音声認識処理を実施して、その音声認識結果を音声認識要求受付部304に渡す。
【0080】
音声認識要求受付部304は、WANインターフェース部300を介して主装置1から受信した音声認識要求に含まれている音声データを声紋照合処理部302および音声認識処理部303に渡す。そして、声紋照合処理部302および音声認識処理部303から受け取ったユーザIDおよび音声認識結果を主装置1に送信する。
【0081】
図14は、音声認識サーバ3の動作を説明するためのフロー図である。
【0082】
音声認識要求受付部304は、WANインターフェース部300を介して主装置1から音声認識要求を受信すると(S300でYES)、音声認識要求に含まれている音声データを声紋照合処理部302および音声認識処理部303に渡す。
【0083】
これを受けて、声紋照合処理部302は、音声認識要求受付部304から受け取った音声データから声紋情報を抽出し、抽出した声紋情報を、声紋情報記憶部301に記憶されている声紋情報と照合する。そして、抽出した声紋情報と一致する声紋情報に対応付けられているユーザIDを音声認識要求受付部304に渡す(S301)。
【0084】
また、音声認識処理部303は、音声認識要求受付部304から受け取った音声データに対して音声認識処理を実施する。そして、その音声認識結果を音声認識要求受付部304に渡す(S302)。
【0085】
これを受けて、音声認識要求受付部304は、声紋照合処理部302および音声認識処理部303から受け取ったユーザIDおよび音声認識結果を、音声認識要求の送信元である主装置1に送信する(S303)。
【0086】
以上、本発明の一実施の形態について説明した。
【0087】
本実施の形態において、主装置1は、内線電話機2がオフフックされると、この内線電話機2を捕捉して、この内線電話機2から指示内容を表す音声データを受け付ける。そして、この音声データの声紋情報により特定されるユーザに、この内線電話機2を割り当てる。また、この音声データの音声認識結果からユーザの指示内容を解析して、この指示内容に応じた処理を実施するとともに、その実施結果をユーザの操作履歴に記録する。
【0088】
例えば、音声データの音声認識結果から解析されたユーザの指示内容が発信先の固有名称の指定を伴う発信指示である場合、電話帳データ記憶部105から発信先の固有名称を含む電話帳データを検索し、検出した電話帳データに含まれている電話番号への発信処理を実施する。あるいは、音声データの音声認識結果から解析されたユーザの指示内容が発信履歴の表示指示である場合、操作履歴記憶部106に記憶されているユーザの操作履歴から、発信処理の実施結果を抽出して、抽出した発信処理の実施結果をこのユーザに割り当てられた内線電話機2に一覧表示する。そして、この内線電話機2から発信処理の実施結果の選択を受け付けたならば、選択された発信処理の実施結果で指定されている発信先への発信処理を実施する。
【0089】
このように、本実施の形態によれば、ユーザが内線電話機2をオフフックして、この内線電話機2に指示内容を表す音声を入力することにより、この内線電話機2がユーザに割り当てられて、指示内容に応じた処理が実施されるので、ユーザは、内線電話機2に所望の処理を実施させるための操作(指示内容を表す音声を入力)とは別に、この内線電話機2を自身に割り当てるための特別な操作を行う必要がない。したがって、手順が少なく簡素であり、より効率的に電話機をユーザに割り当てることができる。また、ユーザの指示内容に応じた実施結果がこのユーザの操作履歴に記録されるので、ユーザが使用した内線電話機2に依存することなく、このユーザの操作履歴を把握することができる。
【0090】
また、本実施の形態において、主装置1は、発信処理の実施に際し、発信指示を表す音声データの送信元である内線電話機2に割り当てられたユーザのユーザ情報を、発信元情報として接続要求に付加している。これにより、ユーザが使用した内線電話機2に依存することなく、発信先に発信元のユーザを知らせることがきる。
【0091】
また、本実施の形態において、主装置1は、発信処理の実施に際し、発信先と発信指示を表す音声データの送信元である内線電話機2が割り当てられたユーザとの通話を録音し、その録音データおよび発信先を含む発信処理の実施結果を、このユーザの操作履歴に記録している。これにより、ユーザが使用した内線電話機2に依存することなく、このユーザの通話内容を把握することができる。
【0092】
また、本実施の形態において、主装置1は、発信履歴の表示処理に際し、発信履歴の表示指示を表す音声データの送信元である内線電話機2に割り当てられたユーザの操作履歴から抽出した発信処理の実施結果を、電話番号毎にまとめて、発信回数の多い順にこの内線電話機2に一覧表示する。したがって、発信先に選ばれる可能性の高い電話番号を上位に表示することができ、これにより、ユーザの使い勝手を向上させることができる。
【0093】
なお、本発明は上記の実施の形態に限定されるものではなく、その要旨の範囲内で数々の変形が可能である。
【0094】
例えば、上記の実施の形態において、主装置1は、指示内容を示す音声データに対する音声認識処理および声紋照合によるユーザIDの特定処理を音声認識サーバ3に依頼しているが、本発明はこれに限定されない。主装置1に音声認識サーバ3と同様の機能(声紋情報記憶部301、声紋照合処理部302、音声認識処理部303、音声認識要求受付部304)を持たせて、主装置1が自ら指示内容を示す音声データに対する音声認識処理および声紋照合によるユーザIDの特定処理を実施してもよい。
【0095】
また、上記の実施の形態において、主装置1からユーザ情報記憶部104および/または操作履歴記憶部106を省略して、これらを外部のファイルサーバに管理させてもよい。そして、主装置1に、このファイルサーバとのインターフェースを持たせて、ファイルサーバで管理されているユーザ情報記憶部104および/または操作履歴記憶部106にアクセスさせてもよい。
【0096】
また、上記の実施の形態において、主装置1に、電話帳データ記憶部105とは別に、電話システムのユーザ毎に電話帳データを保持させ、内線電話機2を介してユーザから指示内容「電話帳表示」を表す音声データを受信した場合に、このユーザの電話帳データを、この内線電話機2に表示させてもよい。この場合、主装置1に、電話システムのユーザ毎に、操作履歴記憶部106に記憶されているユーザの発信履歴に基づいて、このユーザの電話帳データを更新する電話帳データ更新処理部を設ける。電話帳データ更新処理部は、電話システムのユーザ毎に、該当するユーザに対応付けられて操作履歴記憶部106に記憶されている発信処理の実施結果に含まれている発信先番号が、該当するユーザの電話帳データに登録されているか否かを判断し、登録されていないならば、電話帳データ記憶部105からこの発信先番号を有する電話帳データのレコード1050を検索し、検出した電話帳データのレコード1050を該当するユーザの電話帳データに登録する。
【0097】
また、上記の実施の形態において、指示内容を表す音声データの声紋情報に対応付けられたユーザIDが音声認識サーバ3の声紋情報記憶部301に記憶されていない場合、ユーザIDを新規に発行して、主装置1のユーザ情報記憶部104にユーザ情報を登録してもよい。
【0098】
図15は、本実施の形態に係る電話システムにおけるユーザ情報登録処理の一例を説明するためのシーケンス図である。
【0099】
まず、図2のS100~S105が実施され、主装置1から音声認識サーバ3に、指示内容を表す音声データを含む音声認識要求が送信される(S130)。
【0100】
これを受けて、音声認識サーバ3は、音声認識要求に含まれている音声データから声紋情報を抽出して予め登録されている声紋情報と照合するが、抽出した声紋情報と一致する声紋情報が存在しないものとする。この場合、音声認識サーバ3は、新規にユーザIDを発行し、このユーザIDを抽出した声紋情報に対応付けて登録する(S131)。また、音声認識要求に含まれている音声データに対して音声認識処理を実施する(S132)。それから、音声認識サーバ3は、音声認識結果を、新規発行したユーザIDとともに、主装置1に送信する(S133)。
【0101】
つぎに、主装置1は、予め登録されているユーザ情報のなかから、音声認識サーバ3より受信したユーザIDを含むユーザ情報を検索する。しかし、音声認識サーバ3より受信したユーザIDは、新規発行されたユーザIDであるため、このユーザIDを含むユーザ情報は登録されていない。この場合、主装置1は、指示内容を示す音声データの送信元である内線電話機2との間に確立されている通話路を介して、この内線電話機2に、ユーザ情報の音声入力を促す音声ガイダンスを送信する(S134)。
【0102】
これを受けて、内線電話機2は、主装置1より受信した音声ガイダンスを出力する。そして、ユーザからユーザ情報を表す音声が入力されると(S135)、主装置1との間の通話路を介して、この音声データを主装置1に送信する(S136)。
【0103】
主装置1は、内線電話機2からユーザ情報を表す音声データを受信すると、WAN4を介して音声認識サーバ3に、この音声データを含む音声認識要求を送信する(S137)。これを受けて、音声認識サーバ3は、音声認識要求に含まれている音声データから声紋情報を抽出して予め登録されている声紋情報と照合し、抽出した声紋情報と一致する声紋情報に対応付けられているユーザIDを特定する(S138)。ここでは、S131で新規発行されたユーザIDが特定される。また、音声認識要求に含まれている音声データに対して音声認識処理を実施する(S139)。それから、音声認識サーバ3は、音声認識結果を、特定したユーザIDとともに、主装置1に送信する(S140)。
【0104】
つぎに、主装置1は、音声認識サーバ3から受信した音声認識結果からユーザ情報を抽出し、抽出したユーザ情報を音声認識結果とともに音声認識サーバ3から受信したユーザIDとともに登録する(S141)。それから、S133で音声認識サーバ3から受信したユーザIDおよび音声認識結果に対して、図2のS109~S125が実施される(S142)。
【0105】
また、上記の実施の形態において、主装置1は、発信先の内線番号の指定を伴う接続要求が着信した場合に、この内線番号が割り当てられた内線電話機2を呼び出し、この呼び出しに対する応答を受信することなく所定時間の経過によりタイムアウトしたならば、この内線番号が固定的に割り当てられたユーザが最後に利用した内線電話機2に、着信を転送するようにしてもよい。
【0106】
すなわち、主装置1は、呼制御部102は、WAN4を介して外線電話機5から、あるいは内線インターフェース部100を介して内線電話機2から発信先の内線番号の指定を伴う接続要求を受信すると、この内線番号が割り当てられた内線電話機2を呼び出す。そして、発信先の内線電話機2が呼び出しに応答することなく、所定時間の経過によりタイムアウトすると、呼制御部102は、ユーザ情報記憶部104からこの内線番号を有するユーザ情報のレコード1040を検索し、検出したユーザ情報のレコード1040に含まれているユーザIDを特定する。それから、呼制御部102は、このユーザIDに対応付けられて操作履歴記憶部106に登録されている操作履歴のテーブル1060から、フィールド1063に登録されている指示内容が「発信」であり、かつフィールド1064に登録されている内線番号が呼び出した内線電話機2の内線番号以外の操作履歴のレコード1061を検索し、検出したレコード1061のなかからフィールド1062に登録されている実施日時が最新のレコード1061をさらに検索する。そして、検出したレコード1061のフィールド1064に登録されている内線番号に着信を転送する。
【0107】
また、上記の実施の形態において、図4に示す主装置1の機能構成および図12に示す音声認識サーバ3の機能構成は、ASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)などの集積ロジックICによりハード的に実現されるか、DSP(Digital Signal Processor)等の計算機によりソフトウエア的に実現される。あるいは、CPUと、メモリと、ハードディスク、フラッシュメモリ等の補助記憶装置と、NIC(Network Interface Card)等の通信インターフェースと、を備えたPC(Personal Computer)等の汎用コンピュータにおいて、CPUが所定のプログラムを補助記憶装置からメモリ上にロードして実行することにより実現される。
【符号の説明】
【0108】
1:主装置 2、2-1~2-n:内線電話機
3:音声認識サーバ 4:WAN 5:外線電話機
100:内線インターフェース部
101、300:WANインターフェース部 102:呼制御部
103:中継部 104:ユーザ情報記憶部
105:電話帳データ記憶部 106:操作履歴記憶部
107:音声取得部 108:音声認識要求部
109:ユーザ割当設定部 110:指示内容解析部
111:指示処理部 301:声紋情報記憶部
302:声紋照合処理部 303:音声認識処理部
304:音声認識要求受付部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15