IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

7258686情報処理システム、情報処理方法、及びプログラム
<>
  • -情報処理システム、情報処理方法、及びプログラム 図1
  • -情報処理システム、情報処理方法、及びプログラム 図2
  • -情報処理システム、情報処理方法、及びプログラム 図3
  • -情報処理システム、情報処理方法、及びプログラム 図4
  • -情報処理システム、情報処理方法、及びプログラム 図5
  • -情報処理システム、情報処理方法、及びプログラム 図6
  • -情報処理システム、情報処理方法、及びプログラム 図7
  • -情報処理システム、情報処理方法、及びプログラム 図8
  • -情報処理システム、情報処理方法、及びプログラム 図9A
  • -情報処理システム、情報処理方法、及びプログラム 図9B
  • -情報処理システム、情報処理方法、及びプログラム 図10
  • -情報処理システム、情報処理方法、及びプログラム 図11
  • -情報処理システム、情報処理方法、及びプログラム 図12
  • -情報処理システム、情報処理方法、及びプログラム 図13
  • -情報処理システム、情報処理方法、及びプログラム 図14
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-04-07
(45)【発行日】2023-04-17
(54)【発明の名称】情報処理システム、情報処理方法、及びプログラム
(51)【国際特許分類】
   G06Q 10/10 20230101AFI20230410BHJP
【FI】
G06Q10/10
【請求項の数】 9
(21)【出願番号】P 2019134713
(22)【出願日】2019-07-22
(65)【公開番号】P2021018664
(43)【公開日】2021-02-15
【審査請求日】2021-03-12
(73)【特許権者】
【識別番号】514020389
【氏名又は名称】TIS株式会社
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【弁理士】
【氏名又は名称】内藤 和彦
(72)【発明者】
【氏名】福江 尚史
【審査官】関 博文
(56)【参考文献】
【文献】特開2000-029932(JP,A)
【文献】特開2017-174237(JP,A)
【文献】特開2009-086871(JP,A)
【文献】国際公開第2016/157662(WO,A1)
【文献】国際公開第2019/026617(WO,A1)
【文献】清水 圭一,総務の引き出し ICT スマートスピーカーで働き方が変わる,月刊総務 第56巻 第7号 ,ウィズワークス(株),第56巻,p.34-35
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
マイクロフォンとスピーカとを備えるスピーカ装置から、前記スピーカ装置にアクセスしたユーザを識別可能なユーザ情報を、前記ユーザが会議室に入室したときに取得し、前記ユーザ情報に基づいて、前記会議室の予約を管理する予約管理システムから、前記会議室の予約状況に関する予約情報を取得する取得部と、
前記取得部で取得される前記ユーザ情報と前記予約情報とに基づき前記会議室の会議に参加予定のユーザが揃ったことを特定して、揃ったことが特定された時点で前記会議の参加者の氏名を確認することを示す応答内容を特定する応答内容特定部と、
前記スピーカ装置に前記応答内容に沿って音声出力させるべく、前記応答内容特定部で特定された前記応答内容に基づく音声情報を、前記スピーカ装置に送信する送信部と、
を備える情報処理システム。
【請求項2】
前記応答内容特定部は、前記会議室の会議の終了時間の所定の時間前であることが特定された時点で、前記会議室の利用時間を延長するか否かを問い合わせることを示す前記応答内容を特定する、
請求項に記載の情報処理システム。
【請求項3】
前記取得部は、前記スピーカ装置から、前記ユーザの音声に関する前記ユーザ情報を取得し、
前記情報処理システムは、
前記ユーザの音声に関するユーザ情報に基づき前記会議室の会議に参加したユーザの発言に含まれる感情を分析して、前記分析した感情に基づいて、前記会議室の会議に対して点数を付与する分析部をさらに備え、
前記送信部は、前記分析部で分析された結果である点数を示す分析情報を、前記スピーカ装置に送信する、
ことを特徴とする請求項1または請求項2に記載の情報処理システム。
【請求項4】
前記応答内容特定部は、前記予約情報に基づいて、所定の画像を使用することを示す応答内容である画像応答内容を特定し、
前記情報処理システムは、
前記応答内容特定部で特定された前記画像応答内容に基づいて、前記所定の画像を特定する画像特定部をさらに備え、
前記送信部は、前記スピーカ装置に、前記スピーカ装置に接続された表示装置に前記所定の画像を出力させるべく、前記所定の画像に関する画像情報を送信する、
ことを特徴とする請求項1から請求項の何れか一項に記載の情報処理システム。
【請求項5】
前記応答内容特定部は、前記予約情報に基づいて、過去の議事録を使用することを示す応答内容である議事録応答内容を特定し、
前記情報処理システムは、
前記応答内容特定部で特定された応答内容に基づいて、前記過去の議事録に関する議事録情報を保持する過去データベースから、所定の議事録情報を特定する議事録特定部をさらに備え、
前記送信部は、前記スピーカ装置に、前記スピーカ装置に接続された表示装置に前記議事録を出力させるべく、前記議事録情報を送信する、
ことを特徴とする請求項1から請求項の何れか一項に記載の情報処理システム。
【請求項6】
前記応答内容特定部は、前記予約情報に基づいて、所定のプレゼン資料を使用することを示す応答内容であるプレゼン応答内容を特定し、
前記プレゼン応答内容に基づいて、所定のデータベースから、プレゼン資料を示すプレゼン資料情報を特定するプレゼン特定実行部、
をさらに備え、
前記送信部は、前記スピーカ装置に、前記スピーカ装置に接続された表示装置に前記プレゼン資料を出力させるべく、前記プレゼン資料情報を送信する、
ことを特徴とする請求項1から請求項の何れか一項に記載の情報処理システム。
【請求項7】
前記スピーカ装置
をさらに備えることを特徴とする請求項1から請求項のいずれか一項に記載の情報処理システム。
【請求項8】
コンピュータが、
マイクロフォンとスピーカとを備えるスピーカ装置から、前記スピーカ装置にアクセスしたユーザを識別可能なユーザ情報を、前記ユーザが会議室に入室した際に取得し、前記ユーザ情報に基づいて、前記会議室の予約を管理する予約管理システムから、前記会議室の予約状況に関する予約情報を取得する取得ステップと、
前記取得ステップで取得される前記ユーザ情報と前記予約情報とに基づき前記会議室の会議に参加予定のユーザが揃ったことを特定して、揃ったことが特定された時点で前記会議の参加者の氏名を確認することを示す応答内容を特定する応答内容特定ステップと、
前記スピーカ装置に前記応答内容に沿って音声出力させるべく、前記応答内容特定ステップで特定された前記応答内容に基づく音声情報を、前記スピーカ装置に送信する送信ステップと、
を実行する情報処理方法。
【請求項9】
コンピュータに、
マイクロフォンとスピーカとを備えるスピーカ装置から、前記スピーカ装置にアクセスしたユーザを識別可能なユーザ情報を、前記ユーザが会議室に入室した際に取得し、前記ユーザ情報に基づいて、前記会議室の予約を管理する予約管理システムから、前記会議室の予約状況に関する予約情報を取得させることと、
前記ユーザ情報と前記予約情報とに基づき前記会議室の会議に参加予定のユーザが揃ったことを特定して、揃ったことが特定された時点で前記会議の参加者の氏名を確認することを示す応答内容を特定させることと、
前記スピーカ装置に前記応答内容に沿って音声出力させるべく、特定された前記応答内容に基づく音声情報を、前記スピーカ装置に送信させることと、
を実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理システム、情報処理方法、及びプログラムに関する。
【背景技術】
【0002】
画像センサで検知された画像情報に基づいてスピーカに音声出力させるか否かを決定する決定装置が開示されている(特許文献1)。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2019-35897号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1には、ユーザの居住内に設けられたスピーカにおける音声出力のタイミングを画像情報に基づいて決定する決定装置が開示されている。また、特許文献1に記載の決定装置は、音声情報が途切れたタイミングにおいてスピーカに音声出力させる。特許文献1の決定装置によれば居住内の状況に応じてスピーカに音声出力させることができる。しかしながら、特許文献1に記載の決定装置では、スピーカからユーザに対して能動的に音声出力させることができないため、会議などを円滑に進行させるには不十分であるという問題があった。
【0005】
本発明の目的は、上記のような問題に鑑みてなされたものであり、スピーカを使用するユーザのユーザ情報に基づいて能動的に音声出力するシステムを提供することにある。
【課題を解決するための手段】
【0006】
本発明の一態様に係る情報処理システムは、マイクロフォンとスピーカとを備えるスピーカ装置を使用するユーザに関するユーザ情報を取得するユーザ情報取得部と、前記ユーザ情報取得部で取得された前記ユーザ情報に基づいて、所定の応答内容を特定する応答内容特定部と、前記スピーカ装置に前記所定の応答内容に沿って音声出力させるべく、前記特定部で特定された前記所定の応答内容に基づく音声情報を、前記スピーカ装置に送信する送信部と、を備える。
【0007】
本発明の一態様に係る情報処置方法は、コンピュータが、マイクロフォンとスピーカとを備えるスピーカ装置を使用するユーザに関するユーザ情報を取得するユーザ情報取得ステップと、前記ユーザ情報取得ステップで取得された前記ユーザ情報に基づいて、所定の応答内容を特定する応答内容特定ステップと、前記スピーカ装置に前記所定の応答内容に沿って音声出力させるべく、前記応答内容特定ステップで特定された前記所定の応答内容に基づく音声情報を、前記スピーカ装置に送信する送信ステップと、を実現する。
【0008】
本発明の一態様に係るプログラムは、コンピュータに、マイクロフォンとスピーカとを備えるスピーカ装置を使用するユーザに関するユーザ情報を取得させることと、前記ユーザ情報に基づいて、所定の応答内容を特定させることと、前記スピーカ装置に前記所定の応答内容に沿って音声出力させるべく、特定された前記所定の応答内容に基づく音声情報を、前記スピーカ装置に送信させることと、を実現させる。
【発明の効果】
【0009】
本発明によれば、ユーザ情報に基づき能動的にユーザに対して音声出力することで、ユーザの発言を促すことができる。
【図面の簡単な説明】
【0010】
図1】音声通知システムの構成の一例を示す図である。
図2】音声通知システムにおける処理の概要を示す図である。
図3】応答サーバ装置の機能構成の一例を示す図である。
図4】スピーカ情報テーブルの一例を示す図である。
図5】ユーザ情報テーブルの一例を示す図である。
図6】議事録情報テーブルの一例を示す図である。
図7】画像情報テーブルの一例を示す図である。
図8】応答内容テーブルの一例を示す図である。
図9A】ユーザ情報を取得する方法の一例を示す図である。
図9B】ユーザ情報を取得する方法の他の例を示す図である。
図10】スピーカ装置の機能構成の一例を示す図である。
図11】ユーザ端末装置の機能構成の一例を示す図である。
図12】応答サーバ装置の処理の一例を示すフロー図である。
図13】コンピュータのハードウェア構成の一例を示す図である。
図14】応答サーバ装置の処理の他の例を示すフロー図である。
【発明を実施するための形態】
【0011】
以下に、本発明の一実施形態における音声通知システム1について、図面を参照して詳細に説明する。ただし、以下に説明する実施形態は、あくまでも例示であり、以下に明示しない種々の変形や技術の適用を排除する意図はない。即ち、本発明は、その趣旨を逸脱しない範囲で種々変形し、又は各実施例を組み合わせる等して実施することができる。また、以下の図面の記載において、同一または類似の部分には同一または類似の符号を付して表している。
==構成==
【0012】
図1は、音声通知システム1の構成の一例を示す図である。図1に示すように、音声通知システム1は、例えば、応答サーバ装置10、スピーカ装置20、ユーザ端末装置30を含む。なお、応答サーバ装置10とスピーカ装置20の機能を一のシステムで実現してもよい。また、応答サーバ装置10とスピーカ装置20のそれぞれの機能を、他の複数の装置で実現してもよい。以下、音声通知システム1の各構成要素について説明する。
【0013】
応答サーバ装置10は、スピーカ装置20に所定の音声情報を送信することで、ユーザに対してスピーカ装置20から能動的に発話させる装置である。応答サーバ装置10は、例えばサーバコンピュータなどの情報処理装置で構成され、ネットワーク200を介して、スピーカ装置20、ユーザ端末装置30と接続される。応答サーバ装置10と他の装置との間の各種データの送受信については後述する。
【0014】
なお、音声通知システム1には音声認識サーバ装置(不図示)が含まれていてもよい。この場合、応答サーバ装置10は、音声認識サーバ装置において様々な従来技術を用いてユーザの音声を認識して、ユーザの音声を解析して所定の応答を実行する際の、バックエンドとして機能する。すなわち、後述するスピーカ装置20は、応答サーバ装置10が提供する機能をAPI(Application Programming Interface)で呼び出すことで、応答サーバ装置10の機能を利用してもよい。以下では音声認識サーバ装置の有する機能については適宜省略して説明する。
【0015】
スピーカ装置20は、ユーザからの音声を取得し、該音声を音声情報に変換して応答サーバ装置10に送信する装置である。また、スピーカ装置20から取得した音声情報に基づき発話する。スピーカ装置20は所謂スマートスピーカである。ここで、以下説明の理解を助けるために、スピーカ装置20のハードウェア構成の一例について説明する。スピーカ装置20は、例えば、音声を検出して電気信号に変換するマイクロフォン、応答サーバ装置10から取得する音声情報を音声出力するスピーカ、外部の装置と通信するための通信モジュール、視覚的にスピーカ装置20のステータスを示す表示部、各種操作指示を行うための操作ボタン、サポートオペレータと通信するためのサポートボタン、各構成要素を制御する制御部を備える。なお、サポートボタンの機能については後述する。スピーカ装置20については、様々の種類のものが存在し、例えば、複数マイクロフォン及び複数スピーカを有するものや、上面の外周部に等間隔にマイクロフォンを配設したものや、側面の外周部に等間隔にスピーカを配設したものなどが存在し、その仕様が限定されるものではない。
【0016】
ユーザ端末装置30は、ユーザの端末装置であり例えばスマートフォンである。ユーザ端末装置30は、ネットワーク200を介して応答サーバ装置10に接続され、応答サーバ装置10から送信される各種情報を、図13に示す表示装置107に表示する。ユーザは、ユーザ端末装置30を用いて応答サーバ装置10に各種要求を行う。なお、ユーザ端末装置30は近距離無線通信にてスピーカ装置20に接続されてもよい。
==音声通知システム1の概要==
【0017】
図2は、音声通知システム1における処理の概要を示す図である。図2を参照して、音声通知システム1の動作の概要を説明する。
【0018】
まず、S1において、スピーカ装置20は、スピーカ装置20を識別するためのスピーカ情報を応答サーバ装置10に送信する。これにより応答サーバ装置10においてスピーカ装置20の設置場所や機能などを把握できる。
【0019】
次に、S2において、ユーザ端末装置30は、スピーカ装置20を介してまたは応答サーバ装置10に直接、ユーザ端末装置30を識別するためのユーザ情報を送信する。これにより応答サーバにおいてユーザ端末装置30がどのスピーカ装置20と関連付けられているかを特定される。
【0020】
次に、S3において、応答サーバ装置10は、スピーカ情報とユーザ情報とに基づいて、所定の条件で特定された音声情報をスピーカ装置20に送信する。これにより、スピーカ装置20は、ユーザがスピーカ装置20に対して発話する前に、ユーザにとって適切なタイミングで適切な内容の音声を、スピーカ装置20からユーザに対して発話する。スピーカ装置20から出力される音声の内容やタイミングなどについては後述する。
【0021】
次に、S4において、応答サーバ装置10はスピーカ装置20を介してユーザの音声を音声情報として取得し、該音声情報に基づき特定された音声情報をスピーカ装置20に送信する。これによりユーザにはスピーカ装置20を介して音声にて様々な情報が提供される。提供される情報については後述する。
==音声通知システム1の構成==
【0022】
以下、応答サーバ装置10、スピーカ装置20、ユーザ端末装置30が備える機能について説明する。なお、以下説明においては、理解を容易にするために、一例として、予約管理システム(不図示)にて予約済の会議において、ユーザが所定の会議室に設置されたスピーカ装置20の使用を想定する。
<<応答サーバ装置10>>
【0023】
図3を参照して、応答サーバ装置10の機能構成について説明する。図3は、応答サーバ装置10の機能構成の一例を示す図である。図3に示すとおり、応答サーバ装置10は、記憶部11、スピーカ情報取得部12a、ユーザ情報取得部12b、予約情報取得部12c、認識部13、議事録特定部14、画像特定部15、応答内容特定部16、分析部17、送信部18の機能を有する。応答サーバ装置10が有する機能は、図13に示すプロセッサ101が、記憶装置103に記憶されたコンピュータプログラムを読み込み、実行し、応答サーバ装置10の各構成を制御すること等により実現される。
【0024】
記憶部11は、例えば、スピーカ情報テーブル11a、ユーザ情報テーブル11b、議事録情報テーブル11c、画像情報テーブル11d、応答内容テーブル11eを有する。各テーブルは一例を示すものであり、その内容が特に限定されるものではない。
【0025】
スピーカ情報テーブル11aは、スピーカ情報を格納したテーブルである。図4に示すように、スピーカ情報テーブル11aのデータ構造は、例えばスピーカIDなどの適宜な項目を主キーとして、設置場所、仕様などのデータから成るレコードの集合体である。ここで、スピーカIDとはスピーカを識別する識別符号である。識別符号はユニークな番号であればよい。設置場所とは該スピーカ装置20が設置されている場所であり例えば会議室番号などである。仕様とは該スピーカ装置20の機能仕様である。スピーカ情報テーブル11aの内容は例えば応答サーバ装置10の管理者により適宜更新される。応答サーバ装置10はスピーカ情報テーブル11aを参照することでスピーカ装置20を特定できる。
【0026】
ユーザ情報テーブル11bは、ユーザ情報を格納したテーブルである。図5に示すように、ユーザ情報テーブル11bのデータ構造は、例えばユーザIDなどの適宜な項目を主キーとして、氏名、役職などのデータから成るレコードの集合体である。ここで、ユーザIDとはユーザを識別する識別符号であり、例えば、ユニークな任意の番号、携帯番号、MAC(Media Access Control)アドレス、BD(Bluetooth(登録商標) Device)アドレスなどである。氏名とはユーザの氏名を示す。役職とはユーザの役職を示す。ユーザ情報テーブル11bの内容は例えば応答サーバ装置10の管理者により適宜更新される。応答サーバ装置10はユーザ情報テーブル11bを参照することでスピーカ装置20を使用するユーザを特定できる。
【0027】
議事録情報テーブル11cは、過去の議事録を示す議事録情報を格納したテーブルである。図6に示すように、議事録情報テーブル11cのデータ構造は、例えば議事録IDなどの適宜な項目を主キーとして、議事録内容、会議IDなどのデータから成るレコードの集合体である。ここで、議事録IDとは議事録を識別する識別符号である。議事録内容とは過去の会議における議事録の内容を記録したデータである。会議IDは該議事録に対応する会議を識別する識別符号である。議事録情報テーブル11cの内容は会議終了時に自動的に更新される。応答サーバ装置10は議事録情報テーブル11cを参照することで会議に対応する過去の会議における議事録をユーザに提示することができるため、円滑な会議運営を実現できる。
【0028】
画像情報テーブル11dは、例えば円滑な会議運営に要する画像を格納したテーブルである。図7に示すように、画像情報テーブル11dのデータ構造は、例えば画像IDなどの適宜な項目を主キーとして、画像(動画含む)などのデータから成るレコードの集合体である。ここで、画像とは静止画像または動画像などである。画像には会議で使用されるプレゼンテーション資料などが含まれていてもよい。画像情報テーブル11dの内容は例えば応答サーバ装置10の管理者により適宜更新される。応答サーバ装置10は画像情報テーブル11dを参照することで会議に対応する画像をユーザに提示することができるため、円滑な会議運営を実現できる。
【0029】
応答内容テーブル11eは、例えばユーザ情報や音声情報に対応する応答内容を格納したテーブルである。図8に示すように、応答内容テーブル11eのデータ構造は、例えば応答内容IDなどの適宜な項目を主キーとして、スピーカID、ユーザID、画像ID、議事録ID、キーワード、応答内容などのデータから成るレコードの集合体である。具体的には、応答内容IDには画像IDや議事録IDなど関連付けられている。例えば、応答サーバ装置10は、所定の会議において使用されるスピーカ装置20のスピーカID、会議室で特定されたユーザ端末装置30のユーザIDなどを特定し、それに対応する応答内容IDを特定する。これにより応答内容IDに対応する応答内容を特定する。ここで、応答内容とは、会議、音声情報、ユーザ情報に対応する単文または複文である。応答内容には、音声、画像、議事録などが示され、スピーカ装置20に送信する応答内容が示される。また、キーワードとは、音声情報を変換したテキスト情報における単語などである。応答サーバ装置10は、キーワードに基づいて応答内容を特定することもできる。応答内容テーブル11eの内容は例えば応答サーバ装置10の管理者により適宜更新される。応答サーバ装置10は、応答内容テーブル11eを参照することで、会議またはユーザに対応する音声をスピーカ装置20から出力させることができ、円滑な会議運営を実現できる。
【0030】
スピーカ情報取得部12aは、スピーカ装置20から送信されたスピーカ情報を取得する。取得されたスピーカ情報はスピーカ情報テーブル11aに格納される。
【0031】
ユーザ情報取得部12bは、所定のスピーカ装置20を使用するユーザ端末装置30から送信されたユーザ情報を取得する。ユーザ情報には例えばユーザが使用するスピーカ装置20のスピーカ情報が関連付けられている。ここで、ユーザ情報取得部12bは、ユーザ情報を、ユーザ端末装置30から直接に取得してもよいし、スピーカ装置20を介して取得してもよい。
【0032】
具体的には、図9Aに示すように、応答サーバ装置10がユーザ端末装置30から直接、ユーザ情報を取得する場合、例えば、会議室に掲示されるQRコード(登録商標)または表示装置300に表示されるQRコードをユーザ端末装置30の読取機能で読み取ることで、ユーザ情報に該QRコードに含まれるスピーカ情報が付加され、該ユーザ情報が応答サーバ装置10に送信される。
【0033】
また、図9Bに示すように、応答サーバ装置10がスピーカ装置20を介してユーザ情報を取得する場合、例えば、ユーザ端末装置30はユーザ情報として自己のMACアドレスまたはBDアドレスをスピーカ装置20に送信することで、ユーザ情報とスピーカ情報とが関連付けられ、それらの情報が応答サーバ装置10に送信される。
【0034】
予約情報取得部12cは、予約管理システム(不図示)から、会議室の予約状況を示す予約情報を取得する。予約情報には、例えば、日時、利用者、会議室、利用目的に関する情報が含まれる。これにより、応答サーバ装置10は、例えば、いつ、どのユーザが、どの会議室を、どのような目的で使用するかを特定できる。
【0035】
認識部13は、ユーザ情報取得部12bで取得されたユーザ情報に基づき、スピーカ情報テーブル11aを参照して、ユーザ端末装置30とユーザが使用するスピーカ装置20とを関連付けて認識する。これにより、応答サーバ装置10は、どのユーザがどこの会議室でどのスピーカを使用する状況であるかを特定できる。ここで、応答サーバ装置10は、認識部13で認識されたユーザ情報に対応するユーザにつき、スピーカ装置20に接続された表示装置300に出力してもよい。これにより会議における参加者の出席状況を把握できる。
【0036】
議事録特定部14は、後述する応答内容特定部16で議事録を使用すると特定された場合、応答内容特定部の応答内容に応じて、議事録情報テーブル11cを参照して、過去の会議で作成された所定の議事録を特定する。議事録特定部14は、送信部18を介して特定された所定の議事録をスピーカ装置20に接続された表示装置300に出力してもよい。これにより、ユーザは表示装置300に出力された以前の会議の議事録を確認できるため会議を円滑に進行できる。
【0037】
画像特定部15は、後述する応答内容特定部16で画像を使用すると特定された場合、応答内容特定部の応答内容に応じて、画像情報テーブル11dを参照して、所定の画像を特定する。画像特定部15は、送信部18を介して特定された所定の画像をスピーカ装置20に接続された表示装置300に出力してもよい。これにより会議における議論を円滑に進行できる。
【0038】
応答内容特定部16は、応答内容テーブル11eを参照して、スピーカ情報と関連付くユーザ情報に基づいて、応答内容を特定する。具体的に述べると、ユーザ情報に基づいて会議室に存在するユーザを特定し、該ユーザに対する適当な応答内容を特定する。例えば、予約情報に基づき特定される会議に参加する予定のユーザが、会議室に入室した際に、ユーザ情報取得部12bで取得されるユーザ情報に基づいて、応答内容テーブル11eを参照して、例えば該ユーザの名前を確認する応答内容を特定する。特定された応答内容に基づき生成される音声情報を、送信部18を介してスピーカ装置20に送信する。これによりスピーカ装置20を介して能動的にユーザに向けて音声を出力できる。
【0039】
応答内容特定部16は、その後、例えば取得されたユーザ情報と予約情報とに基づいて、会議に参加予定のユーザが揃ったことが特定された時点で、応答内容テーブル11eを参照して、参加者の氏名を確認する応答内容を特定する。さらに、例えば会議の終了時間が迫っていることが特定された時点で、応答内容テーブル11eを参照して、会議室の利用時間を延長するか否かを問い合わせる応答内容を特定する。特定された応答内容に基づき生成される音声情報をスピーカ装置20に送信する。
【0040】
また、応答内容特定部16は、特定された応答内容に基づいて、過去の議事録を示す議事録情報または会議に対応する画像を使用するか否かを判定する。
【0041】
分析部17は、会議においてユーザが発言した音声に関する音声情報を分析する。具体的に述べると、例えば、分析部17は音声情報に基づいて会議の参加者が使用した感情を分析する。分析部17は、例えば感情を示すタグ付きコーパスに基づいて、分類器を学習させる。分析部17は、ユーザの音声情報をテキスト情報に変換し、例えば所定の自然言語解析手法を用いて単語(形態素)に分解する。該単語を分類器に入力することで音声情報に含まれる感情が分析される。
【0042】
分析部17は、例えば感情を分析した結果に基づいて会議に点数を付与する機能を有していてもよい。例えば、会議全体につきプラスの感情、例えば「喜び」「楽しみ」「期待」などの感情の割合が相対的に多い場合は点数を高く評価し、例えば「嫌悪」「絶望」「落胆」などの感情の割合が相対的に多い場合は点数を低く評価する。評価した結果を示す情報をスピーカ装置20に送信するよう、処理を実行させる。これにより会議の内容を改善する動機をユーザに与える。すなわち応答サーバ装置10はスピーカ装置20を介して会議に能動的に参加し、会議の効率化を図ることができる。
【0043】
また、分析部17は、例えば感情を分析した結果に基づいて会議の雰囲気に適当な音楽を出力する。例えば、会議全体につきマイナスの感情、例えば「嫌悪」「絶望」「落胆」などの感情の割合が相対的に多い場合は心が明るくなるようなジャズ音楽に関する情報をスピーカ装置20に送信し、例えば「怒り」などの感情の割合が相対的に多い場合は心が落ち着くようなクラシック音楽に関する情報をスピーカ装置20に送信するよう、処理を実行させる。これにより会議の内容を改善する動機をユーザに与える。すなわち応答サーバ装置10はスピーカ装置20を介して会議の雰囲気を能動的に改善するよう機能し、会議の効率化を図ることができる。
【0044】
また、分析部17は、例えば、ユーザ情報テーブル11bを参照して、ユーザの音声情報を分析することで、役職の高いユーザの発言が相対的に多いと分析された場合、前述の応答内容特定部16において、役職の高いユーザの発言を控える応答内容を特定し、該応答内容に基づき生成される音声情報をスピーカ装置20に送信するよう、処理を実行させる。これにより会議を活発化し多様な意見を抽出できる。
【0045】
送信部18は、音声情報など各種情報をスピーカ装置20に送信する。
<<スピーカ装置20>>
【0046】
次に、図10を参照して、スピーカ装置20の機能構成について説明する。図10は、スピーカ装置20の機能構成の一例を示す図である。図10に示すとおり、スピーカ装置20は、送受信部21、表示制御部22、およびサポート部23の機能を有する。スピーカ装置20が有する機能は、図13に示す、スピーカ装置20の制御部(プロセッサ101)が、記憶装置103に記憶されたコンピュータプログラムを読み込み、実行し、スピーカ装置20の各構成を制御すること等により実現される。
【0047】
送受信部21は、スピーカ装置20におけるデータの送受信を制御する。例えば、送受信部21は、上述したマイクロフォンに入力された音声に関する音声情報を応答サーバ装置10などの外部装置に送信する。また、送受信部21は、応答サーバ装置10などの外部装置からの各種情報を受信する。
【0048】
表示制御部22は、スピーカ装置20が備える、またはスピーカ装置20に接続された表示装置107(表示装置300)の表示を制御する。例えば、表示制御部22は、管理者の設定操作に必要な各種の画面(ユーザインタフェース)を生成し、表示装置107へ表示することを制御する。
【0049】
サポート部23は、上述したサポートボタンが押下されたことを契機に、スピーカ装置20に不具合が生じたことを示すサポート情報を生成する。サポート部23は、送受信部21を介してサポート情報をサポートセンター(不図示)に送信する。これにより、スピーカ装置20に不具合が生じた場合、管理者が迅速に障害対応できる。
<<ユーザ端末装置30>>
【0050】
次に、図11を参照して、ユーザ端末装置30の機能構成について説明する。図11は、ユーザ端末装置30の機能構成の一例を示す図である。図11に示すとおり、ユーザ端末装置30は、入力部31、送受信部32、および表示制御部33の機能を有する。ユーザ端末装置30が有する機能は、図13に示す、ユーザ端末装置30の制御部(プロセッサ101)が、記憶装置103に記憶されたコンピュータプログラムを読み込み、実行し、ユーザ端末装置30の各構成を制御すること等により実現される。
【0051】
入力部31は、ユーザによるユーザ端末装置30に対する操作に応じて各種の情報を受け付ける。例えば、入力部31は、ユーザによる操作に応じて、応答サーバ装置10にアクセスするための入力を受け付ける。
【0052】
送受信部32は、ユーザ端末装置30におけるデータの送受信を制御する。例えば、送受信部32は、入力部31により入力された情報を応答サーバ装置10などの外部装置に送信する。また、送受信部32は、応答サーバ装置10などの外部装置からの通知や各種情報を受信する。
【0053】
表示制御部33は、ユーザ端末装置30が備える、またはユーザ端末装置30に接続された表示装置107の表示を制御する。例えば、表示制御部33は、管理者の各種操作に必要な各種の画面(ユーザインタフェース)を生成し、表示装置107へ表示することを制御する。
==動作フロー==
【0054】
図12は、応答サーバ装置10の処理の一例を示すフロー図である。図12を参照して、応答サーバ装置10により実行される処理の一例を説明する。
【0055】
まず、S100において、応答サーバ装置10はスピーカ装置20からスピーカ情報を取得する。
【0056】
次に、S101において、応答サーバ装置10はユーザ端末装置30またはスピーカ装置20からユーザ情報を取得する。これにより応答サーバ装置10はユーザがいずれの会議室にいるか認識できる。
【0057】
次に、S102において、応答サーバ装置10はユーザ情報に基づき予約管理システムから予約情報を取得する。これにより応答サーバ装置10はユーザが存在する会議室の予約状況を認識できる。
【0058】
次に、S103において、応答サーバ装置10は、予約情報に基づいて、会議目的に応じた応答内容を特定する。特定された応答内容に基づき、議事録情報テーブル11cまたは画像情報テーブル11dを参照して、会議目的に応じた議事録情報または画像情報を特定する。
【0059】
次に、S104において、応答サーバ装置10は、応答内容テーブル11eを参照して、ユーザ情報に基づく応答内容を特定する。
【0060】
次に、S105において、応答サーバ装置10は、特定された応答内容に関する音声情報をスピーカ装置20に送信する。例えば、スピーカ装置20を介して、会議の冒頭に参加者の氏名を読み上げて出席確認をすることや、会議の目的を音声通知することなどを実行する。これによりスピーカ装置20からユーザに対して能動的に発話するため、会議を円滑に進行できる。
【0061】
次に、S106において、応答サーバ装置10は、議事録情報と画像情報とをスピーカ装置20に送信する。スピーカ装置20は取得した議事録情報と画像情報を表示装置300に出力する。例えば、スピーカ装置20を介して表示装置300に前回の議事録を表示し、会議の目的に応じた写真やグラフなどを表示する。これにより応答サーバ装置10は会議を円滑に進行するために過去の議事録と会議に要する画像をユーザに提供できる。
【0062】
次に、S107において、応答サーバ装置10は会議が終了したか否かを判定する。具体的に述べると、応答サーバ装置10は所定の時間になると会議が終了されたか否かを問いかける音声情報をスピーカ装置20に送信する。例えば、スピーカ装置20から「会議時間が終了します。延長しますか?」という音声を出力する。スピーカ装置20から出力された音声に応じてユーザからの応答を示す音声情報を、スピーカ装置20を介して取得する。例えば、スピーカ装置20を介して、ユーザから「30分延長してください」という音声情報を取得すると、応答サーバ装置10は送信部18を介して予約管理システムに対して会議室の予約時間を30分延長する延長情報を送信する。その後、応答サーバ装置10は、ユーザの音声情報に基づいて、応答内容テーブル11eを参照して、会議が終了したか否かを判定する。
【0063】
会議が終了したと判定した場合(S107:NO)、S104から処理を繰り返す。これによりユーザの音声情報に応じた応答内容を特定する。
【0064】
会議が終了したと判定した場合(S107:YES)、会議内容を分析する(S108)。分析結果をスピーカ装置20に送信する。これによりユーザそれぞれが会議において改善すべき点を把握できる。例えば、「本日の会議は70点です」や「B部長話しすぎです」という音声を出力する。
==音声通知システム1のハードウェア構成==
【0065】
図13を参照して、応答サーバ装置10、スピーカ装置20およびユーザ端末装置30をコンピュータ100により実現する場合のハードウェア構成の一例を説明する。なお、それぞれの装置の機能は、複数台の装置に分けて実現することもできる。また、スピーカ装置20における一部のハードウェア構成については上述したとおりである。
【0066】
図13は、コンピュータのハードウェア構成の一例を示す図である。図13に示すように、コンピュータ100は、プロセッサ101と、メモリ102と、記憶装置103と、入力I/F部104と、データI/F部105と、通信I/F部106、及び表示装置107を含む。
【0067】
プロセッサ101は、メモリ102に記憶されているプログラムを実行することによりコンピュータ100における各種の処理を制御する制御部である。
【0068】
メモリ102は、例えばRAM(Random Access Memory)等の記憶媒体である。メモリ102は、プロセッサ101によって実行されるプログラムのプログラムコードや、プログラムの実行時に必要となるデータを一時的に記憶する。
【0069】
記憶装置103は、例えばハードディスクドライブ(HDD)やフラッシュメモリ等の不揮発性の記憶媒体である。記憶装置103は、オペレーティングシステムや、上記各構成を実現するための各種プログラムを記憶する。
【0070】
入力I/F部104は、ユーザからの入力を受け付けるためのデバイスである。入力I/F部104の具体例としては、キーボードやマウス、タッチパネル、各種センサ、ウェアラブル・デバイス等が挙げられる。入力I/F部104は、例えばUSB(Universal Serial Bus)等のインタフェースを介してコンピュータ100に接続されても良い。
【0071】
データI/F部105は、コンピュータ100の外部からデータを入力するためのデバイスである。データI/F部105の具体例としては、各種記憶媒体に記憶されているデータを読み取るためのドライブ装置等がある。データI/F部105は、コンピュータ100の外部に設けられることも考えられる。その場合、データI/F部105は、例えばUSB等のインタフェースを介してコンピュータ100へと接続される。
【0072】
通信I/F部106は、コンピュータ100の外部の装置と有線又は無線により、インターネットNを介したデータ通信を行うためのデバイスである。通信I/F部106は、コンピュータ100の外部に設けられることも考えられる。その場合、通信I/F部106は、例えばUSB等のインタフェースを介してコンピュータ100に接続される。
【0073】
表示装置107は、各種情報を表示するためのデバイスである。表示装置107の具体例としては、例えば液晶ディスプレイや有機EL(Electro-Luminescence)ディスプレイ、ウェアラブル・デバイスのディスプレイ等が挙げられる。表示装置107は、コンピュータ100の外部に設けられても良い。その場合、表示装置107は、例えばディスプレイケーブル等を介してコンピュータ100に接続される。また、入力I/F部104としてタッチパネルが採用される場合には、表示装置107は、入力I/F部104と一体化して構成することが可能である。
==他の実施形態==
【0074】
応答内容特定部16は、例えば会議室の予約管理を行ってもよい。例えば、応答内容特定部16は、予約情報に基づいて、応答内容テーブル11eを参照して、スピーカ装置20を介して会議室にユーザがいるか否かを問いかける応答内容を特定する。これにつき、図14を参照して具体的に述べると、まず、応答サーバ装置10は予約管理システムから予約情報を取得する(S200)。次に、応答サーバ装置10は、現時点において会議室が予約されているか否かを判定する(S201)。会議室が予約されていると判定した場合(S201:YES)、スピーカ装置20から音声情報を取得することで、会議室に人がいるか否かを判定する(S202)。会議室に人がいると判定した場合(S202:YES)、応答内容特定部16は、予約情報に基づいて、応答内容テーブル11eを参照して、会議室を予約した人の氏名を問いかける応答内容(「あなたは誰ですか?」など)を特定し、送信部18を介して該応答内容に関する音声情報をスピーカ装置20に送信する(S203)。一方、会議室に人がいないと判定した場合(S202:NO)、応答内容特定部16は誰かがいるかを問いかける応答内容(「誰かいますか?」など)を特定し、送信部18を介して該応答内容に関する音声情報をスピーカ装置20に送信する。ここで、スピーカ装置20からの問いかけに対して返答がなかった場合、予約管理システムの予約をキャンセルする(S204)。また、会議室が予約されていない場合(S201:NO)、スピーカ装置20から音声情報を取得することで、会議室に人がいるか否かを判定する(S205)。会議室に人がいると判定した場合(S205:YES)、応答内容特定部16は予約するか否かを問いかける応答内容(「予約しますか?」など)を特定し、送信部18を介して該応答内容に関する音声情報をスピーカ装置20に送信する(S206)。これにより応答サーバ装置10は会議室の予約状況に対して能動的に機能するため、会議室の有効活用を図ることができる。
【0075】
応答サーバ装置10は、プレゼン特定実行部(不図示)の機能をさらに有していてもよい。プレゼン特定実行部は、例えばクラウド上で公開されているプレゼン資料データベース(不図示)を参照し、ユーザ情報に基づき応答内容特定部16で特定された応答内容に基づいて、プレゼン資料を特定する。例えば、応答内容における所定のキーワードを特定し、該キーワードに関するプレゼン資料を特定する。プレゼン特定実行部は、送信部18を介して、特定されたプレゼン資料に関する情報をスピーカ装置20に送信するとともに、プレゼン資料に記載されているテキスト情報を音声情報に変換し、該音声情報をスピーカ装置20に送信する。これにより応答サーバ装置10はスピーカ装置20を介してユーザに対して能動的にプレゼン資料を提供するとともに、プレゼン資料の内容につき音声案内することができるため、会議の効率化を図ることができる。
【0076】
また、プレゼン特定実行部(不図示)は、予約情報に基づいて、会議室の利用目的におけるキーワードを特定し、該キーワードに関するプレゼン資料を特定してもよい。プレゼン特定実行部は、送信部18を介して特定されたプレゼン資料に関する情報をスピーカ装置20に送信する。そして、プレゼン資料に記載されているテキスト情報を音声情報に変換し、送信部18を介して該音声情報をスピーカ装置20に送信する。これにより応答サーバ装置10において会議の目的に適したプレゼン資料を自動的に特定されるため、会議を円滑に進行できる。
【0077】
応答内容特定部16は、例えばスピーカ装置20を介してプレゼン実行中におけるユーザの質問に応答する応答内容を特定する機能を有していてもよい。まず、応答内容特定部16は質問に関する音声情報をテキスト情報に変換する。次に、応答内容特定部16は該テキスト情報に対応する応答内容を応答内容テーブル11eから取得する。具体的に述べると、例えばテキスト情報を解析してキーワードを抽出する。抽出されたキーワードに基づいて、応答内容テーブル11eを検索するとともに、質問の種別(人名、地名、数量など)を特定する。検索により応答内容テーブル11eから抽出された応答内容の中から、特定された質問の種別に対応する言葉を特定することで、回答を特定する。これにより応答サーバ装置10は能動的にプレゼンを実行するとともに、ユーザの質問に対する回答をも行うため会議を円滑に進行できる。
【0078】
応答サーバ装置10は、例えば会議の議事録を作成する議事録作成部(不図示)の機能をさらに有していてもよい。議事録作成部は、例えばスピーカ装置20を介して取得したユーザの音声情報をテキスト情報に変換し、所定の様式に議事録として該テキスト情報を入力する。テキスト情報が入力された所定の様式を示す情報をユーザ端末装置30に送信するよう、処理を実行させる。これによりユーザにおいて議事録作成にかかる作業を軽減できる。
【0079】
応答サーバ装置10は、例えばユーザ端末装置30からユーザ情報を取得することに代えてスピーカ装置20で取得するユーザの音声をユーザ情報として取得してもよい。この場合、応答サーバ装置10はユーザごとの声紋に関する声紋情報を格納する声紋情報データベース(不図示)を備え、取得した音声情報と声紋情報とを照合してユーザを特定する。これによりユーザ端末装置30を所持していないユーザを認識できるため、音声通知システム1の確実な運用を実現できる。
【0080】
応答サーバ装置10は、例えばユーザ端末装置30からユーザ情報を取得することに代えてカメラ装置(不図示)から取得するユーザの顔に関する顔情報をユーザ情報として取得してもよい。この場合、応答サーバ装置10はユーザごとの顔情報を格納する顔情報データベース(不図示)を備え、取得した顔情報と顔情報データベースに格納されている顔情報とを照合してユーザを特定する。これによりユーザ端末装置30を所持していないユーザを認識できるため、音声通知システム1の確実な運用を実現できる。
【0081】
応答サーバ装置10は、例えば各種機能を実行するタイミングを計る計時部(不図示)をさらに有していてもよい。計時部において所定の時間や所定の時間経過を計ることで、応答サーバ装置10は所定の時間に所定の機能を実行し所定の時間経過時に所定の機能を実行することができる。これにより応答サーバ装置10は適切なタイミングで能動的に機能を発揮できるため、会議を円滑に進行できる。
【0082】
上記において、スピーカ装置20は会議室に設置されているものとして説明したがこれに限定されない。スピーカ装置20を不特定多数のユーザが利用する場所に設置できる。これにより、音声通知システム1は、例えば、個人宅、集合住宅のエントランス、お店、集会場など様々な場所において、能動的にユーザに対して発話する。様々な場所でユーザに対して能動的に音声出力することで、ユーザの発言を促すことができる。
【0083】
なお、述した実施の形態は本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。本発明はその趣旨を逸脱することなく変更、改良され得るとともに、本発明にはその等価物も含まれる。
【符号の説明】
【0084】
1…音声通知システム、10…応答サーバ装置、11…記憶部、12a…スピーカ情報取得部、12b…ユーザ情報取得部、12c…予約情報取得部、13…認識部、14…議事録特定部、15…画像特定部、16…応答内容特定部、17…分析部、18…送信部、20…スピーカ装置、30…ユーザ端末装置
図1
図2
図3
図4
図5
図6
図7
図8
図9A
図9B
図10
図11
図12
図13
図14