IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ パナソニックIPマネジメント株式会社の特許一覧

<>
  • 特許-音声制御システム、及び、音声制御方法 図1
  • 特許-音声制御システム、及び、音声制御方法 図2
  • 特許-音声制御システム、及び、音声制御方法 図3
  • 特許-音声制御システム、及び、音声制御方法 図4
  • 特許-音声制御システム、及び、音声制御方法 図5
  • 特許-音声制御システム、及び、音声制御方法 図6
  • 特許-音声制御システム、及び、音声制御方法 図7
  • 特許-音声制御システム、及び、音声制御方法 図8
  • 特許-音声制御システム、及び、音声制御方法 図9
  • 特許-音声制御システム、及び、音声制御方法 図10
  • 特許-音声制御システム、及び、音声制御方法 図11
  • 特許-音声制御システム、及び、音声制御方法 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-06-13
(45)【発行日】2024-06-21
(54)【発明の名称】音声制御システム、及び、音声制御方法
(51)【国際特許分類】
   G10L 15/22 20060101AFI20240614BHJP
   G10L 13/00 20060101ALI20240614BHJP
【FI】
G10L15/22 460D
G10L15/22 300U
G10L13/00 100M
【請求項の数】 9
(21)【出願番号】P 2020115318
(22)【出願日】2020-07-03
(65)【公開番号】P2022013035
(43)【公開日】2022-01-18
【審査請求日】2023-04-14
(73)【特許権者】
【識別番号】314012076
【氏名又は名称】パナソニックIPマネジメント株式会社
(74)【代理人】
【識別番号】100109210
【弁理士】
【氏名又は名称】新居 広守
(74)【代理人】
【識別番号】100137235
【弁理士】
【氏名又は名称】寺谷 英作
(74)【代理人】
【識別番号】100131417
【弁理士】
【氏名又は名称】道坂 伸一
(72)【発明者】
【氏名】吉川 彩衣
【審査官】毛利 太郎
(56)【参考文献】
【文献】特開2020-046126(JP,A)
【文献】特開2018-019313(JP,A)
【文献】特開2006-227135(JP,A)
【文献】特開2015-107867(JP,A)
【文献】中国特許出願公開第104692198(CN,A)
【文献】特開2019-152051(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 13/00 - 25/93
(57)【特許請求の範囲】
【請求項1】
音声UI(User Interface)装置に入力されるユーザの発話音声によって指示される機器の制御を実行するための情報を取得する第一取得部と、
取得された前記情報が示す前記制御の実行に対する確認の要否の設定を示す設定情報を取得する第二取得部と、
取得された前記設定情報に基づいて、前記制御を実行する前に前記音声UI装置に前記確認のための確認音声を出力させる実行部とを備え
前記設定情報においては、前記確認の要否が、前記機器を含む複数の機器のそれぞれに対して個別に定められ、
前記制御は、前記複数の機器の一括制御であり、
前記実行部は、
前記複数の機器の中に前記確認が必要であると設定されている機器が含まれる場合に、前記一括制御を実行する前に前記音声UI装置に前記確認音声を出力させ、
前記複数の機器の中に前記確認が必要であると設定されている機器が含まれない場合に、前記一括制御を実行する前に前記音声UI装置に前記確認音声を出力させない
音声制御システム。
【請求項2】
前記設定情報の内容は、前記音声UI装置に入力される発話音声に基づいて変更される
請求項1に記載の音声制御システム。
【請求項3】
さらに、情報端末と通信する通信部を備え、
前記設定情報の内容は、前記情報端末への手動入力に基づいて変更される
請求項1または2に記載の音声制御システム。
【請求項4】
前記実行部は、制御装置を介して前記機器の制御を実行し、
前記設定情報の内容は、前記制御装置への手動入力に基づいて変更される
請求項1~のいずれか1項に記載の音声制御システム。
【請求項5】
前記設定情報の内容は、前記機器が前記音声制御システムに登録されるときに変更可能である
請求項1~のいずれか1項に記載の音声制御システム。
【請求項6】
前記機器は、施設に設置され、
前記設定情報の内容は、前記音声制御システムが前記施設に導入されるときに変更可能である
請求項1~のいずれか1項に記載の音声制御システム。
【請求項7】
前記機器は、施設に設置され、
前記音声制御システムは、さらに、
前記音声UI装置と、
前記発話音声に対して音声認識処理を行うことにより前記情報を送信する、前記施設外に位置するコンピュータとを備え、
前記第一取得部は、前記コンピュータによって送信された前記情報を取得する
請求項1~のいずれか1項に記載の音声制御システム。
【請求項8】
コンピュータによって実行される音声制御方法であって、
音声UI装置に入力されるユーザの発話音声によって指示される機器の制御を実行するための情報を取得する第一取得ステップと、
取得された前記情報が示す前記制御の実行に対する確認の要否の設定を示す設定情報を取得する第二取得ステップと、
取得された前記設定情報に基づいて、前記制御を実行する前に前記音声UI装置に前記確認のための確認音声を出力させる実行ステップとを含み、
前記設定情報においては、前記確認の要否が、前記機器を含む複数の機器のそれぞれに対して個別に定められ、
前記制御は、前記複数の機器の一括制御であり、
前記実行ステップにおいては、
前記複数の機器の中に前記確認が必要であると設定されている機器が含まれる場合に、前記一括制御を実行する前に前記音声UI装置に前記確認音声を出力させ、
前記複数の機器の中に前記確認が必要であると設定されている機器が含まれない場合に、前記一括制御を実行する前に前記音声UI装置に前記確認音声を出力させない
音声制御方法。
【請求項9】
請求項に記載の音声制御方法を前記コンピュータに実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声制御システム、及び、音声制御方法に関する。
【背景技術】
【0002】
VPA(Virtual Personal Assistant)と呼ばれるサービスが普及し始めている。このようなVPAの一形態として音声で機器を操作するサービスがある。特許文献1には、ネットワークに接続可能な集音機器が音声情報を収集し、収集した音声情報に基づいて、ネットワークを介して家電機器を制御する家電機器制御システムが開示されている。
【先行技術文献】
【特許文献】
【0003】
【文献】国際公開第2014/171144号
【発明の概要】
【発明が解決しようとする課題】
【0004】
本発明は、機器の制御を意図した発話音声が入力された後に当該制御の実行確認を行うか否かを切り替えることができる音声制御システム、及び、音声制御方法を提供する。
【課題を解決するための手段】
【0005】
本発明の一態様に係る音声制御システムは、音声UI(User Interface)装置に入力されるユーザの発話音声によって指示される機器の制御を実行するための情報を取得する第一取得部と、取得された前記情報が示す前記制御の実行に対する確認の要否の設定を示す設定情報を取得する第二取得部と、取得された前記設定情報に基づいて、前記制御を実行する前に前記音声UI装置に前記確認のための確認音声を出力させる実行部とを備える。
【0006】
本発明の一態様に係る音声制御方法は、音声UI装置に入力されるユーザの発話音声によって指示される機器の制御を実行するための情報を取得する第一取得ステップと、取得された前記情報が示す前記制御の実行に対する確認の要否の設定を示す設定情報を取得する第二取得ステップと、取得された前記設定情報に基づいて、前記制御を実行する前に前記音声UI装置に前記確認のための確認音声を出力させる実行ステップとを含む。
【0007】
本発明の一態様に係るプログラムは、前記音声制御方法をコンピュータに実行させるためのプログラムである。
【発明の効果】
【0008】
本発明の一態様に係る音声制御システム及び音声制御方法は、機器の制御を意図した発話音声が入力された後に当該制御の実行確認を行うか否かを切り替えることができる。
【図面の簡単な説明】
【0009】
図1図1は、実施の形態に係る音声制御システムの機能構成を示すブロック図である。
図2図2は、機器を個別制御するときのユーザと音声UI装置の対話の第一の例を示す図である。
図3図2は、機器を個別制御するときのユーザと音声UI装置の対話の第二の例を示す図である。
図4図4は、機器の個別制御に対するアクション設定の設定画面の第一の例を示す図である。
図5図5は、機器の個別制御に対するアクション設定の設定画面の第二の例を示す図である。
図6図6は、機器の個別制御に対するアクション設定の設定画面の第三の例を示す図である。
図7図7は、実施の形態に係る音声制御システムの動作例1のシーケンス図である。
図8図8は、実施の形態に係る音声制御システムの動作例2のシーケンス図である。
図9図9は、シーン制御を実行するための制御情報の一例を示す図である。
図10図10は、シーン制御に対するアクション設定の設定画面の第一の例を示す図である。
図11図11は、シーン制御に対するアクション設定の設定画面の第二の例を示す図である。
図12図12は、シーン制御に対するアクション設定の判定動作のフローチャートである。
【発明を実施するための形態】
【0010】
以下、実施の形態について、図面を参照しながら具体的に説明する。なお、以下で説明する実施の形態は、いずれも包括的または具体的な例を示すものである。以下の実施の形態で示される数値、形状、材料、構成要素、構成要素の配置位置及び接続形態、ステップ、ステップの順序などは、一例であり、本発明を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、独立請求項に記載されていない構成要素については、任意の構成要素として説明される。
【0011】
なお、各図は模式図であり、必ずしも厳密に図示されたものではない。また、各図において、実質的に同一の構成に対しては同一の符号を付し、重複する説明は省略または簡略化される場合がある。
【0012】
(実施の形態)
[構成]
まず、実施の形態に係る音声制御システムの構成について説明する。図1は、実施の形態に係る音声制御システムの機能構成を示すブロック図である。
【0013】
実施の形態に係る音声制御システム100は、ユーザの発話音声に基づいて、施設80に設置された機器50を制御することができるシステムである。つまり、音声制御システム100は、音声に基づく機器制御システムである。施設80は、例えば、集合住宅または戸建住宅などの住宅であるが、オフィスなどの住宅以外の施設であってもよい。
【0014】
図1に示されるように、音声制御システム100は、音声UI装置10と、音声認識サーバ20と、機器制御サーバ30と、制御装置40と、複数の機器50と、携帯端末60とを備える。
【0015】
まず、音声UI装置10について説明する。音声UI装置10は、ユーザの発話音声が入力される情報端末であり、入力された発話音声の音声信号を、インターネットなどの広域通信ネットワーク70を介して音声認識サーバ20へ送信する。音声UI装置10は、例えば、施設80に設置されるスマートスピーカである。なお、図1では、音声UI装置10とは別に制御装置40が記載されているが、制御装置40自体が音声UI装置10として使用されてもよい。同様に、図1では、音声UI装置10とは別に携帯端末60が記載されているが、携帯端末60自体が音声UI装置10として使用されてもよい。音声UI装置10は、具体的には、マイクロフォン11、表示部12、及び、スピーカ13を有する。
【0016】
マイクロフォン11は、ユーザが発する音声(発話音声)を取得する。マイクロフォン11は、具体的には、コンデンサマイク、ダイナミックマイク、または、MEMS(Micro Electro Mechanical Systems)マイクなどである。
【0017】
表示部12は、画像の表示機能、及び、ユーザの手動入力を受け付ける機能を有する表示デバイスである。表示部12は、タッチパネル、及び、液晶パネルまたは有機ELパネルなどの表示パネルによって実現される。タッチパネルは、例えば、静電容量方式のタッチパネルであるが、抵抗膜方式のタッチパネルであってもよい。
【0018】
スピーカ13は、マイクロフォン11によって取得された発話音声への応答として、音声(機械音声)を出力する。これにより、ユーザは対話形式で機器50を制御することができる(詳細は後述)。
【0019】
次に、音声認識サーバ20について説明する。音声認識サーバ20は、施設80外に位置するコンピュータである。音声認識サーバ20は、具体的には、音声UI装置10によって送信される音声信号を受信し、受信した音声信号に対して音声認識処理を行うクラウドサーバである。音声認識サービスを提供する事業者は、音声認識サーバ20を用いて当該音声認識サービスを提供する。音声認識サーバ20は、例えば、音声UI装置10によって送信される音声信号をテキスト情報に変換し、テキスト情報を機器制御サーバ30に送信する。
【0020】
次に、機器制御サーバ30について説明する。施設80外に位置するコンピュータである。機器制御サーバ30は、具体的には、音声認識サーバ20から送信されるテキスト情報に基づいて制御命令を生成し、生成した制御命令を制御装置40に送信するクラウドサーバである。制御命令は、制御装置40を介して機器50によって受信される。機器制御サーバ30は、通信部31と、情報処理部32と、記憶部33とを備える。
【0021】
通信部31は、機器制御サーバ30が広域通信ネットワーク70を介して、音声UI装置10、音声認識サーバ20、制御装置40、及び、携帯端末60などと通信を行うための通信モジュール(通信回路)である。通信部31によって行われる通信は、例えば、有線通信であるが、無線通信であってもよい。通信に用いられる通信規格についても特に限定されない。
【0022】
情報処理部32は、機器50の制御に関する情報処理を行う。情報処理部32は、例えば、マイクロコンピュータによって実現されるが、プロセッサによって実現されてもよい。情報処理部32は、第一取得部34と、第二取得部35と、実行部36とを有する。第一取得部34、第二取得部35、及び、実行部36の機能の詳細については後述する。
【0023】
記憶部33は、機器50の制御の実行に対する確認の要否の設定を示す設定情報、及び、情報処理部32が実行する制御プログラムなどが記憶される記憶装置である。記憶部33は、例えば、HDD(Hard Disc Drive)などによって実現される。
【0024】
次に、制御装置40について説明する。制御装置40は、例えば、エネルギーマネジメント機能を有するHEMS(Home Energy Management System)コントローラである。制御装置40は、施設80内に設置され、施設80に設置された複数の機器50の電気使用量(言い換えれば、消費電力量)を管理する。また、制御装置40は、ユーザの音声に基づいて施設80内(あるいは、施設80の敷地内)に設置された複数の機器50の制御を行う。制御装置40は、HEMSコントローラに限定されず、エネルギーマネジメント機能を有しない他のホームコントローラ、または、ゲートウェイ装置であってもよい。
【0025】
制御装置40は、具体的には、表示部41と、第一通信部42と、第二通信部43と、制御部44と、記憶部45とを備える。
【0026】
表示部41は、画像の表示機能、及び、ユーザの手動入力を受け付ける機能を有する表示デバイスである。表示部41は、タッチパネル、及び、液晶パネルまたは有機ELパネルなどの表示パネルによって実現される。タッチパネルは、例えば、静電容量方式のタッチパネルであるが、抵抗膜方式のタッチパネルであってもよい。
【0027】
第一通信部42は、制御装置40が、複数の機器50などと局所通信ネットワークを介して通信を行うための通信モジュール(通信回路)である。第一通信部42は、例えば、無線通信を行う無線通信回路であるが、有線通信を行う有線通信回路であってもよい。第一通信部42が行う通信の通信規格は、例えば、ECHONET Lite(登録商標)であるが、特に限定されない。第一通信部42は、通信相手の機器50に応じて異なる通信規格で通信を行ってもよい。
【0028】
第二通信部43は、制御装置40が、音声UI装置10、音声認識サーバ20、機器制御サーバ30、及び、携帯端末60などと広域通信ネットワーク70を介して通信を行うための通信回路である。第二通信部43は、例えば、無線通信を行う無線通信回路であるが、有線通信を行う有線通信回路であってもよい。第二通信部43が行う通信の通信規格については特に限定されない。
【0029】
制御部44は、機器50の制御に関する情報処理を行う。制御部44は、例えば、マイクロコンピュータによって実現されるが、プロセッサまたは専用回路によって実現されてもよい。
【0030】
記憶部45は、制御部44が実行する制御プログラムなどが記憶される記憶装置である。記憶部45は、例えば、半導体メモリによって実現される。
【0031】
次に、複数の機器50について説明する。複数の機器50は、施設80に設置される、音声制御システム100における制御対象機器である。複数の機器50は、制御装置40の第一通信部42から送信される制御命令によって制御される。複数の機器50には、空調機器51、照明機器52、電動シャッター53、及び、電気錠54などが含まれる。
【0032】
空調機器51は、一般家庭用の空調機器である。空調機器51は、熱交換器(図示せず)などを有することにより、空調機器51から送出される風の温度の調整が可能な空調機器である。つまり、空調機器51は、温度調整機能(送風機能及び冷暖房機能)を有する。空調機器51は、一般家庭用の空調機器に限定されず、産業用の空調機器であってもよい。
【0033】
照明機器52は、施設80の中(室内)を照明する。照明機器52は、例えば、シーリングライトであるが、照明機器52の具体的態様は、特に限定されない。照明機器52は、ダウンライト、ペンダントライト、スポットライト、または、ブラケットライトなどであってもよい。また、照明機器52は、施設80の外(室外)を照明する機器であってもよい。
【0034】
電動シャッター53は、施設80が有する窓の外側(または内側)に配置され、施設80内への外光の取り入れ量を調整する。電動シャッター53は、例えば、電動ブラインドなどであり、物理的に光の遮蔽物が開閉する構成を有する。電動シャッター53は、液晶パネルなどを備え、物性的に光の透過率が変化する構成であってもよい。
【0035】
電気錠54は、施設80が有するドア(または窓など)の開錠及び施錠を制御する防犯機器である。電気錠54は、例えば、カードキーなどから鍵情報を取得するRFIDリーダを備える。また、電気錠54は、指紋などの生体情報を鍵情報として取得する生体センサを備えてもよい。以下の実施の形態では、電気錠54は、玄関のドアに設けられた電気錠であるものとして説明される。
【0036】
次に、携帯端末60について説明する。携帯端末60は、ユーザが設定情報の内容を変更するために操作する携帯型の情報端末であり、具体的には、スマートフォンまたはタブレット端末などである。携帯端末60は、表示部61を有する。
【0037】
表示部61は、画像の表示機能、及び、ユーザの手動入力を受け付ける機能を有する表示デバイスである。表示部61は、タッチパネル、及び、液晶パネルまたは有機ELパネルなどの表示パネルによって実現される。タッチパネルは、例えば、静電容量方式のタッチパネルであるが、抵抗膜方式のタッチパネルであってもよい。
【0038】
[機器の制御の概要]
音声制御システム100において、ユーザは音声UI装置10との対話形式で機器50を制御することができる。図2及び図3は、機器50を制御するときのユーザと音声UI装置10の対話の一例を示す図である。
【0039】
図2の例では、(a)ユーザが「エアコンをつけて」と発話すると、(b)音声UI装置10は、「エアコンをスイッチオンしました」と応答し、空調機器51が動作を開始する。一方、図3の例では、(a)ユーザが「エアコンをつけて」と発話すると、(b)音声UI装置10は、「エアコンをスイッチオンしてもよいですか?」と応答する。これに対して、(c)ユーザが「はい」と発話すると、(d)音声UI装置10は、「エアコンをスイッチオンしました」と応答し、空調機器51が動作を開始する。
【0040】
図2のようにユーザが一度発話するだけで機器50を制御することができる構成(以下、シングルアクション構成とも記載される)は、簡単に機器50を制御することができるが、音声の誤認識などより機器50が誤作動してしまう可能性がある。一方、図3では、音声UI装置10から本当に機器50制御してもよいかの確認音声(確認メッセージ)が出力されるため、ユーザは二度発話しなければ機器50を制御できない構成(以下、ダブルアクション構成とも記載される)である。この構成では、機器50が誤作動してしまうことが抑制される。
【0041】
このように音声に基づいて機器50を制御する際に、シングルアクション構成を採用するか、ダブルアクション構成を採用するかは、システムの設計者等により定められることが一般的である。これに対し、音声制御システム100においては、シングルアクション構成を採用するか、ダブルアクション構成を採用するかの設定(以下、アクション設定とも記載される)をユーザが変更することができる。これにより、ユーザの好みに応じた機器50の音声制御が実現される。なお、アクション設定(つまり、機器50の制御の実行に対する確認の要否の設定)を示す設定情報は、機器制御サーバ30の記憶部33に記憶される。
【0042】
なお、音声制御システム100では、ユーザは施設80内で発話し、これに基づいて施設80に設置される機器50が制御される。しかしながら、発話音声の音声信号は、施設80外に位置する音声認識サーバ20に送信される。このため、音声制御システム100における機器50の制御は、施設80外からの遠隔制御とみなされ、機器50の制御は、電安法などの法律を遵守する観点から慎重に実行される必要がある。ダブルアクション構成は、慎重に機器50を制御するための手法の一例である。
【0043】
[アクション設定の変更方法]
次に、アクション設定の変更方法(記憶部33に記憶される設定情報の設定内容の変更方法)について説明する。ユーザは、音声制御システム100の導入時に、携帯端末60を操作することによりユーザ登録を行う。このとき、ユーザは、音声制御システム100の利用規約に同意する必要がある。アクション設定は、例えば、利用規約への同意と合わせて携帯端末60への手動入力に基づいて行われる。図4は、アクション設定の設定画面の第一の例を示す図である。
【0044】
図4の例では、ダブルアクションがデフォルト設定となっており、シングルアクションに設定することへのリスクを示すメッセージが表示されている。これにより、ユーザは、このようなリスクを認識したうえで、シングルアクションへ設定変更することができる。なお、携帯端末60の表示部61によってアクション設定を変更する手動入力が受け付けられると、設定変更を指示する情報が携帯端末60から機器制御サーバ30へ送信され、記憶部33に記憶された設定情報に変更内容が反映される。
【0045】
また、音声制御システム100のユーザは、制御装置40を操作することにより、事前に制御装置40に機器50を登録(無線接続)する必要がある。そこで、アクション設定は、機器50の登録時に、制御装置40への手動入力に基づいて行われてもよい。図5は、アクション設定の設定画面の第二の例を示す図である。なお、制御装置40の表示部41によってアクション設定を変更する手動入力が受け付けられると、設定変更を指示する情報が制御装置40から機器制御サーバ30へ送信され、記憶部33に記憶された設定情報に変更内容が反映される。
【0046】
また、図5の例では、施設80に設置された複数の機器50は、一括してシングルアクション及びダブルアクションのいずれかに設定される。言い換えれば、記憶部33に記憶される設定情報においては、確認音声の要否が複数の機器50に対して1つ定められる。しかしながら、施設80に設置された複数の機器50は、個別にシングルアクション及びダブルアクションのいずれかに設定されてもよい。言い換えれば、記憶部33に記憶される設定情報においては、確認音声の要否が、施設80に設置された複数の機器50のそれぞれに対して個別に定められてもよい。図6は、このようなアクション設定の設定画面の第三の例を示す図である。
【0047】
なお、図示されないが、図6のような設定画面において、複数の機器50のアクション設定を一括して変更するためのオブジェクト(一括変更ボタン)が設けられてもよい。また、図6のアクション設定画面は一例である。設定画面は、当該設定画面においてチェックを入れた機器50だけがシングルアクションに設定変更されるような設定画面であってもよい。
【0048】
以上、アクション設定の変更方法について説明したが、アクション設定の変更方法は、上記に限定されない。例えば、アクション設定の変更は、音声UI装置10が備える表示部12への手動入力によって行われてもよいし、音声UI装置10が備えるマイクロフォン11への音声入力によって行われてもよい。この場合、設定変更を指示する情報が音声UI装置10から(例えば、音声認識サーバ20を介して)機器制御サーバ30へ送信され、記憶部33に記憶された設定情報に変更内容が反映される。
【0049】
アクション設定の変更は、音声UI装置10、制御装置40、及び、携帯端末60の少なくとも1つを通じて行われればよく、音声制御システム100の導入時(例えば、利用規約に同意するとき)に行われてもよいし、音声制御システム100の導入後(例えば、機器50の登録時)に行われてもよい。いずれのケースにおいても、アクション設定は、機器50ごとに個別に変更されてもよいし、複数の機器50に対して一括変更されてもよい。
【0050】
[動作例1:シングルアクションに設定された機器の制御]
次に、シングルアクションに設定された機器50を制御するときの音声制御システム100の動作について説明する。図7は、このような音声制御システム100の動作例1のシーケンス図である。
【0051】
ユーザが機器50の制御を意図した音声を発すると、音声UI装置10のマイクロフォン11は、この発話音声(例えば、図2の(a))を取得する(S11)。音声UI装置10は、取得した発話音声の音声信号を音声認識サーバ20へ送信する(S12)。
【0052】
音声認識サーバ20は音声信号を受信すると、受信した音声信号(つまり、発話音声)に対して音声認識処理を行う(S13)。音声認識サーバ20は、具体的には、受信した音声信号をテキスト情報に変換し、テキスト情報を機器制御サーバ30に送信する。
【0053】
機器制御サーバ30の第一取得部34は、通信部31を介して音声認識サーバ20からテキスト情報を取得する(S14)。テキスト情報は、機器50の制御を実行するための情報の一例である。なお、音声認識サーバ20はテキスト情報をコマンド情報(後述の制御命令に類似する情報)に変換し、第一取得部34は、通信部31を介して音声認識サーバ20からコマンド情報を取得してもよい。この場合のコマンド情報は、機器50の制御を実行するための情報の別の一例である。
【0054】
第二取得部35は、記憶部33から設定情報を取得する(S15)。実行部36は、第一取得部34によって取得されたテキスト情報に基づいてユーザが意図する制御の制御対象の機器50を特定し、第二取得部35によって取得された設定情報に基づいて、特定した機器50のアクション設定を判定する(S16)。例えば、テキスト情報が「エアコンをつけて」というテキストを示す場合、実行部36は、設定情報において空調機器51に紐づけられたアクション設定を参照することで、空調機器51のアクション設定を判定することができる。
【0055】
動作例1では、実行部36は、機器50がシングルアクションに設定されていると判定し、制御命令を通信部31に制御装置40へ送信させる(S17)。上述のようにテキスト情報が「エアコンをつけて」というテキストを示す場合、実行部36は、空調機器51をオンするための制御命令を通信部31に送信させる。
【0056】
制御装置40の第二通信部43は、制御命令を機器制御サーバ30から受信する。制御部44は、受信された制御命令を第一通信部42に機器50(この場合、空調機器51へ送信させる(S18)。機器50は、制御命令を受信すると制御命令にしたがって動作(または停止)する(S19)。そして、機器50は、動作(または停止)が完了したことを示す完了応答を制御装置40へ送信する(S20)。
【0057】
制御装置40の第一通信部42は、完了応答を機器50から受信する。制御部44は、受信された完了応答を第二通信部43に機器制御サーバ30へ送信させる(S21)。
【0058】
機器制御サーバ30の通信部31は、完了応答を受信する。実行部36は、完了応答が受信されると、完了通知を通信部31に音声認識サーバ20へ送信させる(S22)。
【0059】
音声認識サーバ20は、完了通知を受信すると、音声UI装置10へ完了通知を送信する(S23)。音声UI装置10は、完了通知を受信すると、受信した完了通知に基づいてスピーカ13から完了音声(例えば、図2の(b))を出力する(S24)。
【0060】
このように、実行部36は、記憶部33に記憶された設定情報に基づいて機器50がシングルアクションに設定(制御の実行確認が不要に設定)されていると判定すると、音声UI装置10に確認音声を出力させずに機器50の制御を実行する。これにより、ユーザが確認音声に対する応答(つまり、2度目の発話)を煩わしく感じてしまうことが抑制される。
【0061】
[動作例2:ダブルアクションに設定された機器の制御]
次に、ダブルアクションに設定された機器50を制御するときの音声制御システム100の動作について説明する。図8は、このような音声制御システム100の動作例2のシーケンス図である。
【0062】
ステップS11~ステップS15の処理は、動作例1と同様である。ステップS15の後、実行部36は、第一取得部34によって取得されたテキスト情報に基づいてユーザが意図する制御の制御対象の機器50を特定し、第二取得部35によって取得された設定情報に基づいて、特定した機器50のアクション設定を判定する(S31)。例えば、テキスト情報が「エアコンをつけて」というテキストを示す場合、実行部36は、設定情報において空調機器51に紐づけられたアクション設定を参照することで、空調機器51のアクション設定を判定することができる。
【0063】
動作例2では、実行部36は、機器50がダブルアクションに設定されていると判定し、音声UI装置10に確認音声を出力させるための確認命令を通信部31に音声認識サーバ20へ送信させる(S32)。
【0064】
音声認識サーバ20は、確認命令を受信すると、音声UI装置10へ確認命令を送信する(S33)。音声UI装置10は、確認命令を受信すると、受信した確認命令に基づいてスピーカ13から確認音声(例えば、図3の(b))を出力する(S34)。
【0065】
ユーザが機器50の制御に同意することを意図した音声を発すると、音声UI装置10のマイクロフォン11は、この発話音声(例えば、図3の(c))を取得する(S35)。音声UI装置10は、取得した発話音声の音声信号を音声認識サーバ20へ送信する(S36)。
【0066】
音声認識サーバ20は音声信号を受信すると、受信した音声信号(つまり、発話音声)に対して音声認識処理を行う(S37)。音声認識サーバ20は、具体的には、受信した音声信号をテキスト情報に変換し、テキスト情報を機器制御サーバ30に送信する。
【0067】
機器制御サーバ30の第一取得部34は、通信部31を介して音声認識サーバ20からテキスト情報を取得する(S38)。
【0068】
実行部36は、取得されたテキスト情報がユーザが機器50の制御に同意することを示すと判定し、制御命令を通信部31に制御装置40へ送信させる(S17)。上述のようにテキスト情報が「エアコンをつけて」というテキストを示す場合、実行部36は、空調機器51をオンするための制御命令を通信部31に送信させる。以降の処理は、動作例1と同様である。
【0069】
なお、ステップS35で取得された発話音声がユーザが機器50の制御に同意しないことを意図した音声である場合、ステップS38の後、実行部36は、取得されたテキスト情報がユーザが機器50の制御に同意しないことを示すと判定し、ステップS17以降の処理を行わない。
【0070】
このように、実行部36は、記憶部33に記憶された設定情報に基づいて機器50がダブルアクションに設定(制御の実行確認が必要に設定)されていると判定すると、機器50の制御を実行する前に音声UI装置10に確認音声を出力させる。これにより、発話音声の誤認識などによって機器50が誤作動してしまうことが抑制される。
【0071】
[シーン制御に対するアクション設定]
ところで、音声制御システム100のユーザは、発話音声により、シーン制御(定型アクションなどと呼ばれる場合もある)を実行することもできる。シーン制御は、施設80内を所定の室内環境に近づけるために、施設80内に配置された2以上の機器50を一括して動作させる制御である。図9は、シーン制御を実行するための制御情報の一例を示す図である。
【0072】
シーン制御の制御情報においては、起床、外出、及び、就寝などの生活シーン(シーン名称)のそれぞれに対して、機器50の制御内容が紐づけられている。例えば、ユーザは、音声UI装置10に対して「「帰宅」を有効にして」と発話すると、機器制御サーバ30の実行部36は、記憶部33に記憶された制御情報を参照して機器50を制御する。この結果、空調機器51及び照明機器52があらかじめ登録された設定(明るさ、設定温度など)でオンし、電動シャッター53が開く。シーン制御を実行するときの動作シーケンスは、動作例1または動作例2と同様である。「帰宅」のシーン制御の実行が指示されたときに、どのような機器50がどのような動作を行うかは、ユーザが設定することができる。
【0073】
ここで、音声制御システム100は、シーン制御に対してもアクション設定が可能であってもよい。言い換えれば、設定情報は、シーン制御(複数の機器50の一括制御)の実行に対する確認の要否の設定を示す情報であってもよい。図10は、シーン制御に対するアクション設定の設定画面の第一の例を示す図である。
【0074】
図10の例では、機器50を個別に制御するときのアクション設定と、シーン制御(複数の機器50の一括制御)を実行するときのアクション設定とが区別されている。ユーザは、機器50を個別に制御するときにはダブルアクション設定、シーン制御を行うときには、シングルアクション設定というような設定が可能である。
【0075】
図10の例では、登録された全てのシーン制御は、一括してシングルアクション及びダブルアクションのいずれかに設定される。言い換えれば、記憶部33に記憶される設定情報においては、確認音声の要否が複数のシーン制御に対して1つ定められる。しかしながら、複数のシーン制御は、個別にシングルアクション及びダブルアクションのいずれかに設定されてもよい。言い換えれば、記憶部33に記憶される設定情報においては、確認音声の要否が、複数のシーン制御のそれぞれに対して個別に定められてもよい。図11は、このようなシーン制御に対するアクション設定の設定画面の第二の例を示す図である。
【0076】
なお、図示されないが、図11のような設定画面において、複数のシーン制御のアクション設定を一括して変更するためのオブジェクト(一括変更ボタン)が設けられてもよい。また、図11の設定画面は一例である。設定画面は、当該設定画面においてチェックを入れたシーン制御だけがシングルアクションに設定変更されるような設定画面であってもよい。
【0077】
なお、図10及び図11は、制御装置40の表示部41への手動入力によってシーン制御に対するアクション設定の変更が行われる例を示しているが、シーン制御に対するアクション設定の変更は、上述した個別制御に対するアクション設定の変更と同様に、音声UI装置10、制御装置40、及び、携帯端末60の少なくとも1つを通じて行われればよい。
【0078】
[シーン制御時のアクション設定の判定]
また、音声制御システム100は、シーン制御に対してはアクション設定が不可能であり、実行部36は、シーン制御の制御対象の複数の機器50に対するアクション設定に基づいてシーン制御のアクション設定をシングルアクションにするかダブルアクションにするかを判定してもよい。図12は、シーン制御に対するアクション設定の判定動作のフローチャートである。なお、図12に示される判定動作は、複数の機器50が個別にシングルアクション及びダブルアクションのいずれかに設定されることが前提となる。
【0079】
まず、機器制御サーバ30の第一取得部34は、シーン制御を意図したユーザの発話音声に基づくテキスト情報を、通信部31を介して音声認識サーバ20から取得する(S41)。
【0080】
次に、第二取得部35は、記憶部33から設定情報を取得する(S42)。実行部36は、第一取得部34によって取得されたテキスト情報に基づいてユーザが意図するシーン制御の制御対象となる複数の機器50を特定し(S43)、第二取得部35によって取得された設定情報に基づいて、特定した複数の機器50のアクション設定を特定する(S44)。
【0081】
次に、実行部36は、ステップS44の特定結果に基づいて、ステップS43で特定した制御対象の複数の機器50の中にダブルアクションに設定されている機器が含まれるか否かを判定する(S45)。
【0082】
実行部36は、複数の機器50の中にダブルアクションに設定されている機器50が含まれると判定すると(S45でYes)、音声UI装置10に確認音声を出力させた後(S46)、ユーザが意図するシーン制御を実行する(S47)。言い換えれば、実行部36は、シーン制御に対するアクション設定をダブルアクション設定とみなし、シーン制御を実行する前に音声UI装置10に確認音声を出力させる。
【0083】
一方、実行部36は、複数の機器50の中にダブルアクションに設定されている機器50が含まれないと判定すると(S45でNo)、音声UI装置10に確認音声を出力させずにユーザが意図するシーン制御を実行する(S47)。言い換えれば、実行部36は、シーン制御に対するアクション設定をシングルアクション設定とみなし、シーン制御を実行する前に音声UI装置10に確認音声を出力させない。
【0084】
このように、実行部36は、設定情報が示す複数の機器50のそれぞれの設定に基づいて、シーン制御を実行する前に音声UI装置10に確認音声を出力させる。これにより、音声制御システム100は、シーン制御に対するアクション設定を省略して、複数の機器50の一括制御の前に確認音声を出力するか否かの切り換えを実現することができる。
【0085】
なお、図12の判定動作は一例である。例えば、ステップS45では、制御対象の複数の機器50の中にシングルアクションに設定されている機器が含まれるか否かが判定されてもよい。この場合、実行部36は、複数の機器50の中にシングルアクションに設定されている機器50が含まれると判定すると、シーン制御を実行する前に音声UI装置10に確認音声を出力させ、複数の機器50の中にシングルアクションに設定されている機器50が含まれないと判定すると、シーン制御を実行する前に音声UI装置10に確認音声を出力させない。
【0086】
また、実行部36は、制御対象の複数の機器50に含まれるシングルアクションに設定されている機器50の数、及び、制御対象の複数の機器50に含まれるダブルアクションに設定されている機器50の数に基づいて、シーン制御に対するアクション設定を多数決で決定してもよい。
【0087】
[効果等]
以上説明したように、音声制御システム100は、音声UI装置10に入力されるユーザの発話音声によって指示される機器50の制御を実行するための情報を取得する第一取得部34と、取得された情報が示す上記制御の実行に対する確認の要否の設定を示す設定情報を取得する第二取得部35と、取得された設定情報に基づいて、上記制御を実行する前に音声UI装置10に上記確認のための確認音声を出力させる実行部36とを備える。
【0088】
このような音声制御システム100は、機器50の制御の前に確認音声を出力するか否かを設定情報に基づいて切り替えることができる。つまり、音声制御システム100は、機器50の制御を意図した発話音声が入力された後に当該制御の実行確認を行うか否かを切り替えることができる。
【0089】
また、例えば、設定情報においては、確認の要否が、機器50を含む複数の機器50に対して1つ定められる。
【0090】
このような音声制御システム100は、機器50の制御の前に確認音声を出力するか否かを一括して設定することができる。
【0091】
また、例えば、設定情報においては、確認の要否が、機器50を含む複数の機器50のそれぞれに対して個別に定められる。
【0092】
このような音声制御システム100は、機器50の制御の前に確認音声を出力するか否かを機器50ごとに個別に設定することができる。
【0093】
また、例えば、設定情報の内容は、音声UI装置10に入力される発話音声に基づいて変更される。
【0094】
このような音声制御システム100によれば、ユーザは、設定情報の内容を発話音声(音声入力)によって変更することができる。
【0095】
また、例えば、音声制御システム100は、さらに、情報端末と通信する通信部31を備える。設定情報の内容は、情報端末への手動入力に基づいて変更される。情報端末は、例えば、音声UI装置10、制御装置40、または、携帯端末60である。
【0096】
このような音声制御システム100によれば、ユーザは、設定情報の内容を音声UI装置10、制御装置40、または、携帯端末60への手動入力によって変更することができる。
【0097】
また、例えば、実行部36は、制御装置40を介して機器50の制御を実行し、設定情報の内容は、制御装置40への手動入力に基づいて変更される。
【0098】
このような音声制御システム100によれば、ユーザは、制御装置40への手動入力によって変更することができる。
【0099】
また、例えば、上記制御は、機器50を含む複数の機器50の一括制御である。設定情報は、一括制御の実行に対する確認の要否の設定を示す。
【0100】
このような音声制御システム100は、複数の機器50の一括制御の前に確認音声を出力するか否かを設定情報に基づいて切り替えることができる。つまり、音声制御システム100は、複数の機器50の一括制御の前に確認音声を出力するか否かの切り換えを実現することができる。
【0101】
また、例えば、上記制御は、複数の機器50の一括制御であり、実行部36は、設定情報が示す複数の機器50のそれぞれの設定に基づいて、一括制御を実行する前に音声UI装置10に確認音声を出力させる。
【0102】
このような音声制御システム100は、複数の機器50の一括制御の前に確認音声を出力するか否かを複数の機器50の個別の設定に基づいて切り替えることができる。つまり、音声制御システム100は、複数の機器50の一括制御に対する設定を省略して、複数の機器50の一括制御の前に確認音声を出力するか否かの切り換えを実現することができる。
【0103】
また、例えば、実行部36は、複数の機器50の中に確認が必要であると設定されている機器50が含まれる場合に、一括制御を実行する前に音声UI装置10に確認音声を出力させ、複数の機器50の中に確認が必要であると設定されている機器50が含まれない場合に、一括制御を実行する前に音声UI装置10に確認音声を出力させない。
【0104】
このような音声制御システム100は、一括制御の対象となる複数の機器50の中に1つでも確認が必要であると設定された機器50があるときに、確認音声を出力することができる。
【0105】
また、例えば、設定情報の内容は、機器50が音声制御システム100に登録されるときに変更可能である。
【0106】
このような音声制御システム100によれば、ユーザは、機器50の音声制御システム100への登録時に設定情報の内容を変更することができる。
【0107】
また、例えば、機器50は、施設80に設置され、設定情報の内容は、音声制御システム100が施設80に導入されるときに変更可能である。
【0108】
このような音声制御システム100によれば、ユーザは、音声制御システム100が施設80に導入されるときに設定情報の内容を変更することができる。
【0109】
また、例えば、機器50は、施設80に設置され、音声制御システム100は、さらに、音声UI装置10と、発話音声に対して音声認識処理を行うことにより上記情報を送信する、施設80外に位置する音声認識サーバ20とを備える。第一取得部34は、音声認識サーバ20によって送信された上記情報を取得する。音声認識サーバ20は、コンピュータの一例である。
【0110】
このような音声制御システム100は、施設80外に位置する音声認識サーバ20を利用して音声認識処理を行うことができる。
【0111】
また、音声制御システム100などのコンピュータが実行する音声制御方法は、音声UI装置10に入力されるユーザの発話音声によって指示される機器50の制御を実行するための情報を取得する第一取得ステップと、取得された情報が示す上記制御の実行に対する確認の要否の設定を示す設定情報を取得する第二取得ステップと、取得された設定情報に基づいて、上記制御を実行する前に音声UI装置10に確認のための確認音声を出力させる実行ステップとを含む。
【0112】
このような音声制御方法は、機器50の制御の前に確認音声を出力するか否かを設定情報に基づいて切り替えることができる。つまり、音声制御方法は、機器50の制御を意図した発話音声が入力された後に当該制御の実行確認を行うか否かを切り替えることができる。
【0113】
(その他の実施の形態)
以上、実施の形態について説明したが、本発明は、上記実施の形態に限定されるものではない。
【0114】
例えば、上記実施の形態では、音声制御システムは、複数の装置によって実現されたが、単一の装置によって実現されてもよい。例えば、音声制御システムは、上記実施の形態の機器制御サーバに相当する単一の装置として実現されてもよい。音声制御システムが複数の装置によって実現される場合、各システムが備える構成要素(機能)は、複数の装置にどのように振り分けられてもよい。例えば、上記実施の形態では、音声認識処理は、音声認識サーバによって行われたが、音声UI装置または制御装置などの他の装置によって行われてもよい。
【0115】
また、例えば、上記実施の形態における装置間の通信方法については特に限定されるものではない。また、装置間の通信においては、図示されない中継装置が介在してもよい。また、上記実施の形態で説明された情報の伝達経路は、シーケンス図に示される伝達経路に限定されない。
【0116】
また、上記実施の形態において、特定の処理部が実行する処理を別の処理部が実行してもよい。また、複数の処理の順序が変更されてもよいし、複数の処理が並行して実行されてもよい。
【0117】
また、上記実施の形態において、各構成要素は、各構成要素に適したソフトウェアプログラムを実行することによって実現されてもよい。各構成要素は、CPUまたはプロセッサなどのプログラム実行部が、ハードディスクまたは半導体メモリなどの記録媒体に記録されたソフトウェアプログラムを読み出して実行することによって実現されてもよい。
【0118】
また、各構成要素は、ハードウェアによって実現されてもよい。例えば、各構成要素は、回路(または集積回路)でもよい。これらの回路は、全体として1つの回路を構成してもよいし、それぞれ別々の回路でもよい。また、これらの回路は、それぞれ、汎用的な回路でもよいし、専用の回路でもよい。
【0119】
また、本発明の全般的または具体的な態様は、システム、装置、方法、集積回路、コンピュータプログラムまたはコンピュータ読み取り可能なCD-ROMなどの記録媒体で実現されてもよい。また、システム、装置、方法、集積回路、コンピュータプログラム及び記録媒体の任意な組み合わせで実現されてもよい。
【0120】
例えば、本発明は、上記実施の形態に係る制御装置またはこれに相当する音声制御システムとして実現されてもよい。また、本発明は、音声制御システムなどのコンピュータが実行する音声制御方法として実現されてもよいし、このような音声制御方法をコンピュータに実行させるためのプログラムとして実現されてもよい。本発明は、このようなプログラムが記録されたコンピュータ読み取り可能な非一時的な記録媒体として実現されてもよい。
【0121】
その他、各実施の形態に対して当業者が思いつく各種変形を施して得られる形態、または、本発明の趣旨を逸脱しない範囲で各実施の形態における構成要素及び機能を任意に組み合わせることで実現される形態も本発明に含まれる。
【符号の説明】
【0122】
10 音声UI装置
20 音声認識サーバ(コンピュータ)
31 通信部
34 第一取得部
35 第二取得部
36 実行部
40 制御装置
50 機器
100 音声制御システム
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12