(58)【調査した分野】(Int.Cl.,DB名)
前記判断ステップにおいて音声認識が不可能であると判断された場合に、前記機器制御ステップにて特定された前記環境音を発している機器のうち、制御対象となる所定の機器の運転状態および制御内容を、ユーザに提示する提示ステップを含む、
請求項1に記載の機器制御方法。
前記環境音取得ステップは、前記第1の運転状況取得ステップにおいて取得した前記複数の機器の前記第1の時間における運転状況と一致する運転状況が前記データベースに記憶されていない場合、前記複数の機器の周囲の環境音を取得する請求項1〜4のいずれかに記載の機器制御方法。
【発明を実施するための形態】
【0010】
(本開示の基礎となった知見)
音声認識により機器を制御する際に、家庭内の他の機器により発せられる環境音(ノイズ)によって命令が正しく認識されないおそれがある。そのため、音声入力時にノイズを除去する必要がある。特許文献1では、環境音をマイクで取得して、雑音解析を行うことによってノイズを除去している。特許文献1の
図4のステップS5〜S6の処理では、定常的な雑音が大きく変化したか否かを検出し、定常的な雑音が大きく変化していなければ雑音解析処理は行われない。しかしながら、定常的な雑音の大きな変化は頻繁に発生するため、結果として常に雑音解析処理を行わなければならないことになる。例えば、特許文献1の段落0056等に記載されているように、エアコンの送風が弱から強へ変更された際には、その都度雑音解析処理を行わなければならない。その結果、処理が遅くなり、音声コマンドを受け付ける状態になるまでに時間がかかるという問題が発生する可能性がある。
【0011】
上記考察により、本発明者らは本開示の各態様を想到するに至った。
【0012】
本開示の一局面に係る機器制御方法は、ユーザからの音声コマンドに基づいて複数の機器を制御する機器制御方法であって、第1の時間に複数の機器の周囲の環境音を取得する環境音取得ステップと、ネットワークを介して複数の機器の第1の時間における運転状況を取得する第1の運転状況取得ステップと、第1の運転状況取得ステップにおいて取得した第1の時間における運転状況と、環境音取得ステップにおいて第1の時間に取得した環境音とを関連付けてデータベースに記憶するデータベース管理ステップと、を含む。
【0013】
この構成によれば、第1の時間に複数の機器の周囲の環境音が取得され、ネットワークを介して複数の機器の第1の時間における運転状況が取得され、取得した第1の時間における運転状況と、第1の時間に取得した環境音とが関連付けられてデータベースに記憶される。
【0014】
したがって、音声コマンドが入力された際の複数の機器の運転状況に対応する環境音をデータベースから取得し、取得した環境音に基づいて音声コマンドに含まれるノイズを除去することにより、過剰な雑音解析処理を行うことなく、より確実に音声認識を行うことができる。
【0015】
また、上記の機器制御方法において、第1の時間とは異なる第2の時間にユーザからの音声コマンドを取得する音声コマンド取得ステップと、ネットワークを介して複数の機器の第2の時間における運転状況を取得する第2の運転状況取得ステップと、第2の運転状況取得ステップにおいて取得した複数の機器の第2の時間における運転状況と一致する運転状況がデータベースに記憶されている場合に、運転状況に関連付けてデータベースに記憶されている環境音に基づいて、音声コマンドからノイズを除去するノイズ除去ステップと、をさらに含むことが好ましい。
【0016】
この構成によれば、第1の時間とは異なる第2の時間にユーザからの音声コマンドが取得され、ネットワークを介して複数の機器の第2の時間における運転状況が取得され、取得した複数の機器の第2の時間における運転状況と一致する運転状況がデータベースに記憶されている場合に、運転状況に関連付けてデータベースに記憶されている環境音に基づいて、音声コマンドからノイズが除去される。
【0017】
したがって、音声コマンドに含まれるノイズ(環境音)を確実に除去することができ、より確実に音声認識を行うことができる。
【0018】
また、上記の機器制御方法において、第1の時間とは異なる第2の時間にユーザからの音声コマンドを取得する音声コマンド取得ステップと、ネットワークを介して複数の機器の第2の時間における運転状況を取得する第2の運転状況取得ステップと、第2の運転状況取得ステップにおいて取得した複数の機器の第2の時間における運転状況と一致する運転状況がデータベースに記憶されている場合に、運転状況に関連付けてデータベースに記憶されている環境音から予測される音環境で、音声認識が可能であるか否かを判断する判断ステップと、判断ステップにおいて判断された結果をユーザに提示する提示ステップと、をさらに含むことが好ましい。
【0019】
この構成によれば、第1の時間とは異なる第2の時間にユーザからの音声コマンドが取得され、ネットワークを介して複数の機器の第2の時間における運転状況が取得され、取得した複数の機器の第2の時間における運転状況と一致する運転状況がデータベースに記憶されている場合に、運転状況に関連付けてデータベースに記憶されている環境音から予測される音環境で、音声認識が可能であるか否かが判断され、判断された結果がユーザに提示される。
【0020】
したがって、環境音の影響により音声認識が困難である場合に、ユーザに対して機器の運転状況の変更を促すことができ、音声認識の妨げとなる環境音を低減させることができる。
【0021】
また、上記の機器制御方法において、第1の時間とは異なる第2の時間にユーザからの音声コマンドを取得する音声コマンド取得ステップと、ネットワークを介して複数の機器の第2の時間における運転状況を取得する第2の運転状況取得ステップと、第2の運転状況取得ステップにおいて取得した複数の機器の第2の時間における運転状況と一致する運転状況がデータベースに記憶されている場合に、運転状況に関連付けてデータベースに記憶されている環境音から予測される音環境で、音声認識が可能であるか否かを判断する判断ステップと、判断ステップにおいて音声認識が不可能であると判断された場合に、複数の機器のうち、環境音を発している機器を制御する機器制御ステップと、をさらに含むことが好ましい。
【0022】
この構成によれば、第1の時間とは異なる第2の時間にユーザからの音声コマンドが取得され、ネットワークを介して複数の機器の第2の時間における運転状況が取得され、取得した複数の機器の第2の時間における運転状況と一致する運転状況がデータベースに記憶されている場合に、運転状況に関連付けてデータベースに記憶されている環境音から予測される音環境で、音声認識が可能であるか否かが判断され、音声認識が不可能であると判断された場合に、複数の機器のうち、環境音を発している機器が制御される。
【0023】
したがって、音声認識が不可能であると判断された場合に、複数の機器のうち、環境音を発している機器が制御されるので、音声認識の妨げとなる環境音を低減することができ、より確実に音声認識を行うことができる。
【0024】
また、上記の機器制御方法において、データベースは、過去に音声認識が成功したか否かを、運転状況に関連付けてさらに記憶しており、機器制御ステップは、判断ステップにおいて音声認識が不可能であると判断された場合に、データベースに記憶されている過去に音声認識に成功した運転状況で運転するように、複数の機器を制御することが好ましい。
【0025】
この構成によれば、音声認識が不可能であると判断された場合に、データベースに記憶されている過去に音声認識に成功した運転状況で運転するように、複数の機器が制御されるので、機器の制御が容易となり、より確実に音声認識を行うことができる。
【0026】
また、上記の機器制御方法において、判断ステップは、第2の運転状況取得ステップにおいて取得した複数の機器の第2の時間における運転状況と一致する運転状況がデータベースに記憶されている場合に、運転状況に関連付けてデータベースに記憶されている環境音の音量が、音声認識が可能な所定の音量以下であるか否かを判断することにより、音声認識が可能であるか否かを判断することが好ましい。
【0027】
この構成によれば、運転状況に関連付けてデータベースに記憶されている環境音の音量が、音声認識が可能な所定の音量以下であるか否かを判断することにより、音声認識が可能であるか否かを容易に判断することができる。
【0028】
また、上記の機器制御方法において、音声コマンドの入力が一定時間以上無いことを検知する音声検知ステップをさらに含み、環境音取得ステップは、音声検知ステップにおいて音声コマンドの入力が一定時間以上無いことが検知された場合、複数の機器の周囲の環境音を取得することが好ましい。
【0029】
この構成によれば、ユーザによって発話された音声コマンド以外の不要な音が環境音として取得されるので、音声コマンドに含まれる環境音を確実に除去することができる。
【0030】
また、上記の機器制御方法において、複数の機器の周囲に存在する人を検知する人検知ステップをさらに含み、環境音取得ステップは、人検知ステップにおいて人が検知されない場合、複数の機器の周囲の環境音を取得することが好ましい。
【0031】
この構成によれば、ユーザによって発話された音声コマンド以外の不要な音が環境音として取得されるので、音声コマンドに含まれる環境音を確実に除去することができる。
【0032】
また、上記の機器制御方法において、環境音取得ステップは、第1の運転状況取得ステップにおいて取得した複数の機器の第1の時間における運転状況と一致する運転状況がデータベースに記憶されていない場合、複数の機器の周囲の環境音を取得することが好ましい。
【0033】
この構成によれば、取得した複数の機器の第1の時間における運転状況と一致する運転状況がデータベースに記憶されていない場合、複数の機器の周囲の環境音が取得されるので、新たな運転状況と環境音とを関連付けたデータベースを構築することができる。
【0034】
本開示の他の局面に係る機器制御システムは、ユーザからの音声コマンドに基づいて複数の機器を制御する機器制御システムであって、第1の時間に複数の機器の周囲の環境音を取得する環境音取得部と、ネットワークを介して複数の機器の第1の時間における運転状況を取得する運転状況取得部と、運転状況取得部によって取得した第1の時間における運転状況と、環境音取得部によって第1の時間に取得した環境音とを関連付けてデータベースに記憶するデータベース管理部と、を備える。
【0035】
この構成によれば、第1の時間に複数の機器の周囲の環境音が取得され、ネットワークを介して複数の機器の運転状況が取得され、取得した第1の時間における運転状況と、第1の時間に取得した環境音とが関連付けられてデータベースに記憶される。
【0036】
したがって、音声コマンドが入力された際の複数の機器の運転状況に対応する環境音をデータベースから取得し、取得した環境音に基づいて音声コマンドに含まれるノイズを除去することにより、過剰な雑音解析処理を行うことなく、より確実に音声認識を行うことができる。
【0037】
以下添付図面を参照しながら、本開示の実施の形態について説明する。なお、以下の実施の形態は、本開示を具体化した一例であって、本開示の技術的範囲を限定するものではない。
【0038】
(実施の形態1)
(各装置の構成)
図1は、本開示の実施の形態における機器制御システムの全体構成を示す図である。なお、
図1に示す機器制御システムの構成は一例であり、
図1に示されている構成以外の構成を備えていてもよい。また、
図1に示す機器制御システムの構成の一部が欠けていてもよい。
【0039】
機器制御システムは、サーバ装置100と、機器制御装置110と、機器120とを備える。機器120は、家庭内に配置されたテレビ又はエアコンなどの音声認識により制御可能な機器である。
図1に示すようにサーバ装置100と、機器制御装置110と、制御対象の各機器120とは、それぞれネットワークを介して接続される。なお、サーバ装置100に対して単数の機器120又は複数の機器120が接続されてもよい。また、機器120は、サーバ装置100と直接接続されていなくてもよく、機器制御装置110と例えばLAN(Local Area Network)を介して接続されてもよく、機器制御装置110を介してサーバ装置100と接続されてもよい。
【0040】
サーバ装置100が設置されている場所に関しては、特に限定しない。サーバ装置100は、ビッグデータを扱うデータセンターを管理及び運営する会社が保有するデータセンターに配置されていてもよいし、各家庭に配置されていてもよい。また、サーバ装置100の各構成は1つの装置内に集約されていてもよいし、各構成が別々の装置に配置されていてもよい。
【0041】
サーバ装置100は、制御部101と、通信部102と、環境音情報データベース(DB)103とを備える。
【0042】
制御部101は、サーバ装置100に関する様々な制御を行うための構成であり、特に限定しない。制御部101は、例えばCPU(中央演算処理装置)などで構成される。
【0043】
通信部102は、ネットワーク(例えば、インターネット)に接続するための構成であり、特に限定しない。インターネットへの接続方法に関しては問わない。
【0044】
環境音情報データベース103は、大量の情報を蓄積可能な記録装置である。環境音情報データベース103は、例えば家庭内の各機器120の運転状況と、環境音情報とを対応付けて記憶している。環境音情報データベース103は、同一の装置内に格納されていてもよいし、別々の装置内に格納されていてもよい。
【0045】
機器制御装置110は、制御部111と、通信部112と、音情報取得部113と、表示部114とを備える。なお、機器制御装置110のこれらの構成は、機器の一部として内蔵されていてもよいし、別途外部に接続する装置であってもよい。ここで、機器制御装置110としては、上記した各構成を備えていれば、例えば一般家庭用のテレビ、又はPC(パーソナルコンピュータ)のモニタなどであってもよい。また、機器制御装置110は、本機器制御システムのための専用装置であってもよい。
【0046】
制御部111及び通信部112は、サーバ装置100の制御部101及び通信部102と同様の構成であるため、その説明は省略する。
【0047】
音情報取得部113は、マイクを備えた記録装置である。表示部114は、モニタなどの表示機能を持つ装置である。
【0048】
機器120は、制御部111と、通信部112とを備える。なお、機器120のこれらの構成は、機器の一部として内蔵されていてもよいし、別途外部に接続する装置であってもよい。
【0049】
制御部111及び通信部112は、サーバ装置100の制御部101及び通信部102と同様の構成であるため、その説明は省略する。
【0050】
なお、
図1では、サーバ装置100と機器制御装置110と機器120とによって以下に述べる機器制御システムを構成しているが、これに限られない。例えば、サーバ装置100及び機器制御装置110の一部又は全部の構成が、機器120に含まれており、機器120のみで機器制御システムを構成してもよい。
【0051】
なお、以下で説明する実施の形態は、いずれも本開示の一具体例を示すものである。以下の実施の形態で示される数値、形状、構成要素、ステップ及びステップの順序などは、一例であり、本開示を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。また、全ての実施の形態において、各々の内容を組み合わせることもできる。
【0052】
(機器制御システムの構成)
図2は、本開示の実施の形態1における機器制御システムの構成を示すブロック図である。
【0053】
本実施の形態1における機器制御システムは、環境音取得部201と、運転状況取得部202と、データベース管理部203と、環境音情報データベース204と、音声コマンド取得部205と、ノイズ除去部206とを備える。
【0054】
環境音取得部201は、複数の機器120の周囲の環境音を示す環境音情報を取得する。ここで、環境音情報とは、各機器120の発する作動音又は家庭内のその他の騒音を含む音であればよい。環境音取得部201は、環境音に、定常的な環境音ではない突発的な音が含まれる場合は、突発的な音を除去する機能を有していてもよい。また、環境音取得部201が環境音を取得するタイミング、及び環境音取得部201が取得する環境音の時間長に関しては特に限定しない。環境音取得部201は、常に環境音を取得していてもよいし、予め設定した時間間隔で環境音を取得してもよい。また、環境音取得部201は、人が音声を発していないときだけ環境音を取得してもよい。環境音取得部201は、取得した環境音情報をデータベース管理部203に出力する。
【0055】
運転状況取得部202は、環境音取得部201が環境音を取得したタイミングにおいて、ネットワークを介して接続された各機器の運転状況を示す運転状況情報を取得する。ここで、運転状況情報とは、例えば、電源のON/OFF状態又は運転モード等である。なお、運転状況情報は、各機器から取得できるその他の情報を含んでもよい。運転状況取得部202は、取得した運転状況情報を、データベース管理部203に出力する。
【0056】
データベース管理部203は、環境音取得部201によって取得された環境音情報と、運転状況取得部202によって取得された運転状況情報とを使用して、環境音情報データベース204を構築及び管理する。環境音情報データベース204には、過去に取得された環境音情報と、環境音情報が取得された時の運転状況情報とが関連付けて記憶されている。データベース管理部203は、運転状況取得部202によって取得された第1の時間における運転状況情報と、環境音取得部201によって第1の時間に取得された環境音情報とを関連付けて環境音情報データベース204に記憶する。
【0057】
ここで、取得された環境音情報は、WAV形式のファイルとして登録されている。なお、環境音情報は、必ずしもWAV形式ファイルでなくてもよい。例えば、環境音情報は、MPEG形式又はAIFF形式等の音声圧縮されたデータであってもよい。また、環境音情報は、環境音から算出されたノイズ除去に必要な特徴量であってもよい。ノイズ除去に必要な特徴量とは、例えば、周波数スペクトルなどである。なお、ノイズ除去に必要な特徴量又はノイズ除去の方法については限定しない。
【0058】
データベース管理部203は、環境音情報データベース204に記憶された環境音情報と運転状況情報とを、ノイズ除去部206に出力する。
【0059】
音声コマンド取得部205は、環境音取得部201によって環境音情報が取得されたタイミングとは異なるタイミングにユーザからの音声コマンドを取得する。音声コマンドは、機器を動作させるためにユーザが発した音声を示す。また、運転状況取得部202は、音声コマンド取得部205によって音声コマンドが取得されたタイミングにおいて、ネットワークを介して複数の機器の運転状況情報を取得する。
【0060】
ノイズ除去部206は、機器制御のための音声コマンドが入力されたタイミングにおいて取得した複数の機器の運転状況情報と、構築された環境音情報データベース204の環境音情報とを参照して、音声コマンドからノイズを除去する。すなわち、ノイズ除去部206は、音声コマンドが取得されたタイミングにおいて運転状況取得部202によって取得された複数の機器の運転状況と一致する運転状況が環境音情報データベース204に記憶されている場合に、運転状況に関連付けて環境音情報データベース204に記憶されている環境音に基づいて、音声コマンドからノイズを除去する。ここで、ノイズを除去する方法については限定しない。ノイズ除去部206は、環境音情報からノイズをキャンセルする音を算出して再生してもよいし、取得した音声コマンドから信号処理によってノイズを除去してもよい。
【0061】
なお、環境音取得部201は、
図1に示す音情報取得部113、通信部112及び通信部102によって実現され、運転状況取得部202は、
図1に示す通信部112及び通信部102によって実現され、データベース管理部203は、
図1に示す制御部101によって実現され、環境音情報データベース204は、
図1に示す環境音情報データベース103によって実現され、音声コマンド取得部205は、
図1に示す音情報取得部113、通信部112及び通信部102によって実現され、ノイズ除去部206は、
図1に示す制御部101によって実現される。
【0062】
(機器制御システムの動作)
図3は、本開示の実施の形態1における機器制御システムのデータベース構築処理を示すフローチャートである。
【0063】
図3を用いて、本実施の形態1における機器制御システムによる、データベースに蓄積される環境音の取得方法について説明する。なお、フローチャートの処理は継続的に行われるものとする。
【0064】
本実施の形態1における機器制御システムの目的上、データベースに蓄積される環境音には機器を制御するための音声が含まれていないことが望ましい。そこで、音声検知部(不図示)は、音声コマンドの入力が一定時間以上無いことを検知する。
【0065】
まず、音声検知部は、音声コマンドの入力が一定時間以上無いことが検知されたか否かを判断する(ステップS1)。音声検知部は、音声コマンドの取得が完了してから次に音声コマンドの取得が開始されるまでの時間を計時し、音声コマンドの取得が完了してからの時間が一定時間以上経過したか否かを判断する。音声コマンドの入力が一定時間以上無いと判断された場合(ステップS1でYES)、ステップS2の処理に進む。一方、音声コマンドの入力が一定時間以内にあったと判断された場合(ステップS1でNO)、ステップS1の処理を継続的に繰り返す。
【0066】
音声コマンドの入力が一定時間以上無いと判断された場合、運転状況取得部202は、複数の機器の運転状況を取得する(ステップS2)。
【0067】
次に、環境音取得部201は、環境音を取得する(ステップS3)。このように、環境音取得部201は、音声検知部によって音声コマンドの入力が一定時間以上無いことが検知された場合、複数の機器の周囲の環境音を取得する。なお、運転状況取得部202が複数の機器の運転状況を取得する処理と、環境音取得部201が環境音を取得する処理とが連続的に行われることにより、ほぼ同時刻に運転状況と環境音とを取得することができる。また、運転状況取得部202と環境音取得部201とは、同一時刻にそれぞれ運転状況と環境音とを取得してもよい。
【0068】
次に、データベース管理部203は、運転状況取得部202によって取得された複数の機器の運転状況と、環境音取得部201によって取得された環境音とを関連付けて環境音情報データベース204に記憶する(ステップS4)。
【0069】
図4は、環境音情報データベースのデータ構造の一例を示す図である。例えば、機器A、機器B及び機器Cがネットワーク上に存在する場合、
図4に示すように、機器A及び機器BのON/OFF状態情報と機器Cの運転モード(送風の強又は弱)とを組み合わせた1つのパターンに対して1つの環境音が関連付けられる。
【0070】
例えば、音声コマンドの入力が一定時間以上無いと判断された場合、運転状況取得部202は、電源がON状態である運転状況情報を機器Aから取得し、電源がON状態である運転状況情報を機器Bから取得し、運転モードが強である運転状況情報を機器Cから取得する。また、この際、環境音取得部201は、環境音を取得し、取得した環境音をWAV形式ファイルの環境音情報「XXX01.wav」としてデータベース管理部203へ出力する。データベース管理部203は、運転状況取得部202によって取得された各機器A,B,Cの運転状況情報と、環境音取得部201によって取得された環境音情報とを関連付けて環境音情報データベース204に記憶する。
【0071】
なお、本実施の形態1では、音声コマンドの入力が一定時間以上無いことを検知することにより、人の有無を検知しているが、本開示は特にこれに限定されず、人感センサなどのセンサにより、人の有無を検知してもよい。
【0072】
図5は、本開示の実施の形態1の第1の変形例における機器制御システムのデータベース構築処理を示すフローチャートである。
【0073】
図5を用いて、本実施の形態1の第1の変形例における機器制御システムによる、データベースに蓄積される環境音の取得方法について説明する。なお、フローチャートの処理は継続的に行われるものとする。
【0074】
まず、人感センサ(不図示)は、複数の機器の周囲に存在する人を検知する(ステップS11)。ここで、人の有無を検知するセンサは、人感センサに限定されない。
【0075】
次に、人感センサは、人が検知されたか否かを判断する。ここで、人が検知されないと判断された場合(ステップS12でNO)、ステップS13の処理に進む。一方、人が検知されたと判断された場合(ステップS12でYES)、ステップS11及びステップS12の処理を継続的に繰り返す。
【0076】
人が検知されないと判断された場合、運転状況取得部202は、複数の機器の運転状況を取得する(ステップS13)。
【0077】
次に、環境音取得部201は、環境音を取得する(ステップS14)。このように、環境音取得部201は、人感センサによって人が検知されない場合、複数の機器の周囲の環境音を取得する。
【0078】
次に、環境音取得部201は、取得した環境音から、ノイズ除去に必要な環境音情報を算出する(ステップS15)。環境音取得部201は、ステップS14において環境音を取得した後、取得した環境音からノイズ除去に必要な特徴量を環境音情報として算出する。
【0079】
次に、データベース管理部203は、運転状況取得部202によって取得された複数の機器の運転状況と、環境音取得部201によって取得された環境音情報とを関連付けて環境音情報データベース204に記憶する(ステップS16)。
【0080】
なお、
図5に示す機器制御システムの動作において、ステップS15の処理は省略してもよく、環境音取得部201は、ステップS14で取得された環境音を環境音情報としてデータベース管理部203へ出力してもよい。
【0081】
また、
図3及び
図5では、運転状況を取得した後、環境音が取得されているが、本開示は特にこれに限定されず、環境音が取得された後、運転状況が取得されてもよい。また、運転状況取得部202は、運転状況を定期的に取得し、取得した時刻と運転状況とを対応付けて記憶してもよい。そして、データベース管理部203は、環境音取得部201によって環境音が取得された時刻に対応する運転状況を運転状況取得部202から読み出し、読み出した運転状況と、環境音とを関連付けて環境音情報データベース204に記憶してもよい。
【0082】
また、本実施の形態1において、環境音情報データベースが既に存在しており、環境音情報データベース上にない運転状況が検知された場合に環境音を取得してもよい。
【0083】
図6は、本開示の実施の形態1の第2の変形例における機器制御システムのデータベース構築処理を示すフローチャートである。
【0084】
図6を用いて、本実施の形態1の第2の変形例における機器制御システムによる、データベースに蓄積される環境音の取得方法について説明する。なお、フローチャートの処理は継続的に行われるものとする。
【0085】
まず、運転状況取得部202は、複数の機器の運転状況を取得する(ステップS21)。
【0086】
次に、データベース管理部203は、運転状況取得部202によって取得された複数の機器の運転状況の組合せが、環境音情報データベース204にあるか否かを判断する(ステップS22)。ここで、運転状況の組合せが環境音情報データベース204内に存在しないと判断された場合(ステップS22でNO)、ステップS23の処理に進む。一方、運転状況の組合せが環境音情報データベース204内に存在すると判断された場合(ステップS22でYES)、ステップS21及びステップS22の処理を継続的に繰り返す。
【0087】
次に、環境音取得部201は、環境音を取得する(ステップS23)。環境音取得部201は、運転状況取得部202によって取得した複数の機器の第1の時間における運転状況と一致する運転状況が環境音情報データベース204に記憶されていない場合、複数の機器の周囲の環境音を取得する。
【0088】
次に、データベース管理部203は、運転状況取得部202によって取得された複数の機器の運転状況と、環境音取得部201によって取得された環境音とを関連付けて環境音情報データベース204に記憶する(ステップS24)。
【0089】
なお、環境音を取得するタイミングとしては、
図3、
図5及び
図6のうちのどれか一つのフローチャートの条件を満たせばよく、
図3、
図5及び
図6の全てのフローチャートの条件を満たしてもよい。
【0090】
なお、
図6において、複数の機器の運転状況を取得している場合であっても、
図5の複数の機器の運転状況を取得していない場合と同様に、環境音取得部201は、環境音から特徴量を算出してもよい。
【0091】
続いて、
図7を用いて、本実施の形態1における機器制御システムのノイズ除去処理について説明する。
【0092】
図7は、本開示の実施の形態1における機器制御システムのノイズ除去処理を示すフローチャートである。
【0093】
まず、音声コマンド取得部205は、ユーザの発する音声コマンドの入力を受け付け、音声コマンドが入力されたか否かを判断する(ステップS31)。
【0094】
次に、運転状況取得部202は、複数の機器の運転状況を取得する(ステップS32)。
【0095】
次に、データベース管理部203は、運転状況取得部202によって取得された複数の機器の運転状況の組合せが、環境音情報データベース204にあるか否かを判断する(ステップS33)。ここで、運転状況の組合せが環境音情報データベース204内に存在すると判断された場合(ステップS33でYES)、ノイズ除去部206は、環境音情報データベース204に記憶されている、取得された運転状況の組合せに対応する環境音情報を用いて、取得された音声コマンドから環境音(ノイズ)を除去する(ステップS34)。
【0096】
一方、運転状況の組合せが環境音情報データベース204内に存在しないと判断された場合(ステップS33でNO)、ノイズ除去部206は、取得された音声コマンドに対して通常のノイズ除去処理を行い、取得された音声コマンドから環境音(ノイズ)を除去する(ステップS35)。なお、通常のノイズ除去処理としては、例えば、スペクトラム・サブストラクション、ケプストラム平均化処理、又は音源を推定したエコーキャンセルなどがある。
【0097】
その後、ノイズ除去部206によってノイズが除去された音声コマンドに対して音声認識処理が行われ、音声コマンドに応じた機器の制御が行われる。
【0098】
このように、実施の形態1では、取得した複数の機器の運転状況と一致する運転状況がデータベースに記憶されている場合に、運転状況に関連付けてデータベースに記憶されている環境音に基づいて、音声コマンドからノイズが除去されるので、音声コマンドに含まれるノイズ(環境音)を確実に除去することができ、より確実に音声認識を行うことができる。
【0099】
なお、本実施の形態1において、環境音情報データベースは、家庭内の全ての機器の運転状況と環境音とを関連付けて記憶してもよい。また、環境音情報データベースは、環境音及び音声コマンドを取得するマイクが配置されている部屋ごとに設けられてもよく、各部屋内に配置された複数の機器の運転状況と環境音とを関連付けて記憶してもよい。
【0100】
また、
図7に示すノイズ除去処理は、音声コマンドが入力されたマイクが配置されている部屋の環境音情報データベースを利用して行われてもよい。また、ノイズ除去処理が行われた後、音声認識が不可能であると判断された場合、さらに隣接する部屋の環境音情報データベースを利用してノイズ除去処理が行われてもよい。
【0101】
(実施の形態2)
実施の形態1では、音声コマンドからノイズ(環境音)を除去しているが、実施の形態2では、騒音源となっている機器を制御することによりノイズ(環境音)を低減させる。
【0102】
図8は、本開示の実施の形態2における機器制御システムの構成を示すブロック図である。
【0103】
本実施の形態2における機器制御システムは、環境音取得部201と、運転状況取得部202と、データベース管理部203と、環境音情報データベース204と、音声コマンド取得部205と、ノイズ除去部207と、音声認識判断部208と、機器制御部209とを備える。なお、実施の形態2において、実施の形態1における機器制御システムと同じ構成については同じ符号を付し、説明を省略する。
【0104】
ノイズ除去部207は、音声コマンド取得部205によって取得された音声コマンドに対して通常のノイズ除去処理を行う。運転状況の組合せが環境音情報データベース204内に存在しないと判断された場合、ノイズ除去部207は、取得された音声コマンドに対して通常のノイズ除去処理を行い、取得された音声コマンドから環境音(ノイズ)を除去する。
【0105】
音声認識判断部208は、運転状況取得部202によって取得した複数の機器の第2の時間における運転状況と一致する運転状況が環境音情報データベース204に記憶されている場合に、運転状況に関連付けて環境音情報データベース204に記憶されている環境音から予測される音環境で、音声認識が可能であるか否かを判断する。
【0106】
ここで、環境音取得部201は、環境音を取得する際に、環境音の音量も取得する。環境音情報データベース204は、環境音だけでなく、環境音の音量も記憶している。音声認識判断部208は、運転状況取得部202によって取得した複数の機器の第2の時間における運転状況と一致する運転状況が環境音情報データベース204に記憶されている場合に、運転状況に関連付けて環境音情報データベース204に記憶されている環境音の音量が、音声認識が可能な所定の音量以下であるか否かを判断することにより、音声認識が可能であるか否かを判断する。環境音取得部201は、運転状況に関連付けて環境音情報データベース204に記憶されている環境音の音量が所定の音量以下である場合、音声認識が可能であると判断する。また、環境音取得部201は、運転状況に関連付けて環境音情報データベース204に記憶されている環境音の音量が所定の音量より大きい場合、音声認識が不可能であると判断する。
【0107】
機器制御部209は、音声認識判断部208によって音声認識が不可能であると判断された場合に、複数の機器のうち、環境音を発している機器を制御する。例えば、機器制御部209は、音声認識判断部208によって音声認識が不可能であると判断された場合に、複数の機器のうち、環境音が所定の音量以上である機器を制御してもよい。また、例えば、機器制御部209は、音声認識判断部208によって音声認識が不可能であると判断された場合に、複数の機器のうち、電源がオン状態である機器の電源をオフ状態にしてもよい。また、機器制御部209は、音声認識判断部208によって音声認識が不可能であると判断された場合に、音量が最も小さい環境音に対応する運転状況の組合せに応じて運転するように、複数の機器を制御してもよい。
【0108】
また、環境音情報データベース204は、過去に音声認識が成功したか否かに関する情報を、運転状況の組合せに関連付けて記憶してもよく、機器制御部209は、音声認識判断部208によって音声認識が不可能であると判断された場合に、過去に音声認識が成功した運転状況の組合せに応じて運転するように、複数の機器を制御してもよい。また、環境音情報データベース204が、過去に音声認識が成功したか否かに関する情報を、運転状況の組合せに関連付けて記憶している場合、音声認識判断部208は、運転状況取得部202によって取得された複数の機器の運転状況の組合せに関連付けて記憶されている、過去に音声認識が成功したか否かに関する情報に基づいて、音声認識が可能であるか否かを判断してもよい。
【0109】
なお、ノイズ除去部207は、
図1に示す制御部101によって実現され、音声認識判断部208は、
図1に示す制御部101によって実現され、機器制御部209は、
図1に示す制御部101によって実現される。
【0110】
また、本開示の実施の形態2における機器制御システムのデータベース構築処理は、実施の形態1の
図3、
図5及び
図6に示すデータベース構築処理と同じであるので、説明を省略する。
【0111】
続いて、
図9を用いて、本実施の形態2における機器制御システムの機器制御処理について説明する。
【0112】
図9は、本開示の実施の形態2における機器制御システムの機器制御処理を示すフローチャートである。
【0113】
なお、
図9に示すステップS41〜ステップS43の処理は、
図7に示すステップS31〜ステップS33の処理と同じであるので、説明を省略する。
【0114】
運転状況の組合せが環境音情報データベース204内に存在しないと判断された場合(ステップS43でNO)、ノイズ除去部207は、取得された音声コマンドに対して通常のノイズ除去処理を行い、取得された音声コマンドから環境音(ノイズ)を除去する(ステップS44)。
【0115】
一方、運転状況の組合せが環境音情報データベース204内に存在すると判断された場合(ステップS43でYES)、音声認識判断部208は、運転状況に関連付けて環境音情報データベース204に記憶されている環境音から予測される音環境で、音声認識が可能であるか否かを判断する(ステップS45)。ここで、音声認識が可能であると判断された場合(ステップS45でYES)、処理を終了する。
【0116】
一方、音声認識が不可能であると判断された場合(ステップS45でNO)、機器制御部209は、複数の機器のうち、環境音を発している機器を制御する(ステップS46)。機器制御部209は、音声コマンドにより機器を制御するために、環境音情報データベース204の情報を基に、音声認識の妨げとなるノイズを発している機器を制御する。機器制御部209は、例えば、ある機器Aの電源がON状態である際に取得される環境音情報が、音声認識に適さないノイズを含む場合、機器Aの電源を音声コマンドが入力される間だけ一時的にOFF状態にする。
【0117】
その後、ノイズが低減された音声コマンドに対して音声認識処理が行われ、音声コマンドに応じた機器の制御が行われる。
【0118】
なお、本機器制御システムにおいて、サーバ装置100と表示装置(テレビ、スマートフォン、タブレット型コンピュータ又はPCなど)とがネットワークを介して接続されている場合、表示装置に対し、機器制御部209によって機器が制御されることを通知してもよい。
【0119】
図10は、音声認識を可能にするために機器が制御される際に表示装置に表示される表示画面の一例を示す図である。
【0120】
図10に示すように、表示画面には、運転中の複数の機器を示す画像と、各機器のノイズ値(音量)とが表示されている。データベース管理部203は、環境音取得部201によって取得された環境音から、各機器のノイズ値を算出する。なお、各機器のノイズ値は、各機器の運転状況に関連付けて予め記憶されていてもよい。また、表示画面には、音声認識を利用する際にどの機器をどの程度制御するかという情報が表示されている。例えば、
図10に示す表示画面では、エアコンの運転状況が強から弱に変更されることが表示されている。
【0121】
このように、実施の形態2では、音声認識が不可能であると判断された場合に、複数の機器のうち、環境音を発している機器が制御されるので、音声認識の妨げとなるノイズ(環境音)を低減することができ、より確実に音声認識を行うことができる。また、音声認識を利用する際に特定の機器が自動的に制御されることが通知されるため、ユーザの不快感を軽減できる。
【0122】
(実施の形態3)
実施の形態2では、騒音源となっている機器を制御することによりノイズ(環境音)を低減させるが、実施の形態3では、騒音源となっている機器が存在することをユーザに提示する。
【0123】
図11は、本開示の実施の形態3における機器制御システムの構成を示すブロック図である。
【0124】
本実施の形態3における機器制御システムは、環境音取得部201と、運転状況取得部202と、データベース管理部203と、環境音情報データベース204と、音声コマンド取得部205と、ノイズ除去部207と、音声認識判断部208と、提示部210とを備える。なお、実施の形態3において、実施の形態1及び実施の形態2における機器制御システムと同じ構成については同じ符号を付し、説明を省略する。
【0125】
提示部210は、音声認識判断部208によって判断された結果をユーザに提示する。提示部210は、音声認識判断部208によって音声認識が不可能であると判断された場合に、音声認識が不可能であることをユーザに提示する。提示部210は、音声認識判断部208によって音声認識が不可能であると判断された場合に、音声認識が不可能であることを示す表示画面を表示装置に送信する。表示装置は、受信した表示画面を表示する。なお、表示装置は、例えば、テレビ、スマートフォン、タブレット型コンピュータ又はPCなどである。
【0126】
なお、提示部210は、
図1に示す制御部101によって実現される。
【0127】
また、本開示の実施の形態3における機器制御システムのデータベース構築処理は、実施の形態1の
図3、
図5及び
図6に示すデータベース構築処理と同じであるので、説明を省略する。
【0128】
続いて、
図12を用いて、本実施の形態3における機器制御システムの情報提示処理について説明する。
【0129】
図12は、本開示の実施の形態3における機器制御システムの情報提示処理を示すフローチャートである。
【0130】
なお、
図12に示すステップS51〜ステップS53の処理は、
図7に示すステップS31〜ステップS33の処理と同じであるので、説明を省略する。また、
図12に示すステップS54〜ステップS55の処理は、
図9に示すステップS44〜ステップS45の処理と同じであるので、説明を省略する。
【0131】
音声認識が不可能であると判断された場合(ステップS45でNO)、提示部210は、音声認識が不可能であることを示す音声認識可否情報をユーザに提示する(ステップS56)。提示部210は、現状が音声コマンドの入力に適しているかどうかをユーザに提示してもよい。提示部210は、環境音情報データベース204の情報を基に、現状の機器の運転状況から予想される音環境で音声認識が可能であるか否かについての現状をユーザに提示する。なお、提示部210は、現状を提示した上で、音声認識可能な音環境となるようにユーザに機器の制御を促してもよい。また、音声認識可否情報は、音声認識が不可能であることを示す情報だけでなく、音声認識が可能であることを示す情報を含んでもよい。
【0132】
本機器制御システムにおいて、サーバ装置100と表示装置(テレビ、スマートフォン、タブレット型コンピュータ又はPCなど)とがネットワークを介して接続されている場合、表示装置に対し、現在の環境音の状況を表示する。
【0133】
図13は、音声認識が不可能であることをユーザに提示する際に表示装置に表示される表示画面の一例を示す図である。
【0134】
図13に示すように、表示画面には、運転中の複数の機器を示す画像と、各機器のノイズ値(音量)とが表示されている。データベース管理部203は、環境音取得部201によって取得された環境音から、各機器のノイズ値を算出する。なお、各機器のノイズ値は、各機器の運転状況に関連付けて予め記憶されていてもよい。この際、
図13に示すように、表示装置は、ノイズ値の大きい機器を他の機器よりも大きく表示してもよい。また、
図13に示すように、表示装置は、現在のノイズ状況が、音声認識にふさわしくないノイズ状況であることを表示してもよい。
【0135】
音声認識が不可能であることを示す音声認識不可情報が提示されたユーザは、環境音を低減するべく機器の運転状況を変更する。これにより、ユーザに対して機器の運転状況の変更を促すことができ、音声認識の妨げとなるノイズ(環境音)を低減させることができる。
【0136】
以上、本実施の形態3における機器制御システムによれば、ユーザは、現在の機器の運転状況及びノイズの状況を容易に把握できる。また、ユーザは、ノイズの要因となっている機器を確認できる。