(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022147553
(43)【公開日】2022-10-06
(54)【発明の名称】送信装置、処理装置およびプログラム
(51)【国際特許分類】
G10L 15/28 20130101AFI20220929BHJP
G10L 21/034 20130101ALI20220929BHJP
【FI】
G10L15/28 230K
G10L21/034
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2021048843
(22)【出願日】2021-03-23
(71)【出願人】
【識別番号】501398606
【氏名又は名称】富士通コンポーネント株式会社
(74)【代理人】
【識別番号】100087480
【弁理士】
【氏名又は名称】片山 修平
(72)【発明者】
【氏名】齋藤 舞子
(57)【要約】
【課題】誤動作を適切に抑制すること。
【解決手段】送信装置(ビーコン端末10)は、操作者14の音声52を入力する第1集音部を有し、前記第1集音部に入力する前記操作者14の音声52に基づき処理を行う処理装置(スマートスピーカ12)に対し、前記処理装置を操作可能状態にするための無線信号54を送信する送信装置であって、前記操作者14の操作を受け付ける受付部と、前記受付部が前記操作を受け付けると、前記第1集音部に入力する音の感度を調整するために用いられる無線信号を前記処理装置に送信する送信部と、を備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
操作者の音声を入力する第1集音部を有し、前記第1集音部に入力する前記操作者の音声に基づき処理を行う処理装置に対し、前記処理装置を操作可能状態にするための無線信号を送信する送信装置であって、
前記操作者の操作を受け付ける受付部と、
前記受付部が前記操作を受け付けると、前記第1集音部に入力する音の感度を調整するために用いられる無線信号を前記処理装置に送信する送信部と、
を備える送信装置。
【請求項2】
前記操作は前記操作者の音声であり、
前記受付部は前記操作者の音声を入力するための第2集音部を含み、
前記送信部は、前記第2集音部に入力された音声に対応する前記第2集音部の出力信号のレベルが指定レベル以上のとき前記無線信号を前記処理装置に送信し、前記出力信号のレベルが前記指定レベルより小さいとき前記無線信号を前記処理装置に送信しない請求項1に記載の送信装置。
【請求項3】
前記送信部は、前記出力信号のレベルが前記指定レベル以上のとき、前記第2集音部にて、集音した音声を音声データとして前記処理装置に送信する請求項2に記載の送信装置。
【請求項4】
前記受付部は前記出力信号のうち人の音声に対応する周波数の信号を通過させるフィルタを含む請求項2または3に記載の送信装置。
【請求項5】
前記操作は前記操作者の身体の動きであり、
前記受付部は前記操作者の身体の動きを検出する加速度センサを含み、
前記送信部は、前記操作者の身体の動きに基づいて前記無線信号を前記処理装置に送信する請求項1から4のいずれか一項に記載の送信装置。
【請求項6】
無線信号を受信する受信部と、
音声を集音する集音部と、
前記集音部が集音した音声に基づき所定の処理を行う処理部と、を備え、
前記受信部が前記無線信号を受信すると、前記無線信号に基づき、前記集音部が集音した音に対する感度を調整する処理装置。
【請求項7】
前記無線信号を送信した送信装置までの距離および方向の少なくとも一方を前記無線信号に基づいて検出し、
検出した前記距離および前記方向の少なくとも一方に基づいて、前記感度の調整を行う請求項6に記載の処理装置。
【請求項8】
集音部を備える処理装置に、
前記処理装置を操作可能状態にするための操作者の操作を送信装置が受け付けたことを示す無線信号を前記送信装置から受信するステップと、
前記無線信号を受信すると、前記無線信号に基づき前記集音部に入力する音の感度を調整するステップと、
前記集音部に入力した前記操作者の音声に基づき処理を行うステップと、
を実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、送信装置、処理装置およびプログラムに関する。
【背景技術】
【0002】
操作者の音声に基づき処理を行うスマートスピーカ(またはAI(Artificial Intelligence)スピーカ)が知られている。特定の起動ワードが発せられた方向が操作者の推定される位置を含む場合のみ命令を受け付ける音声入力装置が知られている。操作者の位置を推定する方法として、操作者が所持する可搬端末の電波を用いること知られている(例えば特許文献1)。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
特定の起動ワードが発せられた方向が操作者の推定される位置を含む場合のみ命令を受け付けることにより、操作者以外の音声による誤動作を抑制できる。操作者の位置を推定する方法として、操作者が所持する可搬端末が電波を用いた場合に、操作者の特定の起動ワードが発せられたタイミングと可搬端末が電波を発するタイミングが異なると適切に誤動作を抑制することができないおそれがある。
【0005】
本発明は、上記課題に鑑みなされたものであり、誤動作を適切に抑制することを目的とする。
【課題を解決するための手段】
【0006】
本発明の実施形態は、操作者の音声を入力する第1集音部を有し、前記第1集音部に入力する前記操作者の音声に基づき処理を行う処理装置に対し、前記処理装置を操作可能状態にするための無線信号を送信する送信装置であって、前記操作者の操作を受け付ける受付部と、前記受付部が前記操作を受け付けると、前記第1集音部に入力する音の感度を調整するために用いられる無線信号を前記処理装置に送信する送信部と、を備える送信装置である。
【0007】
本発明の実施形態は、無線信号を受信する受信部と、音声を集音する集音部と、前記集音部が集音した音声に基づき所定の処理を行う処理部と、を備え、前記受信部が前記無線信号を受信すると、前記無線信号に基づき、前記集音部が集音した音に対する感度を調整する処理装置である。
【0008】
本発明の実施形態は、集音部を備える処理装置に、前記処理装置を操作可能状態にするための操作者の操作を送信装置が受け付けたことを示す無線信号を前記送信装置から受信するステップと、前記無線信号を受信すると、前記無線信号に基づき前記集音部に入力する音の感度を調整するステップと、前記集音部に入力した前記操作者の音声に基づき処理を行うステップと、を実行させるプログラムである。
【発明の効果】
【0009】
本発明によれば、誤動作を適切に抑制することができる。
【図面の簡単な説明】
【0010】
【
図1】実施例1におけるスマートスピーカシステムのブロック図である。
【
図2】実施例1におけるビーコン端末のブロック図である。
【
図3】実施例1におけるスマートスピーカのブロック図である。
【
図4】実施例1におけるビーコン端末のプロセッサの処理を示すフローチャートである。
【
図5】実施例1におけるスマートスピーカのプロセッサの処理を示すフローチャートである。
【
図6】実施例1の変形例1におけるビーコン端末のプロセッサの処理を示すフローチャートである。
【
図7】実施例1の変形例1におけるスマートスピーカのプロセッサの処理を示すフローチャートである。
【
図8】実施例1の変形例2におけるビーコン端末のブロック図である。
【
図9】実施例2におけるスマートスピーカシステムのブロック図である。
【
図10】実施例2におけるスマートスピーカのブロック図である。
【
図11】実施例2におけるスマートスピーカのプロセッサの処理を示すフローチャートである。
【
図12】実施例2の変形例1におけるスマートスピーカのプロセッサの処理を示すフローチャートである。
【
図13】実施例3におけるビーコン端末のブロック図である。
【
図14】実施例3におけるビーコン端末のプロセッサの処理を示すフローチャートである。
【
図15】実施例3の変形例1におけるビーコン端末のプロセッサの処理を示すフローチャートである。
【発明を実施するための形態】
【0011】
以下、図面を参照し、本発明の実施例を説明する。
【実施例0012】
図1は、実施例1におけるスマートスピーカシステムのブロック図である。
図1に示すように、システム100は、送信装置であるビーコン端末10および処理装置であるスマートスピーカ12を備えている。ビーコン端末10は、操作者14が装着する端末であり、例えば腕時計のように手首に装着するブレスレット型、バッチのように衣服に装着するバッチ型、または首に掛けるネックストラップ型である。ビーコン端末10はスマートフォンまたは携帯電話のような携帯型端末でもよい。ビーコン端末10は、操作者14の音声50を検出するとスマートスピーカ12に無線信号54を送信する。
【0013】
スマートスピーカ12は、操作者14の音声52に基づき処理を行う処理装置である。スマートスピーカ12は、例えば操作者14の音声52を認識する。スマートスピーカ12はインターネット16に接続されている。スマートスピーカ12は、操作者14の音声に基づき音楽再生等の処理を行う。ビーコン端末10とスマートスピーカ12とは事前にペアリングされている。ビーコン端末10とスマートスピーカ12との距離はLである。
【0014】
図2は、実施例1におけるビーコン端末のブロック図である。ビーコン端末10は、主回路20、アンテナ23および電源部28を備えている。主回路20は、プロセッサ21、送信部22、メモリ24およびマイクロフォン25を備えている。プロセッサ21は、例えばCPU(Central Processing Unit)またはマイクロプロセッサである。送信部22は、例えばBluetooth(登録商標)方式の無線信号54をアンテナ23を介しスマートスピーカ12に送信する。送信部22は、例えばRF(Radio Frequency)部であり、アンテナ23を介し高周波信号を送信する。RF部は、スマートスピーカ12が送信する信号を受信する受信部を備えていてもよい。
【0015】
メモリ24は、例えばEEPROM(Electrically Erasable Programmable Read-Only Memory)等の不揮発性メモリまたは揮発性メモリであり、プロセッサ21のファームウエアおよび各種データを記憶する。マイクロフォン25は周囲の音を集音する。マイクロフォン25には操作者14の音声50等の音が入力し、入力した音に対応する出力信号をプロセッサ21に出力する。電源部28は、例えば二次電池および電源回路であり、主回路20に電力を供給する。
【0016】
図3は、実施例1におけるスマートスピーカのブロック図である。スマートスピーカ12は、主回路30、アンテナ33および電源部38を備えている。主回路30は、プロセッサ31、受信部32、メモリ34、マイクロフォン35、スピーカ36およびI/F(インターフェース)37を備えている。プロセッサ31は、例えばCPU、マイクロプロセッサまたはオーディオプロセッサである。プロセッサ31は、メモリ34に格納されたファームウエア(処理プログラム)を実行する。受信部32は、例えばBluetooth(登録商標)方式の無線信号54をアンテナ33を介し受信する。受信部32は、例えばRF部であり、アンテナ33を介し高周波信号を受信する。RF部は、ビーコン端末10に信号を送信する送信部を備えていてもよい。
【0017】
メモリ34は、例えばEEPROM等の不揮発性メモリまたは揮発性メモリであり、プロセッサ31のファームウエアおよび各種データを記憶する。マイクロフォン35は周囲の音を集音する。マイクロフォン35には操作者14の音声52等の音が入力し、入力した音に対応する出力信号をプロセッサ31に出力する。スピーカ36は、プロセッサ31が出力するオーディオデータを音56として出力する。I/F37は、インターネット16に接続され、インターネット16を介しデータを入力および出力する。電源部38は、例えば二次電池および電源回路であり、主回路30に電力を供給する。
【0018】
図4は、実施例1におけるビーコン端末のプロセッサの処理を示すフローチャートである。
図4に示すように、プロセッサ21は、マイクロフォン25に音声50等の音が入力されるまで待機する(S10)。プロセッサ21は、マイクロフォン25に音が入力すると、マイクロフォン25の出力信号のレベルAが指定レベルX以上か否かを判定する(S12)。レベルAが指定レベルXより小さいとき、マイクロフォン25に入力した音は雑音である可能性が高い。そこで、Noのとき、ステップS10に戻る。ビーコン端末10は操作者14に装着されているため、レベルAが指定レベルX以上のとき、マイクロフォン25に入力した音は操作者14の音声50である可能性が高い。そこで、Yesのとき、プロセッサ21は送信部22を介し無線信号54を送信する(S14)。Bluetooth(登録商標)方式の場合、送信部22はアドバタイズメントチャンネルを用いアドバタイズデータとして無線信号54を送信する。
【0019】
図5は、実施例1におけるスマートスピーカのプロセッサの処理を示すフローチャートである。
図5に示すように、プロセッサ31は、受信部32が無線信号54を受信するまで待機する(S20)。例えば、スマートスピーカ12が複数の電子機器とペアリングしている場合、プロセッサ31はビーコン端末10のアドレスと一致する無線信号を受信部32が受信するまで待機する。プロセッサ31は、受信部32がビーコン端末10からの無線信号54を受信すると、ビーコン端末10とスマートスピーカ12との距離Lを検出する(S22)。例えば、プロセッサ31は、受信部32が受信した無線信号54の受信信号強度RSSI(Received Signal Strength Indicator)から距離Lを検出する。
【0020】
プロセッサ31は、距離Lが指定値Y以上か否かを判定する(S24)。距離Lが長いとき、マイクロフォン35に入力する操作者14の音声52のレベルが小さく、スマートスピーカ12が誤動作する可能性が高い。そこで、Yesのとき、プロセッサ31は、マイクロフォン35に入力する音の感度を上げる(S26)。音の感度を上げる方法として、例えば、マイクロフォン35の集音感度(すなわち音のレベルに対する出力信号のレベルの比)を上げる、または、プロセッサ31が音声認識するときのパラメータを変更することにより、音の感度を上げる。これにより、スマートスピーカ12は、操作者14の音声52を認識できる。距離Lが短いとき、マイクロフォン35に入力する操作者14の音声52のレベルが大きく、スマートスピーカ12が誤動作する可能性は低い。また、音の感度を上げると、操作者14の音声52以外の音によりスマートスピーカ12が誤動作する可能性がある。そこで、Noのとき、プロセッサ31は、音の感度を変化させない(S28)。
【0021】
プロセッサ31は、スマートスピーカ12を操作可能状態とする(ステップS30)。操作可能状態では、マイクロフォン35に操作者14の音声52が入力すると、プロセッサ31は、音声52を認識する。プロセッサ31は音声52により指示された処理を行う。例えば、プロセッサ31は、I/F37およびインターネット16を介し音声52が指示する音楽を検索しスピーカ36から再生する。また、プロセッサ31は、I/F37およびインターネット16を介し音声52が指示する語を検索エンジンにより検索し、検索結果をスピーカ36から音声として出力する。さらに、プロセッサ31は、I/F37およびインターネット16を介し音声52が指示する電気機器を操作する。例えば、プロセッサ31は、操作者14の指示に基づき、テレビジョンを起動する。
【0022】
特許文献1では、スマートスピーカは、特定の起動ワード(ウエイクワード)が発せられた方向が操作者の推定される位置を含む場合のみ命令を受け付ける。これにより、操作者以外の音声による誤動作を抑制できる。また、特許文献1には、操作者の位置を推定する方法として、操作者が所持する可搬端末が発する電波を用いることが記載されている。しかし、可搬端末が電波を発するタイミングについては記載されていない。操作者がスマートスピーカを操作可能状態にする意思のあるときに可搬端末が電波を発しないとスマートスピーカの誤動作を適切に抑制することができない。
【0023】
実施例1によれば、
図4のステップS10のように、ビーコン端末10では、マイクロフォン25(第2集音部)は、スマートスピーカ12を操作可能状態にするための操作者14の操作を受け付ける受付部であり、操作者14の操作として音声50を受け付ける。ステップS12およびS14のように、送信部22は、マイクロフォン25が操作(音声50)を受け付けると、スマートスピーカ12に入力する音の感度を調整するために用いられる無線信号54をスマートスピーカ12に送信する。スマートスピーカ12では、
図5のステップS20のように、受信部32は、プロセッサ31(処理部)を起動するための無線信号54を、ビーコン端末10から受信する。ステップS26のように、プロセッサ31は、受信部32が無線信号54を受信すると、無線信号54に基づきスマートスピーカ12のマイクロフォン35(第1集音部)に入力する音の感度を調整する。プロセッサ31は、マイクロフォン35に入力する操作者14の音声52に基づき処理を行う。これにより、操作者14がスマートスピーカ12を操作可能状態にする意思があるときに、スマートスピーカ12は、入力する音の感度を調整し誤動作を抑制できる。よって、スマートスピーカ12の誤動作を適切に抑制できる。
【0024】
また、ステップS10のように、マイクロフォン25は操作として操作者14の音声50を受け付ける。ステップS12およびS14のように、送信部22は、マイクロフォン25が集音した音に対応する出力信号のレベルAが指定レベルX以上のとき無線信号54をスマートスピーカ12に送信する。ステップS10およびS12のように、レベルAが指定レベルXより小さいとき送信部22は無線信号54をスマートスピーカ12に送信しない。これにより、操作者14は指定レベルXより大きい音声50を発することで、スマートスピーカ12を操作可能状態にできる。また、指定レベルXを適切に設定することで、別の者の音声またはテレビジョン等の音声等の雑音によりスマートスピーカ12が操作可能状態になるような誤動作を抑制できる。
【0025】
さらに、
図5のステップS22のように、スマートスピーカ12のプロセッサ31は、無線信号54に基づきビーコン端末10とスマートスピーカ12との距離Lを検出する。ステップS24およびS26のように、プロセッサ31は、距離Lに基づきスマートスピーカ12のマイクロフォン35に入力する音の感度を調整する。これにより、操作者14がスマートスピーカ12から遠く、操作者14の音声52がスマートスピーカ12に届きにくい場合に、入力する音の感度を調整できる。よって、誤動作を抑制できる。
【0026】
さらに、プロセッサ31は、距離Lが指定値Y以上のとき、スマートスピーカ12に入力する音の感度を、距離Lが指定値Yより小さいときの音の感度より高くする。これにより、操作者14がスマートスピーカ12から遠く、操作者14の音声52がスマートスピーカ12に届きにくい場合に、スマートスピーカ12の誤動作を抑制できる。
【0027】
ビーコン端末10は、操作者14が携帯する端末である。これにより、マイクロフォン25に集音される音の音量レベルが指定レベル以上の場合、集音された音は操作者14の音声50である可能性が高い。よって、雑音等によるスマートスピーカ12の誤動作を抑制できる。なお、ビーコン端末10がネックストラップ型またはバッチ型の場合、マイクロフォン25は操作者14の口に近いため、雑音等によるスマートスピーカ12の誤動作をより抑制できる。ビーコン端末10がブレスレット型または携帯電話の場合、操作者14はビーコン端末10を口に近づけて音声50を発することが好ましい。
【0028】
[実施例1の変形例1]
実施例1の変形例1におけるスマートスピーカシステム、ビーコン端末10およびスマートスピーカ12のブロック図は、それぞれ実施例1の
図1、
図2および
図3と同じであり説明を省略する。
図6は、実施例1の変形例1におけるビーコン端末のプロセッサの処理を示すフローチャートである。
図6に示すように、ステップS10からS14は、実施例1の
図4と同じである。ステップS14の後にプロセッサ21は、マイクロフォン25の出力信号を音声50の音声データとして送信部22を介しスマートスピーカ12に送信する(S16)。Bluetooth(登録商標)方式の場合、送信部22はデータチャンネルを用い音声データを送信する。その他の処理は実施例1の
図4と同じであり説明を省略する。
【0029】
図7は、実施例1の変形例1におけるスマートスピーカのプロセッサの処理を示すフローチャートである。
図7に示すように、ステップS20の後に、プロセッサ31は、受信部32を介しビーコン端末10から音声データを受信する(ステップS32)。プロセッサ31は、音声データが起動ワードか否かを判定する(ステップS34)。起動ワードは、スマートスピーカ12を操作可能状態にするワードであり、予め決められた単語または短い文章である。起動ワードはウエイクワードともいう。Noのとき、ステップS20に戻る。Yesのとき、ステップS22に進む。ステップS20からS30は実施例1と同じであり説明を省略する。
【0030】
実施例1の変形例1によれば、
図6のステップS16のように、送信部22は、マイクロフォン25の出力信号のレベルAが指定レベルX以上のとき、マイクロフォン25の出力信号を音声データとしてスマートスピーカ12に送信する。
図7のステップS32およびS34のように、スマートスピーカ12は、マイクロフォン25が集音した音がスマートスピーカ12を操作可能状態にする起動ワードか否か判定する。これにより、操作者14が起動ワードを音声50として発することで、スマートスピーカ12を操作可能状態にでき、かつスマートスピーカ12の誤動作を抑制するため処理アルゴリズムを変更できる。
【0031】
実施例1のように、スマートスピーカ12は操作者14の任意の音声に基づく無線信号により操作可能状態にしてもよく、実施例1の変形例1のように、スマートスピーカ12は操作者14が起動ワードを発したことにより操作可能状態にしてもよい。
【0032】
[実施例1の変形例2]
図8は、実施例1の変形例2におけるビーコン端末のブロック図である。
図8に示すように、マイクロフォン25の出力はフィルタ26を介しプロセッサ21に入力する。その他の構成は実施例1およびその変形例と同じであり説明を省略する。
【0033】
フィルタ26は、マイクロフォン25の出力信号のうち人の音声に対応する周波数の信号を通過させ他の周波数の信号を抑圧する。人の主な音声帯域は300Hz~800Hzであり、フィルタ26の通過帯域は例えば300Hz~800Hzである。受付部がマイクロフォン25に加えフィルタ26を含むことで、ステップS12の判定において、人以外において発生した雑音が影響することを抑制できる。よって、スマートスピーカ12の誤動作を抑制できる。フィルタ26は、アナログフィルタでもよいし、デジタルフィルタでもよい。
さらに、プロセッサ31は、方向Gのスマートスピーカ12に入力する音の感度を、方向G以外の方向の音の感度より高くする。これにより、操作者14の方向の感度が高いため、操作者14の音声52の感度が高くなり、音声認識の誤りを抑制できる。操作者14以外の方向の感度が低いため、操作者14以外からの雑音の感度が低くなり、雑音による誤動作を抑制できる。プロセッサ31は、実施例1の距離Lおよび実施例2の方向Gの少なくとも一方を無線信号に基づき検出し、検出した距離Lおよび方向Gの少なくとも一方に基づいてアレイマイクロフォン35aに入力する音の感度を調整してもよい。
実施例2のように、スマートスピーカ12は操作者14の任意の音声に基づく無線信号のより操作可能状態にしてもよく、実施例2の変形例1のように、スマートスピーカ12は操作者14が起動ワードを発したことにより操作可能状態にしてもよい。