IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ▲広▼▲東▼美的白色家▲電▼技▲術▼▲創▼新中心有限公司の特許一覧 ▶ 美的集団股▲フン▼有限公司の特許一覧

特表2022-529708音声認識デバイス及びそのウェイクアップ応答方法、コンピュータ記憶媒体
<>
  • 特表-音声認識デバイス及びそのウェイクアップ応答方法、コンピュータ記憶媒体 図1
  • 特表-音声認識デバイス及びそのウェイクアップ応答方法、コンピュータ記憶媒体 図2
  • 特表-音声認識デバイス及びそのウェイクアップ応答方法、コンピュータ記憶媒体 図3
  • 特表-音声認識デバイス及びそのウェイクアップ応答方法、コンピュータ記憶媒体 図4
  • 特表-音声認識デバイス及びそのウェイクアップ応答方法、コンピュータ記憶媒体 図5
  • 特表-音声認識デバイス及びそのウェイクアップ応答方法、コンピュータ記憶媒体 図6
  • 特表-音声認識デバイス及びそのウェイクアップ応答方法、コンピュータ記憶媒体 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-06-23
(54)【発明の名称】音声認識デバイス及びそのウェイクアップ応答方法、コンピュータ記憶媒体
(51)【国際特許分類】
   G10L 15/28 20130101AFI20220616BHJP
【FI】
G10L15/28 230K
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2021562155
(86)(22)【出願日】2019-12-06
(85)【翻訳文提出日】2021-10-19
(86)【国際出願番号】 CN2019123811
(87)【国際公開番号】W WO2020215736
(87)【国際公開日】2020-10-29
(31)【優先権主張番号】201910343067.8
(32)【優先日】2019-04-26
(33)【優先権主張国・地域又は機関】CN
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.ZIGBEE
(71)【出願人】
【識別番号】521007481
【氏名又は名称】▲広▼▲東▼美的白色家▲電▼技▲術▼▲創▼新中心有限公司
【氏名又は名称原語表記】GUANGDONG MIDEA WHITE HOME APPLIANCE TECHNOLOGY INNOVATION CENTER CO.,LTD.
【住所又は居所原語表記】Building #4,Midea Global Innovation Center,Industry Boulevard,Beijiao,Shunde Foshan,Guangdong 528311,CHINA
(71)【出願人】
【識別番号】512237419
【氏名又は名称】美的集団股▲フン▼有限公司
【氏名又は名称原語表記】MIDEA GROUP CO., LTD.
【住所又は居所原語表記】B26-28F, Midea Headquarter Building, No.6 Midea Avenue, Beijiao, Shunde, Foshan, Guangdong 528311 China
(74)【代理人】
【識別番号】100141139
【弁理士】
【氏名又は名称】及川 周
(74)【代理人】
【識別番号】100205785
【弁理士】
【氏名又は名称】▲高▼橋 史生
(74)【代理人】
【識別番号】100203297
【弁理士】
【氏名又は名称】橋口 明子
(74)【代理人】
【識別番号】100175824
【弁理士】
【氏名又は名称】小林 淳一
(74)【代理人】
【識別番号】100135301
【弁理士】
【氏名又は名称】梶井 良訓
(72)【発明者】
【氏名】何 瑞澄
(57)【要約】
本願は、一つの中枢デバイスと少なくとも一つの非中枢デバイスとに分けられる複数の音声認識デバイスからエリアネットワークが構成され、中枢デバイスにより音声信号を収集し分析することで、中枢デバイスの応答要素を得ることと、非中枢デバイスにより音声信号を収集し分析することで得られた非中枢デバイスの応答要素を受信することと、中枢デバイスの応答要素と非中枢デバイスの応答要素を比較することと、エリアネットワークにおける音声信号に応答する音声認識デバイスである応答予定音声認識デバイスを決定することとを含む音声認識デバイスのウェイクアップ応答方法、音声認識デバイス及びコンピュータ記憶媒体を開示する。本願によるウェイクアップ応答方法によれば、当該音声信号に応答できる複数の音声認識デバイスから当該音声信号に応答する一つのデバイスを決定することが可能になる。
【特許請求の範囲】
【請求項1】
一つの中枢デバイスと少なくとも一つの非中枢デバイスとに分けられる複数の音声認識デバイスからエリアネットワークが構成され、
前記中枢デバイスにより音声信号を収集し分析することで、前記中枢デバイスの応答要素を得ることと、
前記非中枢デバイスにより前記音声信号を収集し分析することで得られた前記非中枢デバイスの応答要素を受信することと、
前記中枢デバイスの応答要素と前記非中枢デバイスの応答要素を比較することと、
前記エリアネットワークにおける前記音声信号に応答する音声認識デバイスである応答予定音声認識デバイスを決定することとを含むことを特徴とする音声認識デバイスのウェイクアップ応答方法。
【請求項2】
前記中枢デバイスの応答要素と前記非中枢デバイスの応答要素を比較して応答予定音声認識デバイスを決定することは、
前記中枢デバイスの応答要素のエネルギ値と前記非中枢デバイスの応答要素のエネルギ値を比較することで、エネルギ値の最も大きい応答要素を得ることと、
前記エネルギ値の最も大きい応答要素に対応する音声認識デバイスを前記応答予定音声認識デバイスと決定することとを含むことを特徴とする、請求項1に記載のウェイクアップ応答方法。
【請求項3】
前記中枢デバイスの応答要素と前記非中枢デバイスの応答要素を比較して応答予定音声認識デバイスを決定することは、
前記中枢デバイスの応答要素のエネルギ値と前記非中枢デバイスの応答要素のエネルギ値を比較することで、エネルギ値の最も大きい応答要素を得ることと、
前記エネルギ値の最も大きい応答要素が前記中枢デバイスの応答要素であるかどうかを判断することと、
前記エネルギ値の最も大きい応答要素が前記中枢デバイスの応答要素であることに応じて、前記中枢デバイスを前記応答予定音声認識デバイスと決定することと、
前記エネルギ値の最も大きい応答要素が前記中枢デバイスの応答要素ではないことに応じて、前記エネルギ値の最も大きい応答要素と前記中枢デバイスの応答要素とのエネルギ差を計算することと、
前記エネルギ差とウェイクアップ閾値を比較することと、
前記エネルギ差が前記ウェイクアップ閾値より大きいことに応じて、前記エネルギ値の最も大きい応答要素に対応する音声認識デバイスを前記応答予定音声認識デバイスと決定することと、
前記エネルギ差が前記ウェイクアップ閾値より小さいか等しいことに応じて、前記中枢デバイスを前記応答予定音声認識デバイスと決定することとを含むことを特徴とする、請求項1に記載のウェイクアップ応答方法。
【請求項4】
前記複数の音声認識デバイスはウェイクアップ優先順位を有し、前記エネルギ値の最も大きい応答要素に対応する音声認識デバイスを前記応答予定音声認識デバイスと決定することは、
前記エネルギ値の最も大きい応答要素に対応する音声認識デバイスからウェイクアップ優先順位の最も高いものを前記応答予定音声認識デバイスと決定することを含むことを特徴とする、請求項2又は請求項3に記載のウェイクアップ応答方法。
【請求項5】
前記中枢デバイスから前記非中枢デバイスへ前記音声信号に応答するかどうかの通知を送信することを含むことを特徴とする、請求項1に記載のウェイクアップ応答方法。
【請求項6】
複数の前記エリアネットワークは互いに接続され、すべてのエリアネットワークにおける複数の中枢デバイスは一つの第一中枢デバイスと少なくとも一つの第二中枢デバイスとに分けられ、
前記第二中枢デバイスから前記第一中枢デバイスへ第二応答要素を送信し、前記第一中枢デバイスにより前記第二中枢デバイスが所在するエリアネットワークにおける応答予定音声認識デバイスの応答要素である前記第二応答要素と前記第一中枢デバイスが所在するエリアネットワークの応答予定音声認識デバイスの応答要素である第一応答要素を比較することで、前記音声信号に応答する音声認識デバイスを決定することをさらに含むことを特徴とする、請求項1に記載のウェイクアップ応答方法。
【請求項7】
複数の前記エリアネットワークは互いに接続され、すべてのエリアネットワークにおける複数の中枢デバイスは一つの第一中枢デバイスと少なくとも一つの第二中枢デバイスとに分けられ、
前記第二中枢デバイスが所在するエリアネットワークの応答予定音声認識デバイスの応答要素である第二応答要素を前記第一中枢デバイスが受信することと、
前記第二応答要素と前記第一中枢デバイスが所在するエリアネットワークにおける応答予定音声認識デバイスの応答要素である第一応答要素を比較することで、前記音声信号に応答する音声認識デバイスを決定することとをさらに含むことを特徴とする、請求項1に記載のウェイクアップ応答方法。
【請求項8】
前記第二応答要素と第一応答要素を比較して前記音声信号に応答する音声認識デバイスを決定することは、
前記第一応答要素のエネルギ値と前記第二応答要素のエネルギ値を比較することで、エネルギ値の最も大きい応答要素を得ることと、
前記エネルギ値の最も大きい応答要素に対応する音声認識デバイスにより前記音声信号に応答するのを決定することとを含むことを特徴とする、請求項6又は請求項7に記載のウェイクアップ応答方法。
【請求項9】
前記複数の音声認識デバイスはウェイクアップ優先順位を有し、前記エネルギ値の最も大きい応答要素に対応する音声認識デバイスを前記応答予定音声認識デバイスと決定することは、
前記エネルギ値の最も大きい応答要素に対応する音声認識デバイスにおけるウェイクアップ優先順位の最も高いものにより前記音声信号に応答するのを決定することを含むことを特徴とする、請求項8に記載のウェイクアップ応答方法。
【請求項10】
前記第二応答要素と前記第一中枢デバイスの第一応答要素を比較して前記音声信号に応答する音声認識デバイスを決定することは、
前記第一応答要素のエネルギ値と前記第二応答要素のエネルギ値を比較することで、エネルギ値の最も大きい応答要素を得ることと、
前記エネルギ値の最も大きい応答要素が前記第一応答要素であるかどうかを判断することと、
前記エネルギ値の最も大きい応答要素が前記第一応答要素であることに応じて、前記第一中枢デバイスにより前記音声信号に応答するのを決定することと、
前記エネルギ値の最も大きい応答要素が前記第一応答要素ではないことに応じて、前記エネルギ値の最も大きい応答要素と前記第一応答要素とのエネルギ差を計算することと、
前記エネルギ差とウェイクアップ閾値を比較することと、
前記エネルギ差が前記ウェイクアップ閾値より大きいことに応じて、前記エネルギ値の最も大きい応答要素に対応する音声認識デバイスにより前記音声信号に応答するのを決定することと、
前記エネルギ差が前記ウェイクアップ閾値より小さいか等しいことに応じて、前記第一中枢デバイスにより前記音声信号に応答するのを決定することとを含むことを特徴とする、請求項6又は請求項7に記載のウェイクアップ応答方法。
【請求項11】
前記複数の音声認識デバイスはウェイクアップ優先順位を有し、前記エネルギ値の最も大きい応答要素に対応する音声認識デバイスにより前記音声信号に応答するのを決定することは、
前記エネルギ値の最も大きい応答要素に対応する音声認識デバイスにおけるウェイクアップ優先順位の最も高いものにより前記音声信号に応答するのを決定することを含むことを特徴とする、請求項10に記載のウェイクアップ応答方法。
【請求項12】
前記第一中枢デバイスから前記複数のエリアネットワークにおける他の音声認識デバイスへ前記音声信号に応答するかどうかの通知を送信することをさらに含むことを特徴とする、請求項6又は請求項7に記載のウェイクアップ応答方法。
【請求項13】
前記中枢デバイスの応答要素と前記非中枢デバイスの応答要素を応答要素と総称し、収集された音声信号を分析して応答要素を得ることは、
前記音声信号の音声特徴及び前記音声信号と前記音声認識デバイスのウェイクアップテンプレートとのマッチング度に基づいて計算することで、前記応答要素のエネルギ値を得ることを含むことを特徴とする、請求項1、請求項6、請求項7のいずれかに記載のウェイクアップ応答方法。
【請求項14】
前記音声信号の音声特徴及び前記音声信号と前記音声認識デバイスのウェイクアップテンプレートとのマッチング度に基づいて計算して前記応答要素のエネルギ値を得ることは、
前記音声信号の音声特徴に基づいて計算することでウェイクアップエネルギが得られ、前記音声認識デバイスが所在する環境での環境騒音の音声特徴に基づいて計算することで暗騒音エネルギが得られ、前記ウェイクアップエネルギと前記暗騒音エネルギとの差を有効エネルギとすることと、
前記音声信号と前記ウェイクアップテンプレートとのマッチング程度に基づいて信頼度を計算することと、
前記有効エネルギと前記信頼度との加重和を求めることで、前記応答要素のエネルギ値を得ることとを含むことを特徴とする、請求項13に記載のウェイクアップ応答方法。
【請求項15】
一つの中枢デバイスと少なくとも一つの非中枢デバイスとに分けられる複数の音声認識デバイスからエリアネットワークが構成され、
前記非中枢デバイスにより音声信号を収集し分析することで、前記非中枢デバイスの応答要素を得ることと、
前記中枢デバイスへ前記非中枢デバイスの応答要素を送信し、前記中枢デバイスにより前記非中枢デバイスの応答要素と前記中枢デバイスの応答要素を比較することで、前記エリアネットワークにおける前記音声信号に応答する音声認識デバイスである応答予定音声認識デバイスを決定することとを含むことを特徴とする音声認識デバイスのウェイクアップ応答方法。
【請求項16】
前記中枢デバイスにより前記非中枢デバイスの応答要素と前記中枢デバイスの応答要素を比較して応答予定音声認識デバイスを決定することは、
前記中枢デバイスにより前記中枢デバイスの応答要素のエネルギ値と前記非中枢デバイスの応答要素のエネルギ値を比較することで、エネルギ値の最も大きい応答要素を得ることと、
前記エネルギ値の最も大きい応答要素に対応する音声認識デバイスを前記応答予定音声認識デバイスと決定することとを含むことを特徴とする、請求項15に記載のウェイクアップ応答方法。
【請求項17】
前記中枢デバイスにより前記中枢デバイスの応答要素のエネルギ値と前記非中枢デバイスの応答要素のエネルギ値を比較することで、エネルギ値の最も大きい応答要素が得られ、
前記エネルギ値の最も大きい応答要素が中枢デバイスの応答要素であるかどうかを判断し、
前記エネルギ値の最も大きい応答要素が前記中枢デバイスの応答要素であることに応じて、前記中枢デバイスを前記応答予定音声認識デバイスと決定し、
前記エネルギ値の最も大きい応答要素が前記中枢デバイスの応答要素ではないことに応じて、前記エネルギ値の最も大きい応答要素と前記中枢デバイスの応答要素とのエネルギ差を計算し、
前記エネルギ差とウェイクアップ閾値を比較し、
前記エネルギ差が前記ウェイクアップ閾値より大きいことに応じて、前記エネルギ値の最も大きい応答要素に対応する音声認識デバイスを前記応答予定音声認識デバイスと決定し、
前記エネルギ差が前記ウェイクアップ閾値より小さいか等しいことに応じて、前記中枢デバイスを前記応答予定音声認識デバイスと決定することを特徴とする、請求項15に記載のウェイクアップ応答方法。
【請求項18】
前記複数の音声認識デバイスはウェイクアップ優先順位を有し、前記エネルギ値の最も大きい応答要素に対応する音声認識デバイスを前記応答予定音声認識デバイスと決定することは、
前記エネルギ値の最も大きい応答要素に対応する音声認識デバイスからウェイクアップ優先順位の最も高いものを前記応答予定音声認識デバイスと決定することを含むことを特徴とする、請求項16又は請求項17に記載のウェイクアップ応答方法。
【請求項19】
前記中枢デバイスから送信される前記音声信号に応答するかどうかの通知を受信することをさらに含むことを特徴とする、請求項15に記載のウェイクアップ応答方法。
【請求項20】
前記中枢デバイスの応答要素と前記非中枢デバイスの応答要素を応答要素と総称し、収集された音声信号を分析して応答要素を得ることは、
前記音声信号の音声特徴及び前記音声信号と前記音声認識デバイスのウェイクアップテンプレートとのマッチング度に基づいて計算することで、前記応答要素のエネルギ値を得ることを含むことを特徴とする、請求項15に記載のウェイクアップ応答方法。
【請求項21】
前記音声信号の音声特徴及び前記音声信号と前記音声認識デバイスのウェイクアップテンプレートとのマッチング度に基づいて計算して前記応答要素のエネルギ値を得ることは、
前記音声信号の音声特徴に基づいて計算することでウェイクアップエネルギが得られ、前記音声認識デバイスが所在する環境での環境騒音の音声特徴に基づいて計算することで暗騒音エネルギが得られ、前記ウェイクアップエネルギと前記暗騒音エネルギとの差を有効エネルギとすることと、
前記音声信号と前記ウェイクアップテンプレートとのマッチング程度に基づいて信頼度を計算することと、
前記有効エネルギと前記信頼度との加重和を求めることで、前記応答要素のエネルギ値を得ることとを含むことを特徴とする、請求項20に記載のウェイクアップ応答方法。
【請求項22】
コンピュータプログラムが記憶されているメモリと、前記コンピュータプログラムを実行することで請求項1~請求項21のいずれかに記載の方法の手順を実現するためのプロセッサとを含むことを特徴とする音声認識デバイス。
【請求項23】
実行されることで請求項1~請求項21のいずれかに記載の方法の手順を実現するコンピュータプログラムが記憶されていることを特徴とするコンピュータ記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本願は音声ウェイクアップの分野に関し、特に、音声認識デバイスのウェイクアップ応答方法、音声認識デバイス及びコンピュータ記憶媒体に関する。
【0002】
本願は2019年4月26日に提出された出願番号が2019103430678、発明の名称が「音声認識デバイス及びそのウェイクアップ応答方法、コンピュータ記憶媒体」である中国特許出願の優先権を主張し、その内容のすべてを援用により本願に組み込んだ。
【背景技術】
【0003】
音声認識や音声対話等の技術は複数の分野において適用されており、音声認識システムを搭載したデバイスは音声信号を受け取った場合、ウェイクアップされてから音声信号に応答することが一般的である。
【0004】
同一領域又は複数の隣接領域にある複数の音声認識デバイスは、同時に音声信号によりウェイクアップされて応答することが発生する可能性があり、通常のシーンでは、ユーザは一つの音声認識デバイスのみをウェイクアップするはずであるのが言うまでもなく、また、複数の音声認識デバイスの同時ウェイクアップと応答により複数の音声認識デバイス同士が互いに干渉してしまい、例えば、一つの音声認識デバイスが前記音声信号に応答して朗読した声を別の音声認識デバイスが受け取って応答し、逆もまた同様であり、即ち、互いに干渉することが発生してしまう。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本願は、従来技術による複数の音声認識デバイスが同時にウェイクアップ音声に応答することで互いに干渉することを解決するために、音声認識デバイスのウェイクアップ応答ウェイクアップ応答方法、音声認識デバイス及びコンピュータ記憶媒体を提供する。
【課題を解決するための手段】
【0006】
上記した技術的課題を解決するために、本願は、一つの中枢デバイスと少なくとも一つの非中枢デバイスとに分けられる複数の音声認識デバイスからエリアネットワークが構成され、中枢デバイスにより音声信号を収集し分析することで、中枢デバイスの応答要素を得ることと、非中枢デバイスにより音声信号を収集し分析することで得られた非中枢デバイスの応答要素を受信することと、中枢デバイスの応答要素と非中枢デバイスの応答要素を比較することと、エリアネットワークにおける音声信号に応答する音声認識デバイスである応答予定音声認識デバイスを決定することとを含む音声認識デバイスのウェイクアップ応答ウェイクアップ応答方法を提供する。
【0007】
上記した技術的課題を解決するために、本願は、一つの中枢デバイスと少なくとも一つの非中枢デバイスとに分けられる複数の音声認識デバイスからエリアネットワークが構成され、非中枢デバイスにより音声信号を収集し分析することで、非中枢デバイスの応答要素を得ることと、中枢デバイスへ非中枢デバイスの応答要素を送信し、中枢デバイスにより非中枢デバイスの応答要素と中枢デバイスの応答要素を比較することで、エリアネットワークにおける音声信号に応答する音声認識デバイスである応答予定音声認識デバイスを決定することとを含む音声認識デバイスのウェイクアップ応答ウェイクアップ応答方法を提供する。
【0008】
上記した技術的課題を解決するために、本願は、コンピュータプログラムを実行することでウェイクアップ応答方法の手順を実現するためのプロセッサと、コンピュータプログラムが記憶されているメモリとを含む音声認識デバイスを提供する。
【0009】
上記した技術的問題を解決するために、本願は、実行されることで上記ウェイクアップ応答方法の手順を実現するコンピュータプログラムが記憶されているコンピュータ記憶媒体を提供する。
【発明の効果】
【0010】
本願によるウェイクアップ応答方法では、複数の音声認識デバイスからエリアネットワークが構成され、音声認識デバイスはいずれも音声信号を収集し、そして収集された音声信号を分析することで応答要素を得る。複数の音声認識デバイスは一つの中枢デバイスと少なくとも一つの非中枢デバイスとに分けられる。中枢デバイスはその自体の応答要素を取得しながら、非中枢デバイスの応答要素を受信し、そして、自体の応答要素と非中枢デバイスの応答要素を比較することで、本エリアネットワークにおける音声信号に応答する音声認識デバイスである応答予定音声認識デバイスを決定する。本願では、エリアネットワークを構成する音声認識デバイスは音声信号によりウェイクアップされた場合ではしばらく応答せず、どのデバイスから応答するかを中枢デバイスにより決定することで、複数の音声認識デバイスのいずれも応答することに起因して互いに干渉することは回避されている。
【図面の簡単な説明】
【0011】
図1】本願による音声認識デバイスを互いに接続したネットワークの構造模式図である。
図2】本願による音声認識デバイスのウェイクアップ応答方法を単一エリアネットワークに適用したフロー模式図である。
図3】本願による音声認識デバイスのウェイクアップ応答方法をマルチエリアネットワークに適用したフロー模式図である。
図4】本願による音声認識デバイスのウェイクアップ応答方法の中枢デバイスでの作動フロー模式図である。
図5】本願による音声認識デバイスウェイクアップ応答方法の非中枢デバイスでの作動フロー模式図である。
図6】本願による音声認識デバイスの一実施例の構造模式図である。
図7】本願によるコンピュータ記憶媒体の一実施例の構造模式図である。
【発明を実施するための形態】
【0012】
本発明の技術的解決手段を当業者がより良好に理解できるようにするために、本願による音声認識デバイスのウェイクアップ応答方法、音声認識デバイス及びコンピュータ記憶媒体を図面と具体的な実施形態に合わせて以下でさらに詳細に説明する。
【0013】
本願によるウェイクアップ応答方法は複数の音声認識デバイスがいずれも同一の音声信号に応答可能な場合に適用されるものであり、このような場合、家電の分野を例とすれば、同一領域又は複数の隣接領域に複数の家電機器が存在しており、それらの家電機器はいずれも音声認識機能を持ち、つまり音声認識デバイスとして機能するものである。例えば、客間領域にはテレビ、空調機、冷蔵庫等の音声認識デバイスが存在し、台所領域には冷蔵庫、電子レンジ、電気ポット、炊飯器等の音声認識デバイスが存在している。ユーザが客間領域から音声信号を出すと、声の伝播特性から、客間領域内の複数の家電機器はいずれもこの音声信号を受け取って応答する可能性があり、この場合、家電機器Aが答えた声を家電機器Bが受け取って応答することも発生し得るので、家電機器同士が互いに干渉してしまい、正常にユーザの需要に答えることができなくなった。また、例えばユーザが客間領域と台所領域との間から音声信号を出すと、二つの領域のいずれにおいても音声信号を受け取って応答する可能性があり、互いに干渉することも発生してしまった。
【0014】
本願による音声認識デバイスはウェイクアップされてから応答するモード、即ち、ユーザが出した音声信号によりウェイクアップされてから応答し返答するものである。これに対して、本願はウェイクアップと応答との間に選択・決定メカニズムを導入し、即ち、音声信号によりウェイクアップされた場合ではしばらく応答せず、応答する必要になるのを確認してから返答するものとされている。
【0015】
具体的には、単一領域の場合、複数の音声認識デバイスを互いに接続してエリアネットワークを構成し、その一つの音声認識デバイスをこのエリアネットワークにおける中枢デバイスとし、本エリアネットワークにおけるどの音声認識デバイスにより当該音声信号に応答するかを中枢デバイスにて決定する。
【0016】
複数領域の場合、まず、エリアネットワーク毎における中枢デバイスにより本エリアネットワークにおいて音声信号に応答する応答予定音声認識デバイスを決定した後、どのエリアネットワークにおける応答予定音声認識デバイスにより応答するかをすべての中枢デバイスにおける一つの第一中枢デバイスにて決定することで、複数の音声認識デバイスのいずれも音声信号に応答することに起因して互いに干渉することは解決される。
【0017】
家電の分野に適用する場合、中枢デバイスはいつでもユーザの音声信号に対応して音声信号に応答するデバイスを決定する必要があるので、長期間に電源に接続されてほとんど停電しない家電機器を選択するのが一般的であり、また、ネットワークにおける中枢デバイスとして対話スクリーンを有する家電機器を優先的に選択し、これは、対話スクリーンを介すれば、関連設定を行いやすくなるためである。例えば、冷蔵庫を中枢デバイスとする。
【0018】
一般には、領域毎例えば客間領域、台所領域のいずれにおいて家電機器のそれぞれによりエリアネットワークを構成でき、このエリアネットワークは領域の区分に対応し、ネットワーク接続から言えば、必ずしも独立したエリアネットワークを構成せず、即ち、家庭中のすべての領域の家電機器は互いに接続して一体となる家電機器ネットワークを構成することがある。
【0019】
本願によるネットワークは、WIFI無線ネットワークからなるローカルエリアネットワーク、有線ネットワークからなるローカルエリアネットワーク、ブルートゥース(登録商標)meshからなるローカルエリアネットワーク、zigbeeからなるローカルエリアネットワーク、RS485からなるローカルエリアネットワーク、LoRaからなるローカルエリアネットワーク、1394からなるローカルエリアネットワーク、CANからなるローカルエリアネットワーク等を含むがそれらに限らない。ネットワークの通信メカニズムはUDP、TCP/IP、HTTP、MQTT、CoAP等を含むがそれらに限らなく、同一ネットワークの音声認識デバイス毎が迅速かつ確実に情報対話を行えればよい。
【0020】
以下で、音声認識デバイスからなるネットワークをもとに本願によるウェイクアップ応答方法を説明する。
【0021】
図1を参照し、本願による音声認識デバイスを互いに接続したネットワークの構造模式図である。図1では、領域は客間領域A、台所領域B、寝室領域Cに分けられ、客間領域Aにおいて、音声認識デバイスは冷蔵庫A1、テレビA2、空気清浄機A3を含み、台所領域Bにおいて、音声認識デバイスはレンジフードB1、炊飯器B2、高速ブレンダB3を含み、寝室領域Cにおいて、音声認識デバイスは空調機C1、加湿器C2を含む。すべての的音声認識デバイスを接続してネットワークを構成しており、領域毎の音声認識デバイスからエリアネットワークも構成されている。
【0022】
エリアネットワーク毎における音声デバイスは一つの中枢デバイスと少なくとも一つの非中枢デバイスとに分けられ、本エリアネットワークにおいて音声信号に応答する応答予定音声認識デバイスを中枢デバイスにて決定する。すべてのエリアネットワークの中枢デバイスはさらに一つの第一中枢デバイスと少なくとも一つの第二中枢デバイスとに分けられ、具体的にどのエリアネットワークにおける応答予定音声認識デバイスにより音声信号に応答するかを第一中枢デバイスにて決定する。
【0023】
本願のいくつかの実施例では、エリアネットワークにおける音声デバイスは中枢デバイスと非中枢デバイスとに分けられるのみならず、さらにウェイクアップ優先順位をも有し、ウェイクアップ優先順位は音声認識デバイスの出荷時にメーカにより設定されてもよく、接続によりネットワークを構成した場合、ウェイクアップ優先順位の最も高い音声認識デバイスは自動的にエリアネットワークの中枢デバイスとなり、また、ウェイクアップ優先順位はネットワークを構築する時に設定されてもよく、つまり、ユーザ自らにより設定されてもよいし、又はネットワークを作るプロバイダにより設定されてもよく、それにより、ウェイクアップ優先順位の最も高い音声認識デバイスはネットワークの中枢デバイスとなる。
【0024】
図1に示されるネットワークでは、客間領域Aの優先順位はA1>A2>A3、台所領域Bの優先順位はB1>B2>B3、寝室領域Cの優先順位はC1>C2とされており、ただし、A1、B1、C1はそれぞれの所在するエリアネットワークの中枢デバイスとなる。各エリアネットワークの中枢デバイス同士についても優先順位はA1>B1>C1とされ、本願では、A1は第一中枢デバイス、B1とC1は第二中枢デバイスとなる。
【0025】
図1に示されるネットワークによれば、単一領域でのウェイクアップ応答及び複数領域でのウェイクアップ応答が実現可能になる。具体的には、図2図3を参照し、図2は本願による音声認識デバイスのウェイクアップ応答方法を単一エリアネットワークに適用したフロー模式図であり、図3は本願による音声認識デバイスのウェイクアップ応答方法をマルチエリアネットワークに適用したフロー模式図である。
【0026】
図2に示されるように、単一エリアネットワークにおいては、下記手順によりウェイクアップ応答方法が実現される。
【0027】
S201:音声認識デバイスにより音声信号を収集し分析することで、応答要素を得る。
【0028】
本ステップでは、音声認識デバイスは主に二つの動作つまり収集と分析を行う。ユーザつまり信号源から音声信号を出した後、音声認識デバイスはいずれも音声信号を収集できるが、ユーザに対する音声認識デバイス毎の相対位置が異なるため、収集された音声信号も異なっている。そのうち、ユーザから遠い音声認識デバイスはエリアネットワークにあるが、音声信号を収集できない可能性もある。
【0029】
音声認識デバイスのそれぞれは収集された音声信号を分析し、本実施例では、エリアネットワーク毎におけるすべての音声認識デバイスは音声信号に対する分析メカニズムが同様であり、これは、それに続く比較計算を容易にするためである。音声信号に対する分析と計算により応答要素が得られ、応答要素は当該音声信号に対する音声認識デバイスの対応程度、即ち、当該音声信号が当該音声認識デバイスに対して出されたものである可能性の高低を示すものである。
【0030】
音声信号に応答する応答予定音声認識デバイスを応答要素に応じて決定する必要があるので、応答要素には音声認識デバイスの標識と、判断のためのエネルギ値とが含まれており、具体的には、音声信号の音声特徴及び音声信号と音声認識デバイスのウェイクアップテンプレートとのマッチング度に基づいて計算することで応答要素のエネルギ値を得ることができる。そのうち、音声特徴は音声信号の音量であってもよく、音量が大きいほど、当該音声認識デバイスにユーザが近いことを示し、当該音声認識デバイスのウェイクアップテンプレートとのマッチング度が高いほど、ユーザが当該音声認識デバイスに対して音声信号を出した可能性が高いことを示す。
【0031】
さらには、応答要素のエネルギ値の計算は以下の様にされてもよい。
【0032】
音声信号の音声特徴に基づいて計算することでウェイクアップエネルギE1が得られ、音声認識デバイスが所在する環境での環境騒音の音声特徴に基づいて計算することで暗騒音エネルギE2が得られ、ウェイクアップエネルギと暗騒音エネルギとの差を有効エネルギE=E1-E2とし、
音声信号とウェイクアップテンプレートとのマッチング度に基づいて信頼度Pを計算し、信頼度Pは音声信号とウェイクアップテンプレートとのマッチング度を示し、音声認識デバイスが音声信号によりウェイクアップされた場合、音声信号とウェイクアップテンプレートとのマッチング程度を判断し、例えば完全にマッチングしていると100%、大部分がマッチングしていると90%や80%又は70%等と表記してもよく、マッチング程度が一定の閾値を超える場合、音声認識デバイスのウェイクアップが可能であると判定する。同様に、ウェイクアップ要素のエネルギを計算する場合に計算される信頼度Pも、ウェイクアップに関する音声信号とウェイクアップテンプレートとのマッチング程度を示すものとなり、例えば、Pは1、0.9、0.8、0.7等とされてもよい。
【0033】
有効エネルギEと信頼度Pとの加重和を求めることで、応答要素のエネルギ値Kが得られ、
K=xE+yP、ただし、xは有効エネルギEの重み係数、yは信頼度Pの重み係数である。
【0034】
そのうち、重み係数x、yは固定数値であってもよいし、複数の固定数値から選択してもよく、さらに、最後に決定される音声信号に応答する音声認識デバイスの正確度に応じて動的に調整されてもよい。
【0035】
本実施例の領域Aでは、デバイスA1により得られる応答要素のエネルギ値をK1、デバイスA2により得られる応答要素のエネルギ値をK2、デバイスA3により得られる応答要素のエネルギ値をK3と表記する。
【0036】
本ステップS201では、中枢デバイスにより音声信号を収集し分析することで、中枢デバイスの応答要素が得られ、非中枢デバイスにより音声信号を収集し分析することで、非中枢デバイスの応答要素が得られる。
【0037】
S202:非中枢デバイスの応答要素を中枢デバイスが受信する。
【0038】
音声認識デバイスにより計算することで応答要素が得られた後、非中枢デバイスは自体が取得した応答要素を中枢デバイスに送信する。本実施例では、中枢デバイスA1は非中枢デバイスから送信される応答要素を受信する。
【0039】
S203:中枢デバイスの応答要素と非中枢デバイスの応答要素とを中枢デバイスにて比較することで、応答予定音声認識デバイスを決定する。
【0040】
本ステップでは、中枢デバイスの応答要素と非中枢デバイスの応答要素とを中枢デバイスにて比較することで、エリアネットワークにおいて音声信号に応答する応答予定音声認識デバイスを決定する。具体的には、中枢デバイスはソートアルゴリズムにより応答要素のエネルギ値を比較することで、すべての応答要素のエネルギ値の並べ替えが得られ、それによりエネルギ値の最も大きい応答要素が得られる。ソートアルゴリズムは挿入ソート、シェルソート、選択ソート、ヒープソート、バブルソート、クイックソート、マージソート、計算ソート、バケットソート、基数ソート等を含むがそれらに限らない。本実施例では、応答要素のエネルギ値の並べ替えはK2>K1>K3となる。
【0041】
応答要素のエネルギ値を比較することで、応答予定音声認識デバイスを決定することができる。具体的な決定方法は様々がある。
【0042】
例えば、エネルギ値の最も大きい応答要素を得た場合、それに対応する音声認識デバイスを応答予定音声認識デバイスと決定してもよい。
【0043】
また、例えば、エネルギ値の最も大きい応答要素を得た場合、エネルギ値の最も大きい応答要素が中枢デバイスの応答要素であることに応じて、即ち、エネルギ値の最も大きい応答要素が中枢デバイスの応答要素であれば、中枢デバイスを応答予定音声認識デバイスと決定する。
【0044】
エネルギ値の最も大きい応答要素が非中枢デバイスの応答要素であることに応じて、即ち、エネルギ値の最も大きい応答要素が非中枢デバイスの応答要素であれば、本実施例ではエネルギ値の最も大きいものがK2であるので、さらにエネルギ値の最も大きい応答要素と中枢デバイスの応答要素とのエネルギ差であるδ=K2-K1を計算する。
【0045】
エネルギ差δとウェイクアップ閾値δdを比較し、エネルギ差δがウェイクアップ閾値δdより大きいと、エネルギ値の最も大きい応答要素に対応する音声認識デバイスを応答予定音声認識デバイスと決定し、エネルギ差δがウェイクアップ閾値δdより小さいか等しいことに応じて、中枢デバイスを応答予定音声認識デバイスと決定する。
【0046】
応答要素を比較し分析する場合、エネルギ値の最も大きい応答要素は二つひいてはそれ以上が得られる可能性があり、この時、さらに音声認識デバイスのウェイクアップ優先順位に基づいて音声信号に応答するデバイスを決定し、即ち、エネルギ値の最も大きい応答要素に対応する音声認識デバイスから優先順位の最も高いものを応答予定音声認識デバイスと決定する。
【0047】
S204:中枢デバイスから非中枢デバイスへ音声信号に応答するかどうかの通知を送信する。
【0048】
中枢デバイスは音声信号に応答する応答予定音声認識デバイスを決定した後、ネットワークを介して非中枢デバイス、即ち、エリアネットワークにおけるウェイクアップされたが応答していない音声認識デバイスのすべてへこの音声信号に応答するかどうかの通知を送信し、この通知として、具体的に応答するか応答する必要がないかを示す情報であってもよいし、決定された当該音声信号に応答する音声認識デバイスのデバイス情報であってもよい。応答予定音声認識デバイスのみに通知を送信してもよく、通知を受けなかった他の音声認識デバイスは応答せず、通知を受けたものは応答する。
【0049】
S205:応答予定音声認識デバイスにより音声信号に応答する。
【0050】
決定された音声認識デバイスは音声信号に応答し、他の音声認識デバイスは応答しない。それにより、一つの音声認識デバイスのみによりこの音声信号に応答することは保証され、互いに干渉することがなくなる。
【0051】
上記図2に示される方法は単一エリアネットワークの音声ウェイクアップ認識に適用されるものであり、単一エリアネットワークにおいて、音声認識デバイスは音声情報によりウェイクアップされた場合では直ちに応答せず、単一エリアネットワークにおける中枢デバイスにより応答予定デバイスを決定してから応答する様である。
【0052】
マルチエリアネットワークのウェイクアップ応答方法は、図2に示される単一エリアネットワーク中の応答予定音声認識デバイスの決定に基づいたものである。具体的には、マルチエリアネットワークつまり互いに接続されている複数のエリアネットワークでは、エリアネットワーク毎の中枢デバイスは互いに接続されながら、一つの第一中枢デバイスと少なくとも一つの第二中枢デバイスとに分けられ、エリアネットワーク毎においてその応答予定音声認識デバイスを決定した後、さらに第一中枢デバイスにより音声信号に応答する音声認識デバイスを確認する。
【0053】
マルチエリアネットワーク中のエリアネットワーク毎によるウェイクアップ応答方法の手順について贅言しないが、さらに図3を参照し、マルチエリアネットワークのウェイクアップ応答方法は以下の手順をさらに含む。
【0054】
S301:第二中枢デバイスから第一中枢デバイスへ第二応答要素を送信し、第二応答要素を第一中枢デバイスが受信する。
【0055】
マルチエリアネットワークでは、第一中枢デバイスはすべてのエリアネットワークにおける応答予定音声認識デバイスの応答要素を比較することで、音声信号に応答する音声認識デバイスを決定する必要があり、応答予定音声認識デバイスは単一エリアネットワークにおいて判断された音声信号に応答する音声認識デバイスであり、マルチエリアネットワークに適用する場合、単一エリアネットワークにおいて決定された応答予定音声認識デバイスは直ちに応答せず、第一中枢デバイスにより複数の応答予定音声認識デバイスからどのデバイスで音声信号に応答するか、即ち、音声信号に応答する最終的な音声認識デバイスを決定する。従って、本ステップS301では、第二中枢デバイスからその第二応答要素を第一中枢デバイスへ送信し、第二応答要素は第二中枢デバイスが所在する領域の応答予定音声認識デバイスの応答要素である。
【0056】
例えば、領域Aでは、A1によりKA1とKA2とKA3を比較することで、A2を応答予定音声認識デバイスと決定し、領域Bでは、B1によりKB1とKB2とKB3を比較することで、B3を応答予定音声認識デバイスと決定し、領域Cでは、C1によりKC1とKC2を比較することで、C1を応答予定デバイスと決定する。
【0057】
B1はその所在するエリアネットワークの応答予定音声認識デバイスB3の応答要素KB3をA1に送信し、C1も応答要素KC1をA1に送信し、A1自体により決定された応答予定音声認識デバイスA2の応答要素はKA2である。
【0058】
S302:第一中枢デバイスにより第二応答要素と第一応答要素を比較することで、音声信号に応答する音声認識デバイスを決定する。
【0059】
第一中枢デバイスにより応答予定音声認識デバイス毎の応答要素つまり第一応答要素と第二応答要素を比較し、第一応答要素は第一中枢デバイスが所在するエリアネットワークにおける応答予定音声認識デバイスの応答要素である。
【0060】
本ステップS302での比較は上記ステップS203での比較と類似するものであり、詳細について贅言しない。
【0061】
例えば、第一応答要素のエネルギ値と第二応答要素のエネルギ値を比較することで、エネルギ値の最も大きい応答要素が得られ、エネルギ値の最も大きい応答要素に対応する音声認識デバイスにより音声信号に応答することを決定するようにしてもよい。
【0062】
また、例えば、第一応答要素のエネルギ値と第二応答要素のエネルギ値を比較することで、エネルギ値の最も大きい応答要素が得られ、エネルギ値の最も大きい応答要素が第一応答要素であれば、第一中枢デバイスにより音声信号に応答し、エネルギ値の最も大きい応答要素が第二応答要素であれば、エネルギ値の最も大きい応答要素と第一応答要素とのエネルギ差を計算してエネルギ差とウェイクアップ閾値を比較し、エネルギ差がウェイクアップ閾値より大きいと、エネルギ値の最も大きい応答要素に対応する音声認識デバイスにより音声信号に応答し、エネルギ差がウェイクアップ閾値より小さいか等しいと、第一中枢デバイスにより音声信号に応答する。
【0063】
本実施例では、A1によりKA2とKB3とKC1を比較することで、例えばB2を音声信号に応答する音声認識デバイスと決定する。
【0064】
同様に、エネルギ値の最も大きい応答要素は二つひいてはそれ以上が得られる可能性があり、この時、さらに音声認識デバイスのウェイクアップ優先順位に基づいて音声信号に応答するデバイスを決定し、即ち、エネルギ値の最も大きい応答要素に対応する音声認識デバイスから優先順位の最も高いものを応答予定音声認識デバイスと決定する。
【0065】
S303:第一中枢デバイスからマルチエリアネットワークにおける他の音声認識デバイスへ音声信号に応答するかどうかの通知を送信する。
【0066】
第一中枢デバイスは音声信号に応答する音声認識デバイスを決定した後、直接ネットワーク全体つまり複数のエリアネットワークへ通知を送信してもよいし、あるいは、最初に各エリアネットワークの中枢デバイスへ通知を送信し、そして各中枢デバイスから非中枢デバイスへ通知を送信するようにしてもよい。同様に、音声信号に応答する音声認識デバイスのみに送信し、通知を受けなかった他の音声認識デバイスは応答しない。
【0067】
S304:決定された音声認識デバイスにより音声信号に応答する。
【0068】
本ステップS304は上記ステップS205と類似するものであり、贅言しない。
【0069】
図3に示される方法は複数領域の音声ウェイクアップ認識に適用されるものであり、領域毎において本領域での応答するべき音声デバイスを決定した後、さらに第一中枢デバイスによりどの領域の音声デバイスから応答するかを決定することで、一つの音声認識デバイスのみにより音声信号に応答することは保証されている。
【0070】
図2図3を適用したネットワークでは、音声認識デバイスはウェイクアップ優先順位を有するので、優先順位の最も高い音声認識デバイスが故障した場合、ウェイクアップ優先順位に基づいてそれに次ぐウェイクアップ優先順位の音声認識デバイスを中枢デバイス又は第一中枢デバイスと決定してもよい。
【0071】
音声認識デバイスはその自体がエリアネットワークにおいてウェイクアップ優先順位の最も高いものであるかどうかを周期的に検知してもよいし、エリアネットワークが変化した時に自体がウェイクアップ優先順位の最も高いものであるかどうかを検知してもよく、自体が現在のエリアネットワークにおいてウェイクアップ優先順位の最も高いものであることを検知した場合、即ち、エリアネットワークにおいてウェイクアップ優先順位の最も高いものであるのを検知したことに応じて、中枢デバイスとして作動するようになる。
【0072】
本実施例によるネットワークのウェイクアップ応答方法は、ネットワークにおける音声認識デバイスがウェイクアップ優先順位を有すること、及び、音声認識デバイスがネットワークの中枢デバイスとして応答要素の比較を行い得ることに基づいたものである。従って、新たにネットワークに参加する音声認識デバイスも本実施例のウェイクアップメカニズムに適合する必要があり、中枢デバイスにより関連設定を行ってもよい。
【0073】
中枢デバイスはネットワークに参加する音声認識デバイスのデバイス情報を取得する。予め設定されたルールに従ってデバイス情報を分析することで、ネットワークにおける音声認識デバイスについてウェイクアップ優先順位を改めて並べ替えるようにしてもよい。
【0074】
音声認識デバイス毎に音声認識システムが搭載され、音声認識システムによりウェイクアップ優先順位や音声認識アルゴリズム、ウェイクアップテンプレート等が決められている。新たに参加する音声認識デバイスは異なる音声認識システムを有し、即ち、異なるウェイクアップ優先順位の設定を有すれば、ネットワークの中枢デバイスはその新しいウェイクアップ優先順位に基づいて改めて並べ替えを行ってもよい。例えば、ネットワークA1-A2-A3に対して音声認識デバイスA4が新たに参加し、そのウェイクアップ優先順位がA3より大きくなるように設定されており、この場合、ウェイクアップ優先順位を改めてA1>A2>A4>A3とする。
【0075】
新たに参加する音声認識デバイスは同一の音声認識システムを有し、即ち、同一のウェイクアップ優先順位の設定を有すれば、先にネットワークに参加した音声認識デバイスのウェイクアップ優先順位の方が高いようにする。例えば、新たに参加する音声認識デバイスA3は先に参加したA3と同一の音声認識システムを有する場合、先に参加したA3をA31、新たに参加するA3をA32として、ウェイクアップ優先順位を改めてA1>A2>A31>A32とする。
【0076】
本実施例のネットワークの場合、そのウェイクアップ応答方法を実現するすべての手順がネットワーク内部にて完了できるので、本実施例の音声認識デバイスはオフラインで作動可能である。
【0077】
上記音声認識デバイスを互いに接続した単一エリアネットワークでは、音声認識デバイスは中枢デバイスと非中枢デバイスの二つの役割を果たすことができる。音声認識デバイス毎は中枢デバイスとして高くて多い機能を有してもよいし、単に非中枢デバイスとして低い機能を有してもよい。
【0078】
家電の分野では、大型家電例えば冷蔵庫やテレビ等において機能の高くて多い音声認識システムを搭載することで、中枢デバイスとして作動させてもよく、小型家電例えば炊飯器や電気ポット等において機能の低い音声認識システムを搭載することで、非中枢デバイスとして作動させてもよい。
【0079】
ネットワークの中枢デバイスとなり得る音声認識装置について、そのウェイクアップ応答方法を実現する手順が図4に示され、図4は本願による音声認識デバイスのウェイクアップ応答方法の中枢デバイスでの作動フロー模式図である。ネットワークの中枢デバイスとして、そのウェイクアップ応答方法の実現は下記手順を含む。
【0080】
S401:音声信号を収集し分析することで、中枢デバイスの応答要素を得る。
【0081】
エリアネットワーク毎における中枢デバイスの場合、本ステップS401は上記ステップS201にて完了し、詳細について贅言しない。
【0082】
S402:非中枢デバイスの応答要素を受信する。
【0083】
本ステップS402は上記ステップS202に対応しており、詳細について贅言しない。
【0084】
S403:中枢デバイスの応答要素と非中枢デバイスの応答要素を比較することで、エリアネットワークにおける応答予定音声認識デバイスを決定する。
【0085】
本ステップS403は上記ステップS203と類似するものであり、詳細について贅言しない。
【0086】
上記手順において、音声認識デバイスを中枢デバイスとして単一領域でのウェイクアップ応答方法を実現するための手段を説明したが、ステップ毎の詳細や中枢デバイスが作動する詳細も上述されたため、贅言しない。本実施例の音声認識デバイスは複数の音声認識デバイスから当該音声信号に応答する一つの音声認識デバイスを決定可能であり、いずれも応答することに起因して互いに干渉することは回避されている。
【0087】
さらには、マルチエリアネットワークの場合、中枢デバイスはさらに第一中枢デバイスと第二中枢デバイスとに分けられ、第一中枢デバイスは下記手順をさらに実行する。
【0088】
S404:第二応答要素を第一中枢デバイスが受信する。
【0089】
本ステップS404は上記ステップS301にて完了し、詳細について贅言しない。
【0090】
S406:第一応答要素と第二応答要素を比較することで、音声信号に応答する音声認識デバイスを決定する。
【0091】
本ステップS406は上記ステップS302と類似するものであり、詳細について贅言しない。
【0092】
第二中枢デバイスは下記手順を実行する。
【0093】
S405:第二中枢デバイスから第一中枢デバイスへ第二応答要素を送信し、第一中枢デバイスにより第一応答要素と第二応答要素を比較することで、音声信号に応答する音声認識デバイスを決定する。
【0094】
本ステップS405は上記ステップS301-S302にて完了し、詳細について贅言しない。
【0095】
さらには、マルチエリアネットワークでは、どのエリアネットワークにおける応答予定音声認識デバイスにより音声信号に応答するかを第一中枢デバイスにてさらに決定する。
【0096】
非中枢デバイスから見れば、そのウェイクアップ応答方法を実現する手順が図5に示され、図5は本願による音声認識デバイスウェイクアップ応答方法の非中枢デバイスでの作動フロー模式図である。当該音声認識デバイスは非中枢デバイスとされており、本実施例のウェイクアップ応答方法は下記手順を含む。
【0097】
S501:音声信号を収集し分析することで、非中枢デバイスの応答要素を得る。
【0098】
本ステップS501は上記ステップS201と類似し、いずれも応答要素を取得するものであり、詳細について贅言しない。
【0099】
S502:中枢デバイスへ非中枢デバイスの応答要素を送信し、中枢デバイスにより非中枢デバイスの応答要素と中枢デバイスの応答要素を比較することで、応答予定音声認識デバイスを決定する。
【0100】
非中枢デバイスは音声信号を収集した場合では直ちに当該音声信号に応答せず、計算と分析を行うことで応答要素を得てから、この応答要素を中枢デバイスに伝送して分析し比較することで、中枢デバイスにより音声信号に応答する音声認識デバイスを決定する。
【0101】
本実施例において、音声認識デバイスを非中枢デバイスとしてそのウェイクアップ応答方法を実行するための手段を説明したが、ステップ毎の詳細や非中枢デバイスが作動する詳細も上述されたため、贅言しない。本実施例の音声認識デバイスは音声信号を受信した場合では直ちに応答せず、通知を受けた後に応答するかどうかを決定するので、他の音声認識デバイスと同時に応答することに起因して互いに干渉することは回避されている。
【0102】
上記ウェイクアップ応答方法は音声認識デバイスにより実現されるため、本願は図6に示される音声認識デバイスをさらに提案し、図6は本願による音声認識デバイスの一実施例の構造模式図であり、本実施例の音声認識デバイス100は互いに接続されている音声収集装置11とプロセッサ12とメモリ13とを含む家電であってもよく、本実施例の音声認識デバイス100によれば、上記ウェイクアップ応答方法の実施例を実現可能になる。そのうち、音声収集装置11は音声信号を収集するためのものであり、メモリ13にコンピュータプログラムが記憶され、プロセッサ12はコンピュータプログラムを実行することで上記ウェイクアップ応答方法を実現するためのものである。
【0103】
具体的には、音声収集装置11は音声信号を収集するためのものであり、プロセッサ12は収集された音声信号を分析して応答要素を得てから、予め設定されたアルゴリズムに従ってすべての応答要素を比較することで、音声信号に応答する音声認識デバイスを決定し、そして他の音声認識デバイスへ音声信号に応答するかどうかの通知を送信するためのものである。
【0104】
あるいは、音声収集装置11は音声信号を収集するためのものであり、プロセッサ12は収集された音声信号を分析して応答要素を得てから中枢デバイスに送信し、受信された中枢デバイスからの音声信号に応答するかどうかの通知に基づいて応答するかどうかを決定するためのものである。
【0105】
そのうち、プロセッサ12は集積回路チップであってもよく、信号処理能力を有する。プロセッサ12は汎用プロセッサ、デジタル信号プロセッサ(DSP)、専用集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)又は他のプログラマブル論理素子、ディスクリートゲート又はトランジスタ論理素子、ディスクリートハードウェア部品であってもよい。汎用プロセッサはマイクロプロセッサであってもよいし、あらゆる一般的なプロセッサ等であってもよい。
【0106】
上記実施例の方法はコンピュータプログラムとして提供されてもよいので、本願は図7に示されるコンピュータ記憶媒体を提案し、図7は本願によるコンピュータ記憶媒体の一実施例の構造模式図である。本実施例のコンピュータ記憶媒体200には、実行されることで上記実施例の方法を実現可能なコンピュータプログラム21が記憶されている。
【0107】
本実施例のコンピュータ記憶媒体200はUディスク、ポータブルハードディスク、読取専用メモリ(ROM:Read-Only Memory)、ランダムアクセスメモリ(RAM:Random Access Memory)、磁気ディスク又は光ディスク等のプログラム指令を記憶できる媒体であってもよいし、又は当該プログラム指令を記憶したサーバであってもよく、当該サーバは記憶されたプログラム指令を他のデバイスに実行させるように送信してもよいし、又は記憶されたプログラム指令を自分で実行してもよい。
【0108】
本願によるいくつかの実施例において開示される方法とデバイスは他の態様で実現され得ることは理解されたい。例えば、上記したデバイスの実施形態は模式的なものに過ぎず、例えば、モジュール又はユニットは論理機能に従って分けられており、実際に実現する場合には他の態様で分けてもよく、例えば、複数のユニット又はコンポーネントは別のシステムに組み合わせ又は統合されてもよく、あるいは、一部の特徴を無視したり、実行しなかったりしてもよい。また、表示又は検討される互いの結合や直接結合又は通信接続はあるインタフェース、デバイス又はユニットを介する間接結合又は通信接続であってもよく、電気的や機械的又は他の態様のものであってもよい。
【0109】
個別部品として説明されるユニットは物理的に独立したものであってもよくではなくてもよく、ユニットとして表示される部品は物理的なユニットであってもよくではなくてもよく、即ち、ある場所にあってもよいし、複数のネットワークユニットに分布されてもよい。実際の需要に応じてその一部又は全部のユニットを選択して本実施形態による解決手段を実現するようにしてもよい。
【0110】
また、本願の各実施例中の各機能ユニットは一つの処理ユニットに統合されてもよいし、物理的なものとして個別に存在してもよく、また、二つ又はそれ以上のユニットを一つのユニットに統合してもよい。上記統合されているユニットはハードウェアとして実現されてもよいし、ソフトウェア機能ユニットとして実現されてもよい。
【0111】
統合されているユニットはソフトウェア機能ユニットとして実現されながら独立した製品として販売され使用される場合、コンピュータ読取可能な記憶媒体に記憶されてもよい。このような理解のもとに、本願による技術的解決手段は本質的に、あるいは、従来技術に貢献する部分又はその全部や一部がソフトウェア製品として表現でき、このコンピュータソフトウェア製品は記憶媒体に記憶され、コンピュータ機器(パソコン、サーバ又はネットワークデバイス等であってもよい)又はプロセッサ(processor)に本願の各実施形態による方法の全部や一部の手順を実行させるように若干の指令を含む。前述した記憶媒体はUディスク、ポータブルハードディスク、読取専用メモリ(ROM:Read-Only Memory)、ランダムアクセスメモリ(RAM:Random Access Memory)、磁気ディスク又は光ディスク等のプログラムコードを記憶できる様々な媒体を含む。
【0112】
上記は本願の実施形態に過ぎず、それにより本願の保護範囲を制限するべきではなく、本願の明細書及び図面に基づいてなされた等価構造又は等価流れなどの変形、あるいは、直接又は間接的に他の関連技術分野に適用したものはいずれも本願の保護範囲に含まれる。
【符号の説明】
【0113】
11 音声収集装置
12 プロセッサ
13 メモリ
100 音声認識デバイス
200 コンピュータ記憶媒体
A1 第一中枢デバイス
B1 第二中枢デバイス
C1 第二中枢デバイス
図1
図2
図3
図4
図5
図6
図7
【国際調査報告】