IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッドの特許一覧

<>
  • 特許-音声ウェイクアップ方法及び装置 図1
  • 特許-音声ウェイクアップ方法及び装置 図2
  • 特許-音声ウェイクアップ方法及び装置 図3
  • 特許-音声ウェイクアップ方法及び装置 図4
  • 特許-音声ウェイクアップ方法及び装置 図5
  • 特許-音声ウェイクアップ方法及び装置 図6
  • 特許-音声ウェイクアップ方法及び装置 図7
  • 特許-音声ウェイクアップ方法及び装置 図8
  • 特許-音声ウェイクアップ方法及び装置 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-03-06
(45)【発行日】2023-03-14
(54)【発明の名称】音声ウェイクアップ方法及び装置
(51)【国際特許分類】
   G06F 3/16 20060101AFI20230307BHJP
   G10L 15/00 20130101ALI20230307BHJP
【FI】
G06F3/16 630
G10L15/00 200Z
G06F3/16 610
【請求項の数】 9
(21)【出願番号】P 2020191557
(22)【出願日】2020-11-18
(65)【公開番号】P2021111359
(43)【公開日】2021-08-02
【審査請求日】2020-11-18
(31)【優先権主張番号】202010015663.6
(32)【優先日】2020-01-07
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】512015127
【氏名又は名称】バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド
(74)【代理人】
【識別番号】100118913
【弁理士】
【氏名又は名称】上田 邦生
(74)【代理人】
【識別番号】100142789
【弁理士】
【氏名又は名称】柳 順一郎
(74)【代理人】
【識別番号】100163050
【弁理士】
【氏名又は名称】小栗 眞由美
(74)【代理人】
【識別番号】100201466
【弁理士】
【氏名又は名称】竹内 邦彦
(72)【発明者】
【氏名】ミ, シュー
(72)【発明者】
【氏名】ファン,ロンション
(72)【発明者】
【氏名】ワン, ポン
(72)【発明者】
【氏名】モン, ヤン
(72)【発明者】
【氏名】ルー, ユー
(72)【発明者】
【氏名】ジャン, シャオロン
(72)【発明者】
【氏名】ジン, ルー
(72)【発明者】
【氏名】ジャン, シーワン
(72)【発明者】
【氏名】リー, シュエン
【審査官】塩屋 雅弘
(56)【参考文献】
【文献】特表2018-532151(JP,A)
【文献】特開2003-223188(JP,A)
【文献】特開2019-204103(JP,A)
【文献】国際公開第2018/075660(WO,A1)
【文献】特表2018-537700(JP,A)
【文献】特開2017-121026(JP,A)
【文献】国際公開第2019/196947(WO,A1)
【文献】特開平11-024694(JP,A)
【文献】米国特許出願公開第2017/0076720(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 3/16
G10L 15/00
(57)【特許請求の範囲】
【請求項1】
ユーザのウェイクアップ音声を収集し、前記ウェイクアップ音声及び現在のスマートデバイスの状態情報に基づいて、前記現在のスマートデバイスのウェイクアップ情報を生成するステップと、
前記現在のスマートデバイスのウェイクアップ情報をネットワーク内の非現在のスマートデバイスに送信し、及び前記ネットワーク内の非現在のスマートデバイスから送信されたウェイクアップ情報を受信するステップと、
前記ネットワーク内の各スマートデバイスのウェイクアップ情報を組み合わせて、前記現在のスマートデバイスが対象の音声対話装置であるか否かを決定するステップと、
前記現在のスマートデバイスが対象の音声対話装置である場合、前記現在のスマートデバイスを制御して前記ユーザと音声対話を行うステップと、
を含み、
前記ネットワーク内の各スマートデバイスのウェイクアップ情報を組み合わせて、前記現在のスマートデバイスが対象の音声対話装置であるか否かを決定するステップが、
前記現在のスマートデバイスのウェイクアップ情報の生成時点を取得するステップと、
前記非現在のスマートデバイスのウェイクアップ情報を受信する受信時点を取得するステップと、
前記生成時点及び前記受信時点に基づいて、第1のスマートデバイスを決定するステップであって、前記第1のスマートデバイスは、対応する受信時点と前記生成時点との差の絶対値が予め設定された差のしきい値より小さいスマートデバイスであるステップと、
前記現在のスマートデバイスのウェイクアップ情報、及び前記第1のスマートデバイスのウェイクアップ情報に基づいて、前記現在のスマートデバイスが対象の音声対話装置であるか否かを決定するステップと、
を含み、
ユーザのウェイクアップ音声を収集し、前記ウェイクアップ音声及び前記現在のスマートデバイスの状態情報に基づいて、前記現在のスマートデバイスのウェイクアップ情報を生成する前に、
前記現在のスマートデバイスが前記ネットワークに参加する場合、前記ネットワークのマルチキャストアドレスに基づいて、前記ネットワーク内の非現在のスマートデバイスに前記現在のスマートデバイスのアドレスをマルチキャストするステップと、
前記ネットワーク内の非現在のスマートデバイスから返された非現在のスマートデバイスのアドレスを受信するステップと、
前記ネットワーク内の1つのスマートデバイスがマルチキャストする場合、前記ネットワーク内の他のスマートデバイスがマルチキャストデータを受信可能にするように、前記マルチキャストアドレスと各スマートデバイスのアドレスとの間の対応関係を確立するステップと、
を含む音声ウェイクアップ方法。
【請求項2】
前記ネットワーク内の各スマートデバイスのウェイクアップ情報を組み合わせて、前記現在のスマートデバイスが対象の音声対話装置であるか否かを決定するステップが、
予め設定された計算ポリシーに従って前記現在のスマートデバイスのウェイクアップ情報内の各パラメータを計算して、計算結果を取得するステップと、
予め設定された計算ポリシーに従って各非現在のスマートデバイスのウェイクアップ情報内の各パラメータを計算して、計算結果を取得するステップと、
第2のスマートデバイスが存在しない場合、前記現在のスマートデバイスを対象の音声対話装置として決定するステップであって、前記第2のスマートデバイスは、対応する計算結果が前記現在のスマートデバイスの計算結果より大きいスマートデバイスであるステップと、
を含む請求項1に記載の方法。
【請求項3】
前記ウェイクアップ情報が、ウェイクアップ音声強度と、以下のパラメータのいずれか一つ又は複数とを含み、前記パラメータは、スマートデバイスがアクティブ状態にあるか否か、スマートデバイスが人の目に注視されているか否か、スマートデバイスがジェスチャーによって指し示されているか否かである請求項1に記載の方法。
【請求項4】
ユーザのウェイクアップ音声を収集し、前記ウェイクアップ音声及び現在のスマートデバイスの状態情報に基づいて、前記現在のスマートデバイスのウェイクアップ情報を生成するための収集モジュールと、
前記現在のスマートデバイスのウェイクアップ情報をネットワーク内の非現在のスマートデバイスに送信し、及び前記ネットワーク内の非現在のスマートデバイスから送信されたウェイクアップ情報を受信するための送受信モジュールと、
前記ネットワーク内の各スマートデバイスのウェイクアップ情報を組み合わせて、前記現在のスマートデバイスが対象の音声対話装置であるか否かを決定するための決定モジュールと、
前記現在のスマートデバイスが対象の音声対話装置である場合、前記現在のスマートデバイスを制御して前記ユーザと音声対話を行うための制御モジュールと、
確立モジュールと、
を備え、
前記決定モジュールが、
前記現在のスマートデバイスのウェイクアップ情報の生成時点を取得し、
前記非現在のスマートデバイスのウェイクアップ情報を受信する受信時点を取得し、
前記生成時点及び前記受信時点に基づいて、第1のスマートデバイスを決定し、
前記第1のスマートデバイスは、対応する受信時点と前記生成時点との差の絶対値が予め設定された差のしきい値より小さいスマートデバイスであり、
前記現在のスマートデバイスのウェイクアップ情報、及び前記第1のスマートデバイスのウェイクアップ情報に基づいて、前記現在のスマートデバイスが対象の音声対話装置であるか否かを決定することに用いられ
前記送受信モジュールが、前記現在のスマートデバイスが前記ネットワークに参加する場合、前記ネットワークのマルチキャストアドレスに基づいて、前記ネットワーク内の非現在のスマートデバイスに前記現在のスマートデバイスのアドレスをマルチキャストし、前記ネットワーク内の非現在のスマートデバイスから返された非現在のスマートデバイスのアドレスを受信することに用いられ、
前記確立モジュールが、前記ネットワーク内の1つのスマートデバイスがマルチキャストする場合、前記ネットワーク内の他のスマートデバイスがマルチキャストデータを受信可能にするように、前記マルチキャストアドレスと各スマートデバイスのアドレスとの間の対応関係を確立することに用いられる音声ウェイクアップ装置。
【請求項5】
前記決定モジュールが、
予め設定された計算ポリシーに従って前記現在のスマートデバイスのウェイクアップ情報内の各パラメータを計算して、計算結果を取得し、
予め設定された計算ポリシーに従って各非現在のスマートデバイスのウェイクアップ情報内の各パラメータを計算して、計算結果を取得し、
第2のスマートデバイスが存在しない場合、前記現在のスマートデバイスを対象の音声対話装置として決定することに用いられ、
前記第2のスマートデバイスは、対応する計算結果が前記現在のスマートデバイスの計算結果より大きいスマートデバイスである請求項に記載の装置。
【請求項6】
前記ウェイクアップ情報が、ウェイクアップ音声強度と、以下のパラメータのいずれか一つ又は複数とを含み、前記パラメータは、スマートデバイスがアクティブ状態にあるか否か、スマートデバイスが人の目に注視されているか否か、スマートデバイスがジェスチャーによって指し示されているか否かである請求項に記載の装置。
【請求項7】
少なくとも1つのプロセッサと、該少なくとも1つのプロセッサと通信可能に接続されるメモリと、を備え、
前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶され、前記命令は、前記少なくとも1つのプロセッサが請求項1からのいずれか一項に記載の方法を実行できるように、前記少なくとも1つのプロセッサによって実行される電子機器。
【請求項8】
コンピュータ命令が記憶される非一時的なコンピュータ読み取り可能な記憶媒体であって、前記コンピュータ命令は、コンピュータに請求項1からのいずれか一項に記載の方法を実行させることに用いられる、コンピュータ命令が記憶される非一時的なコンピュータ読み取り可能な記憶媒体。
【請求項9】
コンピュータプログラムにおける命令が実行された場合に、請求項1からのいずれか一項に記載の方法が実行されるコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本出願は音声処理技術分野に関し、具体的には、ヒューマンマシンインタラクション技術分野に関し、特に音声ウェイクアップ方法及び装置に関する。
【背景技術】
【0002】
現在、家庭などのシーンのネットワークにおいて、スマートスピーカー、スマートテレビなど、複数のスマート音声機器が配置されているのは一般的であり、ユーザがウェイクワードを発声すると、複数のスマート音声機器が同時に応答し、ウェイクアップの音による干渉が大きく、ユーザのウェイクアップ体験が低下し、しかもどの機器がユーザと音声対話を行う機器であるかをユーザが知ることが困難であり、音声対話の効率が悪い。
【発明の概要】
【発明が解決しようとする課題】
【0003】
本出願は音声ウェイクアップ方法及び装置を提供し、スマートデバイスを介して各スマート音声機器のウェイクアップ情報と組み合わることによって、最適なスマート音声機器を決定し、最適なスマート音声機器を介してユーザのウェイクワードに応答し、複数のスマートデバイスの同時応答によるユーザへの干渉を回避し、ユーザがどのデバイスがユーザとの音声対話を行うデバイスであるかを明確に知ることができ、音声対話の効率が高くなる。
【課題を解決するための手段】
【0004】
本出願の第1態様の実施例は音声ウェイクアップ方法を提供し、ユーザのウェイクアップ音声を収集し、前記ウェイクアップ音声及び前記現在デバイスの状態情報に基づいて、前記現在デバイスのウェイクアップ情報を生成するステップと、前記現在デバイスのウェイクアップ情報を前記ネットワーク内の非現在のスマートデバイスに送信し、及び前記ネットワーク内の非現在のスマートデバイスから送信されたウェイクアップ情報を受信するステップと、前記ネットワーク内の各スマートデバイスのウェイクアップ情報を組み合わせて、前記現在のスマートデバイスが対象の音声対話装置であるか否かを決定するステップと、前記現在のスマートデバイスが対象の音声対話装置である場合、前記現在のスマートデバイスを制御して前記ユーザと音声対話を行うステップと、を含む。
【0005】
本出願の1つの実施例において、前記ネットワーク内の各スマートデバイスのウェイクアップ情報を組み合わせて、前記現在のスマートデバイスが対象の音声対話装置であるか否かを決定するステップが、前記現在のスマートデバイスのウェイクアップ情報の生成時点を取得するステップと、前記非現在のスマートデバイスのウェイクアップ情報を受信する受信時点を取得するステップと、前記生成時点及び前記受信時点に基づいて、第1のスマートデバイスを決定するステップであって、前記第1のスマートデバイスは、対応する受信時点と前記生成時点との差の絶対値が予め設定された差のしきい値より小さいスマートデバイスであるステップと、前記現在のスマートデバイスのウェイクアップ情報、及び前記第1のスマートデバイスのウェイクアップ情報に基づいて、前記現在のスマートデバイスが対象の音声対話装置であるか否かを決定するステップと、を含む。
【0006】
本出願の1つの実施例において、ユーザのウェイクアップ音声を収集し、前記ウェイクアップ音声及び前記現在のスマートデバイスの状態情報に基づいて、前記現在のスマートデバイスのウェイクアップ情報を生成する前に、前記現在のスマートデバイスが前記ネットワークに参加する場合、前記ネットワークのマルチキャストアドレスに基づいて、前記ネットワーク内の非現在のスマートデバイスに前記第1のスマートデバイスのアドレスをマルチキャストするステップと、前記ネットワーク内の非現在のスマートデバイスから返された非現在のスマートデバイスのアドレスを受信するステップと、前記ネットワーク内の1つのスマートデバイスがマルチキャストする場合、前記ネットワーク内の他のスマートデバイスがマルチキャストデータを受信可能にするように、前記マルチキャストアドレスと各スマートデバイスのアドレスとの間の対応関係を確立するステップと、をさらに含む。
【0007】
本出願の1つの実施例において、前記ネットワーク内の各スマートデバイスのウェイクアップ情報を組み合わせて、前記現在のスマートデバイスが対象の音声対話装置であるか否かを決定するステップが、予め設定された計算ポリシーに従って前記現在のスマートデバイスのウェイクアップ情報内の各パラメータを計算して、計算結果を取得するステップと、予め設定された計算ポリシーに従って各非現在のスマートデバイスのウェイクアップ情報内の各パラメータを計算して、計算結果を取得するステップと、第2のスマートデバイスが存在しない場合、前記現在のスマートデバイスを対象の音声対話装置として決定するステップであって、前記第2のスマートデバイスは、対応する計算結果が前記現在のスマートデバイスの計算結果より大きいスマートデバイスであるステップと、を含む。
【0008】
本出願の1つの実施例において、ウェイクアップ情報が、ウェイクアップ音声強度と、以下のパラメータのいずれか一つ又は複数とを含み、前記パラメータは、スマートデバイスがアクティブ状態にあるか否か、スマートデバイスが人の目に注視されているか否か、スマートデバイスがジェスチャーによって指し示されているか否かである。
【0009】
本出願の実施例の音声ウェイクアップ方法は、ネットワーク内の現在のスマートデバイスに適用され、ユーザのウェイクアップ音声を収集することによって、前記ウェイクアップ音声及び前記現在のスマートデバイスの状態情報に基づいて、前記現在のスマートデバイスのウェイクアップ情報を生成し、前記現在のスマートデバイスのウェイクアップ情報を前記ネットワーク内の非現在のスマートデバイスに送信し、及び前記ネットワーク内の非現在のスマートデバイスから送信されたウェイクアップ情報を受信し、前記ネットワーク内の各スマートデバイスのウェイクアップ情報を組み合わせて、前記現在のスマートデバイスが対象の音声対話装置であるか否かを決定し、前記現在のスマートデバイスが対象の音声対話装置である場合、前記現在のスマートデバイスを制御して前記ユーザと音声対話を行う。該方法は、スマートデバイスを介して各スマート音声機器のウェイクアップ情報を組み合わせて、最適なスマート音声機器を決定し、最適なスマート音声機器を介してユーザのウェイクワードに応答し、複数のスマートデバイスの同時応答によるユーザへの干渉を回避し、ユーザがどのデバイスがユーザとの音声対話を行うデバイスであるかを明確に知ることができ、音声対話の効率が高くなる。
【0010】
本出願の第2態様の実施例は音声ウェイクアップ装置を提供し、ユーザのウェイクアップ音声を収集し、前記ウェイクアップ音声及び前記現在のスマートデバイスの状態情報に基づいて、前記現在のスマートデバイスのウェイクアップ情報を生成するための収集モジュールと、前記現在のスマートデバイスのウェイクアップ情報を前記ネットワーク内の非現在のスマートデバイスに送信し、及び前記ネットワーク内の非現在のスマートデバイスから送信されたウェイクアップ情報を受信するための送受信モジュールと、前記ネットワーク内の各スマートデバイスのウェイクアップ情報を組み合わせて、前記現在のスマートデバイスが対象の音声対話装置であるか否かを決定するための決定モジュールと、前記現在のスマートデバイスが対象の音声対話装置である場合、前記現在のスマートデバイスを制御して前記ユーザと音声対話を行うための制御モジュールと、を備える。
【0011】
本出願の1つの実施例において、決定モジュールが具体的に、前記現在のスマートデバイスのウェイクアップ情報の生成時点を取得し、前記非現在のスマートデバイスのウェイクアップ情報を受信する受信時点を取得し、前記生成時点及び前記受信時点に基づいて、第1のスマートデバイスを決定し、前記第1のスマートデバイスは、対応する受信時点と前記生成時点との差の絶対値が予め設定された差のしきい値より小さいスマートデバイスであり、前記現在のスマートデバイスのウェイクアップ情報、及び前記第1のスマートデバイスのウェイクアップ情報に基づいて、前記現在のスマートデバイスが対象の音声対話装置であるか否かを決定することに用いられる。
【0012】
本出願の1つの実施例において、音声ウェイクアップ装置がさらに確立モジュールを備える。前記送受信モジュールがさらに、前記現在のスマートデバイスが前記ネットワークに参加する場合、前記ネットワークのマルチキャストアドレスに基づいて、前記ネットワーク内の非現在のスマートデバイスに前記現在のスマートデバイスのアドレスをマルチキャストし、前記ネットワーク内の非現在のスマートデバイスから返された非現在のスマートデバイスのアドレスを受信することに用いられる。前記確立モジュールが、前記ネットワーク内の1つのスマートデバイスがマルチキャストする場合、前記ネットワーク内の他のスマートデバイスがマルチキャストデータを受信可能にするように、前記マルチキャストアドレスと各スマートデバイスのアドレスとの間の対応関係を確立することに用いられる。
【0013】
本出願の1つの実施例において、前記決定モジュールが具体的に、予め設定された計算ポリシーに従って前記現在のスマートデバイスのウェイクアップ情報内の各パラメータを計算して、計算結果を取得し、予め設定された計算ポリシーに従って各非現在のスマートデバイスのウェイクアップ情報内の各パラメータを計算して、計算結果を取得し、第2のスマートデバイスが存在しない場合、前記現在のスマートデバイスを対象の音声対話装置として決定することに用いられ、前記第2のスマートデバイスは、対応する計算結果が前記現在のスマートデバイスの計算結果より大きいスマートデバイスである。
【0014】
本出願の1つの実施例において、前記ウェイクアップ情報が、ウェイクアップ音声強度と、以下のパラメータのいずれか一つ又は複数とを含み、前記パラメータは、スマートデバイスがアクティブ状態にあるか否か、スマートデバイスが人の目に注視されているか否か、スマートデバイスがジェスチャーによって指し示されているか否かである。
【0015】
本出願の実施例の音声ウェイクアップ装置は、ネットワーク内の現在のスマートデバイスに適用され、ユーザのウェイクアップ音声を収集することによって、前記ウェイクアップ音声及び前記現在のスマートデバイスの状態情報に基づいて、前記現在のスマートデバイスのウェイクアップ情報を生成し、前記現在のスマートデバイスのウェイクアップ情報を前記ネットワーク内の非現在のスマートデバイスに送信し、及び前記ネットワーク内の非現在のスマートデバイスから送信されたウェイクアップ情報を受信し、前記ネットワーク内の各スマートデバイスのウェイクアップ情報を組み合わせて、前記現在のスマートデバイスが対象の音声対話装置であるか否かを決定し、前記現在のスマートデバイスが対象の音声対話装置である場合、前記現在のスマートデバイスを制御して前記ユーザと音声対話を行う。該装置スマートデバイスを介して各スマート音声機器のウェイクアップ情報を組み合わせて、最適なスマート音声機器を決定し、最適なスマート音声機器を介してユーザのウェイクワードに応答し、複数のスマートデバイスの同時応答によるユーザへの干渉を回避し、ユーザがどのデバイスがユーザとの音声対話を行うデバイスであるかを明確に知ることができ、音声対話の効率が高くなる。
【0016】
本出願の第3態様の実施例は電子機器を提供し、少なくとも1つのプロセッサと、該少なくとも1つのプロセッサと通信可能に接続されるメモリとを備える。前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶され、前記命令は、前記少なくとも1つのプロセッサが本出願の実施例の音声ウェイクアップ方法を実行できるように、前記少なくとも1つのプロセッサによって実行される。
【0017】
本出願の第4態様の実施例は、コンピュータ命令が記憶される非一時的なコンピュータ読み取り可能な記憶媒体を提供し、前記コンピュータ命令は、コンピュータに本出願の実施例の音声ウェイクアップ方法を実行させることに用いられる。
本開示の第5の態様では、コンピュータプログラムを提供し、前記コンピュータプログラムにおける命令が実行された場合に、本出願の実施例の音声ウェイクアップ方法が実行される。
【発明の効果】
【0018】
上記の選択可能な形態が有する他の効果は以下で具体的な実施例と組み合わせて説明する。
【図面の簡単な説明】
【0019】
図面は本解決手段をよりよく理解するためのものであり、本出願を限定するものではない。
図1】本出願の第1の実施例に係る概略図である。
図2】本出願の第2の実施例に係る概略図である。
図3】本出願の実施例のネットワーク構造の概略図である。
図4】本出願の第3の実施例に係る概略図である。
図5】本出願の第4の実施例に係る概略図である。
図6】本出願の第5の実施例に係る概略図である。
図7】本出願の第6の実施例に係る概略図である。
図8】本出願の第7の実施例に係る概略図である。
図9】本出願の実施例の音声ウェイクアップ方法を実現するための電子機器のブロック図である。
【発明を実施するための形態】
【0020】
以下、図面と組み合わせて本出願の例示的な実施例を説明し、理解を促すように、本出願の実施例の様々な詳細が含まれており、それらを単なる例示的なものと見なすべきである。そのため、当業者であれば、本出願の範囲と精神から逸脱しない限り、ここで説明された実施例に対して様々な変化と修正を行うことができることを理解されたい。同様に、明確かつ簡潔にするために、以下の説明において、公知の機能及び構造に対する説明は省略される。
【0021】
以下、図面を参照しながら本出願の実施例の音声ウェイクアップ方法及び装置を説明する。
【0022】
図1は、本出願の第1の実施例に係る概略図である。
【0023】
図1に示すように、音声ウェイクアップ方法は以下のステップを含む。
【0024】
ステップ101、ユーザのウェイクアップ音声を収集し、ウェイクアップ音声及び現在のスマートデバイスの状態情報に基づいて、現在のスマートデバイスのウェイクアップ情報を生成する。
【0025】
本出願の実施例において、現在のスマートデバイスはネットワーク内の任意のスマートデバイスであってもよく、即ち、ネットワーク内の任意のスマートデバイスも図1に示す方法を実行することができる。本出願の実施例において、現在のスマートデバイスはユーザの音声をリアルタイムに収集しかつ識別することができ、ユーザの音声から予め設定されたウェイクワードが収集された場合、ユーザのウェイクアップ音声が収集されたと決定される。例えば、ウェイクワードは「小度小度」(ショウドゥショウドゥ)、「若基」(ロッキ)、「叮ドォン叮ドォン」(ドォンは口偏に冬と表記)(ディンドンディンドン)などであってもよい。
【0026】
選択的に、ウェイクアップ音声及び現在のスマートデバイスの状態情報に基づいて現在のスマートデバイスのウェイクアップ情報を生成する。一例として、ウェイクアップ音声の強度、現在のスマートデバイスがアクティブ状態にあるか否か、現在のスマートデバイスが人の目に注視されているか否か、現在のスマートデバイスがジェスチャーによって指し示されているか否かなどに基づいて該現在のスマートデバイスのウェイクアップ情報を生成することができる。現在のスマートデバイスがアクティブ状態にあるか否かは、例えば、現在のスマートデバイスがビデオ再生、音楽再生などの状態にあるか否かを指す。なお、ウェイクアップ情報は、ウェイクアップ音声強度と、以下のパラメータのいずれか一つ又は複数とを含むが、これらに限定されない。前記パラメータは、スマートデバイスがアクティブ状態にあるか否か、スマートデバイスが人の目に注視されているか否か、スマートデバイスがジェスチャーによって指し示されているか否かである。なお、スマートデバイスは、人の顔の画像又は人の目の画像を収集することによって、人の目に注視されているか否か及びジェスチャーによって指し示されているか否かを決定するためのカメラを配置することができる。
【0027】
現在のスマートデバイスは、ウェイクアップ情報を他のスマートデバイスに送信したり、他のスマートデバイスから送信されたウェイクアップ情報を受信したりすることができる。選択的に、図2に示すように、図2は、本出願の第2の実施例に係る概略図である。現在のスマートデバイスがユーザのウェイクアップ音声を収集し、ウェイクアップ音声及びスマートデバイスの状態情報に基づいて、現在のスマートデバイスのウェイクアップ情報を生成する前に、各デバイスアドレスとネットワークのマルチキャストアドレスとの間の対応関係を確立することができ、具体的に以下のとおりである。
【0028】
ステップ201、現在のスマートデバイスがネットワークに参加する場合、ネットワークのマルチキャストアドレスに基づいて、ネットワーク内の非現在のスマートデバイスに現在のスマートデバイスのアドレスをマルチキャストする。
【0029】
なお、無線方式によるデバイスのネットワーキングはWIFI(ワイヤレスフィデリティ)、ブルートゥース(登録商標)、及びzigbee(登録商標)(ジグビー技術)等。
【0030】
一例として、WIFIを介してスマートデバイスのネットワーキングを行う場合、ルーターを設定し、かつルーターのアドレスをマルチキャストアドレスに設定することによって、スマートデバイスはデータをルーターに送信することができ、ルーターを介してデータを他のスマートデバイスに転送する。図3に示すように、スマートデバイスA、B、Cの間は、ルーターを介してデータの転送を行い、デバイスの間はハートビートによってデバイスリストの動的な更新を維持することができる。
【0031】
別の例として、ブルートゥース(登録商標)を介してスマートデバイスのネットワーキングを行う場合、各スマートデバイスをルーターとして、スマートデバイス間のデータの転送に用いることができる。例えば、スマートデバイスAとスマートデバイスCとの間でデータを転送する場合は、スマートデバイスAとスマートデバイスCとの間のスマートデバイスBをルーターとすることができ、それによってスマートデバイスAとスマートデバイスCとの間のデータの転送を実現する。
【0032】
他の例として、zigbee(登録商標)を介してスマートデバイスのネットワーキングを行う場合、一部のスマートデバイスがルーティング機能を有する場合を例として挙げると、ルーティング機能を有するスマートデバイスはデータの転送を直接行うことができ、ルーティング機能を有さないスマートデバイスは、ルーティング機能を有するスマートデバイスにデータを報告することができ、それによってスマートデバイス間のデータの転送を実現する。
【0033】
本出願の実施例において、現在のスマートデバイスがネットワークに参加する場合、ネットワーク内のルーターは、該現在のスマートデバイスのアドレスを記録し、及びマルチキャストアドレスと該現在のスマートデバイスのアドレスとの間の対応関係を記録し、マルチキャストアドレスと対応関係を有する他のスマートデバイスに該現在のスマートデバイスのアドレスを送信することができる。なお、ネットワーク内の各スマートデバイスは同じマルチキャストアドレス、及び一意のデバイスアドレスを有することができる。
【0034】
ステップ202、ネットワーク内の非現在のスマートデバイスから返された非現在のスマートデバイスのアドレスを受信する。
【0035】
ステップ203、ネットワーク内の1つのスマートデバイスがマルチキャストする場合、ネットワーク内の他のスマートデバイスがマルチキャストデータを受信可能にするように、マルチキャストアドレスと各スマートデバイスのアドレスとの間の対応関係を確立する。
【0036】
本出願の実施例において、各スマートデバイスがネットワークに参加する場合、ルーターが各スマートデバイスのアドレスを記録し、及びマルチキャストアドレスと各スマートデバイスのアドレスとの間の対応関係を記録することにより、マルチキャストアドレスと各スマートデバイスのアドレスとの間の対応関係を確立することができ、これにより各スマートデバイスは、ネットワーク内の1つのスマートデバイスがマルチキャストする場合、ネットワーク内の他のスマートデバイスがマルチキャストされたデータを受信可能にするように、ネットワーク内のすべてのスマートデバイスのアドレスを含む1つのリストを有することができる。
【0037】
なお、マルチキャストアドレスと各スマートデバイスのアドレスとの間の対応関係が確立された後、スマートデバイスが、送信先アドレスがマルチキャストアドレスであるデータを受信した場合、該スマートデバイスは該データが自分に送信されるデータであると決定することができる。
【0038】
ステップ102、現在のスマートデバイスのウェイクアップ情報をネットワーク内の非現在のスマートデバイスに送信し、及びネットワーク内の非現在のスマートデバイスから送信されたウェイクアップ情報を受信する。
【0039】
本出願の実施例において、現在のスマートデバイスの識別子が運ばれるウェイクアップ情報をネットワーク内のルーターを介してネットワーク内の他のスマート音声機器に送信し、及びネットワーク内の他のスマートデバイスから送信されたウェイクアップ情報を受信することができる。
【0040】
ステップ103、ネットワーク内の各スマートデバイスのウェイクアップ情報を組み合わせて、現在のスマートデバイスが対象の音声対話装置であるか否かを決定する。
【0041】
一例として、スマートデバイスのウェイクアップ情報の生成時点及び受信時点に基づいて第1のスマートデバイスを決定し、現在のスマートデバイスのウェイクアップ情報、及び第1のスマートデバイスのウェイクアップ情報に基づいて、現在のスマートデバイスが対象の音声対話装置であるか否かを決定する。他の例として、予め設定された計算ポリシーに従ってネットワーク内の各スマートデバイスのウェイクアップ情報内の各パラメータを計算し、かつ各スマートデバイスの各パラメータの計算結果を比較して、現在のスマートデバイスが対象の音声対話装置であるか否かを決定する。更なる例として、現在のスマートデバイスのウェイクアップ情報の各パラメータ及び第1のスマートデバイスのウェイクアップ情報内の各パラメータを計算し、かつ現在のスマートデバイスのウェイクアップ情報の各パラメータの計算結果を第1のスマートデバイスの各パラメータの計算結果と比較することによって、現在のスマートデバイスが対象の音声対話装置であるか否かを決定する。具体的には、後続の実施例の説明を参照されたい。
【0042】
ステップ104、現在のスマートデバイスが対象の音声対話装置である場合、現在のスマートデバイスを制御してユーザと音声対話を行う。
【0043】
本出願の実施例において、現在のスマートデバイスが対象の音声対話装置である場合、現在のスマートデバイスはユーザのウェイクワードに応答して、ユーザと音声対話を行う。
【0044】
本出願の実施例の音声ウェイクアップ方法は、ユーザのウェイクアップ音声を収集することによって、ウェイクアップ音声及び現在のスマートデバイスの状態情報に基づいて、現在のスマートデバイスのウェイクアップ情報を生成し、現在のスマートデバイスのウェイクアップ情報をネットワーク内の非現在のスマートデバイスに送信し、及びネットワーク内の非現在のスマートデバイスから送信されたウェイクアップ情報を受信し、ネットワーク内の各スマートデバイスのウェイクアップ情報を組み合わせて、現在のスマートデバイスが対象の音声対話装置であるか否かを決定し、現在のスマートデバイスが対象の音声対話装置である場合、前記現在のスマートデバイスを制御してユーザと音声対話を行う。該方法は、スマートデバイスを介して各スマート音声機器のウェイクアップ情報を組み合わせて、最適なスマート音声機器を決定し、最適なスマート音声機器を介してユーザのウェイクワードに応答し、複数のスマートデバイスの同時応答によるユーザへの干渉を回避し、ユーザがどのデバイスがユーザとの音声対話を行うデバイスであるかを明確に知ることができ、音声対話の効率が高くなる。
【0045】
図4は本出願の第3の実施例に係る概略図である。図4に示すように、スマートデバイスのウェイクアップ情報の生成時点及び受信時点に基づいて第1のスマートデバイスを決定し、現在のスマートデバイスのウェイクアップ情報、及び第1のスマートデバイスのウェイクアップ情報に基づいて、現在のスマートデバイスが対象の音声対話装置であるか否かを決定し、具体的な実現プロセスは以下のとおりである。
【0046】
ステップ401、現在のスマートデバイスのウェイクアップ情報の生成時点を取得する。
【0047】
なお、現在のスマートデバイスはウェイクアップ音声及び現在のスマートデバイスの状態情報に基づいて該スマートデバイスのウェイクアップ情報を生成する時、ウェイクアップ情報の生成時点を記憶することができ、これにより現在のスマートデバイスのウェイクアップ情報の生成時点を取得することができる。
【0048】
ステップ402、非現在のスマートデバイスのウェイクアップ情報を受信する受信時点を取得する。
【0049】
本出願の実施例において、現在のスマートデバイスはネットワーク内の非現在のスマートデバイスから送信されたウェイクアップ情報を受信する時、受信時間を記録することができ、これにより非現在のスマートデバイスのウェイクアップ情報を受信する受信時点を取得することができる。
【0050】
ステップ403、生成時点及び受信時点に基づいて、第1のスマートデバイスを決定する。前記第1のスマートデバイスは、対応する受信時点と生成時点との差の絶対値が予め設定された差のしきい値よりも小さいスマートデバイスである。
【0051】
例えば、生成時点がt、予め設定された差のしきい値がmである場合を例として挙げると、現在のスマートデバイスが(t-m、t+m)という時間範囲内に非現在のスマートデバイスのウェイクアップ情報を受信した場合、該非現在のスマートデバイスを第1のスマートデバイスとする。
【0052】
ステップ404、現在のスマートデバイスのウェイクアップ情報、及び第1のスマートデバイスのウェイクアップ情報に基づいて、現在のスマートデバイスが対象の音声対話装置であるか否かを決定する。
【0053】
本出願の実施例において、現在のスマートデバイスのウェイクアップ情報及び第1のスマートデバイスのウェイクアップ情報に基づいて、各ウェイクアップ情報を比較し、比較ポリシーに基づいて最適な音声対話装置を決定することができ、該最適な音声対話装置を対象の音声対話装置とする。一例として、現在のスマートデバイス及び第1のスマートデバイスのウェイクアップ情報内の音声信号の強度を比較することができ、例えば、スマートデバイスが人に近ければ近いほど音声信号が強く、該デバイスを対象の音声対話装置として優先的に応答することができる。別の例として、現在のスマートデバイス及び第1のスマートデバイスのウェイクアップ情報内のデバイスがアクティブ状態にあるか否かを判断することができ、デバイスがアクティブ状態、例えば、ビデオ再生、音楽再生など状態にある場合、該デバイスを対象の音声対話装置として優先的に応答することができる。他の例として、現在のスマートデバイス及び第1のスマートデバイスのウェイクアップ情報内のデバイスが人の目に注視されている又はジェスチャーによって指し示されているか否かを判断することができ、デバイスが人の目に注視されている又はジェスチャーによって指し示されている場合、ウェイクアップ情報内のウェイクアップ音声と組み合わせて、注視されている又はジェスチャーによって指し示されているデバイスを対象の音声対話装置として優先的に応答することができる。更なる例として、ウェイクアップ情報内の各パラメータの優先度を設定し、例えば、人の目に注視されている又はジェスチャーによって指し示されているスマートデバイスの優先度が最も高く、アクティブ状態のスマートデバイスの優先度がその次である場合、人の目に注視されているスマートデバイスを優先的に取得して、人の目に注視されている又はジェスチャーによって指し示されているスマートデバイスからアクティブ状態のスマートデバイスを選択して、アクティブ状態にあるスマートデバイスからウェイクアップ音声強度の最も高いものを選択して、対象の音声対話装置として優先的に応答する。
【0054】
なお、比較ポリシーに基づいて決定を下す場合、スマート音声機器は自身のウェイクアップ情報の取得時点を取得することができ、該時点を中心とする時間範囲内に受信したウェイクアップ情報を取得し、該時間範囲内に受信したウェイクアップ情報及び自身のウェイクアップ情報に基づいて決定を下し、該時間範囲内に他のスマート音声機器のウェイクアップ情報を受信しなかった場合、自身を最適なスマート音声機器とする。
【0055】
以上より、各スマートデバイスのウェイクアップ情報を比較し、比較ポリシーに基づいて最適な音声対話装置を決定し、最適な音声対話装置を介してユーザのウェイクワードに応答し、これによりユーザと音声対話を行うことにより、複数のスマートデバイスの同時応答がユーザに干渉を与えることを回避し、ユーザは自身と音声対話を行ったデバイスを明確に知ることができ、音声対話の効率が高くなる。
【0056】
図5は本出願の第4の実施例に係る概略図である。図5に示すように、ネットワーク内の各スマートデバイスのウェイクアップ情報内の各パラメータを計算して、各スマートデバイスの各パラメータの計算結果を比較することにより、現在のスマートデバイスが対象の音声対話装置であるか否かを決定する。具体的な実現プロセスは以下のとおりである。
【0057】
ステップ501、予め設定された計算ポリシーに従って現在のスマートデバイスのウェイクアップ情報内の各パラメータを計算して、計算結果を取得する。
【0058】
ステップ502、予め設定された計算ポリシーに従って各非現在のスマートデバイスのウェイクアップ情報内の各パラメータを計算して、計算結果を取得する。
【0059】
ステップ503、第2のスマートデバイスが存在しない場合、現在のスマートデバイスを対象の音声対話装置として決定する。第2のスマートデバイスは、対応する計算結果が現在のスマートデバイスの計算結果より大きいスマートデバイスである。
【0060】
本出願の実施例において、予め設定された計算ポリシーに基づいて現在のスマートデバイス及び非現在のスマートデバイスのウェイクアップ情報内の各パラメータを計算して、現在のスマートデバイス及び非現在のスマートデバイスのウェイクアップ情報の計算結果を取得し、現在のスマートデバイスのウェイクアップ情報の計算結果を非現在のスマートデバイスのウェイクアップ情報の計算結果と比較して、非現在のスマートデバイスの計算結果が現在のスマートデバイスの計算結果より大きい場合、該非現在のスマートデバイスを第2のスマートデバイスとする。第2のスマートデバイスが存在しない場合、現在のスマートデバイスを最適な音声対話装置とすることができる。最適な音声対話装置を介してユーザのウェイクワードに応答し、これによりユーザと音声対話を行う。第2のスマートデバイスが存在する場合、図4に記載の実施例のステップ404によって現在のスマートデバイス及び第2のスマートデバイスのウェイクアップ情報を比較することができ、比較ポリシーに基づいて最適な音声対話装置を決定し、又は第2のスマートデバイスを直接に最適な音声対話装置とすることができる。なお、予め設定された計算ポリシーは重み付け演算ポリシーを含んでもよいが、これに限定されない。
【0061】
以上より、予め設定された計算ポリシーによってネットワーク内の各スマートデバイスのウェイクアップ情報内の各パラメータを計算し、かつ各スマートデバイスの各パラメータの計算結果を比較して、最適なスマート音声機器を決定し、最適なスマート音声機器を介してユーザのウェイクワードに応答し、複数のスマートデバイスの同時応答によるユーザへの干渉を回避し、ユーザがどのデバイスがユーザとの音声対話を行うデバイスであるかを明確に知ることができ、音声対話の効率が高くなる。
【0062】
図6は本出願の第5の実施例に係る概略図である。図6に示すように、スマートデバイスのウェイクアップ情報の生成時点及び受信時点に基づいて第1のスマートデバイスを決定し、予め設定された計算ポリシーに従って現在のスマートデバイスのウェイクアップ情報の各パラメータと第1のスマートデバイスのウェイクアップ情報内の各パラメータとを計算し、現在のスマートデバイスのウェイクアップ情報の各パラメータの計算結果を第1のスマートデバイスの各パラメータの計算結果を比較して、現在のスマートデバイスが対象の音声対話装置であるか否かを決定する。具体的な実現プロセスは以下のとおりである。
【0063】
ステップ601、現在のスマートデバイスのウェイクアップ情報の生成時点を取得する。
【0064】
ステップ602、非現在のスマートデバイスのウェイクアップ情報を受信する受信時点を取得する。
【0065】
ステップ603、生成時点及び受信時点に基づいて、第1のスマートデバイスを決定する。前記第1のスマートデバイスは、対応する受信時点と生成時点との差の絶対値が予め設定された差のしきい値より小さいスマートデバイスである。
【0066】
ステップ604、現在のスマートデバイスのウェイクアップ情報内の各パラメータを計算して、計算結果を取得する。
【0067】
ステップ605、予め設定された計算ポリシーに従って第1のスマートデバイスのウェイクアップ情報内の各パラメータを計算して、計算結果を取得する。
【0068】
ステップ606、現在のスマートデバイスの計算結果がすべての第1のスマートデバイスの計算結果より大きい場合、現在のスマートデバイスを対象の音声対話装置として決定する。
【0069】
本出願の実施例において、スマートデバイスのウェイクアップ情報の生成時点及び受信時点に基づいて第1のスマートデバイスを決定し、予め設定された計算ポリシーに従って現在のスマートデバイスのウェイクアップ情報の各パラメータと第1のスマートデバイスのウェイクアップ情報内の各パラメータとを計算し、かつ現在のスマートデバイスのウェイクアップ情報の各パラメータの計算結果を第1のスマートデバイスの各パラメータの計算結果と比較して、現在のスマートデバイスの計算結果がすべての第1のスマートデバイスの計算結果より大きい場合、現在のスマートデバイスを対象の音声対話装置として決定する。第1のスマートデバイスの計算結果が現在のスマートデバイスの計算結果より大きい状況が存在する場合、該第1のスマートデバイスを対象の音声対話装置として決定する。現在のスマートデバイスの計算結果が第1のスマートデバイスの計算結果と同じである場合、図4に記載の実施例のステップ404によって現在のスマートデバイス及び第1のスマートデバイスのウェイクアップ情報に基づいて比較することができ、比較ポリシーに基づいて最適な音声対話装置を決定する。
【0070】
以上より、現在のスマートデバイス及び第1のスマートデバイスの計算結果を比較することによって、最適なスマート音声機器を決定し、最適なスマート音声機器を介してユーザのウェイクワードに応答し、複数のスマートデバイスの同時応答によるユーザへの干渉を回避し、ユーザがどのデバイスがユーザとの音声対話を行うデバイスであるかを明確に知ることができ、音声対話の効率が高くなる。
【0071】
本出願の実施例の音声ウェイクアップ方法は、ユーザのウェイクアップ音声を収集することによって、前記ウェイクアップ音声及び前記現在のスマートデバイスの状態情報に基づいて、現在のスマートデバイスのウェイクアップ情報を生成し、前記現在のスマートデバイスのウェイクアップ情報を前記ネットワーク内の非現在のスマートデバイスに送信し、及びネットワーク内の非現在のスマートデバイスから送信されたウェイクアップ情報を受信し、ネットワーク内の各スマートデバイスのウェイクアップ情報を組み合わせて、現在のスマートデバイスが対象の音声対話装置であるか否かを決定し、現在のスマートデバイスが対象の音声対話装置である場合、現在のスマートデバイスを制御してユーザと音声対話を行う。該方法は、スマートデバイスを介して各スマート音声機器のウェイクアップ情報を組み合わせて、最適なスマート音声機器を決定し、最適なスマート音声機器を介してユーザのウェイクワードに応答し、複数のスマートデバイスの同時応答によるユーザへの干渉を回避し、ユーザがどのデバイスがユーザとの音声対話を行うデバイスであるかを明確に知ることができ、音声対話の効率が高くなる。
【0072】
上記の幾つかの実施例によって提供される音声ウェイクアップ方法に対応して、本出願の一実施例はさらに音声ウェイクアップ装置を提供し、本出願の実施例によって提供される音声ウェイクアップ装置は上記の幾つかの実施例によって提供される音声ウェイクアップ方法に対応するため、音声ウェイクアップ方法における実施形態は本実施例によって提供される音声ウェイクアップ装置にも適用され、本実施例において詳しい説明は省略する。図7は本出願の第6の実施例に係る概略図である。図7に示すように、音声ウェイクアップ装置700は、収集モジュール710、送受信モジュール720、決定モジュール730、及び制御モジュール740を備える。
【0073】
収集モジュール710は、ユーザのウェイクアップ音声を収集し、ウェイクアップ音声及び現在のスマートデバイスの状態情報に基づいて、現在のスマートデバイスのウェイクアップ情報を生成することに用いられる。送受信モジュール720は、現在のスマートデバイスのウェイクアップ情報をネットワーク内の非現在のスマートデバイスに送信し、及びネットワーク内の非現在のスマートデバイスから送信されたウェイクアップ情報を受信することに用いられる。決定モジュール730は、ネットワーク内の各スマートデバイスのウェイクアップ情報を組み合わせて、現在のスマートデバイスが対象の音声対話装置であるか否かを決定することに用いられる。制御モジュール740は、現在のスマートデバイスが対象の音声対話装置である場合、現在のスマートデバイスを制御してユーザと音声対話を行うことに用いられる。
【0074】
本出願の実施例の可能な実現形態として、前記決定モジュール730は具体的に、現在のスマートデバイスのウェイクアップ情報の生成時点を取得し、非現在のスマートデバイスのウェイクアップ情報を受信する受信時点を取得し、生成時点及び受信時点に基づいて、第1のスマートデバイスを決定し、前記第1のスマートデバイスは、対応する受信時点と生成時点との差の絶対値が予め設定された差のしきい値より小さいスマートデバイスであり、現在のスマートデバイスのウェイクアップ情報、及び第1のスマートデバイスのウェイクアップ情報に基づいて、現在のスマートデバイスが対象の音声対話装置であるか否かを決定することに用いられる。
【0075】
本出願の実施例の可能な実現形態として、図8に示すように、図7に示す内容をもとに、音声ウェイクアップ装置はさらに確立モジュール750を備える。
【0076】
送受信モジュール720はさらに、現在のスマートデバイスがネットワークに参加する場合、ネットワークのマルチキャストアドレスに基づいて、ネットワーク内の非現在のスマートデバイスに現在のスマートデバイスのアドレスをマルチキャストし、ネットワーク内の非現在のスマートデバイスから返された非現在のスマートデバイスのアドレスを受信することに用いられる。確立モジュール750は、ネットワーク内の1つのスマートデバイスがマルチキャストする場合、ネットワーク内の他のスマートデバイスがマルチキャストデータを受信可能にするように、マルチキャストアドレスと各スマートデバイスのアドレスとの間の対応関係を確立することに用いられる。
【0077】
本出願の実施例の可能な実現形態として、決定モジュール730は具体的に、予め設定された計算ポリシーに従って前記現在のスマートデバイスのウェイクアップ情報内の各パラメータを計算して、計算結果を取得し、予め設定された計算ポリシーに従って各非現在のスマートデバイスのウェイクアップ情報内の各パラメータを計算して、計算結果を取得し、第2のスマートデバイスが存在しない場合、前記現在のスマートデバイスを対象の音声対話装置として決定することに用いられ、前記第2のスマートデバイスは、対応する計算結果が前記現在のスマートデバイスの計算結果より大きいスマートデバイスである。
【0078】
本出願の実施例の可能な実現形態として、ウェイクアップ情報は、ウェイクアップ音声強度と、以下のパラメータのいずれか一つ又は複数とを含み、前記パラメータは、スマートデバイスがアクティブ状態にあるか否か、スマートデバイスが人の目に注視されているか否か、スマートデバイスがジェスチャーによって指し示されているか否かである。
【0079】
本出願の実施例の音声ウェイクアップ装置は、ユーザのウェイクアップ音声を収集することによって、前記ウェイクアップ音声及び前記現在のスマートデバイスの状態情報に基づいて、前記現在のスマートデバイスのウェイクアップ情報を生成し、前記現在のスマートデバイスのウェイクアップ情報を前記ネットワーク内の非現在のスマートデバイスに送信し、及び前記ネットワーク内の非現在のスマートデバイスから送信されたウェイクアップ情報を受信し、前記ネットワーク内の各スマートデバイスのウェイクアップ情報を組み合わせて、前記現在のスマートデバイスが対象の音声対話装置であるか否かを決定し、前記現在のスマートデバイスが対象の音声対話装置である場合、前記現在のスマートデバイスを制御して前記ユーザと音声対話を行う。該装置はスマートデバイスを介して各スマート音声機器のウェイクアップ情報を組み合わせて、最適なスマート音声機器を決定し、最適なスマート音声機器を介してユーザのウェイクワードに応答し、複数のスマートデバイスの同時応答によるユーザへの干渉を回避し、ユーザがどのデバイスがユーザとの音声対話を行うデバイスであるかを明確に知ることができ、音声対話の効率が高くなる。
【0080】
本出願の実施例に基づいて、本出願は、電子機器及び読み取り可能な記憶媒体をさらに提供する。本出願の実施例によれば、コンピュータプログラムが提供される。当該コンピュータプログラムにおける命令が実行された場合に、上記音声ウェイクアップ方法が実行される。
【0081】
図9に示すように、本出願の実施例に係る音声ウェイクアップ方法の電子機器のブロック図である。電子機器は様々な形態のデジタルコンピュータ、例えば、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、携帯情報端末、サーバ、ブレードサーバ、大型コンピュータ及び他の適切なコンピュータを表すこと意図している。電子機器はさらに、様々な形態のモバイル装置、例えば、携帯情報端末、セルラー電話、スマートフォン、ウェアラブルデバイス及び他の同様なコンピューティングデバイスを表すことができる。本明細書に示されている部品、それらの接続と関係、及びそれらの機能は例示的なものに過ぎず、本明細書で説明された及び/又は求められた本出願の実現を限定することを意図していない。
【0082】
図9に示すように、電子機器は、1つ又は複数のプロセッサ901、メモリ902及び各部品を接続するためのインターフェースを備え、インターフェースは高速インターフェースと低速インターフェースを備える。各部品は、異なるバスを用いて互いに接続されており、かつ共用のマザーボードに実装される又は必要に応じて他の形態で実装することができる。プロセッサは、電子機器内で実行される命令を処理することができ、前記命令は、外部入力/出力装置(例えば、インターフェースに接続される表示装置)にGUIの図形情報を表示するようにメモリ内又はメモリ上に記憶される命令を含む。他の実施形態において、必要があれば、複数のプロセッサ及び/又は複数のバスを複数のメモリと組み合わせて使用してもよい。同様に、複数の電子機器を接続してもよく、各機器は、必要とされる操作の一部(例えば、サーバアレイ、1組のブレードサーバ、又はマルチプロセッサシステムとして)を提供する。図9では、1つのプロセッサ901は例として挙げられた。
【0083】
メモリ902は即ち本出願によって提供される非一時的なコンピュータ読み取り可能な記憶媒体である。前記メモリには、前記少なくとも1つのプロセッサによって、本出願が提供する音声ウェイクアップ方法が実行される少なくとも1つの実行可能な命令が記憶されている。本出願の非一時的なコンピュータ読み取り可能な記憶媒体は、コンピュータに本出願が提供する音声ウェイクアップ方法を実行させるためのコンピュータ命令が記憶されている。
【0084】
メモリ902は非一時的なコンピュータ読み取り可能な記憶媒体として、本出願の実施例における音声ウェイクアップ方法に対応するプログラム命令/モジュール(例えば、図面7に示す収集モジュール710、送受信モジュール720、決定モジュール730、制御モジュール740、及び図面8に示す確立モジュール750)のような非一時的なソフトウェアプログラム、非一時的なコンピュータ実行可能なプログラム及びモジュールを記憶することに用いることができる。プロセッサ901は、メモリ902に記憶される非一時的なソフトウェアプログラム、命令及びモジュールを実行することによって、サーバの様々な機能適用及びデータ処理を実行し、即ち上記の方法の実施例における音声ウェイクアップ方法を実現する。
【0085】
メモリ902は、プログラムを記憶する領域と、データを記憶する領域とを含んでもよい。プログラムを記憶する領域は、オペレーティングシステムと、少なくとも1つの機能に必要なアプリケーションプログラムを含んでもよい。データを記憶する領域は、音声ウェイクアップの電子機器の使用によって生成されたデータなどを含んでもよい。また、メモリ902は、高速ランダムアクセスメモリだけではなく、少なくとも1つのディスクストレージデバイス、フラッシュメモリデバイス又は他の非一時的なソリッドステートストレージデバイスのような非一時的なメモリを備えてもよい。一部の実施例において、メモリ902は、プロセッサ901に対してリモートで配置されるメモリを選択的に備えてもよく、これらのメモリはネットワークを介して音声ウェイクアップの電子機器に接続することができる。上記のネットワークの実例は、インターネット、企業内部のネットワーク、ローカルエリアネットワーク、移動通信ネットワーク及びそれらの組み合わせを含むが、これらに限定されない。
【0086】
音声ウェイクアップ方法の電子機器は、入力装置903及び出力装置904を備えてもよい。プロセッサ901、メモリ902、入力装置903及び出力装置904はバス又は他の方法で接続することができ、図9では、バスによる接続は例として挙げられる。
【0087】
入力装置903は、入力されたデジタル又は文字情報を受信し、及び音声ウェイクアップの電子機器のユーザ設定及び機能制御に関連するキー信号入力を生成することができ、例えば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、ポインティングスティック、1つ又は複数のマウスボタン、トラックボール、ジョイスティック等の入力装置がある。出力装置904は、表示装置、補助照明装置(例えば、LED)及び触覚フィードバック装置(例えば、振動モータ)などを含んでも良い。表示装置は、液晶ディスプレイ(LCD)、発光ダイオード(LED)ディスプレイ及びプラズマディスプレイを含むが、これらに限定されない。一部の実施形態では、表示装置はタッチスクリーンであってもよい。
【0088】
ここで説明されたシステムと技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、専用ASIC(専用集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア及び/又はそれらの組み合わせにおいて実現することができる。これらの様々な実施形態は以下を含んでもよい。1つ又は複数のコンピュータプログラムにおいて実施され、該1つ又は複数のコンピュータプログラムは、少なくとも1つのプログラマブルプロセッサを含むプログラマブルシステムにおいて実行及び/又は解釈することができ、該プログラマブルプロセッサは、専用又は汎用のプログラマブルプロセッサであり、ストレージシステム、少なくとも1つの入力装置及び少なくとも1つの出力装置からデータと命令を受信し、データ及び命令を該ストレージシステム、該少なくとも1つの入力装置及び該少なくとも1つの出力装置に転送することができる。
【0089】
これらの計算プログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、又はコードとも言う)は、プログラマブルプロセッサの機械命令を含み、かつ高度プロセス及び/又はオブジェクト指向プログラミング言語、及び/又はアセンブリ言語/機械語を用いてこれらの計算プログラム実行することができる。本明細書で使用される「機械読み取り可能な媒体」と「コンピュータ読み取り可能な媒体」という用語は、機械命令及び/又はデータをプログラマブルプロセッサに提供するための任意のコンピュータプログラム製品、装置、及び/又はデバイス(例えば、磁気ディスク、光ディスク、メモリ、プログラマブルロジックデバイス(PLD))を指し、機械読み取り可能な信号としての機械命令を受信する機械読み取り可能な媒体を含む。「機械読み取り可能な信号」という用語は、機械命令及び/又はデータをプログラマブルプロセッサに提供するための如何なる信号を指す。
【0090】
ユーザとのインタラクションを提供するために、コンピュータにおいて、ここで説明されたシステムと技術を実施することができる。該コンピュータは、ユーザに情報を表示するための表示装置(例えば、CRT(ブラウン管)又はLCD(液晶ディスプレイ)モニタ)と、キーボードとポインティングデバイス(例えば、マウス又はトラックボール)と、を含み、ユーザは該キーボードと該ポインティングデバイスを介して入力をコンピュータに提供することができる。他の種類のデバイスはさらにユーザとのインタラクションを提供することができ、例えば、ユーザに提供されたフィードバックは、任意の形式のセンサフィードバック(例えば、視覚フィードバック、聴覚フィードバック、または触覚フィードバック)であってもよい以上、ユーザからの入力を任意の形式(音の入力、音声入力又は触覚入力を含む)で受信することもできる。
【0091】
ここで説明されたシステムと技術を、バックグラウンドパーツを含む計算システム(例えば、データサーバとして)、又はミドルウェアパーツを含む計算システム(例えば、アプリケーションサーバ)、又はフロントエンドパーツを含む計算システム(例えば、グラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータ、ユーザは該グラフィカルユーザインタフェース又は該ウェブブラウザ介して、ここで説明されたシステムと技術の実施形態と対話することができる)、又はこれらのバックグラウンドパーツ、ミドルウェアパーツ又はフロントエンドパーツの任意の組み合わせを含む計算システムにおいて実行することができる。任意の形式又は媒体のデジタルデータ通信(例えば、通信ネットワーク)を介して、システムのパーツを互いに接続することができる。通信ネットワークの例としては、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)及びインターネットが含まれる。
【0092】
コンピュータシステムは、クライアントとサーバを備えてもよい。クライアントとサーバは通常離れており、一般的に通信ネットワークを介してインタラクションを行う。対応するコンピュータにおいて実行されかつ互いにクライアント-サーバ関係を有するコンピュータプログラムによってクライアントとサーバとの関係は生成される。
【0093】
なお、以上に示した様々な形式のプロセスを用いて、ステップを並べ替えたり、追加したり、削除したりすることができることを理解されたい。例えば、本出願書に記載の各ステップは、並列的に実行するか、順次的に実行するか、又は異なる順序で実行してもよい。本出願で開示された技術的解決手段が予期している結果を実現できる限り、本明細書では限定されない。
【0094】
上記の具体的な実施形態は、本出願の保護範囲を制限するものではない。当業者であれば、設計要件とその他の要因に応じて、様々な修正、組み合わせ、一部の組み合わせ及び置き換えを行うことができることを理解されたい。本出願の精神と原則を逸脱しない限り、行われるすべての修正、置き換え及び改善等は、いずれも本出願の保護範囲に含まれるべきである。
図1
図2
図3
図4
図5
図6
図7
図8
図9