(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6866046
(24)【登録日】2021年4月9日
(45)【発行日】2021年4月28日
(54)【発明の名称】クラウドウェイクアップ方法、システム、端末、コンピュータ可読記憶媒体、及びプログラム
(51)【国際特許分類】
G10L 15/10 20060101AFI20210419BHJP
G10L 15/00 20130101ALI20210419BHJP
G10L 15/30 20130101ALI20210419BHJP
G10L 15/06 20130101ALI20210419BHJP
【FI】
G10L15/10 200W
G10L15/00 200A
G10L15/30
G10L15/06 200Z
【請求項の数】22
【全頁数】16
(21)【出願番号】特願2018-232121(P2018-232121)
(22)【出願日】2018年12月12日
(65)【公開番号】特開2019-191552(P2019-191552A)
(43)【公開日】2019年10月31日
【審査請求日】2018年12月12日
(31)【優先権主張番号】201810367637.2
(32)【優先日】2018年4月23日
(33)【優先権主張国】CN
【前置審査】
(73)【特許権者】
【識別番号】513224353
【氏名又は名称】バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【弁理士】
【氏名又は名称】内藤 和彦
(72)【発明者】
【氏名】ワン,ジジャン
(72)【発明者】
【氏名】チェン,シェン
【審査官】
大野 弘
(56)【参考文献】
【文献】
再公表特許第2014/171144(JP,A1)
【文献】
特表2016−532146(JP,A)
【文献】
特開2004−032087(JP,A)
(57)【特許請求の範囲】
【請求項1】
クラウドウェイクアップ方法であって、
ユーザーの入力したウェイクアップ音声を受信して、前記ウェイクアップ音声をクラウドに伝送することと、
クラウドにおいて、前記ウェイクアップ音声を復号して、ウェイクアップテキストを生成することと、
ユーザーの予め設定したウェイクアップ文字を前記クラウドに伝送し、前記クラウドが前記ウェイクアップ文字を圧縮しないことと、
前記ウェイクアップテキストにおける前記ウェイクアップ文字を認識することと、
認識結果に基づいて、ウェイクアップ指示を与えることと、を含み、
前記ユーザーの予め設定したウェイクアップ文字を前記クラウドに伝送することは、
前記ウェイクアップ音声を前記クラウドに伝送すると同時に、予め設定された前記ウェイクアップ文字を前記クラウドに伝送することを含むことを特徴とするクラウドウェイクアップ方法。
【請求項2】
クラウドにおいて、前記ウェイクアップ音声を復号して、ウェイクアップテキストを生成することは、
前記クラウドにおいて、音響モデル、言語モデル及び発音辞書によって、前記ウェイクアップ音声を復号することにより、ウェイクアップテキストを生成することを含むことを特徴とする請求項1に記載の方法。
【請求項3】
前記ウェイクアップテキストにおけるウェイクアップ文字を認識することは、
前記ウェイクアップテキストから前記ウェイクアップ文字にマッチングするマッチング文字を認識することと、
前記マッチング文字に基づいて、調整及び組み合わせを行って、ウェイクアップワードを生成することと、を含むことを特徴とする請求項2に記載の方法。
【請求項4】
前記調整及び組み合わせを行うことは、
位置関係及び論理関係についての調整及び組み合わせを行うことを含むことを特徴とする請求項3に記載の方法。
【請求項5】
認識結果に基づいて、ウェイクアップ指示を与えることは、
前記ウェイクアップワードに基づいて、ウェイクアップ指示を与えることを含むことを特徴とする請求項3に記載の方法。
【請求項6】
クラウドウェイクアップシステムであって、
ユーザーの入力したウェイクアップ音声を受信して、前記ウェイクアップ音声をクラウドに伝送するように配置される音声受信ユニットと、
クラウドにおいて、前記ウェイクアップ音声を復号して、ウェイクアップテキストを生成するように配置される音声復号ユニットと、
ウェイクアップ文字がユーザーに予め設定されるように配置されるウェイクアップ文字設定ユニットと、
前記ウェイクアップ文字を前記クラウドに伝送し、前記クラウドが前記ウェイクアップ文字を圧縮しないように配置されるウェイクアップ文字伝送ユニットと、
前記ウェイクアップテキストにおける前記ウェイクアップ文字を認識するように配置される音声認識ユニットと、
認識結果に基づいて、ウェイクアップ指示を与えるように配置されるウェイクアップ指示ユニットと、を備え、
前記ウェイクアップ文字伝送ユニットは、前記ウェイクアップ音声をクラウドに伝送すると同時に、予め設定された前記ウェイクアップ文字を前記クラウドに伝送するようにさらに配置されることを特徴とするクラウドウェイクアップシステム。
【請求項7】
前記音声復号ユニットは、前記クラウドにおいて、音響モデル、言語モデル及び発音辞書によって、前記ウェイクアップ音声を復号することにより、ウェイクアップテキストを生成するように配置されることを特徴とする請求項6に記載のシステム。
【請求項8】
前記音声認識ユニットは、
前記ウェイクアップテキストから前記ウェイクアップ文字にマッチングするマッチング文字を認識するように配置される文字マッチングユニットと、
前記マッチング文字に基づいて、調整及び組み合わせを行って、ウェイクアップワードを生成するように配置されるウェイクアップ形成ユニットと、を備えることを特徴とする請求項7に記載のシステム。
【請求項9】
前記調整及び組み合わせを行うことは、
位置関係及び論理関係についての調整及び組み合わせを行うことを含むことを特徴とする請求項8に記載のシステム。
【請求項10】
前記ウェイクアップ指示ユニットは前記ウェイクアップワードに基づいて、ウェイクアップ指示を与えるように更に配置されることを特徴とする請求項8に記載のシステム。
【請求項11】
クラウドウェイクアップ端末であって、
1つ又は複数のプロセッサと、
1つ又は複数のプログラムを記憶するためのメモリと、を備え、
前記1つ又は複数のプログラムが前記1つ又は複数のプロセッサにより実行される場合、前記1つ又は複数のプロセッサに請求項1〜5のいずれか一項に記載の方法を実現させることを特徴とするクラウドウェイクアップ端末。
【請求項12】
コンピュータプログラムが記憶されるコンピュータ可読記憶媒体であって、
該プログラムがプロセッサにより実行される場合、請求項1〜5のいずれか一項に記載の方法を実現することを特徴とするコンピュータ可読記憶媒体。
【請求項13】
コンピュータにおいて、プロセッサにより実行される場合、請求項1〜5のいずれか一項に記載の方法を実現することを特徴とするプログラム。
【請求項14】
クラウドウェイクアップ方法であって、
ユーザーの入力したウェイクアップ音声を受信することと、
クラウドにおいて、前記ウェイクアップ音声を復号して、ウェイクアップテキストを生成することと、
ユーザーの予め設定したウェイクアップ文字を受信し、前記クラウドが前記ウェイクアップ文字を圧縮しないことと、
前記ウェイクアップテキストにおける前記ウェイクアップ文字を認識することと、
認識結果に基づいて、ウェイクアップ指示を与えることと、を含み、
ユーザーの予め設定したウェイクアップ文字を受信することは、
ユーザーの入力したウェイクアップ音声を受信すると同時に、ユーザーの予め設定した前記ウェイクアップ文字を受信することを含むことを特徴とするクラウドウェイクアップ方法。
【請求項15】
前記ウェイクアップテキストにおけるウェイクアップ文字を認識することは、
前記ウェイクアップテキストから前記ウェイクアップ文字にマッチングするマッチング文字を認識することと、
前記マッチング文字に基づいて、調整及び組み合わせを行って、ウェイクアップワードを生成することと、を含むことを特徴とする請求項14に記載の方法。
【請求項16】
調整及び組み合わせを行うことは、
位置関係及び論理関係についての調整及び組み合わせを行うことを含むことを特徴とする請求項15に記載の方法。
【請求項17】
クラウドウェイクアップシステムであって、
ユーザーの入力したウェイクアップ音声を受信するように配置される音声受信ユニットと、
クラウドにおいて、前記ウェイクアップ音声を復号して、ウェイクアップテキストを生成するように配置される音声復号ユニットと、
ユーザーの予め設定したウェイクアップ文字を受信し、前記クラウドが前記ウェイクアップ文字を圧縮しないように配置されるウェイクアップ文字伝送ユニットと、
前記ウェイクアップテキストにおける前記ウェイクアップ文字を認識するように配置される音声認識ユニットと、
認識結果に基づいて、ウェイクアップ指示を与えるように配置されるウェイクアップ指示ユニットと、を備え、
前記ウェイクアップ文字伝送ユニットは、前記音声受信ユニットがユーザーの入力したウェイクアップ音声を受信すると同時に、前記ユーザーの予め設定した前記ウェイクアップ文字を受信するようにさらに配置されることを特徴とするクラウドウェイクアップシステム。
【請求項18】
前記音声認識ユニットは、
前記ウェイクアップテキストから前記ウェイクアップ文字にマッチングするマッチング文字を認識するように配置される文字マッチングユニットと、
前記マッチング文字に基づいて、調整及び組み合わせを行って、ウェイクアップワードを生成するように配置されるウェイクアップ形成ユニットと、を備えることを特徴とする請求項17に記載のシステム。
【請求項19】
前記調整及び組み合わせを行うことは、
位置関係及び論理関係についての調整及び組み合わせを行うことを含むことを特徴とする請求項18に記載のシステム。
【請求項20】
クラウドウェイクアップ端末であって、
1つ又は複数のプロセッサと、
1つ又は複数のプログラムを記憶するためのメモリと、を備え、
前記1つ又は複数のプログラムが前記1つ又は複数のプロセッサにより実行される場合、前記1つ又は複数のプロセッサに請求項14〜16のいずれか一項に記載の方法を実現させることを特徴とするクラウドウェイクアップ端末。
【請求項21】
コンピュータプログラムが記憶されるコンピュータ可読記憶媒体であって、
該プログラムがプロセッサにより実行される場合、請求項14〜16のいずれか一項に記載の方法を実現することを特徴とするコンピュータ可読記憶媒体。
【請求項22】
コンピュータにおいて、プロセッサにより実行される場合、請求項14〜16のいずれか一項に記載の方法を実現することを特徴とするプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、通信技術分野に関し、特に音クラウドウェイクアップ方法
、システム、端末
、コンピュータ可読記憶媒体
、及びプログラムに関する。
【背景技術】
【0002】
科学技術の発展に伴って、ユーザーは音声によって家電等のスマートデバイスを操作することができる。つまり、音声によってスマートデバイスをウェイクアップする必要がある。
【0003】
現在、従来のウェイクアップ案はすべてローカルウェイクアップを用いる。ローカルウェイクアップに基づく場合、実際に、端末装置の電力消費及びリソース占有に対して、高い要求がある。且つ、端末装置のメモリに限りがあるため、ウェイクアップモデルを圧縮する必要がある。しかしながら、ウェイクアップモデルが圧縮されると、ウェイクアップ効果に影響し、ウェイクアップ誤報も発生するため、ウェイクアップ品質に影響する。
【0004】
従って、ウェイクアップ品質に影響せずに、ウェイクアップモデルのリソース消費量及び電力損失をどのように削減するかは、人々が関心を持っている問題である。
【発明の概要】
【発明が解決しようとする課題】
【0005】
従来技術における以上の1つ又は複数の技術的問題を解決し、又は、少なくとも1つの有益な選択肢を提供するために、本発明の実施例はクラウドウェイクアップ制御方法
、システム、端末
、コンピュータ可読記憶媒体
、及びプログラムを提供する。
【課題を解決するための手段】
【0006】
第一態様において、本発明の実施例に係るクラウドウェイクアップ方法であって、
ユーザーの入力したウェイクアップ音声を受信して、前記ウェイクアップ音声をクラウドに伝送することと、
クラウドにおいて、前記ウェイクアップ音声を復号して、ウェイクアップテキストを生成することと、
前記ウェイクアップテキストにおけるウェイクアップ文字を認識することと、
認識結果に基づいて、ウェイクアップ指示を与えることと、を含む。
【0007】
第一態様によれば、本発明の第一態様の第一実施形態では、前記方法は、
ユーザーが前記ウェイクアップ文字を予め設定することと、
前記ウェイクアップ文字を前記クラウドに伝送することと、を更に含む。
【0008】
第一態様、第一態様の第一実施形態によれば、本発明の第一態様の第二実施形態では、前記ウェイクアップ文字を前記クラウドに伝送することは、
前記ウェイクアップ音声をクラウドに伝送すると同時に、予め設定された前記ウェイクアップ文字を前記クラウドに伝送することを含む。
【0009】
第一態様、第一態様の第一実施形態、第一態様の第二実施形態によれば、本発明の第一態様の第三実施形態では、クラウドにおいて、前記ウェイクアップ音声を復号して、ウェイクアップテキストを生成することは、
前記クラウドにおいて、音響モデル、言語モデル及び発音辞書によって、前記ウェイクアップ音声を復号することにより、ウェイクアップテキストを生成することを含む。
【0010】
第一態様、第一態様の第一実施形態、第一態様の第二実施形態、第一態様の第三実施形態によれば、本発明の第一態様の第四実施形態では、前記ウェイクアップテキストにおけるウェイクアップ文字を認識することは、
前記ウェイクアップテキストから前記ウェイクアップ文字にマッチングするマッチング文字を認識することと、
前記マッチング文字に基づいて、調整及び組み合わせを行って、ウェイクアップワードを生成することと、を含む。
【0011】
第一態様及び上記いずれか1つの実施形態によれば、本発明の第一態様の第五実施形態では、認識結果に基づいて、ウェイクアップ指示を与えることは、
前記ウェイクアップワードに基づいて、ウェイクアップ指示を与えることを含む。
【0012】
第二態様において、本発明の実施例に係るクラウドウェイクアップシステムであって、
ユーザーの入力したウェイクアップ音声を受信して、前記ウェイクアップ音声をクラウドに伝送するように配置される音声受信ユニットと、
クラウドにおいて、前記ウェイクアップ音声を復号して、ウェイクアップテキストを生成するように配置される音声復号ユニットと、
前記ウェイクアップテキストにおけるウェイクアップ文字を認識するように配置される音声認識ユニットと、
認識結果に基づいて、ウェイクアップ指示を与えるように配置されるウェイクアップ指示ユニットと、を備える。
【0013】
第二態様によれば、本発明の第二態様の第一実施形態では、前記システムは、
ユーザーが前記ウェイクアップ文字を予め設定するように配置されるウェイクアップ文字設定ユニットと、
前記ウェイクアップ文字を前記クラウドに伝送するように配置されるウェイクアップ文字伝送ユニットと、を更に備える。
【0014】
第二態様、第二態様の第一実施形態及び第二態様の第二実施形態によれば、本発明の第二態様の第二実施形態では、ウェイクアップ文字伝送ユニットは前記ウェイクアップ音声をクラウドに伝送すると同時に、予め設定された前記ウェイクアップ文字を前記クラウドに伝送するように更に配置される。
【0015】
第二態様、第二態様の第一実施形態、第二態様の第二実施形態によれば、本発明の第二態様の第三実施形態では、前記音声復号ユニットは前記クラウドにおいて、音響モデル、言語モデル及び発音辞書によって、前記ウェイクアップ音声を復号することにより、ウェイクアップテキストを生成するように配置される。
【0016】
第二態様、第二態様の第一実施形態、第二態様の第二実施形態、第二態様の第三実施形態によれば、本発明の第二態様の第四実施形態では、前記音声認識ユニットは、
前記ウェイクアップテキストから前記ウェイクアップ文字にマッチングするマッチング文字を認識するように配置される文字マッチングユニットと、
前記マッチング文字に基づいて、調整及び組み合わせを行って、ウェイクアップワードを生成するように配置されるウェイクアップ形成ユニットと、を備える。
【0017】
第二態様及び上記いずれかの実施形態によれば、本発明の第二態様の第五実施形態では、前記ウェイクアップ指示ユニットは前記ウェイクアップワードに基づいて、ウェイクアップ指示を与えるように更に配置される。
【0018】
第三態様によれば、本発明の実施例に係るクラウドウェイクアップ端末であって、
1つ又は複数のプロセッサと、
1つ又は複数のプログラムを記憶するためのメモリと、を備え、
前記1つ又は複数のプログラムが前記1つ又は複数のプロセッサにより実行される場合、前記1つ又は複数のプロセッサに上記いずれかの前記クラウドウェイクアップ方法を実現させる。
【0019】
第四態様によれば、本発明の実施例に係るコンピュータ可読記憶媒体であって、コンピュータプログラムが記憶され、該プログラムがプロセッサにより実行される場合、上記第一態様におけるいずれかの前記クラウドウェイクアップ方法を実現する。
【0020】
前記機能はハードウェアで実現されてもよいし、ハードウェアで対応するソフトウェアを実行することにより実現されてもよい。前記ハードウェア又はソフトウェアは上記機能に対応する1つ又は複数のモジュールを備える。
【発明の効果】
【0021】
上記技術案のうちの1つの技術案は、本発明のクラウドウェイクアップ方法によって、クラウドにおいて、音声の認識を完了させ、認識された音声に基づいて、クラウドにおいて、スマートデバイスのウェイクアップを実現することができるという利点又は有益な効果を有する。従って、ウェイクアップ品質を確保する上で、端末装置のリソース消費量を削減し、電力損失も削減した。
【0022】
上記概説は明細書のためのものであって、いかなる方式で制限するためのものではない。上記説明される模式的な態様、実施形態及び特徴を除き、本発明のさらなる態様、実施形態及び特徴は、図面及び以下の詳細な説明によって明らかになる。
【図面の簡単な説明】
【0023】
図面において、特に断りがない限り、複数の図面における同一記号は同様又は類似する部材又は要素を示す。これらの図面は比率で描かれるとは限らない。これらの図面は本発明の開示に係るいくつかの実施形態を描くものに過ぎず、本発明の範囲を制限するものと見なされるべきではないと理解すべきである。
【0024】
【
図1】本発明の一実施例に係るクラウドウェイクアップ方法100のフローチャートである。
【
図2】本発明の別の実施例に係るクラウドウェイクアップ方法200のフローチャートである。
【
図3】本発明の別の実施例に係るクラウドウェイクアップ方法300のフローチャートである。
【
図4】本発明の一実施例に係るクラウドウェイクアップシステム400のブロック構成図である。
【
図5】本発明の別の実施例に係るクラウドウェイクアップシステム500のブロック構成図である。
【
図6】本発明の別の実施例に係るクラウドウェイクアップシステム600のブロック構成図である。
【
図7】本発明に係るクラウドウェイクアップ端末の模式図である。
【発明を実施するための形態】
【0025】
以下、ある例示的な実施例を簡単に説明する。当業者が理解できるとおり、本発明の趣旨又は範囲を逸脱せずに、様々な方式で説明される実施例を修正することができる。従って、図面及び説明は本質的に例示的なものであって、制限的なものではないと見なされる。
【0026】
以下、
図1〜
図7を参照して、本発明のクラウドウェイクアップ方法、システム及び端末を説明する。
【0027】
図1に示すように、本発明のクラウドウェイクアップ方法100はステップS101〜ステップS104を含む。
【0028】
まず、音声受信ステップS101によって、ユーザーの入力したウェイクアップ音声を受信する。
【0029】
ここで、端末装置の内蔵マイクロフォンによって、ウェイクアップ音声を受信してもよい。更に、端末装置に接続されるマイクロフォンアレイを設定し、ビームフォーミング技術で音の発生源に基づいてビームフォーミング角度を設定してもよく、従って、様々な方向からのユーザーの遠距離音声を指向的に受信することができる。
【0030】
ウェイクアップ音声はユーザーの現在のウェイクアップニーズに基づくものであり、例えば、ユーザーが冷蔵庫を開けたがる場合、ウェイクアップ音声「冷蔵庫を開けてください」を入力してもよく、無論、ユーザーのウェイクアップ音声が正確でなくてもよく、ウェイクアップニーズを示す一段落の音声、例えば「天気が熱すぎるから、エアコンを起動しましょう」であってもよい。
【0031】
ユーザーのウェイクアップ音声を受信すると、ウェイクアップ音声をクラウドに伝送する。
【0032】
次に、音声復号ステップS102に進み、クラウドにおいて、伝送してきたウェイクアップ音声を復号する。
【0033】
一実施例において、復号動作は音響モデル、言語モデル及び発音辞書等の組み合わせによって実現されてもよいが、それらに限らない。ウェイクアップ音声を復号した後、音声信号を文字信号に変換することにより、ウェイクアップテキストを生成することができる。
【0034】
ここで、復号することに使用される音響モデル、言語モデル及び発音辞書等はいずれもクラウドに構築され、クラウドスペースが大きいため、音響モデル、言語モデル及び発音辞書等を圧縮する必要がなく、それにより復号する品質を確保する。
【0035】
ウェイクアップテキストを生成した後、音声認識ステップS103では、ウェイクアップテキストにおけるウェイクアップ文字を認識することができる。これにより、ウェイクアップテキストにウェイクアップ文字が含まれるかどうか、及びどのウェイクアップ文字が含まれるかを確定する。
【0036】
ここで、ウェイクアップ文字はクラウドに予め設定されてもよいし、クラウドに予め伝送されてもよい。以下、具体的な操作方式を説明する。
【0037】
一実施例において、ウェイクアップ文字はスマートデバイスの名称、ニックネーム等、及び起動、停止、一時停止、スリープ等に関連する動詞を含んでもよいが、これらに限らず、ユーザーの個人的ニーズに応じて関連するウェイクアップ文字を設定してもよい。
【0038】
ウェイクアップテキスト「エアコンを起動してください」を例とし、音声認識ステップS103では、「エアコンを起動してください」にはどのウェイクアップ文字、例えばスマートデバイスの名称「エアコン」、起動に関連する動詞「起動」が存在するかを認識することができる。次に、「エアコン」及び「起動」をウェイクアップ指示ステップS104に送信することができる。
【0039】
最後に、ウェイクアップ指示ステップS104では、認識結果、即ち「エアコン」及び「起動」に基づいて、ウェイクアップ指示を与えることができる。この時、認識結果、即ち「エアコン」及び「起動」に基づいて、エアコンを使用するウェイクアップ提示を与えて、空調設備を起動することができる。
【0040】
音声認識ステップS103及びウェイクアップ指示ステップS104はクラウドにおいて完了してもよく、ローカルリソースを占有せず、リソース消費量を削減し、ローカル端末装置の電力損失も削減した。
【0041】
本発明のクラウドウェイクアップ方法100によって、クラウドにおいて、音声の復号及び認識を完了させ、認識された音声に基づいて、クラウドにおいて、スマートデバイスのウェイクアップを実現することができ、従って、端末装置のリソース消費量を削減し、電力損失も削減した。
【0042】
図2に示すように、本発明の一実施例のクラウドウェイクアップ方法200は、方法100を基礎とし、方法200はウェイクアップ文字設定ステップS105及びウェイクアップ文字伝送ステップS106を更に含む。
【0043】
ウェイクアップ文字設定ステップS105では、必要に応じて、ユーザーはウェイクアップ文字を予め設定することができる。
【0044】
ここで、ウェイクアップ文字はスマートデバイスの名称、例えば冷蔵庫、テレビ、エアコン等のみ含んでもよいし、ユーザーの好みに応じて、スマートデバイスに対してニックネーム、例えば「子豚冷蔵庫」、「小冷エアコン」等を設定してもよく、更に、ウェイクアップ文字は操作に関連する動詞、例えば起動、停止、一時停止、スリープ等に関連する動詞を更に含んでもよい。
【0045】
更に、ウェイクアップ文字設定ステップS105では、ユーザーは更にスマートデバイスの出荷名、即ち、メーカーの設定したデフォルト名を検索することができ、これらの出荷名をウェイクアップ文字として直接使用してもよい。
【0046】
ウェイクアップ文字を設定した後、ウェイクアップ文字伝送ステップS106に進み、ウェイクアップ文字をクラウドに伝送する。
【0047】
一実施例において、ユーザーはローカルにおいてウェイクアップ文字を設定することができ、且つ、設定してからクラウドに伝送して記憶し、後続の音声認識に備える。
【0048】
好ましくは、ウェイクアップ文字伝送ステップS106では、ウェイクアップ音声をクラウドに伝送すると同時に、予め設定されたウェイクアップ文字もクラウドに伝送する。このように、ウェイクアップ文字がウェイクアップ音声とともに伝送され、それにより、クラウドにおいて、ウェイクアップ音声を復号すると、ウェイクアップテキストを認識して、認識結果に基づいて、ウェイクアップ指示を出すことができる。
【0049】
本発明のクラウドウェイクアップ方法200によって、ウェイクアップ文字をクラウドに伝送し、クラウドスペースが大きいため、大規模なデータ群を記憶することができ、ウェイクアップ文字を圧縮する必要がなく、従って、ウェイクアップ文字のカバレッジ範囲を確保し、ウェイクアップ文字及びウェイクアップテキストの認識及びマッチング程度を向上させ、ウェイクアップ効果を向上させることができ、ウェイクアップ誤報の発生も減少した。
【0050】
図3に示すように、本発明の一実施例のクラウドウェイクアップ方法300は、方法200を基礎とし、音声認識ステップS103は文字マッチングステップS1031及びウェイクアップ形成ステップS1032を含んでもよい。
【0051】
一実施例において、
図3に示すように、文字マッチングステップS1031では、ウェイクアップテキストからウェイクアップ文字にマッチングするマッチング文字を認識することができる。
【0052】
ウェイクアップテキスト「天気が熱すぎるから、エアコンを起動しましょう」を例とし、この時、ウェイクアップテキストの語義がより曖昧である。予め設定されたウェイクアップ文字は「テレビ」、「エアコン」、「開ける」、「起動」を含む場合、文字マッチングステップS1031では、「天気が熱すぎるから、エアコンを起動しましょう」における予め設定されたウェイクアップ文字(「テレビ」、「エアコン」、「開ける」、「起動」)にマッチングする文字が「エアコン」及び「起動」、即ちマッチング文字であることを認識することができる。
【0053】
次に、ウェイクアップ形成ステップS1032では、認識されたマッチング文字に基づいて、調整及び組み合わせを行って、ウェイクアップワードを生成することができる。例えば:マッチング文字「エアコン」及び「起動」に対して位置関係及び論理関係についての調整及び組み合わせを行って、ウェイクアップワード「エアコンを起動しましょう」を形成する。
【0054】
一実施例において、ウェイクアップ指示ステップS104に進む前に、ウェイクアップワードに基づいて、ウェイクアップ指示を与えることができる。例えば、ウェイクアップワード「エアコンを起動しましょう」に基づいて、エアコンを起動するウェイクアップ指示を与えることにより、エアコンのウェイクアップを実現する。
【0055】
本発明のクラウドウェイクアップ方法300によって、ウェイクアップテキストの語義がより曖昧である場合、マッチング文字を認識した後、マッチング文字に対して調整及び組み合わせを行うことにより、ウェイクアップワードを生成することができる。方法300において、調整及び組み合わせによってウェイクアップワードを生成することができ、ウェイクアップ文字の構築モデルを変更する必要がなく、技術的リソースを節約し、且つ誤報の発生を減少させることもできる。
【0056】
図4に示すように、クラウドウェイクアップシステム400であって、音声受信ユニット401、音声復号ユニット402、音声認識ユニット403及びウェイクアップ指示ユニット404を備える。
【0057】
音声受信ユニット401はユーザーの入力したウェイクアップ音声を受信し、ウェイクアップ音声をクラウドに伝送するように配置される。
【0058】
ここで、端末装置の内蔵マイクロフォンによって、ウェイクアップ音声を受信することができる。端末装置に接続されるマイクロフォンアレイを設定し、ビームフォーミング技術で音の発生源に基づいてビームフォーミング角度を設定してもよく、これにより、様々な方向からのユーザーの遠距離音声を指向的に受信することができる。
【0059】
ウェイクアップ音声はユーザーの現在のウェイクアップニーズに基づくものであり、例えば、ユーザーが冷蔵庫を開けたがる場合、ウェイクアップ音声「冷蔵庫を開けてください」を入力してもよく、無論、ユーザーのウェイクアップ音声が正確でなくてもよく、ウェイクアップニーズを示す一段落の音声、例えば「天気が熱すぎるから、エアコンを起動しましょう」であってもよい。
【0060】
音声復号ユニット402は、クラウドにおいて、ウェイクアップ音声を復号して、ウェイクアップテキストを生成するように配置される。
【0061】
一実施例において、復号動作は音響モデル、言語モデル及び発音辞書等の組み合わせによって実現されてもよいが、それらに限らない。ウェイクアップ音声を復号した後、音声信号を文字信号に変換することにより、ウェイクアップテキストを生成することができる。
【0062】
復号することに使用される音響モデル、言語モデル及び発音辞書等はいずれもクラウドに構築され、クラウドスペースが大きいため、音響モデル、言語モデル及び発音辞書等を圧縮する必要がなく、それにより復号する品質を確保する。
【0063】
音声認識ユニット403はウェイクアップテキストにおけるウェイクアップ文字を認識するように配置される。
【0064】
一実施例において、ウェイクアップテキストに対する認識によって、ウェイクアップテキストにウェイクアップ文字が含まれるかどうか、及びどのウェイクアップ文字が含まれるかを確定する。
【0065】
ここで、ウェイクアップ文字はクラウドに予め設定されてもよいし、クラウドに予め伝送されてもよい。以下、具体的な操作ユニットを説明する。
【0066】
ウェイクアップ指示ユニット404は認識結果に基づいて、ウェイクアップ指示を与えるように配置される。
【0067】
音声復号ユニット402、音声認識ユニット403及びウェイクアップ指示ユニット404はクラウドに設定されてもよく、ローカルリソースを占有せず、リソース消費量を削減し、ローカル端末装置の電力損失も削減した。
【0068】
本発明のクラウドウェイクアップシステム400によって、クラウドにおいて、音声の復号及び認識を完了させ、認識された音声に基づいて、クラウドにおいて、スマートデバイスのウェイクアップを実現することができ、従って、端末装置のリソース消費量を削減し、電力損失も削減した。
【0069】
具体的に、
図4に示すクラウドウェイクアップシステム400は
図1に示すクラウドウェイクアップ方法100に対応する。
図4に示すシステムの具体的な実現方式は
図1に示す方法の実施例における説明を参照する。
【0070】
図5に示すように、クラウドウェイクアップシステム500は、システム400を基礎とし、システム500はウェイクアップ文字設定ユニット405及びウェイクアップ文字伝送ユニット406を更に備える。
【0071】
ウェイクアップ文字設定ユニット405はユーザーがウェイクアップ文字を予め設定するように配置される。
【0072】
ウェイクアップ文字伝送ユニット406はウェイクアップ文字をクラウドに伝送するように配置される。
【0073】
一実施例において、ユーザーはローカルにウェイクアップ文字を設定することができ、且つ、設定してからクラウドに伝送して記憶し、後続の音声認識に備える。
【0074】
好ましくは、文字伝送ユニット406をウェイクアップしてウェイクアップ音声をクラウドに伝送すると同時に、予め設定されたウェイクアップ文字もクラウドに伝送してもよい。このように、ウェイクアップ文字がウェイクアップ音声とともに伝送され、それにより、クラウドにおいて、ウェイクアップ音声を復号すると、ウェイクアップテキストを認識して、認識結果に基づいて、ウェイクアップ指示を出すことができる。
【0075】
具体的に、
図5に示すクラウドウェイクアップシステム500は
図2に示すクラウドウェイクアップ方法200に対応する。
図5に示すシステムの具体的な実現方式は
図2に示す方法の実施例における説明を参照する。
【0076】
図6に示すように、クラウドウェイクアップシステム600であって、システム500を基礎とし、音声認識ユニット403は文字マッチングユニット4031及びウェイクアップ形成ユニット4032を含んでもよい。
【0077】
文字マッチングユニット4031はウェイクアップテキストからウェイクアップ文字にマッチングするマッチング文字を認識するように配置される。
【0078】
ウェイクアップ形成ユニット4032はマッチング文字に基づいて、調整及び組み合わせを行って、ウェイクアップワードを生成するように配置される。
【0079】
一実施例において、ウェイクアップ指示ユニット404はウェイクアップワードに基づいて、ウェイクアップ指示を与えるように配置されてもよい。
【0080】
具体的に、
図6に示すクラウドウェイクアップシステム600は
図3に示すクラウドウェイクアップ方法300に対応する。
図6に示すシステムの具体的な実現方式は
図3に示す方法の実施例における説明を参照する。
【0081】
図7に示すように、クラウドウェイクアップ制御端末であって、メモリ710及びプロセッサ720を備える。メモリ710にはプロセッサ720で実行できるコンピュータプログラムが記憶される。プロセッサ720がコンピュータプログラムを実行する時、上記実施例におけるクラウドウェイクアップ方法を実現する。メモリ710及びプロセッサ720の数が1つ又は複数であってもよい。
【0082】
該サーバは、
外部デバイスと通信し、データ交換伝送を行うための通信インターフェース730を更に備える。
【0083】
メモリ710は高速RAMメモリを含む可能性もあるし、更に不揮発性メモリ(non−volatile memory)、例えば少なくとも1つの磁気ディスクメモリを含む可能性もある。
【0084】
メモリ710、プロセッサ720及び通信インターフェース730が独立して実現する場合、メモリ710、プロセッサ720及び通信インターフェース730はバスで互いに接続され、且つ相互間の通信を実現することができる。バスは業界標準アーキテクチャ(ISA、Industry Standard Architecture)バス、ペリフェラルコンポーネント(PCI、Peripheral Component)バス又は拡張業界標準アーキテクチャ(EISA、Extended Industry Standard Component)バス等であってもよい。バスはアドレスバス、データバス、制御バス等に分けられてもよい。示しやすくするために、
図7では1本のみの太線で示すが、1本のみのバス又は1つタイプのみのバスを有すると示さない。
【0085】
選択的に、具体的に実現するとき、メモリ710、プロセッサ720及び通信インターフェース730が1枚のチップに統合される場合、メモリ710、プロセッサ720及び通信インターフェース730は内部インターフェースによって相互間の通信を実現することができる。
【0086】
一実施例において、本発明は更にコンピュータ可読記憶媒体を提供し、コンピュータプログラムが記憶され、該プログラムがプロセッサで実行されるとき、上記第一態様におけるいずれか1つの前記クラウドウェイクアップ方法を実現する。
【0087】
本明細書の説明において、用語「一実施例」、「いくつかの実施例」、「例」、「具体例」、又は「いくつかの例」等の説明とは、該実施例又は例によれば説明した具体的な特徴、構造、材料又は特性が本発明の少なくとも1つの実施例又は例に含まれることを意味する。且つ、説明される具体的な特徴、構造、材料又は特性はいずれか1つ又は複数の実施例又は例で適切な方式で結合してもよい。また、矛盾しない限り、当業者は本明細書に説明される様々な実施例又は例、及び様々な実施例又は例の特徴を結合及び組み合わせすることができる。
【0088】
また、用語の「第一」、「第二」は説明のためのものに過ぎず、相対重要性を指示又は示唆し、又は指示された技術的特徴の数を暗示すると理解すべきではない。従って、「第一」、「第二」で制限された特徴は少なくとも1つの該特徴を明示的又は暗示的に含んでもよい。本発明の説明において、特に明確且つ具体的に制限しない限り、「複数」の意味は2つ又は2つ以上である。
【0089】
当業者であれば、フローチャートにおける、又はここでほかの方式で説明されるいかなる過程又は方法についての説明は、特定の論理機能又は過程を実現するための1つ又は複数のステップの実行可能命令のコードを含むモジュール、セグメント又は部分を示すと理解されてもよく、且つ本発明の好適な実施形態の範囲はほかの実現を含み、指示又は検討される順序通りでなくてもよく、関わる機能に基づいて、ほぼ同時に、又は逆順序で機能を実行してもよいと理解すべきである。
【0090】
フローチャートに示す、又はここでほかの方式で説明される論理及び/又はステップは、例えば、論理機能を実現するための実行可能命令の順序付けリストであると見なされてもよく、具体的にいかなるコンピュータ可読記憶媒体に実現されてもよく、命令実行システム、装置又はデバイス(例えばコンピュータに基づくシステム、プロセッサを含むシステム又は命令実行システム、装置又はデバイスから命令を受信し且つ命令を実行するシステム)の使用に備え、又はこれらの命令実行システム、装置又はデバイスと組み合わせて使用される。本明細書については、「コンピュータ可読記憶媒体」はプログラムを包含、記憶、通信、伝播又は伝送することにより、命令実行システム、装置又はデバイス、又はこれらの命令実行システム、装置又はデバイスと組み合わせて使用されるいかなる装置であってもよい。コンピュータ可読記憶媒体のさらなる具体例(非網羅的リスト)は、1つ又は複数の配線を有する電気接続部(電子装置)、ポータブルコンピュータケース(磁気装置)、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、電気的消去再書込み可能な読出し専用メモリ(EPROM又はフラッシュメモリ)、光ファイバー装置、及び携帯型読み出し専用メモリ(CDROM)を含む。また、コンピュータ可読記憶媒体は更にその上に前記プログラムを印刷できる用紙又はほかの適切な媒体であってもよい理由は、例えば用紙又はほかの媒体を光学的に走査し、次に編集、解釈し、又は必要な時にほかの適切な方式で処理して、電子方式で前記プログラムを取得し、次にそれをコンピュータメモリに記憶することができるためである。
【0091】
本発明の各部分はハードウェア、ソフトウェア、ファームウェア又はそれらの組み合わせで実現されてもよいと理解すべきである。上記実施形態において、複数のステップ又は方法は、メモリに記憶される、且つ適切な命令実行システムで実行するソフトウェア又はファームウェアで実現されてもよい。例えば、ハードウェアで実現する場合は、別の実施形態と同様に、データ信号に対して論理機能を実現する論理ゲート回路を有する離散論理回路、適切な組み合わせ論理ゲート回路を有する特定用途向け集積回路、プログラマブルゲートアレイ(PGA)、フィールドプログラマブルゲートアレイ(FPGA)等の本分野での公知技術のうちのいずれか1つ又はそれらの組み合わせで実現してもよい。
【0092】
当業者であれば、上記実施例方法におけるステップの全部又は一部の実現がプログラムによって関連するハードウェアを命令して完了させてもよく、前記プログラムがコンピュータ可読記憶媒体に記憶されてもよく、実行時に、該プログラムは方法実施例のステップの1つ又はそれらの組み合わせを含むと理解される。
【0093】
また、本発明の各実施例における各機能ユニットが1つの処理モジュールに統合されてもよく、各ユニットが独立して物理的に存在してもよく、2つ又は2つ以上のユニットが1つのモジュールに統合されてもよい。上記統合モジュールはハードウェアのタイプで実現されてもよいし、ソフトウェア機能モジュールのタイプで実現されてもよい。前記統合モジュールはソフトウェア機能モジュールのタイプで実現され、且つ独立した製品として販売又は使用されるとき、1つのコンピュータ可読記憶媒体に記憶されてもよい。前記記憶媒体は読み出し専用メモリ、磁気ディスク又は光ディスク等であってもよい。
【0094】
以上の説明は、本発明の具体的な実施形態に過ぎず、本発明の保護範囲を制限するためのものではなく、当業者が本発明に開示される技術的範囲内に容易に想到し得る種々の変更又は置換は、いずれも本発明の保護範囲内に含まれるべきである。従って、本発明の保護範囲は特許請求の範囲に準じるべきである。