特許第6799573号(P6799573)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッドの特許一覧

特許6799573端末ブラケット及びファーフィールド音声対話システム
<>
  • 特許6799573-端末ブラケット及びファーフィールド音声対話システム 図000002
  • 特許6799573-端末ブラケット及びファーフィールド音声対話システム 図000003
  • 特許6799573-端末ブラケット及びファーフィールド音声対話システム 図000004
  • 特許6799573-端末ブラケット及びファーフィールド音声対話システム 図000005
  • 特許6799573-端末ブラケット及びファーフィールド音声対話システム 図000006
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6799573
(24)【登録日】2020年11月25日
(45)【発行日】2020年12月16日
(54)【発明の名称】端末ブラケット及びファーフィールド音声対話システム
(51)【国際特許分類】
   G10L 15/28 20130101AFI20201207BHJP
   G10L 15/10 20060101ALI20201207BHJP
   G10L 15/30 20130101ALI20201207BHJP
   G10L 15/00 20130101ALI20201207BHJP
【FI】
   G10L15/28 400
   G10L15/10 200W
   G10L15/30
   G10L15/00 200A
   G10L15/28 230K
【請求項の数】9
【外国語出願】
【全頁数】12
(21)【出願番号】特願2018-223359(P2018-223359)
(22)【出願日】2018年11月29日
(65)【公開番号】特開2019-159307(P2019-159307A)
(43)【公開日】2019年9月19日
【審査請求日】2018年11月30日
(31)【優先権主張番号】201810210026.7
(32)【優先日】2018年3月14日
(33)【優先権主張国】CN
(73)【特許権者】
【識別番号】513224353
【氏名又は名称】バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド
(74)【代理人】
【識別番号】110000796
【氏名又は名称】特許業務法人三枝国際特許事務所
(72)【発明者】
【氏名】スー ホン
(72)【発明者】
【氏名】リー ポン
(72)【発明者】
【氏名】ヂャオ リーフォン
【審査官】 中村 天真
(56)【参考文献】
【文献】 特開2016−178662(JP,A)
【文献】 米国特許出願公開第2017/0270919(US,A1)
【文献】 特開2013−214924(JP,A)
【文献】 特開2016−151608(JP,A)
【文献】 特開2019−110447(JP,A)
【文献】 特開2013−102373(JP,A)
【文献】 特開2011−023790(JP,A)
【文献】 特開2002−171337(JP,A)
【文献】 中国特許出願公開第106714013(CN,A)
【文献】 Bluetoothスピーカー(iPhone5・スマートフォン・iPad・タブレットPC対応・スタンド一体型・20W)400-SP037の販売商品,[online],2016年 3月15日,[2019年12月19日検索],インターネット,URL,https://web.archive.org/web/20160315124258/http://direct.sanwa.co.jp:80/ItemPage/400-SP037
(58)【調査した分野】(Int.Cl.,DB名)
G10L 13/00−25/93
(57)【特許請求の範囲】
【請求項1】
端末を支持するための端末ブラケットであって、
前記端末ブラケットにファーフィールド集音装置と音声解析装置とブルートゥースモジュールとが備えられ、
前記ファーフィールド集音装置は、マイクアレイからなり、遠距離ユーザから送信された音声情報を受信し、前記音声情報を音声解析装置へ送信し、
前記音声解析装置は、前記音声情報を解析して、前記音声情報に所定のウェークアップワードが含まれているか否かを確定し、
前記所定のウェークアップワードが含まれていれば、前記端末ブラケットのブルートゥースモジュールは、前記端末のブルートゥースモジュールと前記端末ブラケットのブルートゥースモジュールとの間にブルートゥース同期指向接続リンクを確立するように、前記端末のブルートゥースモジュールへ通信リンク確立指令を送信し、
前記ブルートゥース同期指向接続リンクにより、前記音声情報を前記端末ブラケットと通信可能に接続された前記端末へ送信する端末ブラケット。
【請求項2】
前記端末ブラケットにファーフィールド再生装置が更に備えられ、
前記ファーフィールド再生装置は、前記端末から受信された音声再生情報を再生する、請求項1に記載の端末ブラケット。
【請求項3】
前記ファーフィールド再生装置には、前記音声再生情報のパワーを増幅するためのパワーアンプが備えられる、請求項2に記載の端末ブラケット。
【請求項4】
前記端末ブラケットは、さらに、前記ブルートゥース同期指向接続リンクにより前記端末から前記音声再生情報を受信する、請求項2または3に記載の端末ブラケット。
【請求項5】
ファーフィールド音声対話システムであって、
端末と請求項1〜の何れか一つに記載の端末ブラケットとが備えられ、前記端末と前記端末ブラケットは通信可能に接続される、ファーフィールド音声対話システム。
【請求項6】
前記端末には、制御装置と実行装置とが備えられ、
前記制御装置は、前記音声情報に対して解析処理を行って前記音声情報に対応する制御情報を確定し、前記制御情報を前記実行装置へ送信し、
前記実行装置は、前記制御情報に対応する処理を実行する、請求項に記載のファーフィールド音声対話システム。
【請求項7】
前記ファーフィールド音声対話システムにクラウドサーバが備えられ、
前記クラウドサーバは、前記端末から送信された音声情報を受信し、前記音声情報に対して解析処理を行って前記音声情報に対応する制御情報を確定し、前記制御情報が含まれた制御指令を前記端末へ送信して、前記端末の実行装置に前記制御情報に対応する処理を実行させる、請求項に記載のファーフィールド音声対話システム。
【請求項8】
前記制御情報に音声再生情報が含まれている場合に、前記端末は前記音声再生情報を前記端末ブラケットへ送信し、前記端末ブラケットのファーフィールド再生装置は前記音声再生情報を再生する、請求項又はに記載のファーフィールド音声対話システム。
【請求項9】
前記端末にニアフィールド集音装置とニアフィールド再生装置とが備えられ、前記端末と前記端末ブラケットとの間に通信リンクが確立された後に、前記端末は前記ニアフィールド集音装置と前記ニアフィールド再生装置の動作状態をオフ状態へ切り替える、請求項の何れか一つに記載のファーフィールド音声対話システム。
【発明の詳細な説明】
【技術分野】
【0001】
本出願はコンピュータ技術分野に関し、具体的に端末ブラケット及びファーフィールド音声対話システムに関する。
【背景技術】
【0002】
スマート端末(例えばスマートフォン)の益々の普及に従い、人間によるスマート端末の使用時間も益々長くなり、任意の時間、任意の場所にもスマート端末を使用するニーズがある。サイズに制限があるため、スマート端末は、ニアフィールド音声対話機能をサポートするように、一般的にニアフィールド集音装置(例えば、マイク)とニアフィールド再生装置(例えば、携帯電話のスピーカ)とを内蔵する。即ち、ユーザがスマート端末に近い場合に、言い出しだけで応答結果を得られる。このような対話手段は、人間にとって最も自然で簡単な対話手段であり、両手を効率的に解放し、且つ最大の程度で処理の難易度を低減させることができる。
【発明の概要】
【発明が解決しようとする課題】
【0003】
ところが、ユーザがスマート端末から離れた場合に、スマート端末からファーフィールド音声対話機能をサポートできないため、ユーザが一般的にスマート端末に対して音声制御を実行することができない。
【課題を解決するための手段】
【0004】
本出願の実施形態は、端末ブラケット及びファーフィールド音声対話システムを提出した。
【0005】
本願に係る第一の側面によると、本出願の実施形態は、端末ブラケットであって、ファーフィールド集音装置と音声解析装置とが備えられ、ファーフィールド集音装置は、ユーザから送信された音声情報を受信し、音声情報を音声解析装置へ送信し、音声解析装置は、音声情報を解析して、音声情報に所定のウェークアップワードが含まれているか否かを確定し、所定のウェークアップワードが含まれていれば、音声情報を端末ブラケットと通信可能に接続された端末へ送信する端末ブラケットを提供する。
【0006】
一部の実施形態において、端末ブラケットにファーフィールド再生装置が更に備えられ、ファーフィールド再生装置は、端末から受信された音声再生情報を再生する。
【0007】
一部の実施形態において、ファーフィールド再生装置には、音声再生情報のパワーを増幅するためのパワーアンプが備えられる。
【0008】
一部の実施形態において、端末ブラケットにブルートゥースモジュールが更に備えられ、音声情報に所定のウェークアップワードが含まれていれば、端末ブラケットのブルートゥースモジュールは、端末のブルートゥースモジュールと端末ブラケットのブルートゥースモジュールとの間にブルートゥース同期指向接続リンクを確立するように、端末のブルートゥースモジュールへ通信リンク確立指令を送信する。
【0009】
一部の実施形態において、端末ブラケットは、ブルートゥース同期指向接続リンクにより音声情報を端末へ送信し、ブルートゥース同期指向接続リンクにより端末から音声再生情報を受信する。
【0010】
本願に係る第二の側面によると、本出願の実施形態は、ファーフィールド音声対話システムであって、端末と第一の側面の実施形態の何れか一つに記載の端末ブラケットとが備えられ、端末と端末ブラケットは通信可能に接続される、ファーフィールド音声対話システムを提供する。
【0011】
一部の実施形態において、端末には、制御装置と実行装置とが備えられ、制御装置は、音声情報に対して解析処理を行って音声情報に対応する制御情報を確定し、制御情報を実行装置へ送信し、実行装置は、制御情報に対応する処理を実行する。
【0012】
一部の実施形態において、ファーフィールド音声対話システムにクラウドサーバが備えられ、クラウドサーバは、端末から送信された音声情報を受信し、音声情報に対して解析処理を行って音声情報に対応する制御情報を確定し、制御情報が含まれた制御指令を端末へ送信して、端末の実行装置に制御情報に対応する処理を実行させる。
【0013】
一部の実施形態において、制御情報に音声再生情報が含まれている場合に、端末は音声再生情報を端末ブラケットへ送信し、端末ブラケットのファーフィールド再生装置は音声再生情報を再生する。
【0014】
一部の実施形態において、端末にニアフィールド集音装置とニアフィールド再生装置とが備えられ、端末と端末ブラケットとの間に通信リンクが確立された後に、端末はニアフィールド集音装置とニアフィールド再生装置の動作状態をオフ状態へ切り替える。
【発明の効果】
【0015】
本出願の実施形態により提供された端末ブラケット及びファーフィールド音声対話システムにおいて、端末ブラケットは、ユーザから送信された音声情報をファーフィールド集音装置により受信して音声情報を音声解析装置へ送信し、その後に、音声解析装置は音声情報を解析して音声情報に所定のウェークアップワードが含まれているか否かを確定し、所定のウェークアップワードが含まれている場合に、音声情報を端末ブラケットと通信可能に接続された端末へ送信する。つまり、ファーフィールド集音機能をサポートする端末ブラケットにより、ユーザから送信された音声情報を受信することにより、端末に対するファーフィールド音声制御の実現に寄与することができる。
【図面の簡単な説明】
【0016】
以下の図面を参照してなされた非制限的実施形態に対する詳細的な説明により、本発明の他の特徴、目的及び利点がより明らかになる。
図1】本出願により提供される端末ブラケットの一つの実施例の構成の模式図である。
図2】本出願により提供される端末ブラケットの他の実施例の構成の模式図である。
図3】本出願により提供されるファーフィールド音声対話システムの一つの実施例の構成の模式図である。
図4】本出願により提供されるファーフィールド音声対話システムの一つの応用シーンにおけるインタラクションフローチャートである。
図5】本出願により提供されるファーフィールド音声対話システムの他の応用シーンにおけるインタラクションフローチャートである。
【発明を実施するための形態】
【0017】
以下、図面及び実施形態を参照しながら本発明をより詳細に説明する。なお、ここで説明する具体的な実施形態は、当該発明を説明するためのものに過ぎず、当該発明を限定するものではないことを理解すべきである。また、説明の便宜上、図面には発明に関連する部分のみを示す。
【0018】
なお、矛盾のない限り、本願の実施形態と実施形態における特徴を相互に組み合せることができるものとする。以下、図面及び実施形態を参照しながら本願を詳細に説明する。
【0019】
図1を参照する。図1は、本出願により提供される端末ブラケットの一つの実施例の構成の模式図を示す。本実施例における端末ブラケットには、ファーフィールド集音装置11と音声解析装置12とが備えられても良い。
【0020】
本実施例において、ファーフィールド集音装置11は、まずユーザから送信された音声情報を受信し、その後に音声情報を音声解析装置12へ送信することができる。音声解析装置12は、音声情報を解析して音声情報に所定のウェークアップワードが含まれているか否かを確定し、音声情報に所定のウェークアップワードが含まれていると確定した場合に、音声情報を端末ブラケットと通信可能に接続された端末へ送信することができる。
【0021】
従来の端末(例えば、スマートフォン)は、端末サイズに制限があるため、その内部に一般的にニアフィールド集音装置(例えば、マイク)だけ設置することによりニアフィールド(例えば、1メートル以内)集音機能をサポートする。ところが、ユーザが端末から離れた場合に(例えば、5メートル以内)、端末のニアフィールド集音装置により、ユーザから送信された音声情報を一般的に受信できない。ここで、端末ブラケットにおけるファーフィールド集音装置11により、ユーザから送信された音声情報を受信して、端末に通信可能に接続された端末ブラケットから音声情報を取得させることにより、端末に対するファーフィールド音声制御を実現することができる。
【0022】
本実施例において、ファーフィールド集音装置11は、例えばマイクアレイ(Microphone Array)のような、遠距離ユーザから送信される音声情報を受信可能な各種の装置であっても良い。なお、マイクアレイは、一定の数且つ一定の空間構成の音響学センサ(一般的にマイクである)で構成され、サウンドフィールドの空間特徴にサンプリングして処理するためのシステムであっても良い。実際の応用において、線形、環形、球形マイクアレイは、原理的には大きい差がないが、空間構成が異なるため、形状の異なるマイクアレイが認識可能な空間の範囲が異なることになる。例えば、音源の位置決めについて、線形のアレイは一元の情報を持ち180度しか認識できず、環形のアレイは平面のアレイであるため、二元の情報を持ち360度を認識でき、球形のアレイは立体的な三元の空間のアレイであるため、三元の情報を持ち360度の方位角と180度のピッチ角を認識できる。ここでは、位置の異なるユーザが端末に対するファーフィールド音声制御を実行可能にするために、一般的にファーフィールド集音装置11として環形のマイクアレイ又は球形のマイクアレイを採用する。また、マイクアレイにおけるマイクの数が多いほど、ビームで区分できる空間が細かくなり、ノイズの多い環境において受信される音声情報の品質が高くなる。ところが、マイクアレイにおけるマイクの数が多いほど、コストも高くなる。従って、ファーフィールド音声対話の距離と合わせて適合なマイクの数を確定することができる。
【0023】
また、後処理で音声情報に対する認識の正確度を向上するために、ファーフィールド集音装置11は、幾つかの処理アルゴリズム(例えば、ノイズ除去アルゴリズム、エコー、残響などを除去する音響学アルゴリズムなど)を採用して音声情報に対して処理を行うこともできる。例えば、ファーフィールド集音装置11は、ビーム形成の方法に基づいて、マイクアレイにおける複数のマイクで受信された音声情報に対して重み付け加算を行って、目標方向にピックアップビームを形成すし、他の方向からの反射音を減衰することにより、一連のクリーンな音声情報を取得することができる。
【0024】
本実施例において、音声解析装置12は、常用の音声解析方法(例えば、音声認識方法、語義解析方法)を採用して、ファーフィールド集音装置11から受信された音声情報を解析することができる。例えば、音声解析装置12は、まず音声認識技術(Automatic Speech Recognition、ASR)を利用して音声情報に対して音声認識を行って、音声情報における語句内容を書面言語形式の語句内容へ変換し、そして単語分割技術(例えば完全分割手法)を利用して書面言語形式の語句内容を単語に分割し、最後に分割された単語に所定のウェークアップワード(例えば、「AA」、「どうも」など)が含まれているか否かを確定し、音声情報に所定のウェークアップワードが含まれたと確定された場合に、音声情報を端末ブラケットと通信可能に接続された端末へ送信して端末に対するファーフィールド音声制御を実現することができる。音声情報に所定のウェークアップワードが含まれていないと確定された場合に、フローを終了させる。つまり、ユーザは、端末に対してファーフィールド音声制御を実行しようとする場合に、所定のウェークアップワードと端末に対して制御する情報とを同時に言い出す必要がある。
【0025】
本実施例において、端末と端末ブラケットとの間に複数種の手段で通信可能な接続を確立することができる。
【0026】
例示として、端末ブラケットに有線ポート装置を設置することができる。有線ポート装置は、ランケーブルに接続して有線ネットワーク接続を実現することができる。なお、有線ポート装置に有線インターフェース、例えばRJ45(Registered Jack 45、コネクタ)におけるコンセントが含まれても良い。これにより、ランケーブルのジョイントが当該コンセントに挿入されると、有線ネットワークの接続を実現することができる。理解すべきなのは、このような有線接続手段は、プラグアンドプレイが可能になり、複雑なネットワークの配置手順が必要なくなる。且つ、一般的にネットオフが発生することがなく、ネットワークの運行が安定である。
【0027】
他の例示として、端末ブラケットには、Wi−Fi(登録商標)(WIreless−Fidelity、無線ローカルエリアネットワーク)チップが設置されても良い。Wi−Fiチップは端末ブラケットを無線ローカルエリアネットワークに接続するようにトリガすることができる。これにより、無線ローカルエリアネットワークの信号のカバー範囲内に位置すれば、Wi−Fiチップは無線信号を受信できるため、端末ブラケットの設置場所がランケーブルに関わらずに任意に設置可能になり、ユーザによる使用の便利性を向上した。
【0028】
他の例示として、端末ブラケットには、ブルートゥースモジュールが配置されても良い。ブルートゥースモジュールは、端末と端末ブラケットとの間にニアフィールド無線通信可能な接続を確立するようにトリガすることができる。つまり、端末ブラケットと端末との間にブルートゥース(登録商標)で情報を伝送することができる。これにより、端末ブラケットがネットワークに接続することに依存せず、端末ブラケットと端末との間の対話手段を豊かにすることができる。
【0029】
説明すべきなのは、端末は一般的に端末ブラケットに固定的に設置される。なお、端末ブラケットの形状に制限がなく、端末を適当な箇所に固定的に設置すれば良い。
【0030】
本出願の実施例により提供された端末ブラケットにおいて、端末ブラケットがファーフィールド集音装置によりユーザから送信された音声情報を受信して音声情報を音声解析装置へ送信し、その後に音声解析装置が音声情報を解析して音声情報に所定のウェークアップワードが含まれているか否かを確定し、所定のウェークアップワードが含まれている場合に、音声情報を端末ブラケットと通信可能に接続された端末へ送信する。つまり、ファーフィールド集音機能をサポートする端末ブラケットによりユーザから送信された音声情報を受信することにより、端末に対するファーフィールド音声制御の実現に寄与することができる。
【0031】
続いて図2を参照する。図2は、本出願により提供される端末ブラケットの他の実施例の構成の模式図を示す。本実施例における端末ブラケットは、ファーフィールド集音装置11と、音声解析装置12と、ファーフィールド再生装置13と、ブルートゥースモジュール14とを備えても良い。
【0032】
本実施例において、ファーフィールド集音装置11は、まずユーザから送信された音声情報を受信し、そして音声情報を音声解析装置12へ送信することができる。音声解析装置12は、音声情報を解析して音声情報に所定のウェークアップワードが含まれているか否かを確定し、音声情報に所定のウェークアップワードが含まれていると確定した場合に、端末ブラケットのブルートゥースモジュール14により端末のブルートゥースモジュールへ通信リンク確立指令を送信して端末のブルートゥースモジュールと端末ブラケットのブルートゥースモジュール14との間にブルートゥースSCO(Synchronous Connection Oriented、同期指向接続)リンクを確立することができる。端末ブラケットは、ブルートゥースSCOリンクにより音声情報を端末へ送信することができる。同時に、端末ブラケットは、ファーフィールド再生装置13を更に備えても良い。ファーフィールド再生装置13は、ブルートゥースSCOリンクにより端末から音声再生情報を受信し、端末から受信された音声再生情報を再生することができる。
【0033】
従来の端末(例えば、スマートフォン)は、端末サイズに制限があるため、その内部に一般的にニアフィールド再生装置(例えば、携帯電話スピーカ)だけ設置することによりニアフィールド(例えば、1メートル以内)音声再生機能をサポートする。ところが、ユーザが端末から離れた場合に(例えば、5メートル以内)、端末のニアフィールド再生装置から再生された音声再生情報は一般的にユーザに良好に受信されない。ここで、端末ブラケットにおけるファーフィールド再生装置13により音声再生情報を再生可能であるため、音声再生情報がユーザに良好に受信される。
【0034】
本実施例において、ファーフィールド再生装置13は、異なる場所に位置するユーザは何れも音声再生情報を受信できるように、方位の異なる複数のスピーカからなることができる。一般的に、ファーフィールド再生装置13に音声再生情報のパワーを増幅するためのパワーアンプが設置される。これにより、ファーフィールド再生装置13により再生される音声再生情報のボリュームを増大することにより、端末から離れたユーザも音声再生情報を良く受信可能である。
【0035】
本実施例において、端末ブラケットは、一般的に、NFC(Near Field Communication、近距離無線通信)機能、ブルートゥース機能又はBLE(Bluetooth Low Energy、ブルートゥースローエネルギー)機能をサポートする。例えば、NFC機能をサポートする端末がNFC機能をサポートする端末ブラケットに設置された場合に、端末は予め実装された特定のアプリにより端末ブラケットとブルートゥースとBLE接続を確立することができる。ユーザから端末ブラケットに所定のウェークアップワードを言い出した場合に、端末ブラケットのブルートゥースモジュール14は、端末のブルートゥースモジュールへ通信リンク確立指令を送信して、端末のブルートゥースモジュールと端末ブラケットのブルートゥースモジュール14との間にブルートゥースSCOリンクを確立するようにトリガすることができる。なお、ブルートゥースは、デバイスによる短距離通信をサポートする無線技術である。ブルートゥース技術は、ペア毎のデバイス同士の間にブルートゥース通信を行なう場合に、当該ペアのデバイス同士の間の通信を実現するように、必ず一方のデバイスがマスタデバイス、他方のデバイスがスレーブデバイスであると規定される。一般的に、マスタデバイスは探索してペアリングを行なう。マスタデバイスとスレーブデバイスの間にブルートゥース物理リンクを確立することにより、マスタデバイスとスレーブデバイスの間にブルートゥース物理リンクで情報を送受信する。一般的に、ブルートゥース物理リンクには、二種類のSCOリンクとACL(Asynchronous Connection Less、非同期無接続)リンクとが含まれても良い。SCOリンクは、主に同期音声の伝送に用いられ、ACLリンクは、主にパケットデータの伝送に用いられる。
【0036】
図2からわかるように、図1に対応する実施例と比べて、本実施例における端末ブラケットには、ファーフィールド再生装置13とブルートゥースモジュール14とが追加される。これにより、本実施例に説明された端末ブラケットは、ファーフィールド集音機能だけではなく、ファーフィールド再生機能をサポートするため、端末ブラケットにファーフィールド音声対話機能をサポートさせ、端末ブラケットと端末との間にブルートゥースで通信可能な接続を確立でき、端末ブラケットと端末との間の対話手段を豊かにすることができる。
【0037】
本出願の実施例は、ファーフィールド音声対話システムを更に提供する。当該ファーフィールド音声対話システムには、端末と前記の各実施例に説明された端末ブラケットとが備えられても良い。なお、端末は端末ブラケットと通信可能に接続することができる。例示として、ファーフィールド音声対話システムは、図3に示すようになる。図3は、本出願により提供されたファーフィールド音声対話システムの一つの実施例の構成の模式図を示す。
【0038】
図3に示すように、ファーフィールド音声対話システムは端末2と端末ブラケット1とを備えても良い。端末2と端末ブラケット1とは通信可能に接続される。
【0039】
本実施例において、端末2と端末ブラケット1は、複数の手段で通信可能な接続を確立することができる。有線ネットワーク接続、無線ネットワーク接続及びブルートゥース接続などを含むが、それらに限定されない。
【0040】
本実施例において、端末ブラケット1から送信された音声情報を受信した後に、端末2は複数種の手段で音声情報に対応する制御情報を取得することができる。
【0041】
一つの例示として、端末2には制御装置と実行装置とが備えられても良い。なお、制御装置は、まず音声情報に対して解析処理を行って、音声情報に対応する制御情報を確定し、そして制御情報を実行装置へ送信することができる。実行装置は、制御情報に対応する処理を実行することができる。例えば、端末2は、サンプル音声情報セットとサンプル音声情報毎に対応するサンプル制御情報とをローカルに予め記憶することができる。具体的に、制御装置は音声情報をサンプル音声情報セットにおける各サンプル音声情報と逐一にマッチングすることができる。サンプル音声情報セットにおいて何れか一つのサンプル音声情報が音声情報と同一又は類似すれば、当該サンプル音声情報が音声情報にマッチしたと確定する。この場合に、制御装置は、ローカルで当該サンプル音声情報に対応するサンプル制御情報を、音声情報に対応する制御情報として検索して実行装置へ送信することにより、実行装置に制御情報に対応する処理を実行させることができる。ここで、実行装置は複数であっても良い。例えば、音声情報が「AA、映画名が《XX》である映画を再生する」であれば、制御情報が映画《XX》のビデオ情報であっても良く、実行装置が端末2のディスプレーとスピーカであっても良い。なお、ディスプレーは、映画《XX》のビデオ情報における画面情報を表示しても良く、スピーカは、映画《XX》のビデオ情報におけるオーディオ情報を再生しても良い。
【0042】
他の例示として、ファーフィールド音声対話システムは、クラウドサーバを更に備えても良い。クラウドサーバは、端末2と通信可能に接続される。なお、クラウドサーバは、端末2から送信された音声情報を受信し、音声情報に対して解析処理を行って音声情報に対応する制御情報を確定し、その後に制御情報が含まれている制御指令を端末へ送信して、端末の実行装置に制御情報に対応する処理を実行させることができる。例えば、クラウドサーバは、サンプル音声情報セットとサンプル音声情報毎に対応するサンプル制御情報とを予め記憶することができる。具体的に、クラウドサーバは、まず通信可能に接続されている端末2から音声情報を取得し、その後に音声情報をサンプル音声情報セットにおける各サンプル音声情報と逐一にマッチングすることができる。サンプル音声情報セットにおいて何れか一つのサンプル音声情報が音声情報と同一又は類似すれば、当該サンプル音声情報が音声情報にマッチしたと確定する。この場合に、クラウドサーバは、当該サンプル音声情報に対応するサンプル制御情報を、音声情報に対応する制御情報として検索し、通信可能に接続されている端末2へ送信して、端末2に制御情報に対応する処理を実行させることができる。
【0043】
本実施例の一部の任意の実施形態において、制御情報に音声再生情報が含まれている場合に、端末2は、音声再生情報を端末ブラケット1へ送信することができる。端末ブラケット1のファーフィールド再生装置13は、音声再生情報を再生することができる。これにより、ファーフィールド再生装置13により音声再生情報を再生することにより、音声再生情報が遠距離ユーザに良く受信可能である。例えば、制御情報が映画《XX》のビデオ情報であれば、端末2は映画《XX》のビデオ情報におけるオーディオ情報を端末ブラケット1へ送信することができる。端末2のディスプレーは、映画《XX》のビデオ情報における画面情報を表示し、同時に端末ブラケット2は、映画《XX》のビデオ情報におけるオーディオ情報を再生する。
【0044】
本実施例の一部の任意の実施形態において、端末2は、ニアフィールド集音装置とニアフィールド再生装置とを備えても良い。端末2と端末ブラケット1との間に通信リンクが確立された後に、端末2はニアフィールド集音装置とニアフィールド再生装置の動作状態をオフ状態へ切り替えることができる。
【0045】
本出願の実施例は、ファーフィールド音声対話システムの一つの応用シーンを更に提供する。図4は、本出願により提供されたファーフィールド音声対話システムの一つの応用シーンにおけるインタラクションフロー400を示す。まず、401に示すように、ユーザはファーフィールド音声対話システムにおける端末ブラケット1に対して音声情報として「AA、明君へ電話ください」を言い出すことができる。この場合に、402に示すように、端末ブラケット1のファーフィールド集音装置は、ユーザから送信された音声情報を受信し、音声情報を端末ブラケット1の音声解析装置へ送信することができる。その後に、403に示すように、音声解析装置は、音声情報を解析して、音声情報に所定のウェークアップワードとして「AA」が含まれていると確定する。この場合に、404に示すように、端末ブラケット1のブルートゥースモジュールは、端末2のブルートゥースモジュールへ通信リンク確立指令を送信して、端末2のブルートゥースモジュールと端末ブラケット1のブルートゥースモジュールとの間にブルートゥースSCOリンクを確立するようにトリガすることができる。その後に405に示すように、端末ブラケット2は、ブルートゥースSCOリンクにより音声情報を端末2へ送信することができる。この場合に406に示すように、端末2は音声情報をクラウドサーバへ送信することができる。その後に407に示すように、クラウドサーバは音声情報に対して解析処理を行い、処理結果に基づいて明君の電話番号と電話をかける指令とを端末2へ返信することができる。最後に408に示すように、端末2は明君の電話へかけ、受信された音声再生情報をブルートゥースSCOリンクで端末ブラケット1へ送信して、端末ブラケット1のファーフィールド再生装置に音声再生情報を再生させることができる。
【0046】
本出願の実施例は、ファーフィールド音声対話システムの他の応用シーンを更に提供する。図5は、本出願により提供されたファーフィールド音声対話システムの他の応用シーンにおけるインタラクションフロー500を示す。まず、501に示すように、ユーザは、ファーフィールド音声対話システムにおける端末ブラケット1に対して、音声情報として「AA、映画名が《XX》の映画を再生する」を言い出すことができる。この場合に502に示すように、端末ブラケット1のファーフィールド集音装置はユーザから送信された音声情報を受信し、音声情報を端末ブラケット1の音声解析装置へ送信することができる。その後に503に示すように、音声解析装置は、音声情報を解析して、音声情報に所定のウェークアップワードとして「AA」が含まれていると確定する。この場合に504に示すように、端末ブラケット1のブルートゥースモジュールは、端末2のブルートゥースモジュールへ通信リンク確立指令を送信して、端末2のブルートゥースモジュールと端末ブラケット1のブルートゥースモジュールとの間にブルートゥースSCOリンクを確立するようにトリガすることができる。その後に505に示すように、端末ブラケット2は、ブルートゥースSCOリンクにより音声情報を端末2へ送信することができる。この場合に506に示すように、端末2は、音声情報をクラウドサーバへ送信することができる。その後に507に示すように、クラウドサーバは、音声情報に対して解析処理を行い、処理結果に基づいて映画《XX》のビデオ情報と映画を再生する指令とを端末2へ返信することができる。最後に508に示すように、端末2はブルートゥースSCOリンクで映画《XX》のビデオ情報におけるオーディオ情報を端末ブラケット1へ送信することができる。端末2のディスプレーは、映画《XX》のビデオ情報における画面情報を表示し、同時に、端末ブラケット2のファーフィールド再生装置は、映画《XX》のビデオ情報におけるオーディオ情報を再生する。
【0047】
本出願の実施例により提出されたファーフィールド音声対話システムにおいて、端末ブラケットのファーフィールド集音装置により、ユーザから送信された音声情報を受信して音声情報を端末へ送信し、端末により音声情報に対応する制御情報を取得して制御情報に対応する処理を実行する。つまり、ファーフィールド音声対話システムは、ファーフィールド音声対話機能をサポートする端末ブラケットにより端末に対するファーフィールド音声制御を実現させることができる。
【0048】
以上の記載は、本発明の好適な実施形態及び運用される技術原理に対する説明にすぎない。本願発明の範囲は、前記技術的特徴による特定の組み合わせからなる発明に限定されることなく、前記発明の技術的思想から逸脱しない限り、前記技術的特徴又は均等の特徴による任意の組み合わせによって形成される他の発明も同様に含まれることは、当業者であれば明らかである。例えば、前記特徴と本願に開示された(それらに限定されない)類似の機能を具備する技術的特徴が互いに置換され得る発明も本願発明に含まれる。
図1
図2
図3
図4
図5