IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッドの特許一覧 ▶ シャンハイ シャオドゥ テクノロジー カンパニー リミテッドの特許一覧

特許7029613インターフェイススマートインタラクティブ制御方法、装置、システム及びプログラム
<>
  • 特許-インターフェイススマートインタラクティブ制御方法、装置、システム及びプログラム 図1
  • 特許-インターフェイススマートインタラクティブ制御方法、装置、システム及びプログラム 図2
  • 特許-インターフェイススマートインタラクティブ制御方法、装置、システム及びプログラム 図3
  • 特許-インターフェイススマートインタラクティブ制御方法、装置、システム及びプログラム 図4
  • 特許-インターフェイススマートインタラクティブ制御方法、装置、システム及びプログラム 図5
  • 特許-インターフェイススマートインタラクティブ制御方法、装置、システム及びプログラム 図6
  • 特許-インターフェイススマートインタラクティブ制御方法、装置、システム及びプログラム 図7
  • 特許-インターフェイススマートインタラクティブ制御方法、装置、システム及びプログラム 図8
  • 特許-インターフェイススマートインタラクティブ制御方法、装置、システム及びプログラム 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-02-24
(45)【発行日】2022-03-04
(54)【発明の名称】インターフェイススマートインタラクティブ制御方法、装置、システム及びプログラム
(51)【国際特許分類】
   G06F 3/16 20060101AFI20220225BHJP
   G06F 3/0481 20220101ALI20220225BHJP
   G10L 15/22 20060101ALI20220225BHJP
   G10L 15/00 20130101ALI20220225BHJP
【FI】
G06F3/16 630
G06F3/16 620
G06F3/16 650
G06F3/0481
G10L15/22 453
G10L15/00 200A
【請求項の数】 16
(21)【出願番号】P 2020142849
(22)【出願日】2020-08-26
(62)【分割の表示】P 2018158444の分割
【原出願日】2018-08-27
(65)【公開番号】P2021009701
(43)【公開日】2021-01-28
【審査請求日】2020-09-01
(31)【優先権主張番号】201710757704.7
(32)【優先日】2017-08-29
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】512015127
【氏名又は名称】バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド
(74)【代理人】
【識別番号】110000877
【氏名又は名称】龍華国際特許業務法人
(73)【特許権者】
【識別番号】521235408
【氏名又は名称】シャンハイ シャオドゥ テクノロジー カンパニー リミテッド
(72)【発明者】
【氏名】チェン、ガオフェイ
(72)【発明者】
【氏名】ジャン、シャンタオ
(72)【発明者】
【氏名】シュ、ベン
(72)【発明者】
【氏名】オウ、リンシン
(72)【発明者】
【氏名】ション、チン
【審査官】酒井 優一
(56)【参考文献】
【文献】米国特許出願公開第2013/0041666(US,A1)
【文献】特開2011-049705(JP,A)
【文献】特開2006-330576(JP,A)
【文献】国際公開第2008/114708(WO,A1)
【文献】特開2017-138650(JP,A)
【文献】特開2016-218881(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 3/16
G10L 15/22
G10L 15/00
G06F 3/0481
G06F 13/00
(57)【特許請求の範囲】
【請求項1】
インターフェイススマートインタラクティブ制御方法であって、
ユーザに入力された音声情報を受信し、音声識別の結果を取得することと、
前記音声識別の結果に関連するシーン要素を確定することであって、前記シーン要素は現在のインターフェイスに表示されていないカスタマイズされた行為を含む、ことと、
シーン要素毎に対応するエントリをそれぞれに生成し、前記音声識別の結果及び前記エントリをクラウドサーバに送信することであって、前記エントリには要素ラベル及び対応するカスタマイズされた操作行為情報をそれぞれに含むことと、
前記クラウドサーバにて受信したエントリから選択され返送された、前記音声識別の結果に最もマッチングするエントリを受信することと、
前記カスタマイズされた行為を実現させるように、前記最もマッチングするエントリに対応するインターフェイス操作を実行することと、を含み、
前記最もマッチングするエントリに対応するインターフェイス操作を実行することは、前記最もマッチングするエントリにおけるカスタマイズされた操作行為情報に基づいて、インターフェイス操作を実行することを含む
インターフェイススマートインタラクティブ制御方法。
【請求項2】
前記音声識別の結果を取得することは、
前記音声情報を前記クラウドサーバに送信することと、
前記クラウドサーバが前記音声情報を音声識別して返送した前記音声識別の結果を受信することと、を含む、請求項1に記載のインターフェイススマートインタラクティブ制御方法。
【請求項3】
インターフェイススマートインタラクティブ制御方法であって、
スマート設備からの音声識別の結果及びエントリを受信することであって、前記音声識別の結果は、前記スマート設備にて受信されたユーザの入力した音声情報を音声識別した結果であり、前記エントリは、前記スマート設備が前記音声識別の結果に関連するシーン要素を確定した後に、シーン要素毎にそれぞれに生成した対応のエントリであり、前記エントリには要素ラベル及び対応するカスタマイズされた操作行為情報をそれぞれに含み、前記シーン要素は現在のインターフェイスに表示されていないカスタマイズされた行為を含む、ことと、
前記カスタマイズされた行為を実現させるように、前記受信したエントリから前記音声識別の結果に最もマッチングするエントリを選択し、前記最もマッチングするエントリを前記スマート設備に返送して、前記最もマッチングするエントリに対応するインターフェイス操作を前記スマート設備に実行させることと、を含み、
前記受信したエントリから前記音声識別の結果に最もマッチングするエントリを選択することは、前記要素ラベルに基づいて、前記受信したエントリから前記音声識別の結果に最もマッチングするエントリを選択することを含む
インターフェイススマートインタラクティブ制御方法。
【請求項4】
前記スマート設備からの音声識別の結果及びエントリを受信する前に、さらに
スマート端末にて送信された前記音声情報を受信することと、
前記音声情報を音声識別して前記音声識別の結果を得て、前記スマート設備に返送することと、を含む、請求項に記載のインターフェイススマートインタラクティブ制御方法。
【請求項5】
前記要素ラベルに基づいて、前記受信したエントリから前記音声識別の結果に最もマッチングするエントリを選択することは、
エントリ毎に、前記エントリの要素ラベルと前記音声識別の結果との編集距離をそれぞれに計算することと、
最小値の編集距離に対応するエントリを前記最もマッチングするエントリとすることと、を含む、請求項に記載のインターフェイススマートインタラクティブ制御方法。
【請求項6】
前記エントリには、さらに、シーン要素が位置する行列位置を示すx値及びy値と、シーン要素の配列番号を示すindex値との中の1つ或いは全部をそれぞれに含み、
前記受信したエントリから前記音声識別の結果に最もマッチングするエントリを選択することは、
前記x値及びy値に基づいて、又は前記index値に基づいて、前記受信したエントリから前記音声識別の結果に最もマッチングするエントリを選択することを、含む、請求項に記載のインターフェイススマートインタラクティブ制御方法。
【請求項7】
スマート設備であって、第1の取得手段と、第1の制御手段と、第2の制御手段とを含み、
前記第1の取得手段は、ユーザに入力された音声情報を受信し、音声識別の結果を取得するために用いられ、
前記第1の制御手段は、前記音声識別の結果に関連する、現在のインターフェイスに表示されていないカスタマイズされた行為を含むシーン要素を確定し、シーン要素毎に対応するエントリをそれぞれに生成し、前記音声識別の結果及び前記エントリをクラウドサーバに送信し、前記クラウドサーバにて受信したエントリから選択され返送された、前記音声識別の結果に最もマッチングするエントリを受信するために用いられ、前記エントリには要素ラベル及び対応するカスタマイズされた操作行為情報をそれぞれに含み、
前記第2の制御手段は、前記カスタマイズされた行為を実現させるように、前記最もマッチングするエントリに対応するインターフェイス操作を実行するために用いられ
前記第2の制御手段は、前記最もマッチングするエントリ中のカスタマイズされた操作行為情報に基づいて、インターフェイス操作を実行する
スマート設備。
【請求項8】
前記第1の取得手段は、さらに、
前記音声情報を前記クラウドサーバに送信し、
前記クラウドサーバにて前記音声情報を音声識別して返送された前記音声識別の結果を受信するためにも用いられる、請求項に記載のスマート設備。
【請求項9】
クラウドサーバであって、第2の取得手段とマッチング手段とを含み、
前記第2の取得手段は、スマート設備からの音声識別の結果及びエントリを受信するために用いられ、前記音声識別の結果は、前記スマート設備にて受信したユーザの入力した音声情報を音声識別した結果であり、前記エントリは、前記スマート設備が前記音声識別の結果に関連するシーン要素を確定した後に、シーン要素毎にそれぞれに生成した対応のエントリであり、前記シーン要素は現在のインターフェイスに表示されていないカスタマイズされた行為を含み、前記エントリには、要素ラベル及び対応するカスタマイズされた操作行為情報をそれぞれに含み、
前記マッチング手段は、前記カスタマイズされた行為を実現させるように、受信したエントリから前記音声識別の結果に最もマッチングするエントリを選択し、前記最もマッチングするエントリを前記スマート設備に返送して、前記最もマッチングするエントリに対応するインターフェイス操作を前記スマート設備に実行させるために用いられ
前記マッチング手段は、前記要素ラベルに基づいて、前記受信したエントリから前記音声識別の結果に最もマッチングするエントリを選択する
クラウドサーバ。
【請求項10】
前記第2の取得手段は、さらに、
スマート設備からの音声識別の結果及びエントリを受信する前に、
スマート端末にて送信された前記音声情報を受信し、
前記音声情報を音声識別して、前記音声識別の結果を得て、前記スマート設備に返送するためにも用いられる、請求項に記載のクラウドサーバ。
【請求項11】
前記マッチング手段は、エントリ毎に、前記エントリの要素ラベルと前記音声識別の結果との編集距離をそれぞれに計算し、最小値の編集距離に対応するエントリを前記最もマッチングするエントリとする、請求項に記載のクラウドサーバ。
【請求項12】
インターフェイススマートインタラクティブ制御システムであって、
請求項7又は8に記載されたスマート設備と、請求項9~11の中のいずれか1項に記載されたクラウドサーバとを含む、インターフェイススマートインタラクティブ制御システム。
【請求項13】
メモリ、プロセッサ及び前記メモリに記憶し前記プロセッサに実行されるコンピュータプログラムを含むコンピュータ設備であって、
前記プロセッサが前記プログラムを実行する時、請求項1又は2に記載された方法を実現する、コンピュータ設備。
【請求項14】
プロセッサによって実行される時、請求項1又は2に記載された方法を実現する、コンピュータプログラム。
【請求項15】
メモリ、プロセッサ及び前記メモリに記憶し前記プロセッサに実行されるコンピュータプログラムを含むコンピュータ設備であって、
前記プロセッサが前記プログラムを実行する時、請求項3~6の中のいずれか1項に記載された方法を実現する、コンピュータ設備。
【請求項16】
プロセッサによって実行される時、請求項3~6の中のいずれか1項に記載された方法を実現する、コンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
技術の発展に従って、音声インタラクティブ機能を有すスマート設備がますます多くなって来る。
【0002】
ユーザはスマート設備に対して音声制御を行うことができ、例えばユーザは音声情報を発出し、スマート設備にある操作等を実行させるように要求することができる。
【0003】
スマート設備は、ユーザに入力された音声情報を受信した後に、それをクラウドサーバを送信し、クラウドサーバが音声識別して返送された命令又は捜索された資源を受信し、これに対応して、命令に対応する操作を実行する又は資源を示す。
【0004】
ところが、上記方式は、実際の応用において或る問題が存在する。例えば、音声制御は、普通、システムレベルに対する命令だけであり、クラウドサーバが返送可能な命令セットが固定であり、命令セットに存在していない命令に対応する操作を実行することができず、仮に現在のインターフェイスに1つの「収蔵」ボタンを表示し、ユーザが「収蔵」という音声情報を発出したが、クラウドサーバには該命令が記憶されていないので、対応する操作を実行することができず、これで分かるように、先行の音声制御方式には大きな制限がある。
【0005】
また、仮に現在のインターフェイスに10部の映画を表示し、映画毎の名称及再生アドレスを含んだが、クラウドサーバはこれらを知っておらず、この場合、ユーザがその中の或る映画を見たくて映画名称を話した後、クラウドサーバは、ユーザの見たいのがインターフェイスに表示された1部の映画であることを知らなく、映画名称を検索するだけで、返送した結果がユーザの見たいものではない可能性があり、例えば名称が同じ又は類似する他の映画である可能性があるので、音声制御の正確性を低下する。
【発明の概要】
【発明が解決しようとする課題】
【0006】
上記実情に鑑みて、本発明は、インターフェイススマートインタラクティブ制御方法、装置、システム及び記憶媒体を提供し、音声制御の自由度及び正確性を向上することができる。
【0007】
具体的な技術態様は、次のようである。
【0008】
インターフェイススマートインタラクティブ制御方法であって、ユーザに入力された音声情報を受信し、音声識別の結果を取得することと、上記音声識別の結果に関連するシーン要素を確定することと、シーン要素毎に対応するエントリをそれぞれに生成し、上記音声識別の結果及び上記エントリをクラウドサーバに送信することと、上記クラウドサーバにて受信したエントリから選択され返送された、上記音声識別の結果に最もマッチングするエントリを受信することと、上記最もマッチングするエントリに対応するインターフェイス操作を実行することと、を含む。
【0009】
本発明の1つの好ましい実施例によると、上記音声識別の結果を取得することは、上記音声情報を上記クラウドサーバに送信することと、上記クラウドサーバが上記音声情報を音声識別して返送した上記音声識別の結果を受信することと、を含む。
【0010】
本発明の1つの好ましい実施例によると、上記シーン要素毎に対応するエントリをそれぞれに生成することにおいて、上記エントリには、要素ラベル及び対応するカスタマイズされた操作行為情報をそれぞれに含み、上記最もマッチングするエントリに対応するインターフェイス操作を実行することは、上記最もマッチングするエントリにおけるカスタマイズされた操作行為情報に基づいて、インターフェイス操作を実行すること、を含む。
【0011】
インターフェイススマートインタラクティブ制御方法であって、スマート設備からの音声識別の結果及びエントリを受信することであって、上記音声識別の結果は、上記スマート設備にて受信されたユーザの入力した音声情報を音声識別した結果である、受信することと、上記エントリは、上記スマート設備が上記音声識別の結果に関連するシーン要素を確定した後に、シーン要素毎にそれぞれに生成した対応のエントリであり、上記受信したエントリから上記音声識別の結果に最もマッチングするエントリを選択し、上記最もマッチングするエントリを上記スマート設備に返送して、上記最もマッチングするエントリに対応するインターフェイス操作を上記スマート設備に実行させることと、を含む。
【0012】
本発明の1つの好ましい実施例によると、上記スマート設備からの音声識別の結果及びエントリを受信する前に、さらにスマート端末にて送信された上記音声情報を受信することと、上記音声情報を音声識別して上記音声識別の結果を得て、上記スマート設備に返送することと、を含む。
【0013】
本発明の1つの好ましい実施例によると、上記エントリには、要素ラベル及び対応するカスタマイズされた操作行為情報をそれぞれに含み、上記受信したエントリから上記音声識別の結果に最もマッチングするエントリを選択することは、上記要素ラベルに基づいて、上記受信したエントリから上記音声識別の結果に最もマッチングするエントリを選択すること、を含む。
【0014】
本発明の1つの好ましい実施例によると、上記要素ラベルに基づいて、上記受信したエントリから上記音声識別の結果に最もマッチングするエントリを選択することは、エントリ毎に、上記エントリの要素ラベルと上記音声識別の結果との編集距離をそれぞれに計算することと、最小値の編集距離に対応するエントリを上記最もマッチングするエントリとすることと、を含む。
【0015】
本発明の1つの好ましい実施例によると、上記エントリには、さらに、シーン要素が位置する行列位置を示すx値及びy値と、シーン要素の配列番号を示すindex値との中の1つ或いは全部をそれぞれに含み、上記受信したエントリから上記音声識別の結果に最もマッチングするエントリを選択することは、上記x値及びy値に基づいて、又は上記index値に基づいて、上記受信したエントリから上記音声識別の結果に最もマッチングするエントリを選択することを、含む。
【0016】
スマート設備であって、第1の取得手段と、第1の制御手段と、第2の制御手段とを含み、上記第1の取得手段は、ユーザに入力された音声情報を受信し、音声識別の結果を取得するために用いられ、上記第1の制御手段は、上記音声識別の結果に関連するシーン要素を確定し、シーン要素毎に対応するエントリをそれぞれに生成し、上記音声識別の結果及び上記エントリをクラウドサーバに送信し、上記クラウドサーバにて受信したエントリから選択され返送された、上記音声識別の結果に最もマッチングするエントリを受信するために用いられ、上記第2の制御手段は、上記最もマッチングするエントリに対応するインターフェイス操作を実行するために用いられる。
【0017】
本発明の1つの好ましい実施例によると、上記第1の取得手段は、さらに、上記音声情報を上記クラウドサーバに送信し、上記クラウドサーバにて上記音声情報を音声識別して返送された上記音声識別の結果を受信するためにも用いられる。
【0018】
本発明の1つの好ましい実施例によると、上記エントリには、要素ラベル及び対応するカスタマイズされた操作行為情報をそれぞれに含み、上記第2の制御手段は、上記最もマッチングするエントリ中のカスタマイズされた操作行為情報に基づいて、インターフェイス操作を実行する。
【0019】
クラウドサーバであって、第2の取得手段とマッチング手段とを含み、上記第2の取得手段は、スマート設備からの音声識別の結果及びエントリを受信するために用いられ、上記音声識別の結果は、上記スマート設備にて受信したユーザの入力した音声情報を音声識別した結果であり、上記エントリは、上記スマート設備が上記音声識別の結果に関連するシーン要素を確定した後に、シーン要素毎にそれぞれに生成した対応のエントリであり、上記マッチング手段は、受信したエントリから上記音声識別の結果に最もマッチングするエントリを選択し、上記最もマッチングするエントリを上記スマート設備に返送して、上記最もマッチングするエントリに対応するインターフェイス操作を上記スマート設備に実行させるために用いられる。
【0020】
本発明の1つの好ましい実施例によると、上記第2の取得手段は、さらに、スマート設備からの音声識別の結果及びエントリを受信する前に、スマート端末にて送信された上記音声情報を受信し、上記音声情報を音声識別して、上記音声識別の結果を得て、上記スマート設備に返送するためにも用いられる。
【0021】
本発明の1つの好ましい実施例によると、エントリには、要素ラベル及び対応するカスタマイズされた操作行為情報をそれぞれに含み、上記マッチング手段は、上記要素ラベルに基づいて、上記受信したエントリから上記音声識別の結果に最もマッチングするエントリを選択する。
【0022】
本発明の1つの好ましい実施例によると、上記マッチング手段は、エントリ毎に、上記エントリの要素ラベルと上記音声識別の結果との編集距離をそれぞれに計算し、最小値の編集距離に対応するエントリを上記最もマッチングするエントリとする。
【0023】
インターフェイススマートインタラクティブ制御システムであって、上記記載されたスマート設備と、上記記載されたクラウドサーバとを含む。
【0024】
メモリ、プロセッサ及び上記メモリに記憶し上記プロセッサに実行されるコンピュータプログラムを含むコンピュータ設備であって、上記プロセッサが上記プログラムを実行する時、上記記載された方法を実現する。
【0025】
コンピュータプログラムが記憶されているコンピュータ読取り可能な記憶媒体であって、上記プログラムがプロセッサによって実行される時、上記のような方法を実現する。
【0026】
上記説明から分かるように、本発明の上記技術案によれば、スマート設備は、ユーザに入力された音声情報を受信し、音声識別の結果を取得した後に、音声識別の結果に関連するシーン要素を確定し、シーン要素毎に対応するエントリをそれぞれに生成し、更に音声識別の結果及び生成されたエントリをクラウドサーバに送信し、その後、クラウドサーバにて受信したエントリから選択され返送された、音声識別の結果に最もマッチングするエントリを受信し、更に最もマッチングするエントリに対応するインターフェイス操作を実行することができる。先行技術に比べて、本発明に係る技術案によれば、ユーザに入力された音声情報に基づいてエントリを生成して選択し、更に選択されたエントリに基づいてインターフェイス操作を実行することができ、命令セット中の命令に限定されないので、音声制御の自由度を向上することができる。更に、本発明に係る技術案において、スマート設備にて送信された音声識別の結果に関連するシーン要素に対応するエントリから選別して、音声識別の結果に最もマッチングするエントリを取得するので、マッチング結果がより正しくなり、音声制御の正確性を向上することができる。
【図面の簡単な説明】
【0027】
図1】本発明に係るインターフェイススマートインタラクティブ制御方法の第1の実施例のフローチャートである。
図2】本発明に係るインターフェイススマートインタラクティブ制御方法の第2の実施例のフローチャートである。
図3】先行の音声識別過程を示す概要図である。
図4】本発明に係るインターフェイススマートインタラクティブ制御方法の第3の実施例のフローチャートである。
図5】本発明に係るスマート設備インターフェイスに出現するシーン要素を示す概要図である。
図6】本発明に係るスマート設備インターフェイスに表示する8部の映画を示す概要図である。
図7】本発明に係るスマート設備の実施例の構成図である。
図8】本発明に係るクラウドサーバの実施例の構成図である。
図9】本発明の実施形態を実現するために適応する例示的なコンピュータシステム/サーバ12のブロック図を示す。
【発明を実施するための形態】
【0028】
本発明の技術案をより明確で簡潔させるために、以下、図面を参照して実施例を挙げて、本発明に係る技術案を更に説明する。
【0029】
明らかに、記載された実施例は、本発明の実施例の一部だけであり、全ての実施例ではない。本発明における実施例に基づいて、当業者が創造的な労働をしないことを前提として獲得できる他の実施例は、いずれも本発明の保護範囲に属する。
【0030】
図1は、本発明に係るインターフェイススマートインタラクティブ制御方法の第1の実施例のフローチャートである。実際の応用において、図1に示すように、スマート設備をフローの実行本体とすることができる。図1に示すように、以下の具体的な実現方式を含む。
【0031】
101において、ユーザに入力された音声情報を受信し、音声識別の結果を取得する。
【0032】
ユーザに入力された音声情報を受信した後に、それをクラウドサーバに送信し、クラウドサーバにて受信した音声情報を音声識別して返送された音声識別の結果を取得することができる。
【0033】
102において、音声識別の結果に関連するシーン要素を確定する。
【0034】
本実施例において、ユーザがシーン要素に対して音声情報を発出する。
【0035】
シーン要素とは、ユーザがユーザインターフェイス(例えばスクリーン)を持っているスマート設備を使用する時、インターフェイスに表示されたインターフェイス要素及び或る行為等、例えばページターン等の操作である。インターフェイス要素には、ボタン、ラベル、ピクチャ、リスト等を含み、音声でこれらの要素に対する操作を実現することができ、ユーザに入力された音声に基づいて、スマート設備に、インターフェイスにおいて実行可能な操作、例えばあるピクチャに対するクリック、左スライド、右スライド等を実行させることができる。
【0036】
ユーザに入力された音声情報を音声識別した結果を取得した後に、先ず音声識別の結果に関連するシーン要素を確定する。
【0037】
どのように音声識別の結果に関連するシーン要素を確定するかは制限されなく、実際の必要に基づいて設定することができ、例えば予め設定された規則に基づいて確定することができる。
【0038】
例えば、インターフェイスに8部の映画を表示しており、映画がポスターの形式で表示されており、ユーザに入力された音声情報がその中の1部の映画の名称であれば、この8部の映画を関連するシーン要素とそれぞれにすることができる。
【0039】
また、関連するシーン要素が、現在のインターフェイスに表示されているものでもよく、現在のインターフェイスに表示されていないものでもよい。
【0040】
例えば、現在のインターフェイスがマスターインターフェイスであり、3個のシーン要素である映画、音楽及び応用がそれぞれに1つのサブインターフェイスに対応し、3個のシーン要素がカスタマイズされた行為であり、マスターインターフェイスに表示されておらず、ユーザに入力された音声情報が「映画を見る」であれば、映画、音楽及び応用を関連するシーン要素とそれぞれにすることができる。
【0041】
103において、シーン要素毎に、対応するエントリをそれぞれに生成し、音声識別の結果及び生成されたエントリをクラウドサーバに送信する。
【0042】
関連するシーン要素毎に、対応するエントリをそれぞれに生成する必要がある。
【0043】
エントリには、要素ラベル(label)及び対応するカスタマイズされた操作行為情報(url)等をそれぞれに含む。
【0044】
ただし、labelが、インターフェイスウィジェット上の要素ラベル、例えばインターフェイスにおける操作可能な要素ラベルであってもよく、カスタマイズされた操作ラベル等であってもよい。
【0045】
例えば、インターフェイスにおける操作可能な要素ラベルが、インターフェイスに表示された映画の名称等であり、カスタマイズされた操作ラベルが、ユーザにカスタマイズされた操作の名称等である。
【0046】
urlがカスタマイズされた操作行為情報であり、スマート設備端の行為を示し、ユーザにカスタマイズされた任意な文字であり、スマート設備がその意味を識別できればよい。
【0047】
104において、クラウドサーバにて返送された、受信したエントリから選択された音声識別の結果に最もマッチングするエントリを受信する。
【0048】
クラウドサーバは、音声識別の結果及び生成されたエントリを受信した後に、labelに基づいて、受信したエントリから音声識別の結果に最もマッチングするエントリを選択し、更に最もマッチングするエントリを返送することができる。
【0049】
例えば、クラウドサーバは、エントリ毎に、該エントリの要素ラベルと音声識別の結果との編集距離をそれぞれに計算し、更に最小値の編集距離に対応するエントリを最もマッチングするエントリとすることができる。
【0050】
105において、最もマッチングするエントリに対応するインターフェイス操作を実行する。
【0051】
最もマッチングするエントリを取得した後に、最もマッチングするエントリにおけるurlに基づいてインターフェイス操作を実行し、即ち最もマッチングするエントリにおけるurlに基づいて処理を行い、ユーザの制御操作を実現することができる。
【0052】
図2は、本発明に係るインターフェイススマートインタラクティブ制御方法の第2の実施例のフローチャートである。実際の応用において、図2に示すように、クラウドサーバをフローの実行本体とすることができる。図2に示すように、以下の具体的な実現方式を含む。
【0053】
201において、スマート設備からの音声識別の結果及びエントリを受信し、ただし、上記音声識別の結果は、ユーザに入力されスマート設備が受信した音声情報を音声識別して取得した結果であり、上記エントリは、スマート設備が音声識別の結果に関連するシーン要素を確定した後、シーン要素毎にそれぞれに生成した対応のエントリである。
【0054】
スマート設備は、ユーザに入力された音声情報を受信した後に、それをクラウドサーバに送信し、更にクラウドサーバは、受信した音声情報を音声識別して音声識別の結果を得て、音声識別の結果をスマート設備に返送する。
【0055】
図3は、先行の音声識別過程の概要図である。図3に示すように、オーディオデータを収集した後に、それに対して特徴抽出を行い、その後、抽出されたオーディオ特徴を特定のデコーダに入力してデコードを行うことで、音声識別の結果を得ることができる。デコーダにおけるデコードの過程において、音声学モデル、言葉モデルと発音辞書を使用することができる。音声学モデルの主な作用が、オーディオ特徴を音節に変換することであり、言葉モデルの主な作用が、音節をテキストに変換することであり、発音辞書は、音節からテキストへのマッピング表を提供するものである。
【0056】
ただし、オーディオデータの収集過程において、音の效果は、設備性能の差異、音源から設備までの距離、設備が単マイクを支持するか又はマイクアレイを支持するか等によって変化する。全体的に、録音設備の性能がよいほど、音源から設備までの距離が短いほど、単マイクでなく効率的なマイクアレイを採用すると、特徴がより完全でより認識しやすいオーディオデータを得ることができる。
【0057】
また、収集されたオーディオデータは、ある問題が存在して、直接に識別することができない可能性がある。例えば、ハンズフリー又は会議という応用シーンにおいて、スピーカの音がマイクに数回フィードバックされ、この場合、マイクに収集されたオーディオデータにおいて音声学回声が発生し、エコーキャンセル(AEC,Acoustic Echo Cancellation)とのアルゴリズムを使用してエコーをキャンセルする必要があり、また例えば、特定の環境(例えば走行の車両中)で収集されたオーディオデータには特定な噪音が含み、このとき、収集されたオーディオデータに対してノイズ低減(NS,Noise Suppression)処理を行い、即ちノイズ低減アルゴリズムを利用して環境噪音を消除する必要がある。
【0058】
202において、受信したエントリから音声識別の結果に最もマッチングするエントリを選択し、最もマッチングするエントリをスマート設備に返送して、最もマッチングするエントリに対応するインターフェイス操作をスマート設備に実行させる。
【0059】
上記記載されたように、エントリにはlabel及び対応するurl等をそれぞれに含むことができる。
【0060】
labelに基づいて、受信したエントリから音声識別の結果に最もマッチングするエントリを選択することができる。
【0061】
例えば、エントリ毎に、それぞれに該エントリのlabelと音声識別の結果との編集距離を計算し、更に最小値の編集距離に対応するエントリを最もマッチングするエントリとすることができる。
【0062】
好ましく、最小値の編集距離を取得した後に、最小値の編集距離と予め設定された閾値とを比較し、最小値の編集距離が閾値以下であれば、最小値の編集距離に対応するエントリを最もマッチングするエントリとすることもできる。
【0063】
実際の必要に基づいて上記閾値の具体的な値を設定することができ、最もマッチングするエントリを取得できなければ、NULLの結果をスマート設備に返送することができる。
【0064】
また、エントリには、更に、シーン要素が位置する行列位置を示すx値及びy値と、シーン要素の配列番号を示すindex値との中の1つ或いは全部をそれぞれに含むことができ、相応的に、x値及びy値、又はindex値に基づいて、受信したエントリから音声識別の結果に最もマッチングするエントリを選択することもできる。
【0065】
スマート設備は、非NULLのエントリを受信したら、受信したエントリに対応するインターフェイス操作を実行し、即ちエントリにおけるurlに基づいて処理を行って、ユーザの制御操作を実現することができる。
【0066】
上記説明に基づいて、図4は、本発明に係るインターフェイススマートインタラクティブ制御方法の第3の実施例のフローチャートである。図4に示すように、以下の具体的な実現方式を含む。
【0067】
401において、スマート設備は、ユーザに入力された音声情報を受信し、クラウドサーバに送信する。
【0068】
ユーザは、マイク近接場音声入力又はマイクアレイ遠方場音声入力等の方式によって、音声情報を入力することができる。
【0069】
402において、クラウドサーバは、受信された音声情報を音声識別して、音声識別の結果を得て、スマート設備に返送する。
【0070】
音声識別によって、音声情報を対応するテキスト情報に変換することができる。
【0071】
403において、スマート設備は、音声識別の結果に関連するシーン要素を確定する。
【0072】
一般、関連するシーン要素の個数は複数である。
【0073】
404において、スマート設備は、シーン要素毎に対応するエントリをそれぞれに生成し、音声識別の結果及び生成されたエントリをクラウドサーバに送信する。
【0074】
エントリにはlabel及びurl等をそれぞれに含む。
【0075】
405において、クラウドサーバは、受信したエントリから音声識別の結果に最もマッチングするエントリを選択し、最もマッチングするエントリをスマート設備に返送する。
【0076】
例えば、クラウドサーバは、エントリ毎に、該エントリのlabelと音声識別の結果との間の編集距離をそれぞれに計算し、更に最小値の編集距離に対応するエントリを最もマッチングするエントリとすることができる。
【0077】
406において、スマート設備は、最もマッチングするエントリに対応するインターフェイス操作を実行する。
【0078】
スマート設備は、受信したエントリにおけるurlに基づいて処理を行い、ユーザの制御操作を実現する。
【0079】
注意すべきことは、前述各方法の実施例に関して、説明を簡単させるために、それを一連の動作の組み合わせとして表現したが、本開示によれば、あるステップが他の順序でまたは同時に行うことができるので、当業者であれば、本開示は記述された動作の順序によって制限されないことを理解すべきことである。そして、明細書に記載された実施例はいずれも好ましい実施例であり、係る操作及びモジュールが、本発明にとっては必ずしも必要とは限らないことが、当業者であれば理解すべきである。
【0080】
上記実施例において、各実施例に関する説明にはいずれも自分の重点があり、ある実施例において詳述していない部分が、他の実施例にかかる説明を参照できる。
【0081】
以下、具体的な応用シーンによって、本発明に係る技術案を更に説明する。
1)シーン1
【0082】
仮に映画、音楽及び応用という3つのシーン要素があり、シーン要素毎が1つのサブインターフェイスにそれぞれに対応する。このような3つのシーン要素が、カスタマイズされた行為であり、インターフェイスに表示されていない。
【0083】
仮にユーザに入力された音声情報が「映画を見る」であり、スマート設備は、クラウドサーバに返送された音声識別の結果である「映画を見る」を受信した後に、クラウドサーバに3つのエントリを送信し、エントリには1つのlabel及び対応する1つのurlをそれぞれに含み、音声識別の結果をクラウドサーバに送信する。ただし、labelの内容は、それぞれが映画、音楽及び応用であり、urlの内容をカスタマイズすることができ、例えばGoToMovie、GoToMusic、GoToAppsと定義することができる。クラウドサーバは、音声識別の結果である「映画を見る」とエントリ毎におけるlabelとをマッチングして、最もマッチングするエントリを選択する。
【0084】
スマート設備がクラウドサーバに送信する内容は、次のようにすることができる(jsonデータフォーマットを例とする)。

"query":"映画を見る",
"items":[

"label":"映画",
"url":"GoToMovie"
},

"label":"音楽",
"url":"GoToMusic"
},

"label":"応用",
"url":"GoToApps"



クラウドサーバにスマート設備に返送される内容は、次のようにすることができる。

"label":"映画",
"url":"GoToMovie"
【0085】
スマート設備が上記urlを取得した後に、対応する操作だけを実行すればよく、対応するインターフェイスに遷移する。
【0086】
上記の3つのシーン要素は、図5に示すように、スマート設備インターフェイスに見えるシーン要素であってもよく、図5は、本発明に係るスマート設備インターフェイスに見えるシーン要素の概要図である。
【0087】
この場合、urlを、映画、音楽及び応用のインターフェイスにおけるidと定義することができ、スマート設備は最もマッチングするエントリにおけるurlを取得した後に、直接にこのidに対応するラベルを模擬的にクリックすればよい。
2)シーン2
【0088】
仮にスマート設備インターフェイスには8部の映画を表示し、図6に示すように、映画がポスターの形式で表示されており、図6は、本発明に係るスマート設備インターフェイスに表示する8部の映画の概要図である。
【0089】
ユーザは、音声でその中の1部の映画の名称を話すことができ、スマート設備は、クラウドサーバにて返送された音声識別の結果を受信した後に、クラウドサーバに8個のエントリを送信し、エントリには1つのlabel及び対応する1つのurlをそれぞれに含み、音声識別の結果をクラウドサーバに送信する。ただし、labelの内容はそれぞれが映画毎の名称であり、urlの内容は映画の再生アドレスである。クラウドサーバは、音声識別の結果とエントリそれぞれのlabelとをマッチングし、選択された最もマッチングするエントリをスマート設備に返送する。スマート設備は、受信したエントリにおけるurlに基づいて直接に映画を再生すればよく、新たに映画を捜索する必要がなく、より正確にユーザの再生意図を実現することができる。
【0090】
スマート設備がクラウドサーバに送信する内容は、次のようにすることができる。

"qeury":"映画1",
"items":[

"label":"映画1",
"url":"www.xxx.com/movie1"
},

"label":"映画2",
"url":"www.xxx.com/movie2"
},

"label":"映画3",
"url":"www.xxx.com/movie3"
},

"label":"映画4",
"url":"www.xxx.com/movie4"
},

"label":"映画5",
"url":"www.xxx.com/movie5"
},

"label":"映画6",
"url":"www.xxx.com/movie6"
},

"label":"映画7",
"url":"www.xxx.com/movie7"
},

"label":"映画8",
"url":"www.xxx.com/movie8"


【0091】
クラウドサーバにスマート設備に返送される内容は、次のようにすることができる。

"label":"映画1",
"url":"www.xxx.com/movie1"
【0092】
シーン1及びシーン2において、クラウドサーバは、最もマッチングするエントリを選択する時、エントリ毎に、該エントリのlabelと音声識別の結果との編集距離をそれぞれに計算し、更に最小値の編集距離に対応するエントリを最もマッチングするエントリとすることができる。
【0093】
具体的に、labelの文字と音声識別の結果の文字との編集距離、又は、labelのピンインと音声識別の結果のピンインとの編集距離を計算することができる。
【0094】
編集距離(Edit Distance)はLevenshtein距離とも呼ばれ、2つの文字列の間に、1つの文字列からもう1つの文字列に変換するために必要な最少の編集操作回数である。許可された編集操作には、1つの文字を他の1つの文字に置換することと、1つの文字を插入することと、1つの文字を削除することとを含む。一般的に、編集距離が小さいほど、2つの文字列の類似度が大きい。
【0095】
実際の応用において、エントリにはlabel及びurlの以外、更に他の内容、例えば、x値及びy値、index値等を含むことができ、相応的に、x値及びy値又はindex値等に基づいてマッチングしてもよく、例えばシーン3に示す。
3)シーン3
【0096】
仮にスマート設備インターフェイスに8部の映画を表示し、図6に示すように、映画はポスターの形式で表示されている。
【0097】
ユーザは音声で「2行目1番目」という内容を発出し、スマート設備は、クラウドサーバにて返送された音声識別の結果を受信した後に、クラウドサーバに8個のエントリを送信し、エントリにはlabel、対応するurl、x値及びy値、index値等をそれぞれに含み、音声識別の結果をクラウドサーバに送信する。ただし、labelの内容がそれぞれに映画毎の名称であり、urlには映画の再生アドレスを含み、x値及びy値が映画が位置する行列位置を示し、例えば、x値が行を示し、y値が列を示し、index値が映画の配列番号等を示す。クラウドサーバは、x値及びy値に基づいて最もマッチングするエントリを選択し、スマート設備に返送することができる。スマート設備は、受信したエントリにおけるurlに基づいて、直接に映画を再生すればよい。
【0098】
スマート設備がクラウドサーバに送信する内容は、次のようにすることができる。

"query": 2行目1番目,
"items":[

"label":"映画1",
"url":"www.xxx.com/movie1","x":1,"y":1,"index":1
},

"label":"映画2",
"url":"www.xxx.com/movie2","x":1,"y":2,"index":2
},

"label":"映画3",
"url":"www.xxx.com/movie3","x":1,"y":3,"index":3
},

"label":"映画4",
"url":"www.xxx.com/movie4","x":1,"y":4,"index":4
},

"label":"映画5",
"url":"www.xxx.com/movie5","x":2,"y":1,"index":5
},

"label":"映画6",
"url":"www.xxx.com/movie6","x":2,"y":2,"index":6
},

"label":"映画7",
"url":"www.xxx.com/movie7","x":2,"y":3,"index":7
},

"label":"映画8",
"url":"www.xxx.com/movie8","x":2,"y":4,"index":8


【0099】
クラウドサーバにスマート設備に返送される内容は、次のようにすることができる。

"label":"映画5",
"url":"www.xxx.com/movie5","x":2,"y":1,"index":5
【0100】
また、ユーザに入力された音声が「*番目」であれば、index値に基づいて対応するエントリを選択することができる。
【0101】
実際の応用において、システムはシーン2において説明された映画名称によってエントリをマッチングする方式しか支持しなければ、生成されたエントリにはlabel及びurlだけを含んで良く、シーン3において説明した「2行目1番目」及び「*番目」等によってエントリをマッチングする方式を同時に支持すれば、生成されたエントリにはx値とy値及びindex値等もさらに含む必要がある。
【0102】
要するに、上記各方法の実施例に係る技術案において、ユーザに入力された音声情報に基づいてエントリを生成して選択し、更に選択されたエントリに基づいてインターフェイス操作を実行することができ、命令セット中の命令に限定されないので、音声制御の自由度を向上することができる。更に、上記各方法の実施例に係る技術案において、スマート設備に送信された音声識別の結果に関連するシーン要素に対応するエントリから選別して、音声識別の結果に最もマッチングするエントリを取得するので、マッチング結果がより正しくなり、音声制御の正確性を向上することができる。
【0103】
以上は方法に関する実施例の説明であり、以下、装置の実施例によって本発明に係る技術案を更に説明する。
【0104】
図7は、本発明の上記のスマート設備の実施例の構成図である。図7に示すように、第1の取得手段701、第1の制御手段702及び第2の制御手段703を含む。
【0105】
第1の取得手段701は、ユーザに入力された音声情報を受信し、音声識別の結果を取得するために用いられる。
【0106】
第1の制御手段702は、音声識別の結果に関連するシーン要素を確定し、シーン要素毎に対応するエントリをそれぞれに生成し、音声識別の結果及びエントリをクラウドサーバに送信し、クラウドサーバにて受信したエントリから選択され返送された、音声識別の結果に最もマッチングするエントリを受信するために用いられる。
【0107】
第2の制御手段703は、最もマッチングするエントリに対応するインターフェイス操作を実行するために用いられる。
【0108】
第1の取得手段701は、ユーザに入力された音声情報を受信した後に、それをクラウドサーバに送信し、クラウドサーバにて受信した音声情報を音声識別して返送された音声識別の結果を取得することができる。
【0109】
その後に、第1の制御手段702は、音声識別の結果に関連するシーン要素を確定することができる。
【0110】
シーン要素とは、ユーザがユーザインターフェイス(例えばスクリーン)を持っているスマート設備を使用する時、インターフェイスに表示されたインターフェイス要素及び或る行為等、例えばページターン等の操作である。インターフェイス要素には、ボタン、ラベル、ピクチャ、リスト等を含み、音声でこれらの要素に対する操作を実現することができ、ユーザに入力された音声に基づいて、インターフェイスに実行可能な操作、例えばあるピクチャに対するクリック、左スライド、右スライド等をスマート設備に実行させることができる。
【0111】
どのように音声識別の結果に関連するシーン要素を確定するかは制限されなく、実際の必要に基づいて設定することができ、例えば予め設定された規則に基づいて確定することができる。
【0112】
第1の制御手段702は、シーン要素毎に対応するエントリをそれぞれに生成し、音声識別の結果及び生成されたエントリをクラウドサーバに送信する必要もある。
【0113】
エントリには、要素ラベル(label)及び対応するカスタマイズされた操作行為情報(url)等をそれぞれ含むことができる。
【0114】
クラウドサーバは、スマート設備からの音声識別の結果及び生成されたエントリを受信した後に、labelに基づいて、受信したエントリから音声識別の結果に最もマッチングするエントリを選択し、更に最もマッチングするエントリを返送することができる。
【0115】
これに対応して、第2の制御手段703は、最もマッチングするエントリにおけるurlに基づいて、インターフェイス操作を実行することができる。
【0116】
図8は、本発明に係るクラウドサーバの実施例の構成図である。図8に示すように、第2の取得手段801及びマッチング手段802を含む。
【0117】
第2の取得手段801は、スマート設備からの音声識別の結果及びエントリを受信するために用いられ、ただし、音声識別の結果は、スマート設備にて受信されたユーザの入力した音声情報を音声識別した結果であり、エントリは、スマート設備が音声識別の結果に関連するシーン要素を確定した後に、シーン要素毎にそれぞれに生成した対応のエントリである。
【0118】
マッチング手段802は、受信したエントリから音声識別の結果に最もマッチングするエントリを選択し、最もマッチングするエントリをスマート設備に返送するために用いられ、スマート設備に最もマッチングするエントリに対応するインターフェイス操作を実行させる。
【0119】
ただし、第2の取得手段801は、スマート設備からの音声識別の結果及びエントリを受信する前に、スマート端末が送信した音声情報を受信し、音声情報を音声識別して音声識別の結果を得て、スマート設備に返送することもできる。
【0120】
エントリにはlabel及び対応するurl等をそれぞれ含む。
【0121】
マッチング手段802は、labelに基づいて、受信したエントリから音声識別の結果に最もマッチングするエントリを選択することができる。
【0122】
例えば、マッチング手段802は、エントリ毎に、該エントリのlabelと音声識別の結果との編集距離をそれぞれに計算し、更に最小値の編集距離に対応するエントリを最もマッチングするエントリとすることができる。
【0123】
また、エントリには、さらに、シーン要素が位置する行列位置を示すx値及びy値と、シーン要素の配列番号を示すindex値との中の1つ或いは全部をぞれぞれに含むことができる。
【0124】
相応的に、マッチング手段802は、x値及びy値に基づいて、又はindex値に基づいて、受信したエントリから音声識別の結果に最もマッチングするエントリを選択することもできる。
【0125】
図7及び図8に示す装置の実施例の具体的な動作フローは、前述各方法の実施例における該当の説明を参照でき、その説明を省略する。
【0126】
また、実際の応用において、図8に示すように、サーバを更に2つのサーバに分割することができ、その中の1つが音声識別を実行することに用いられ、もう1つがマッチング等の操作を実行することに用いられ、具体的な実現方式は限定されない。
【0127】
また、本発明は、図7に示すような実施例におけるスマート設備及び図8に示すような実施例におけるクラウドサーバを含むインターフェイススマートインタラクティブ制御システムを同時に開示し、具体的な実現の説明を省略する。
【0128】
図9は、本発明の実施形態を実現することに適する、例示的なコンピュータシステム/サーバ12のブロック図を示す。図9に示したコンピュータシステム/サーバ12が1つの例だけであり、本発明の実施例の機能及び使用範囲を限制するためのものではない。
【0129】
図9に示すように、コンピュータシステム/サーバ12は、汎用演算設備の形態で表現される。コンピュータシステム/サーバ12の構成要素には、1つ又は複数のプロセッサ(処理手段)16と、メモリ28と、異なるシステム構成要素(メモリ28とプロセッサ16とを含む)を接続するためのバス18を含んでいるが、これに限定されない。
【0130】
バス18は、複数種類のバス構成の中の1つ又は複数の種類を示し、メモリバス又はメモリコントローラ、周辺バス、グラフィック加速ポート、プロセッサ又は複数種類のバス構成でのいずれかのバス構成を使用したローカルバスを含む。例えば、それらの架構には、工業標準架構(ISA)バス、マイクロチャンネル架構(MAC)バス、増強型ISAバス、ビデオ電子規格協会(VESA)ローカルバス及び周辺コンポーネント接続(PCI)バスを含んでいるが、これに限定されない。
【0131】
コンピュータシステム/サーバ12には、典型的には複数の種類のコンピュータシステムが読取り可能な媒体を含む。それらの媒体は、コンピュータシステム/サーバ12にアクセスされて使用可能な任意な媒体であり、揮発性の媒体と不揮発性の媒体や移動可能な媒体と移動不可な媒体を含む。
【0132】
メモリ28には、揮発性メモリ形式のコンピュータシステム読取り可能な媒体、例えばランダムアクセスメモリ(RAM)30及び/又はキャッシュメモリ32を含むことができる。コンピュータシステム/サーバ12には、更に他の移動可能/移動不可なコンピュータシステム記憶媒体や揮発性/不揮発性のコンピュータシステム記憶媒体を含むことができる。例として、記憶システム34は、移動不可能な不揮発性磁媒体を読み書くために用いられる(図9に示していないが、常に「ハードディスクドライブ」とも呼ばれる)。図9に示していないが、移動可能な不揮発性磁気ディスク(例えば「フレキシブルディスク」)に対して読み書きを行うための磁気ディスクドライブ、及び移動可能な不揮発性光ディスク(例えばCD-ROM、DVD-ROM又は他の光媒体)に対して読み書きを行うための光ディスクドライブを提供できる。このような場合に、ドライブは、ぞれぞれ1つ又は複数のデータ媒体インターフェースによってバス18に接続される。メモリ28には少なくとも1つのプログラム製品を含み、該プログラム製品には1組の(例えば少なくとも1つの)プログラムモジュールを含み、それらのプログラムモジュールは、本発明の各実施例の機能を実行するように配置される。
【0133】
1組の(少なくとも1つの)プログラムモジュール42を含むプログラム/実用ツール40は、例えばメモリ28に記憶され、このようなプログラムモジュール42には、オペレーティングシステム、1つの又は複数のアプリケーションプログラム、他のプログラムモジュール及びプログラムデータを含んでいるが、これに限定しておらず、それらの例示での1つ又はある組み合にはネットワーク環境の実現を含む可能性がある。プログラムモジュール42は、常に本発明に記載されている実施例における機能及び/又は方法を実行する。
【0134】
コンピュータシステム/サーバ12は、1つ又は複数の周辺設備14(例えば、キーボード、ポインティングデバイス、ディスプレイ24等)と通信を行ってもよく、ユーザと該コンピュータシステム/サーバ12とのインタラクティブを実現できる1つ又は複数の設備と通信を行ってもよく、及び/又は該コンピュータシステム/サーバ12と1つ又は複数の他の演算設備との通信を実現できる任意の設備(例えばネットワークカード、モデム等)と通信を行っても良い。このような通信は入力/出力(I/O)インターフェース22によって行うことができる。そして、コンピュータシステム/サーバ12は、ネットワークアダプタ20によって1つ又は複数のネットワーク(例えば、ローカルエリアネットワーク(LAN)、広域ネットワーク(WAN)及び/又は公衆回線網、例えばインターネット)と通信を行っても良い。図9に示すように、ネットワークアダプタ20は、バス18によってコンピュータシステム/サーバ12の他のモジュールと通信を行う。図に示していないが、コンピュータシステム/サーバ12と連携して他のハードウェア及び/又はソフトウェアモジュールを使用することができ、マイクロコード、設備ドライブ、冗長処理手段、外部磁気ディスクドライブアレイ、RAIDシステム、磁気テープドライブ及びデータバックアップストレジ等を含むが、これに限定されない。
【0135】
プロセッサ16は、メモリ28に記憶されているプログラムを実行することで、各々機能応用及びデータ処理を実行し、例えば図1図2又は図4に示す実施例における方法を実現し、即ち、ユーザに入力された音声情報を受信し、音声識別の結果を取得し、音声識別の結果に関連するシーン要素を確定し、シーン要素毎に対応するエントリをそれぞれに生成し、音声識別の結果及びエントリをクラウドサーバに送信し、クラウドサーバにて受信したエントリから選択され返送された、音声識別の結果に最もマッチングするエントリを受信し、最もマッチングするエントリに対応するインターフェイス操作を実行する。
【0136】
具体的な実現過程は、前述各実施例における該当の説明を参照でき、その説明を省略する。
【0137】
本発明には、コンピュータプログラムが記憶されているコンピューター読み取りな可能な記憶媒体を同時に開示し、該プログラムがプロセッサによって実行される時、図1図2又は図4に示す実施例における方法を実現する。
【0138】
1つ又は複数のコンピューター読み取りな可能な媒体の任意な組合を採用しても良い。コンピューター読み取りな可能な媒体は、コンピューター読み取りな可能な信号媒体又はコンピューター読み取りな可能な記憶媒体である。コンピューター読み取りな可能な記憶媒体は、例えば、電気、磁気、光、電磁気、赤外線、又は半導体のシステム、装置又はデバイス、或いは上記ものの任意な組合であるが、これに限定されない。コンピューターが読み取りな可能な記憶媒体の更なる具体的な例(網羅していないリスト)には、1つ又は複数のワイヤを具備する電気的な接続、携帯式コンピュータ磁気ディスク、ハードディクス、ランダムアクセスメモリ(RAM)、リードオンリーメモリ(ROM)、消去可能なプログラマブルリードオンリーメモリ(EPROM又はフラッシュ)、光ファイバー、携帯式コンパクト磁気ディスクリードオンリーメモリ(CD-ROM)、光メモリ部材、磁気メモリ部材、又は上記ものの任意で適当な組合を含む。本願において、コンピューターが読み取りな可能な記憶媒体は、プログラムを含む又は記憶する任意な有形媒体であってもよく、該プログラムは、命令実行システム、装置又はデバイスに使用される又はそれらと連携して使用されるができる。
【0139】
コンピューター読み取りな可能な信号媒体には、ベースバンドにおいて伝搬されるデータ信号或いはキャリアの一部として伝搬されるデータ信号を含み、それにコンピューターが読み取りな可能なプログラムコードが載っている。このような伝搬されるデータ信号について、複数種類の形態を採用でき、電磁気信号、光信号又はそれらの任意で適当な組合を含んでいるが、これに限定されない。コンピューター読み取りな可能な信号媒体は、コンピューター読み取りな可能な記憶媒体以外の任意なコンピューター読み取りな可能な媒体であってもよく、該コンピューター読み取りな可能な媒体は、命令実行システム、装置又はデバイスによって使用される又はそれと連携して使用されるプログラムを送信、伝搬又は転送できる。
【0140】
コンピューター読み取りな可能な媒体に記憶されたプログラムコードは、任意で適正な媒体によって転送されてもよく、無線、電線、光ケーブル、RF等、又は上記ものの任意で適当な組合が含されているが、これに限定されない。
【0141】
1つ又は複数の種類のプログラミング言語又はそれらの組合で、本発明の操作を実行するためのコンピュータプログラムコードを編集することができ、上記プログラミング言語には、オブジェクト向けのプログラミング言語、例えばJava(登録商標)、Smalltalk、C++が含まれ、通常のプロシージャ向けプログラミング言語、例えば「C」言語又は類似しているプログラミング言語も含まれる。プログラムコードは、完全的にユーザコンピュータに実行されてもよく、部分的にユーザコンピュータに実行されてもよく、1つの独立のソフトウェアパッケージとして実行されてもよく、部分的にユーザコンピュータに実行され且つ部分的に遠隔コンピュータに実行されてもよく、又は完全的に遠隔コンピュータ又はサーバに実行されてもよい。遠隔コンピュータに係る場合に、遠隔コンピュータは、ローカルエリアネットワーク(LAN)又は広域ネットワーク(WAN)を含む任意の種類のネットワークを介して、ユーザコンピュータ、又は、外部コンピュータに接続できる(例えば、インターネットサービス事業者を利用してインターネットを介して接続できる)。
【0142】
本発明に開示されたいくつの実施例で開示された装置および方法などが、他の手段によって実現できることを理解すべきだ。例えば、上述の装置に関する実施形態は例示だけであり、例えば、上記手段の区分がロジック機能上の区分だけであり、実際的に実現する時、他の区分方式であってもよい。
【0143】
上記の分離部品として説明された手段が、物理的に分離されてもよく、物理的に分離されなくてもよく、手段として表される部品が、物理手段でもよく、物理手段でなくてもよく、1つの箇所に位置してもよく、又は複数のネットワークセルに分布されても良い。実際の必要に基づいて、その中の部分又は全部を選択して、本実施例の態様の目的を実現できる。
【0144】
また、本発明の各実施例における各機能手段が、1つの処理手段に集積されてもよく、各手段が物理的に独立に存在してもよく、2つ又は2つ以上の手段が1つの手段に集積されても良い。上記集積された手段は、ハードウェアの形式で実現してもよく、ハードウェア+ソフトウェア機能手段の形式で実現しても良い。
【0145】
上記ソフトウェア機能手段の形式で実現する集積された手段は、1つのコンピューター読み取りな可能な記憶媒体に記憶されることができる。上記ソフトウェア機能手段は1つの記憶媒体に記憶されており、1台のコンピュータ設備(パソコン、サーバ、又はネットワーク設備等)又はプロセッサ(processor)に本発明の各実施例に記載された方法の一部の手順を実行させるための若干の命令を含む。前述の記憶媒体には、USBメモリ、リムーバブルハードディスク、リードオンリーメモリ(ROM,Read-Only Memory)、ランダムアクセスメモリ(RAM,Random Access Memory)、磁気ディスク又は光ディスク等の、プログラムコードを記憶できる媒体を含む。
【0146】
以上の説明は、本発明の好ましい例示だけであり、本発明を限定するものではなく、本発明の主旨及び原則の範囲で実行したいずれの修正、等価置換、改良なども、全部本発明の保護する範囲に属すべきである。
図1
図2
図3
図4
図5
図6
図7
図8
図9