IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッドの特許一覧 ▶ シャンハイ シャオドゥ テクノロジー カンパニー リミテッドの特許一覧

特許6990728音声スキルの起動方法、装置、デバイスおよび記憶媒体
<>
  • 特許-音声スキルの起動方法、装置、デバイスおよび記憶媒体 図1
  • 特許-音声スキルの起動方法、装置、デバイスおよび記憶媒体 図2
  • 特許-音声スキルの起動方法、装置、デバイスおよび記憶媒体 図3
  • 特許-音声スキルの起動方法、装置、デバイスおよび記憶媒体 図4
  • 特許-音声スキルの起動方法、装置、デバイスおよび記憶媒体 図5
  • 特許-音声スキルの起動方法、装置、デバイスおよび記憶媒体 図6
  • 特許-音声スキルの起動方法、装置、デバイスおよび記憶媒体 図7
  • 特許-音声スキルの起動方法、装置、デバイスおよび記憶媒体 図8
  • 特許-音声スキルの起動方法、装置、デバイスおよび記憶媒体 図9
  • 特許-音声スキルの起動方法、装置、デバイスおよび記憶媒体 図10
  • 特許-音声スキルの起動方法、装置、デバイスおよび記憶媒体 図11
  • 特許-音声スキルの起動方法、装置、デバイスおよび記憶媒体 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2021-12-08
(45)【発行日】2022-01-12
(54)【発明の名称】音声スキルの起動方法、装置、デバイスおよび記憶媒体
(51)【国際特許分類】
   G06F 3/16 20060101AFI20220104BHJP
   G10L 15/28 20130101ALI20220104BHJP
【FI】
G06F3/16 630
G06F3/16 650
G06F3/16 690
G10L15/28 500
【請求項の数】 16
(21)【出願番号】P 2020019065
(22)【出願日】2020-02-06
(65)【公開番号】P2021034002
(43)【公開日】2021-03-01
【審査請求日】2020-02-06
(31)【優先権主張番号】201910809147.8
(32)【優先日】2019-08-29
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】512015127
【氏名又は名称】バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド
(73)【特許権者】
【識別番号】521235408
【氏名又は名称】シャンハイ シャオドゥ テクノロジー カンパニー リミテッド
(74)【代理人】
【識別番号】110002952
【氏名又は名称】特許業務法人鷲田国際特許事務所
(72)【発明者】
【氏名】チュー グアンギャ
(72)【発明者】
【氏名】チョウ シャオ
【審査官】日比野 可奈子
(56)【参考文献】
【文献】特表2019-520661(JP,A)
【文献】特開平09-081632(JP,A)
【文献】特表2015-528140(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 3/16
G10L 15/28
(57)【特許請求の範囲】
【請求項1】
音声スキルの起動方法であって、前記起動方法は、少なくとも1つのサードパーティー音声スキルと内蔵の音声スキルを含み、現在、前記内蔵の音声スキルが設定された電子デバイスに応用され、前記起動方法は、
ユーザの現在の要求命令を受信するステップと、
前記現在の要求命令に応答し、マッピング関係に基づき、前記現在の要求命令がサードパーティー音声スキルに対応するエントリー要求命令に属するかどうかを判定するステップであって、前記マッピング関係は、予め構築されたサードパーティー音声スキルとエントリー要求命令とのマッピング関係であり、前記マッピング関係は、第1の履歴的要求命令の各サードパーティー音声スキルでのスキル関連特徴データに基づいて決定されるものであり、前記第1の履歴的要求命令は、前記内蔵の音声スキルに位置する、判定するステップと、
前記現在の要求命令がサードパーティー音声スキルに対応するエントリー要求命令に属すると判定した場合、前記内蔵の音声スキルを前記サードパーティー音声スキルに切り替えるステップと、を含む
ことを特徴とする音声スキルの起動方法。
【請求項2】
ユーザの現在の要求命令を受信する前に、さらに、
前記内蔵の音声スキルにおける第1の履歴的要求命令を取得するステップと、
前記第1の履歴的要求命令の各サードパーティー音声スキルでのスキル関連特徴データを決定するステップと、
前記スキル関連特徴データに基づき、前記第1の履歴的要求命令に対して選別を行うことで、各前記サードパーティー音声スキルに対応するエントリー要求命令を取得するステップと、
各前記サードパーティー音声スキルと対応するエントリー要求命令とのマッピング関係を構築するステップと、を含む
ことを特徴とする請求項1に記載の方法。
【請求項3】
前記スキル関連特徴データに基づき、前記第1の履歴的要求命令に対して選別を行うことで、各前記サードパーティー音声スキルに対応するエントリー要求命令を取得した後に、さらに、
各前記エントリー要求命令に対応するサードパーティー音声スキルが1つであるかどうかを判定するステップと、
あるエントリー要求命令に対応するサードパーティー音声スキルが複数である場合、当該エントリー要求命令が各対応するサードパーティー音声スキルで現れた頻度を決定するステップと、
現れる頻度の最も高いサードパーティー音声スキルを当該エントリー要求命令とマッピング関係のあるサードパーティー音声スキルとして決定するステップと、を含む
ことを特徴とする請求項2に記載の方法。
【請求項4】
前記第1の履歴的要求命令の各サードパーティー音声スキルでのスキル関連特徴データを決定するステップは、
前記第1の履歴的要求命令の各サードパーティー音声スキルでのスキル関連エントリー特徴データを決定するステップと、
前記第1の履歴的要求命令における第2の履歴的要求命令の各サードパーティー音声スキルでのスキル満足度データを決定するステップと、を含む
ことを特徴とする請求項2に記載の方法。
【請求項5】
前記スキル関連特徴データに基づき、前記第1の履歴的要求命令に対して選別を行うことで、各前記サードパーティー音声スキルに対応するエントリー要求命令を取得するステップは、
前記スキル関連エントリー特徴データに基づき、前記第1の履歴的要求命令に対して選別を行うことで、各前記サードパーティー音声スキルに対応する第2の履歴的要求命令を取得するステップと、
前記スキル満足度データに基づき、前記第2の履歴的要求命令に対して選別を行うことで、各前記サードパーティー音声スキルに対応するエントリー要求命令を取得するステップと、を含む
ことを特徴とする請求項4に記載の方法。
【請求項6】
前記スキル関連エントリー特徴データに基づき、前記第1の履歴的要求命令に対して選別を行うことで、各前記サードパーティー音声スキルに対応する第2の履歴的要求命令を取得するステップは、
前記第1の履歴的要求命令のスキル関連エントリー特徴データを各前記サードパーティー音声スキルに対応する収束するまでトレーニングされた分類モデルに入力することで、前記第1の履歴的要求命令を前記分類モデルによって分類し、各前記サードパーティー音声スキルに対応する第2の履歴的要求命令を取得するステップを含む
ことを特徴とする請求項5に記載の方法。
【請求項7】
前記第1の履歴的要求命令のスキル関連エントリー特徴データを各前記サードパーティー音声スキルに対応する収束するまでトレーニングされた分類モデルに入力する前に、さらに、
サードパーティー音声スキルに対応するエントリー要求命令とすることができるかどうかの識別子を持っている要求命令サンプルである各前記分類モデルのトレーニングサンプルを取得するステップと、
前記トレーニングサンプルのスキル関連エントリー特徴データを用いて、対応する分類モデルを収束するまでトレーニングすることで、各前記収束するまでトレーニングされた分類モデルを取得するステップと、を含む
ことを特徴とする請求項6に記載の方法。
【請求項8】
前記スキル関連エントリー特徴データは、エントリー行動特徴データ、スキル関連性特徴データ及びエントリー文法特徴データを含む
ことを特徴とする請求項4~請求項7のいずれか1項に記載の方法。
【請求項9】
前記スキル満足度データは、内容の満足度又はインタラクションの満足度を含み、前記第1の履歴的要求命令における第2の履歴的要求命令の各サードパーティー音声スキルでのスキル満足度データを決定するステップは、
各サードパーティー音声スキルのタイプがリソーススキルであるかどうかを判定するステップと、
あるサードパーティー音声スキルのタイプがリソーススキルである場合、第2の履歴的要求命令の当該サードパーティー音声スキルでの内容の満足度を決定するステップと、
あるサードパーティー音声スキルのタイプが非リソーススキルである場合、第2の履歴的要求命令の当該サードパーティー音声スキルでのインタラクションの満足度を決定するステップと、を含む
ことを特徴とする請求項5に記載の方法。
【請求項10】
第2の履歴的要求命令の当該サードパーティー音声スキルでの内容の満足度を決定するステップは、
前記第2の履歴的要求命令の当該サードパーティー音声スキルでの第1のリソース再生時間と前記内蔵の音声スキルでの第2のリソース再生時間とを取得するステップと、
前記第1のリソース再生時間と前記第2のリソース再生時間とに基づいて前記内容の満足度を決定するステップと、を含む
ことを特徴とする請求項9に記載の方法。
【請求項11】
第2の履歴的要求命令の当該サードパーティー音声スキルでのインタラクションの満足度を決定するステップは、
第2の履歴的要求命令が当該サードパーティー音声スキルで対応するマルチラウンド会話テキストを取得するステップと、
前記マルチラウンド会話テキストに基づき、前記第2の履歴的要求命令の当該サードパーティー音声スキルでのスキル応答の満足度とスキル応答の繰り返し率を決定するステップと、
前記スキル応答の満足度と前記スキル応答の繰り返し率に基づいて前記インタラクションの満足度を決定するステップと、を含む
ことを特徴とする請求項9に記載の方法。
【請求項12】
前記スキル満足度データに基づき、前記第2の履歴的要求命令に対して選別を行うことで、前記エントリー要求命令を取得するのは、
あるサードパーティー音声スキルのタイプがリソーススキルである場合、第2の履歴的要求命令の当該サードパーティー音声スキルでの内容の満足度に基づき、前記第2の履歴的要求命令に対して選別を行い、前記エントリー要求命令を取得することと、
あるサードパーティー音声スキルのタイプが非リソーススキルである場合、前記内蔵の音声スキルに前記第2の履歴的要求命令に対応するリソース再生記録がないと決定した後、第2の履歴的要求命令の当該サードパーティー音声スキルでのインタラクションの満足度に基づき、前記第2の履歴的要求命令に対して選別を行い、前記エントリー要求命令を取得することと、を含む
ことを特徴とする請求項11に記載の方法。
【請求項13】
音声スキルの起動装置であって、前記起動装置は、少なくとも1つのサードパーティー音声スキルと内蔵の音声スキルを含み、現在、前記内蔵の音声スキルが設定された電子デバイスに位置し、前記起動装置は、
ユーザの現在の要求命令を受信するための命令受信モジュールと、
前記現在の要求命令に応答し、マッピング関係に基づき、前記現在の要求命令がサードパーティー音声スキルに対応するエントリー要求命令に属するかどうかを判定するエントリー命令判定モジュールであって、前記マッピング関係は、予め構築されたサードパーティー音声スキルとエントリー要求命令とのマッピング関係であり、前記マッピング関係は、第1の履歴的要求命令の各サードパーティー音声スキルでのスキル関連特徴データに基づいて決定されるものであり、前記第1の履歴的要求命令は、前記内蔵の音声スキルに位置する、エントリー命令判定モジュールと、
前記現在の要求命令がサードパーティー音声スキルに対応するエントリー要求命令に属すると判定した場合、前記内蔵の音声スキルを前記サードパーティー音声スキルに切り替えるスキル切り替えモジュールと、を含む
ことを特徴とする音声スキルの起動装置。
【請求項14】
少なくとも1つのプロセッサ、及び
前記少なくとも1つのプロセッサに通信接続されるメモリを含み、
前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶され、前記命令が前記少なくとも1つのプロセッサによって実行されると、請求項1~12のいずれか1項に記載の方法を前記少なくとも1つのプロセッサが実施する
ことを特徴とする電子デバイス。
【請求項15】
コンピュータ命令を記憶した非一時的なコンピュータ可読記憶媒体であって、前記コンピュータ命令は、請求項1~12のいずれか1項に記載の方法をコンピュータに実行させることを特徴とする非一時的なコンピュータ可読記憶媒体。
【請求項16】
音声スキルの起動方法であって、前記起動方法は、少なくとも1つのサードパーティー音声スキルと内蔵の音声スキルを含む電子デバイスに応用され、前記起動方法は、
ユーザの現在の要求命令を取得するステップと、
マッピング関係に基づき、前記現在の要求命令がサードパーティー音声スキルに対応するエントリー要求命令に属するかどうかを判定するステップであって、前記マッピング関係は、予め構築されたサードパーティー音声スキルとエントリー要求命令とのマッピング関係であり、前記マッピング関係は、第1の履歴的要求命令の各サードパーティー音声スキルでのスキル関連特徴データに基づいて決定される、判定するステップと、
前記現在の要求命令がサードパーティー音声スキルに対応するエントリー要求命令に属すると判定した場合、前記サードパーティー音声スキルを起動するステップと、を含む
ことを特徴とする音声スキルの起動方法。
【発明の詳細な説明】
【技術分野】
【0001】
本願は、データ処理技術の分野に関し、特に人工知能技術に関する。
【背景技術】
【0002】
人工知能技術の成熟に伴って、インテリジェントな音声対話デバイス、例えば、スマートスピーカー、スマートテレビ、スマート冷蔵庫などが日々増えている。インテリジェントな音声対話デバイスの音声スキルを持続的に豊かにするために、内蔵(built-in)の音声スキルとサードパーティー音声スキルがインテリジェントな音声対話デバイスに同時に存在することができる。
【0003】
従来の技術において、あるサードパーティー音声スキルをインテリジェントな音声対話デバイスを通じて起動する必要がある場合、当該サードパーティー音声スキルを起動するには、いずれも明確な要求命令を必要とする。当該明確な要求命令は、例えば、「XX音楽を開く」であるとした場合、インテリジェントな音声対話デバイスが「XX音楽」を起動する。
【0004】
従来の技術において、サードパーティー音声スキルを起動する方法は、当該サードパーティー音声スキルを開くようなユーザからの命令がなければ、起動しない。サードパーティー音声スキルは、内蔵の音声スキルと公平に競争に参加することができなくなり、ユーザのためにユーザの要求を満足するような応答を提供することができない。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本願の実施例は、音声スキルの起動方法、装置、デバイスおよび記憶媒体を提供し、サードパーティー音声スキルは、内蔵の音声スキルと公平に競争に参加することができなくなり、ユーザのためにユーザの要求を満足するような応答を提供することができないという従来の技術における技術的課題を解決する。
【課題を解決するための手段】
【0006】
第1の態様では、本願の実施例は、音声スキルの起動方法を提供し、前記方法は、少なくとも1つのサードパーティー音声スキルと内蔵の音声スキルを含む電子デバイスに応用され、前記電子デバイスには、現在、前記内蔵の音声スキルが設定されており、前記方法は、ユーザの現在の要求命令を受信するステップと、前記現在の要求命令に応答し、マッピング関係に基づき、前記現在の要求命令がサードパーティー音声スキルに対応するエントリー要求命令に属するかどうかを判定し、前記マッピング関係は、予め構築されたサードパーティー音声スキルとエントリー要求命令とのマッピング関係であり、前記マッピング関係は、第1の履歴的要求命令の各サードパーティー音声スキルでのスキル関連特徴データに基づいて決定されるものであり、前記第1の履歴的要求命令は、前記内蔵の音声スキルに位置するステップと、前記現在の要求命令がサードパーティー音声スキルに対応するエントリー要求命令に属すると判定した場合、前記内蔵の音声スキルを前記サードパーティー音声スキルに切り替えるステップと、を含む。
【0007】
本願の実施例では、電子デバイスには現在内蔵の音声スキルが設定されており、現在の要求命令がサードパーティー音声スキルのエントリー要求命令に属するかどうかを判定することで、サードパーティー音声スキルが、現在の内蔵の音声スキルと公平に競争に参加させることができるようになる。且つ、サードパーティー音声スキルとマッピング関係のあるエントリー要求命令は、第1の履歴的要求命令の各サードパーティー音声スキルでのスキル関連特徴データに基づいて第1の履歴的要求命令に対して選別を行って得られたものであり、当該エントリー要求命令と当該サードパーティー音声スキルとの関連関係が、当該エントリー要求命令と当該内蔵の音声スキルとの関連関係より強いため、現在の要求命令があるサードパーティー音声スキルのエントリー要求命令であると判定し、当該サードパーティー音声スキルによる応答する場合、現在の内蔵の音声スキルによる応答と比べて、ユーザの要求をよりよく満足することができる。
【0008】
さらに、以上のような方法は、ユーザの現在の要求命令を受信する前に、さらに、前記内蔵の音声スキルにおける第1の履歴的要求命令を取得するステップと、前記第1の履歴的要求命令の各サードパーティー音声スキルでのスキル関連特徴データを決定するステップと、前記スキル関連特徴データに基づき、前記第1の履歴的要求命令に対して選別を行うことで、各前記サードパーティー音声スキルに対応するエントリー要求命令を取得するステップと、各前記サードパーティー音声スキルと対応するエントリー要求命令とのマッピング関係を構築するステップと、を含む。
【0009】
本願の実施例では、第1の履歴的要求命令の各サードパーティー音声スキルでのスキル関連特徴データは、当該第1の履歴的要求命令がエントリー要求命令として用いられる可能性があるかどうか、そして、第1の履歴的要求命令が、内蔵の音声スキルに比べて、各サードパーティー音声スキルとより強い関連関係を有するかどうかを反映する特徴データであるため、スキル関連特徴データに基づいて第1の履歴的要求命令に対して選別を行い、各サードパーティー音声スキルに対応するエントリー要求命令を決定することで、決定されたエントリー要求命令を、サードパーティー音声スキルのエントリー要求命令としてより適切にすることが可能になる。
【0010】
さらに、以上の方法は、前記スキル関連特徴データに基づき、前記第1の履歴的要求命令に対して選別を行うことで、各前記サードパーティー音声スキルに対応するエントリー要求命令を取得した後に、さらに、各前記エントリー要求命令に対応するサードパーティー音声スキルが1つであるかどうかを判定するステップと、あるエントリー要求命令に対応するサードパーティー音声スキルが複数である場合、当該エントリー要求命令が各対応するサードパーティー音声スキルで現れた頻度を決定するステップと、現れた頻度の最も高いサードパーティー音声スキルを当該エントリー要求命令とマッピング関係のあるサードパーティー音声スキルとして決定するステップと、を含む。
【0011】
本願の実施例では、エントリー要求命令が対応するサードパーティー音声スキルで現れた頻度に基づき、各エントリー要求命令とマッピング関係のあるサードパーティー音声スキルが1つのみと決定することで、現在の内蔵の音声スキルから最適なサードパーティー音声スキルに切り替えることができ、どのサードパーティー音声スキルに切り替えるかを決定することができないという問題を回避する。且つ、最適なサードパーティー音声スキルへの切り替えは、当該最適なサードパーティー音声スキルによって応答するから、ユーザの要求の満足度をさらに向上させる。
【0012】
さらに、以上のような方法は、前記第1の履歴的要求命令の各サードパーティー音声スキルでのスキル関連特徴データを決定するステップは、前記第1の履歴的要求命令の各サードパーティー音声スキルでのスキル関連エントリー特徴データを決定することと、前記第1の履歴的要求命令における第2の履歴的要求命令が各サードパーティー音声スキルでのスキル満足度データを決定することと、を含む。
【0013】
本願の実施例では、まず、第1の履歴的要求命令の各サードパーティー音声スキルでのスキル関連エントリー特徴データを決定し、次に、第1の履歴的要求命令における第2の履歴的要求命令の各サードパーティー音声スキルでのスキル満足度データを決定することで、第1の履歴的要求命令に対する選別のために、包括的な特徴根拠を提供することができ、選別された各サードパーティー音声スキルのエントリー要求命令がより正確であるようにする。
【0014】
さらに、以上のような方法は、前記スキル関連特徴データに基づき、前記第1の履歴的要求命令に対して選別を行うことで、各前記サードパーティー音声スキルに対応するエントリー要求命令を取得するステップは、前記スキル関連エントリー特徴データに基づき、前記第1の履歴的要求命令に対して選別を行うことで、各前記サードパーティー音声スキルに対応する第2の履歴的要求命令を取得することと、前記スキル満足度データに基づき、前記第2の履歴的要求命令に対して選別を行うことで、各前記サードパーティー音声スキルに対応するエントリー要求命令を取得することと、を含む。
【0015】
本願の実施例では、スキル関連エントリー特徴データに基づき、第1の履歴的要求命令に対して選別を行うことで、サードパーティー音声スキルのエントリー要求命令の特徴を持たざるを得ない第1の履歴的要求命令を取り除くことができる。スキル満足度データに基づき、第2の履歴的要求命令に対して2番目の選別を行うことで、サードパーティー音声スキルが満足できない第2の履歴的要求命令を取り除くことができ、選別された各サードパーティー音声スキルのエントリー要求命令がより正確であるようにする。
【0016】
さらに、以上のような方法は、前記スキル関連エントリー特徴データに基づき、前記第1の履歴的要求命令に対して選別を行うことで、各前記サードパーティー音声スキルに対応する第2の履歴的要求命令を取得するステップは、前記第1の履歴的要求命令のスキル関連エントリー特徴データを各前記サードパーティー音声スキルに対応する収束するまでトレーニングされた分類モデルに入力することで、前記第1の履歴的要求命令を前記分類モデルによって分類し、各前記サードパーティー音声スキルに対応する第2の履歴的要求命令を取得することを含む。
【0017】
本願の実施例では、各サードパーティー音声スキルには、対応する収束するまでトレーニングされた分類モデルがあり、当該収束するまでトレーニングされた分類モデルを用いて、第1の履歴的要求命令に対して選別を行って、第2の履歴的要求命令を取得することで、選別された第2の履歴的要求命令がサードパーティー音声スキルに対応するエントリー特徴をより満足するものにさせることができる。
【0018】
さらに、以上のような方法は、前記第1の履歴的要求命令のスキル関連エントリー特徴データを各前記サードパーティー音声スキルに対応する収束するまでトレーニングされた分類モデルに入力する前に、さらに、サードパーティー音声スキルに対応するエントリー要求命令とすることができるかどうかの識別子を持っている要求命令サンプルである各前記分類モデルのトレーニングサンプルを取得するステップと、前記トレーニングサンプルのスキル関連エントリー特徴データを用いて、収束するまで対応する分類モデルをトレーニングすることで、各前記収束するまでトレーニングされた分類モデルを取得するステップと、を含む。
【0019】
本願の実施例では、識別子情報の持つ要求命令サンプルを分類モデルのトレーニングサンプルとして用いることで、トレーニングされた分類モデルをテストサンプルにより適応させ、さらに、分類結果をより正確にすることができる。
【0020】
さらに、以上のような方法は、スキル関連エントリー特徴データは、エントリー行動特徴データ、スキル関連性特徴データ及びエントリー文法特徴データを含む。
【0021】
本願の実施例では、スキル関連エントリー特徴データは多種のタイプを含み、第1の履歴的要求命令のスキル関連エントリー特徴をより統合的に抽出することができる。
【0022】
さらに、以上のような方法は、前記スキル満足度データは、内容の満足度又はインタラクションの満足度を含み、前記第1の履歴的要求命令における第2の履歴的要求命令の各サードパーティー音声スキルでのスキル満足度データを決定するステップは、各サードパーティー音声スキルのタイプがリソーススキルであるかどうかを判定することと、あるサードパーティー音声スキルのタイプがリソーススキルである場合、第2の履歴的要求命令の当該サードパーティー音声スキルでの内容の満足度を決定することと、あるサードパーティー音声スキルのタイプが非リソーススキルである場合、第2の履歴的要求命令の当該サードパーティー音声スキルでのインタラクションの満足度を決定することと、を含む。
【0023】
本願の実施例では、サードパーティー音声スキルのタイプに基づいて対応するスキル満足度データを決定することは、後続の第2の履歴的要求命令に対する選別のために、正確な根拠を提供することができる。
【0024】
さらに、以上のような方法は、第2の履歴的要求命令の当該サードパーティー音声スキルでの内容の満足度を決定するステップは、前記第2の履歴的要求命令の当該サードパーティー音声スキルでの第1のリソース再生時間と前記内蔵の音声スキルでの第2のリソース再生時間を取得することと、前記第1のリソース再生時間と前記第2のリソース再生時間に基づいて前記内容の満足度を決定することと、を含む。
【0025】
本願の実施例では、リソース再生時間は、リソース音声スキルがユーザの要求を満足するかどうかを測定するための重要な指標であるため、サードパーティー音声スキルのリソース再生時間と内蔵の音声スキルのリソース再生時間に基づいて第2の履歴的要求命令のサードパーティー音声スキルでの内容の満足度を決定することで、決定された内容の満足度をより正確にする。
【0026】
さらに、以上のような方法は、第2の履歴的要求命令の当該サードパーティー音声スキルでのインタラクションの満足度を決定するステップが、第2の履歴的要求命令が当該サードパーティー音声スキルで対応するマルチラウンド会話テキストを取得することと、前記マルチラウンド会話テキストに基づき、前記第2の履歴的要求命令の当該サードパーティー音声スキルでのスキル応答の満足度とスキル応答の繰り返し率を決定することと、前記スキル応答の満足度と前記スキル応答の繰り返し率に基づいて前記インタラクションの満足度を決定することと、を含む。
【0027】
本願の実施例では、スキル応答の満足度とスキル応答の繰り返し率は、インタラクション音声スキルがユーザの要求を満足するかどうかを測定するための重要な指標であるため、第2の履歴的要求命令の当該サードパーティー音声スキルでのスキル応答の満足度とスキル応答の繰り返し率を用いて、インタラクションの満足度を決定することで、決定されたインタラクションの満足度をより正確にすることができる。
【0028】
さらに、以上のような方法は、前記スキル満足度データに基づき、前記第2の履歴的要求命令に対して選別を行うことで、前記エントリー要求命令を取得するステップは、あるサードパーティー音声スキルのタイプがリソーススキルである場合、第2の履歴的要求命令の当該サードパーティー音声スキルでの内容の満足度に基づき、前記第2の履歴的要求命令に対して選別を行い、前記エントリー要求命令を取得することと、あるサードパーティー音声スキルのタイプが非リソーススキルである場合、前記内蔵の音声スキルに前記第2の履歴的要求命令に対応するリソース再生記録がないと決定した後、第2の履歴的要求命令の当該サードパーティー音声スキルでのインタラクションの満足度に基づき、前記第2の履歴的要求命令に対して選別を行い、前記エントリー要求命令を取得することと、を含む。
【0029】
本願の実施例では、サードパーティー音声スキルのタイプに基づき、第2の履歴的要求命令に対して選別を行うための特徴根拠を別々に決定することで、選別されたエントリー要求命令に基づいてサードパーティー音声スキルを起動させた後、効果的な内容満足又はインタラクション満足を達成し、ユーザが音声スキル応答に対する満足度を向上させることができる。
【0030】
第2の態様では、本願の実施例は、音声スキルの起動装置を提供し、前記装置は少なくとも1つのサードパーティー音声スキルと内蔵の音声スキルを含む電子デバイスに位置し、前記電子デバイスには、現在、前記内蔵の音声スキルが設定されており、前記装置は、ユーザの現在の要求命令を受信するための命令受信モジュールと、前記現在の要求命令に応答することに用いられ、マッピング関係に基づき、前記現在の要求命令がサードパーティー音声スキルに対応するエントリー要求命令に属するかどうかを判定し、前記マッピング関係は、予め構築されたサードパーティー音声スキルとエントリー要求命令とのマッピング関係であり、前記マッピング関係は、第1の履歴的要求命令の各サードパーティー音声スキルでのスキル関連特徴データに基づいて決定されるものであり、前記第1の履歴的要求命令は、前記内蔵の音声スキルに位置する、エントリー命令判定モジュールと、前記現在の要求命令がサードパーティー音声スキルに対応するエントリー要求命令に属すると判定した場合、前記内蔵の音声スキルを前記サードパーティー音声スキルに切り替えるためのスキル切り替えモジュールと、を含む。
【0031】
さらに、以上のような装置はさらに、内蔵の音声スキルにおける第1の履歴的要求命令を取得するための命令取得モジュールと、第1の履歴的要求命令の各サードパーティー音声スキルでのスキル関連特徴データを決定するための特徴データ決定モジュールと、スキル関連特徴データに基づき、第1の履歴的要求命令に対して選別を行うことで、各サードパーティー音声スキルに対応するエントリー要求命令を取得するための命令選別モジュールと、各サードパーティー音声スキルと対応するエントリー要求命令とのマッピング関係を構築するためのマッピング関係構築モジュールと、を含む。
【0032】
さらに、以上の装置はさらに、各エントリー要求命令に対応するサードパーティー音声スキルが1つであるかどうかを判定し、あるエントリー要求命令に対応するサードパーティー音声スキルが複数である場合、当該エントリー要求命令が各対応するサードパーティー音声スキルで現れた頻度を決定し、現れた頻度の最も高いサードパーティー音声スキルを当該エントリー要求命令とマッピング関係のあるサードパーティー音声スキルとして決定するためのマッピングスキル決定モジュールを含む。
【0033】
さらに、上記装置では、特徴データ決定モジュールは、第1の履歴的要求命令の各サードパーティー音声スキルでのスキル関連エントリー特徴データを決定し、且つ第1の履歴的要求命令における第2の履歴的要求命令の各サードパーティー音声スキルでのスキル満足度データを決定することに用いられる。
【0034】
さらに、上記装置では、命令選別モジュールは、スキル関連エントリー特徴データに基づき、第1の履歴的要求命令に対して選別を行うことで、各サードパーティー音声スキルに対応する第2の履歴的要求命令を取得すること、及びスキル満足度データに基づき、第2の履歴的要求命令に対して選別を行うことで、各サードパーティー音声スキルに対応するエントリー要求命令を取得することに用いられる。
【0035】
さらに、上記装置では、命令選別モジュールは、スキル関連エントリー特徴データに基づき、第1の履歴的要求命令に対して選別を行うことで、各サードパーティー音声スキルに対応する第2の履歴的要求命令を取得するとき、第1の履歴的要求命令のスキル関連エントリー特徴データを各サードパーティー音声スキルに対応する収束するまでトレーニングされた分類モデルに入力することで、第1の履歴的要求命令を分類モデルによって分類し、各サードパーティー音声スキルに対応する第2の履歴的要求命令を取得することに用いられる。
【0036】
さらに、上記装置では、命令選別モジュールは、第1の履歴的要求命令のスキル関連エントリー特徴データを各サードパーティー音声スキルに対応する収束するまでトレーニングされた分類モデルに入力する前に、さらに、サードパーティー音声スキルに対応するエントリー要求命令とすることができるかどうかの識別子を持っている要求命令サンプルである各分類モデルのトレーニングサンプルを取得すること、及びトレーニングサンプルのスキル関連エントリー特徴データを用いて、対応する分類モデルを収束するまでトレーニングすることで、各収束するまでトレーニングされた分類モデルを取得することに用いられる。
【0037】
スキル関連エントリー特徴データは、エントリー行動特徴データ、スキル関連性特徴データ及びエントリー文法特徴データを含む。
【0038】
さらに、上記装置では、スキル満足度データは、内容の満足度又はインタラクションの満足度を含み、特徴データ決定モジュールは、第1の履歴的要求命令における第2の履歴的要求命令の各サードパーティー音声スキルでのスキル満足度データを決定するとき、各サードパーティー音声スキルのタイプがリソーススキルであるかどうかを判定し、あるサードパーティー音声スキルのタイプがリソーススキルである場合、第2の履歴的要求命令の当該サードパーティー音声スキルでの内容の満足度を決定し、あるサードパーティー音声スキルのタイプが非リソーススキルである場合、第2の履歴的要求命令の当該サードパーティー音声スキルでのインタラクションの満足度を決定することに用いられる。
【0039】
さらに、上記装置では、特徴データ決定モジュールは、第2の履歴的要求命令の当該サードパーティー音声スキルでの内容の満足度を決定するとき、第2の履歴的要求命令の当該サードパーティー音声スキルでの第1のリソース再生時間と前記内蔵の音声スキルでの第2のリソース再生時間を取得すること、及び第1のリソース再生時間と第2のリソース再生時間に基づいて内容の満足度を決定することに用いられる。
【0040】
さらに、上記装置では、特徴データ決定モジュールは、第2の履歴的要求命令の当該サードパーティー音声スキルでのインタラクションの満足度を決定するとき、第2の履歴的要求命令が当該サードパーティー音声スキルで対応するマルチラウンド会話テキストを取得すること、マルチラウンド会話テキストに基づき、第2の履歴的要求命令の当該サードパーティー音声スキルでのスキル応答の満足度とスキル応答の繰り返し率を決定すること、及びスキル応答の満足度とスキル応答の繰り返し率に基づいてインタラクションの満足度を決定することに用いられる。
【0041】
さらに、上記装置では、命令選別モジュールは、スキル満足度データに基づき、第2の履歴的要求命令に対して選別を行うことで、エントリー要求命令を取得するとき、あるサードパーティー音声スキルのタイプがリソーススキルである場合、第2の履歴的要求命令の当該サードパーティー音声スキルでの内容の満足度に基づき、第2の履歴的要求命令に対して選別を行い、エントリー要求命令を取得すること、及びあるサードパーティー音声スキルのタイプが非リソーススキルである場合、内蔵の音声スキルに第2の履歴的要求命令に対応するリソース再生記録がないと決定した後、第2の履歴的要求命令の当該サードパーティー音声スキルでのインタラクションの満足度に基づき、第2の履歴的要求命令に対して選別を行い、エントリー要求命令を取得することに用いられる。
【0042】
第3の態様では、本願の実施例は、少なくとも1つのプロセッサ、及び前記少なくとも1つのプロセッサに通信接続されるメモリを含む電子デバイスを提供し、前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶され、前記命令が、前記少なくとも1つのプロセッサによって実行され、前記少なくとも1つのプロセッサに第1の態様のいずれか1項に記載の方法を実行する。
【0043】
第4の態様では、本願の実施例は、コンピュータ命令を記憶している非一時的なコンピュータ可読記憶媒体を提供し、前記コンピュータ命令は、前記コンピュータに第1の態様のいずれか1項に記載の方法を実行させるためのものである。
【0044】
第5の態様では、本願、音声スキルの起動方法を提供し、前記方法は、少なくとも1つのサードパーティー音声スキルと内蔵の音声スキルを含む電子デバイスに応用され、前記方法は、ユーザの現在の要求命令を取得するステップと、マッピング関係に基づき、前記現在の要求命令がサードパーティー音声スキルに対応するエントリー要求命令に属するかどうかを判定し、前記マッピング関係は、予め構築されたサードパーティー音声スキルとエントリー要求命令とのマッピング関係であり、前記マッピング関係は、第1の履歴的要求命令と各サードパーティー音声スキルでのスキル関連特徴データに基づいて決定されるものであるステップと、前記現在の要求命令がサードパーティー音声スキルに対応するエントリー要求命令に属すると判定した場合、前記サードパーティー音声スキルを起動するステップと、を含む。
【図面の簡単な説明】
【0045】
図面は本解決手段をより理解するためのものであり、本願を限定するように構成されない。
図1】本願の実施例の音声スキルの起動方法を実現可能な第1の場面図である。
図2】本願の実施例の音声スキルの起動方法を実現可能な第2の場面図である。
図3】本願の第1の実施例による音声スキルの起動方法の概略フローチャートである。
図4】本願の第2の実施例による音声スキルの起動方法の概略フローチャートである。
図5】本願の第2の実施例による音声スキルの起動方法におけるステップ203の概略フローチャートである。
図6】本願の第2の実施例による音声スキルの起動方法におけるステップ204の概略フローチャートである。
図7】本願の第2の実施例による音声スキルの起動方法におけるステップ2042の概略フローチャートである。
図8】本願の第2の実施例による音声スキルの起動方法におけるステップ2043の概略フローチャートである。
図9】本願の第2の実施例による音声スキルの起動方法におけるステップ205の概略フローチャートである。
図10】本願の第3の実施例による音声スキルの起動装置の構造模式図である。
図11】本願の第4の実施例による音声スキルの起動装置の構造模式図である。
図12】本願の実施例の音声スキルの起動方法を実現するための電子デバイスのブロック図である。
【発明を実施するための形態】
【0046】
以下、図面を参照しながら、本願の例示的な実施例について説明し、理解することに役立つために、本願の実施例の様々な詳細が含まれるが、それらが例示的なものにすぎないと理解すべきである。したがって、当業者であれば、本文に記載の実施例に対して行われる様々な変化や修正は可能であり、本願の保護範囲と主旨を逸脱しない。同様に、明瞭且つ簡潔にするために、以下の記述では、公知機能と構造についての説明が省略される。
【0047】
本願の技術的解決手段を明瞭に理解するために、以下、本願に係るデバイスと用語を解釈する。
【0048】
インテリジェントな音声対話デバイスは、音声によって人間とコンピュータの対話を実現するスマートデバイス、例えば、スマートボイスホームデバイス、端末デバイス等である。スマートボイスホームデバイスは、スマートスピーカー、スマートテレビ、スマート冷蔵庫等であってもよく、端末デバイスは、スマートフォン、車載端末、ウェアラブルデバイス等であってよい。インテリジェントな音声対話デバイスは、ユーザからの音声要求命令を識別し、対応する応答を実行することができる。
【0049】
内蔵の音声スキルは、スマートスピーカーが備えている音楽再生スキル、録音スキル等、スマートテレビが備えているライブテレビ放送スキル、プレイバックスキル等、インテリジェントな音声対話デバイス自体の音声スキルである。
【0050】
サードパーティー音声スキルは、スキルプラットフォームをインテリジェントな音声対話デバイスによってサードパーティーの開発者に開放することで、開発者がプラットフォームに簡易且つ効率的に開発した各種の音声スキルである。サードパーティー音声スキルは、インテリジェントな音声対話デバイスにインストールして、ユーザの要求に応答することができる。例えば、スマートスピーカーにインストールされる百科事典検索の音声スキル、ゲーム音声スキルなどである。
【0051】
電子デバイスがインテリジェントな音声対話デバイスである場合を例として、本願の実施例による音声スキルの起動方法のアプリケーションシナリオについて紹介する。図1に示すように、当該アプリケーションシナリオにおいて、インテリジェントな音声対話デバイスには、少なくとも1つの内蔵の音声スキルと少なくとも1つのサードパーティー音声スキルが含まれている。インテリジェントな音声対話デバイスは現在、待機状態、即ち、いずれか1つの音声スキルを起動しない状態にある。ユーザの要求を最大限に満足することができる音声スキルにより起動して、且つユーザの要求に応答するために、ユーザは、ある音声スキルを開くような明確なエントリー要求命令を使用せずに、応答を取得したい命令を直接に提示する。例えば、言い出したエントリー要求命令は、「Aちゃん、Aちゃん、今日の天気を確認してください」である。本願では、サードパーティー音声スキルが、内蔵の音声スキルと公平に競争に参加することができるようにするために、サードパーティー音声スキルとエントリー要求命令とのマッピング関係を予め設定しており、内蔵の音声スキルとエントリー要求命令とのマッピング関係を予め設定してもよい。現在の要求命令を取得した後、現在の要求命令があるサードパーティー音声スキルに対応するエントリー要求命令に属するかどうかを判定し、また、現在の要求命令がある内蔵の音声スキルに対応するエントリー要求命令に属するかどうかを判定することもできる。現在の要求命令があるサードパーティー音声スキルに対応するエントリー要求命令に属すると判定する場合、当該サードパーティー音声スキルを起動させ、現在の要求命令がある内蔵の音声スキルに対応するエントリー要求命令に属すると判定する場合、当該内蔵の音声スキルを起動させる。サードパーティー音声スキルとエントリー要求命令とのマッピング関係は、第1の履歴的要求命令の各サードパーティー音声スキルでのスキル関連特徴データに基づいて決定されるものであるので、第1の履歴的要求命令は、内蔵の音声スキルに位置する要求命令であり、即ち、サードパーティー音声スキルのエントリー要求命令は、内蔵の音声スキルの第1の履歴的要求命令から選別を行って得られたものであり、選別の原則は、当該第1の履歴的要求命令がエントリー要求命令として用いられる可能性があるかどうか、そして、第1の履歴的要求命令が、内蔵の音声スキルに比べて、各サードパーティー音声スキルとより強い関連関係を有するかどうかである。この選別原則は、第1の履歴的要求命令が各サードパーティー音声スキルでのスキル関連特徴データによって反映されるため、現在の要求命令があるサードパーティー音声スキルに対応するエントリー要求命令に属すると決定し、当該サードパーティー音声スキルを起動させた後、当該サードパーティー音声スキルは、ユーザの要求をよりよく満足させることができる応答を提供することができる音声スキルである。図1に示すように、インテリジェントな音声対話デバイスにおける音声スキルは、内蔵の音声スキルの「XX音楽」、「XXバス」及びサードパーティー音声スキルの「XX天気」を含むとした場合、ユーザが「Aちゃん、Aちゃん、今日の天気を確認してください」と言い出した後、「XX天気」を起動し、「XX天気」により応答して、「今日は、晴れで、気温が28℃~35℃です」という応答音声を出力する。
【0052】
さらに、図2に示すように、インテリジェントな音声対話デバイスは待機状態ではなく、現在、ある内蔵の音声スキルにある場合、本願による音声スキルの起動方法はまた、図2に示すようなシナリオに応用されてもよい。内蔵の音声スキルでは、ユーザが現在の要求命令を言い出し、インテリジェントな音声対話デバイスがユーザの現在の要求命令を受信し、サードパーティー音声スキルが、当該現在の内蔵の音声スキルと公平に競争に参加するために、ユーザの要求を最大限に満足することができる音声スキルにより応答する。インテリジェントな音声対話デバイスは、当該現在の要求命令を判定し、あるサードパーティー音声スキルに対応するエントリー要求命令であるかどうかを判定し、当該サードパーティー音声スキルに対応するエントリー要求命令であると判定した場合、内蔵の音声スキルを当該サードパーティー音声スキルに切り替え、当該サードパーティー音声スキルが現在の要求命令に応答するように制御する。現在の要求命令があるサードパーティー音声スキルに対応するエントリー要求命令に属するかどうかを判定するのは、予め構築されたサードパーティー音声スキルとエントリー要求命令とのマッピング関係に基づいて決定され、且つ、当該マッピング関係は、第1の履歴的要求命令の各サードパーティー音声スキルでのスキル関連特徴データに基づいて決定されるので、第1の履歴的要求命令は、内蔵の音声スキルに位置する要求命令であり、即ち、サードパーティー音声スキルのエントリー要求命令は、内蔵の音声スキルの第1の履歴的要求命令から選別を行って得られたものであり、選別の原則は、当該第1の履歴的要求命令がエントリー要求命令として用いられる可能性があるかどうか、そして、第1の履歴的要求命令が、内蔵の音声スキルに比べて、各サードパーティー音声スキルとより強い関連関係を有するかどうかである。この選別原則は、第1の履歴的要求命令が各サードパーティー音声スキルでのスキル関連特徴データによって反映されているため、現在の要求命令があるサードパーティー音声スキルに対応するエントリー要求命令に属すると決定することは、現在の要求命令が対応するサードパーティー音声スキルにより応答することがより適切であることを意味する。現在の内蔵の音声スキルをサードパーティー音声スキルに切り替えた後、当該サードパーティー音声スキルは、ユーザの要求をよりよく満足させることができる応答を提供することができる。図2に示すように、インテリジェントな音声対話デバイスにおける現在の内蔵の音声スキルが、「XX音楽」であるとした場合、ユーザが「Aちゃん、Aちゃん、今日の天気を確認してください」のような現在の要求命令を言い出した後、「XX天気」をサードパーティー音声スキルの「XX天気」に切り替え、「XX天気」により応答して、「今日は、晴れで、気温が28℃~35℃です」という応答音声を出力する。
【0053】
以下、図面を参照しながら、本願の実施例を具体的に説明する。
【0054】
実施例1
【0055】
図3は、本願の第1の実施例による音声スキルの起動方法の概略フローチャートであり、図3に示すように、本願の実施例の実行主体は、音声スキルの起動装置であり、当該音声スキルの起動装置は、電子デバイスに集積されることができ、電子デバイスは、少なくとも1つのサードパーティー音声スキルと内蔵の音声スキルを含む複数の音声スキルを含み、電子デバイスは現在、内蔵の音声スキルにある。電子デバイスがインテリジェントな音声対話デバイスである場合を例として、本実施例を説明する。本実施例による音声スキルの起動方法は、以下のいくつかのステップを含む。
【0056】
ステップ101において、ユーザの現在の要求命令を受信する。
【0057】
本実施例では、電子デバイスは、音声受信コンポーネントと再生コンポーネントを有してもよい。音声受信コンポーネントを通じて、ユーザから送信された要求命令の音声を受信する。再生コンポーネントを通じて、要求命令に応答する音声再生を実現する。
【0058】
本実施例では、電子デバイスは、内蔵の音声スキルにある。音声受信コンポーネントを通じて、ユーザの現在の要求命令の音声を受信し、現在の要求命令に対して音声識別を行い、現在の要求命令の意味情報を決定することができる。
【0059】
ステップ102において、現在の要求命令に応答して、マッピング関係に基づき、現在の要求命令がサードパーティー音声スキルに対応するエントリー要求命令に属するかどうかを判定し、マッピング関係は、予め構築されたサードパーティー音声スキルとエントリー要求命令とのマッピング関係であり、マッピング関係は、第1の履歴的要求命令の各サードパーティー音声スキルでのスキル関連特徴データに基づいて決定されるものであり、第1の履歴的要求命令は、内蔵の音声スキルに位置する。
【0060】
本実施例では、現在の要求命令を、予め構築されたサードパーティー音声スキルとエントリー要求命令とのマッピング関係における各々のエントリー要求命令にマッチし、現在の要求命令が、あるサードパーティー音声スキルのエントリー要求命令とマッチする場合、当該現在の要求命令が、マッチされたサードパーティー音声スキルに対応するエントリー要求命令に属すると決定する。
【0061】
本実施例では、予め構築されたサードパーティー音声スキルとエントリー要求命令とのマッピング関係は、第1の履歴的要求命令の各サードパーティー音声スキルでのスキル関連特徴データに基づいて決定されるものである。第1の履歴的要求命令の各サードパーティー音声スキルでのスキル関連特徴データは、当該第1の履歴的要求命令がエントリー要求命令として用いられる可能性があるかどうか、そして、第1の履歴的要求命令が、内蔵の音声スキルに比べて、各サードパーティー音声スキルとより強い関連関係を有するかどうかを反映するための特徴データである。
【0062】
要求命令と音声スキルの関連関係の強さは、当該音声スキルが、当該要求命令のためにユーザの要求をよりよく満足させるような応答を提供できるかどうかを表現することができる。したがって、サードパーティー音声スキルのエントリー要求命令とされることができると、当該エントリー要求命令からサードパーティー音声スキルに入った後、当該サードパーティー音声スキルはユーザのために内蔵の音声スキルよりもユーザの要求をよりよく満足させるような応答を提供することができる。
【0063】
ステップ103において、現在の要求命令がサードパーティー音声スキルに対応するエントリー要求命令に属すると判定した場合、内蔵の音声スキルを当該サードパーティー音声スキルに切り替える。
【0064】
現在の要求命令があるサードパーティー音声スキルに対応するエントリー要求命令に属すると判定した場合、当該サードパーティー音声スキルを起動することができることを表し、電子デバイスが内蔵の音声スキルにあるため、内蔵の音声スキルを当該サードパーティー音声スキルに切り替える。
【0065】
本実施例では、内蔵の音声スキルを当該サードパーティー音声スキルに切り替えた後、当該サードパーティー音声スキルが現在の要求命令に応答するように制御することができるとき、サードパーティー音声スキルによって、現在の要求命令に対応する応答音声を取得し、再生コンポーネントを通じて、応答音声に対して音声再生を実行する。
【0066】
電子デバイスは、ディスプレイコンポーネントがある場合、再生コンポーネントとディスプレイコンポーネントを連携し、音声の形をもって応答音声を出力すると同時に、ディスプレイコンポーネントで応答音声の内容を表示してもよい。
【0067】
理解できるのは、現在の要求命令と応答を実行するサードパーティー音声スキルとの関連関係がより強いため、現在内蔵の音声スキルによる応答と比べて、当該サードパーティー音声スキルによる応答は、ユーザの要求をよりよく満足させることができる。
【0068】
本実施例による音声スキルの起動方法において、ユーザの現在の要求命令を受信し、現在の要求命令に応答し、マッピング関係に基づき、現在の要求命令がサードパーティー音声スキルに対応するエントリー要求命令に属するかどうかを判定し、マッピング関係は、予め構築されたサードパーティー音声スキルとエントリー要求命令とのマッピング関係であり、マッピング関係は、第1の履歴的要求命令の各サードパーティー音声スキルでのスキル関連特徴データに基づいて決定されるものであり、第1の履歴的要求命令は、内蔵の音声スキルに位置し、現在の要求命令がサードパーティー音声スキルに対応するエントリー要求命令に属すると判定した場合、内蔵の音声スキルをサードパーティー音声スキルに切り替える。電子デバイスは、現在、内蔵の音声スキルにある場合に、現在の要求命令がサードパーティー音声スキルのエントリー要求命令に属するかどうかを判定することで、サードパーティー音声スキルが、現在の内蔵の音声スキルと公平に競争に参加することができるようになる。また、サードパーティー音声スキルとマッピング関係のあるエントリー要求命令が、第1の履歴的要求命令の各サードパーティー音声スキルでのスキル関連特徴データに基づき、第1の履歴的要求命令に対して選別を行って得られたものであり、当該エントリー要求命令と当該サードパーティー音声スキルとの関連関係が、当該エントリー要求命令と内蔵の音声スキルとの関連関係より強いため、現在の要求命令があるサードパーティー音声スキルのエントリー要求命令であると判定し、当該サードパーティー音声スキルにより応答する場合、現在の内蔵の音声スキルによる応答と比べて、ユーザの要求をよりよく満足させることができる。
【0069】
実施例2
【0070】
図4は本願の第2の実施例による音声スキルの起動方法の概略フローチャートであり、図4に示すように、本実施例による音声スキルの起動方法は、本願の実施例1による音声スキルの起動方法の上で、サードパーティー音声スキルとエントリー要求命令とのマッピング関係を構築するステップをさらに含み、本実施例による音声スキルの起動方法は以下のステップを含む。
【0071】
ステップ201において、内蔵の音声スキルにおける第1の履歴的要求命令を取得する。
【0072】
本実施例では、電子デバイスは、少なくとも1つの内蔵の音声スキルを含んでよく、第1の履歴的要求命令は、すべての内蔵の音声スキルに発生した要求命令である。第1の履歴的要求命令は、複数であってもよい。
【0073】
内蔵の音声スキルにおける第1の履歴的要求命令を取得する方法は、各内蔵の音声スキルのログファイルから自然なコンテキストを取得し、自然なコンテキストから第1の履歴的要求命令を取得することであってもよい。
【0074】
自然なコンテキストは、マンマシンインタラクション会話のコンテキストであり、自然なコンテキストにマルチラウンド会話のコンテキストが含まれている。
【0075】
ステップ202において、第1の履歴的要求命令の各サードパーティー音声スキルでのスキル関連エントリー特徴データを決定する。
【0076】
なお、ステップ202とステップ204は、第1の履歴的要求命令の各サードパーティー音声スキルでのスキル関連特徴データを決定するステップである。
【0077】
さらに、本実施例では、第1の履歴的要求命令が内蔵の音声スキルにおける要求命令であるため、各サードパーティー音声スキルに現れる可能性もあるが、第1の履歴的要求命令のサードパーティー音声スキルのそれぞれでのスキル関連特徴データが異なるため、第1の履歴的要求命令の各サードパーティー音声スキルでのスキル関連特徴データを別々に決定する。
【0078】
まず、第1の履歴的要求命令の各サードパーティー音声スキルでのスキル関連エントリー特徴データを決定する。第1の履歴的要求命令の各サードパーティー音声スキルでのスキル関連エントリー特徴データを決定することは、各第1の履歴的要求命令に対して、各サードパーティー音声スキルでのスキル関連エントリー特徴データを別々に決定することである。
【0079】
スキル関連エントリー特徴データは、サードパーティー音声スキルに関連するエントリー要求命令特徴を表現するデータである。一実施例において、スキル関連エントリー特徴データは、エントリー行動特徴データ、スキル関連性特徴データ及びエントリー文法特徴データを含む。
【0080】
一実施例において、エントリー行動特徴データは、第1の履歴的要求命令が音声スキルの自然なコンテキストでのエントリー要求命令とされる頻度、第1の履歴的要求命令がすべてのサードパーティー音声スキルを開いた後の1番目の要求命令とされる頻度、第1の履歴的要求命令が命令の意図を的中するかどうか等を含む。
【0081】
第1の履歴的要求命令が音声スキルの自然なコンテキストでのエントリー要求命令とされる頻度を決定する方法は、すべての音声スキルでのすべての自然なコンテキストを取得し、自然なコンテキストを解析して自然なコンテキストの1番目の要求命令を取得し、当該1番目の要求命令は、即ち自然なコンテキストのエントリー要求命令である。第1の履歴的要求命令が対応する音声スキルのエントリー要求命令であるかどうか、即ち、第1の履歴的要求命令が対応する音声スキルの自然なコンテキストにおける1番目の要求命令であるかどうかを決定し、且つ第1の履歴的要求命令が対応する音声スキルの1番目の要求命令である頻度を統計することで、第1の履歴的要求命令が音声スキルの自然なコンテキストでのエントリー要求命令とされる頻度を決定する。
【0082】
第1の履歴的要求命令は、すべてのサードパーティー音声スキルを開いた後に1番目の要求命令である頻度を決定する方法は、すべてのサードパーティー音声スキルのログファイルを取得し、ログファイルからサードパーティー音声スキルを開く1番目の要求命令を取得し、第1の履歴的要求命令が当該1番目の要求命令であるかどうかを判定し、第1の履歴的要求命令が1番目の要求命令である頻度を統計し、第1の履歴的要求命令がすべてのサードパーティー音声スキルを開いた後に1番目の要求命令である頻度を取得する。
【0083】
第1の履歴的要求命令が命令の意図を的中するかどうかを決定する方法は、まず、命令意図を表すキーワード、例えば、「終了する」、「戻す」、「シャットダウンする」、「開始」等を決定し、次に、第1の履歴的要求命令を命令意図のキーワードに突き合わせ、第1の履歴的要求命令が命令の意図するキーワードにマッチする場合、第1の履歴的要求命令が命令の意図を的中することを意味し、そうでなければ、第1の履歴的要求命令が命令の意図を的中しないと決定する。
【0084】
一実施例において、スキル関連性特徴データは、第1の履歴的要求命令が現れたすべてのサードパーティー音声スキルの数と、第1の履歴的要求命令が対応するサードパーティー音声スキルでの応答が空であるかどうかと、第1の履歴的要求命令が対応するサードパーティー音声スキルでのtfidf情報と、第1の履歴的要求命令が対応するサードパーティー音声スキルでの応答音声が満足度の高い応答音声であるかどうかと、第1の履歴的要求命令が対応するサードパーティー音声スキルで高頻度の要求命令である比率と、第1の履歴的要求命令が対応するサードパーティー音声スキルの内外で現れた頻度の関連特徴等と、を含む。
【0085】
第1の履歴的要求命令が内蔵の音声スキルにおける履歴的要求命令であるが、サードパーティー音声スキルで現れることもできる。したがって、各サードパーティー音声スキルのログファイルから、第1の履歴的要求命令が現れたかどうかを判定し、第1の履歴的要求命令が現れたサードパーティー音声スキルの数を統計し、第1の履歴的要求命令のすべてのサードパーティー音声スキルの数を決定する。
【0086】
第1の履歴的要求命令が対応するサードパーティー音声スキルでのtfidf情報とは、対応するサードパーティー音声スキルにおける第1の履歴的要求命令の内外比率分布関係情報を指し、従来の方法によって計算して取得することができる。
【0087】
第1の履歴的要求命令が対応するサードパーティー音声スキルでの応答音声は満足度の高い応答音声であるかどうかを決定する方法は、まず、満足度応答音声の予測モデルを1つトレーニングし、当該第1の履歴的要求命令が対応するサードパーティー音声スキルでの応答音声を収束するまでトレーニングされた満足度応答音声の予測モデルに入力し、当該予測モデルによって応答音声が満足度の高い応答音声であるかどうかを予測し、当該満足度応答音声の予測モデルは、ロジスティック回帰モデルであってよく、ロジスティック回帰モデルの出力は1である場合、第1の履歴的要求命令が対応するサードパーティー音声スキルでの応答音声は満足度の高い応答音声であると決定し、ロジスティック回帰モデルの出力は0である場合、満足度の高い応答音声ではないと決定することである。
【0088】
第1の履歴的要求命令が対応するサードパーティー音声スキルでの高頻度の要求命令である比率を決定する方法は、すべての音声スキルにおけるログファイルを取得し、現れる頻度の高い要求命令を最初からN個取得し、当該最初からN個の現れる頻度の高い要求命令が高頻度の要求命令であり、次に、当該サードパーティー音声スキルでは、第1の履歴的要求命令が高頻度の要求命令に属する頻度を決定し、当該サードパーティー音声スキルでは、第1の履歴的要求命令が高頻度の要求命令に属する頻度と高頻度の要求命令が現れる頻度との比率を第1の履歴的要求命令が対応するサードパーティー音声スキルで高頻度の要求命令である比率として決定することである。
【0089】
第1の履歴的要求命令が対応するサードパーティー音声スキルの内外で現れる頻度関連特徴は、第1の履歴的要求命令が内蔵の音声スキルで現れる頻度と、第1の履歴的要求命令が対応するサードパーティー音声スキル内で現れる頻度と、第1の履歴的要求命令が内蔵の音声スキルで現れる頻度と第1の履歴的要求命令が対応するサードパーティー音声スキル内で現れる頻度との差と、第1の履歴的要求命令が内蔵の音声スキルで現れる頻度と第1の履歴的要求命令が対応するサードパーティー音声スキル内で現れる頻度との比率と、を含む。
【0090】
一実施例において、エントリー文法特徴データは、第1の履歴的要求命令自体から、解析を行って得られた特徴であり、取得したいキーワードが含まれるかどうかと、意図的述語が含まれるかどうかと、シングルワード又はダブルワードの命令であるかどうかと、高頻度ワードが含まれるかどうかと、等を含んでよい。
【0091】
取得したいキーワードが含まれるかどうかを決定する方法は、まず、取得したいキーワード(英語、wantkey)を設定する。例えば、設定された取得したいキーワードは、「行きたい」、「聞きたい」、「見たい」等であり、そして、第1の履歴的要求命令と予め設定された取得したいキーワードを比較して、取得したいキーワードが含まれるかどうかを決定することである。
【0092】
意図的述語が含まれるかどうかを決定する方法は、まず、意図的述語を設定する。例えば、設定された意図的述語は、「見る」、「聞く」、「食べる」等であり、そして、第1の履歴的要求命令と予め設定された意図的述語を比較して、意図的述語が含まれるかどうかを決定することである。
【0093】
シングルワード又はダブルワードの命令であるかどうかを決定する方法は、第1の履歴的要求命令を取得してから、第1の履歴的要求命令に含まれるワードの数を決定し、2より大きい数である場合、シングルワード又はダブルワードの命令ではないと決定し、そうでなければ、シングルワード又はダブルワードの命令であると決定することである。
【0094】
高頻度ワードが含まれるかどうかを決定する方法は、履歴的要求命令に現れたすべてのワードを決定し、現れる頻度の高い高頻度ワードを決定し、第1の履歴的要求命令と高頻度ワードを比較し、高頻度ワードが含まれるかどうかを決定することである。
【0095】
ステップ203において、スキル関連エントリー特徴データに基づき、第1の履歴的要求命令に対して選別を行うことで、各サードパーティー音声スキルに対応する第2の履歴的要求命令を取得する。
【0096】
さらに、図5は、本願の第2の実施例による音声スキルの起動方法におけるステップ203の概略フローチャートである。図5に示すように、ステップ203は、以下のステップを含んでよい。ステップ2031において、サードパーティー音声スキルに対応するエントリー要求命令とすることができるかどうかの識別子を持っている要求命令サンプルである各分類モデルのトレーニングサンプルを取得する。ステップ2032において、トレーニングサンプルのスキル関連エントリー特徴データを用いて、対応する分類モデルを収束するまでトレーニングすることで、各収束するまでトレーニングされた分類モデルを取得する。
【0097】
各サードパーティー音声スキルのそれぞれに対して、いずれも対応する分類モデルがある。まず、各分類モデルのそれぞれをトレーニングする。分類モデルをトレーニングするとき、要求命令のサンプルを取得し、各要求命令サンプルのそれぞれに対して対応するサードパーティー音声スキルのエントリー要求命令として使用できるかどうかの識別子をマークし、対応するサードパーティー音声スキルのエントリー要求命令として使用できる場合、識別子は1であり、そうでなければ、識別子は0である。次に、当該要求命令サンプルをトレーニングサンプルとして用いて、各トレーニングサンプルのそれぞれが各サードパーティー音声スキルでのスキル関連エントリー特徴データを決定する。各トレーニングサンプルのスキル関連エントリー特徴データを対応する分類モデルに入力し、分類モデルをトレーニングし、分類モデルにおけるパラメータを最大の反復回数に至るまで最適化し、当該分類モデルを収束させ、収束するまでトレーニングされた分類モデルを取得する。
【0098】
一実施例において、分類モデルは、マシンラーニングモデル又はディープラーニングモデルであってよい。本実施例では、分類モデルは勾配ブースティング決定木(Gradient Boosting Decision Tree,GBDT)分類モデルである。
【0099】
本願の実施例では、識別子情報の持つ要求命令サンプルを分類モデルのトレーニングサンプルとして用いることで、トレーニングされた分類モデルがテストサンプルにより適合し、さらに、分類結果をより正確にすることができる。
【0100】
ステップ2033において、第1の履歴的要求命令のスキル関連エントリー特徴データを各サードパーティー音声スキルに対応する収束するまでトレーニングされた分類モデルに入力することで、第1の履歴的要求命令を分類モデルによって分類し、各サードパーティー音声スキルに対応する第2の履歴的要求命令を取得する。
【0101】
なお、同じ第1の履歴的要求命令が異なるサードパーティー音声スキルでのスキル関連エントリー特徴データは異なるため、第1の履歴的要求命令のスキル関連エントリー特徴データを各サードパーティー音声スキルに対応する収束するまでトレーニングされた分類モデルに入力し、第1の履歴的要求命令のスキル関連エントリー特徴データに基づき、第1の履歴的要求命令を収束するまでトレーニングされた分類モデルによって分類し、ある第1の履歴的要求命令に対する分類結果の値は、予め設定された分類数値より大きい場合、当該第1の履歴的要求命令は、選別された第2の履歴的要求命令であることを表す。ある第1の履歴的要求命令に対する分類結果の値は、予め設定された分類数値以下である場合、当該第1の履歴的要求命令は、選別された後に除去すべき履歴的要求命令であることを表す。
【0102】
第2の履歴的要求命令は、スキル関連エントリー特徴データに基づき、第1の履歴的要求命令から、選別を行って得られる履歴的要求命令である。
【0103】
本願の実施例では、各サードパーティー音声スキルに対して、対応する収束するまでトレーニングされた分類モデルがあり、当該収束するまでトレーニングされた分類モデルを用いて、第1の履歴的要求命令に対して選別を行って、第2の履歴的要求命令を取得することで、選別された第2の履歴的要求命令を、サードパーティー音声スキルに対応するエントリー特徴をより満足するような要求命令にさせることができる。
【0104】
ステップ204において、第1の履歴的要求命令における第2の履歴的要求命令の各サードパーティー音声スキルでのスキル満足度データを決定する。
【0105】
スキル満足度データは、サードパーティー音声スキルが第2の履歴的要求命令を満足させることができるかどうかを表すための特徴データである。一実施例において、スキル満足度データは、内容の満足度又はインタラクションの満足度であってよい。
【0106】
さらに、図6は、本願の第2の実施例による音声スキルの起動方法におけるステップ204の概略フローチャートであり、図6に示すように、ステップ204は以下のステップを含んでよい。
【0107】
ステップ2041において、各サードパーティー音声スキルのタイプがリソーススキルであるかどうかを判定する。リソーススキルである場合、ステップ2042を実行し、リソーススキルでない場合、ステップ2043を実行する。
【0108】
リソーススキルは、オーディオスキル、ビデオスキル及び音声合成スキル(テキストからスピーチへ(Text To Speech,TTS)スキルと略称)等を含んでよい。
【0109】
本実施例において、リソーススキルの各タイプの識別子を予め記憶し、各サードパーティー音声スキルのタイプの識別子を取得し、各サードパーティー音声スキルのタイプの識別子を予め記憶されたリソーススキルの各タイプの識別子にマッチし、あるサードパーティー音声スキルのタイプの識別子がある予め記憶されたリソーススキルのタイプの識別子にマッチする場合、当該サードパーティー音声スキルがリソーススキルであると判定し、そうでなければ、当該サードパーティー音声スキルが非リソーススキルであると判定する。
【0110】
ステップ2042において、第2の履歴的要求命令の当該サードパーティー音声スキルでの内容の満足度を決定する。
【0111】
あるサードパーティー音声スキルのタイプがリソーススキルである場合、第2の履歴的要求命令の当該サードパーティー音声スキルでの内容の満足度を決定する。
【0112】
本実施例において、図7は、本願の第2の実施例による音声スキルの起動方法におけるステップ2042の概略フローチャートであり、図7に示すように、ステップ2042は、以下のステップを含んでよい。
【0113】
ステップ2042aにおいて、第2の履歴的要求命令の当該サードパーティー音声スキルでの第1のリソース再生時間と内蔵の音声スキルでの第2のリソース再生時間を取得する。
【0114】
本実施例において、当該サードパーティー音声スキルの履歴ログから、第2の履歴的要求命令が当該サードパーティー音声スキルで対応するリソース再生時間を取得し、当該サードパーティー音声スキルで対応するリソース再生時間は、第1のリソース再生時間である。また、内蔵の音声スキルの履歴ログから、第2の履歴的要求命令が内蔵の音声スキルで対応するリソース再生時間を取得し、内蔵の音声スキルで対応するリソース再生時間は、第2のリソース再生時間である。
【0115】
ステップ2042bにおいて、第1のリソース再生時間と第2のリソース再生時間に基づいて内容の満足度を決定する。
【0116】
さらに、本実施例において、第1のリソース再生時間と第2のリソース再生時間とを比較し、その比較結果に基づいて内容の満足度を決定する。
【0117】
1つの実施形態として、第1のリソース再生時間と第2のリソース再生時間とを比較し、第1のリソース再生時間が第2のリソース再生時間より大きい場合、内容の満足度を1と決定し、そうでなければ、内容の満足度を0と決定する。
【0118】
他の実施形態として、まず、第1のリソース再生時間と第2のリソース再生時間の差と、内容の満足度のマッピング関係を設定し、次に、第1のリソース再生時間と第2のリソース再生時間の差を計算し、計算された差と当該マッピング関係に基づいて対応する内容の満足度を決定する。内容の満足度は、区間0~1にある数値である。
【0119】
本願の実施例では、リソース再生時間は、リソース音声スキルがユーザの要求を満足させるかどうかを測定するための重要な指標であるため、サードパーティー音声スキルのリソース再生時間と内蔵の音声スキルのリソース再生時間に基づいて第2の履歴的要求命令のサードパーティー音声スキルでの内容の満足度を決定することで、決定された内容の満足度をより正確にする。
【0120】
ステップ2043において、第2の履歴的要求命令の当該サードパーティー音声スキルでのインタラクションの満足度を決定する。
【0121】
本実施例において、あるサードパーティー音声スキルのタイプが非リソーススキルである場合、当該サードパーティー音声スキルは、ゲームスキル又は他の非リソーススキルである可能性がある。ゲームスキルである場合、命令型ゲーム、知識ゲーム又は他の種類のゲームであってよい。当該非リソーススキルは、マルチラウンド会話の特徴がある。
【0122】
本実施例において、図8は、本願の第2の実施例による音声スキルの起動方法におけるステップ2043の概略フローチャートであり、図8に示すように、ステップ2043は、以下のステップを含んでよい。
【0123】
ステップ2043aにおいて、第2の履歴的要求命令が当該サードパーティー音声スキルで対応するマルチラウンド会話テキストを取得する。
【0124】
一実施例において、当該サードパーティー音声スキルでのログファイルから、第2の履歴的要求命令が含まれているマルチラウンド会話テキストを取得する。各ラウンドの会話テキストには、1つの要求命令と対応する応答音声が含まれている。
【0125】
取得されたマルチラウンド会話テキストのラウンド数は予め設定されてもよいか、又は、マルチラウンド会話テキストのラウンド数は、当該サードパーティー音声スキルの進入から当該サードパーティー音声スキルの終了までのラウンド数であってもよい。
【0126】
ステップ2043bにおいて、マルチラウンド会話テキストに基づき、第2の履歴的要求命令の当該サードパーティー音声スキルでのスキル応答の満足度とスキル応答の繰り返し率を決定する。
【0127】
スキル応答の満足度は、マルチラウンド会話テキストの応答音声で、満足度の低いキーワードが現れる頻度に基づいて決定されるものである。満足度の低いキーワードの頻度とスキル応答の満足度との対応関係を予め設定してよい。マルチラウンド会話テキストの応答音声で満足度の低いキーワードが現れる頻度を取得し、上記の対応関係に基づいてスキル応答の満足度を決定する。
【0128】
マルチラウンド会話テキストで満足度の低いキーワードが現れる頻度が高いほど、スキル応答の満足度が低いと決定する。逆に、マルチラウンド会話テキストで満足度の低いキーワードが現れる頻度が低いほど、スキル応答の満足度が高いと決定する。
【0129】
本実施例において、スキル応答の繰り返し率を決定する方法は、第2の履歴的要求命令が含まれているマルチラウンド会話テキストの応答音声を取得し、各ラウンドの応答音声を比較し、各応答音声の繰り返し回数を決定し、各応答音声の繰り返し回数と応答音声の総数との比をスキル応答の繰り返し率として決定する。
【0130】
以下、サードパーティー音声スキルが「インテリジェント医療指導」である場合を例として、スキル応答の満足度とスキル応答の繰り返し率を説明する。
【0131】
インテリジェント医療指導において、第2の履歴的要求命令が含まれているマルチラウンド会話テキストに5ラウンドの会話テキストが含まれている。この5ラウンドの会話テキストは、ユーザに症状、年齢、性別、病気の種類などを尋ねることで、最終的には、ユーザに応答する登録部門を推薦する要求が実現される。当該「インテリジェント医療指導」の応答音声に「わかりません」、「理解できません」等の明らかな満足度の低いキーワードが常に含まれている場合、当該「インテリジェント医療指導」は、ユーザ要求に対する理解能力が弱く、スキル応答の満足度が低いと決定する。同様に、「インテリジェント医療指導」が、同じ応答音声を常に繰り返し、例えば、ユーザの症状を尋ねる応答音声を常に繰り返して、即ち、スキル応答の繰り返し率が高い場合、当該「インテリジェント医療指導」がユーザの要求命令を理解できないことを表す。
【0132】
ステップ2043cにおいて、スキル応答の満足度とスキル応答の繰り返し率に基づいてインタラクションの満足度を決定する。
【0133】
1つの実施形態として、スキル応答の満足度とインタラクションの満足度が正の相関関係を呈し、スキル応答の繰り返し率とインタラクションの満足度が負の相関関係を呈するため、スキル応答の繰り返し率を変換し、インタラクションの満足度と正の相関関係を呈するように変えた後、スキル応答の満足度とスキル応答の繰り返し率に対し、加重加算を行うことで、インタラクションの満足度を決定する。
【0134】
他の実施形態として、インタラクションの満足度の予測モデルを1つトレーニングしてよい。スキル応答の満足度とスキル応答の繰り返し率を当該インタラクションの満足度の予測モデルに入力することで、インタラクションの満足度の予測モデルによってインタラクションの満足度を予測する。
【0135】
理解できるのは、スキル応答の満足度とスキル応答の繰り返し率に基づいてインタラクションの満足度を決定する方法は、他の方法であってもよく、本実施例はこれを限定しない。
【0136】
本願の実施例では、スキル応答の満足度とスキル応答の繰り返し率は、インタラクション型音声スキルがユーザの要求を満足させるかどうかを測定するための重要な指標であるため、第2の履歴的要求命令の当該サードパーティー音声スキルでのスキル応答の満足度とスキル応答の繰り返し率を用いて、インタラクションの満足度を決定することで、決定されたインタラクションの満足度をより正確にすることができる。
【0137】
ステップ205において、スキル満足度データに基づき、第2の履歴的要求命令に対して選別を行うことで、各サードパーティー音声スキルに対応するエントリー要求命令を取得する。
【0138】
さらに、図9は本願の第2の実施例による音声スキルの起動方法におけるステップ205の概略フローチャートであり、図9に示すように、ステップ205は以下のステップを含んでよい。
【0139】
ステップ2051において、あるサードパーティー音声スキルのタイプがリソーススキルである場合、第2の履歴的要求命令の当該サードパーティー音声スキルでの内容の満足度に基づき、第2の履歴的要求命令に対して選別を行い、エントリー要求命令を取得する。
【0140】
1つの実施形態として、第2の履歴的要求命令の当該サードパーティー音声スキルでの内容の満足度を取得し、内容の満足度には、0と1の2つの数値しか含まれていないとした場合、内容の満足度は1である場合、当該第2の履歴的要求命令が当該サードパーティー音声スキルのエントリー要求命令であると決定し、内容の満足度は0である場合、当該第2の履歴的要求命令が当該サードパーティー音声スキルのエントリー要求命令ではないと決定する。
【0141】
他の実施形態として、第2の履歴的要求命令の当該サードパーティー音声スキルでの内容の満足度を取得し、内容の満足度は、0~1にある数値である場合、内容の満足度の閾値を設定する。例えば、予め設定された内容の満足度の閾値が0.8であり、内容の満足度は、当該予め設定された内容の満足度の閾値より大きい場合、当該第2の履歴的要求命令が当該サードパーティー音声スキルのエントリー要求命令であると決定し、内容の満足度は、当該予め設定された内容の満足度の閾値以下である場合、当該第2の履歴的要求命令が当該サードパーティー音声スキルのエントリー要求命令ではないと決定する。
【0142】
本実施例において、あるサードパーティー音声スキルのタイプがリソーススキルである場合、第2の履歴的要求命令の当該サードパーティー音声スキルでの内容の満足度に基づき、第2の履歴的要求命令に対して選別を行い、エントリー要求命令を取得する。内容の満足度は、第2の履歴的要求命令のサードパーティー音声スキルと内蔵の音声スキルでのリソース再生時間に基づいて決定されるものであるため、選別されたエントリー要求命令とサードパーティー音声スキルとの内容での関連性が、エントリー要求命令と内蔵の音声スキルとの内容での関連性より強い。当該選別された第2の履歴的要求命令が、サードパーティー音声スキルのエントリー要求命令として用いられることにより適し、ユーザのために要求をよりよく満足させるような再生リソースを提供する。
【0143】
ステップ2052において、あるサードパーティー音声スキルのタイプが非リソーススキルである場合、内蔵の音声スキルに第2の履歴的要求命令に対応するリソース再生記録がないと決定した後、第2の履歴的要求命令の当該サードパーティー音声スキルでのインタラクションの満足度に基づき、第2の履歴的要求命令に対して選別を行い、エントリー要求命令を取得する。
【0144】
さらに、本実施例において、あるサードパーティー音声スキルのタイプが非リソーススキルである場合、内蔵の音声スキルでは、当該第2の履歴的要求命令のリソース再生記録があるかどうかを判定し、記録がある場合、当該第2の履歴的要求命令をリソース音声スキルの要求命令として使用することが可能であり、非リソーススキルのエントリー要求命令として使用することに適しないことを表し、当該第2の履歴的要求命令を削除する。内蔵の音声スキルでは、当該第2の履歴的要求命令の対応するリソース再生記録がない場合、当該第2の履歴的要求命令を非リソーススキルの要求命令として使用することが可能であることを表す。非リソーススキルのマルチラウンド会話の特徴によって、第2の履歴的要求命令の当該サードパーティー音声スキルでのインタラクションの満足度に基づき、第2の履歴的要求命令に対して選別を行い、エントリー要求命令を取得する。
【0145】
インタラクションの満足度の閾値を予め設定してもよく、第2の履歴的要求命令の当該サードパーティー音声スキルでのインタラクションの満足度と当該予め設定されたインタラクションの満足度の閾値を比較し、当該予め設定されたインタラクションの満足度の閾値より大きい場合、当該第2の履歴的要求命令をエントリー要求命令とし、当該予め設定されたインタラクションの満足度の閾値以下である場合、当該第2の履歴的要求命令をエントリー要求命令としない。
【0146】
本願の実施例では、サードパーティー音声スキルのタイプに基づき、第2の履歴的要求命令に対して選別を行うための特徴根拠を別々に決定することで、選別されたエントリー要求命令に基づいてサードパーティー音声スキルを起動させた後、効果的な内容満足又はインタラクション満足を達成し、ユーザの音声スキル応答に対する満足度を向上させることができる。
【0147】
また、本願の実施例では、前記スキル関連エントリー特徴データに基づき、前記第1の履歴的要求命令に対して選別を行うことで、各前記サードパーティー音声スキルに対応する第2の履歴的要求命令を取得し、前記スキル満足度データに基づき、前記第2の履歴的要求命令に対して選別を行うことで、各前記サードパーティー音声スキルに対応するエントリー要求命令を取得することにより、スキル関連エントリー特徴データに基づき、第1の履歴的要求命令に対して一次選別を行い、サードパーティー音声スキルのエントリー要求命令の特徴を持たざるを得ない第1の履歴的要求命令を取り除くことができる。スキル満足度データに基づき、第2の履歴的要求命令に対して二次選別を行い、サードパーティー音声スキルで満足できない第2の履歴的要求命令を取り除き、選別された各サードパーティー音声スキルのエントリー要求命令をより正確にさせることができる。
【0148】
ステップ206において、各エントリー要求命令に対応するサードパーティー音声スキルが1つであるかどうかを判定する。1つである場合、ステップ207を実行し、1つでない場合、ステップ209を実行する。
【0149】
本実施例において、あるサードパーティー音声スキルのエントリー要求命令として使用される可能な要求命令は、少なくとも1つである。同様に、各エントリー要求命令もまた、少なくとも1つのサードパーティー音声スキルのエントリー要求命令として使用されることが可能である。これにより、現在の要求命令は、少なくとも1つのサードパーティー音声スキルのエントリー要求命令にマッチしうるので、どのサードパーティー音声スキルによって応答されるかを決定できなくなる。したがって、あるエントリー要求命令に対応するサードパーティー音声スキルが複数であると判定する場合、当該エントリー要求命令に対応する1つのサードパーティー音声スキルのみを保留する。
【0150】
ステップ207において、当該エントリー要求命令が各対応するサードパーティー音声スキルで現れた頻度を決定する。
【0151】
さらに、エントリー要求命令に対応する1つのサードパーティー音声スキルのみを保留するために、当該エントリー要求命令が各対応するサードパーティー音声スキルで現れた頻度を決定する。現れる頻度が高いほど、当該エントリー要求命令と当該サードパーティー音声スキルとの関連性が強いことを表す。
【0152】
ステップ208において、現れる頻度の最も高いサードパーティー音声スキルを当該エントリー要求命令とマッピング関係のあるサードパーティー音声スキルとして決定する。
【0153】
さらに、本実施例において、現れる頻度の最も高いサードパーティー音声スキルを当該エントリー要求命令とマッピング関係のあるサードパーティー音声スキルとして決定し、他の対応するサードパーティー音声スキルと当該エントリー要求命令とのマッピング関係を除去する。1つのエントリー要求命令が、1つのサードパーティー音声スキルのみとマッピング関係を有するようにする。
【0154】
ステップ209において、各サードパーティー音声スキルと対応するエントリー要求命令とのマッピング関係を構築する。
【0155】
さらに、本実施例において、各サードパーティー音声スキルと対応するエントリー要求命令とのマッピング関係を構築するとき、ペアとなるエントリー要求命令とサードパーティー音声スキルの形でマッピング関係を構築することができる。
【0156】
本願の実施例では、エントリー要求命令が対応するサードパーティー音声スキルで現れた頻度に基づき、各エントリー要求命令とマッピング関係のあるサードパーティー音声スキルが1つだけであると決定することで、現在の内蔵の音声スキルから最適なサードパーティー音声スキルに切り替えることができ、どのサードパーティー音声スキルに切り替えるかを決定できないという問題を回避する。また、最適なサードパーティー音声スキルに切り替え、当該最適なサードパーティー音声スキルによって応答するから、ユーザの要求の満足度をさらに向上させる。
【0157】
ステップ210において、ユーザの現在の要求命令を受信する。
【0158】
ステップ211において、現在の要求命令に応答し、予め構築されたサードパーティー音声スキルとエントリー要求命令とのマッピング関係に基づき、現在の要求命令がサードパーティー音声スキルに対応するエントリー要求命令に属するかどうかを判定する。
【0159】
マッピング関係は、第1の履歴的要求命令の各サードパーティー音声スキルでのスキル関連特徴データに基づいて決定されるものであり、第1の履歴的要求命令は、内蔵の音声スキルに位置する。
【0160】
ステップ212において、現在の要求命令がサードパーティー音声スキルに対応するエントリー要求命令に属すると判定した場合、内蔵の音声スキルを当該サードパーティー音声スキルに切り替える。
【0161】
ステップ213において、当該サードパーティー音声スキルが現在の要求命令に応答するように制御する。
【0162】
本実施例において、ステップ210~ステップ212の実施形態は、本願の図3に示す実施例におけるステップ101~ステップ103の実施形態に類似し、ここでは一つ一つ説明しない。
【0163】
実施例3
【0164】
図10は、本願の第3の実施例による音声スキルの起動装置の構造模式図であり、図10に示すように、本実施例による音声スキルの起動装置は、少なくとも1つのサードパーティー音声スキルと内蔵の音声スキルを含む電子デバイスに位置し、電子デバイスは現在、内蔵の音声スキルにある。当該音声スキルの起動装置1000は、命令受信モジュール1001と、エントリー命令判定モジュール1002と、スキル切り替えモジュール1003と、を含む。
【0165】
命令受信モジュール1001は、ユーザの現在の要求命令を受信することに用いられる。エントリー命令判定モジュール1002は、前記現在の要求命令に応答し、マッピング関係に基づき、前記現在の要求命令がサードパーティー音声スキルに対応するエントリー要求命令に属するかどうかを判定することに用いられ、前記マッピング関係は、予め構築されたサードパーティー音声スキルとエントリー要求命令とのマッピング関係であり、前記マッピング関係は、第1の履歴的要求命令の各サードパーティー音声スキルでのスキル関連特徴データに基づいて決定されるものであり、前記第1の履歴的要求命令は、前記内蔵の音声スキルに位置する。スキル切り替えモジュール1003は、前記現在の要求命令がサードパーティー音声スキルに対応するエントリー要求命令に属すると判定した場合、前記内蔵の音声スキルを前記サードパーティー音声スキルに切り替えることに用いられる。
【0166】
本実施例による音声スキルの起動装置は、図3に示す方法の実施例の技術的解決手段を実行することができ、その実現原理と技術的効果が図3に示す方法の実施例に類似し、ここでは一つ一つ説明しない。
【0167】
実施例4
【0168】
図11は、本願の第4の実施例による音声スキルの起動装置の構造模式図であり、図11に示すように、本実施例による音声スキルの起動装置は本願の実施例3による音声スキルの起動装置の上で、当該音声スキルの起動装置1100は、さらに、命令取得モジュール1101と、特徴データ決定モジュール1102と、命令選別モジュール1103と、マッピング関係構築モジュール1104と、マッピングスキル決定モジュール1105と、を含む。
【0169】
さらに、命令取得モジュール1101は、内蔵の音声スキルにおける第1の履歴的要求命令を取得することに用いられる。特徴データ決定モジュール1102は、第1の履歴的要求命令の各サードパーティー音声スキルでのスキル関連特徴データを決定することに用いられる。命令選別モジュール1103は、スキル関連特徴データに基づき、第1の履歴的要求命令に対して選別を行うことで、各サードパーティー音声スキルに対応するエントリー要求命令を取得することに用いられる。マッピング関係構築モジュール1104は、各サードパーティー音声スキルと対応するエントリー要求命令とのマッピング関係を構築することに用いられる。
【0170】
さらに、本実施例における音声スキルの起動装置は、マッピングスキル決定モジュール1105をさらに含む。
【0171】
マッピングスキル決定モジュール1105は、各エントリー要求命令に対応するサードパーティー音声スキルが1つであるかどうかを判定し、あるエントリー要求命令に対応するサードパーティー音声スキルが複数である場合、当該エントリー要求命令が各対応するサードパーティー音声スキルで現れた頻度を決定し、現れる頻度の最も高いサードパーティー音声スキルを当該エントリー要求命令とマッピング関係のあるサードパーティー音声スキルとして決定することに用いられる。
【0172】
さらに、特徴データ決定モジュール1102は、第1の履歴的要求命令の各サードパーティー音声スキルでのスキル関連エントリー特徴データを決定し、第1の履歴的要求命令における第2の履歴的要求命令の各サードパーティー音声スキルでのスキル満足度データを決定することに用いられる。
【0173】
さらに、命令選別モジュール1103は、スキル関連エントリー特徴データに基づき、第1の履歴的要求命令に対して選別を行うことで、各サードパーティー音声スキルに対応する第2の履歴的要求命令を取得し、スキル満足度データに基づき、第2の履歴的要求命令に対して選別を行うことで、各サードパーティー音声スキルに対応するエントリー要求命令を取得することに用いられる。
【0174】
さらに、命令選別モジュール1103は、スキル関連エントリー特徴データに基づき、第1の履歴的要求命令に対して選別を行うことで、各サードパーティー音声スキルに対応する第2の履歴的要求命令を取得するとき、第1の履歴的要求命令のスキル関連エントリー特徴データを各サードパーティー音声スキルに対応する収束するまでトレーニングされた分類モデルに入力することで、第1の履歴的要求命令を分類モデルによって分類し、各サードパーティー音声スキルに対応する第2の履歴的要求命令を取得することに用いられる。
【0175】
さらに、命令選別モジュール1103は、第1の履歴的要求命令のスキル関連エントリー特徴データを各サードパーティー音声スキルに対応する収束するまでトレーニングされた分類モデルに入力する前に、さらに、サードパーティー音声スキルに対応するエントリー要求命令とすることができるかどうかの識別子を持っている要求命令サンプルである各分類モデルのトレーニングサンプルを取得すること、及びトレーニングサンプルのスキル関連エントリー特徴データを用いて、対応する分類モデルを収束するまでトレーニングすることで、各収束するまでトレーニングされた分類モデルを取得することに用いられる。
【0176】
スキル関連エントリー特徴データは、エントリー行動特徴データ、スキル関連性特徴データ及びエントリー文法特徴データを含む。
【0177】
さらに、スキル満足度データは、内容の満足度又はインタラクションの満足度を含み、特徴データ決定モジュール1102は、第1の履歴的要求命令における第2の履歴的要求命令の各サードパーティー音声スキルでのスキル満足度データを決定するとき、各サードパーティー音声スキルのタイプがリソーススキルであるかどうかを判定し、あるサードパーティー音声スキルのタイプがリソーススキルである場合、第2の履歴的要求命令の当該サードパーティー音声スキルでの内容の満足度を決定し、あるサードパーティー音声スキルのタイプが非リソーススキルである場合、第2の履歴的要求命令の当該サードパーティー音声スキルでのインタラクションの満足度を決定することに用いられる。
【0178】
さらに、特徴データ決定モジュール1102は、第2の履歴的要求命令の当該サードパーティー音声スキルでの内容の満足度を決定するとき、第2の履歴的要求命令の当該サードパーティー音声スキルでの第1のリソース再生時間と前記内蔵の音声スキルでの第2のリソース再生時間を取得し、第1のリソース再生時間と第2のリソース再生時間に基づいて内容の満足度を決定することに用いられる。
【0179】
さらに、特徴データ決定モジュール1102は、第2の履歴的要求命令の当該サードパーティー音声スキルでのインタラクションの満足度を決定するとき、第2の履歴的要求命令が当該サードパーティー音声スキルで対応するマルチラウンド会話テキストを取得し、マルチラウンド会話テキストに基づき、第2の履歴的要求命令の当該サードパーティー音声スキルでのスキル応答の満足度とスキル応答の繰り返し率を決定し、スキル応答の満足度とスキル応答の繰り返し率に基づいてインタラクションの満足度を決定することに用いられる。
【0180】
さらに、命令選別モジュール1103は、スキル満足度データに基づき、第2の履歴的要求命令に対して選別を行うことで、エントリー要求命令を取得するとき、あるサードパーティー音声スキルのタイプがリソーススキルである場合、第2の履歴的要求命令の当該サードパーティー音声スキルでの内容の満足度に基づき、第2の履歴的要求命令に対して選別を行い、エントリー要求命令を取得し、あるサードパーティー音声スキルのタイプが非リソーススキルである場合、内蔵の音声スキルで、第2の履歴的要求命令に対応するリソース再生記録がないと決定した後、第2の履歴的要求命令の当該サードパーティー音声スキルでのインタラクションの満足度に基づき、第2の履歴的要求命令に対して選別を行い、エントリー要求命令を取得することに用いられる。
【0181】
本実施例による音声スキルの起動装置は、図4図9に示す方法の実施例の技術的解決手段を実行することができ、その実現原理と技術的効果が図4図9に示す方法の実施例に類似し、ここでは一つ一つ説明しない。
【0182】
本願の実施例に基づき、本願は、電子デバイスと可読記憶媒体をさらに提供する。
【0183】
図12に示すように、本願の実施例による音声スキルの起動方法の電子デバイスのブロック図である。電子デバイスは、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレームコンピュータ、及び他の適切なコンピュータなどの音声対話機能を有する様々な形態のデジタルコンピュータを指す。電子デバイスはまた、パーソナルデジタルプロセシング、携帯電話、スマートフォン、ウェアラブルデバイス、及び他の同様のコンピューティングデバイスなどの音声対話機能を有する様々な形態のモバイルデバイスを表すこともできる。電子デバイスは、スマートスピーカー、スマートテレビ、スマート冷蔵庫など、音声対話機能を有する様々な形態の家電製品を表すこともできる。本明細書に示されるコンポーネント、それらの接続及び関係、並びにそれらの機能は、単なる例であり、本明細書に記載及び/又は主張の本開示の実現を限定することを意図しない。
【0184】
図12に示すように、当該電子デバイスは、1つ又は複数のプロセッサ1201、メモリ1202、及び高速インタフェースと低速インタフェースを含む各々のコンポーネントを接続するためのインタフェースを含む。各コンポーネントは、異なるバスで接続され、共通のマザーボード上に実装されてもよいし、必要に応じてその他の方法によって実装されてもよい。プロセッサは、電子デバイス内で実行される命令を処理し得て、メモリ内またはメモリ上に記憶された、外部入力/出力装置上(例えば、インタフェースに結合されたディスプレイデバイス)にGUIのグラフィカル情報を表示するための命令を含む。他の実施形態では、必要に応じて、複数のプロセッサおよび/または複数のバスが、複数のメモリおよび複数のメモリとともに使用され得る。同様に、複数の電子デバイスが接続されてもよく、各機器が必要な操作の一部(例えば、サーバアレイ、1組のブレードサーバ、あるいはマルチプロセッサシステムとして機能する)を提供する。図12では、1つのプロセッサ1201を例としている。
【0185】
メモリ1202は、本願による非一時的なコンピュータ可読記憶媒体である。メモリには、少なくとも1つのプロセッサによって実行可能な命令が記憶され、少なくとも1つのプロセッサが本願による音声スキルの起動方法を実行する。本願の非一時的なコンピュータ可読記憶媒体には、コンピュータ命令が記憶され、当該コンピュータ命令が、コンピュータに本願による音声スキルの起動方法を実行させることに用いられる。
【0186】
メモリ1202は、非一時的なコンピュータ可読記憶媒体として、非一時的ソフトウェアプログラム、非一時的コンピュータ実行可能プログラム、及びモジュール、例えば、本願の実施例における音声スキルの起動方法に対応するプログラム命令/モジュール(例えば、図10に示す命令受信モジュール1001、エントリー命令判定モジュール1002、スキル切り替えモジュール1003)を記憶することに用いられることができる。プロセッサ1201は、メモリ1202に記憶されている非一時的なソフトプログラム、命令及びモジュールを実行することにより、サーバの各種の機能応用及びデータ処理を実行し、即ち、上記の方法の実施例における音声スキルの起動方法を実施する。
【0187】
メモリ1202は、オペレーティングシステム、少なくとも1つの機能に必要なアプリケーションを記憶することができるプログラム記憶領域と、図12における電子デバイスの使用に基づいて作成されたデータなどを記憶することができるデータ記憶領域を含む。なお、メモリ1202は、高速ランダムアクセスメモリを含んでもよく、また、少なくとも1つの磁気ディスク記憶装置、フラッシュメモリデバイス、または他の非一時的固体記憶デバイスなどの、非一時的メモリを含んでもよい。いくつかの実施例において、メモリ1202は、プロセッサ1201に対して遠隔設置されるメモリを含んでもよく、これらの遠隔メモリは、ネットワークを通じて図12における電子デバイスに接続されることができる。上記ネットワークの実例は、インターネット、イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク及びこれらの組み合わせが含まれるが、それらに限定されない。
【0188】
図12における電子デバイスはまた、入力装置1203と出力装置1204とを含む。プロセッサ1201、メモリ1202、入力装置1203及び出力装置1204は、バス又はほかの方式によって接続されることができ、図12では、バスによる接続を例としている。
【0189】
入力装置1203は、入力された数字又は文字情報を受信し、図12における電子デバイスのユーザ設定及び機能制御に関連するキー信号入力を生成することができ、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、インディケータロッド、1つ又は複数のマウスボタン、トラックボール、操作レバーなどの入力装置である。出力装置1204は、音声再生デバイス、ディスプレイデバイス、補助照明装置(例えば、LED)、及び触感フィードバック装置(例えば、振動モータ)等を含んでよい。当該ディスプレイデバイスは、液晶ディスプレイ(liquid crystal display,LCD)、発光ダイオード(light emitting diode,LED)ディスプレイ及びプラズマディスプレイを含んでよいが、それらに限定されない。いくつかの実施形態では、ディスプレイデバイスはタッチスクリーンであってよい。
【0190】
本明細書で説明するシステムおよび技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、特定用途向け集積回路(application-specific integrated circuit,ASIC)、コンピュータハードウェア、ファームウェア、ソフトウェア、および/またはそれらの組み合わせにおいて実現され得る。これらの様々な実施形態は、少なくとも1つのプログラマブルプロセッサを含むプログラマブルシステム上で実行および/または解釈可能な1つ以上のコンピュータプログラムで実施することを含み得て、該プログラマブルプロセッサは、専用又は汎用のプログラマブルプロセッサであってよく、記憶システム、少なくとも1つの入力装置、及び少なくとも1つの出力装置からデータ及び命令を受信し、且つデータ及び命令を該記憶システム、該少なくとも1つの入力装置、及び該少なくとも1つの出力装置に送信することができる。
【0191】
これらのコンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、またはコードとも呼ばれる)は、プログラマブルプロセッサの機械命令を含み、これらのコンピュータプログラムは、高レベルの手続きおよび/またはオブジェクト指向プログラミング言語、および/またはアセンブリ/機械語で実施され得る。本明細書で使用された用語「機械可読媒体」および「コンピュータ可読媒体」とは、プログラマブルプロセッサに機械命令および/またはデータを提供するための任意のコンピュータプログラム製品、機器、および/または装置(例えば、磁気ディスク、光学ディスク、メモリ、プログラム可能論理デバイス(programmable logic device,PLD))を指し、機械可読信号としての機械命令を受信する機械可読媒体を含む。「機械可読信号」という用語は、機械命令および/またはデータをプログラマブルプロセッサに提供するための任意の信号を指す。
【0192】
ユーザとの対話を提供するために、本明細書に記載されたシステムおよび技術は、コンピュータ上で実施され得て、該コンピュータは、ユーザに情報を表示するための表示装置(例えば、陰極線管(cathode ray tube,CRT)またはLCD(液晶ディスプレイ)モニタ)と、ユーザがコンピュータに入力を提供することができるキーボードおよびポインティング装置(例えば、マウスまたはトラックボール)と、を有する。他の種類の装置は、ユーザとの対話を提供することに使用されてもよく、例えば、ユーザに提供されるフィードバックは、任意の形態の感覚フィードバック(例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック)であってもよく、ユーザからの入力は、(サウンド入力、音声入力、または触覚入力を含む)任意の形態で受信され得る。
【0193】
本明細書に記載のシステム及び技術は、バックエンド部材を含むコンピューティングシステム(例えば、データサーバとして)、又はミドルウェア部材を含むコンピューティングシステム(例えば、アプリケーションサーバ)、又はフロントエンド部材を含むコンピューティングシステム(例えば、ユーザが本明細書に記載のシステム及び技術の実施形態と対話できるグラフィカルユーザインターフェース又はウェブブラウザを有するユーザコンピュータ)、又はこのようなバックエンド部材、ミドルウェア部材、又はフロントエンド部材の任意の組み合わせを含むコンピューティングシステムにおいて実施され得る。システムの部材は、任意の形式または媒体(例えば、通信ネットワーク)のデジタルデータ通信によって互いに接続され得る。通信ネットワークの例としては、例えば、ローカルエリアネットワーク(local area network,LAN)、ワイドエリアネットワーク(wide area network,WAN)、インターネット等が挙げられる。
【0194】
コンピュータシステムは、クライアント及びサーバを含み得る。クライアント及びサーバは、一般に、互いから離れており、通常、通信ネットワークを介して対話する。クライアントとサーバの関係は、それぞれのコンピュータ上で実行され、互いにクライアント-サーバ関係を有するコンピュータプログラムによって生成される。
【0195】
本願の実施例の技術的解決手段によれば、電子デバイスには、内蔵の音声スキルが設定されており、現在の要求命令がサードパーティー音声スキルのエントリー要求命令に属するかどうかを判定することで、サードパーティー音声スキルが、現在の内蔵の音声スキルと公平に競争に参加することができる。また、サードパーティー音声スキルとマッピング関係のあるエントリー要求命令は、第1の履歴的要求命令の各サードパーティー音声スキルでのスキル関連特徴データに基づき、第1の履歴的要求命令に対して選別を行って得られたものであり、当該エントリー要求命令と当該サードパーティー音声スキルとの関連関係が、当該エントリー要求命令と当該内蔵の音声スキルとの関連関係より強いため、現在の要求命令があるサードパーティー音声スキルのエントリー要求命令であると判定し、当該サードパーティー音声スキルにより応答するとき、現在の内蔵の音声スキルによる応答と比べて、ユーザの要求をよりよく満足させることができる。
【0196】
上記に示された様々な形態のフローが、ステップの順序変更、追加、または削除のために使用され得ることが理解されるべきである。例えば、本願に記載された各ステップは、並列に実行されても、順次的に実行されても、異なる順序で実行されてもよく、本願に開示された技術的解決手段の所望の結果を実現できる限り、本明細書はここで限定しない。
【0197】
上記の実施形態は、本願の保護範囲を制限するように構成されない。当業者は、設計要件と他の要素に従って、各種の修正、組合せ、サブコンビネーションまたは代替を行うことが可能であることは明らかである。本願の思想及び原理から逸脱しない限り、行ったあらゆる修正、等価置換及び改良等は、本願の保護範囲に含まれるべきである。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12