(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-06-09
(45)【発行日】2023-06-19
(54)【発明の名称】音声対話プラットフォームの機能ディスパッチ方法および装置
(51)【国際特許分類】
G06F 3/16 20060101AFI20230612BHJP
G10L 15/22 20060101ALI20230612BHJP
G10L 15/10 20060101ALI20230612BHJP
H04L 67/562 20220101ALI20230612BHJP
【FI】
G06F3/16 650
G10L15/22 300Z
G10L15/10 500T
H04L67/562
(21)【出願番号】P 2022532075
(86)(22)【出願日】2020-11-18
(86)【国際出願番号】 CN2020129703
(87)【国際公開番号】W WO2021129240
(87)【国際公開日】2021-07-01
【審査請求日】2022-08-22
(31)【優先権主張番号】201911364193.8
(32)【優先日】2019-12-26
(33)【優先権主張国・地域又は機関】CN
【早期審査対象出願】
(73)【特許権者】
【識別番号】520235782
【氏名又は名称】エーアイ スピーチ カンパニー リミテッド
【氏名又は名称原語表記】AI SPEECH CO., LTD.
(74)【代理人】
【識別番号】100112874
【氏名又は名称】渡邊 薫
(72)【発明者】
【氏名】朱 成亜
(72)【発明者】
【氏名】樊 帥
(72)【発明者】
【氏名】石 ▲ウェイ▼斯
【審査官】岩橋 龍太郎
(56)【参考文献】
【文献】特開2004-288018(JP,A)
【文献】特開2017-107078(JP,A)
【文献】特表2015-528140(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 3/01
G06F 3/048-3/04895
G06F 3/16
G06F 13/00
G10L 15/00-17/26
H04L 51/00ー51/58
H04L 67/00-67/75
(57)【特許請求の範囲】
【請求項1】
サーバに用いられる音声対話プラットフォームの機能ディスパッチ方法であって、
中央制御ディスパッチサービスによって、データ配信サービスから送信される、ユーザ音声を認識したセマンティック結果を受信するステップと、
中央制御ディスパッチサービスによって、前記セマンティック結果に関連する複数の機能サービスを並行してディスパッチし、前記複数の機能サービスからフィードバックされた機能解析結果を取得するステップと、
前記機能サービスの優先度に基づいて前記機能解析結果をソートし、最高優先度の機能解析結果を機能実現判別サービスに導出し、最高優先度の前記機能解析結果によって前記セマンティック結果の機能を実現できるか否かを判断するステップと、
前記機能実現判別サービスから実現の失敗というフィードバックがあった場合、残りの複数の機能解析結果の中から最高優先度の機能解析結果を選択して機能実現判別サービスに導出し、
前記機能実現判別サービスから実現の成功というフィードバックがあった場合、前記最高優先度の機能解析結果をデータ配信サービスに送信して、ユーザにフィードバックするステップと、
を含むことを特徴とする音声対話プラットフォームの機能ディスパッチ方法。
【請求項2】
前記機能実現判別サービスは、
中央制御ディスパッチサービスから送信される最高優先度の機能解析結果を受信するステップと、
前記機能解析結果に対して対話状態追跡を行い、確定された対話状態に基づいて前記機能解析結果によって前記セマンティック結果の機能を実現できるか否かを判断するステップと、
を含むことを特徴とする請求項1に記載の音声対話プラットフォームの機能ディスパッチ方法。
【請求項3】
前記優先度には、少なくと
もコンテキスト優先
度が含まれることを特徴とする請求項1に記載の音声対話プラットフォームの機能ディスパッチ方法。
【請求項4】
前記機能サービスには、質問応答型機能サービスとタスク型機能サービスとが含まれることを特徴とする請求項1に記載の音声対話プラットフォームの機能ディスパッチ方法。
【請求項5】
中央制御ディスパッチサービスによって、データ配信サービスから送信されるユーザ音声を認識したセマンティック結果を受信するために用いられるセマンティック受信プログラムモジュールと、
中央制御ディスパッチサービスによって前記セマンティック結果に関連する複数の機能サービスを並行してディスパッチし、前記複数の機能サービスからフィードバックされた機能解析結果を取得するために用いられる機能解析プログラムモジュールと、
前記機能サービスの優先度に基づいて前記複数の解析結果をソートし、最高優先度の機能解析結果を機能実現判別サービスに導出し、最高優先度の前記機能解析結果によって前記セマンティック結果の機能を実現できるか否かを判断するために用いられる機能実現判別プログラムモジュールと、
前記機能実現判別サービスから実現の失敗というフィードバックがあった場合、残りの複数の機能解析結果の中から最高優先度の機能解析結果を選択して機能実現判別サービスに導出するが、前記機能実現判別サービスから実現の成功というフィードバックがあった場合、前記最高優先度の機能解析結果をデータ配信サービスに送信してユーザにフィードバックするために用いられるディスパッチプログラムモジュールと、
を含むことを特徴とする音声対話プラットフォームの機能ディスパッチ装置。
【請求項6】
前記機能実現判別プログラムモジュールは、
中央制御ディスパッチサービスから送信される最高優先度の機能解析結果を受信し、
前記機能解析結果に対して対話状態追跡を行い、確定された対話状態に基づいて前記機能解析結果によって前記セマンティック結果の機能を実現できるか否かを判断するために用いられる、
ことを特徴とする請求項5に記載の音声対話プラットフォームの機能ディスパッチ装置。
【請求項7】
前記優先度には、少なくと
もコンテキスト優先
度が含まれることを特徴とする請求項5に記載の音声対話プラットフォームの機能ディスパッチ装置。
【請求項8】
前記機能サービスには、質問応答型機能サービスとタスク型機能サービスとが含まれることを特徴とする請求項5に記載の音声対話プラットフォームの機能ディスパッチ装置。
【請求項9】
少なくとも1つのプロセッサと、前記少なくとも1つのプロセッサに通信可能に接続されたメモリと、を含む電子機器であって、
前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶されており、
請求項1~4のいずれか1項に記載の音声対話プラットフォームの機能ディスパッチ方法のステップが実行できるように、前記少なくとも1つのプロセッサによって前記命令を実行させることを特徴とする電子機器。
【請求項10】
コンピュータプログラムが記憶されている記憶媒体であって、
前記プログラムがプロセッサによって実行されると、請求項1~4のいずれか1項に記載の音声対話プラットフォームの機能ディスパッチ方法のステップが実現できる、ことを特徴とする記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、インテリジェント音声分野に関し、特に、音声対話プラットフォームの機能ディスパッチ方法および装置に関する。
【背景技術】
【0002】
音声製品には、複数の異なる機能(ナビゲーション、音楽、ラジオ等)が含まれ、ユーザが入力した音声に対するセマンティック分類と解析結果に基づいて、対応する機能が選択される。
【0003】
セマンティック分類のディスパッチポリシーに基づいて、ある音声製品にはQQ(登録商標)音楽と網易(登録商標)雲音楽が含まれており、QQ(登録商標)音楽機能にセマンティック分類された後、コンテンツが検索できない場合や著作権がない場合には、引き続き網易(登録商標)雲音楽機能においてディスパッチして、検索を完了させることができる。
【0004】
本発明を実現する過程において、発明者は、関連技術において少なくとも以下の問題が存在することを発見した。
機能ディスパッチは、音声対話プラットフォームの中央制御ディスパッチサービスによって処理される。ユーザが検索したコンテンツが人気のないコンテンツであれば、一般的に使用される機能には対応するコンテンツがない。この時、中央制御ディスパッチサービスは、ユーザの今回の検索に対して複数回の機能を繰り返しディスパッチして、対応するコンテンツを照会する必要がある。中央制御ディスパッチサービスが大量のユーザ要求を受信した場合、大量のディスパッチ処理を行う必要がある。この場合、大きな遅延が発生し、ユーザへのフィードバックの効率が低下する。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明は、少なくとも従来技術において、中央制御ディスパッチサービスが大量のユーザ要求を受信した場合、ユーザが要求したリソースが人気のないリソースであるという原因により、中央制御ディスパッチサービスが極めて多い回数のディスパッチを必要とし、ネットワーク遅延が発生し、フィードバック効率が低くなるという問題を解決する。
【課題を解決するための手段】
【0006】
第1態様では、本発明の実施例は、
中央制御ディスパッチサービスによって、データ配信サービスから送信される、ユーザ音声を認識したセマンティック結果を受信するステップと、
中央制御ディスパッチサービスによって、セマンティック結果に関連する複数の機能サービスを並行してディスパッチし、複数の機能サービスからフィードバックされた機能解析結果を取得するステップと、
機能サービスの優先度に基づいて複数の解析結果をソートし、最高優先度の機能解析結果を機能実現判別サービスに導出し、最高優先度の機能解析結果によってセマンティック結果の機能を実現できるか否かを判断するステップと、
機能実現判別サービスから実現の失敗というフィードバックがあった場合、残りの複数の機能解析結果の中から最高優先度の機能解析結果を選択して機能実現判別サービスに導出し、
機能実現判別サービスから実現の成功というフィードバックがあった場合、最高優先度の機能解析結果をデータ配信サービスに送信して、ユーザにフィードバックするステップと、
を含むことを特徴とする音声対話プラットフォームの機能ディスパッチ方法を提供する。
【0007】
第2態様では、本発明の実施例は、
中央制御ディスパッチサービスによって、データ配信サービスから送信されるユーザ音声を認識したセマンティック結果を受信するために用いられるセマンティック受信プログラムモジュールと、
中央制御ディスパッチサービスによってセマンティック結果に関連する複数の機能サービスを並行してディスパッチし、複数の機能サービスからフィードバックされた解析結果を取得するために用いられる機能解析プログラムモジュールと、
機能サービスの優先度に基づいて複数の解析結果をソートし、最高優先度の機能解析結果を機能実現判別サービスに導出し、最高優先度の機能解析結果によってセマンティック結果の機能を実現できるか否かを判断するために用いられる機能実現判別プログラムモジュールと、
機能実現判別サービスから実現の失敗というフィードバックがあった場合、残りの複数の機能解析結果の中から最高優先度の機能解析結果を選択して機能実現判別サービスに導出するが、機能実現判別サービスから実現の成功というフィードバックがあった場合、最高優先度の機能解析結果をデータ配信サービスに送信してユーザにフィードバックするために用いられるディスパッチプログラムモジュールと、
を含むことを特徴とする音声対話プラットフォームの機能ディスパッチ装置を提供する。
【0008】
第3態様では、少なくとも1つのプロセッサと、少なくとも1つのプロセッサに通信可能に接続されたメモリと、を含む電子機器であって、メモリには、少なくとも1つのプロセッサによって実行可能な命令が記憶されており、本発明のいずれかの実施例の音声対話プラットフォームの機能ディスパッチ方法のステップが実行できるように、少なくとも1つのプロセッサによって命令を実行させることを特徴とする電子機器を提供する。
【0009】
第4態様では、コンピュータプログラムが記憶されている記憶媒体であって、当該プログラムがプロセッサによって実行されると、本発明のいずれかの実施例の音声対話プラットフォームの機能ディスパッチ方法のステップが実現できる、ことを特徴とする記憶媒体を提供する。
【発明の効果】
【0010】
本発明の実施例は、以下の有益な効果を有する。セマンティック認識結果を複数の機能サービスに同時に送信し、各機能サービスの解析結果を機能実現判別サービスに送信して順次判別する。中央制御ディスパッチサービスと機能サービスとの間で一度ディスパッチするだけで、ユーザのニーズを実現できる音声機能の解析結果を確定でき、中央制御ディスパッチサービスのディスパッチ回数を減少させることができる。多数のユーザが要求を送信する場合、機能ディスパッチの効率を確保し、遅延を低減し、ユーザの体験を改善させることもできる。
【図面の簡単な説明】
【0011】
本願の実施例の技術方案をより明確に説明するために、以下、実施例の説明において使用される図面について簡単に紹介する。明らかに、以下の説明における図面は、本願のいくつかの実施例である。当業者は、創造的な労働をすることなく、これらの図面に基づいて他の図面を得ることができる。
【0012】
【
図1】本発明の一実施例によって提供される音声対話プラットフォームの機能ディスパッチ方法のフローチャートである。
【
図2】本発明の一実施例によって提供される音声対話プラットフォームの機能ディスパッチ装置の構造概略図である。
【
図3】本発明の電子機器の一実施例の概略構成図である。
【発明を実施するための形態】
【0013】
本発明の実施例の目的、技術方案および利点をより明確にするために、以下では、本発明の実施例における図面と併せて、本発明の実施例における技術方案を明確かつ完全に説明する。もちろん、説明される実施形態は本発明の一部の実施形態にすぎず、本発明の全部の実施形態ではない。本発明の実施形態に基づいて、当業者が創造的な努力なしに得られる他の全ての実施形態も本発明の保護範囲に含まれるべきである。
【0014】
図1は、本発明の一実施例によって提供される音声対話プラットフォームの機能ディスパッチ方法のフローチャートである。この方法はサーバに用いられ、以下のステップを含む。
【0015】
ステップS11において、中央制御ディスパッチサービスによって、データ配信サービスから送信される、ユーザ音声を認識したセマンティック結果を受信する。
【0016】
ステップS12において、中央制御ディスパッチサービスによって、セマンティック結果に関連する複数の機能サービスを並行してディスパッチし、複数の機能サービスからフィードバックされた解析結果を取得する。
【0017】
ステップS13において、機能サービスの優先度に基づいて複数の解析結果をソートし、最高優先度の機能解析結果を機能実現判別サービスに導出し、最高優先度の機能解析結果によってセマンティック結果の機能を実現できるか否かを判断する。
【0018】
ステップS14において、機能実現判別サービスから実現の失敗というフィードバックがあった場合、残りの複数の機能解析結果の中から最高優先度の機能解析結果を選択して機能実現判別サービスに導出し、
機能実現判別サービスから実現の成功というフィードバックがあった場合、最高優先度の機能解析結果をデータ配信サービスに送信して、ユーザにフィードバックする。
【0019】
本実施形態において、ユーザは、インテリジェントデバイスを使用する際に、例えば「**曲を再生します」または「**問題を照会します」などのようにインテリジェントデバイスと対話をする。インテリジェントデバイスは、収集された音声をデータ配信サービスに送信する。音声は、データ配信サービスを介して認識サービスに送信され、セマンティック認識される。データ配信サービスは、ユーザ音声のセマンティック結果を取得した後、セマンティック結果を中央制御ディスパッチサービスに送信する。
【0020】
ステップS11において、中央制御ディスパッチサービスによって、データ配信サービスから送信されるユーザ音声のセマンティック認識結果、例えば、「ある曲を再生します」を受信する。
【0021】
ステップS12において、中央制御ディスパッチサービスによってセマンティック認識結果を受信した後、1つの機能サービスに直接送信するのではなく、当該セマンティック結果をセマンティック結果に関連する複数の機能サービスに同時に並行して送信する。この時、中央制御ディスパッチサービスによって、複数の機能サービスからフィードバックされた解析結果を受信する。「ある曲を再生します」が、例えばQQ(登録商標)音楽、網易(登録商標)雲音楽、酷狗音楽、酷我音楽、蝦米音楽などの複数の関連する機能サービスに並行して送信される。中央制御ディスパッチサービスによって、各音声機能によりフィードバックされた解析結果を受信する。
【0022】
従来の方法では、セマンティック認識結果を確定した後、最高優先度の機能サービスに直接送信する。当該機能サービスによってセマンティック結果の機能を実現できない場合、中央制御ディスパッチサービスによってセマンティック認識結果を他の機能サービスに再送信する必要があり、このようなディスパッチ方法は、中央制御ディスパッチサービスによって継続的に試行する必要があり、効率が低い。
【0023】
ステップS13において、音声製品設計段階において、異なる機能に対して異なる優先度があるため、まず、最高優先度の機能解析結果を機能実現判別サービスに導出して、最高優先度の機能によってセマンティック結果の機能を実現できるか否かを判断する。例えば、セマンティック結果が「『これが愛です』を再生する」であり、各機能はいずれも対応する解析結果をフィードバックしている。この場合、第1優先度の機能はQQ(登録商標)音楽である。QQ(登録商標)音楽機能の解析結果を機能実現判別サービスに導出する。
【0024】
ステップS14において、機能実現判別サービスから実現の失敗というフィードバックがあった場合、例えば、QQ(登録商標)音楽に「これが愛です」のオリジナル曲がなく、ユーザのニーズを実現できない場合には、残りの複数の機能解析の中から最高優先度の機能解析結果を再度選択して機能実現判別サービスに導出する。例えば、この時の最高優先度の機能が網易(登録商標)雲音楽である場合、網易(登録商標)雲音楽機能の解析結果を機能実現判別サービスに導出する。
【0025】
機能実現判別サービスから実現の成功というフィードバックがあった場合、「これが愛です」という曲が網易(登録商標)雲音楽にあることを表明する。網易(登録商標)雲音楽機能の解析結果をデータ配信サービスに送信して、ユーザにフィードバックする。
【0026】
この実施形態によれば、セマンティック認識結果を複数の機能サービスに同時に送信し、各機能サービスの解析結果を機能実現判別サービスに送信して順次判別し、中央制御ディスパッチサービスと機能サービスとの間で一度ディスパッチするだけで、ユーザのニーズを実現できる音声機能の解析結果を確定でき、中央制御ディスパッチサービスと機能サービスのディスパッチ回数を減少させることができる。多数のユーザが要求を送信する場合、機能ディスパッチの効率を確保し、遅延を低減し、ユーザの体験を改善させることもできる。
【0027】
一実施形態として、本実施例において、機能実現判別サービスは、
中央制御ディスパッチサービスから送信される最高優先度の機能解析結果を受信するステップと、
機能解析結果に対して対話状態追跡を行い、確定された対話状態に基づいて機能解析結果によってセマンティック結果の機能を実現できるか否かを判断するステップと、
を含む。
【0028】
本実施形態において、機能実現判別サービスは、機能解析結果に対して対話状態追跡を行い、対応する対話状態を確定することにより、機能解析結果によってセマンティック結果の機能を実現できるか否かを判断する。例えば、音楽機能の他に、いくつかの検索機能に用いることができる。検索エンジンが異なるため、同じキーワードを入力すると異なる検索結果を得る可能性がある。ある検索機能はゴシップ類の情報を検索することが得意で、ある検索機能は学術類の情報を検索することが得意である。対話状態追跡によって取得される対話状態も異なり、さらに異なる機能の解析結果によってセマンティック結果の機能を実現できるか否かを判断する。
【0029】
この実施形態からわかるように、機能実現判別の実現方法が提供されており、フィードバックされたコンテンツがいずれもユーザ所望のコンテンツであることを確保し、ユーザの体験をさらに改善することができる。
【0030】
一実施形態として、本実施例において、優先度には、少なくとも機能優先度とコンテキスト優先度とが含まれる。
【0031】
コンテキスト優先度は、このように理解することができる。例えば、Aエンジン検索機能はゴシップ情報を検索することが得意で、Bエンジン検索機能は学術情報を検索することが得意である。ユーザが学術的な質問を頻繁にしない可能性があることを考慮して、Aエンジン検索機能の優先度はBエンジン検索機能より高い。ユーザが第1ラウンドの対話において学術類の質問要求を入力した場合、上記の方法により、学術類の質問要求をAエンジン検索機能とBエンジン検索機能に同時に並行して送信することができる。Aエンジン検索機能の解析結果によってユーザのニーズを実現できるかどうかを優先的に判断する。Aエンジン検索機能によってユーザのニーズを実現できず、Bエンジン検索機能によって実現できると判断された場合には、Bエンジン検索機能の解析結果をユーザにフィードバックする。ユーザの第2ラウンドの対話ではまた学術類の質問がされている。この時、コンテキスト判断により、第1ラウンドの対話ではBエンジン検索機能によってユーザのニーズを実現できるため、第2ラウンドの対話ではBエンジン検索機能が優先的に考慮される。
【0032】
この実施形態から分かるように、複数の優先度の判別方法が提供されており、ディスパッチロジックをさらに最適化し、機能ディスパッチ効率を向上させることができる。
【0033】
図2は、本発明の一実施例によって提供される音声対話プラットフォームの機能ディスパッチ装置10の構造概略図である。この装置は、上記いずれかの実施例の音声対話プラットフォームの機能ディスパッチ方法を実行することができ、且つ端末に配置される。
【0034】
本実施例によって提供される音声対話プラットフォームの機能ディスパッチ装置10は、セマンティック受信プログラムモジュール11と、機能解析プログラムモジュール12と、機能実現判別プログラムモジュール13と、ディスパッチプログラムモジュール14と、を含む。
【0035】
ここで、セマンティック受信プログラムモジュール11は、中央制御ディスパッチサービスによって、データ配信サービスから送信されるユーザ音声を認識したセマンティック結果を受信するために用いられる。機能解析プログラムモジュール12は、中央制御ディスパッチサービスによってセマンティック結果に関連する複数の機能サービスを並行してディスパッチし、複数の機能サービスからフィードバックされた解析結果を取得するために用いられる。機能実現判別プログラムモジュール13は、機能サービスの優先度に基づいて複数の解析結果をソートし、最高優先度の機能解析結果を機能実現判別サービスに導出し、最高優先度の機能解析結果によってセマンティック結果の機能を実現できるか否かを判断するために用いられる。ディスパッチプログラムモジュール14は、機能実現判別サービスから実現の失敗というフィードバックがあった場合、残りの複数の機能解析結果の中から最高優先度の機能解析結果を選択して機能実現判別サービスに導出するが、機能実現判別サービスから実現の成功というフィードバックがあった場合、最高優先度の機能解析結果をデータ配信サービスに送信してユーザにフィードバックするために用いられる。
【0036】
機能実現判別プログラムモジュールは、
中央制御ディスパッチサービスから送信される最高優先度の機能解析結果を受信し、
機能解析結果に対して対話状態追跡を行い、確定された対話状態に基づいて機能解析結果によってセマンティック結果の機能を実現できるか否かを判断するために用いられる。
【0037】
さらに、優先度には、少なくとも機能優先度とコンテキスト優先度とが含まれる。
さらに、機能サービスには、質問応答型機能サービスとタスク型機能サービスとが含まれる。
【0038】
本発明の実施例は、不揮発性コンピュータ記録媒体をさらに提供し、上記のいずれかの方法実施例における音声対話プラットフォームの機能ディスパッチ方法を実行可能なコンピュータにより実行可能な命令が記憶されている。
【0039】
一実施形態として、本発明の不揮発性コンピュータ記録媒体に記憶されているコンピュータにより実行可能な命令は、以下のように構成される。
中央制御ディスパッチサービスによって、データ配信サービスから送信される、ユーザ音声を認識したセマンティック結果を受信する。
中央制御ディスパッチサービスによって、セマンティック結果に関連する複数の機能サービスを並行してディスパッチし、複数の機能サービスからフィードバックされた解析結果を取得する。
機能サービスの優先度に基づいて複数の解析結果をソートし、最高優先度の機能解析結果を機能実現判別サービスに導出し、最高優先度の機能解析結果によってセマンティック結果の機能を実現できるか否かを判断する。
機能実現判別サービスから実現の失敗というフィードバックがあった場合、残りの複数の機能解析結果の中から最高優先度の機能解析結果を選択して機能実現判別サービスに導出し、
機能実現判別サービスから実現の成功というフィードバックがあった場合、最高優先度の機能解析結果をデータ配信サービスに送信して、ユーザにフィードバックする。
【0040】
不揮発性コンピュータ可読記憶媒体として、不揮発性ソフトウェアプログラム、不揮発性コンピュータ実行可能なプログラムおよびモジュール、例えば本発明の実施例における方法に対応するプログラム命令/モジュールを記憶するために用いることができる。1つまたは複数のプログラム命令は、不揮発性コンピュータ可読記憶媒体に記憶され、プロセッサによって実行されると、上述したいずれかの方法実施例における音声対話プラットフォームの機能ディスパッチ方法が実行できる。
【0041】
不揮発性コンピュータ可読記憶媒体は、プログラム記憶領域とデータ記憶領域を含むことができる。ここで、プログラム記憶領域は、オペレーティングシステムと少なくとも1つの機能に必要なアプリケーションプログラムとを記憶することができる。データ記憶領域は、装置の使用に応じて作成されたデータなどを記憶することができる。さらに、不揮発性コンピュータ可読記憶媒体は、高速ランダムアクセスメモリを含むことができ、不揮発性メモリ、例えば少なくとも1つの磁気ディスク記憶装置、フラッシュメモリ装置、または他の不揮発性固体記憶装置を含むことができる。いくつかの実施例において、不揮発性コンピュータ可読記憶媒体は、プロセッサから離れて設置されたメモリを選択的に含むことができ、これらのリモートメモリは、ネットワークを介して装置に接続することができる。上記ネットワークの例には、インタネット、イントラネット、ローカルエリアネットワーク、移動体通信ネットワークおよびそれらの組合せが含まれるが、これらに限定されない。
【0042】
本発明の実施例はさらに、少なくとも1つのプロセッサと、少なくとも1つのプロセッサに通信可能に接続されたメモリと、を含む電子機器であって、メモリには、少なくとも1つのプロセッサによって実行可能な命令が記憶されており、
中央制御ディスパッチサービスによって、データ配信サービスから送信される、ユーザ音声を認識したセマンティック結果を受信するステップと、
中央制御ディスパッチサービスによって、セマンティック結果に関連する複数の機能サービスを並行してディスパッチし、複数の機能サービスからフィードバックされた解析結果を取得するステップと、
機能サービスの優先度に基づいて複数の解析結果をソートし、最高優先度の機能解析結果を機能実現判別サービスに導出し、最高優先度の機能解析結果によってセマンティック結果の機能を実現できるか否かを判断するステップと、
機能実現判別サービスから実現の失敗というフィードバックがあった場合、残りの複数の機能解析結果の中から最高優先度の機能解析結果を選択して機能実現判別サービスに導出し、
機能実現判別サービスから実現の成功というフィードバックがあった場合、最高優先度の機能解析結果をデータ配信サービスに送信して、ユーザにフィードバックするステップと、
が実行できるように、少なくとも1つのプロセッサによって命令を実行させる電子機器を提供する。
【0043】
一実施形態として、前記機能実現判別サービスは、中央制御ディスパッチサービスから送信される最高優先度の機能解析結果を受信するステップと、前記機能解析結果に対して対話状態追跡を行い、確定された対話状態に基づいて前記機能解析結果によって前記セマンティック結果の機能を実現できるか否かを判断するステップと、を含む。
【0044】
一実施形態として、前記優先度には、少なくとも機能優先度とコンテキスト優先度とが含まれる。
【0045】
一実施形態として、前記機能サービスには、質問応答型機能サービスとタスク型機能サービスとが含まれる。
【0046】
図3は、本発明の他の実施例によって提供される音声対話プラットフォームの機能ディスパッチ方法を実行する電子機器のハードウェア構造概略図ある。
図3に示すように、この機器は、1つまたは複数のプロセッサ310とメモリ320とを含み、
図3では、1つのプロセッサ310を例としている。
【0047】
音声対話プラットフォームの機能ディスパッチ方法を実行する機器は、入力装置330と出力装置340とをさらに含むことができる。
【0048】
プロセッサ310、メモリ320、入力装置330及び出力装置340は、バスを介して接続されてもよいし、他の方法で接続されてもよく、
図3では、バスを介した接続を例とする。
【0049】
メモリ320は、不揮発性コンピュータ可読記憶媒体であり、不揮発性ソフトウェアプログラム、不揮発性コンピュータ実行可能なプログラムおよびモジュール、例えば本発明の実施例における音声対話プラットフォームの機能ディスパッチ方法に対応するプログラム命令/モジュールを記憶するために用いることができる。プロセッサ310は、メモリ320に記憶されている不揮発性ソフトウェアプログラム、命令およびモジュールを実行することにより、サーバの各種機能応用およびデータ処理を実行し、上記方法実施例の音声対話プラットフォームの機能ディスパッチ方法を実現する。
【0050】
メモリ320は、プログラム記憶領域とデータ記憶領域を含むことができる。プログラム記憶領域は、オペレーティングシステムや少なくとも1つの機能に必要なアプリケーションプログラムを記憶することができる。データ記憶領域は、音声対話プラットフォームの機能ディスパッチ装置の使用に応じて作成されたデータなどを記憶することができる。さらに、メモリ320は、高速ランダムアクセスメモリを含むことができ、不揮発性メモリ、例えば少なくとも1つの磁気ディスク記憶装置、フラッシュメモリ装置、または他の不揮発性固体記憶装置を含むことができる。いくつかの実施例において、メモリ320は、プロセッサ310から離れて設置されたメモリを選択的に含むことができ、これらのリモートメモリは、ネットワークを介して音声対話プラットフォームの機能ディスパッチ装置に接続することができる。上記ネットワークの例には、インタネット、イントラネット、ローカルエリアネットワーク、移動体通信ネットワークおよびそれらの組合せが含まれるが、これらに限定されない。
【0051】
入力装置330は、入力された数値や文字情報を受信し、音声対話プラットフォームの機能ディスパッチ装置のユーザ設置および機能制御に関連する信号を生成することができる。出力装置340は、ディスプレイなどの表示装置を含むことができる。
【0052】
1つまたは複数のモジュールはメモリ320に記憶され、1つまたは複数のプロセッサ 310によって実行されると、上記任意の方法実施例における音声対話プラットフォームの機能ディスパッチ方法を実行する。
【0053】
本発明の実施形態の電子デバイスは、以下のデバイスを含むが、これらに限定されない様々な形態で存在する。
【0054】
(1)モバイル通信デバイス:これらのデバイスは、その特徴がモバイル通信機能を備えることであり、音声及びデータ通信を提供することを主な目標として、スマートフォン(例えば、iphone(登録商標))、マルチメディア携帯電話、機能携帯電話、ローエンド携帯電話などを含む。
(2)ウルトラモバイルパソコンデバイス:これらのデバイスは、パソコンのカテゴリーに属し、計算及び処理の機能を持ち、一般にモバイルインターネットアクセスの特性を持って、例えば、iPad(登録商標)などのPDA、MID及びUMPCデバイスなどを含む。
(3)ポータブルエンターテイメントデバイス:これらのデバイスは、マルチメディアコンテンツを表示及び放送でき、オーディオ、ビデオプレーヤー(例えば、iPod(登録商標))、ハンドヘルドゲームデバイス、電子書籍、インテリジェントおもちゃ及びポータブルカーナビゲーションデバイスを含む。
(4)データ交換機能を備えたその他の電子デバイス。
【0055】
上記の装置の実施形態は、例示的だけであり、分離するコンポーネントとして記載されたユニットは、物理的に分離されるものであってもよく、分離されないものであってもよい。ユニットとして表示されるコンポーネントは、物理ユニットであってもよく、物理ユニットではなくてもよい。即ち、 一つの場所に配置することもでき、複数のネットワークユニットに分散することもできる。実際のニーズに応じて、いくつかのモジュール又はすべてのモジュールを選択することができ、実施形態の目的を達成するようになる。
【0056】
上記の実施形態の説明を通じて、当業者は、各実施形態がソフトウェア及び共通のハードウェアプラットフォームによって実現することができ、もちろん、ハードウェアによって実現することもできることを明確に理解することができる。この理解に基づいて、上記の技術方案の本質又は関連技術に貢献する部分は、ソフトウェア製品の形式で具体化でき、コンピューターソフトウェア製品は、例えば、ROM/RAM、磁気ディスク、コンパクトディスクなどのコンピュータ可読記憶媒体に格納でき、コンピューターデバイス(パーソナルコンピューター、サーバ又はネットワークデバイスなどである)に、各々の実施形態又は実施形態のある部分に記載された方法を実行させるように、いくつかの命令を含む。
【0057】
最後に、上記した実施形態は、本発明の技術構成を説明するためのものであり、本発明を限定するためのものではない。当業者であれば、本発明の技術構成の趣旨や範囲を逸脱しない前提下で、上述した実施形態に対して修正することもできるし、一部の技術的特徴を均等置換することもできる。これらの修正や置換は、いずれも本発明の保護範囲に含まれるべきである。