(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-02-16
(45)【発行日】2022-02-25
(54)【発明の名称】音声対話方法、装置、端末、サーバ、可読記憶媒体及びプログラム
(51)【国際特許分類】
G10L 15/22 20060101AFI20220217BHJP
G06F 3/16 20060101ALI20220217BHJP
G10L 13/00 20060101ALI20220217BHJP
G10L 13/047 20130101ALI20220217BHJP
G10L 15/10 20060101ALI20220217BHJP
【FI】
G10L15/22 300Z
G06F3/16 630
G06F3/16 650
G10L13/00 100M
G10L13/047 E
G10L15/10 500T
(21)【出願番号】P 2018145053
(22)【出願日】2018-08-01
【審査請求日】2018-08-01
【審判番号】
【審判請求日】2020-08-13
(31)【優先権主張番号】201711139757.9
(32)【優先日】2017-11-16
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】512015127
【氏名又は名称】バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド
(73)【特許権者】
【識別番号】521235408
【氏名又は名称】シャンハイ シャオドゥ テクノロジー カンパニー リミテッド
(74)【代理人】
【識別番号】100079108
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【氏名又は名称】内藤 和彦
(74)【代理人】
【識別番号】100108213
【氏名又は名称】阿部 豊隆
(72)【発明者】
【氏名】ザン,ゾンチー
(72)【発明者】
【氏名】ウォン,ティアン
【合議体】
【審判長】畑中 高行
【審判官】千葉 輝久
【審判官】川崎 優
(56)【参考文献】
【文献】国際公開第2016/158792(WO,A1)
【文献】特開2017-138698(JP,A)
【文献】特表2007-538432(JP,A)
【文献】米国特許出願公開第2010/0240402(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G10L13/00-15/34
G06F3/16
(57)【特許請求の範囲】
【請求項1】
音声対話方法であって、
音声対話シーンで、サーバからプッシュされた通知情報を受信するステップと、
ユーザの音声により、ユーザの制御対象と制御意図を取得するステップと、
制御対象がサーバに予め記憶されたユーザの選択可能な通知情報に属するか否かを判断するステップと、
制御対象がユーザの選択可能な通知情報に属する場合、サーバが制御対象に対して前記制御意図に対応する制御を実行するステップと、を含み、
ユーザの選択可能な通知情報は、サーバに予め記憶されてユーザに対するプリセットルールを有する通知情報であることを特徴とする音声対話方法。
【請求項2】
前記サーバが制御対象に対して前記制御意図に対応する制御を実行することは、
前記制御意図が取得することであるか否かを判断するステップと、
前記制御意図が取得することである場合、サーバは制御対象の選定した通知情報を再生データに形成してユーザの使用する端末に送信するステップと、を含み、
前記再生データは、ユーザの使用する端末が音声対話シーンでサポートする再生フォーマットのデータを含み、制御対象の選定した通知情報が制御対象に係る通知情報であることを特徴とする請求項1に記載の方法。
【請求項3】
前記サーバが制御対象の選定した通知情報を再生データに形成することは、
サーバが制御対象の選定した通知情報におけるテキストを処理してテキストに対応するオーディオを形成するステップを含むことを特徴とする請求項2に記載の方法。
【請求項4】
ユーザの使用する端末が通知情報の再生データを再生する場合、制御対象の選定した通知情報が変更すれば、サーバは変更後の制御対象の選定した通知情報を再生データに形成してユーザの使用する端末に送信するステップを更に含むことを特徴とする請求項2に記載の方法。
【請求項5】
前記サーバが制御対象に対して前記制御意図に対応する制御を実行することは、
前記制御意図が削除することであるか否かを判断するステップと、
前記制御意図が削除することである場合、サーバは制御対象の選定した通知情報を前記サーバから削除するステップとを更に含むことを特徴とする請求項1に記載の方法。
【請求項6】
各ユーザの選択可能な通知情報は、プッシュ対象がユーザである通知情報、及び/又はプッシュ対象がユーザとプリセット関連を有する他のユーザである通知情報を含むことを特徴とする請求項1~5のいずれかの項に記載の方法。
【請求項7】
前記サーバの記憶装置は、未読通知情報キューと既読通知情報キューを含む複数のキューユニットを含む複数のユーザ記憶ユニットを備え、
1つのユーザ記憶ユニットは、プッシュ対象が同一のユーザである通知情報を記憶し、同一の記憶ユニットの1つのキューユニットは、同一のユーザの同一のソースサービスの通知情報を記憶し、同一のキューユニットの未読情報キューと既読情報キューは、それぞれ同一のユーザの同一のソースサービスの未読通知情報と既読通知情報を記憶するように設置されることを特徴とする請求項1~5の何れかの項に記載の方法。
【請求項8】
音声対話装置であって、
音声対話シーンで、サーバからプッシュされた通知情報を受信する受信モジュールと、
通知情報を記憶する記憶モジュールと、
ユーザの音声により、ユーザの制御対象と制御意図を取得する取得モジュールと、
制御対象がサーバに予め記憶されたユーザの選択可能な通知情報に属するか否かを判断し、制御対象がユーザの選択可能な通知情報に属する場合、サーバが制御対象に対して前記制御意図に対応する制御を実行する制御モジュールとを備え、
ユーザの選択可能な通知情報は、サーバに予め記憶されて、ユーザに対するプリセットルールを有する通知情報であることを特徴とする音声対話装置。
【請求項9】
再生モジュールを更に備え、
前記制御意図が取得することである場合、前記制御モジュールは制御対象の選定した通知情報を再生データに形成して前記再生モジュールに送信するように設置され、
前記再生データは、再生モジュールが音声対話シーンでサポートする再生フォーマットのデータを含み、
制御対象の選定した通知情報が制御対象に係る通知情報であることを特徴とする請求項8に記載の装置。
【請求項10】
前記制御モジュールは、具体的に制御対象の選定した通知情報におけるテキストを処理して、テキストに対応するオーディオを形成するように設置されることを特徴とする請求項9に記載の装置。
【請求項11】
前記制御モジュールが通知情報の再生データを再生する場合、制御対象の選定した通知情報が変更すれば、前記制御モジュールは変更後の制御対象の選定した通知情報を再生データに形成して前記再生モジュールに送信するように設置されることを特徴とする請求項9に記載の装置。
【請求項12】
前記制御意図が削除することである場合、前記制御モジュールは制御対象の選定した通知情報を前記記憶モジュールから削除するように設置されることを特徴とする請求項8に記載の装置。
【請求項13】
端末であって、
1つ又は複数のプロセッサと、
1つ又は複数のプログラムを記憶する記憶装置と、を備え、
前記1つ又は複数のプログラムが前記1つ又は複数のプロセッサにより実行される場合、前記1つ又は複数のプロセッサに請求項1~7の何れかの項に記載の方法を実現させることを特徴とする端末。
【請求項14】
サーバであって、
1つ又は複数のプロセッサと、
1つ又は複数のプログラム、及び通知情報を記憶する記憶装置と、を備え、
前記1つ又は複数のプログラムが前記1つ又は複数のプロセッサにより実行される場合、前記1つ又は複数のプロセッサに請求項1~7の何れかの項に記載の方法を実行させることを特徴とするサーバ。
【請求項15】
コンピュータ可読記憶媒体であって、
コンピュータプログラムを記憶し、該プログラムがプロセッサにより実行される場合、請求項1~7の何れかの項に記載の方法を実現することを特徴とするコンピュータ可読記憶媒体。
【請求項16】
コンピュータにおいて、プロセッサにより実行される場合、請求項1~7の何れかの項に記載の方法を実現することを特徴とするプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声対話技術分野に関し、特に音声対話方法、装置、端末、サーバ、可読記憶媒体及びプログラムに関する。
【背景技術】
【0002】
現在、音声対話という対話方式は、次第に人間とコンピュータとの対話の主流となる。音声対話の操作システムも人々の生活に登場し、例えば、様々な音声アシスタント等。音声対話の操作システムが搭載されているスマートデバイスは、音声を使用して所要な情報を便利に取得できる。しかしながら、現在の音声対話の操作システムは、音声対話シーンで、ユーザが各サービスによってプッシュされた通知情報を積極的に取得又は削除するには、音声対話シーンを終了する必要があり、そうしなければ、図形化のインタフェースで取得又は削除することができない。操作が複雑で、音声対話シーンでのユーザエクスペリエンスを低下してしまって、使用が便利ではなくて、ユーザエクスペリエンスが悪いという技術課題が存在する。
【発明の概要】
【発明が解決しようとする課題】
【0003】
本発明実施例は、音声対話方法、装置、端末、サーバ及び可読記憶媒体を提供し、背景技術における上記の技術課題を少なくとも解決する。
【課題を解決するための手段】
【0004】
第1の態様よれば、本発明実施例は、
ユーザの音声により、ユーザの制御対象と制御意図を取得するステップと、
制御対象がサーバに予め記憶されたユーザの選択可能な通知情報に属するか否かを判断するステップと、
音声対話シーンで、制御対象がユーザの選択可能な通知情報に属する場合、サーバが制御対象に対して前記制御意図に対応する制御を実行するステップと、を含み、
ユーザの選択可能な通知情報は、サーバに予め記憶されて、ユーザに対するプリセットルールを有する通知情報である音声対話方法を提供する。
【0005】
第2の態様によれば、本発明実施例は、
通知情報を記憶する記憶モジュールと、
ユーザの音声により、ユーザの制御対象と制御意図を取得する取得モジュールと、
音声対話シーンで、制御対象がサーバに予め記憶されたユーザの選択可能な通知情報に属するか否かを判断し、制御対象がユーザの選択可能な通知情報に属する場合、サーバが制御対象に対して前記制御意図に対応する制御を実行する制御モジュールと、を備え、
ユーザの選択可能な通知情報は、サーバに予め記憶されて、ユーザに対するプリセットルールを有する通知情報である音声対話装置を提供する。
【0006】
第3の態様によれば、本発明実施例は、
1つ又は複数のプロセッサと、
1つ又は複数のプログラムを記憶する記憶装置と、を備え、
前記1つ又は複数のプログラムが前記1つ又は複数のプロセッサにより実行される場合、前記1つ又は複数のプロセッサに第1の態様の何れかに記載の方法を実現させる端末を提供する。
【0007】
第4の態様によれば、本発明実施例は、
1つ又は複数のプロセッサと、
1つ又は複数のプログラム、及び通知情報を記憶する記憶装置と、を備え、
前記1つ又は複数のプログラムが前記1つ又は複数のプロセッサにより実行される場合、前記1つ又は複数のプロセッサに第1の態様の何れかに記載の方法を実行させるサーバを提供する。
【0008】
第5の態様によれば、コンピュータプログラムを記憶し、該プログラムがプロセッサにより実行される場合、第1の態様の何れかに記載の方法を実現するコンピュータ可読記憶媒体を提供する。
【発明の効果】
【0009】
前記技術案のうちの1つの技術案は、ユーザの制御対象と制御意図に基づいて、制御対象がユーザの選択可能な通知情報に属する場合、サーバが制御対象に対して前記制御意図に対応する制御を実行し;制御対象がユーザの選択可能な通知情報に属することに対するユーザの制御の効率が高まられ、音声対話シーンで音声対話によって実現できる制御タイプを拡大し、音声対話シーンでのユーザエクスペリエンスを向上するというメリット又は有益な効果を有する。
【0010】
前記技術案のうちの別の技術案は、制御モジュールが制御対象に対して制御意図に対応する操作を行い、即ち、音声対話シーンでユーザが音声によって制御対象の選定した通知情報を制御することを実現し、本発明の実施例における音声対話装置のユーザが制御対象の選定した通知情報に対する制御の効率が高まられ、音声対話シーンで音声対話によって実現できる制御タイプを更に拡大し、音声対話シーンでのユーザエクスペリエンスを向上するというメリット又は有益な効果を有する。
【0011】
上記概要は、明細書の目的のために説明されたが、何らかの形態で本発明を限定するものではない。上記例示的な態様、実施形態及び特徴に加えて、図面及び以下の詳細な説明を参照することによって、本発明のさらなる態様、実施形態及び特徴は分かりやすくなる。
【図面の簡単な説明】
【0012】
図面において、特に断らない限り、複数の図面を通して同一符号は同一又は類似の部材又は要素を示す。これらの図面は必ずしも縮尺で描かれたものではない。なお、これらの図面は本発明に開示された幾つかの実施形態のみを示し、本発明の範囲を限定するものではない。
【0013】
【
図1】本発明の実施例1の音声対話方法のフロー図である。
【
図2】本発明実施例5の音声対話方法におけるサーバの記憶装置の略図である。
【
図3】本発明実施例6の音声対話装置の略図である。
【発明を実施するための形態】
【0014】
以下では、幾つかの例示的な実施例のみを簡単に説明する。当業者であれば、本発明の趣旨又は範囲を逸脱せずに、説明した実施例に様々な変更を施すことができると理解できる。従って、図面と説明は本質的に例示的であり、限定的ではないとみなされるべきである。
【0015】
実施例1
本発明実施例1は、音声対話での通知情報制御方法を提供し、
図1に示すように、以下のステップを含む。
【0016】
ステップS100では、ユーザの音声により、ユーザの制御対象と制御意図を取得する。
【0017】
本発明実施例の1つの例において、ユーザの音声は、ユーザの音声データを取得できる端末により取得され、端末は、スマートフォン、タブレット、スマートロボット等の設備を含むが、これらに限られない、多種音声識別技術を使用してユーザの音声を解析して、ユーザの制御対象と制御意図を取得し、選択可能な方式として、ユーザの音声をクラウドサーバにアップロードして解析してもよい、解析した後の結果によってユーザのニーズを取得し、元に取得したユーザの音声データを処理してクラウドサーバにアップロードするデータの大きさを減少してもよい。
【0018】
ステップS200では、制御対象がサーバに予め記憶されたユーザの選択可能な通知情報に属するか否かを判断し、サーバがクラウドサーバであってもよい。
【0019】
ステップS300では、音声対話シーンで、制御対象がユーザの選択可能な通知情報に属する場合、サーバは制御対象に対して前記制御意図に対応する制御を実行する。
【0020】
ここで、ユーザの選択可能な通知情報は、サーバに予め記憶されて、ユーザに対するプリセットルールを有する通知情報である。
【0021】
本発明実施例における音声対話方法は、ユーザの制御対象と制御意図に基づいて、制御対象がユーザの選択可能な通知情報に属する場合、サーバは制御対象に対して前記制御意図に対応する制御を実行し;制御対象がユーザの選択可能な通知情報に属することに対するユーザの制御の効率が高まられ、音声対話シーンで音声対話によって実現できる制御タイプを拡大し、音声対話シーンでのユーザエクスペリエンスを向上する。
【0022】
本発明実施例のうちの1つの例として、ユーザの選択可能な通知情報は、プッシュ対象がユーザである通知情報になる。この例において、ユーザの音声が「私の通知情報があるか」であれば、取得したユーザの制御対象がユーザの未読通知情報であり、制御意図が取得することである。ユーザの音声が「アラームを作成する」であれば、取得したユーザの制御対象が目覚し時計であり、目覚し時計がユーザの選択可能な通知情報ではないので、本発明実施例の音声方法を適用しない。
【0023】
本発明実施例の別の例として、ユーザは親であり、ユーザとプリセット関連を有する他のユーザは、例えば、子であり、ユーザの選択可能な通知情報は、プッシュ対象が自分であり、及びプッシュ対象がこの子であるという通知情報を含む。この例において、ユーザの音声が「〇〇〇(この子)の通知情報があるか」であれば、ユーザの制御対象がこの子であるという未読通知情報を取得し、制御意図が取得することである。
【0024】
実施例2
本発明実施例2は、本発明実施例1に基づき、ユーザの制御意図が取得することである。
【0025】
サーバが制御対象に対して前記制御意図に対応する制御を実行するのは、
制御意図が取得することであるか否かを判断するステップと、
前記制御意図が取得することである場合、サーバは制御対象の選定した通知情報を再生データに形成してユーザの使用する端末に送信するステップと、を含み、
前記再生データは、ユーザの使用する端末が音声対話シーンでサポートする再生フォーマットのデータを含み、制御対象の選定した通知情報が制御対象に係る通知情報である。
【0026】
本発明実施例における音声対話方法は、前記制御意図が取得することである場合、サーバが、制御対象に基づいて再生データを形成してユーザの使用する端末に送信し、即ち、音声対話シーンで音声によってユーザが制御対象の選定した通知情報に対して取得することを実現し、ユーザが制御対象の選定した通知情報を取得する効率が高まられ、音声対話シーンで音声対話によって実現できる操作タイプを更に拡大し、音声対話シーンでのユーザエクスペリエンスを向上する。
【0027】
サーバに予め記憶された通知情報の形式はさまざまであり、テキスト、オーディオ、画像等、及び前記幾つかの形式の組み合わせであってもよい。
【0028】
ユーザの使用する端末は、音声対話シーンで再生フォーマットをサポートすることは制限され、例えば、オーディオと画像フォーマットのファイルを再生でき、テキストフォーマットのファイルを再生できない。この場合、制御対象の中に何れかの通知情報がテキスト、オーディオ、及び画像を含めば、サーバがテキストを処理してテキストに対応するオーディオを形成する。即ち、サーバは該通知情報を処理し、従来のオーディオ、従来の画像、及びテキストに対応するオーディオを含む再生データを形成する。つまり、サーバは、制御対象における各通知情報を再生データに形成するのは、少なくとも以下のステップを含む。
【0029】
サーバは、通知情報におけるテキストを処理してテキストに対応するオーディオに形成する。
【0030】
また、例えば、ユーザの使用する端末が音声対話シーンでサポートする再生ファーマットは、再生可能な特定フォーマットのオーディオである。この場合、制御対象におけるある通知情報は、他のフォーマットのオーディオを含めば、サーバは他のフォーマットのオーディオを処理して、元のオーディオに対応する特定フォーマットのオーディオを形成する。即ち、サーバは、制御対象における通知情報を処理して、元のオーディオに対応する特定フォーマットのオーディオを含む通知情報の再生データを形成する。つまり、サーバは、通知情報の再生データを形成するのは、少なくとも以下のステップを含む。
【0031】
サーバは、通知情報におけるユーザの使用する端末が音声対話シーンでサポートしない再生フォーマットを処理して、音声対話シーンでサポートされる再生フォーマットを形成し、前記制御対象における通知情報に基づいて再生データを形成する。
【0032】
サーバは再生データをユーザの使用する端末に送信した後、プリセット再生ルールによってユーザの使用する端末での再生を制御する必要がある。
【0033】
プリセット再生ルールは、異なるタイプの通知情報に対して、異なる再生ルールを設置することができる。例えば、あるタイプの通知情報に対して、該タイプの通知情報の再生データをユーザの使用する端末に送信した後、直ちに再生するように設置することができ、例えば、天気予報等。例えば、別のタイプの通知情報に対して、該タイプの通知情報の再生データをユーザの使用する端末に送信した後、ユーザが更に対話しなければ再生できないように設置してもよい。対話が手動による対話であってもよいし、音声による対話であってもよい、例えば、データが大きいビデオクリップ等でもよい。
【0034】
更に、ユーザの使用する端末で通知情報の再生データを再生する場合、ユーザの音声により取得されたユーザの制御対象の選定した通知情報が変更すれば、サーバが変更後の制御対象の選定した通知情報を再生データに形成してユーザの使用する端末に送信する。つまり、ある通知情報の再生データを再生する時に、音声対話によって別の制御対象の選定した通知情報を取得することを実現できる。
【0035】
1つの例において、例えば、ユーザの使用する端末で天気予報を再生する時に、ユーザが天気予報を聞きたくない場合、「前へ」、「次へ」、「最後へ」等を使用して、ユーザが変更後の制御対象の選定した通知情報を取得することを実現できる。
【0036】
実施例3
本発明実施例3は、本発明実施例1に基づき、ユーザの制御意図が削除することである。
【0037】
サーバが制御対象に対して前記制御意図に対応する制御を実行するのは以下のステップを含む。
【0038】
制御意図が削除することであるか否かを判断し、
前記制御意図が削除することである場合、サーバが制御対象の選定した通知情報を前記サーバから削除する。
【0039】
本発明実施例における音声対話での通知情報制御方法は、ユーザのニーズが制御対象の選定した通知情報を削除することである場合、サーバは制御対象の選定した通知情報を削除して通知情報を削除することを実現し、即ち、音声対話シーンで音声によってユーザが制御対象の選定した通知情報を削除することを実現し、ユーザが制御対象の選定した通知情報を削除する効率が高まられ、音声対話シーンで音声対話によって実現できる操作タイプを更に拡大し、音声対話シーンでのユーザエクスペリエンスを向上する。
【0040】
実施例4
本発明実施例4は、本発明実施例2と本発明実施例3との組み合わせであり、詳細な説明を控える。
【0041】
実施例5
本発明実施例5は本発明実施例1~4に基づき、各ユーザの選択可能な通知情報に対して更に限定する。
【0042】
各ユーザの選択可能な通知情報は、プッシュ対象がユーザである通知情報、及び/又はプッシュ対象がユーザとプリセット関連を有する他のユーザである通知情報を含む。
【0043】
ユーザの選択可能な通知情報のプッシュ対象が自分であり、及び自分とプリセット関連を有する他のユーザである通知情報であれば、例えば、親としてのユーザが選択できる通知情報は、プッシュ対象が自分である通知情報、及びプッシュ対象が自分の後見する未成年者であるというユーザの通知情報である。当然、後見人ユーザと後見される未成年者ユーザとの間にプリセット関連を作らなければならない。
【0044】
1つの例において、前述した選択可能な通知情報は、プッシュ対象がユーザである通知情報である場合、
ユーザの音声データが「Aサービスの通知情報」であれば、制御対象の選定した通知情報は、プッシュ対象がユーザであるというAサービスの未読通知情報であり、
ユーザの音声データが「昨日の通知情報」であれば、制御対象の選定した通知情報は、プッシュ対象がユーザであるという昨日の未読通知情報であり、
ユーザの音声データが「通知情報」であれば、制御対象の選定した通知情報は、プッシュ対象がユーザであるという全ての未読通知情報であり、
ユーザの音声データが「既読通知情報」であれば、制御対象の選定した通知情報は、プッシュ対象がユーザである全ての既読の通知情報である。
【0045】
通知情報がサーバに記憶される方式は複数があり、1つの選択可能な方式として、
図2に示すように、前記サーバの記憶装置が、複数のユーザ記憶ユニット100、例えば、
図2に示すユーザ1記憶ユニットとユーザ2記憶ユニットとを備え、前記ユーザ記憶ユニットは、複数のキューユニット110、例えば、
図2に示すユーザ1記憶ユニットのキューユニットAとB、ユーザ2記憶ユニットのキューユニットAとCを備え、キューユニットは、未読通知情報キュー111と、既読通知情報キュー112と、例えば、
図2に示すユーザ1記憶ユニットのキューユニットAのサービスAの既読通知情報キュー、サービスAの未読通知情報キュー、サービスBの既読通知情報キュー、サービスBの未読通知情報キューを備える。
【0046】
ここで、1つのユーザ記憶ユニットは、プッシュ対象が同一のユーザである通知情報を記憶し、同一の記憶ユニットのうちの1つのキューユニットは、同一のユーザの同一のソースサービスの通知情報を記憶し、同一のキューユニットの未読情報キューと既読情報キューは、それぞれ同一のユーザの同一のソースサービスの未読通知情報及び既読通知情報を記憶する。
【0047】
1つの例において、プリセット期間後、サーバが既読通知情報を自動的に削除するように設置してもよい。
【0048】
実施例6
本発明実施例6は、
図3に示すように、
通知情報を記憶する記憶モジュール210と、
ユーザの音声によりユーザの制御対象と制御意図を取得する取得モジュール220と、
音声対話シーンで、制御対象がサーバに予め記憶されて、ユーザの選択可能な通知情報に属するか否かを判断し、制御対象がユーザの選択可能な通知情報に属する場合、サーバが制御対象に対して前記制御意図に対応する制御を実行する制御モジュール230と、を備え、
ここで、ユーザの選択可能な通知情報は、サーバに予め記憶されて、ユーザに対するプリセットルールを有する通知情報である音声対話装置を提供する。
【0049】
本発明実施例における音声対話装置は、通知情報を記憶する記憶モジュールと、ユーザの音声によりユーザの制御対象と制御意図を取得する取得モジュールと、音声対話シーンで、制御対象がサーバに予め記憶されて、ユーザの選択可能な通知情報に属するか否かを判断する制御モジュールとを備え、制御対象がユーザの選択可能な通知情報に属する場合、サーバは制御対象に対して前記制御意図に対応する制御を実行する。
【0050】
このようにして、ユーザのニーズが制御対象を制御する場合、制御モジュールは、制御対象に対して制御意図に対応する操作を行い、即ち、音声対話シーンで、ユーザが音声によって制御対象の選定した通知情報を制御することを実現し、本発明実施例における音声対話装置のユーザが制御対象の選定した通知情報を制御する効率が高まられ、音声対話シーンで音声対話によって実現できる制御タイプを更に拡大し、音声対話シーンでのユーザエクスペリエンスを向上する。
【0051】
実施例7
本発明実施例7は本発明実施例6との相違点が、再生モジュールを更に備えることにある。
【0052】
本発明実施例7は再生モジュールを更に備える。
制御モジュールは、前記制御意図が取得することである場合、制御対象に基づき、再生データを形成して再生モジュールに送信するように更に設置され、
ここで、前記再生データは、再生モジュールが音声対話シーンで支持される再生フォーマットのデータを備え、制御対象の選定した通知情報は制御対象に係る通知情報である。
【0053】
本発明実施例における音声対話装置は、ユーザのニーズが制御対象の選定した通知情報を取得する時に、制御モジュールが制御対象の選定した通知情報を再生データに形成して再生モジュールに送信し、即ち、音声対話シーンで音声によってユーザが制御対象の選定した通知情報を取得することを実現し、ユーザが制御対象の選定した通知情報を取得する効率が高まられ、音声対話シーンで音声対話によって実現できる操作タイプを更に拡大し、音声対話シーンでユーザエクスペリエンスを向上する。
【0054】
記憶モジュールに予め記憶された通知情報の形式は様々であり、テキスト、オーディオ、画像等、及び上記幾つか形式の組み合わせであってもよい。
【0055】
再生モジュールが音声対話シーンで再生フォーマットをサポートすることは制限され、例えば、オーディオと画像フォーマットのファイルを再生でき、テキストフォーマットのファイルを再生できない。この場合、制御対象の選定したある通知情報が、テキスト、オーディオ、及び画像を含めば、制御モジュールがテキストを処理してテキストに対応するオーディオを形成する。即ち、制御モジュールは、制御対象の選定したこの通知情報を処理して、従来のオーディオ、従来の画像、及びテキストに対応するオーディオを含む通知情報の再生データを形成する。つまり、制御モジュールは、少なくとも具体的に制御対象の選定した通知情報のうちのテキストを処理してテキストに対応するオーディオを形成するように設置される。
【0056】
また、再生モジュールが音声対話シーンでサポートする再生フォーマットは、再生可能な特定フォーマットのオーディオである。この場合、制御対象の選定したある通知情報が、他のフォーマットのオーディオを含めば、制御モジュールは他のフォーマットのオーディオを処理して、従来のオーディオに対応する特定フォーマットのオーディオを形成し、即ち、制御モジュールは、制御対象の選定した該通知情報を処理して、元のオーディオに対応する特定フォーマットのオーディオを含む通知情報の再生データを形成する。言い換えれば、制御モジュールは、少なくとも具体的に制御対象の選定した通知情報における音声対話装置が音声対話シーンでサポートしない再生フォーマットを処理して、音声対話シーンでサポートする再生フォーマットを形成し、前記通知情報に基づいて再生データに形成する。
【0057】
再生のプリセットルールは、異なるタイプの通知情報に対して異なる再生ルールを設置できる。例えば、あるタイプの通知情報に対して、該タイプの通知情報の再生データを再生モジュールに送信した後、直ちに再生するように設置することができ、例えば、天気予報等。例えば、別のタイプの通知情報に対して、該タイプの通知情報の再生データを再生モジュールに送信した後、ユーザが更に対話しなければ再生できないように設置してもよい、対話は手動による対話であってもよいし、音声による対話であってもよい、例えば、データが大きなビデオクリップ等でもよい。
【0058】
更に、前記制御モジュールがある通知情報の再生データを再生する場合、ユーザのニーズが制御対象の選定した通知情報の変更であれば、変更後の制御対象の選定した通知情報を再生データに形成して前記再生モジュールに送信する。言い換えれば、ある通知情報のデータを再生する時に、音声対話によって別の通知情報を取得することを実現できる。
【0059】
1つの例において、音声対話装置で天気予報を再生する場合、ユーザが天気予報を聞きたくない時に、「前へ」、「次へ」、「最後へ」等を使用して、ユーザが新たに選定した通知情報を取得することを実現できる。
【0060】
実施例8
本発明実施例8が本発明実施例6との相違点は、制御モジュールの具体的な役割にある。
【0061】
1つの例において、前記制御モジュールは、ユーザにより制御対象の選定した通知情報に対する制御操作が削除することである場合、制御対象の選定した通知情報を前記記憶モジュールから削除するように更に設置される。
【0062】
本発明実施例における音声対話装置は、ユーザのニーズが制御対象の選定した通知情報を削除することである場合、制御モジュールは、制御対象の選定した通知情報を削除して制御対象の選定した通知情報の削除を実現し、即ち、音声対話装置が音声対話シーンで音声によってユーザにより制御対象の選定した通知情報を削除することを実現し、ユーザが制御対象の選定した通知情報を削除する効率が高まられ、音声対話シーンで音声対話によって実現できる操作タイプを更に拡大し、音声対話シーンでユーザエクスペリエンスを向上する。
【0063】
実施例9
本発明実施例9は、本発明実施例7と本発明実施例8との組合せであり、詳細な説明を控える。
【0064】
実施例10
本発明実施例10は本発明実施例6~9に基づき、各ユーザの選択可能な通知情報に対して更なる具体的な限定を行う。
【0065】
各ユーザの選択可能な通知情報は、プッシュ対象がユーザである通知情報、及び/又はプッシュ対象がユーザとプリセット関連を有する他のユーザの通知情報を含む。
【0066】
ユーザの選択可能な通知情報は、プッシュ対象が自分及び自分とプリセット関連を有する他のユーザである通知情報であり、例えば、親としてのユーザの選択可能な通知情報は、プッシュ対象が自分であって、及びプッシュ対象が自分の後見する未成年者のユーザである通知情報を含めば、当然、後見人ンユーザと後見される未成年者ユーザとの間にプリセット関連を作らなければならない。
【0067】
1つの例において、前述した選択可能な通知情報は、プッシュ対象がユーザである通知情報である場合、
ユーザの音声データが「Aサービスの通知情報」であれば、制御対象の選定した通知情報は、プッシュ対象がユーザであるというAサービスの未読通知情報であり、
ユーザの音声データが「昨日の通知情報」であれば、制御対象の選定した通知情報は、プッシュ対象がユーザであるという昨日の未読通知情報であり、
ユーザの音声データが「通知情報」であれば、制御対象の選定した通知情報は、プッシュ対象がユーザであるという全ての未読の通知情報であり、
ユーザの音声データは、「既読の通知情報」であれば、制御対象の選定した通知情報は、プッシュ対象がユーザである全ての既読の通知情報である。
【0068】
記憶モジュールにおいて通知情報を記憶する方式は複数があり、1つの選択可能な方式として、記憶モジュールは、未読通知情報キューと既読通知情報キューとを有する複数のキューユニットを有する複数のユーザ記憶ユニットを備え、
ここで、ユーザ記憶ユニットは、プッシュ対象が同一のユーザである通知情報を記憶するように設置され、同一の記憶ユニットの1つのキューユニットが、同一のユーザの同一のソースサービスの通知情報を記憶するように設置され、同一のキューユニットの未読情報キューと既読情報キューが、それぞれ同一のユーザの同一のソースサービスの未読通知情報と既読通知情報を記憶するように設置される。
【0069】
1つの例において、プリセット期間後、既読通知情報が自動に削除されるようにさらに設置してもよい。
【0070】
実施例11
本発明実施例11は、
図4に示すように、
1つ又は複数のプロセッサ310と、
1つ又は複数のプログラムを記憶する記憶装置320と、を備え、
前記1つ又は複数のプログラムが前記1つ又は複数のプロセッサにより実行される場合、前記1つ又は複数のプロセッサに本発明実施例1~5の何れかの項に記載の方法を実行させる端末を提供する。
【0071】
実施例12
本発明実施例12は、
図5に示すように、
1つ又は複数のプロセッサ410と、
1つ又は複数のプログラム及び通知情報を記憶する記憶装置420と、を備え、
前記1つ又は複数のプログラムが前記1つ又は複数のプロセッサにより実行される場合、前記1つ又は複数のプロセッサに本発明実施例1~5の何れかの項に記載の方法を実現させるサーバを提供する。
【0072】
実施例13
本発明実施例12は、コンピュータプログラムを記憶し、該プログラムがプロセッサにより実行される場合、本発明の実施例1~5の何れかの項に記載の方法を実現するコンピュータ可読記憶媒体を提供する。
【0073】
本明細書の説明において、「1つの実施例」、「幾つかの実施例」、「例」、「具体的な例」、又は「幾つかの例」等の記述は、該実施例又は例を参照して説明された具体的な特徴、構造、材料又は特性が本発明の少なくとも1つの実施例又は例に含まれることを意味する。さらに、説明された具体的な特徴、構造、材料又は特性はいずれか又は複数の実施例又は例において適宜な方式で組み合わせることができる。また、矛盾しない限り、当業者は本明細書に記載の異なる実施例又は例及び異なる実施例又は例の特徴を組み合わせることができる。
【0074】
本発明の記載において、別途に明確で具体的な限定がない限り、「複数」の意味は2つ以上である。
【0075】
フローチャートにおいて又はここでほかの形態で説明されたすべてのプロセス又は方法についての説明は、特定のロジック機能又はプロセスのステップを実現するための1つ又は複数の実行可能な命令を含むコードのモジュール、セグメント又は部分を示すと理解でき、且つ、当業者であれば、本発明の好適な実施形態の範囲は別の実現を含み、示された又は検討された順序にもかかわらず、係る機能に応じてほぼ同時に又は反対順序で機能を実行してもよいと理解できる。
【0076】
フローチャートに示された又はここでほかの形態で説明されたロジック及び/又はステップは、例えば、ロジック機能を実現するための実行可能な命令のシーケンスリストとしてみなされてもよく、具体的には、命令実行システム、装置又は機器(例えば、コンピュータに基づくシステム、プロセッサを備えたシステム、又は命令実行システム、装置又は機器から命令を読み取って命令を実行するほかのシステム)の使用に供し、又はこれらの命令実行システム、装置又は機器と組み合わせて使用するように、任意のコンピュータ可読媒体に実現される。本明細書において、「コンピュータ可読媒体」は、命令実行システム、装置又は機器の使用に供し、又はこれらの命令実行システム、装置又は機器と組み合わせて使用するように、プログラムを具備、記憶、通信、伝播又は伝送できる装置である。
【0077】
本発明実施例に記載されるコンピュータ可読媒体は、コンピュータ可読信号媒体、又はコンピュータ可読記憶媒体、又は前記両者の任意の組合せでもよい。コンピュータ可読媒体のより具体的な例(非網羅的なリスト)は、1つ又は複数の配線を有する電気接続部(電子装置)、ポータブルコンピュータディスクボックス(磁気装置)、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、消去可能プログラマブル読み取り専用メモリ(EPROM又はフラッシュメモリ)、ファイバ装置、及びポータブル読み取り専用メモリ(CDROM)を含む。また、コンピュータ可読媒体はさらに、前記プログラムを印刷可能な紙やほかの適切な媒体であってもよく、例えば紙やほかの媒体を光走査し、続いて編集、解釈し又は必要に応じてほかの適宜な形態で処理して前記プログラムを電子的に取得し、その後、コンピュータメモリに記憶する。
【0078】
本発明の実施例では、コンピュータ可読信号媒体はベースバンドに伝播されるデータ信号又は搬送波の一部として伝播されるデータ信号を含んでもよいし、前記データ信号はコンピュータ可読プログラムコードを搭載する。このような伝播されるデータ信号は様々な形態であり、電磁信号、光信号又は上記任意の適切な組合せを含むが、それに限定されない。コンピュータ可読信号媒体はさらにコンピュータ可読記憶媒体以外の任意のコンピュータ可読媒体であってもよく、該コンピュータ可読媒体は命令実行システム、入力法又はデバイスに用いられるプログラム又はそれらと組み合わせて使用されるプログラムを送信、伝播又は伝送できる。コンピュータ可読媒体に含まれるプログラムコードは任意の適切な媒体で伝送でき、無線、ワイヤー、ケーブル、無線周波数(Radio Frequency、RF)等、又はそれらの任意の適切な組合せを含むが、それらに限定されない。
【0079】
なお、本発明の各部分はハードウェア、ソフトウェア、ファームウェア又はそれらの組合せによって実現できると理解できる。上記実施形態では、複数のステップ又は方法は、メモリに記憶され且つ適切な命令実行システムにより実行されるソフトウェア又はファームウェアによって実現できる。例えば、ハードウェアで実現される場合、別の実施形態と同様に、データ信号に対してロジック機能を実現するための論理ゲート回路を有する離散論理回路、適切な組合せ論理ゲート回路を有する特定用途向け集積回路、プログラマブルゲートアレイ(PGA)、フィールドプログラマブルゲートアレイ(FPGA)等という公知技術のうちのいずれか又はそれらの組合せによって実現できる。
【0080】
当業者は、上記実施例の方法に含まれるすべて又は一部のステップを、プログラムによって関連ハードウェアに命令を出して完成させることができ、前記プログラムはコンピュータ可読記憶媒体に記憶され、該プログラムが実行される時、方法の実施例のステップのいずれか又はそれらの組合せを含むと理解できる。
【0081】
また、本発明の各実施例の各機能ユニットは1つの処理モジュールに集積されてもよいし、各ユニットは別々に物理的に存在してもよいし、2つ又は2つ以上のユニットは1つのモジュールに集積されてもよい。上記集積したモジュールはハードウェアの形態で実現されてもよく、ソフトウェア機能モジュールの形態で実現されてもよい。前記集積したモジュールがソフトウェア機能モジュールの形態で実現されて且つ独立した製品として販売又は使用される場合、コンピュータ可読記憶媒体に記憶されてもよい。前記記憶媒体は読み出し専用メモリ、磁気ディスク又は光ディスク等であってもよい。
【0082】
以上、本発明の具体的な実施形態を説明したが、本発明の保護範囲を限定するものではなく、本発明に開示された技術的範囲を逸脱せずに当業者が容易に想到し得る種々の変更や置換はすべて、本発明の保護範囲に属する。従って、本発明の保護範囲は特許請求の範囲に定められる。
【符号の説明】
【0083】
100 ユーザ記憶ユニット
110 キューユニット
111 未読通知情報キュー
112 既読通知情報キュー
210 記憶モジュール
220 取得モジュール
230 制御モジュール
310 端末のプロセッサ
320 端末の記憶装置
410 サーバのプロセッサ
420 サーバの記憶装置