IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッドの特許一覧 ▶ シャンハイ シャオドゥ テクノロジー カンパニー リミテッドの特許一覧

<>
  • 特許-インタラクション方法および装置 図1
  • 特許-インタラクション方法および装置 図2
  • 特許-インタラクション方法および装置 図3
  • 特許-インタラクション方法および装置 図4
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-07-27
(45)【発行日】2022-08-04
(54)【発明の名称】インタラクション方法および装置
(51)【国際特許分類】
   G06F 16/9032 20190101AFI20220728BHJP
【FI】
G06F16/9032
【請求項の数】 16
【外国語出願】
(21)【出願番号】P 2019122909
(22)【出願日】2019-07-01
(65)【公開番号】P2020009439
(43)【公開日】2020-01-16
【審査請求日】2019-07-29
(31)【優先権主張番号】201810725631.8
(32)【優先日】2018-07-04
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】512015127
【氏名又は名称】バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド
(73)【特許権者】
【識別番号】521235408
【氏名又は名称】シャンハイ シャオドゥ テクノロジー カンパニー リミテッド
(74)【代理人】
【識別番号】110001508
【氏名又は名称】弁理士法人 津国
(72)【発明者】
【氏名】メンメン・チャン
(72)【発明者】
【氏名】ジョンジ・ファン
(72)【発明者】
【氏名】レイ・シー
(72)【発明者】
【氏名】リー・ワン
(72)【発明者】
【氏名】チャン・ジュ
(72)【発明者】
【氏名】チャオ・イン
(72)【発明者】
【氏名】ウェイ・シェン
(72)【発明者】
【氏名】ジャン・シェ
(72)【発明者】
【氏名】ラン・シュウ
(72)【発明者】
【氏名】ジンヤ・ワン
【審査官】早川 学
(56)【参考文献】
【文献】特開2001-249685(JP,A)
【文献】特開2011-150682(JP,A)
【文献】特開平04-182857(JP,A)
【文献】米国特許出願公開第2014/0272821(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
(57)【特許請求の範囲】
【請求項1】
ユーザにより入力された複数の単語を含む要求情報が、複数の照会意図が関連付けられていること及び照会意図が関連付けられていないことの一方を含む案内条件を満たすと判定したことに応答して、案内情報を生成するとともに、案内情報をユーザにフィードバックすることであって、前記ユーザにより入力された要求情報に照会意図が関連付けられていない案内条件を満たしたと判定すると、インタラクション履歴に基づいて、前記要求情報における複数の単語の一部を置換して、照会意図を示すための予め設定された単語の組み合わせにマッチングした要求情報を取得して、案内情報を生成するとともに、案内情報をユーザにフィードバックすることを含むことと、
要求情報とユーザにより入力された案内情報に対応するフィードバック情報に基づいて、意図の明確な要求情報を生成するとともに、意図の明確な要求情報とバインディングされたプッシュ情報をユーザにフィードバックすることとを含み、
前記予め設定された単語の組み合わせは、予め記憶された複数の異なる予め設定された単語の組み合わせに含まれ、それぞれの予め設定された単語の組み合わせは、1つの照会意図を示し、且つ、プッシュ情報がバインディングされている、
インタラクション装置により実行されるインタラクション方法。
【請求項2】
要求情報は、情報照会要求情報、マルチメディアコンテンツ要求情報、及び通話要求情報のいずれか一つを含む、請求項1に記載の方法。
【請求項3】
案内条件は、複数の照会意図が関連付けられていることを含み、要求情報は、エンティティキーワードを含み、前記案内情報は、前記エンティティキーワードで示されるエンティティのリソースタイプから少なくとも一つのリソースタイプを選択するようにユーザを案内するためのものである、請求項2に記載の方法。
【請求項4】
案内条件は、照会意図が関連付けられていないことを含み、前記案内情報は、続けてフィードバック情報を入力してフィードバック情報と要求情報とで意図の明確な情報を構成するようにユーザを案内するためのものである、請求項2に記載の方法。
【請求項5】
要求情報は、予め設定された動作キーワードを含み、フィードバック情報は、予め設定された動作キーワードに対応する動作対象キーワードを含む、請求項4に記載の方法。
【請求項6】
案内条件は、照会意図が関連付けられていないことを含み、前記案内情報は、ユーザにより入力された要求情報と意味的に類似する要求情報を意図の明確な要求情報とするかどうかを決定するようにユーザを案内するためのものである、請求項2に記載の方法。
【請求項7】
要求情報は、ユーザにより入力された照会音声に対して音声認識を行って得られたものであり、フィードバック情報は、ユーザにより入力されたフィードバック音声に対して音声認識を行って得られたものである、請求項1~6のいずれか1項に記載の方法。
【請求項8】
ユーザにより入力された複数の単語を含む要求情報が、複数の照会意図が関連付けられていること及び照会意図が関連付けられていないことの一方を含む案内条件を満たすと判定したことに応答して、案内情報を生成するとともに、案内情報をユーザにフィードバックするように構成される応答手段と、
要求情報とユーザにより入力された案内情報に対応するフィードバック情報に基づいて、意図の明確な要求情報を生成するとともに、意図の明確な要求情報とバインディングされたプッシュ情報をユーザにフィードバックするように構成されるフィードバック手段とを備え、
前記応答手段は、さらに、前記ユーザにより入力された要求情報に照会意図が関連付けられていない案内条件を満たしたと判定すると、インタラクション履歴に基づいて、前記要求情報における複数の単語の一部を置換して、照会意図を示すための予め設定された単語の組み合わせにマッチングした要求情報を取得して、案内情報を生成するとともに、案内情報をユーザにフィードバックするように構成され、
前記予め設定された単語の組み合わせは、予め記憶された複数の異なる予め設定された単語の組み合わせに含まれ、それぞれの予め設定された単語の組み合わせは、1つの照会意図を示し、且つ、プッシュ情報がバインディングされている、
インタラクション装置。
【請求項9】
要求情報は、情報照会要求情報、マルチメディアコンテンツ要求情報、及び通話要求情報のいずれか一つを含む、請求項8に記載の装置。
【請求項10】
案内条件は、複数の照会意図が関連付けられていることを含み、要求情報は、エンティティキーワードを含み、前記案内情報は、前記エンティティキーワードで示されるエンティティのリソースタイプから少なくとも一つのリソースタイプを選択するようにユーザを案内するためのものである、請求項9に記載の装置。
【請求項11】
案内条件は、照会意図が関連付けられていないことを含み、前記案内情報は、続けてフィードバック情報を入力してフィードバック情報と要求情報とで意図の明確な情報を構成するようにユーザを案内するためのものである、請求項9に記載の装置。
【請求項12】
要求情報は、予め設定された動作キーワードを含み、フィードバック情報は、予め設定された動作キーワードに対応する動作対象キーワードを含む、請求項11に記載の装置。
【請求項13】
案内条件は、照会意図が関連付けられていないことを含み、前記案内情報は、ユーザにより入力された要求情報と意味的に類似する要求情報を意図の明確な要求情報とするかどうかを決定するようにユーザを案内するためのものである、請求項9に記載の装置。
【請求項14】
要求情報は、ユーザにより入力された照会音声に対して音声認識を行って得られたものであり、フィードバック情報は、ユーザにより入力されたフィードバック音声に対して音声認識を行って得られたものである、請求項8~13のいずれか1項に記載の装置。
【請求項15】
コンピュータプログラムが記憶されているコンピュータ可読記憶媒体であって、前記コンピュータプログラムが実行される場合、請求項1~7のいずれか1項に記載の方法を実現させる、コンピュータ可読記憶媒体。
【請求項16】
コンピュータプログラムであって、
前記コンピュータプログラムがプロセッサにより実行されると、請求項1~7のいずれか一項に記載の方法を実現させるコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本願はコンピュータ分野に関し、具体的にインタラクション分野に関し、特にインタラクション方法及び装置に関する。
【背景技術】
【0002】
例えば音声でユーザとインタラクションすることにより、ユーザが取得しようとする情報をフィードバックする機能は、インテリジェントデバイスの基礎機能である。現在、一般的なインタラクションプロセスは、ユーザがある方面の情報を取得しようとする際に、照会意図に関連付ける要求情報を入力して、要求情報によって照会意図を決定できると、照会意図に基づいてユーザにフィードバックする情報を決定して、決定された情報をユーザにフィードバックする一方、要求情報によって照会意図を決定できないと、ユーザに情報をフィードバックしない。
【発明の概要】
【発明が解決しようとする課題】
【0003】
本願の実施例は、インタラクション方法及び装置を提供する。
【課題を解決するための手段】
【0004】
第1態様では、本願の実施例は、ユーザにより入力された要求情報が、複数の照会意図が関連付けられていること及び照会意図が関連付けられていないことの一方を含む案内条件を満たすと判定したことに応答して、案内情報を生成するとともに、案内情報をユーザにフィードバックすることと、要求情報とユーザにより入力さらた案内情報に対応するフィードバック情報に基づいて、意図の明確な要求情報を生成するとともに、意図の明確な要求情報とバインディングされたプッシュ情報をユーザにフィードバックすることとを含む、インタラクション方法を提供する。
【0005】
第2態様では、本願の実施例は、ユーザにより入力された要求情報が、複数の照会意図が関連付けられていること及び照会意図が関連付けられていないことの一方を含む案内条件を満たすと判定したことに応答して、案内情報を生成するとともに、案内情報をユーザにフィードバックするように構成される応答手段と、要求情報とユーザにより入力さらた案内情報に対応するフィードバック情報に基づいて、意図の明確な要求情報を生成するとともに、意図の明確な要求情報とバインディングされたプッシュ情報をユーザにフィードバックするように構成されるフィードバック手段とを備える、インタラクション装置を提供する。
【発明の効果】
【0006】
本願の実施例が提供するインタラクション方法及び装置は、ユーザにより入力された要求情報が、複数の照会意図が関連付けられていること及び照会意図が関連付けられていないことの一方を含む案内条件を満たすと判定したことに応答して、案内情報を生成するとともに、案内情報をユーザにフィードバックすることと、要求情報とユーザにより入力さらた案内情報に対応するフィードバック情報に基づいて、意図の明確な要求情報を生成するとともに、意図の明確な要求情報とバインディングされたプッシュ情報をユーザにフィードバックすることとを含む。ユーザとインタラクションする過程において、ユーザにより入力された要求情報に対して複数の照会意図が関連付けられている状況、意図が不完全な状況などでは、ユーザとのインタラクションにより、明確な照会意図が関連付けられている意図の明確な要求情報を決定し、意図の明確な要求情報を利用して対応するプッシュ情報を取得しユーザにフィードバックして、ユーザとインタラクションする過程において、ユーザが取得しようとする情報をフィードバックする精度を向上させる。
【図面の簡単な説明】
【0007】
本願の他の特徴、目的および利点は、以下の図面を参照して説明される非限定的な実施例を読むことによって、より明らかになる。
図1】本願の実施例を実現するのに適した例示的なシステム構成を示す。
図2】本願のインタラクション方法にかかる一実施例を示すフローチャートである。
図3】本願のインタラクション装置にかかる一実施例の構成概略図である。
図4】本願の実施例の端末を実現するのに適したコンピュータシステムの構成概略図である。
【発明を実施するための形態】
【0008】
以下、図面及び実施例を参照しながら本願をさらに詳細に説明する。本明細書に記載された具体的な実施例は、単に本発明を説明するためのものであり、本発明を限定するものではないことが理解されるべきである。なお、説明の便宜上、図面には、かかる発明に関連する部分のみが示されている。
【0009】
なお、矛盾しない場合に、本願における実施例及び実施例における特徴は互いに組み合わせることができる。以下、図面及び実施例を参照しながら本願を詳細に説明する。。
【0010】
図1を参照すると、本願の実施例を実現するこの適合した例示的なシステム構成が示されている。
【0011】
図1に示すように、端末101、ネットワーク102、サーバ103を含む。ネットワーク102は、有線通信ネットワークまたは無線通信ネットワークであってもよい。
【0012】
端末101は、インテリジェントデバイス、スマートフォン、タブレット型コンピュータ、車載端末であってもよい。ユーザがある方面の情報を取得する必要がある場合に、ユーザは、端末101で要求情報を入力する。ユーザは、音声で要求情報を入力することができる。端末101のユーザが端末101で入力した要求情報は、サーバ103に送信される。サーバ103は、ユーザにより入力された要求情報が案内条件を満たするか否かを判断することができ、ユーザにより入力された要求情報が案内条件を満たすと判断した場合に、案内情報を生成して、案内情報を端末101に送信して、端末101によってユーザにフィードバックされることができる。ユーザは、フィードバック情報を入力することができ、端末101は、ユーザにより入力されたフィードバック情報をサーバに送信することができ、サーバ103は、要求情報及びユーザにより入力された案内情報に対応するフィードバック情報に基づいて、意図の明確な要求情報を生成するとともに、意図の明確な要求情報とバインディングされたプッシュ情報を端末101に送信して、端末101によってユーザにフィードバックされることができる。
【0013】
図2を参照すると、本願のインタラクション方法にかかる一実施例のフローが示されている。該方法は、ユーザにより入力された要求情報が案内条件を満たすと判定したことに応答して、案内情報を生成するとともに、案内情報をユーザにフィードバックするステップ201を含む。
【0014】
本実施例において、案内条件は、複数の照会意図が関連付けられていること及び照会意図が関連付けられていないことの一方を含む。
【0015】
本実施例において、ユーザは端末で要求情報を入力することができ、端末は要求情報をサーバに送信することができる。サーバは、ユーザにより入力された要求情報が案内条件を満たしているか否かを判断することができる。要求情報にプッシュ情報がバインディングされていないと判定した場合に、要求情報に照会意図が関連付けられていないと判定することができ、ひいては案内条件を満たすと判定することができる。要求情報に複数のプッシュ情報がバインディングされていない場合に、ユーザにより入力された要求情報に複数の照会意図が関連付けられていると判定することができ、ひいては案内条件を満たすと判定することができる。
【0016】
本実施例のいくつかの選択可能な実施形態において、要求情報は、情報照会要求情報、マルチメディアコンテンツ要求情報及び通話要求情報のいずれか1つを含む。情報照会要求情報は、ユーザが天気、交通、生活などの一般的なタイプの情報を取得しようとするニーズに関連付けられている。マルチメディアコンテンツ要求情報は、ユーザがマルチメディアコンテンツを取得しようとするニーズに関連付けられている。通話要求情報は、ユーザの連絡先との通話ニーズに関連付けられている。
【0017】
本実施例において、サーバに複数のスロットが予め設定されており、1つの単語が出現する位置を1つのスロットと称することができ、1つのスロットにおける値が複数であってもよい。各スロットの値を組み合わせることにより、大量の異なる予め設定された単語の組み合わせを構成することができ、サーバには大量の異なる予め設定された単語の組み合わせが予め記憶されており、予め設定された単語の組み合わせのそれぞれは1つの照会意図を示することができ、予め設定された単語の組み合わせのそれぞれにプッシュ情報が予めバインディングされている。例えば、サーバに予め設定された全てのスロットには、動作に対応するスロットと、リソース名称に対応するスロットと、リソースタイプに対応するスロットが含まれている。動作に対応するスロットの値は、閲覧したい、聞きたい、開き、再生などを含むことができる。リソース名称に対応するスロットの値は、大量のリソース名称を含むことができる。リソースタイプに対応するスロットの値は、ニュース、クリップ、音楽、映画を含むことができる。動作に対応するスロット、リソース名称に対応するスロット、リソースタイプに対応するスロットの異なる値を組み合わせることにより、複数の予め設定された単語の組み合わせを構成することができ、予め設定された単語の組み合わせのそれぞれは1つの照会意図を示すことができ、予め設定された単語の組み合わせのそれぞれにプッシュ情報が予めバインディングされている。ユーザにより入力された要求情報が予め設定された単語の組み合わせにマッチングしたかどうかによって、ユーザにより入力された要求情報に対応するプッシュ情報があるかどうかを判定することができ、ひいては照会意図が関連付けられているか否かを判定することができる。ユーザにより入力された要求情報が1つの予め設定された単語の組み合わせにマッチングした場合、この要求情報にこの予め設定された単語の組合せにバインディングされたプッシュ情報がバインディングされていると判定することができる。
【0018】
本実施例において、ユーザにより入力された要求情報に複数の照会意図が関連付けられていると判定すると、フィードバックを行って照会意図をさらに明確にするようにユーザを案内するための案内情報を生成することができる。
【0019】
例えば、ユーザは1つの要求情報を入力して、この要求情報は、サーバに予め記憶された複数の予め設定された単語の組み合わせにマッチングしており、各予め設定された単語の組み合わせにプッシュ情報が予めバインディングされており、マッチングしたすべての予め設定された単語の組み合わせには、プッシュ情報に含まれる複数の異なるタイプのプッシュ情報が予めバインディングされている。案内情報、例えば、「どのタイプの情報を取得しようとしますか」を生成することができる。
【0020】
本実施例において、ユーザにより入力された要求情報に照会意図が関連付けられていないと判定した場合、他の要求情報を利用してプッシュ情報を取得するか否かを決定するようにユーザを案内するための案内情報を生成することができる。
【0021】
例えば、ユーザにより入力された要求情報がサーバに予め記憶されたいずれかの照会意図を示すための予め設定された単語の組み合わせにマッチングしない場合に、インタラクション履歴に基づいて、要求情報における1つの単語を別の単語で置換した後に、予め設定された単語の組み合わせにマッチングした場合に、かかる置換を行って、新たな要求情報を取得することができる。そして、案内情報を生成することができ、例えば、「新たな要求情報を入力したいですか」を生成する。
【0022】
また、例えば、サーバにユーザの連絡先情報に関連する複数の予め設定された単語組み合わせが予め記憶されており、予め設定された単語の組み合わせは、連絡先の氏名、連絡先の電話を含む。ユーザにより入力された要求情報は、1つの連絡先の氏名である小明を含むと、サーバは、ユーザにより入力された要求情報が小明の氏名及び小明の電話を含む予め設定された単語の組み合わせにマッチングしたと判定することができ、案内情報である「小明に電話をかけたいですか」を生成することができる。
【0023】
本実施例のいくつかの選択可能な実施形態において、ユーザにより入力された要求情報は、ユーザにより入力された照会音声に対して音声認識を行って得られたものである。ユーザは、端末で要求情報に対応する照会音声を入力することができ、端末はユーザにより入力された要求情報に対応する照会音声をサーバに送信する。サーバによってこの照会音声を音声認識して、ユーザにより入力された要求情報を取得することができる。
【0024】
本実施例のいくつかの選択可能な実施形態において、ユーザにより入力された要求情報がエンティティキーワードを含み、サーバにこのエンティティキーワードで示されるエンティティに属する複数のリソースタイプのプッシュ情報が予め記憶されており、各リソースタイプのプッシュ情報のそれぞれがこのエンティティキーワードを含む予め設定された1つの単語の組み合わせにバインディングされると、このユーザにより入力された要求情報と各リソースタイプのプッシュ情報のぞれぞれにバインディングされた、予め設定された単語の組み合わせのいずれにもマッチングしたと判定して、ユーザにより入力された要求情報に複数の照会意図が関連付けられていると判定することができる。エンティティキーワードで示されるエンティティの複数のリソースタイプから少なくとも1つのタイプを選択するようにユーザを案内するための案内情報を生成することができる。
【0025】
例えば、ユーザは、要求情報である「ラヴソング」に対応する音声を入力する。この要求情報には、エンティティキーワードとしての「ラヴソング」のみが含まれている。サーバは、この端末から送信された音声を受信した後、音声認識により、ユーザが要求情報である「ラヴソング」を入力したと判定する。サーバは、ラヴソングというエンティティについて、ムービービデオリソースプールと音楽リソースプールとの両方にプッシュ情報が存在すると判定することができる。ラヴソングというエンティティのリソースタイプには映画、音楽などのリソースタイプが含まれる。プッシュ情報にはリソース名称、リソースの再生アドレスなどが含まれることができる。サーバは、ユーザにより入力された要求情報には、「ラヴソング」という映画を見る、「ラヴソング」という音楽を聞くなどの照会意図が関連付けられていると判定する。サーバは、「ラヴソングという映画及び音楽があり、どちらがほしいですか」という案内情報を生成することができる。サーバは、「ラヴソングという映画及び音楽があり、どちらがほしいですか」という案内情報を端末に送信する。端末は案内情報を受信した後に、「ラヴソングという映画及び音楽があり、どちらがほしいですか」という案内情報をユーザに提示する。
【0026】
本実施例のいくつかの選択可能な実施形態において、ユーザにより入力された要求情報に対応するプッシュ情報がないと判定する場合、即ちユーザにより入力された要求情報に照会意図が関連付けられていないと判定して、且つユーザにより入力された要求情報における重みの高い複数の単語が1つの予め設定された単語の組み合わせに出現する場合に、ユーザにより入力された要求情報が不完全であるとさらに判定することができる。フィードバック情報を入力し続けてフィードバック情報と要求情報とで意図の明確な情報を構成するようにユーザを案内するための案内情報を生成することができる。言い換えれば、この案内情報は、フィードバック情報を入力し続けるようにユーザを案内するためのものであり、案内情報をユーザにフィードバックした後に、ユーザはフィードバック情報を入力し続けることができ、フィードバック情報と要求情報とでプッシュ情報がバインディングされている意図の明確な要求情報を構成することができる。
【0027】
ユーザにより入力された要求情報に対応するプッシュ情報がないと判断した場合、即ちユーザにより入力された要求情報に照会意図が関連付けられていないと判定して、且つユーザにより入力された要求情報に予め設定された動作キーワードのみが含まれ、予め設定された動作キーワードに対応する動作対象キーワードが含まれない場合に、ユーザにより入力された要求情報が不完全であるとさらに判定することができる。また、予め設定された動作キーワードに対応する動作対象キーワードをフィードバック情報として入力し続けるようにユーザを案内するための案内情報を生成することができる。
【0028】
例えば、ユーザが要求情報「見たい」を入力すると、この要求情報には予め設定された動作キーワード「見たい」のみが含まれている。サーバは、プッシュ情報がバインディングされ「見たい」を含む複数の予め設定された単語の組み合わせが予め格納されていると判定することができるが、「見たい」対象のコンテンツは空である。
【0029】
サーバは、ユーザにより入力された要求情報が不完全であると判定することができる。サーバは、「よく聞こえません。何を見たいですか」という案内情報を生成することができる。サーバは、「よく聞こえません。何を見たいですか」という案内情報を端末に送信して、端末が受信した後に、ユーザに「よく聞こえません。何を見たいですか」という案内情報をユーザに提示する。ユーザは、「見たい」に対応する動作対象キーワードである、例えば「偶像研修生クリップ」に対応する音声をフィードバック情報として入力することができる。端末はこの音声をサーバに送信する。サーバは、音声認識を行った後に、ユーザにより入力されたフィードバック情報が、「見たい」に対応する動作対象キーワードである、例えば「偶像研修生クリップ」であると判定する。
【0030】
本実施例のいくつかの選択可能な実施形態において、ユーザにより入力された要求情報に対応するプッシュ情報がないと判断した場合、即ちユーザにより入力された要求情報に照会意図が関連付けられていないと判定して、且つユーザにより入力された要求情報と類似する要求情報にプッシュ情報がバインディングされていると判定した場合に、ユーザにより入力された要求情報と類似の要求情報を意図の明確な要求情報として利用して、プッシュ情報を取得するかを決定するようにユーザを案内するための案内情報を生成することができる。
【0031】
例えば、ユーザは、要求情報である「アイドル研修生クリップ」に対応する音声を入力する。サーバは、この端末から送信された音声を受信して音声認識を行った後に、ユーザにより入力された要求情報が「アイドル研修生クリップ」であると判定する。単語分割により「アイドル研修生、クリップ}を得た後に、{アイドル研修生、クリップ}にマッチングした予め設定された単語の組合せがないと判定する。サーバは、{アイドル研修生、クリップ}と、プッシュ情報がバインディングされている、予め設定された単語の組み合わせとの意味の類似度を計算して、計算された意味の類似度に基づいて、プッシュ情報がバインディングされている、予め設定された単語の組み合わせから、{アイドル研修生、クリップ}の意味と類似する{偶像研修生、クリップ}を含む予め設定された単語の組み合わせを検索することができる。{偶像研修生、クリップ}を含む予め設定された単語の組み合わせには、偶像研修生のクリップの再生アドレス、インターフェースを含むプッシュ情報がバインディングされている。サーバは、「偶像研修生のクリップを見たいですよね」という案内情報を生成することができる。「偶像研修生のクリップを見たいですよね」という案内情報を端末に送信する。端末は、サーバから送信された案内情報を受信した後に、「偶像研修生のクリップを見たいですよね」という案内情報をユーザに提示する。
【0032】
上記インタラクション方法は、要求情報とユーザにより入力された案内情報に対応するフィードバック情報に基づいて、意図の明確な要求情報を生成するとともに、意図の明確な要求情報とバインディングされたプッシュ情報をユーザにフィードバックするステップ202を含む。
【0033】
本実施例において、ユーザにより入力された要求情報に複数の照会意図が関連付けられていると判定した場合、案内情報を生成して、ユーザに案内情報をフィードバックした後に、ユーザは案内情報に対応するフィードバック情報を入力することができる。そして、要求情報とユーザにより入力された案内情報に対応するフィードバック情報に基づいて、意図の明確な要求情報を生成するとともに、意図の明確な要求情報とバインディングされたプッシュ情報をユーザにフィードバックすることができる。意図の明確な要求情報にはプッシュ情報がバインディングされている。
【0034】
例えば、ユーザは1つの要求情報を入力する。この要求情報は、サーバに予め記憶された照会意図を示す複数の予め設定された単語の組み合わせにマッチングしたものである。各予め設定された単語の組み合わせにプッシュ情報が予めバインディングされている。予め設定された単語の組み合わせのぞれぞれに予めバインディングされているプッシュ情報には、複数の異なるタイプのプッシュ情報が含まれている。「どのタイプの情報を取得しようとしますか」とう案内情報を生成することができる。案内情報をユーザにフィードバックした後に、ユーザにより入力されたフィードバック情報を受信することができる。フィードバック情報は、ユーザにより入力された取得しようとするタイプの名称であってもよく、フィードバック情報をユーザにより入力された要求情報と組み合わせることにより、プッシュ情報がバインディングされている意図の明確な要求情報を構成することができる。それにより、意図の明確な要求情報によりプッシュ情報を取得して、プッシュ情報をユーザにプッシュすることができる。
【0035】
本実施例において、ユーザにより入力された要求情報に照会意図が関連付けられていないと判定した場合に、他の要求情報を利用してプッシュ情報を取得するか否かを決定するようにユーザを案内するための案内情報を生成して、この案内情報をユーザにフィードバックした後に、ユーザはフィードバック情報を入力することができる。フィードバック情報は、肯定的な情報を示すものであってもよいし、否定的な情報を示すものであってもよい。ユーザにより入力された要求情報及びフィードバック情報に基づいて、意図の明確な要求情報を生成することができる。
【0036】
例えば、ユーザにより入力された要求情報がサーバに予め記憶されたいずれかの照会意図を示すための予め設定された単語の組み合わせにマッチングしない場合に、インタラクション履歴に基づいて、要求情報における1つの単語を別の単語で置換した後に、照会意図を示すための予め設定された単語の組み合わせにマッチングした場合に、かかる置換を行って、新たな要求情報を取得することができる。そして、案内情報を生成することができ、例えば、「新たな要求情報を入力したいですか」という案内情報を生成する。案内情報をユーザにフィードバックした後に、ユーザは、肯定を示す単語、例えば「はい」、又は否定を示す単語、例えば「いいえ」を入力することができる。ユーザにより入力されたフィードバック情報が肯定を示す単語であると判定すると、この新たな要求情報をそのまま意図の明確な要求情報とすることができる。
【0037】
本実施例において、ユーザにより入力された要求情報はエンティティキーワードを含み、ユーザにより入力された要求情報に複数の照会意図が関連付けられていると判断した後に、エンティティキーワードで示されるエンティティの複数のリソースタイプから少なくとも1つのタイプを選択するようにユーザを案内するための案内情報を生成することができる。案内情報をユーザにフィードバックした後、ユーザにより入力されたフィードバック情報を受信することができ、フィードバック情報は、エンティティキーワードで示されるエンティティの複数のリソースタイプから選択されたリソースタイプの名称であってもよい。サーバは、選択されたリソースタイプの名称をフィードバック情報としてエンティティキーワードと組み合わせることにより、プッシュ情報がバインディングされている意図の明確な要求情報を構成することができる。それにより、意図の明確な要求情報によりプッシュ情報を取得して、プッシュ情報をユーザにプッシュすることができる。
【0038】
例えば、ユーザは、要求情報である「ラヴソング」に対応する音声を入力する。サーバは、この端末から送信された音声を受信した後、音声認識により、ユーザが要求情報である「ラヴソング」を入力したと判定する。サーバは、ラヴソングというエンティティついて、ムービービデオリソースプールと音楽リソースプールとの両方にプッシュ情報が存在すると判定することができる。プッシュ情報にはリソース名称、リソースの再生アドレスなどが含まれることができる。サーバは、ユーザにより入力された要求情報には、「ラヴソング」という映画を見る、「ラヴソング」という音楽を聞くなどの照会意図が関連付けられていると判定する。サーバは、「ラヴソングという映画及び音楽があり、どちらがほしいですか」という案内情報を生成することができる。サーバは、「ラヴソングという映画及び音楽があり、どちらがほしいですか」という案内情報を端末に送信する。端末は案内情報を受信した後に、「ラヴソングという映画及び音楽があり、どちらがほしいですか」という案内情報をユーザに提示する。ユーザは「映画」に対応する音声又は「音楽」に対応する音声を入力することができ、端末は「映画」に対応する音声又は「音楽」に対応する音声をサーバに送信して、サーバは、ユーザにより入力されたフィードバック情報が「映画」又は「音楽」であると判定して、「ラヴソング」と「映画」又は「音楽」とを意図の明確な要求情報に組み合わせることにより、「ラヴソング」という名称の映画に対応するプッシュ情報又は「ラヴソング」という音楽に対応するプッシュ情報を取得することができる。
【0039】
本実施例において、ユーザにより入力された要求情報に照会意図が関連付けられていないと判定して、且つユーザにより入力された要求情報が不完全であると判定した場合に、フィードバック情報を入力し続けてフィードバック情報と要求情報とで意図の明確な情報を構成するようにユーザを案内するための案内情報を生成することができる。言い換えれば、この案内情報は、フィードバック情報を入力し続けるようにユーザを案内するためのものであり、案内情報をユーザにフィードバックした後に、ユーザはフィードバック情報を入力し続けることができ、フィードバック情報と要求情報とでプッシュ情報がバインディングされている意図の明確な要求情報を構成することができる。
【0040】
例えば、ユーザが要求情報「見たい」を入力すると、この要求情報には予め設定された動作キーワード「見たい」のみが含まれている。サーバは、プッシュ情報がバインディングされ「見たい」を含む複数の予め設定された単語の組み合わせが予め格納されていると判定することができるが、「見たい」対象のコンテンツは空である。サーバは、ユーザにより入力された要求情報が不完全であると判定することができる。サーバは、「よく聞こえません。何を見たいですか」という案内情報を生成することができる。サーバは、「よく聞こえません。何を見たいですか」という案内情報を端末に送信して、端末が受信した後に、ユーザに「よく聞こえません。何を見たいですか」という案内情報をユーザに提示する。ユーザは、「見たい」に対応する動作対象キーワードである、例えば「偶像研修生クリップ」に対応する音声をフィードバック情報として入力することができる。端末は、この音声をサーバに送信する。サーバは、音声認識を行った後に、ユーザにより入力されたフィードバック情報が「見たい」に対応する動作対象キーワード、例えば「偶像研修生クリップ」であると判定して、「見たい」と、続けて入力されたフィードバック情報とをプッシュ情報がバインディングされている意図の明確な要求情報に組み合わせることができる。
【0041】
本実施例において、ユーザにより入力された要求情報に対応するプッシュ情報がないと判断した場合、即ちユーザにより入力された要求情報に照会意図が関連付けられていないと判定して、且つユーザにより入力された要求情報と類似する要求情報にプッシュ情報がバインディングされていると判定した場合に、ユーザにより入力された要求情報の意味と類似の要求情報を意図の明確な要求情報として利用して、プッシュ情報を取得するかを決定するようにユーザを案内するための案内情報を生成することができる。
【0042】
例えば、ユーザは、要求情報である「アイドル研修生クリップ」に対応する音声を入力する。サーバは、この端末から送信された音声を受信して音声認識を行った後に、ユーザにより入力された要求情報が「アイドル研修生クリップ」であると判定する。単語分割により「アイドル研修生、クリップ}を得た後に、{アイドル研修生、クリップ}にマッチングした予め設定された単語の組合せがないと判定する。サーバは、{アイドル研修生、クリップ}と、プッシュ情報がバインディングされている、予め設定された単語の組み合わせとの意味の類似度を計算して、計算された意味の類似度に基づいて、プッシュ情報がバインディングされている、予め設定された単語の組み合わせから、{アイドル研修生、クリップ}の意味と類似する{偶像研修生、クリップ}を含む予め設定された単語の組み合わせを検索することができる。{偶像研修生、クリップ}を含む予め設定された単語の組み合わせには、偶像研修生のクリップの再生アドレス、インターフェースを含むプッシュ情報がバインディングされている。サーバは、「偶像研修生のクリップを見たいですよね」という案内情報を生成することができる。「偶像研修生のクリップを見たいですよね」という案内情報を端末に送信する。端末は、サーバから送信された案内情報を受信した後に、「偶像研修生のクリップを見たいですよね」という案内情報をユーザに提示する。ユーザは、肯定を示す単語に対応する音声、例えば「はい」に対応する音声、又は否定を示す単語に対応する音声、例えば「いいえ」に対応する音声を入力することができる。サーバは、音声認識を行った後に、ユーザにより入力されたフィードバック情報が肯定を示す単語又は否定を示す単語であると判定する。ユーザにより入力されたフィードバック情報が肯定を示す単語であると判定すると、{偶像研修生、クリップ}を含む予め設定された単語の組み合せをそのまま意図の明確な情報とすることができる。
【0043】
図3を参照すると、上記各図に示される方法の実施として、本願はインタラクション装置の一実施例を提供して、この装置の実施例は図2に示される方法の実施例に対応する。
【0044】
図3に示すように、本実施例のインタラクション装置は、応答手段301、フィードバック手段302を備える。ここで、応答手段301は、ユーザにより入力された要求情報が、複数の照会意図が関連付けられていること及び照会意図が関連付けられていないことの一方を含む案内条件を満たすと判定したことに応答して、案内情報を生成するとともに、案内情報をユーザにフィードバックするように構成され、フィードバック手段302は、要求情報とユーザにより入力さらた案内情報に対応するフィードバック情報に基づいて、意図の明確な要求情報を生成するとともに、意図の明確な要求情報とバインディングされたプッシュ情報をユーザにフィードバックするように構成される。
【0045】
本実施例のいくつかの選択可能な実施形態において、要求情報は、情報照会要求情報、マルチメディアコンテンツ要求情報及び通話要求情報のいずれか1つを含む。
【0046】
本実施例のいくつかの選択可能な実施形態において、案内条件は、複数の照会意図が関連付けられていることを含み、要求情報は、エンティティキーワードを含み、前記案内情報は、前記エンティティキーワードで示されるエンティティのリソースタイプから少なくとも一つのリソースタイプを選択するようにユーザを案内するためのものである。
【0047】
本実施例のいくつかの選択可能な実施形態において、案内条件は、照会意図が関連付けられていないことを含み、前記案内情報は、フィードバック情報を入力し続けてフィードバック情報と要求情報とで意図の明確な情報を構成するようにユーザを案内するためのものである。
【0048】
本実施例のいくつかの選択可能な実施形態において、要求情報は、予め設定された動作キーワードを含み、フィードバック情報は、予め設定された動作キーワードに対応する動作対象キーワードを含む。
【0049】
本実施例のいくつかの選択可能な実施形態において、案内条件は、照会意図が関連付けられていないことを含み、前記案内情報は、ユーザにより入力された要求情報と意味的に類似する要求情報を意図の明確な要求情報とするかどうかを決定するようにユーザを案内するためのものである。
【0050】
本実施例のいくつかの選択可能な実施形態において、要求情報は、ユーザにより入力された照会音声に対して音声認識を行って得られたものであり、フィードバック情報は、ユーザにより入力されたフィードバック音声に対して音声認識を行って得られたものである。
【0051】
図4には、本願の実施例のサーバを実現するのに適したコンピュータシステムの構成概略図が示されている。
【0052】
図4に示すように、コンピュータシステムは、ROM(Read Only Memory)402に格納されているプログラム、または記憶部408からRAM(Random Access Memory)403にロードされたプログラムに従って各種の適切な動作および処理を実行するCPU(Central Processing Unit)401を備える。RAM403には、コンピュータシステムが動作するために必要な各種プログラムやデータも記憶されている。CPU401、ROM402及びRAM403は、バス404を介して相互に接続されている。また、バス404には、入出力(I/O)インタフェース405も接続されている。
【0053】
I/Oインタフェース405には、入力部406と、出力部407と、ハードディスクなどを含む記憶部408と、LANカードやモデムなどのネットワークインタフェースカードを含む通信部409とが接続されている。通信部409は、インターネットのようなネットワークを介して通信処理を行う。ドライブ410も、必要に応じてI/Oインタフェース405に接続される。磁気ディスクや光ディスク、光磁気ディスク、半導体メモリなどのリムーバブルメディア411は、必要に応じてドライブ410にインストールされることにより、リムーバブルメディア711から読み出されたコンピュータプログラムが必要に応じて記憶部408にインストールされる。
【0054】
特に、本願の実施例で説明されたプロセスは、コンピュータプログラムとして実施されることができる。例えば、本願の実施例は、フローチャートに示される方法を実行するための命令を含むコンピュータ可読媒体に担持されたコンピュータプログラムを含むコンピュータプログラム製品を含む。このコンピュータプログラムは、通信部409を介してネットワークからダウンロードしてインストールされ、および/またはリムーバブルメディア411からインストールされることができる。このコンピュータプログラムが中央処理手段(CPU)401によって実行されると、本願の方法で限定された上記機能が実行される。
【0055】
なお、本願に記載のコンピュータ可読媒体は、コンピュータ可読信号媒体やコンピュータ可読記憶媒体、又は上記両方の任意の組み合わせであってもよい。コンピュータ可読記憶媒体は、特に限定されないが、例えば、電気や磁気、光、電磁気、赤外線または半導体のシステム、装置またはデバイスであってもく、またはこれらの任意の組み合わせであってもよい。コンピュータ可読記憶媒体のより具体的な例には、ータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリーメモリ(ROM)、消去可能プログラマブルリードオンリーメモリ(EPROMまたはフラッシュメモリ)、ータブルコンパクトディスク読み取り専用メモリ(CD-ROM)、光記憶デバイス、磁気記憶デバイス、または上述の任意の適切な組合せが含まれるが、これらに限定されない。本願において、コンピュータ可読記憶媒体は、プログラムを含むかまたは格納する任意の有形媒体であってもよく、そのプログラムは、情報を実行するシステム、装置またはデバイスによって使用されてもよく、またはそれらとともに使用されてもよい。本願において、コンピュータ可読信号媒体は、ベースバンドでまたはキャリアの一部として伝搬される、コンピュータ読み取り可能なプログラムコードを担持するデータ信号を含むことができる。このように伝搬されるデータ信号は、電磁信号、光信号、または上述の任意の適切な組み合わせを含む様々な形態とすることができるが、これらに限定されない。コンピュータ可読信号媒体は、さらに、情報を実行するシステム、装置またはデバイスによって使用され、またはそれらとともに使用されるプログラムを送信、伝播または伝搬することが可能なコンピュータ可読記憶媒体以外の任意のコンピュータ可読媒体とすることができる。コンピュータ可読媒体に含まれるプログラムコードは、無線や電線、光ケーブル、RFなど、またはそれらの任意の適切な組合せを含む任意の適切な媒体を介して伝送されてることができるが、これらに限定されない。
【0056】
図面におけるフローチャートおよびブロック図は、本願の様々な実施例によるシステム、方法およびコンピュータプログラム製品の実施可能な構成、機能および動作を示す。この点に関して、フローチャートまたはブロック図の各ブロックは、所定の論理機能を実施するための1つまたは複数の実行可能な情報を含むモジュール、ブロックまたはコードの一部を示すことができる。なお、いくつかの置換例としての実施例では、ブロックに示す機能は、図面に示す順序とは異なる順序で実行されてもよい。例えば、接続して示される2つのブロックは、実際に、実質的に並行して実行されてもよく、かかる機能によっては、相互に逆の順序で実行されてもよい。なお、ブロック図および/またはフローチャートにおける各ブロック、ならびにブロック図および/またはフローチャートにおけるブロックの組合せは、所定の機能または動作を実行する専用のハードウェアによるシステムによって実施されてもよく、または専用ハードウェアとコンピュータ情報との組合せによって実施されてもよい。
【0057】
以上の説明は、本出願の好適な実施例及び適用される技術原理の説明に過ぎない。当業者であれば、本願に係る発明の範囲は、上記技術的特徴の特定の組み合わせからなる技術的手段に限定されるものではなく、同時に前記発明の主旨から逸脱しない範囲で上記技術的特徴又はその等価な特徴によって任意に組み合わせて形成される他の技術的手段を含むことが理解されべきである。例えば、上記特徴が本願に開示された(これに限定されない)同様な機能を有する技術的特徴と相互に置換されて形成される技術的手段である。
図1
図2
図3
図4