IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ グーグル インコーポレイテッドの特許一覧

特表2024-521189アシスタント上でユーザ意図を理解するための検索結果に基づくトリガリング
<>
  • 特表-アシスタント上でユーザ意図を理解するための検索結果に基づくトリガリング 図1
  • 特表-アシスタント上でユーザ意図を理解するための検索結果に基づくトリガリング 図2
  • 特表-アシスタント上でユーザ意図を理解するための検索結果に基づくトリガリング 図3
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-05-28
(54)【発明の名称】アシスタント上でユーザ意図を理解するための検索結果に基づくトリガリング
(51)【国際特許分類】
   G06F 16/908 20190101AFI20240521BHJP
【FI】
G06F16/908
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2023573250
(86)(22)【出願日】2022-05-27
(85)【翻訳文提出日】2024-01-26
(86)【国際出願番号】 US2022072606
(87)【国際公開番号】W WO2022251869
(87)【国際公開日】2022-12-01
(31)【優先権主張番号】17/333,074
(32)【優先日】2021-05-28
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.BLUETOOTH
(71)【出願人】
【識別番号】502208397
【氏名又は名称】グーグル エルエルシー
【氏名又は名称原語表記】Google LLC
【住所又は居所原語表記】1600 Amphitheatre Parkway 94043 Mountain View, CA U.S.A.
(74)【代理人】
【識別番号】100108453
【弁理士】
【氏名又は名称】村山 靖彦
(74)【代理人】
【識別番号】100110364
【弁理士】
【氏名又は名称】実広 信哉
(74)【代理人】
【識別番号】100133400
【弁理士】
【氏名又は名称】阿部 達彦
(72)【発明者】
【氏名】ティー・ブイ・ラマン
(72)【発明者】
【氏名】ペン・ロン
(72)【発明者】
【氏名】プラヴィール・グプタ
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175FA01
5B175FB04
5B175HA01
(57)【要約】
曖昧なクエリへの関連応答を送出するための方法(200)は、ユーザ(10)に関連付けられたユーザデバイス(110)から、デジタルアシスタントサービス(160)からの情報またはデジタルアシスタントサービスによるアクションの実施のいずれかを要求するクエリ(120)を受信するステップを含む。クエリのユーザ意図が未解決であるとき、方法はまた、検索エンジン(164)から、クエリについての現在トレンドの検索結果を取り出すステップと、検索結果に基づいて、クエリのユーザ意図を解決するステップとを含む。方法は、解決されたユーザ意図に基づいて、クエリへの応答(122)を生成するステップも含む。応答は、解決されたユーザ意図に関連付けられた特定の意図バーティカルから取得された情報、またはデジタルアシスタントサービスによるアクションの履行を含む。
【特許請求の範囲】
【請求項1】
データ処理ハードウェア(144)上で実行されると、前記データ処理ハードウェア(144)に、関連するクエリ応答を送出するための動作を実施させるコンピュータ実装方法(200)であって、前記動作は、
ユーザ(10)に関連付けられたユーザデバイス(110)から、デジタルアシスタントサービス(160)からの情報またはアクションの実施のいずれかを要求するクエリ(120)を受信することと、
前記クエリ(120)のユーザ意図が未解決であると判断することと、
前記クエリ(120)の前記ユーザ意図が未解決であるとの判断に基づいて、
検索エンジン(164)から、前記クエリ(120)についての現在トレンドの検索結果を取り出すことと、
前記検索結果に基づいて、前記クエリ(120)の前記ユーザ意図を解決することと、
前記解決されたユーザ意図に基づいて、前記クエリ(120)への応答(122)を生成することであって、前記応答(122)は、
前記解決されたユーザ意図に関連付けられた特定の意図バーティカルから取得された情報、または
前記デジタルアシスタントサービス(160)によって実施される前記アクションの履行を含む、生成することとを含む、方法(200)。
【請求項2】
前記動作は、前記クエリ(120)を受信したことに応答して、
前記ユーザ意図が曖昧であるかどうかを判断するために、前記クエリ(120)に対してクエリ解釈を実施することと、
前記ユーザ意図が曖昧であるとき、前記クエリ(120)の前記ユーザ意図が未解決であると判断することとをさらに含む、請求項1に記載の方法(200)。
【請求項3】
前記ユーザ意図が曖昧であるかどうかを判断するために、前記クエリ(120)に対してクエリ解釈を実施することは、
前記クエリ(120)の1つまたは複数の可能ユーザ意図の各々についてのそれぞれのスコアを判断するために、前記クエリ(120)を処理することと、
前記クエリ(120)の前記1つまたは複数の可能ユーザ意図の各々について判断された前記それぞれのスコアが信頼性しきい値を満足できないとき、前記ユーザ意図が曖昧であると判断することとを含む、請求項2に記載の方法(200)。
【請求項4】
クエリ解釈を実施することは、前記クエリ(120)の前記1つまたは複数の可能ユーザ意図のうちの1つについての前記それぞれのスコアが前記信頼性しきい値を満足するとき、前記ユーザ意図が曖昧でないと判断することをさらに含む、請求項3に記載の方法(200)。
【請求項5】
前記検索結果に基づいて、前記クエリ(120)の前記ユーザ意図を解決することは、
前記検索エンジン(164)から取り出された前記クエリ(120)についての前記現在トレンドの検索結果の第1の位置にある前記検索結果を識別することと、
前記第1の位置にある前記検索結果に関連付けられた検索結果タイプまたはエンティティのうちの少なくとも1つを判断することと、
前記第1の位置にある前記検索結果に関連付けられた前記検索結果タイプまたは前記エンティティのうちの前記少なくとも1つに基づいて、前記ユーザ意図を解決することとを含む、請求項1から4のいずれか一項に記載の方法(200)。
【請求項6】
前記解決されたユーザ意図は、ニュース探索ユーザ意図、旅行/交通関連ユーザ意図、音楽探索ユーザ意図、自動化コマンド意図、および娯楽探索ユーザ意図のうちの1つを含む、請求項1から5のいずれか一項に記載の方法(200)。
【請求項7】
前記解決されたユーザ意図に関連付けられた前記特定の意図バーティカルは、1つまたは複数のユーザ選好情報ソースを含む、請求項1から6のいずれか一項に記載の方法(200)。
【請求項8】
前記ユーザデバイス(110)はスマートスピーカーを含む、請求項1から7のいずれか一項に記載の方法(200)。
【請求項9】
前記ユーザデバイス(110)はスマートディスプレイを含む、請求項1から7のいずれか一項に記載の方法(200)。
【請求項10】
前記ユーザデバイス(110)はモバイルコンピューティングデバイスを含む、請求項1から7のいずれか一項に記載の方法(200)。
【請求項11】
前記クエリ(120)は、前記ユーザデバイス(110)上で実行する可聴ユーザインターフェース(114)を介して前記ユーザ(10)によって入力された発声クエリ(120)を含む、請求項1から10のいずれか一項に記載の方法(200)。
【請求項12】
前記クエリ(120)は、前記ユーザデバイス(110)上で実行するグラフィカルユーザインターフェース(114)を介して前記ユーザ(10)によって入力された、タイプされたクエリを含む、請求項1から10のいずれか一項に記載の方法(200)。
【請求項13】
前記動作は、前記クエリ(120)への前記応答(122)を前記ユーザデバイス(110)に与えることをさらに含み、前記ユーザデバイス(110)は、前記応答(122)のオーディオ表現またはグラフィカル表現のうちの少なくとも1つを出力するように構成される、請求項1から12のいずれか一項に記載の方法(200)。
【請求項14】
データ処理ハードウェア(144)上で実行されると、前記データ処理ハードウェア(144)に、関連するクエリ応答を送出するための動作を実施させるコンピュータ実装方法(200)であって、前記動作は、
ユーザ(10)に関連付けられたユーザデバイス(110)から、デジタルアシスタントサービス(160)からの情報または前記デジタルアシスタントサービス(160)によるアクションの実施のいずれかを要求するクエリ(120)を受信することと、
前記クエリ(120)のユーザ意図が未解決であると判断することと、
前記クエリ(120)の前記ユーザ意図が未解決であるとの判断に基づいて、
前記デジタルアシスタントサービス(160)に対して情報を要求する、他のユーザからの類似クエリが最近急増したかどうかを判断することと、
類似クエリが最近急増している場合、類似クエリの前記最近の急増に基づいて、前記クエリ(120)の前記ユーザ意図を解決することと、
前記解決されたユーザ意図に基づいて、前記クエリ(120)への応答(122)を生成することであって、前記応答(122)は、
前記解決されたユーザ意図に関連付けられた特定の意図バーティカルから取得された情報、または
前記デジタルアシスタントサービス(160)によって実施される前記アクションの履行を含む、生成することとを含む、方法(200)。
【請求項15】
類似クエリの前記最近の急増に基づいて、前記クエリ(120)の前記ユーザ意図を解決することは、前記他のユーザからの、類似クエリの前記最近の急増におけるしきい値数の最近のクエリによって共有される共通ユーザ意図を抽出することによって、前記ユーザ意図を解決することを含む、請求項14に記載の方法(200)。
【請求項16】
データ処理ハードウェア(144)と、
前記データ処理ハードウェア(144)と通信するメモリハードウェア(146)とを備えるシステム(100)であって、前記メモリハードウェア(146)は、前記データ処理ハードウェア(144)上で実行されると、前記データ処理ハードウェア(144)に動作を実施させる命令を記憶し、前記動作は、
ユーザ(10)に関連付けられたユーザデバイス(110)から、デジタルアシスタントサービス(160)からの情報または前記デジタルアシスタントサービス(160)によるアクションの実施のいずれかを要求するクエリ(120)を受信することと、
前記クエリ(120)のユーザ意図が未解決であると判断することと、
前記クエリ(120)の前記ユーザ意図が未解決であるとの判断に基づいて、
検索エンジン(164)から、前記クエリ(120)についての現在トレンドの検索結果を取り出すことと、
前記検索結果に基づいて、前記クエリ(120)の前記ユーザ意図を解決することと、
前記解決されたユーザ意図に基づいて、前記クエリ(120)への応答(122)を生成することであって、前記応答(122)は、
前記解決されたユーザ意図に関連付けられた特定の意図バーティカルから取得された情報、または
前記デジタルアシスタントサービス(160)によって実施される前記アクションの履行を含む、生成することとを含む、システム(100)。
【請求項17】
前記動作は、前記クエリ(120)を受信したことに応答して、
前記ユーザ意図が曖昧であるかどうかを判断するために、前記クエリ(120)に対してクエリ解釈を実施することと、
前記ユーザ意図が曖昧であるとき、前記クエリ(120)の前記ユーザ意図が未解決であると判断することとをさらに含む、請求項16に記載のシステム(100)。
【請求項18】
前記ユーザ意図が曖昧であるかどうかを判断するために、前記クエリ(120)に対してクエリ解釈を実施することは、
前記クエリ(120)の1つまたは複数の可能ユーザ意図の各々についてのそれぞれのスコアを判断するために、前記クエリ(120)を処理することと、
前記クエリ(120)の前記1つまたは複数の可能ユーザ意図の各々について判断された前記それぞれのスコアが信頼性しきい値を満足できないとき、前記ユーザ意図が曖昧であると判断することとを含む、請求項17に記載のシステム(100)。
【請求項19】
クエリ解釈を実施することは、前記クエリ(120)の前記1つまたは複数の可能ユーザ意図のうちの1つについての前記それぞれのスコアが前記信頼性しきい値を満足するとき、前記ユーザ意図が曖昧でないと判断することをさらに含む、請求項18に記載のシステム(100)。
【請求項20】
前記検索結果に基づいて、前記クエリ(120)の前記ユーザ意図を解決することは、
前記検索エンジン(164)から取り出された前記クエリ(120)についての前記現在トレンドの検索結果の第1の位置にある前記検索結果を識別することと、
前記第1の位置にある前記検索結果に関連付けられた検索結果タイプまたはエンティティのうちの少なくとも1つを判断することと、
前記第1の位置にある前記検索結果に関連付けられた前記検索結果タイプまたは前記エンティティのうちの前記少なくとも1つに基づいて、前記ユーザ意図を解決することとを含む、請求項16から19のいずれか一項に記載のシステム(100)。
【請求項21】
前記解決されたユーザ意図は、ニュース探索ユーザ意図、旅行/交通関連ユーザ意図、音楽探索ユーザ意図、自動化コマンド意図、および娯楽探索ユーザ意図のうちの1つを含む、請求項16から20のいずれか一項に記載のシステム(100)。
【請求項22】
前記解決されたユーザ意図に関連付けられた前記特定の意図バーティカルは、1つまたは複数のユーザ選好情報ソースを含む、請求項16から21のいずれか一項に記載のシステム(100)。
【請求項23】
前記ユーザデバイス(110)はスマートスピーカーを含む、請求項16から22のいずれか一項に記載のシステム(100)。
【請求項24】
前記ユーザデバイス(110)はスマートディスプレイを含む、請求項16から22のいずれか一項に記載のシステム(100)。
【請求項25】
前記ユーザデバイス(110)はモバイルコンピューティングデバイスを含む、請求項16から22のいずれか一項に記載のシステム(100)。
【請求項26】
前記クエリ(120)は、前記ユーザデバイス(110)上で実行する可聴ユーザインターフェース(114)を介して前記ユーザ(10)によって入力された発声クエリ(120)を含む、請求項16から25のいずれか一項に記載のシステム(100)。
【請求項27】
前記クエリ(120)は、前記ユーザデバイス(110)上で実行するグラフィカルユーザインターフェース(114)を介して前記ユーザ(10)によって入力された、タイプされたクエリを含む、請求項16から25のいずれか一項に記載のシステム(100)。
【請求項28】
前記動作は、前記クエリ(120)への前記応答(122)を前記ユーザデバイス(110)に与えることをさらに含み、前記ユーザデバイス(110)は、前記応答(122)のオーディオ表現またはグラフィカル表現のうちの少なくとも1つを出力するように構成される、請求項16から27のいずれか一項に記載のシステム(100)。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、アシスタント上でユーザ意図を理解するための、検索結果に基づくトリガリングに関する。
【背景技術】
【0002】
ユーザは、トピック/エンティティについての情報および事実を取得し、またはユーザが特定のタスクを遂行するのを支援するために、コンピューティングデバイス上で実行するデジタルアシスタントに問い合わせる場合がある。デジタルアシスタントは、ユーザにとって興味のある特定の情報を突き止める方へデジタルアシスタントを導くための十分な情報をユーザが提供できることを求め得る。クエリが十分には調整されていない場合、またはユーザが、クエリに関連したエンティティを単に指定することを超える追加情報をあまり提供しない場合、デジタルアシスタントは、クエリをさらに絞り込み、ユーザ意図を得るために、ユーザに曖昧性解消質問を促し得る。さらに、デジタルアシスタントは、動的に更新されなければならないデフォルト応答を与えることによって、ユーザ意図が欠けている曖昧なクエリについての所定のクエリ解釈に依拠する場合がある。
【発明の概要】
【課題を解決するための手段】
【0003】
本開示の一態様は、曖昧なクエリへの関連応答を送出するためのコンピュータ実装方法を提供する。コンピュータ実装方法は、データ処理ハードウェア上で実行されると、データ処理ハードウェアに動作を実施させ、動作は、ユーザに関連付けられたユーザデバイスから、デジタルアシスタントサービスに対して情報を要求するクエリを受信することと、クエリのユーザ意図が未解決であるとき、検索エンジンから、クエリについての現在トレンドの検索結果を取り出すことと、検索結果に基づいて、クエリのユーザ意図を解決することと、解決されたユーザ意図に基づいて、クエリへの応答を生成することであって、応答は、解決されたユーザ意図に関連付けられた特定の意図バーティカル(intent vertical)から取得された情報を含む、生成することとを含む。
【0004】
本開示の実装形態は、以下の任意選択の特徴のうちの1つまたは複数を含み得る。いくつかの実装形態では、動作はまた、クエリを受信したことに応答して、ユーザ意図が曖昧であるかどうかを判断するために、クエリに対してクエリ解釈を実施することと、ユーザ意図が曖昧であるとき、クエリのユーザ意図が未解決であると判断することとを含む。これらの実装形態では、ユーザ意図が曖昧であるかどうかを判断するために、クエリに対してクエリ解釈を実施することは、クエリの1つまたは複数の可能ユーザ意図の各々についてのそれぞれのスコアを判断するために、クエリを処理することと、クエリの1つまたは複数の可能ユーザ意図の各々について判断されたそれぞれのスコアが信頼性しきい値を満足できないとき、ユーザ意図が曖昧であると判断することとを含む。クエリ解釈を実施することは、クエリの1つまたは複数の可能ユーザ意図のうちの1つについてのそれぞれのスコアが信頼性しきい値を満足するとき、ユーザ意図が曖昧でないと判断することも含み得る。
【0005】
いくつかの例では、検索結果に基づいて、クエリのユーザ意図を解決することは、検索エンジンから取り出された、クエリについての現在トレンドの検索結果の第1の位置にある検索結果を識別することと、第1の位置にある検索結果に関連付けられた検索結果タイプまたはエンティティのうちの少なくとも1つを判断することと、第1の位置にある検索結果に関連付けられた検索結果タイプまたはエンティティのうちの少なくとも1つに基づいて、ユーザ意図を解決することとを含む。エンティティは、限定はしないが、人、場所、物などを含み得る。解決されたユーザ意図は、ニュース探索ユーザ意図、旅行/交通関連ユーザ意図、音楽探索ユーザ意図、および娯楽探索ユーザ意図のうちの1つを含み得る。解決されたユーザ意図に関連付けられた特定の意図バーティカルは、1つまたは複数のユーザ選好情報ソースを含み得る。
【0006】
ユーザデバイスは、スマートスピーカー、スマートディスプレイ、またはモバイルコンピューティングデバイスを含み得る。クエリは、ユーザデバイス上で実行する可聴ユーザインターフェースを介してユーザによって入力された発声クエリ、またはユーザデバイス上で実行するグラフィカルユーザインターフェースを介してユーザによって入力された、タイプされたクエリを含み得る。動作は、クエリへの応答をユーザデバイスに与えることも含んでよく、ユーザデバイスは、応答のオーディオ表現またはグラフィカル表現のうちの少なくとも1つを出力するように構成される。
【0007】
本開示の別の態様は、データ処理ハードウェアと、データ処理ハードウェアと通信するメモリハードウェアとを含むシステムを提供し、メモリハードウェアは、データ処理ハードウェア上で実行されるとデータ処理ハードウェアに動作を実施させる命令を記憶する。動作は、ユーザに関連付けられたユーザデバイスから、デジタルアシスタントサービスに対して情報を要求するクエリを受信することと、クエリのユーザ意図が未解決であるとき、検索エンジンから、クエリについての現在トレンドの検索結果を取り出すことと、検索結果に基づいて、クエリのユーザ意図を解決することと、解決されたユーザ意図に基づいて、クエリへの応答を生成することであって、応答は、解決されたユーザ意図に関連付けられた特定の意図バーティカルから取得された情報を含む、生成することとを含む
【0008】
本態様は、以下の任意選択の特徴のうちの1つまたは複数を含み得る。本開示の実装形態は、以下の任意選択の特徴のうちの1つまたは複数を含み得る。いくつかの実装形態では、動作はまた、クエリを受信したことに応答して、ユーザ意図が曖昧であるかどうかを判断するために、クエリに対してクエリ解釈を実施することと、ユーザ意図が曖昧であるとき、クエリのユーザ意図が未解決であると判断することとを含む。これらの実装形態では、ユーザ意図が曖昧であるかどうかを判断するために、クエリに対してクエリ解釈を実施することは、クエリの1つまたは複数の可能ユーザ意図の各々についてのそれぞれのスコアを判断するために、クエリを処理することと、クエリの1つまたは複数の可能ユーザ意図の各々について判断されたそれぞれのスコアが信頼性しきい値を満足できないとき、ユーザ意図が曖昧であると判断することとを含む。クエリ解釈を実施することは、クエリの1つまたは複数の可能ユーザ意図のうちの1つについてのそれぞれのスコアが信頼性しきい値を満足するとき、ユーザ意図が曖昧でないと判断することも含み得る。
【0009】
いくつかの例では、検索結果に基づいて、クエリのユーザ意図を解決することは、検索エンジンから取り出された、クエリについての現在トレンドの検索結果の第1の位置にある検索結果を識別することと、第1の位置にある検索結果に関連付けられた検索結果タイプまたはエンティティのうちの少なくとも1つを判断することと、第1の位置にある検索結果に関連付けられた検索結果タイプまたはエンティティのうちの少なくとも1つに基づいて、ユーザ意図を解決することとを含む。エンティティは、限定はしないが、人、場所、物などを含み得る。解決されたユーザ意図は、ニュース探索ユーザ意図、旅行/交通関連ユーザ意図、音楽探索ユーザ意図、および娯楽探索ユーザ意図のうちの1つを含み得る。解決されたユーザ意図に関連付けられた特定の意図バーティカルは、1つまたは複数のユーザ選好情報ソースを含み得る。
【0010】
ユーザデバイスは、スマートスピーカー、スマートディスプレイ、またはモバイルコンピューティングデバイスを含み得る。クエリは、ユーザデバイス上で実行する可聴ユーザインターフェースを介してユーザによって入力された発声クエリ、またはユーザデバイス上で実行するグラフィカルユーザインターフェースを介してユーザによって入力された、タイプされたクエリを含み得る。動作は、クエリへの応答をユーザデバイスに与えることも含んでよく、ユーザデバイスは、応答のオーディオ表現またはグラフィカル表現のうちの少なくとも1つを出力するように構成される。
【0011】
本開示の1つまたは複数の実装形態の詳細について、添付図面および以下の説明に示す。他の態様、特徴、および利点は、説明および図面から、ならびに特許請求の範囲から明らかになろう。
【図面の簡単な説明】
【0012】
図1】デジタルアシスタントサービスに向けられたクエリが曖昧なとき、クエリのユーザ意図を解決するための例示的システムの概略図である。
図2】曖昧なクエリへの関連応答を送出する方法のための、例示的な並びの動作のフローチャートである。
図3】本明細書に記載するシステムおよび方法を実装するのに使うことができる例示的コンピューティングデバイスの概略図である。
【発明を実施するための形態】
【0013】
様々な図面における同様の参照符号は、同様の要素を示す。
【0014】
トピック/エンティティについての情報および事実を取得し、またはユーザが特定のタスクを遂行するのを支援するために、コンピューティングデバイス上で実行するデジタルアシスタントインターフェースに、ユーザが問い合わせる場合がある。ユーザが、デジタルアシスタントインターフェースに同様に問い合わせて、アクション/動作を実施することをデジタルアシスタントに要求する場合がある。デジタルアシスタントは、ユーザにとって興味のある特定の情報を突き止める(または特定のアクションを識別する)方へデジタルアシスタントを導くための十分な情報をユーザが提供できることを求め得る。クエリが十分には調整されていない場合、またはユーザが、クエリに関連したエンティティを単に指定することを超える追加情報をあまり提供しない場合、デジタルアシスタントは、クエリをさらに絞り込み、ユーザ意図を得るために、曖昧性解消質問に回答するようにユーザに促し得る。ユーザは、応答を受信する前に曖昧性解消質問に回答しなければならない場合に発生した追加時間によって煩わされる可能性がある。さらに、デジタルアシスタントは、動的に更新されなければならないデフォルト応答を与えることによって、ユーザ意図が欠けている曖昧なクエリについての所定のクエリ解釈に依拠する場合がある。デジタルアシスタントサービスの管理者にとっては、曖昧なクエリについての所定の解釈を適時に更新することは冗長なプロセスであり、潜在的に無数の可能な曖昧クエリについての正確な解釈を絶えず維持することが困難になる。本明細書における実装形態は、文脈的に関連するユーザ意図を解決/抽出するために、クエリ120に関連した現在トレンドの検索結果を参照することによって、曖昧なクエリの曖昧性を解消することを対象とする。明らかになるように、検索結果により、デジタルアシスタントサービスは、曖昧なクエリについての関連するユーザ意図を動的に、およびユーザが追加情報を提供する(たとえば、曖昧性解消質問に回答し、またはクエリを調整し直す)ことを求めることなく、確かめることができるようになり得る。
【0015】
図1は、ネットワーク130を介して分散型システム(たとえば、クラウドコンピューティングプラットフォーム)140へクエリ120(たとえば、クライアントコンテンツ/データとも呼ばれる)を通信することが可能な、ユーザ10に関連付けられたユーザデバイス110を含む例示的システム100である。分散型システム140は、ユーザデバイス110のローカルリソースから離れたスケーラブル/エラスティックリソース142(たとえば、ストレージ抽象化)を有し得る。リソース142は、ハードウェアリソース144(たとえば、データ処理ハードウェア)、ストレージリソース146(たとえば、メモリハードウェア)、および/またはソフトウェアリソース148(たとえば、ウェブベースのアプリケーションもしくはアプリケーションプログラミングインターフェース(API))を含む。いくつかの例では、分散型システム140は、デジタルアシスタントサービス(DAS)160を実行し、ユーザ10は、ユーザデバイス110を使って(たとえば、デジタルアシスタントインターフェース114またはウェブブラウザアプリケーション116を使って)、DAS160とインターフェースする。
【0016】
ユーザデバイス110は、分散型システム140と通信することが可能な、どのコンピューティングデバイスまたはデータ処理ハードウェアであってもよい。ユーザデバイス110のいくつかの例は、デスクトップコンピューティングデバイス、ラップトップ、タブレット、スマートフォンなどのモバイルコンピューティングデバイス、スマートテレビジョン、セットトップボックス、スマートスピーカー/ディスプレイ、スマートアプライアンス、車両インフォテインメント、ならびに装着可能コンピューティングデバイス(たとえば、ヘッドセットおよび/または腕時計)を含むが、それに限定されない。コンピューティングデバイスとして、ユーザデバイス110は、データ処理ハードウェア111と、様々なプロセスを実行するためにデータ処理ハードウェア111と通信するように構成されたメモリハードウェア113とを含む。ここで、図1は、ユーザデバイス110が、アプリケーション114、116(たとえば、ダウンロードされ、メモリハードウェア113に記憶されているアプリケーション)を実行するためにデータ処理ハードウェア111を使うことを示す。たとえば、ユーザデバイス110は、DAS160によって提供されるとともにインターフェース114またはウェブブラウザアプリケーション116を介してユーザデバイス110にとってアクセス可能なウェブベースのサービスと通信するために、インターフェース114またはウェブブラウザアプリケーション116を実行する。
【0017】
ユーザ10は、トピック/エンティティについての情報および事実を取得するための、DAS160へのクエリ120ならびに/またはアクション/動作を実施するための、DAS160への要求を発行してよい。たとえば、情報を要求するクエリ120は、「マイケルジャクソンって誰?」を含んでよく、アクション/動作の実施を要求するクエリは、「マイケルジャクソンの曲をかけて」を含んでよい。インターフェース114は、DAS160に関連付けられたグラフィカルユーザインターフェースを含み得る。いくつかの例では、インターフェース114は、ユーザ10がDAS160へのクエリ120を発行し、DAS160から戻されたクエリ120への応答122を出力できるようにするための、可聴ユーザインターフェースまたはグラフィカル/可聴ユーザインターフェースの組合せを含む。したがって、ユーザ10は、インターフェース114を介して、発声またはタイプされたクエリ120を入力してよく、ユーザデバイス110は、クエリ120を処理し、応答122を戻すために、DAS160へクエリ120を送信し得る。ユーザインターフェース114がグラフィカルおよび可聴能力の両方を有するので、DASによって戻された応答122は、複数の同期された出力モダリティを組み込み得る多モード応答122であってよい。非限定的例では、複数の同期された出力モダリティを組み込む多モード応答は、オーディオおよびビジュアルトラックの両方を含むビデオなどのマルチメディア構成要素、ならびに戻された応答122についての全般的情報を伝える、DAS160からの合成音声など、他の構成要素を含んでもよい。クエリ120が発声されると、ユーザデバイス110は、転写を取得し、クエリ120の転写を、ネットワーク130を介してDAS160へ送信するために、クエリに対応するオーディオデータに対して音声認識を実施してよい。任意選択で、ユーザデバイス110は、発声クエリ120に対応するオーディオデータを、クエリ120の転写を取得するために、分散型システム140上で実行するサーバ側音声認識器へ送信し得る。
【0018】
図示した例において、DAS160は、クエリ120に対してクエリ解釈を実施することによってクエリ120を処理するように構成されたクエリインタープリタ162を含む。クエリインタープリタ162は、クエリ120が曖昧でないようにユーザ意図が解決され得るかどうかを判断し得る。本明細書で使用する限り、曖昧でないクエリとは、クエリにおいてユーザ意図が明示的に指定されるか、または十分な信頼性で合理的に推論することができるクエリを指す。ユーザ意図は、情報探索意図ならびにアクション要求に関連した意図に対応し得る複数のあらかじめ定義された意図のうちの1つであってよい。たとえば、あらかじめ定義された意図は、ニュース探索意図、交通/旅行関連意図、音楽探索意図、娯楽関連意図、ホーム/オフィス/自動車自動化コマンド意図などを含み得る。クエリインタープリタ162は、意図に関連付けられたスコアを生成し得る。意図のスコアは、意図を満足する情報をクエリ120が取得することになる信頼性の程度(たとえば、確率または他の可能性の程度)を示し得る。したがって、クエリインタープリタ162は、クエリ120についての可能な意図に対する確率分布を出力してよい。意図についてのスコアが信頼性しきい値を満足するとき、クエリインタープリタ162は、クエリ160のユーザ意図が解決されたと判断してよく、これによってDAS160は、クエリ120に応答して、適切な意図バーティカルにアクセスして情報を取得することができる。
【0019】
そうではなく、ユーザ意図が未解決であるとき、たとえば、可能な意図について生成されたスコアのどれもが信頼性しきい値を満足しないとき、DAS160は、クエリ120を曖昧と見なす。DAS120がクエリ120のユーザ意図を未解決/曖昧と判断するときのシナリオでは、DAS160は、単にデフォルト応答を与え得る。たとえば、クエリ120が、エンティティ指定語の「タイガーウッズ」のみを含む場合、ユーザ意図がクエリ120において明示的でなかったので、クエリインタープリタ162は、ユーザ意図が、タイガーウッズがゴルフをしている人気のあるビデオ(たとえば、You Tube(登録商標))を閲覧することであるかどうか、ユーザ意図が、ゴルファーのタイガーウッズについての現在トレンドのニュースを得るためのニュース探索であるか、それとも何らかの他のユーザ意図であるかを判断することができないであろう。この例では、DAS120によって与えられるデフォルト応答は、ゴルファーのタイガーウッズについての何らかの全般的文献情報を含み得る。ただし、クエリ120が、カリフォルニア州でのタイガーウッドの自動車事故の後間もなく与えられた場合、ユーザが、その自動車事故についてのニュースを確かめたい可能性が高く、この場合、タイガーウッズについての文献情報を伝えるデフォルト応答は、ユーザにとってほとんど価値がない。
【0020】
本明細書における実装形態は、クエリ120が曖昧であるとクエリインタープリタ162が判断したとき、ユーザ意図を解決/抽出するために、クエリ120に関連した現在トレンドの検索結果を活用することを対象とする。したがって、DAS160は、解決されたユーザ意図を、クエリ120への、文脈的に関連する応答122を生成するのに使ってよく、そうすることによって応答122は、解決されたユーザ意図に関連付けられた特定の意図バーティカルから得られた情報を含む。図示した例において、DAS160は、クエリのユーザ意図が未解決であるとクエリインタープリタ162が判断したことに応答して、曖昧クエリ120に関連した検索を執り行うために、検索モジュール(たとえば、検索エンジン)164を呼び出し得る。ここで、クエリ120は、検索を執り行うために検索エンジン164によって検索語として使用するための、エンティティ/トピックを指定する1つまたは複数の用語を含み得る。検索を執り行った後、検索モジュール164は、クエリ120についての現在トレンドの検索結果のリストを、ユーザ意図リゾルバ166へ出力し得る。ここで、ユーザ意図リゾルバ166は、検索モジュール164から取り出された現在トレンドの検索結果の第1の位置の中中の検索結果を識別し、第1の位置にある検索結果に関連付けられた検索結果タイプを判断し、次いで、第1の位置にある検索結果に関連付けられた検索結果タイプに基づいてユーザ意図を解決/抽出し得る。「検索結果タイプ」は、文献、ニュース、音楽、交通/旅行などの応答バーティカル(response vertical)を指し得る。たとえば、上の例を適用すると、「タイガーウッズ」というクエリに関連した現在トレンドの検索結果の第1の位置にある検索結果は、自動車事故の後間もなくは、ニュース探索の検索結果タイプに関連付けられるであろう。したがって、意図リゾルバ166は、クエリの履行168を促すために、ユーザ意図を、ニュース探索であるものとして解決し、タイガーウッズについての文献情報を含むデフォルト応答ではなく、ニュース探索応答を生成することになる。したがって、DAS160における履行168は、現在トレンドの検索結果を活用することによって、実世界のコンテキストにおいて、クエリ120への、より関連する応答122を生成し、送出する。
【0021】
特に、検索モジュール164が、タイガーウッズが関わった自動車事故に先立つどこかの時点で、曖昧なクエリ120に関連した同じ検索を実施した場合、第1の位置にある検索結果は、文献関連検索結果タイプに関連付けられている可能性がある。このシナリオでは、意図リゾルバ166がユーザ意図を文献関連であると解決し、そうすることによって、タイガーウッズについての文献情報を含むデフォルト応答と同じ応答を生成することによって、クエリ120の履行168を引き起こす。したがって、DAS160は、現在トレンドの検索結果に基づいて動的に変わる、曖昧なクエリ120への、文脈的に関連する応答122を送出し得る。
【0022】
興味深いことに、現在トレンドの検索結果に基づいてユーザ意図が解決されると、DAS160は、現在トレンドの検索結果の第1の位置にある検索結果を与えることに単に復帰するのではない。そうではなく、DAS160は、この検索結果に関連付けられた検索結果タイプから、ユーザ意図を解決し、次いで、解決されたユーザ意図を、曖昧なクエリのデフォルト解釈と相互参照して、クエリ120への、実世界のコンテキストの中中における最も関連する応答122を判断する。ここで、最も関連する応答122は、特定のユーザ向けにまとめられる、解決されたユーザ意図に関連付けられた特定の意図バーティカルから取得された情報を含む。つまり、特定の意図バーティカルは、第1の位置にある検索結果に関連付けられた検索結果タイプに関連した1つまたは複数の情報ソースを含み得るが、これらの情報ソースは、やはり検索結果タイプに関連した他の情報ソースよりも、ユーザに好まれる場合がある。異なる意図バーティカルに関連付けられたこれらのユーザ選好情報ソースが、ユーザによってあらかじめ指定されるか、かつ/またはユーザ10とDAS160との間の過去の対話に基づいて学習されてよい。その上、意図バーティカルのためのユーザ選好情報ソースは、ユーザに関連付けられたユーザプロファイルに記憶され、DAS160にとってアクセス可能であってよい。たとえば、上の例では、特定のユーザについてのニュース探索ユーザ意図は、ユーザ選好によって指定された特定のニュースソースのみから、情報にアクセスする履行を含んでよく、これらのニュースソースは、現在トレンドの検索結果の第1の位置にある検索結果を与えたニュースソースとは異なってよい。ここで、ユーザ10は、自分の地域の新聞からニュースを受信することを好む場合があり、第1の位置にある検索結果を与えたニュースソースは、全国ニュース企業体を含む場合がある。
【0023】
解決されたユーザ意図が音楽探索である別の例では、音楽探索ユーザ意図に関連付けられた特定の意図バーティカルは、ユーザが音楽を聴くために使う、好まれる音楽ストリーミングサービスを含み得る。この例では、音楽探索だった検索結果タイプは、検索エンジン164がデフォルト選択した異なる音楽ストリーミングサービスからストリーミングされる音楽の可聴再生のためのリンクを含む、第1の位置にある検索結果を含み得る。
【0024】
追加または代替として、DAS160は、他のユーザに関連付けられた他のユーザデバイスから、類似クエリが最近受信されたかどうかを判断し得る。本明細書で使用する限り、類似クエリは、未解決であるクエリと同じエンティティを指定する同様の用語を含み得る。これらの類似クエリは、ユーザ意図を明示的に伝える場合があり、またはユーザ意図は、すでに解決されている場合がある。ここで、クエリリゾルバ166は、類似クエリが最近急増したかどうかを判断し、しきい値数の類似クエリによって共有される共通ユーザ意図を識別し得る。したがって、クエリリゾルバ166は、他のユーザからDAS160において受信された、最近急増した類似クエリにおいて、しきい値数のクエリによって共有される共通ユーザ意図を抽出することによって、ユーザ意図を解決し得る。
【0025】
図2は、曖昧なクエリへの関連応答を送出する方法200のための例示的な並びの動作のフローチャートである。動作202において、方法200は、ユーザ10に関連付けられたユーザデバイス110から、デジタルアシスタントサービス(DAS)160に対して情報を要求するクエリ120を受信するステップを含む。動作204~208は、クエリ120のユーザ意図が未解決であるときに実施される。動作204において、方法200は、検索エンジン164から、クエリ120についての現在トレンドの検索結果を取り出すステップを含む。動作206において、方法200は、検索結果に基づいて、クエリのユーザ意図を解決するステップを含む。動作208において、方法200は、解決されたユーザ意図に基づいて、クエリ120への応答122を生成するステップを含む。ここで、応答122は、解決されたユーザ意図に関連付けられた特定の意図バーティカルから取得された情報を含む。
【0026】
DAS160は、ユーザ意図が曖昧であるかどうかを判断し、ユーザ意図が曖昧であるときはクエリ120のユーザ意図が未解決であると判断するために、受信されたクエリに対してクエリ解釈を実施するクエリインタープリタ162を含み得る。いくつかの例では、クエリインタープリタ162は、クエリ120を処理して、クエリの1つまたは複数の可能ユーザ意図の各々についてのそれぞれのスコアを判断し、クエリの1つまたは複数の可能ユーザ意図の各々について判断されたそれぞれのスコアが信頼性しきい値を満足できないとき、ユーザ意図が曖昧であると判断する。
【0027】
いくつかの実装形態では、検索結果に基づいて、クエリのユーザ意図を解決することは、検索エンジンから取り出された、クエリについての現在トレンドの検索結果の第1の位置にある検索結果を識別すること、第1の位置にある検索結果に関連付けられた検索結果タイプを判断すること、および第1の位置にある検索結果に関連付けられた検索結果タイプに基づいて、ユーザ意図を解決することを含む。解決されたユーザ意図は、ニュース探索ユーザ意図、旅行/交通関連ユーザ意図、音楽探索ユーザ意図、および娯楽探索ユーザ意図のうちの1つを含み得る。解決されたユーザ意図に関連付けられた特定の意図バーティカルは、1つまたは複数のユーザ選好情報ソースを含み得る。
【0028】
ユーザデバイスは、スマートスピーカーまたはスマートディスプレイを含み得る。さらに、ユーザデバイスは、限定はしないが、スマートフォン、タブレット、またはラップトップなどのモバイルコンピューティングデバイスを含み得る。クエリは、ユーザデバイス上で実行するグラフィカルユーザインターフェース14を介してユーザによって入力された、タイプされたクエリを含んでよく、またはクエリは、ユーザデバイス上で実行する可聴ユーザインターフェースを介してユーザによって入力された発声クエリを含んでよい。
【0029】
ソフトウェアアプリケーション(すなわち、ソフトウェアリソース)は、コンピューティングデバイスにタスクを実施させるコンピュータソフトウェアを指し得る。いくつかの例では、ソフトウェアアプリケーションは、「アプリケーション」、「アプリ」、または「プログラム」と呼ばれる場合がある。例示的アプリケーションは、限定はしないが、システム診断アプリケーション、システム管理アプリケーション、システム保守アプリケーション、文書処理アプリケーション、表計算アプリケーション、メッセージングアプリケーション、メディアストリーミングアプリケーション、ソーシャルネットワーキングアプリケーション、およびゲーム用アプリケーションを含む。
【0030】
非一時的メモリは、プログラム(たとえば、命令のシーケンス)またはデータ(たとえば、プログラム状態情報)を、コンピューティングデバイスによる使用のために、一時的または永続的に記憶するのに使われる物理デバイスであってよい。非一時的メモリは、揮発性および/または不揮発性アドレス可能半導体メモリであってよい。不揮発性メモリの例は、フラッシュメモリおよび読取り専用メモリ(ROM)/プログラマブル読取り専用メモリ(PROM)/消去可能プログラマブル読取り専用メモリ(EPROM)/電子的消去可能プログラマブル読取り専用メモリ(EEPROM)(たとえば、通常は、ブートプログラムなどのファームウェアのために使用される)を含むが、それに限定されない。揮発性メモリの例は、ランダムアクセスメモリ(RAM)、ダイナミックランダムアクセスメモリ(DRAM)、スタティックランダムアクセスメモリ(SRAM)、相変化メモリ(PCM)ならびにディスクまたはテープを含むが、それに限定されない。
【0031】
図3は、本文書に記載するシステムおよび方法を実装するのに使うことができる例示的コンピューティングデバイス300の概略図である。コンピューティングデバイス300は、ラップトップ、デスクトップ、ワークステーション、携帯情報端末、サーバ、ブレードサーバ、メインフレーム、および他の適切なコンピュータなど、様々な形のデジタルコンピュータを表すことを意図している。ここに示される構成要素、それらの接続および関係、ならびにそれらの機能は、例示であることのみを意図しており、本明細書で説明および/または請求する本発明の実装形態を限定することは意図していない。
【0032】
コンピューティングデバイス300は、プロセッサ310と、メモリ320と、記憶デバイス330と、メモリ320および高速拡張ポート350に接続する高速インターフェース/コントローラ340と、低速バス370および記憶デバイス330に接続する低速インターフェース/コントローラ360とを含む。構成要素310、320、330、340、350、および360の各々は、様々なバスを使用して相互接続され、共通マザーボード上に、または適宜に他の方法で搭載され得る。プロセッサ310は、グラフィカルユーザインターフェース(GUI)についてのグラフィカル情報を、高速インターフェース340に結合されたディスプレイ380などの外部入力/出力デバイス上に表示するための、メモリ320中または記憶デバイス330上に記憶された命令を含む、コンピューティングデバイス300内での実行のための命令を処理することができる。他の実装形態では、複数のプロセッサおよび/または複数のバスが、必要に応じて、複数のメモリおよび複数のタイプのメモリとともに使用されてよい。また、複数のコンピューティングデバイス300が接続されてよく、各デバイスは、必要な動作の部分を(たとえば、サーババンク、ブレードサーバのグループ、またはマルチプロセッサシステムとして)提供する。
【0033】
メモリ320は、コンピューティングデバイス300内に情報を非一時的に記憶する。メモリ320は、コンピュータ可読媒体、揮発性メモリユニット、または不揮発性メモリユニットであってよい。非一時的メモリ320は、プログラム(たとえば、命令のシーケンス)またはデータ(たとえば、プログラム状態情報)を、コンピューティングデバイス300による使用のために、一時的または永続的に記憶するのに使用される物理デバイスであってよい。不揮発性メモリの例は、フラッシュメモリおよび読取り専用メモリ(ROM)/プログラマブル読取り専用メモリ(PROM)/消去可能プログラマブル読取り専用メモリ(EPROM)/電子的消去可能プログラマブル読取り専用メモリ(EEPROM)(たとえば、通常は、ブートプログラムなどのファームウェア用に使用される)を含むが、それに限定されない。揮発性メモリの例は、ランダムアクセスメモリ(RAM)、動的ランダムアクセスメモリ(DRAM)、スタティックランダムアクセスメモリ(SRAM)、相変化メモリ(PCM)ならびにディスクまたはテープを含むが、それに限定されない。
【0034】
記憶デバイス330は、コンピューティングデバイス300に大容量記憶を提供することが可能である。いくつかの実装形態では、記憶デバイス330は、コンピュータ可読媒体である。様々な異なる実装形態では、記憶デバイス330は、フロッピーディスクデバイス、ハードディスクデバイス、光ディスクデバイス、またはテープデバイス、フラッシュメモリもしくは他の同様のソリッドステートメモリデバイス、あるいは、ストレージエリアネットワークまたは他の構成におけるデバイスを含むデバイスのアレイであり得る。追加の実装形態では、コンピュータプログラム製品が、情報キャリアに具現化される。コンピュータプログラム製品は、実行されると、上記で説明した方法などの1つまたは複数の方法を実施する命令を含む。情報キャリアは、メモリ320、記憶デバイス330、またはプロセッサ310上のメモリなどの、コンピュータ可読媒体または機械可読媒体である。
【0035】
高速コントローラ340は、コンピューティングデバイス300向けの帯域幅消費型動作を管理し、低速コントローラ360は、より帯域幅低消費型の動作を管理する。義務のそのような割振りは、例示的なものにすぎない。いくつかの実装形態において、高速コントローラ340は、メモリ320、ディスプレイ380に(たとえば、グラフィックスプロセッサまたはアクセラレータを通して)、および様々な拡張カード(図示せず)を受ける場合がある高速拡張ポート350に結合される。いくつかの実装形態において、低速コントローラ360は、記憶デバイス330および低速拡張ポート390に結合される。低速拡張ポート390は、様々な通信ポート(たとえば、USB、Bluetooth、イーサネット、ワイヤレスイーサネット)を含み得るが、キーボード、ポインティングデバイス、スキャナなど、1つもしくは複数の入力/出力デバイス、またはスイッチもしくはルータなどのネットワークデバイスに、たとえば、ネットワークアダプタを通して結合され得る。
【0036】
コンピューティングデバイス300は、図に示すように、いくつかの異なる形で実装されてよい。たとえば、標準サーバ300aとして、もしくはサーバ300aのグループで何度も、ラップトップコンピュータ300bとして、またはラックサーバシステム300cの一部として実装されてよい。
【0037】
本明細書で説明するシステムおよび技法の様々な実装形態は、デジタル電子および/もしくは光学回路構成、集積回路構成、特別に設計されたASIC(特定用途向け集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、ならびに/またはそれらの組合せで実現され得る。これらの様々な実装形態は、少なくとも1つのプログラマブルプロセッサを含むプログラマブルシステム上で実行可能および/または解釈可能な1つまたは複数のコンピュータプログラムにおける実装形態を含むことができ、プログラマブルプロセッサは、記憶システム、少なくとも1つの入力デバイス、および少なくとも1つの出力デバイスからデータおよび命令を受信するように、かつそれらにデータおよび命令を送信するように結合された、専用または汎用であってもよい。
【0038】
これらのコンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーションまたはコードとしても知られる)は、プログラマブルプロセッサ用の機械命令を含み、高度手続型および/もしくはオブジェクト指向プログラミング言語で、ならびに/またはアセンブリ/機械言語で実装され得る。本明細書で使用する「機械可読媒体」および「コンピュータ可読媒体」という用語は、機械命令を機械可読信号として受信する機械可読媒体を含むプログラマブルプロセッサに、機械命令および/またはデータを提供するために使用される、任意のコンピュータプログラム製品、非一時的コンピュータ可読媒体、装置および/またはデバイス(たとえば、磁気ディスク、光ディスク、メモリ、プログラマブル論理デバイス(PLD))を指す。「機械可読信号」という用語は、プログラマブルプロセッサに機械命令および/またはデータを提供するために使用される任意の信号を指す。
【0039】
本明細書に記載したプロセスおよび論理フローは、入力データに対して動作し、出力を生成することによって機能を実施するための1つまたは複数のコンピュータプログラムを実行する、データ処理ハードウェアとも呼ばれる1つまたは複数のプログラマブルプロセッサによって実施することができる。プロセスおよび論理フローは、特殊目的論理回路構成、たとえば、FPGA(フィールドプログラマブルゲートアレイ)やASIC(特定用途向け集積回路)によって実施することもできる。コンピュータプログラムの実行に適したプロセッサは、例として、汎用および専用マイクロプロセッサの両方、ならびに任意の種類のデジタルコンピュータの任意の1つまたは複数のプロセッサを含む。概して、プロセッサは、読取り専用メモリもしくはランダムアクセスメモリまたは両方から、命令およびデータを受信することになる。コンピュータの本質的要素は、命令を実施するためのプロセッサ、ならびに命令およびデータを記憶するための1つまたは複数のメモリデバイスである。概して、コンピュータは、データを記憶するための1つまたは複数の大容量記憶デバイス、たとえば、磁気、光磁気ディスク、または光ディスクも含み、あるいは大容量記憶デバイスからデータを受信し、もしくはデータを転送し、または両方を行うように大容量記憶デバイスに動作可能に結合される。ただし、コンピュータは、そのようなデバイスを有する必要はない。コンピュータプログラム命令およびデータを記憶するのに適したコンピュータ可読媒体は、例として、半導体メモリデバイス、たとえば、EPROM、EEPROM、およびフラッシュメモリデバイスと、磁気ディスク、たとえば、内部ハードディスクまたは取外し可能ディスクと、光磁気ディスクと、CD-ROMおよびDVD-ROMディスクとを含む、すべての形態の不揮発性メモリ、媒体およびメモリデバイスを含む。プロセッサおよびメモリは、特殊目的論理回路構成によって補完することも、その中に組み込むこともできる。
【0040】
ユーザとの対話を可能にするために、本開示の1つまたは複数の態様は、ユーザに情報を表示するためのディスプレイデバイス、たとえば、CRT(陰極線管)やLCD(液晶ディスプレイ)モニタ、またはタッチスクリーンと、任意選択で、ユーザがコンピュータに入力を与えることができるためのキーボードおよびポインティングデバイス、たとえば、マウスやトラックボールとを有するコンピュータ上で実装することができる。他の種類のデバイスも、ユーザとの対話を提供するのに使われることが可能であり、たとえば、ユーザに与えられるフィードバックは、どの形の感覚フィードバックでも、たとえば、視覚フィードバック、聴覚フィードバック、または触覚フィードバックであることができ、ユーザからの入力は、音響、音声、または触覚入力を含む、どの形でも受信されることが可能である。さらに、コンピュータは、ユーザによって使われるデバイスへドキュメントを送り、デバイスからドキュメントを受信することによって、たとえば、ウェブブラウザから受信された要求に応答して、ユーザのクライアントデバイス上のウェブブラウザへウェブページを送ることによって、ユーザと対話することができる。
【0041】
いくつかの実装形態について説明した。それにもかかわらず、本開示の趣旨および範囲から逸脱することなく、様々な修正が行われ得ることが理解されよう。したがって、他の実装形態が、以下の特許請求の範囲内にある。
【符号の説明】
【0042】
10 ユーザ
100 システム
110 ユーザデバイス
111 データ処理ハードウェア
113 メモリハードウェア
114 デジタルアシスタントインターフェース、アプリケーション、インターフェース
116 ウェブブラウザアプリケーション、アプリケーション
120 クエリ
122 応答
130 ネットワーク
140 分散型システム、クラウドコンピューティングプラットフォーム
142 スケーラブル/エラスティックリソース、リソース
144 ハードウェアリソース
146 ストレージリソース
148 ソフトウェアリソース
160 デジタルアシスタントサービス(DAS)
162 クエリインタープリタ
164 検索モジュール、検索エンジン
166 ユーザ意図リゾルバ、意図リゾルバ、クエリリゾルバ
168 履行
300 コンピューティングデバイス
310 プロセッサ、構成要素
320 メモリ、構成要素
330 記憶デバイス、構成要素
340 高速インターフェース/コントローラ、構成要素
350 高速拡張ポート、構成要素
360 低速インターフェース/コントローラ、構成要素
370 低速バス
380 ディスプレイ
390 低速拡張ポート
図1
図2
図3
【手続補正書】
【提出日】2024-01-26
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
データ処理ハードウェア(144)上で実行されると、前記データ処理ハードウェア(144)に、関連するクエリ応答を送出するための動作を実施させるコンピュータ実装方法(200)であって、前記動作は、
ユーザ(10)に関連付けられたユーザデバイス(110)から、デジタルアシスタントサービス(160)からの情報またはアクションの実施のいずれかを要求するクエリ(120)を受信することと、
前記クエリ(120)のユーザ意図が未解決であると判断することと、
前記クエリ(120)の前記ユーザ意図が未解決であるとの判断に基づいて、
検索エンジン(164)から、前記クエリ(120)についての現在トレンドの検索結果を取り出すことと、
前記検索結果に基づいて、前記クエリ(120)の前記ユーザ意図を解決することと、
前記解決されたユーザ意図に基づいて、前記クエリ(120)への応答(122)を生成することであって、前記応答(122)は、
前記解決されたユーザ意図に関連付けられた特定の意図バーティカルから取得された情報、または
前記デジタルアシスタントサービス(160)によって実施される前記アクションの履行を含む、生成することとを含む、方法(200)。
【請求項2】
前記動作は、前記クエリ(120)を受信したことに応答して、
前記ユーザ意図が曖昧であるかどうかを判断するために、前記クエリ(120)に対してクエリ解釈を実施することと、
前記ユーザ意図が曖昧であるとき、前記クエリ(120)の前記ユーザ意図が未解決であると判断することとをさらに含む、請求項1に記載の方法(200)。
【請求項3】
前記ユーザ意図が曖昧であるかどうかを判断するために、前記クエリ(120)に対してクエリ解釈を実施することは、
前記クエリ(120)の1つまたは複数の可能ユーザ意図の各々についてのそれぞれのスコアを判断するために、前記クエリ(120)を処理することと、
前記クエリ(120)の前記1つまたは複数の可能ユーザ意図の各々について判断された前記それぞれのスコアが信頼性しきい値を満足できないとき、前記ユーザ意図が曖昧であると判断することとを含む、請求項2に記載の方法(200)。
【請求項4】
クエリ解釈を実施することは、前記クエリ(120)の前記1つまたは複数の可能ユーザ意図のうちの1つについての前記それぞれのスコアが前記信頼性しきい値を満足するとき、前記ユーザ意図が曖昧でないと判断することをさらに含む、請求項3に記載の方法(200)。
【請求項5】
前記検索結果に基づいて、前記クエリ(120)の前記ユーザ意図を解決することは、
前記検索エンジン(164)から取り出された前記クエリ(120)についての前記現在トレンドの検索結果の第1の位置にある前記検索結果を識別することと、
前記第1の位置にある前記検索結果に関連付けられた検索結果タイプまたはエンティティのうちの少なくとも1つを判断することと、
前記第1の位置にある前記検索結果に関連付けられた前記検索結果タイプまたは前記エンティティのうちの前記少なくとも1つに基づいて、前記ユーザ意図を解決することとを含む、請求項1に記載の方法(200)。
【請求項6】
前記解決されたユーザ意図は、ニュース探索ユーザ意図、旅行/交通関連ユーザ意図、音楽探索ユーザ意図、自動化コマンド意図、および娯楽探索ユーザ意図のうちの1つを含む、請求項1に記載の方法(200)。
【請求項7】
前記解決されたユーザ意図に関連付けられた前記特定の意図バーティカルは、1つまたは複数のユーザ選好情報ソースを含む、請求項1に記載の方法(200)。
【請求項8】
前記ユーザデバイス(110)はスマートスピーカーを含む、請求項1に記載の方法(200)。
【請求項9】
前記ユーザデバイス(110)はスマートディスプレイを含む、請求項1に記載の方法(200)。
【請求項10】
前記ユーザデバイス(110)はモバイルコンピューティングデバイスを含む、請求項1に記載の方法(200)。
【請求項11】
前記クエリ(120)は、前記ユーザデバイス(110)上で実行する可聴ユーザインターフェース(114)を介して前記ユーザ(10)によって入力された発声クエリ(120)を含む、請求項1に記載の方法(200)。
【請求項12】
前記クエリ(120)は、前記ユーザデバイス(110)上で実行するグラフィカルユーザインターフェース(114)を介して前記ユーザ(10)によって入力された、タイプされたクエリを含む、請求項1に記載の方法(200)。
【請求項13】
前記動作は、前記クエリ(120)への前記応答(122)を前記ユーザデバイス(110)に与えることをさらに含み、前記ユーザデバイス(110)は、前記応答(122)のオーディオ表現またはグラフィカル表現のうちの少なくとも1つを出力するように構成される、請求項1から12のいずれか一項に記載の方法(200)。
【請求項14】
データ処理ハードウェア(144)上で実行されると、前記データ処理ハードウェア(144)に、関連するクエリ応答を送出するための動作を実施させるコンピュータ実装方法(200)であって、前記動作は、
ユーザ(10)に関連付けられたユーザデバイス(110)から、デジタルアシスタントサービス(160)からの情報または前記デジタルアシスタントサービス(160)によるアクションの実施のいずれかを要求するクエリ(120)を受信することと、
前記クエリ(120)のユーザ意図が未解決であると判断することと、
前記クエリ(120)の前記ユーザ意図が未解決であるとの判断に基づいて、
前記デジタルアシスタントサービス(160)に対して情報を要求する、他のユーザからの類似クエリが最近急増したかどうかを判断することと、
類似クエリが最近急増している場合、類似クエリの前記最近の急増に基づいて、前記クエリ(120)の前記ユーザ意図を解決することと、
前記解決されたユーザ意図に基づいて、前記クエリ(120)への応答(122)を生成することであって、前記応答(122)は、
前記解決されたユーザ意図に関連付けられた特定の意図バーティカルから取得された情報、または
前記デジタルアシスタントサービス(160)によって実施される前記アクションの履行を含む、生成することとを含む、方法(200)。
【請求項15】
類似クエリの前記最近の急増に基づいて、前記クエリ(120)の前記ユーザ意図を解決することは、前記他のユーザからの、類似クエリの前記最近の急増におけるしきい値数の最近のクエリによって共有される共通ユーザ意図を抽出することによって、前記ユーザ意図を解決することを含む、請求項14に記載の方法(200)。
【請求項16】
データ処理ハードウェア(144)と、
前記データ処理ハードウェア(144)と通信するメモリハードウェア(146)とを備えるシステム(100)であって、前記メモリハードウェア(146)は、前記データ処理ハードウェア(144)上で実行されると、前記データ処理ハードウェア(144)に動作を実施させる命令を記憶し、前記動作は、
ユーザ(10)に関連付けられたユーザデバイス(110)から、デジタルアシスタントサービス(160)からの情報または前記デジタルアシスタントサービス(160)によるアクションの実施のいずれかを要求するクエリ(120)を受信することと、
前記クエリ(120)のユーザ意図が未解決であると判断することと、
前記クエリ(120)の前記ユーザ意図が未解決であるとの判断に基づいて、
検索エンジン(164)から、前記クエリ(120)についての現在トレンドの検索結果を取り出すことと、
前記検索結果に基づいて、前記クエリ(120)の前記ユーザ意図を解決することと、
前記解決されたユーザ意図に基づいて、前記クエリ(120)への応答(122)を生成することであって、前記応答(122)は、
前記解決されたユーザ意図に関連付けられた特定の意図バーティカルから取得された情報、または
前記デジタルアシスタントサービス(160)によって実施される前記アクションの履行を含む、生成することとを含む、システム(100)。
【請求項17】
前記動作は、前記クエリ(120)を受信したことに応答して、
前記ユーザ意図が曖昧であるかどうかを判断するために、前記クエリ(120)に対してクエリ解釈を実施することと、
前記ユーザ意図が曖昧であるとき、前記クエリ(120)の前記ユーザ意図が未解決であると判断することとをさらに含む、請求項16に記載のシステム(100)。
【請求項18】
前記ユーザ意図が曖昧であるかどうかを判断するために、前記クエリ(120)に対してクエリ解釈を実施することは、
前記クエリ(120)の1つまたは複数の可能ユーザ意図の各々についてのそれぞれのスコアを判断するために、前記クエリ(120)を処理することと、
前記クエリ(120)の前記1つまたは複数の可能ユーザ意図の各々について判断された前記それぞれのスコアが信頼性しきい値を満足できないとき、前記ユーザ意図が曖昧であると判断することとを含む、請求項17に記載のシステム(100)。
【請求項19】
クエリ解釈を実施することは、前記クエリ(120)の前記1つまたは複数の可能ユーザ意図のうちの1つについての前記それぞれのスコアが前記信頼性しきい値を満足するとき、前記ユーザ意図が曖昧でないと判断することをさらに含む、請求項18に記載のシステム(100)。
【請求項20】
前記検索結果に基づいて、前記クエリ(120)の前記ユーザ意図を解決することは、
前記検索エンジン(164)から取り出された前記クエリ(120)についての前記現在トレンドの検索結果の第1の位置にある前記検索結果を識別することと、
前記第1の位置にある前記検索結果に関連付けられた検索結果タイプまたはエンティティのうちの少なくとも1つを判断することと、
前記第1の位置にある前記検索結果に関連付けられた前記検索結果タイプまたは前記エンティティのうちの前記少なくとも1つに基づいて、前記ユーザ意図を解決することとを含む、請求項16に記載のシステム(100)。
【請求項21】
前記解決されたユーザ意図は、ニュース探索ユーザ意図、旅行/交通関連ユーザ意図、音楽探索ユーザ意図、自動化コマンド意図、および娯楽探索ユーザ意図のうちの1つを含む、請求項16に記載のシステム(100)。
【請求項22】
前記解決されたユーザ意図に関連付けられた前記特定の意図バーティカルは、1つまたは複数のユーザ選好情報ソースを含む、請求項16に記載のシステム(100)。
【請求項23】
前記ユーザデバイス(110)はスマートスピーカーを含む、請求項16に記載のシステム(100)。
【請求項24】
前記ユーザデバイス(110)はスマートディスプレイを含む、請求項16に記載のシステム(100)。
【請求項25】
前記ユーザデバイス(110)はモバイルコンピューティングデバイスを含む、請求項16に記載のシステム(100)。
【請求項26】
前記クエリ(120)は、前記ユーザデバイス(110)上で実行する可聴ユーザインターフェース(114)を介して前記ユーザ(10)によって入力された発声クエリ(120)を含む、請求項16に記載のシステム(100)。
【請求項27】
前記クエリ(120)は、前記ユーザデバイス(110)上で実行するグラフィカルユーザインターフェース(114)を介して前記ユーザ(10)によって入力された、タイプされたクエリを含む、請求項16に記載のシステム(100)。
【請求項28】
前記動作は、前記クエリ(120)への前記応答(122)を前記ユーザデバイス(110)に与えることをさらに含み、前記ユーザデバイス(110)は、前記応答(122)のオーディオ表現またはグラフィカル表現のうちの少なくとも1つを出力するように構成される、請求項16から27のいずれか一項に記載のシステム(100)。
【国際調査報告】