IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ アップル インコーポレイテッドの特許一覧

特表2024-531408デジタルアシスタントオブジェクト配置
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-08-29
(54)【発明の名称】デジタルアシスタントオブジェクト配置
(51)【国際特許分類】
   G06F 3/01 20060101AFI20240822BHJP
   G06T 19/00 20110101ALI20240822BHJP
【FI】
G06F3/01 510
G06T19/00 300B
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2024510432
(86)(22)【出願日】2022-08-15
(85)【翻訳文提出日】2024-02-20
(86)【国際出願番号】 US2022040346
(87)【国際公開番号】W WO2023022987
(87)【国際公開日】2023-02-23
(31)【優先権主張番号】63/235,424
(32)【優先日】2021-08-20
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】63/247,557
(32)【優先日】2021-09-23
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】503260918
【氏名又は名称】アップル インコーポレイテッド
【氏名又は名称原語表記】Apple Inc.
【住所又は居所原語表記】One Apple Park Way,Cupertino, California 95014, U.S.A.
(74)【代理人】
【識別番号】100094569
【弁理士】
【氏名又は名称】田中 伸一郎
(74)【代理人】
【識別番号】100103610
【弁理士】
【氏名又は名称】▲吉▼田 和彦
(74)【代理人】
【識別番号】100067013
【弁理士】
【氏名又は名称】大塚 文昭
(74)【代理人】
【識別番号】100139712
【弁理士】
【氏名又は名称】那須 威夫
(72)【発明者】
【氏名】ワインバーグ ガレット エル
(72)【発明者】
【氏名】マリ ペドロ
(72)【発明者】
【氏名】アラソン イザール カリ
(72)【発明者】
【氏名】ハーマン ブラッド ケニス
(72)【発明者】
【氏名】アクマル シラーズ
(72)【発明者】
【氏名】リメイ スティーブン オー
(72)【発明者】
【氏名】オーウェン ジェイムズ ジェイ
(72)【発明者】
【氏名】エスタニー ロドリゲス ミゲル
(72)【発明者】
【氏名】ムーン ジェイ
(72)【発明者】
【氏名】ソレンティーノ ザ サード ウィリアム エイ
(72)【発明者】
【氏名】チェカ オロリス ホセ アントニオ
(72)【発明者】
【氏名】ストレヤ リン アイ
【テーマコード(参考)】
5B050
5E555
【Fターム(参考)】
5B050BA09
5B050CA07
5B050DA04
5B050DA05
5B050DA07
5B050EA07
5B050EA12
5B050EA19
5B050FA06
5B050FA10
5E555AA07
5E555AA27
5E555AA64
5E555BA38
5E555BB38
5E555BC04
5E555BE17
5E555CA42
5E555CA44
5E555CA47
5E555CB64
5E555CB65
5E555CB66
5E555CC01
5E555DA08
5E555DB32
5E555DC09
5E555DC14
5E555DD01
5E555EA28
5E555FA00
(57)【要約】
コンピュータ生成現実(CGR)環境の中でインテリジェント自動アシスタントを動作させるシステム及びプロセスが提供される。例えば、デジタルアシスタントセッションを呼び出すユーザ入力が受け取られ、それに応じて、デジタルアシスタントセッションが開始される。デジタルアシスタントセッションを開始することは、第1の時間にCGR環境の中であるがCGR環境の現在表示されている部分の外にある第1のロケーションにデジタルアシスタントオブジェクトを配置することと、デジタルアシスタントオブジェクトのロケーションを示す第1の出力を提供することとを含む。
【特許請求の範囲】
【請求項1】
1つ以上のプロセッサ、メモリ、ディスプレイ、及び1つ以上のセンサを有する電子デバイスにおいて、
前記電子デバイスのユーザの現在の視野を表すコンピュータ生成現実(CGR)環境の部分を表示している間に、
前記1つ以上のセンサを用いて第1のユーザ入力を検出することと、
前記第1のユーザ入力がデジタルアシスタントセッションを開始するための少なくとも1つの基準を満たしているという判断に従って、第1のデジタルアシスタントセッションを開始することであって、前記第1のデジタルアシスタントセッションを開始することが、第1の時間に前記CGR環境の中であって前記CGR環境の前記表示されている部分の外にある第1のロケーションにデジタルアシスタントオブジェクトを配置することを含む、開始することと、
前記CGR環境内の前記デジタルアシスタントオブジェクトの前記第1のロケーションを示す第1の出力を提供することと、
を含む、方法。
【請求項2】
前記第1のユーザ入力は、聴覚入力を含む、請求項1に記載の方法。
【請求項3】
前記聴覚入力は、トリガフレーズを含む音声入力を含む、請求項2に記載の方法。
【請求項4】
前記第1のユーザ入力は、視線入力を含む、請求項1~3のいずれか一項に記載の方法。
【請求項5】
前記第1のユーザ入力は、ジェスチャ入力を含む、請求項1~4のいずれか一項に記載の方法。
【請求項6】
1つ以上の環境要因に基づいて、前記CGR環境内の前記第1のロケーションを判断することを更に含む、
請求項1~5のいずれか一項に記載の方法。
【請求項7】
前記1つ以上の環境要因は、前記CGR環境の特性を含む、請求項6に記載の方法。
【請求項8】
前記1つ以上の環境要因は、前記電子デバイスの前記ユーザのポジションを含む、請求項6~7のいずれか一項に記載の方法。
【請求項9】
前記1つ以上の環境要因は、前記CGR環境の複数のユーザの複数のポジションを含む、請求項6~8のいずれか一項に記載の方法。
【請求項10】
前記第1のロケーションを示す前記第1の出力を提供することは、第1の聴覚出力を生成させることを含む、請求項1~9のいずれか一項に記載の方法。
【請求項11】
前記第1の聴覚出力は、少なくとも、複数のスピーカーのうちの第1のスピーカーによって生成される第1のオーディオ成分と、前記複数のスピーカーのうちの第2のスピーカーによって生成される第2のオーディオ成分とを含み、前記第1のロケーションを示す前記第1の出力を提供することは、
前記第1のロケーションが前記複数のスピーカーのうちの前記第1のスピーカーのロケーションに近いか、それとも前記複数のスピーカーのうちの前記第2のスピーカーのロケーションに近いかを判断することと、
前記第1のロケーションが前記第2のスピーカーの前記ロケーションより前記第1のスピーカーの前記ロケーションに近いという判断に従って、前記第1のオーディオ成分を前記第2のオーディオ成分より大音量で生成することと、
前記第1のロケーションが前記第1のスピーカーの前記ロケーションより前記第2のスピーカーの前記ロケーションに近いという判断に従って、前記第2のオーディオ成分を前記第1のオーディオ成分より大音量で生成することとを含む、請求項10に記載の方法。
【請求項12】
前記第1のロケーションを示す前記第1の出力を提供することは、第1の触覚出力を生成させることを含む、請求項1~11のいずれか一項に記載の方法。
【請求項13】
前記第1のロケーションを示す前記第1の出力を提供することは、前記第1のロケーションの視覚的指示を前記ディスプレイに表示することを含む、請求項1~12のいずれか一項に記載の方法。
【請求項14】
第2の時間において、
前記第1のロケーションが前記第2の時間に前記CGR環境の前記表示されている部分の中にあるという判断に従って、前記第1のロケーションに前記デジタルアシスタントオブジェクトを表示することとを更に含む、
請求項1~13のいずれか一項に記載の方法。
【請求項15】
前記1つ以上のセンサを用いて第3の時間に第2のユーザ入力を検出することと、
前記第2のユーザ入力の意図を判断することと、
前記判断された意図に基づいて第2の出力を提供することとを更に含む、
請求項1~14のいずれか一項に記載の方法。
【請求項16】
前記第2のユーザ入力を検出することは、前記デジタルアシスタントオブジェクトが前記第1のロケーションに配置されている間に実行され、前記意図を判断することと前記判断された意図に基づいて前記第2の出力を提供することとは、前記第1のロケーションが前記第3の時間に前記CGR環境の前記表示されている部分の中にあるという前記判断に従って実行される、請求項15に記載の方法。
【請求項17】
前記判断された意図に基づいて前記第2の出力を提供することは、
前記判断された意図が前記デジタルアシスタントオブジェクトを再配置することに関連するという判断に従って、
前記第2のユーザ入力から第2のロケーションを判断することと、
前記第2のロケーションに前記デジタルアシスタントオブジェクトを配置することと、
第4の時間において、前記第2のロケーションが前記第4の時間に前記CGR環境の前記表示されている部分の中にあるという判断に従って、前記CGR環境内の前記第2のロケーションに前記デジタルアシスタントオブジェクトを表示することとを含む、請求項15~16のいずれか一項に記載の方法。
【請求項18】
前記第2のロケーションに前記デジタルアシスタントオブジェクトを配置した後に、前記デジタルアシスタントオブジェクトを退去させることと、
前記1つ以上のセンサを用いて第3のユーザ入力を検出することと、
前記第3のユーザ入力がデジタルアシスタントセッションを開始するための少なくとも1つの基準を満たしているという判断に従って、第2のデジタルアシスタントセッションを開始することであって、前記第2のデジタルアシスタントセッションを開始することが、前記第2のロケーションに前記デジタルアシスタントオブジェクトを配置することを含む、開始することとを更に含む、
請求項17に記載の方法。
【請求項19】
前記判断された意図に基づいて前記第2の出力を提供することは、
前記判断された意図が前記CGR環境内のオブジェクトロケーションに位置するオブジェクトに関連するという判断に従って、前記オブジェクトロケーションの近くの第3のロケーションに前記デジタルアシスタントオブジェクトを配置することを含む、請求項15~16のいずれか一項に記載の方法。
【請求項20】
前記第2の出力を提供している間に、前記第2の出力の1つ以上の特性に基づいて、第3の出力を提供することを更に含む、
請求項14~19のいずれか一項に記載の方法。
【請求項21】
前記デジタルアシスタントオブジェクトを退去させることと、
前記デジタルアシスタントオブジェクトの退去を示す第4の出力を提供することとを更に含む、
請求項1~20のいずれか一項に記載の方法。
【請求項22】
前記第4の出力を提供することは、
前記CGR環境内の前記第1のロケーションにデジタルアシスタントインジケータを配置することを含む、請求項21に記載の方法。
【請求項23】
前記第1のデジタルアシスタントセッションの2つ以上の異なる状態から選択された状態を示す2つ以上の異なる出力から選択された第5の出力を提供することを更に含む、
請求項1~22のいずれか一項に記載の方法。
【請求項24】
1つ以上のプロセッサ、メモリ、ディスプレイ、及び1つ以上のセンサを有する電子デバイスにおいて、
前記1つ以上のセンサを用いて第1のユーザ入力を検出することと、
前記第1のユーザ入力がデジタルアシスタントセッションを開始するための基準を満たしているという判断に従って、第1のデジタルアシスタントセッションを開始することであって、前記第1のデジタルアシスタントセッションを開始することが、
コンピュータ生成現実(CGR)環境の第1の部分を前記ディスプレイに表示している間に、前記CGR環境の中であって前記CGR環境の前記第1の部分の外にある第1のロケーションにデジタルアシスタントオブジェクトを配置することと、
前記CGR環境内の前記デジタルアシスタントオブジェクトの前記第1のロケーションを示す第1の出力を提供することとを含む、開始することと、
を含む、方法。
【請求項25】
前記第1のユーザ入力は、聴覚入力を含む、請求項24に記載の方法。
【請求項26】
前記聴覚入力は、トリガフレーズを含む音声入力を含む、請求項25に記載の方法。
【請求項27】
前記第1のユーザ入力は、視線入力を含む、請求項24~26のいずれか一項に記載の方法。
【請求項28】
前記第1のユーザ入力は、ジェスチャ入力を含む、請求項24~27のいずれか一項に記載の方法。
【請求項29】
1つ以上の環境要因に基づいて、前記CGR環境内の前記第1のロケーションを判断することを更に含む、
請求項24~28のいずれか一項に記載の方法。
【請求項30】
前記1つ以上の環境要因は、前記CGR環境の特性を含む、請求項29に記載の方法。
【請求項31】
前記1つ以上の環境要因は、前記電子デバイスのユーザのポジションを含む、請求項29~30のいずれか一項に記載の方法。
【請求項32】
前記1つ以上の環境要因は、前記CGR環境の複数のユーザの複数のポジションを含む、請求項29~31のいずれか一項に記載の方法。
【請求項33】
前記第1のロケーションを示す前記第1の出力を提供することは、
第1の聴覚出力を生成させることとを含む、請求項24~32のいずれか一項に記載の方法。
【請求項34】
前記第1の聴覚出力は、少なくとも、複数のスピーカーのうちの第1のスピーカーによって生成される第1のオーディオ成分と、前記複数のスピーカーのうちの第2のスピーカーによって生成される第2のオーディオ成分とを含み、前記第1のロケーションを示す前記第1の出力を提供することは、
前記第1のロケーションが前記複数のスピーカーのうちの前記第1のスピーカーのロケーションに近いか、それとも前記複数のスピーカーのうちの前記第2のスピーカーのロケーションに近いかを判断することと、
前記第1のロケーションが前記第2のスピーカーの前記ロケーションより前記第1のスピーカーの前記ロケーションに近いという判断に従って、前記第1のオーディオ成分を前記第2のオーディオ成分より大音量で生成することと、
前記第1のロケーションが前記第1のスピーカーの前記ロケーションより前記第2のスピーカーの前記ロケーションに近いという判断に従って、前記第2のオーディオ成分を前記第1のオーディオ成分より大音量で生成することとを含む、請求項33に記載の方法。
【請求項35】
前記第1のロケーションを示す前記第1の出力を提供することは、
第1の触覚出力を生成させることとを含む、請求項24~34のいずれか一項に記載の方法。
【請求項36】
前記第1のロケーションを示す前記第1の出力を提供することは、前記第1のロケーションの視覚的表示を提供することを含む、請求項24~35のいずれか一項に記載の方法。
【請求項37】
前記1つ以上のセンサを用いて第2のユーザ入力を検出することと、
前記第2のユーザ入力の意図を判断することと、
前記判断された意図に基づいて第2の出力を提供することとを更に含む、
請求項24~36のいずれか一項に記載の方法。
【請求項38】
前記CGR環境の第2の部分を前記ディスプレイに表示することと、
前記第1のロケーションに前記デジタルアシスタントオブジェクトが配置されている間に、前記第1のロケーションが前記CGR環境の前記第2の部分の中にあるという判断に従って、前記CGR環境内の前記第1のロケーションに前記デジタルアシスタントオブジェクトを表示することとを更に含む、
請求項37に記載の方法。
【請求項39】
前記第2のユーザ入力を検出することは、前記デジタルアシスタントオブジェクトが前記第1のロケーションに配置されている間に実行され、前記意図を判断することと前記判断された意図に基づいて前記第2の出力を提供することとは、前記第1のロケーションが前記CGR環境の前記第2の部分の中にあるという前記判断に従って実行される、請求項38に記載の方法。
【請求項40】
前記判断された意図に基づいて前記第2の出力を提供することは、
前記判断された意図が前記デジタルアシスタントオブジェクトを再配置することに関連するという判断に従って、
前記第2のユーザ入力から第2のロケーションを判断することと、
前記第2のロケーションに前記デジタルアシスタントオブジェクトを配置することと、
前記CGR環境の前記第2の部分を表示している間に、前記第2のロケーションが前記CGR環境の前記第2の部分の中にあるという判断に従って、前記CGR環境内の前記第2のロケーションに前記デジタルアシスタントオブジェクトを表示することとを含む、請求項38~39のいずれか一項に記載の方法。
【請求項41】
前記デジタルアシスタントオブジェクトを前記第2のロケーションに表示した後に、前記デジタルアシスタントオブジェクトを退去させることと、
前記1つ以上のセンサを用いて第3のユーザ入力を検出することと、
前記第3のユーザ入力がデジタルアシスタントセッションを開始するための基準を満たしているという判断に従って、第2のデジタルアシスタントセッションを開始することであって、前記第2のデジタルアシスタントセッションを開始することが、前記第2のロケーションに前記デジタルアシスタントオブジェクトを配置することを含む、開始することとを更に含む、
請求項40に記載の方法。
【請求項42】
前記判断された意図に基づいて前記第2の出力を提供することは、
前記判断された意図が前記CGR環境内のオブジェクトロケーションに位置するオブジェクトに関連するという判断に従って、前記オブジェクトロケーションの近くの第3のロケーションに前記デジタルアシスタントオブジェクトを配置することとを含む、請求項37~39のいずれか一項に記載の方法。
【請求項43】
前記第2の出力を提供している間に、前記第2の出力の1つ以上の特性に基づいて、第3の出力を提供することを更に含む、
請求項37~42のいずれか一項に記載の方法。
【請求項44】
前記デジタルアシスタントオブジェクトが前記第1のロケーションに配置されている間に、
前記デジタルアシスタントオブジェクトを退去させることと、
前記デジタルアシスタントオブジェクトの退去を示す第4の出力を提供することとを更に含む、
請求項24~43のいずれか一項に記載の方法。
【請求項45】
前記第4の出力を提供することは、
前記CGR環境内の前記第1のロケーションにデジタルアシスタントインジケータを配置することを含む、請求項44に記載の方法。
【請求項46】
前記第1のデジタルアシスタントセッションの2つ以上の異なる状態から選択された状態を示す2つ以上の異なる出力から選択された第5の出力を提供することを更に含む、
請求項24~45のいずれか一項に記載の方法。
【請求項47】
1つ以上のプロセッサ、メモリ、ディスプレイ、及び1つ以上のセンサを有する電子デバイスにおいて、
コンピュータ生成現実(CGR)環境の部分を前記ディスプレイに表示している間に、
前記1つ以上のセンサを用いて第1のユーザ入力を検出することと、
前記第1のユーザ入力がデジタルアシスタントセッションを開始するための基準を満たしているという判断に従って、第1のデジタルアシスタントセッションを開始することであって、前記第1のデジタルアシスタントセッションを開始することが、
第1の時間に前記CGR環境の中であって前記CGR環境の前記部分の外にある第1のロケーションでデジタルアシスタントオブジェクトのインスタンスを生成することと、
前記第1の時間に前記CGR環境の前記部分の中の第2のロケーションに移動する前記デジタルアシスタントオブジェクトを動画化することとを含む、開始することと、
を含む、方法。
【請求項48】
前記第1のユーザ入力は、音声入力を含む、請求項47に記載の方法。
【請求項49】
前記音声入力は、トリガフレーズを含む、請求項48に記載の方法。
【請求項50】
前記第1のユーザ入力は、視線入力を含む、請求項47~49のいずれか一項に記載の方法。
【請求項51】
前記第1のユーザ入力は、ジェスチャ入力を含む、請求項47~50のいずれか一項に記載の方法。
【請求項52】
1つ以上の第1の環境要因に基づいて、前記CGR環境内の前記第1のロケーションを判断することを更に含む、
請求項47~51のいずれか一項に記載の方法。
【請求項53】
前記1つ以上の第1の環境要因は、前記CGR環境の第1の特性を含む、請求項52に記載の方法。
【請求項54】
前記1つ以上の第1の環境要因は、前記電子デバイスのユーザの第1のポジションを含む、請求項52~53のいずれか一項に記載の方法。
【請求項55】
1つ以上の第2の環境要因に基づいて、前記CGR環境内の前記第2のロケーションを判断することを更に含む、
請求項47~54のいずれか一項に記載の方法。
【請求項56】
前記1つ以上の第2の環境要因は、前記CGR環境の第2の特性を含む、請求項55に記載の方法。
【請求項57】
前記1つ以上の第2の環境要因は、前記電子デバイスのユーザの第1のポジションを含む、請求項55~56のいずれか一項に記載の方法。
【請求項58】
前記第2のロケーションに移動する前記デジタルアシスタントオブジェクトを動画化することは、移動経路を判断することを含む、請求項47~57のいずれか一項に記載の方法。
【請求項59】
前記移動経路は、前記第1のロケーションと前記第2のロケーションとの間の経路の一部分に相当し、前記経路の前記部分は、前記第1の時間に前記CGR環境の前記部分の中にある、請求項58に記載の方法。
【請求項60】
前記移動経路は、前記第1の時間に前記CGR環境の前記部分の中に位置する追加のオブジェクトを通過しない、請求項58~59のいずれか一項に記載の方法。
【請求項61】
前記1つ以上のセンサを用いて第2のユーザ入力を検出することと、
前記第2のユーザ入力の意図を判断することと、
前記判断された意図に基づいて第1の出力を提供することとを更に含む、
請求項47~60のいずれか一項に記載の方法。
【請求項62】
前記判断された意図に基づいて前記第1の出力を提供することは、
前記判断された意図が前記デジタルアシスタントオブジェクトを再配置することに関連するという判断に従って、
前記第2のユーザ入力から第3のロケーションを判断することと、
前記第3のロケーションに前記デジタルアシスタントオブジェクトを配置することと、
第2の時間において、前記第3のロケーションが前記第2の時間に前記CGR環境の前記部分の中にあるという判断に従って、前記CGR環境内の前記第3のロケーションに前記デジタルアシスタントオブジェクトを表示することとを含む、請求項61のいずれか一項に記載の方法。
【請求項63】
前記第3のロケーションに前記デジタルアシスタントオブジェクトを表示した後に、前記デジタルアシスタントオブジェクトを退去させることと、
前記1つ以上のセンサを用いて第3のユーザ入力を検出することと、
前記第3のユーザ入力がデジタルアシスタントセッションを開始するための基準を満たしているという判断に従って、第2のデジタルアシスタントセッションを開始することであって、前記第2のデジタルアシスタントセッションを開始することが、前記第3のロケーションに前記デジタルアシスタントオブジェクトを配置することを含む、開始することとを更に含む、
請求項62に記載の方法。
【請求項64】
前記デジタルアシスタントオブジェクトを退去させることは、
前記CGR環境内の前記第3のロケーションにデジタルアシスタントインジケータを配置することを含む、請求項63に記載の方法。
【請求項65】
前記判断された意図に基づいて前記第1の出力を提供することは、
前記判断された意図が前記CGR環境内のオブジェクトロケーションに位置するオブジェクトに関連するという判断に従って、前記オブジェクトロケーションの近くの第4のロケーションに前記デジタルアシスタントオブジェクトを配置することを含む、請求項61に記載の方法。
【請求項66】
前記第1の出力を提供している間に、前記第1の出力の1つ以上の特性に基づいて、第2の出力を提供することを更に含む、
請求項61~65のいずれか一項に記載の方法。
【請求項67】
前記デジタルアシスタントオブジェクトが前記第2のロケーションに配置されている間の第3の時間に、
前記デジタルアシスタントオブジェクトを退去させることと、
前記デジタルアシスタントオブジェクトの退去を示す第3の出力を提供することとを更に含む、
請求項47~66のいずれか一項に記載の方法。
【請求項68】
前記第1のデジタルアシスタントセッションの2つ以上の異なる状態から選択された状態を示す2つ以上の異なる出力から選択された第4の出力を提供することを更に含む、
請求項1~21のいずれか一項に記載の方法。
【請求項69】
電子デバイスであって、
ディスプレイと、
1つ以上のセンサと、
1つ以上のプロセッサと、
前記1つ以上のプロセッサによって実行されるように構成された1つ以上のプログラムを記憶するメモリと、を備え、前記1つ以上のプログラムは、
前記電子デバイスのユーザの現在の視野を表すコンピュータ生成現実(CGR)環境の部分を表示している間に、
前記1つ以上のセンサを用いて第1のユーザ入力を検出する命令と、
前記第1のユーザ入力がデジタルアシスタントセッションを開始するための少なくとも1つの基準を満たしているという判断に従って、第1のデジタルアシスタントセッションを開始する命令であって、前記第1のデジタルアシスタントセッションを開始することが、第1の時間に前記CGR環境の中であって前記CGR環境の前記表示されている部分の外にある第1のロケーションにデジタルアシスタントオブジェクトを配置することを含む、開始する命令と、
前記CGR環境内の前記デジタルアシスタントオブジェクトの前記第1のロケーションを示す第1の出力を提供する命令とを含む、電子デバイス。
【請求項70】
電子デバイスであって、
ディスプレイと、
1つ以上のセンサと、
1つ以上のプロセッサと、
前記1つ以上のプロセッサによって実行されるように構成された1つ以上のプログラムを記憶するメモリと、を備え、前記1つ以上のプログラムは、
前記1つ以上のセンサを用いて第1のユーザ入力を検出する命令と、
前記第1のユーザ入力がデジタルアシスタントセッションを開始するための基準を満たしているという判断に従って、第1のデジタルアシスタントセッションを開始する命令であって、前記第1のデジタルアシスタントセッションを開始することが、
コンピュータ生成現実(CGR)環境の第1の部分を前記ディスプレイに表示している間に、前記CGR環境の中であって前記CGR環境の前記第1の部分の外にある第1のロケーションにデジタルアシスタントオブジェクトを配置することと、
前記CGR環境内の前記デジタルアシスタントオブジェクトの前記第1のロケーションを示す第1の出力を提供することとを含む、開始する命令とを含む、電子デバイス。
【請求項71】
電子デバイスであって、
ディスプレイと、
1つ以上のセンサと、
1つ以上のプロセッサと、
前記1つ以上のプロセッサによって実行されるように構成された1つ以上のプログラムを記憶するメモリと、を備え、前記1つ以上のプログラムは、
コンピュータ生成現実(CGR)環境の部分を前記ディスプレイに表示している間に、
前記1つ以上のセンサを用いて第1のユーザ入力を検出する命令と、
前記第1のユーザ入力がデジタルアシスタントセッションを開始するための基準を満たしているという判断に従って、第1のデジタルアシスタントセッションを開始する命令であって、前記第1のデジタルアシスタントセッションを開始することが、
第1の時間に前記CGR環境の中であって前記CGR環境の前記部分の外にある第1のロケーションでデジタルアシスタントオブジェクトのインスタンスを生成することと、
前記第1の時間に前記CGR環境の前記部分の中の第2のロケーションに移動する前記デジタルアシスタントオブジェクトを動画化することとを含む、開始する命令とを含む、電子デバイス。
【請求項72】
ディスプレイと1つ以上のセンサとを有する電子デバイスの1つ以上のプロセッサによって実行されるように構成された1つ以上のプログラムを記憶する非一時的コンピュータ可読記憶媒体であって、前記1つ以上のプログラムが、
前記電子デバイスのユーザの現在の視野を表すコンピュータ生成現実(CGR)環境の部分を表示している間に、
前記1つ以上のセンサを用いて第1のユーザ入力を検出する命令と、
前記第1のユーザ入力がデジタルアシスタントセッションを開始するための少なくとも1つの基準を満たしているという判断に従って、第1のデジタルアシスタントセッションを開始する命令であって、前記第1のデジタルアシスタントセッションを開始することが、第1の時間に前記CGR環境の中であって前記CGR環境の前記表示されている部分の外にある第1のロケーションにデジタルアシスタントオブジェクトを配置することを含む、開始する命令と、
前記CGR環境内の前記デジタルアシスタントオブジェクトの前記第1のロケーションを示す第1の出力を提供する命令とを含む、非一時的コンピュータ可読記憶媒体。
【請求項73】
ディスプレイと1つ以上のセンサとを有する電子デバイスの1つ以上のプロセッサによって実行されるように構成された1つ以上のプログラムを記憶する非一時的コンピュータ可読記憶媒体であって、前記1つ以上のプログラムが、
前記1つ以上のセンサを用いて第1のユーザ入力を検出する命令と、
前記第1のユーザ入力がデジタルアシスタントセッションを開始するための基準を満たしているという判断に従って、第1のデジタルアシスタントセッションを開始する命令であって、前記第1のデジタルアシスタントセッションを開始することが、
コンピュータ生成現実(CGR)環境の第1の部分を前記ディスプレイに表示している間に、前記CGR環境の中であって前記CGR環境の前記第1の部分の外にある第1のロケーションにデジタルアシスタントオブジェクトを配置することと、
前記CGR環境内の前記デジタルアシスタントオブジェクトの前記第1のロケーションを示す第1の出力を提供することとを含む、開始する命令とを含む、非一時的コンピュータ可読記憶媒体。
【請求項74】
ディスプレイと1つ以上のセンサとを有する電子デバイスの1つ以上のプロセッサによって実行されるように構成された1つ以上のプログラムを記憶する非一時的コンピュータ可読記憶媒体であって、前記1つ以上のプログラムが、
コンピュータ生成現実(CGR)環境の部分を前記ディスプレイに表示している間に、
前記1つ以上のセンサを用いて第1のユーザ入力を検出する命令と、
前記第1のユーザ入力がデジタルアシスタントセッションを開始するための基準を満たしているという判断に従って、第1のデジタルアシスタントセッションを開始する命令であって、前記第1のデジタルアシスタントセッションを開始することが、
第1の時間に前記CGR環境の中であって前記CGR環境の前記部分の外にある第1のロケーションでデジタルアシスタントオブジェクトのインスタンスを生成することと、
前記第1の時間に前記CGR環境の前記部分の中の第2のロケーションに移動する前記デジタルアシスタントオブジェクトを動画化することとを含む、開始する命令とを含む、非一時的コンピュータ可読記憶媒体。
【請求項75】
電子デバイスであって、
前記電子デバイスのユーザの現在の視野を表すコンピュータ生成現実(CGR)環境の部分を表示している間に、
前記1つ以上のセンサを用いて第1のユーザ入力を検出する手段と、
前記第1のユーザ入力がデジタルアシスタントセッションを開始するための少なくとも1つの基準を満たしているという判断に従って、第1のデジタルアシスタントセッションを開始する手段であって、前記第1のデジタルアシスタントセッションを開始することが、第1の時間に前記CGR環境の中であって前記CGR環境の前記表示されている部分の外にある第1のロケーションにデジタルアシスタントオブジェクトを配置することを含む、開始する手段と、
前記CGR環境内の前記デジタルアシスタントオブジェクトの前記第1のロケーションを示す第1の出力を提供する手段とを備える、電子デバイス。
【請求項76】
電子デバイスであって、
前記1つ以上のセンサを用いて第1のユーザ入力を検出する手段と、
前記第1のユーザ入力がデジタルアシスタントセッションを開始するための基準を満たしているという判断に従って、第1のデジタルアシスタントセッションを開始する手段であって、前記第1のデジタルアシスタントセッションを開始することが、
コンピュータ生成現実(CGR)環境の第1の部分を前記ディスプレイに表示している間に、前記CGR環境の中であって前記CGR環境の前記第1の部分の外にある第1のロケーションにデジタルアシスタントオブジェクトを配置することと、
前記CGR環境内の前記デジタルアシスタントオブジェクトの前記第1のロケーションを示す第1の出力を提供することとを含む、開始する手段とを備える、電子デバイス。
【請求項77】
電子デバイスであって、
コンピュータ生成現実(CGR)環境の部分を前記ディスプレイに表示している間に、
前記1つ以上のセンサを用いて第1のユーザ入力を検出する手段と、
前記第1のユーザ入力がデジタルアシスタントセッションを開始するための基準を満たしているという判断に従って、第1のデジタルアシスタントセッションを開始する手段であって、前記第1のデジタルアシスタントセッションを開始することが、
第1の時間に前記CGR環境の中であって前記CGR環境の前記部分の外にある第1のロケーションでデジタルアシスタントオブジェクトのインスタンスを生成することと、
前記第1の時間に前記CGR環境の前記部分の中の第2のロケーションに移動する前記デジタルアシスタントオブジェクトを動画化することとを含む、開始する手段とを備える、電子デバイス。
【請求項78】
電子デバイスであって、
ディスプレイと、
1つ以上のセンサと、
1つ以上のプロセッサと、
前記1つ以上のプロセッサによって実行されるように構成された1つ以上のプログラムを記憶するメモリとを備え、前記1つ以上のプログラムが、請求項1~23のいずれか一項に記載の方法を実行する命令を含む、電子デバイス。
【請求項79】
電子デバイスであって、
ディスプレイと、
1つ以上のセンサと、
1つ以上のプロセッサと、
前記1つ以上のプロセッサによって実行されるように構成された1つ以上のプログラムを記憶するメモリとを備え、前記1つ以上のプログラムが、請求項24~46のいずれか一項に記載の方法を実行する命令を含む、電子デバイス。
【請求項80】
電子デバイスであって、
ディスプレイと、
1つ以上のセンサと、
1つ以上のプロセッサと、
前記1つ以上のプロセッサによって実行されるように構成された1つ以上のプログラムを記憶するメモリとを備え、前記1つ以上のプログラムが、請求項47~68のいずれか一項に記載の方法を実行する命令を含む、電子デバイス。
【請求項81】
ディスプレイと1つ以上のセンサとを有する電子デバイスの1つ以上のプロセッサによって実行されるように構成された1つ以上のプログラムを記憶する非一時的コンピュータ可読記憶媒体であって、前記1つ以上のプログラムが、請求項1~23のいずれか一項に記載の方法を実行する命令を含む、非一時的コンピュータ可読記憶媒体。
【請求項82】
ディスプレイと1つ以上のセンサとを有する電子デバイスの1つ以上のプロセッサによって実行されるように構成された1つ以上のプログラムを記憶する非一時的コンピュータ可読記憶媒体であって、前記1つ以上のプログラムが、請求項24~46のいずれか一項に記載の方法を実行する命令を含む、非一時的コンピュータ可読記憶媒体。
【請求項83】
ディスプレイと1つ以上のセンサとを有する電子デバイスの1つ以上のプロセッサによって実行されるように構成された1つ以上のプログラムを記憶する非一時的コンピュータ可読記憶媒体であって、前記1つ以上のプログラムが、請求項47~68のいずれか一項に記載の方法を実行する命令を含む、非一時的コンピュータ可読記憶媒体。
【請求項84】
請求項1~23のいずれか一項に記載の方法を実行する手段を備える、
電子デバイス。
【請求項85】
請求項25~46のいずれか一項に記載の方法を実行する手段を備える、
電子デバイス。
【請求項86】
請求項47~68のいずれか一項に記載の方法を実行する手段を備える、
電子デバイス。
【発明の詳細な説明】
【技術分野】
【0001】
これは、一般的には、デジタルアシスタントに関し、より具体的には、コンピュータ生成現実(CGR)環境の中でデジタルアシスタントを表すオブジェクトを配置することに関する。
【背景技術】
【0002】
デジタルアシスタントは、例えば、発話若しくはタイプされた自然言語、ジェスチャ、又はその他の便利な若しくは直感的な入力モードを使用して、人のユーザとその電子デバイスとの間で有益なインターフェースとして機能することができる。例えば、ユーザは、電子デバイスのデジタルアシスタントに対して自然言語要求を発言できる。デジタルアシスタントは、発話入力からユーザの意図を解釈し、ユーザの意図をタスクに動作可能にすることができる。次いで、タスクは、電子デバイスの1つ以上のサービスを実行することによって実行され、ユーザ要求への関連出力応答をユーザに戻すことができる。
【0003】
人が電子デバイスを使用せずに相互作用し知覚できる物理的な世界とは異なり、電子デバイスは、全体的又は部分的にシミュレートされたコンピュータ生成現実(CGR)環境と相互作用するために、及び/又はそれを知覚するために、使用される。例えば、CGR環境は、複合現実(Mixed Reality、MR)コンテンツ、拡張現実(Augmented Reality、AR)コンテンツ、仮想現実(Virtual Reality、VR)コンテンツなどを含み得る。CGRシステムと相互作用する1つの方法は、人の身体運動のいくつかを追跡し、それに応じて、少なくとも1つの物理の法則に従っているように見えるやり方で、CGR環境においてシミュレートされた要素の特性を調整することによる。例えば、ユーザが、CGR環境を提示するデバイス及び/又はユーザの頭を動かすと、CGRシステムは、その動きを検出し、ユーザの視点に従ってグラフィカルコンテンツと聴覚コンテンツを調整して、空間音の効果を生み出すことができる。いくつかの状況では、CGRシステムは、ボタン入力又は音声コマンドなどのユーザ入力に応じてCGRコンテンツの特性を調整できる。
【0004】
ヘッドアップディスプレイ(HUD)、頭部装着可能システム、投影方式のシステム、ヘッドホン/イヤホン、スピーカーアレイ、スマートフォン、タブレット、及びデスクトップ/ラップトップコンピュータなど、多くの異なる電子デバイス及び/又はシステムを使用して、CGR環境と相互作用でき、及び/又はCGR環境を知覚できる。例えば、頭部装着可能システムは、1つ以上のスピーカー(例えば、スピーカーアレイ)、一体型又は外部の不透明、半透明、又は透明ディスプレイ、物理的環境の映像を取り込む画像センサ、及び/又は物理的環境の音声を取り込むマイクロフォンを含み得る。ディスプレイは、uLED、OLED、LED、シリコン上の液晶、レーザ走査光源、デジタル光投影などを含む様々なディスプレイ技術を使用して実装され得、ユーザの目に光を誘導する媒体として、光導波路、光学反射器、ホログラム媒体、光学式コンバイナ、それらの組み合わせ、又は同様の技術を実装し得る。透明又は半透明のディスプレイを用いる実装形態では、透明又は半透明のディスプレイは不透明になるようにも制御され得る。ディスプレイは、ユーザの網膜上に画像を投影する、及び/又は(例えば、ホログラムとして、又は物理的な表面若しくは物体上にマッピングされる投影として)物理的環境内に仮想CGR要素を投影する、投影方式のシステムを実現できる。
【0005】
電子デバイスは、CGR環境におけるデジタルアシスタントの使用を実現するために使用され得る。CGR環境においてデジタルアシスタントを実現することは、電子デバイスのユーザがCGR環境と相互作用するのを支援でき、ユーザがCGR環境との相互作用を中止する必要なくデジタルアシスタント機能にアクセスすることを可能にすることができる。しかしながら、CGR環境のインターフェースは大規模で複雑であり得るので(例えば、CGR環境は、ユーザの視野を満たし、且つそれを超えて延在し得る)、CGR環境の中でデジタルアシスタントを呼び出してそれと相互作用するのは、困難である、分かりにくい、又はCGR環境の没入から気を散らす可能性がある。
【発明の概要】
【0006】
例示的な方法を本明細書に開示する。例示的な方法は、1つ以上のプロセッサ、メモリ、ディスプレイ、及び1つ以上のセンサを有する電子デバイスにおいて、電子デバイスのユーザの現在の視野を表すコンピュータ生成現実(CGR)環境の部分を表示している間に、1つ以上のセンサを用いて第1のユーザ入力を検出することと、第1のユーザ入力がデジタルアシスタントセッションを開始するための少なくとも1つの基準を満たしているという判断に従って、第1のデジタルアシスタントセッションを開始することであって、第1のデジタルアシスタントセッションを開始することが、第1の時間にCGR環境の中であってCGR環境の表示されている部分の外にある第1のロケーションにデジタルアシスタントオブジェクトを配置することを含む、開始することと、CGR環境内のデジタルアシスタントの第1のロケーションを示す第1の出力を提供することとを含む。
【0007】
例示的な非一時的コンピュータ可読媒体が、本明細書で開示される。例示的な非一時的コンピュータ可読記憶媒体は、1つ以上のプログラムを記憶している。1つ以上のプログラムは、電子デバイスの1つ以上のプロセッサによって実行されたときに、電子デバイスに、1つ以上のセンサを用いて第1のユーザ入力を検出させる命令と、第1のユーザ入力がデジタルアシスタントセッションを開始するための少なくとも1つの基準を満たしているという判断に従って、第1のデジタルアシスタントセッションを開始させる命令であって、第1のデジタルアシスタントセッションを開始することが、第1の時間にCGR環境の中であってCGR環境の表示されている部分の外にある第1のロケーションにデジタルアシスタントオブジェクトを配置することを含む、開始させる命令と、CGR環境内のデジタルアシスタントの第1のロケーションを示す第1の出力を提供させる命令とを含む。
【0008】
例示的な電子デバイスが本明細書に開示されている。例示的な電子デバイスは、1つ以上のプロセッサと、メモリと、1つ以上のプログラムとを備え、1つ以上のプログラムは、メモリに記憶され、1つ以上のプロセッサによって実行されるように構成され、1つ以上のプログラムは、1つ以上のセンサを用いて第1のユーザ入力を検出する命令と、第1のユーザ入力がデジタルアシスタントセッションを開始するための少なくとも1つの基準を満たしているという判断に従って、第1のデジタルアシスタントセッションを開始する命令であって、第1のデジタルアシスタントセッションを開始することが、第1の時間にCGR環境の中であってCGR環境の表示されている部分の外にある第1のロケーションにデジタルアシスタントオブジェクトを配置することを含む、開始する命令と、CGR環境内のデジタルアシスタントの第1のロケーションを示す第1の出力を提供する命令とを含む。
【0009】
例示的な電子デバイスは、1つ以上のセンサを用いて第1のユーザ入力を検出する手段と、第1のユーザ入力がデジタルアシスタントセッションを開始するための少なくとも1つの基準を満たしているという判断に従って、第1のデジタルアシスタントセッションを開始する手段であって、第1のデジタルアシスタントセッションを開始することが、第1の時間にCGR環境の中であってCGR環境の表示されている部分の外にある第1のロケーションにデジタルアシスタントオブジェクトを配置することを含む、開始する手段と、CGR環境内のデジタルアシスタントの第1のロケーションを示す第1の出力を提供する手段とを備える。
【0010】
例示的な方法を本明細書に開示する。例示的な方法は、1つ以上のプロセッサ、メモリ、ディスプレイ、及び1つ以上のセンサを有する電子デバイスにおいて、1つ以上のセンサを用いてユーザ入力を検出することと、第1のユーザ入力がデジタルアシスタントセッションを開始するための基準を満たしているという判断に従って、第1のデジタルアシスタントセッションを開始することであって、第1のデジタルアシスタントセッションを開始することが、コンピュータ生成現実(CGR)環境の第1の部分をディスプレイに表示している間に、CGR環境の中であってCGR環境の第1の部分の外にある第1のロケーションにデジタルアシスタントオブジェクトを配置することを含む、開始することと、CGR環境内のデジタルアシスタントオブジェクトの第1のロケーションを示す第1の出力を提供することとを含む。
【0011】
例示的な非一時的コンピュータ可読媒体が、本明細書で開示される。例示的な非一時的コンピュータ可読記憶媒体は、1つ以上のプログラムを記憶している。1つ以上のプログラムは、電子デバイスの1つ以上のプロセッサによって実行されたときに、電子デバイスに、1つ以上のセンサを用いてユーザ入力を検出させる命令と、第1のユーザ入力がデジタルアシスタントセッションを開始するための基準を満たしているという判断に従って、第1のデジタルアシスタントセッションを開始させる命令であって、第1のデジタルアシスタントセッションを開始することが、コンピュータ生成現実(CGR)環境の第1の部分をディスプレイに表示している間に、CGR環境の中であってCGR環境の第1の部分の外にある第1のロケーションにデジタルアシスタントオブジェクトを配置することと、CGR環境内のデジタルアシスタントオブジェクトの第1のロケーションを示す第1の出力を提供することとを含む、開始させる命令とを含む。
【0012】
例示的な電子デバイスが本明細書に開示されている。例示的な電子デバイスは、1つ以上のプロセッサ、メモリ、及び1つ以上のプログラムを備え、1つ以上のプログラムは、メモリに記憶され、1つ以上のプロセッサによって実行されるように構成され、1つ以上のプログラムは、1つ以上のセンサを用いてユーザ入力を検出する命令と、第1のユーザ入力がデジタルアシスタントセッションを開始するための基準を満たしているという判断に従って、第1のデジタルアシスタントセッションを開始する命令であって、第1のデジタルアシスタントセッションを開始することが、コンピュータ生成現実(CGR)環境の第1の部分をディスプレイに表示している間に、CGR環境の中であってCGR環境の第1の部分の外にある第1のロケーションにデジタルアシスタントオブジェクトを配置することを含む、開始する命令と、CGR環境内のデジタルアシスタントオブジェクトの第1のロケーションを示す第1の出力を提供する命令とを含む。
【0013】
例示的な電子デバイスは、1つ以上のセンサを用いてユーザ入力を検出する手段と、第1のユーザ入力がデジタルアシスタントセッションを開始するための基準を満たしているという判断に従って、第1のデジタルアシスタントセッションを開始する手段であって、第1のデジタルアシスタントセッションを開始することが、コンピュータ生成現実(CGR)環境の第1の部分をディスプレイに表示している間に、CGR環境の中であってCGR環境の第1の部分の外にある第1のロケーションにデジタルアシスタントオブジェクトを配置することを含む、開始する手段と、CGR環境内のデジタルアシスタントオブジェクトの第1のロケーションを示す第1の出力を提供する手段とを備える。
【0014】
例示的な方法を本明細書に開示する。例示的な方法は、1つ以上のプロセッサ、メモリ、ディスプレイ、及び1つ以上のセンサを有する電子デバイスにおいて、コンピュータ生成現実(CGR)環境の部分をディスプレイに表示している間に、1つ以上のセンサを用いて第1のユーザ入力を検出することと、第1のユーザ入力がデジタルアシスタントセッションを開始するための基準を満たしているという判断に従って、第1のデジタルアシスタントセッションを開始することであって、第1のデジタルアシスタントセッションを開始することが、第1の時間にCGR環境の中であってCGR環境の部分の外にある第1のロケーションでデジタルアシスタントオブジェクトを開始することと、第1の時間にCGR環境の部分の中の第2のロケーションに移動するデジタルアシスタントオブジェクトを動画化することとを含む、開始することとを含む。
【0015】
例示的な非一時的コンピュータ可読媒体が、本明細書で開示される。例示的な非一時的コンピュータ可読記憶媒体は、1つ以上のプログラムを記憶している。1つ以上のプログラムは、電子デバイスの1つ以上のプロセッサによって実行されたときに、電子デバイスに、コンピュータ生成現実(CGR)環境の部分をディスプレイに表示している間に、1つ以上のセンサを用いて第1のユーザ入力を検出させる命令と、第1のユーザ入力がデジタルアシスタントセッションを開始するための基準を満たしているという判断に従って、第1のデジタルアシスタントセッションを開始させる命令であって、第1のデジタルアシスタントセッションを開始することが、第1の時間にCGR環境の中であってCGR環境の部分の外にある第1のロケーションでデジタルアシスタントオブジェクトを開始することと、第1の時間にCGR環境の部分の中の第2のロケーションに移動するデジタルアシスタントオブジェクトを動画化することとを含む、開始させる命令とを含む。
【0016】
例示的な電子デバイスが本明細書に開示されている。例示的な電子デバイスは、1つ以上のプロセッサ、メモリ、及び1つ以上のプログラムを備え、1つ以上のプログラムは、メモリに記憶され、1つ以上のプロセッサによって実行されるように構成され、1つ以上のプログラムは、コンピュータ生成現実(CGR)環境の部分をディスプレイに表示している間に、1つ以上のセンサを用いて第1のユーザ入力を検出する命令と、第1のユーザ入力がデジタルアシスタントセッションを開始するための基準を満たしているという判断に従って、第1のデジタルアシスタントセッションを開始する命令であって、第1のデジタルアシスタントセッションを開始することが、第1の時間にCGR環境の中であってCGR環境の部分の外にある第1のロケーションでデジタルアシスタントオブジェクトを開始することと、第1の時間にCGR環境の部分の中の第2のロケーションに移動するデジタルアシスタントオブジェクトを動画化することとを含む、開始する命令とを含む。
【0017】
例示的な電子デバイスは、コンピュータ生成現実(CGR)環境の部分をディスプレイに表示している間に、1つ以上のセンサを用いて第1のユーザ入力を検出する手段と、第1のユーザ入力がデジタルアシスタントセッションを開始するための基準を満たしているという判断に従って、第1のデジタルアシスタントセッションを開始する手段であって、第1のデジタルアシスタントセッションを開始することが、第1の時間にCGR環境の中であってCGR環境の部分の外にある第1のロケーションでデジタルアシスタントオブジェクトを開始することと、第1の時間にCGR環境の部分の中の第2のロケーションに移動するデジタルアシスタントオブジェクトを動画化することとを含む、開始する手段とを備える。
【0018】
本明細書で説明されているようにコンピュータ生成現実(CGR)環境の中でデジタルアシスタントの表現を配置することは、CGR環境の中でデジタルアシスタントと相互作用するための直感的で効率的なユーザインターフェースを提供する。例えば、最初にユーザの視野外にデジタルアシスタントオブジェクトを配置し、デジタルアシスタントオブジェクトのロケーションの指示を提供することは、ユーザの注意をデジタルアシスタントに効率的に引き付け、ユーザが所望の機能にアクセスするために必要な時間及びユーザ入力を削減し、したがって、電力使用量を削減し、デバイスのバッテリ寿命を向上させる。別の実施例として、ユーザの視野外でデジタルアシスタントオブジェクトを初期化し、ユーザの視野内に移動するデジタルアシスタントを動画化することも、ユーザの注意をデジタルアシスタントに効率的に引き付け、ユーザが所望の機能にアクセスするのに必要な時間及びユーザ入力を削減し、したがって、電力使用量を削減し、デバイスのバッテリ寿命を向上させる。
【図面の簡単な説明】
【0019】
図1A】様々な実施例による、様々な拡張現実技術で使用する例示的なシステムを示す。
図1B】様々な実施例による、様々な拡張現実技術で使用する例示的なシステムを示す。
【0020】
図2A】様々な実施例による、CGR環境の中でデジタルアシスタントの表現を配置するプロセスを示す。
図2B】様々な実施例による、CGR環境の中でデジタルアシスタントの表現を配置するプロセスを示す。
図2C】様々な実施例による、CGR環境の中でデジタルアシスタントの表現を配置するプロセスを示す。
図2D】様々な実施例による、CGR環境の中でデジタルアシスタントの表現を配置するプロセスを示す。
図2E】様々な実施例による、CGR環境の中でデジタルアシスタントの表現を配置するプロセスを示す。
【0021】
図3A】様々な実施例による、CGR環境の中でデジタルアシスタントの表現を配置する方法の流れ図を示す。
図3B】様々な実施例による、CGR環境の中でデジタルアシスタントの表現を配置する方法の流れ図を示す。
【0022】
図4A】様々な実施例による、CGR環境の中でデジタルアシスタントの表現を配置するプロセスを示す。
図4B】様々な実施例による、CGR環境の中でデジタルアシスタントの表現を配置するプロセスを示す。
図4C】様々な実施例による、CGR環境の中でデジタルアシスタントの表現を配置するプロセスを示す。
図4D】様々な実施例による、CGR環境の中でデジタルアシスタントの表現を配置するプロセスを示す。
図4E】様々な実施例による、CGR環境の中でデジタルアシスタントの表現を配置するプロセスを示す。
図4F】様々な実施例による、CGR環境の中でデジタルアシスタントの表現を配置するプロセスを示す。
【0023】
図5A】様々な実施例による、CGR環境の中でデジタルアシスタントの表現を配置する方法の流れ図を示す。
図5B】様々な実施例による、CGR環境の中でデジタルアシスタントの表現を配置する方法の流れ図を示す。
【発明を実施するための形態】
【0024】
以下の実施例の説明では、実践することが可能な特定の実施例が例として示される、添付図面を参照する。それら様々な実施例の範囲から逸脱することなく、他の実施例を使用することができ、構造上の変更を実施することができる点を理解されたい。
【0025】
デジタルアシスタントは、CGR環境の中で使用され得る。いくつかの実施形態において、呼び出し時に、CGR環境の中であるが、ユーザの現在の視野の外にある第1のロケーションに、デジタルアシスタントを表すデジタルアシスタントオブジェクトが配置され得、デジタルアシスタントオブジェクトのロケーションの指示が提供され得る。いくつかの実施形態において、呼び出し時に、CGR環境の中であるが、ユーザの現在の視野の外にある第1のロケーションに、デジタルアシスタントオブジェクトが配置され得、次いで、第1のロケーションから第2の見えるロケーションに移動するように動画化され得る。
【0026】
以下の説明では、様々な要素について説明するために、「第1の」、「第2の」などの用語を使用するが、これらの要素は、それらの用語によって限定されるべきではない。これらの用語は、ある要素を別の要素と区別するためにのみ使用される。例えば、説明される様々な実施例の範囲から逸脱することなく、第1の入力を第2の入力と呼ぶことが可能であり、同様に、第2の入力を第1の入力と呼ぶことも可能である。第1の入力及び第2の入力は、双方とも入力であり、一部の場合には、別個の異なる入力である。
【0027】
本明細書で説明される様々な実施例の説明で使用される用語法は、特定の実施例を説明することのみを目的とするものであって、限定することを意図するものではない。説明される様々な実施例の説明、及び添付の特許請求の範囲で使用するとき、単数形「a」、「an」、及び「the」は、文脈がそうではないことを明確に示さない限り、複数形もまた含むことが意図される。また、本明細書で使用されるとき、用語「及び/又は」は、関連する列挙された項目のうちの1つ以上のいずれか及び全ての考えられる組み合わせを指し、且つこれを含むことを理解されたい。用語「includes(含む)」、「including(含む)」、「comprises(含む、備える)」、及び/又は「comprising(含む、備える)」は、本明細書で使用する場合、述べられた特徴、整数、ステップ、動作、要素、及び/又は構成要素の存在を指定するが、1つ以上の他の特徴、整数、ステップ、動作、要素、構成要素、及び/又はそれらのグループの存在又は追加を除外しないことが更に理解されるであろう。
【0028】
用語「if(~の場合には)」は、文脈に応じて、「when(~のとき)」若しくは「upon(~すると)」、又は「in response to determining(~という判定に応答して)」、若しくは「in response to detecting(~の検出に応答して)」を意味するものと解釈することができる。同様に、句「if it is determined(~と判定される場合には)」又は「if[a stated condition or event]is detected([記述される条件又はイベント]が検出される場合には)」は、文脈に応じて、「upon determining(~と判定すると)」、若しくは「in response to determining(~という判定に応じて)」、又は「upon detecting[the stated condition or event]([記述される条件又はイベント]を検出すると)」、若しくは「in response to detecting[the stated condition or event]([記述される条件又はイベント]の検出に応じて)」を意味するものと解釈することができる。
1.CGR環境の中でデジタルアシスタントの表現を配置するプロセス
【0029】
図1A及び図1Bは、様々なコンピュータ生成現実技術で使用する例示的なシステム800を示す。
【0030】
いくつかの実施例において、図1Aに示されているように、システム800は、デバイス800aを含む。デバイス800aは、プロセッサ(単数又は複数)802、RF回路(単数又は複数)804、メモリ(単数又は複数)806、画像センサ(単数又は複数)808、向きセンサ(単数又は複数)810、マイクロフォン(単数又は複数)812、ロケーションセンサ(単数又は複数)816、スピーカー(単数又は複数)818、ディスプレイ(単数又は複数)820、及びタッチ感知面822などの様々な構成要素を含む。これらの構成要素は、任意選択的に、デバイス800aの通信バス(単数又は複数)850を介して通信する。
【0031】
いくつかの実施例において、システム800の要素は、基地局デバイス(例えば、リモートサーバ、モバイルデバイス、又はラップトップなどのコンピューティングデバイス)内に実装され、システム800の他の要素は、ユーザによって装着されるように設計されたヘッドマウントディスプレイ(HMD)デバイス内に実装され、HMDデバイスは、基地局デバイスと通信する。いくつかの実施例において、デバイス800aは、基地局デバイス又はHMDデバイス内に実装される。
【0032】
図1Bに示されているように、いくつかの実施例において、システム800は、有線接続又は無線接続などを介して通信状態にある2つ(又はそれ以上)のデバイスを含む。第1のデバイス800b(例えば、基地局デバイス)は、プロセッサ(単数又は複数)802、RF回路(単数又は複数)804、及びメモリ(単数又は複数)806を含む。これらの構成要素は、任意選択として、デバイス800bの通信バス(単数又は複数)850を介して通信する。第2のデバイス800c(例えば、ヘッドマウントデバイス)は、プロセッサ802、RF回路804、メモリ806、画像センサ808、向きセンサ810、マイクロフォン812、ロケーションセンサ816、スピーカー818、ディスプレイ820、及びタッチ感知面822などの様々な構成要素を含む。これらの構成要素は、任意選択として、デバイス800cの通信バス(単数又は複数)850を介して通信する。
【0033】
システム800は、プロセッサ(単数又は複数)802とメモリ(単数又は複数)806とを含む。プロセッサ(単数又は複数)802は、1つ以上の汎用プロセッサ、1つ以上のグラフィックプロセッサ、及び/又は1つ以上のデジタル信号プロセッサを含む。いくつかの実施例において、メモリ(単数又は複数)806は、後述する技法を実行するためにプロセッサ(単数又は複数)802によって実行されるように構成されたコンピュータ可読命令を記憶する1つ以上の非一時的コンピュータ可読記憶媒体(例えば、フラッシュメモリ、ランダムアクセスメモリ)である。
【0034】
システム800は、RF回路(単数又は複数)804を含む。RF回路(単数又は複数)804は、任意選択的に、電子デバイス、インターネット、イントラネット並びに/又は、セルラーネットワーク及び無線ローカルエリアネットワーク(LAN)などの無線ネットワークなどのネットワークと通信するための回路を含む。RF回路(単数又は複数)804は、任意選択的に、Bluetooth(登録商標)などの近距離通信及び/又は短距離通信を使用して通信するための回路を含む。
【0035】
システム800は、ディスプレイ(単数又は複数)820を含む。いくつかの実施例において、ディスプレイ(単数又は複数)820は、第1のディスプレイ(例えば、左目ディスプレイパネル)と第2のディスプレイ(例えば、右目ディスプレイパネル)とを含み、各ディスプレイがユーザの個別の目に画像を表示する。対応する画像は、第1のディスプレイ及び第2のディスプレイ上に同時に表示される。任意選択として、対応する画像は、異なる視点から見た、同一の仮想オブジェクト及び/又は同一の物理的オブジェクトの表現を含み、結果として、ディスプレイ上で、オブジェクトの深さの錯覚をユーザに提供する視差効果をもたらす。いくつかの実施例において、ディスプレイ(単数又は複数)820は、単一のディスプレイを含む。対応する画像は、ユーザのそれぞれの目のために、単一のディスプレイの第1の領域及び第2の領域上に同時に表示される。任意選択として、対応する画像は、異なる視点から見た、同一の仮想オブジェクト及び/又は同一の物理的オブジェクトの表現を含み、結果として、単一のディスプレイ上で、オブジェクトの深さの錯覚をユーザに提供する視差効果をもたらす。
【0036】
いくつかの実施例において、システム800は、タップ入力やスワイプ入力などのユーザ入力を受け取るタッチ感知面(単数又は複数)822を含む。いくつかの実施例において、ディスプレイ(単数又は複数)820とタッチ感知面(単数又は複数)822は、タッチ感知ディスプレイ(単数又は複数)を形成する。
【0037】
システム800は、画像センサ(単数又は複数)808を含む。画像センサ(単数又は複数)808は、任意選択的に、電荷結合素子(CCD)センサなどの1つ以上の可視光画像センサ、及び/又は現実環境から物理的オブジェクトの画像を得る働きをする相補型金属酸化膜半導体(CMOS)センサを含む。画像センサ(単数又は複数)はまた、任意選択として、現実環境からの赤外光を検出するための、パッシブIRセンサ又はアクティブIRセンサなどの1つ以上の赤外線(infrared、IR)センサ(単数又は複数)を含む。例えば、アクティブIRセンサは、赤外光を現実環境に放射するためのIRドットエミッタなどのIRエミッタを含む。画像センサ(単数又は複数)808はまた、任意選択的に、現実環境における物理的オブジェクトの動きをキャプチャするように構成された1つ以上のイベントカメラを含む。画像センサ(単数又は複数)808はまた、任意選択的に、システム800からの物理的オブジェクトの距離を検出するように構成された1つ以上のデプスセンサを含む。いくつかの実施例において、システム800は、CCDセンサ、イベントカメラ、及びデプスセンサを組み合わせて使用して、システム800の周囲の物理的環境を検出する。いくつかの実施例において、画像センサ(単数又は複数)808は、第1の画像センサと第2の画像センサとを含む。第1の画像センサ及び第2の画像センサは、任意選択として、2つの異なる透視視点から、現実環境内の物理的オブジェクトの画像をキャプチャするように構成されている。いくつかの実施例において、システム800は、画像センサ(単数又は複数)808を使用して、ハンドジェスチャなどのユーザ入力を受け取る。いくつかの実施例において、システム800は、画像センサ(単数又は複数)808を使用して、現実環境におけるシステム800及び/又はディスプレイ(単数又は複数)820のポジション及び向きを検出する。例えば、システム800は、画像センサ(単数又は複数)808を使用して、現実環境内の1つ以上の固定されたオブジェクトに対するディスプレイ(単数又は複数)820のポジション及び向きを追跡する。
【0038】
いくつかの実施例において、システム800は、マイクロフォン(単数又は複数)812を含む。システム800は、マイクロフォン(単数又は複数)812を使用して、ユーザ及び/又はユーザの物理的環境からの音を検出する。いくつかの実施形態において、マイクロフォン(単数又は複数)812は、任意選択的に、周囲雑音を特定するために、又は現実環境の空間内の音源の位置を特定するなどのために、協調して動作する(複数のマイクロフォンを含む)マイクロフォンの配列を含む。
【0039】
システム800は、システム800及び/又はディスプレイ(単数又は複数)820の向き及び/又は動きを検出する向きセンサ(単数又は複数)810を含む。例えば、システム800は、向きセンサ(単数又は複数)810を使用して、現実環境内の物理的オブジェクトなどに対するシステム800及び/又はディスプレイ(単数又は複数)820のポジション及び/又は向きの変化を追跡する。向きセンサ(単数又は複数)810は、任意選択的に、1つ以上のジャイロスコープ及び/又は1つ以上の加速度計を含む。
【0040】
図2A図2Eは、様々な実施形態による、CGR環境の中でデジタルアシスタントの表現を配置するプロセス(例えば、方法1000)を示す。このプロセスは、例えば、デジタルアシスタントを実現する1つ以上の電子デバイスを使用して実行される。いくつかの実施例において、プロセスはクライアントサーバシステムを使用して実行され、プロセスのステップは、サーバとクライアントデバイスとで任意の方式で分担される。他の実施例において、プロセスのステップは、サーバと複数のクライアントデバイス(例えば、頭部装着可能システム(例えば、ヘッドセット)及びスマートウォッチ)とで分担される。したがって、プロセスの一部は、本明細書ではクライアントサーバシステムの特定のデバイスによって実行されるものとして説明されているが、プロセスがそのように限定されないことは理解されよう。他の実施例において、プロセスは、クライアントデバイスのみ(例えば、デバイス906)又は複数のクライアントデバイスのみを使用して実行される。このプロセスでは、いくつかのステップが任意選択的に組み合わされ、いくつかのステップの順序が任意選択的に変更され、いくつかのステップが任意選択的に省略される。いくつかの実施例では、追加のステップが例示されているプロセスと組み合わせて実行され得る。
【0041】
いくつかの実施形態において、デバイス906は、図1A図1Bに示されているように実装され、例えば、デバイス800a又は800cである。いくつかの実施形態において、デバイス906は、コンピュータ、モバイルデバイス、スマートホームデバイスなどの1つ以上の他の電子デバイスと、直接的又は間接的に(例えば、ハブデバイス、サーバなどを介して)、(例えば、5G、WiFi、有線接続などを使用して)通信する。例えば、図2A図2Eに示されているように、デバイス906は、スマートウォッチデバイス910、スマートスピーカーデバイス912、テレビ914、及び/又はステレオシステム916に直接的又は間接的に接続され得る。いくつかの実施形態において、図1A図1Bに関して説明されているように、デバイス906は、(例えば、物理的環境の視覚的コンテンツのキャプチャ、視線検出などのための)画像センサ、向きセンサ、マイクロフォン、ロケーションセンサ、タッチ感知面、加速度計などの1つ以上のセンサを有する(及び/又はそれらを有する他のデバイスと直接的若しくは間接的に通信する)。
【0042】
図2A図2Eを参照すると、ユーザ902は、プロセス900の様々なステップにおいてデバイス906を使用してコンピュータ生成現実(CGR)環境904に没入しているように示されている。図2A図2Eの右パネルは、デバイス906の1つ以上のディスプレイに表示される、プロセス900のそれぞれのステップにおけるCGR環境904の対応する現在表示されている部分908(例えば、ユーザ902の現在の視野)をそれぞれ示している。
【0043】
いくつかの実施形態において、CGR環境904は、複合現実(MR)コンテンツ、拡張現実(AR)コンテンツ、仮想現実(VR)コンテンツなどを含み得る。例えば、図2A図2Eに示されているように、CGR環境は、MRコンテンツを含み、物理的オブジェクト及び環境(例えば、物理的デバイス910、912、914、又は916、ユーザ902が位置する部屋の中の家具又は壁など)並びに仮想オブジェクト918A~C(例えば、椅子、額縁、及び花瓶を含む仮想家具アイテム)の両方をユーザが視認することを可能にする。
【0044】
ここで図2Aを参照すると、デバイス906は、(例えば、1つ以上のセンサを使用して)ユーザ入力を検出する。現在表示されている部分908A(例えば、ユーザ入力を提供している間のユーザ902の現在の視野)では、物理的デバイステレビ914及びステレオシステム916が仮想オブジェクト918Bとともに見える。
【0045】
いくつかの実施形態において、ユーザ入力は、トリガフレーズを含む音声入力などの聴覚入力、ユーザが少なくとも閾期間にわたって特定のロケーションに視線を向けるなどの視線入力、ジェスチャ入力、ボタン押下、タップ、コントローラ、タッチスクリーン、又はデバイス入力などを含み得る。例えば、図2Aに示されているように、デバイス906は、ユーザ902が「ヘイ、アシスタント」と発言すること、及び/又はユーザ902が「上げて話す」ジェスチャで手首を上げることを検出する。口頭入力「ヘイ、アシスタント」と「上げて話す」ジェスチャの両方が提供されるが、(例えば、図2Bに関して説明されるように)これらの入力のうちの1つだけでもデジタルアシスタントセッションをトリガするのに十分であり得る。
【0046】
ここで図2Bを参照すると、ユーザ入力がデジタルアシスタントセッションを開始するための1つ以上の基準を満たしているという判断に従って、デジタルアシスタントセッションが開始される。例えば、図2Bに示されているように、デジタルアシスタントセッションを開始するための基準は、既定の音声トリガ(例えば、「ヘイ、アシスタント」)を照合するための基準、及び/又は既定のジェスチャトリガ(例えば、「上げて話す」ジェスチャ)を照合するための基準を含み得るしたがって、(図2Aのように)例示されているようにユーザ902が「上げて話す」ジェスチャで自分の手首を上げ、トリガフレーズ「ヘイ、アシスタント」と発言すると、デジタルアシスタントセッションが開始される。
【0047】
デジタルアシスタントセッションを開始することは、CGR環境904内の第1のロケーション(例えば、第1のポジション)にデジタルアシスタントオブジェクト920を配置することを含む。図2Bに示されているように、デジタルアシスタントオブジェクト920は、物理的なスマートスピーカーデバイス912の近くの第1のロケーションに位置する仮想(例えば、VR)球体である。しかしながら、デジタルアシスタントオブジェクト920の第1のロケーションはユーザ902の右側にあり、ユーザ902は前方を注視しているので、デジタルアシスタントオブジェクト920の第1のポジションは、デジタルアシスタントセッションが開始される時点で現在表示されている部分908Bの外にある(例えば、その中では見えない)。
【0048】
いくつかの実施形態において、デジタルアシスタントオブジェクト920の第1のロケーションは、物理的環境の特徴、CGR環境904の特徴、ユーザ902のロケーション、ポジション、又は姿勢、存在し得る他のユーザのロケーション、ポジション、又は姿勢など、1つ以上の環境要因に基づいて判断され得る。
【0049】
例えば、デジタルアシスタントオブジェクト920の第1のロケーションは、物理的なスマートスピーカーデバイス912のロケーションの近くになるように、且つ物理的オブジェクト(物理的なスマートスピーカーデバイス912が置かれているテーブルなど)及び/又は仮想オブジェクト918A~C(仮想オブジェクト918Cなど)との衝突(例えば、視覚的な交差)を回避するように、選択され得る。スマートスピーカーデバイス912のロケーションは、事前に特定されたロケーションに基づいて(例えば、スマートスピーカーデバイス912のユーザがデバイスロケーションを手動で特定し、タグ付け)、画像センサデータの視覚的解析に基づいて(例えば、スマートスピーカーデバイス912を認識するために、画像センサ(単数又は複数)808からのデータなどの画像センサデータを解析)、他のセンサデータの解析などに基づいて(例えば、概ね近傍の場合にBluetooth接続を使用)、判断され得る。
【0050】
いくつかの実施形態において、デバイス906は、デジタルアシスタントセッションの状態を示す出力を提供し得る。状態出力は、2つ以上の異なる状態から選択された状態を表す2つ以上の異なる出力から選択され得る。例えば、2つ以上の状態は、アクティブ及びパッシブリスニング状態に更に細分され得るリスニング状態、応答状態、思考(例えば、処理)状態、注意獲得状態などを含み得、これらは視覚、聴覚、及び/又は触覚出力によって示され得る。
【0051】
例えば、図2Bに示されているように、デジタルアシスタントオブジェクト920(例えば、仮想球体)の外観は、球体の中央に雲の形状を含み、デジタルアシスタントオブジェクト920が注意獲得状態にあることを示している。他の状態出力は、デジタルアシスタントオブジェクト920のサイズの変更、動きの動画化(例えば、デジタルアシスタントオブジェクト920のホッピング、ホバリングなどを動画化)、聴覚出力(例えば、デジタルアシスタントオブジェクト920の現在のロケーションから「発する」指向性音声出力)、照明効果の変化(例えば、デジタルアシスタントオブジェクト920によって発せられる照明若しくは光の変更、又はデジタルアシスタントオブジェクト920の方向のディスプレイの端に「ピン留めされた」ピクセル若しくは光源の変更)、触覚出力などを含み得る。
【0052】
デジタルアシスタントセッションを開始することは、CGR環境904内のデジタルアシスタントオブジェクト920の第1のロケーションを示す出力を生成させることを含む。いくつかの実施形態において、出力は、空間音を使用してロケーションを指示する聴覚出力などの聴覚出力、触覚出力、又は視覚的指示を含み得る。例えば、図2Bに示されているように、出力は、スマートスピーカーデバイス912とステレオシステム916から出力される口頭聴覚出力「ええ?」を含む。口頭聴覚出力「ええ?」は、空間音技術を使用して提供され得、スマートスピーカーデバイス912から来るオーディオ信号の成分を、ステレオシステム916から来るオーディオ信号の成分より大音量で生成することで、出力があたかもデジタルアシスタントオブジェクト920の第1のロケーションから(例えば、図2Bに示されているようにユーザの右手側から)来ているかのように聞こえるようにする。
【0053】
別の実施例として、図2Bに示されているように、出力は、第1のロケーションがユーザの右にあることを示す、スマートウォッチデバイス910からのユーザ902の右手首におけるスキンタップ触覚出力を更に含む。
【0054】
更なる実施例として、出力は、第1のロケーションの視覚的指示(すなわち、現在視野外にあるデジタルアシスタントオブジェクトの表示以外の視覚的指示)を含み得る。視覚出力は、第1のロケーションから放たれる光を示すCGR環境の照明の変化など、デバイス906のディスプレイを使用して提供され得る(例えば、現在表示されている部分908Bで見える3D空間における光及び影をレンダリングすること、第1のロケーションの方向で現在表示されている部分908Bの端に照らされたピクセル又は光源を「ピン留め」すること、及び/又はヘッドアップディスプレイ若しくは2D照明オーバーレイを表示すること)。視覚出力はまた、第1のロケーションの方向に照らされるエッジ照明(例えば、LEDなど)などの非表示ハードウェアを使用して提供され得る。照明又は光は、第1のロケーションに更に注意を引くために光度が変化し得る。
【0055】
ここで図2Cを参照すると、いくつかの実施形態において、デジタルアシスタントセッションを開始した後に、第1のロケーションが現在表示されている部分908Cの中にあるという判断に従って(例えば、第1のロケーションがユーザ902の現在の視野内に入るようにユーザ902が配置されると)、デジタルアシスタントオブジェクト920が(例えば、デバイス906のディスプレイに)表示される。
【0056】
デジタルアシスタントセッションが進むにつれて、デバイス906は、デジタルアシスタントセッションの更新された状態を示す更新された出力を提供できる。例えば、図2Cに示されているように、デジタルアシスタントセッションがアクティブリスニング状態に入ると、デジタルアシスタントオブジェクト920は、球体の中央に渦巻きの形状を含み、デジタルアシスタントオブジェクト920がアクティブリスニング状態にあることを示す。
【0057】
いくつかの実施形態において、デバイス906は、(例えば、1つ以上のセンサを使用して)第2のユーザ入力を検出する。次いで、デバイス906は、例えば自然言語処理法を用いて、第2のユーザ入力の意図を判断する。例えば、図2Cに示されているように、デバイス906は、オーディオを再生する意図に相当する要求「ステレオで何か音楽を再生してください」をユーザ902が発話していることを検出する。
【0058】
いくつかの実施形態において、デバイス906は、第1のロケーションが現在表示されている部分908C(例えば、ユーザ902が第2のユーザ入力を提供した時点におけるユーザ902の現在の視野)の中にあるという判断に従って、意図を判断する。すなわち、いくつかの実施形態において、デジタルアシスタントは専ら、ユーザ902がデジタルアシスタントオブジェクト920に注意を向け(例えば、デジタルアシスタントオブジェクト920を見て)、デジタルアシスタントオブジェクト920に対応するつもりであるという判断に従って応答する。
【0059】
ここで図2Dを参照すると、いくつかの実施形態において、デバイス906は、第2のユーザ入力の意図を判断した後に、判断された意図に基づいて応答出力を提供する。例えば、図2Dに示されているように、デバイス906は、ユーザ入力「ステレオで何か音楽を再生してください」に応じて、オーディオを再生するという判断された意図に基づいて、ステレオシステム906から音楽が再生されるようにする。
【0060】
いくつかの実施形態において、判断された意図がCGR環境904内のオブジェクトロケーションに位置するオブジェクト(例えば、物理的オブジェクト又は仮想オブジェクトのいずれか)に関連するという判断に従って、応答出力を提供することは、オブジェクトロケーションの近くにデジタルアシスタントオブジェクト920を配置することを含む。例えば、図2Dに示されているように、ステレオシステム916から音楽を再生させることに加えて、デバイス906は、デジタルアシスタントオブジェクト920をステレオシステム906のロケーションの近くに再配置させ、デジタルアシスタントがタスクを遂行していることを示す。加えて、図2Dに示されているように、デジタルアシスタントオブジェクト920の外観は、図示のように球体の中央に星形状を含めるなど、デジタルアシスタントオブジェクト920が応答状態にあることを示すように更新されてよく、又は(例えば、図2Bに関して上述されているような)他の何らかの適切な状態出力が提供されてもよい。
【0061】
ここで図2Eを参照すると、いくつかの実施形態において、デジタルアシスタントセッションは、例えば、ユーザ902が明示的に(例えば、音声入力、視線入力、ジェスチャ入力、ボタン押下、タップ、コントローラ、タッチスクリーン、又はデバイス入力などを使用して)デジタルアシスタントを退去させる場合に、又は自動的に(例えば、相互作用なしに所定の閾期間の後に)、終了し得る。デジタルアシスタントセッションが終了すると、デバイス906は、デジタルアシスタントオブジェクト920を退去させる。図2Eに示されているように、デジタルアシスタントオブジェクト920の現在のロケーションが現在表示されている部分908E(例えば、デジタルアシスタントセッションが終了する時点でのユーザ902の現在の視野)の中にある場合、デジタルアシスタントオブジェクト920を退去させることは、デジタルアシスタントオブジェクト920の表示を中止することを含む。
【0062】
いくつかの実施形態において、デジタルアシスタントを退去させることは、退去を示す更なる出力を提供することをも含み得る。退去出力は、聴覚出力(例えば、チャイム、口頭出力など)又は視覚出力(例えば、表示されたオブジェクト、CGR環境904の照明の変更など)などの指示を含み得る。例えば、図2Eに示されているように、退去出力は、第1のロケーション(例えば、デジタルアシスタントオブジェクト920の初期ロケーション)に配置されたデジタルアシスタントインジケータ922を含み、これにより、別のデジタルアシスタントセッションが開始された場合にデジタルアシスタントオブジェクト920が再び出現する場所を示す。第1のロケーションは現在表示されている部分908E(例えば、デジタルアシスタントセッションが終了する時点でのユーザ902の現在の視野)の中にあるので、デバイス906は、デジタルアシスタントインジケータ922を表示する。
【0063】
図2A図2Eを参照して上述されているプロセスは、任意選択的に、図1A図1Bに示されている構成要素によって実施される。例えば、例示されているプロセスの作業は、電子デバイス(例えば、800a、800b、800c、又は906)によって実施され得る。図1A図1Bに示されている構成要素に基づいて他のプロセスがどのように実施されるかは、当業者には明らかであろう。
【0064】
図3A図3Bは、いくつかの実施形態による、コンピュータ生成現実(CGR)環境の中でデジタルアシスタントの表現を配置する方法1000の流れ図を示す。方法1000は、1つ以上のプロセッサとメモリとを有する1つ以上の電子デバイス(例えば、デバイス800a、80b、800c、906)を使用して実行され得る。いくつかの実施形態において、方法1000は、クライアントサーバシステムを使用して実行され、方法1000の作業は、クライアントデバイス(例えば、800c、906)とサーバとで任意の方式で分担される。方法1000のいくつかの作業は、任意選択的に組み合わされ、いくつかの作業の順序は、任意選択的に変更され、いくつかの作業は、任意選択的に省略される。
【0065】
方法1000は、CGR環境の少なくとも一部分を表示している間に実行される。すなわち、ある特定の時間に、表示されているCGR環境の特定の部分は、ユーザ(例えば、クライアントデバイス(単数又は複数)のユーザ)の現在の視野を表し、CGR環境のその他の部分(例えば、ユーザの背後又はユーザの周辺視野の外)は表示されない。したがって、方法1000は、例えば、仮想オブジェクトを配置し、且つ「視覚」出力を生成することに言及するが、仮想オブジェクト及び出力のユーザにとっての実際の可視性は、CGR環境の現在表示されている特定の部分に応じて異なり得る。「第1の時間」、「第2の時間」、「第1の部分」、「第2の部分」などの用語は、表示される仮想コンテンツを表示されない仮想コンテンツから区別するために使用され、CGR環境の一定の順序又は既定の部分を示すことを意図していない。
【0066】
いくつかの実施形態において、方法1000のCGR環境は、仮想及び/又は物理的コンテンツ(例えば、物理的デバイス910、912、914、又は916、ユーザ902が位置する部屋の中の家具又は壁、及び図2A~2Eに示されている仮想オブジェクト918A~C)を含み得る。CGR環境の内容は、静的であり得、又は動的であり得る。例えば、CGR環境内の静的な物理的オブジェクトは、物理的な家具、壁、及び天井などを含み得るが、CGR環境内の静的な仮想オブジェクトは、CGR環境内の一定のロケーションに位置する仮想オブジェクト(例えば、仮想オブジェクト918A~Cなどの仮想家具)、又はディスプレイに対して一定のロケーションに位置する仮想オブジェクト(例えば、CGR環境の表示された部分にオーバーレイされるヘッドアップディスプレイ)を含み得る。CGR環境内の動的な物理的オブジェクトは、ユーザ、他のユーザ、ペットなどを含み得、CGR環境内の動的な仮想アイテムは、動くオブジェクト(例えば、仮想キャラクタ、アバター、又はペット)、或いはサイズ、形状、又は形態が変化するオブジェクトを含む。
【0067】
ここで図3Aを参照すると、ブロック1002では、方法1000を実施するデバイス(単数又は複数)の1つ以上のセンサによって第1のユーザ入力が検出される。例えば、1つ以上のセンサは、オーディオセンサ(例えば、マイクロフォン)、振動センサ、運動センサ(例えば、加速度計、カメラなど)、ビジュアルセンサ(例えば、光センサ、カメラなど)、タッチセンサなどを含み得る。
【0068】
いくつかの実施形態において、第1のユーザ入力は、聴覚入力を含む。例えば、第1のユーザ入力は、トリガフレーズ(例えば、「ヘイ、アシスタント」)を含む音声入力を含み得る。いくつかの実施形態において、第1のユーザ入力は、視線入力を含む。例えば、ユーザは、少なくとも閾期間にわたって特定のロケーション(例えば、既定のデジタルアシスタントロケーション、スマートスピーカー又はデバイスのロケーション)、デジタルアシスタントが支援できるオブジェクトのロケーションなど)に視線を向けることができる。いくつかの実施形態において、第1のユーザ入力は、ジェスチャ(例えば、ユーザの身体の動き)入力を含む。例えば、ユーザは、「上げて話す」ジェスチャで手首を上げることができる。いくつかの実施形態において、第1のユーザは、ボタン押下、タップ、コントローラ、タッチスクリーン、又はデバイス入力を入力する。例えば、ユーザは、スマートウォッチデバイス910のタッチスクリーンを押し続けることができる。
【0069】
ブロック1004では、第1のユーザ入力がデジタルアシスタントセッションを開始するための基準を満たしているという判断に従って、デジタルアシスタントセッションが開始される。
【0070】
例えば、第1のユーザ入力が聴覚入力を含む場合、基準は、十分な信頼度を有する既定の音声トリガ(例えば、「ヘイ、アシスタント」など)を照合することを含み得る。別の実施例として、第1のユーザ入力が視線入力を含む場合、基準は、ユーザが少なくとも閾期間にわたって特定のロケーション(例えば、既定のデジタルアシスタントロケーション、デジタルアシスタントが相互作用することができるオブジェクトのロケーションなど)に視線を向けることを含み得る。別の実施例として、第1のユーザ入力がジェスチャ(例えば、ユーザの身体の動き)入力を含む場合、基準は、十分な信頼度を有する既定のジェスチャトリガ(例えば、「手首を上げて話す」動きなど)を照合することを含み得る。ユーザがデジタルアシスタントセッションを呼び出したか否かを判断するために、1つ以上の可能なトリガ入力が、まとめて、又は単独で、考慮され得る。
【0071】
ブロック1004でデジタルアシスタントセッションを開始することは、第1の時間にCGR環境の中であってCGR環境の第1の(例えば、現在表示されている)部分の外にある第1の(例えば、初期)ロケーションにデジタルアシスタントオブジェクトを配置することを含む。すなわち、ブロック1004を実施する電子デバイスは、デジタルアシスタントセッションが開始されるときにデジタルアシスタントオブジェクトがユーザに見えない(例えば、表示されない、又は「画面外」となる)ように、デジタルアシスタントオブジェクトをCGR環境内に配置する。
【0072】
いくつかの実施形態において、CGR環境内の第1の(例えば、初期)ロケーションは、CGR環境内の所定のロケーションである。例えば、所定のロケーションは、CGR環境の座標系内の既定の座標セットであってよい。所定のロケーションは、(例えば、第2のデジタルアシスタントセッションに関して以下で説明するように)以前のデジタルアシスタントセッションでユーザによって決定(例えば、選択)されたものであってもよい。
【0073】
いくつかの実施形態において、ブロック1006では、ユーザが作業している物理的環境、ユーザのポジション、又は複数のユーザのポジションなど、1つ以上の環境要因に基づいて、CGR環境内の第1の(例えば、初期)ロケーションが判断される。
【0074】
1つ以上の環境要因は、CGR環境の特性を含み得る。例えば、第1のロケーションは、電子デバイス(例えば、図2A図2Eのスマートスピーカーデバイス912)の物理的ロケーション、別の物理的オブジェクト(例えば、家具又は部屋に駆け込むペット)の静的又は動的ロケーション、仮想オブジェクト(例えば、図2A図2Eの仮想オブジェクト918A~C)の静的又は動的ロケーションなどに基づいて判断され得る。電子デバイスのロケーションは、事前に特定されたロケーションに基づいて(例えば、ユーザが手動でデバイスロケーションを特定し、タグ付け)、画像センサデータの視覚的解析に基づいて(例えば、デバイスを認識又は視覚的に理解するために画像センサデータを解析)、他のセンサ又は接続データの解析などに基づいて(例えば、概ね近傍の場合にBluetooth接続を使用)、判断され得る。
【0075】
1つ以上の環境要因はまた、ユーザのポジション(例えば、ロケーション及び/又は姿勢)を含み得る。例えば、第1のロケーションは、ユーザの身体又は頭の向き、又はユーザの視線のポジションに基づいて、ユーザの後ろのロケーションであると判断され得る。別の実施例として、第1のロケーションは、ユーザの手首に球体を配置するなど、ユーザの身体上又はその付近のロケーションであると判断され得る。
【0076】
1つ以上の環境要因はまた、CGR環境の複数のユーザの複数のポジション(例えば、ロケーション及び/又は姿勢)を含み得る。例えば、仮想会議室やマルチプレーヤゲームなどの共有CGR環境では、第1のロケーションは、各ユーザがどこを向いているか及び/又はどこを注視しているかに基づいて、共有ユーザの大多数にとってデジタルアシスタントオブジェクトの可視性を最小化(又は最大化)するロケーションとなるように判断され得る。
【0077】
デジタルアシスタントオブジェクトは、デジタルアシスタント(例えば、デジタルアシスタントセッションのアバター)を表す仮想オブジェクトである。例えば、デジタルアシスタントオブジェクトは、仮想の球体、仮想のキャラクタ、仮想の光の玉、アバターなどであってよい。デジタルアシスタントオブジェクトは、デジタルアシスタントセッションを通じて外観及び/又は形態を変えることができ、例えば、外観を、球体から仮想の光の玉に、半透明の球体から不透明の球体に、及び/又は同様に、変えることができる。
【0078】
ブロック1008では、CGR環境内のデジタルアシスタントオブジェクトの第1のロケーションを示す第1の出力が提供される。すなわち、第1の(例えば、初期)ロケーションはCGR環境の第1の(例えば、現在表示されている)部分の外にあるが、第1のロケーションを示す第1の出力は、ユーザがCGR環境の中でデジタルアシスタントオブジェクトの位置を特定する(例えば、デジタルアシスタントオブジェクトを見つける)のを助け、例えば、ユーザの注意をデジタルアシスタントセッションに迅速且つ直感的に引き付けることによって、デジタルアシスタントセッションの効率と有効性を高める。
【0079】
いくつかの実施形態において、第1のロケーションを示す第1の出力を提供することは、第1の聴覚出力を生成させることを含む。すなわち、方法1000を実施するデバイスは、(例えば、内蔵スピーカー又はヘッドセットを使用して)第1の聴覚出力そのものを生成し得、及び/又は1つ以上の他の好適な聴覚デバイスに第1の聴覚出力を生成させ得る。例えば、第1の聴覚出力は、口頭出力(例えば、「ええ?」、「はい?」、「お手伝いしましょうか?」など)、別の聴覚出力(例えば、チャイム、ハム音など)、及び/又は聴覚/触覚混合出力(例えば、ユーザが感じることもできる振動から生じるハム音)を含み得る。
【0080】
いくつかの実施形態において、複数のスピーカー(例えば、スピーカーアレイ又はサラウンドサウンドシステム)を使用して、複数のオーディオ成分(例えば、チャネル)を異なる音量で放ち、全体的な聴覚出力が具体的に特定のロケーションから放たれているように思わせるなど、第1の聴覚出力は空間音技術を使用して提供され得る。例えば、第1の聴覚出力は、複数のスピーカーのうちの第1のスピーカーによって生成される第1のオーディオ成分(例えば、チャネル)と、複数のスピーカーのうちの第2のスピーカーによって生成される第2のオーディオ成分とを含み得る。デジタルアシスタントオブジェクトの第1のロケーションが第1のスピーカーのロケーションに近いか、それとも第2のスピーカーのロケーションに近いかの判断が行われる。第1のロケーションが第1のスピーカーのロケーションにより近いという判断に従って、第1のオーディオ成分が第2のオーディオ成分より大音量で生成される。同様に、第1のロケーションが第2のスピーカーのロケーションにより近いという判断に従って、第2のオーディオ成分が第1のオーディオ成分より大音量で生成される。
【0081】
いくつかの実施形態において、第1のロケーションを示す第1の出力を提供することは、第1の触覚出力を生成させることを含む。すなわち、方法1000を実施するデバイス(単数又は複数)は、第1の触覚出力そのものを生成し得、及び/又は1つ以上の他の好適な触覚デバイスに第1の触覚出力を生成させ得る。触覚出力は、方法1000を実施するデバイス(単数又は複数)のユーザによって感じられる振動、タップ、及び/又は他の触知可能な出力を含む。例えば、図2Bに示されているように、デバイス910は、ユーザ902の右手首に振動触覚出力を生成させられ、デジタルアシスタントオブジェクト920がユーザ902の右側にあることを示す。
【0082】
いくつかの実施形態において、第1のロケーションを示す第1の出力を提供することは、第1のロケーションの視覚的指示を表示することを含む。例えば、視覚的指示は、第1のロケーションから仮想光を放つこと、物理的環境照明のパススルーフィルタリングを変えること、及び/又は適切なホームオートメーションデバイスを使用して物理的環境の照明を変えてCGR環境を指向的に照らすことを含み得る。別の実施例として、視覚的指示は、デジタルアシスタントオブジェクト以外のインジケータを表示してユーザを第1のロケーションに誘導することを含み得る。
【0083】
いくつかの実施形態において、ブロック1010では、第1のロケーションがCGR環境の第2の部分(例えば、第2の時間に現在表示されている部分)の中にあるという判断に従って、第1のロケーションに(例えば、方法1000を実施するデバイスの1つ以上のディスプレイ上に)デジタルアシスタントオブジェクトが表示される。すなわち、デジタルアシスタントオブジェクトが画面外(例えば、開始時にユーザの視野外)に配置された状態で第1のデジタルアシスタントセッションを開始した後に、ユーザが(例えば、別の方向を見ることによって、又は別の入力を提供することによって)視点を変えてデジタルアシスタントオブジェクトのロケーション又はその近くを見ると、デジタルアシスタントオブジェクトがユーザに見えるようになる。
【0084】
いくつかの実施形態において、ブロック1012では、(例えば、第1のデジタルアシスタントセッション開始後の第3の時間に)第2のユーザ入力が検出される。例えば、第2のユーザ入力は、口頭によるコマンド、質問、要求、ショートカットなどの口頭入力を含み得る。別の実施例として、第2のユーザ入力はまた、身ぶりによるコマンド、質問、要求などのジェスチャ入力、CGR環境との相互作用を表すジェスチャ(例えば、仮想オブジェクトを「掴む」及び「落とす」)などを含み得る。別の実施例として、第2のユーザ入力は、視線入力を含み得る。
【0085】
いくつかの実施形態において、ブロック1014では、第2のユーザ入力の意図が判断される。意図は、1つ以上のパラメータを使用して実行され得る1つ以上のタスクに対応し得る。例えば、第2のユーザ入力が口頭又は身ぶりによるコマンド、質問、又は要求を含む場合は、図2Cに示されている口頭ユーザ入力「ステレオで何か音楽を再生してください」からオーディオを再生する意図を判断するなど、自然言語処理技術を用いて意図が判断され得る。別の実施例として、第2のユーザ入力がジェスチャを含む場合は、ジェスチャのタイプ(単数又は複数)、ジェスチャのロケーション(単数又は複数)、及び/又はCGR環境内の様々なオブジェクトのロケーションに基づいて、意図が判断され得る。例えば、掴んで落とすタイプのジェスチャは、「掴む」ジェスチャのロケーション又はその近くに配置された仮想オブジェクトを「落とす」ジェスチャのロケーションに移動させる意図に対応し得る。
【0086】
いくつかの実施形態において、第2のユーザ入力の意図の判断は専ら、デジタルアシスタントオブジェクトの現在のロケーションがCGR環境の現在表示されている部分の中にあるという判断に従って行われる。すなわち、ユーザが物理的な部屋の中の別の人又はマルチプレーヤゲームの中の別のプレーヤと話すなど、検出されるユーザ入力にはデジタルアシスタントセッションを対象としないものもある。ユーザがデジタルアシスタントオブジェクトを見ている(又はその近くにいる)間に受け取られたユーザ入力のみを処理し、且つそれのみに応答することで、例えば、意図されていない相互作用が生じる見込みが低下し、デジタルアシスタントセッションの効率が向上する。
【0087】
いくつかの実施形態において、ブロック1016では、判断された意図に基づいて第2の出力が提供される。第2の出力を提供することは、判断された意図に対応する1つ以上のタスクを実行させることを含み得る。例えば、図2A~2Eに示されているように、口頭ユーザ入力「ステレオで何か音楽を再生してください」に対して、第2の出力は、ステレオシステム916に何らかの音楽を再生させることを含む。別の実施例として、身ぶりによる入力「今日の天気は?」に対して、第2の出力は、雷雨のアイコンと温度を示すウィジェットを表示することを含み得る。
【0088】
いくつかの実施形態において、判断された意図に基づいて第2の出力を提供することは、判断された意図がデジタルアシスタントオブジェクトを再配置することに関連するか否かを判断することを含む。例えば、第2のユーザ入力は、口頭入力「テレビのそばを通ってください」や掴んで落とすジェスチャ入力など、デジタルアシスタントを再配置する明示的な要求を含み得る。別の実施例として、第2のユーザ入力は、デジタルアシスタントオブジェクトの移動を開始するために、「摘まむ」又は「掴む」と組み合わされた、デジタルアシスタントオブジェクトの現在のロケーションを起点とする視線入力を含み得る。
【0089】
判断された意図がデジタルアシスタントオブジェクトを再配置することに関連するという判断に従って、第2のユーザ入力から第2のロケーションが判断される。例えば、口頭入力「テレビのそばを通ってください」から第2のロケーション「テレビのそば」が判断され得、掴んで落とすジェスチャ入力から「落とす」ジェスチャに位置する若しくはその近くに位置する第2のロケーションが判断され得、又は視線入力からユーザの視線のロケーションに位置する若しくはその近くに位置する第2のロケーションが判断され得る。
【0090】
更に、判断された意図がデジタルアシスタントオブジェクトを再配置することに関連するという判断に従って、デジタルアシスタントオブジェクトは第2のロケーションに配置される。(例えば、第4の時間に)CGR環境の現在表示されている(例えば、第2の)部分の中に第2のロケーションがあるという判断に従って、デジタルアシスタントオブジェクトはCGR環境内の第2のロケーションに表示される。すなわち、デジタルアシスタントオブジェクトを、第2のユーザ入力が検出されたときのそのロケーションから第2のユーザ入力から判断された第2のロケーションに再配置する間に、デジタルアシスタントオブジェクトは、そのロケーションがユーザの現在の視野内に留まる限りは、表示される(例えば、あるロケーションから別のロケーションへのデジタルアシスタントオブジェクトの移動を動画化することを含む)。
【0091】
いくつかの実施形態において、判断された意図に基づいて第2の出力を提供することは、判断された意図が、CGR環境内のオブジェクトロケーションに位置するオブジェクト(例えば、物理的又は仮想オブジェクト)に関連するか否かを判断することを含む。判断された意図がCGR環境内のオブジェクトロケーションに位置するオブジェクトに関連するという判断に従って、デジタルアシスタントはオブジェクトロケーションに近い第3のロケーションに配置される。すなわち、デジタルアシスタントオブジェクトが関連するオブジェクトの近くに移動して、そのオブジェクトとの相互作用を示し、及び/又はそのオブジェクト若しくは相互作用に注意を引く。例えば、図2A~2Eに示されているように、口頭ユーザ入力「ステレオで何か音楽を再生してください」に対し、あたかもデジタルアシスタントオブジェクト920自体がステレオシステム916をオンにして、ステレオが関与する要求されたタスクが実行されていることをユーザに示しているかのように、デジタルアシスタントオブジェクト920がステレオシステム916の近くに移動する。
【0092】
いくつかの実施形態において、ブロック1018では、第2の出力の1つ以上の特性に基づいて、第3の出力が提供される。第2の出力の1つ以上の特性は、第2の出力のタイプ(例えば、視覚、聴覚、又は触覚)、(例えば、CGR環境内で実行されるタスクのための)CGR環境内の第2の出力のロケーションなどを含み得る。例えば、図2A図2Eに示されているように、口頭ユーザ入力「ステレオで何か音楽を再生してください」に対して、第3の出力は、口頭出力「OK、音楽を再生しています」を含む。別の実施例として、身ぶりによる入力「今日の天気は?」に対して、第3の出力は、表示された天気ウィジェット(例えば、第2の出力)の近くで跳ねる又は小刻みに揺れるデジタルアシスタントオブジェクトを動画化することを含み得る。説明されているように第3の出力を提供することによって、例えば、要求されたタスクの実行及び/又は完了がユーザに直ちに明らかではない場合には、その実行及び/又は完了にユーザの注意を引き付けることによって、デジタルアシスタントセッションの効率が向上する。
【0093】
いくつかの実施形態において、ブロック1020では、2つ以上の異なる出力から選択された第5の出力が提供されて、2つ以上の異なる状態から選択された第1のデジタルアシスタントセッションの状態を示す。第1のデジタルアシスタントセッションの2つ以上の異なる状態は、1つ以上のリスニング状態(例えば、アクティブ又はパッシブリスニング)、1つ以上の応答状態、1つ以上の処理(例えば、思考)状態、1つ以上の失敗状態、1つ以上の注意獲得状態、及び/又は1つ以上の遷移(例えば、移動、出現、又は消失)状態を含み得る。異なる出力と異なる状態との間には一対一の対応関係が存在し得、1つ以上の状態が同じ出力によって表され得、又は1つ以上の出力が同じ状態(又は同じ状態のバリエーション)を表し得る。
【0094】
例えば、図2A図2Eに示されているように、デジタルアシスタントオブジェクト920は、最初にユーザの注意を引き(例えば、初期ロケーションを示す)、ユーザ入力を聞き、ユーザ入力に応答する/ユーザの注意を応答に引き付ける間に、異なる外観を呈する。他の第5の(例えば、状態)出力は、デジタルアシスタントオブジェクトのサイズの変更、動きの動画化、聴覚出力(例えば、デジタルアシスタントオブジェクトの現在のロケーションから「発する」指向性音声出力)、照明効果の変化、他の視覚出力、触覚出力などを含み得る。
【0095】
第1のデジタルアシスタントセッション中の任意の時点で、(例えば、ユーザが視点を変えるのに応じて)CGR環境の現在表示されている部分が更新され、デジタルアシスタントオブジェクトの現在のロケーションが現在表示されている部分にもはや含まれなくなった(例えば、ユーザにもはや見えなくなった)場合は、デジタルアシスタントの現在のロケーションを示す追加の出力が提供され得る。例えば、現在のポジションを示す追加の出力は、ブロック1008に関して説明されているように提供され得る(例えば、空間聴覚出力、視覚出力、触覚出力など)。
【0096】
いくつかの実施形態において、第1のデジタルアシスタントセッションは、例えば、ユーザによる明示的な退去の際に、又は相互作用なしに閾期間が経過した後に、終了する。第1のデジタルアシスタントセッションが終了すると、ブロック1022でデジタルアシスタントオブジェクトが退去させられる(例えば、CGR環境から除去される)。デジタルアシスタントセッションが終了する時点でデジタルアシスタントオブジェクトがCGR環境の表示されている部分の中に位置する場合、デジタルアシスタントオブジェクトを退去させることは、デジタルアシスタントオブジェクトの表示を中止することを含む。
【0097】
いくつかの実施形態において、デジタルアシスタントオブジェクトを退去させるときには、デジタルアシスタントオブジェクトの退去を示す第4の出力が提供される。第4の出力は、1つ以上の視覚出力(例えば、かすかな光、CGR環境内の照明をデジタルアシスタントセッション前の状態に戻すことなど)、1つ以上の聴覚出力(例えば、「バイ」などの口頭出力、チャイムなど)、1つ以上の触覚出力などを含み得る。例えば、図2Eに示されているように、第4の出力を提供することは、第1のロケーションにデジタルアシスタントインジケータ922を配置することを含み得る。第4の出力は、第1のデジタルアシスタントセッションが終了したことをユーザに示すことができ、ユーザが後続の呼び出しにおいてより速やかにデジタルアシスタントオブジェクトの位置を特定する(例えば、デジタルアシスタントオブジェクトを見つける)のに役立つことができる。
【0098】
いくつかの実施形態において、デジタルアシスタントオブジェクトを退去させた後には、第3のユーザ入力が検出される。第3のユーザ入力は、第1のユーザ入力(例えば、第1のデジタルアシスタントセッションを呼び出すユーザ入力)に関して説明されているように、聴覚入力、視線入力、ジェスチャ入力、又はデバイス入力(例えば、ボタン押下、タップ、スワイプなど)であり得る。(例えば、ブロック1004に関して上述されているように)第3のユーザ入力がデジタルアシスタントセッションを開始するための少なくとも1つの基準を満たしているという判断に従って、第2のデジタルアシスタントセッションが開始される。
【0099】
(例えば、ブロック1016に関して上述されているように)デジタルアシスタントオブジェクトを再配置することに関連する第2のユーザ入力が第1のデジタルアシスタントセッション中に受け取られたいくつかの実施形態において、第2のデジタルアシスタントセッションを開始することは、デジタルアシスタントオブジェクトを第2のロケーション(例えば、第2のユーザ入力で要求されたロケーション)に配置することを含む。すなわち、いくつかの実施形態において、ユーザがデジタルアシスタントオブジェクトを明示的に移動させた後には、ユーザによって選択されたロケーションが、後続の呼び出しのときにデジタルアシスタントオブジェクトが出現する新しい「デフォルト」位置になる。
【0100】
図3A図3Bを参照して上述されている方法は、任意選択的に、図1A図1B及び図2A図2Eに示されている構成要素によって実施される。例えば、例示されている方法の作業は、電子デバイス(例えば、800a、800b、800c、又は906)によって実施され得る。図1A図1B及び図2A図2Eに示されている構成要素に基づいて他のプロセスがどのように実施されるかは、当業者には明らかであろう。
【0101】
図4A図4Eは、様々な実施例による、CGR環境の中でデジタルアシスタントの表現を配置するプロセス(例えば、方法1200)を示す。このプロセスは、例えば、デジタルアシスタントを実現する1つ以上の電子デバイスを使用して実行される。いくつかの実施例において、プロセスはクライアントサーバシステムを使用して実行され、プロセスのステップは、サーバとクライアントデバイスとで任意の方式で分担される。他の実施例において、プロセスのステップは、サーバと複数のクライアントデバイス(例えば、頭部装着可能システム(例えば、ヘッドセット)及びスマートウォッチ)とで分担される。したがって、プロセスの一部は、本明細書ではクライアントサーバシステムの特定のデバイスによって実行されるものとして説明されているが、プロセスがそのように限定されないことは理解されよう。他の実施例において、プロセスは、クライアントデバイス(例えば、デバイス1106)のみ、又は複数のクライアントデバイスのみを使用して実行される。このプロセスでは、いくつかのステップが任意選択的に組み合わされ、いくつかのステップの順序が任意選択的に変更され、いくつかのステップが任意選択的に省略される。いくつかの実施例では、追加のステップが例示されているプロセスと組み合わせて実行され得る。
【0102】
図4A図4Eを参照すると、ユーザ1102は、プロセスの様々なステップにおいてデバイス1106を使用してコンピュータ生成現実(CGR)環境1104に没入しているように示されている。図4A~4Eの右パネルは、デバイス1106の1つ以上のディスプレイに表示される、プロセスのそれぞれのステップにおけるCGR環境1104の対応する現在表示されている部分1108(例えば、ユーザ1102の現在の視野)を示している。デバイス1106は、図1A~1Bと図2A~2Eのデバイス906に関して上述されているように実装され得る。
【0103】
いくつかの実施形態において、CGR環境1104は、複合現実(MR)コンテンツ、拡張現実(AR)コンテンツ、仮想現実(VR)コンテンツなどを含み得る。例えば、図4A図4Eに示されているように、CGR環境1104は、MRコンテンツを含み、物理的オブジェクト及び環境(例えば、物理的デバイス1110、1112、1114、又は1116、ユーザ1102が位置する部屋の中の家具又は壁など)並びに仮想オブジェクト1118A~C(例えば、椅子、額縁、及び花瓶を含む仮想家具アイテム)の両方をユーザが視認することを可能にする。
【0104】
ここで図4Aを参照すると、デバイス1106は、(例えば、1つ以上のセンサを使用して)ユーザ入力を検出する。現在表示されている部分1108A(例えば、ユーザ入力を提供している間のユーザ902の現在の視野)では、物理的デバイステレビ1114及びステレオシステム1116が、仮想オブジェクト1118Bとともに見える。
【0105】
いくつかの実施形態において、ユーザ入力は、トリガフレーズを含む音声入力などの聴覚入力、ユーザが少なくとも閾期間にわたって特定のロケーションに視線を向けるなどの視線入力、ジェスチャ入力、ボタン押下、タップ、コントローラ、タッチスクリーン、又はデバイス入力などを含み得る。例えば、図4Aに示されているように、デバイス1106は、ユーザ1102が「ヘイ、アシスタント」と発言していることを検出する。ユーザがデジタルアシスタントセッションを呼び出したか否かを判断するために、1つ以上の可能なトリガ入力が、まとめて、又は単独で、考慮され得る。
【0106】
ここで図4Bを参照すると、ユーザ入力がデジタルアシスタントセッションを開始するための1つ以上の基準を満たしているという判断に従って、第1のデジタルアシスタントセッションが開始される。例えば、図4Bに示されているように、デジタルアシスタントセッションを開始するための基準は、既定の音声トリガ(例えば、「ヘイ、アシスタント」)を照合する基準を含み得る。したがって、(図4Aのように)ユーザ1102が例示されているようにトリガフレーズ「ヘイ、アシスタント」を発言すると、デジタルアシスタントセッションが開始される。
【0107】
第1のデジタルアシスタントセッションを開始することは、CGR環境1104内の第1のロケーション(例えば、第1のポジション)でデジタルアシスタントオブジェクト1120のインスタンスを生成することを含む。図4Bに示されているように、デジタルアシスタントオブジェクト1120は、ユーザ1102の背後の第1のロケーションに位置する仮想(例えば、VR)球体である。したがって、デジタルアシスタントオブジェクト1120の第1のポジションは、デジタルアシスタントセッションが開始される時点で現在表示されている部分1108Bの外にある(例えば、その中では見えない)。
【0108】
いくつかの実施形態において、デジタルアシスタントオブジェクト1120の第1のロケーションは、物理的環境の特徴、CGR環境1104の特徴、ユーザ1102のロケーション、ポジション、又は姿勢、存在し得る他のユーザのロケーション、ポジション、又は姿勢など、1つ以上の環境要因に基づいて判断され得る。例えば、図4Bに示されているように、デジタルアシスタントオブジェクト1120の第1のロケーションは、ユーザ1102がCGR環境の中で立っている場所とユーザ1102が見ている方向とに基づいて、ユーザ1102が現在見ることができないロケーション(例えば、現在表示されている部分1108Bの外のロケーション)となるように選択される。
【0109】
いくつかの実施形態において、デバイス1106は、デジタルアシスタントセッションの状態を示す出力を提供し得る。状態出力は、2つ以上の異なる状態から選択された状態を表す2つ以上の異なる出力から選択され得る。例えば、2つ以上の状態は、アクティブ及びパッシブリスニング状態に更に細分され得るリスニング状態、応答状態、思考(例えば、処理)状態、注意獲得状態などを含み得、これらは視覚、聴覚、及び/又は触覚出力によって示され得る。例えば、図4Bに示されているように、デジタルアシスタントオブジェクト1120(例えば、仮想球体)の外観は、球体の中央に渦巻きの形状を含み、デジタルアシスタントオブジェクト1120がリスニング状態にあることを示している。図2A図2Eに関して説明されているように、会話の状態が進むにつれて、異なる状態を表す更新された状態出力が提供され得る。
【0110】
ここで図4B~4Cを参照すると、第1のデジタルアシスタントセッションを開始することは、現在表示されている部分1108Cの中で第2に移動するデジタルアシスタントオブジェクト1120を動画化することを更に含む。すなわち、デジタルアシスタントオブジェクト1120は、CGR環境1104の中を移動してユーザ1102に見えるようになる。
【0111】
いくつかの実施形態において、デジタルアシスタントオブジェクト1120の再配置を動画化することは、第1のロケーションと現在表示されている部分1108Cの中にある第2のロケーションとの間の経路の一部分に相当する移動経路を判断することを含む。すなわち、図4Cに示されているように、デジタルアシスタントオブジェクト1120は、初期(例えば、第1の)ロケーションから「視野内に飛んでいき」、ユーザ1102に見える最終(例えば、第2の)ロケーションで止まるように動画化される。
【0112】
いくつかの実施形態において、移動経路は、CGR環境の現在表示されている部分(単数又は複数)1108B及び1108Cの中に位置する1つ以上のオブジェクト(例えば、物理的又は仮想オブジェクト)を通過しないように判断される。例えば、図4Cに示されているように、移動経路は、あたかもデジタルアシスタントオブジェクト1120がCGR環境の中の「素早く身をかわす」オブジェクトであるかのように、ユーザ1102が位置する部屋の中の(物理的な)家具と、又はCGR環境1104内の仮想オブジェクト(例えば、仮想オブジェクト1118C)と、交差しない。
【0113】
いくつかの実施形態において、デジタルアシスタントオブジェクト1120の第2のロケーションは、物理的環境の特徴、CGR環境1104の特徴、ユーザ1102のロケーション、ポジション、又は姿勢、存在し得る他のユーザのロケーション、ポジション、又は姿勢など、1つ以上の環境要因に基づいて判断され得る。例えば、図4Cに示されているように、デジタルアシスタントオブジェクト1120の第2のロケーションは、(例えば、ユーザ1102のポジションに基づいて)ユーザ1102に見えるように、且つ物理的オブジェクト(テレビ1114など)及び/又は仮想オブジェクト1118(仮想オブジェクト1118Cなど)との衝突(例えば、視覚的な干渉)を回避するように、選択される。
【0114】
ここで図4Cを参照すると、いくつかの実施形態において、デバイス1106は、(例えば、1つ以上のセンサを使用して)第2のユーザ入力を検出する。次いで、デバイス1106は、例えば自然言語処理法を用いて、第2のユーザ入力の意図を判断する。判断された意図に基づいて応答出力が提供される。例えば、図4Cに示されているように、デバイス1106は、デジタルアシスタントオブジェクト1120を再配置する意図に相当する要求「棚に座ってください」をユーザ1102が発話していることを検出する。
【0115】
ここで図4Dを参照すると、判断された意図がデジタルインテントオブジェクト1120を再配置することに関連する実施形態において、応答出力を提供することは、第2のユーザ入力から第3のロケーションを判断することを含む。デジタルアシスタントオブジェクト120は、次いで、第3のロケーションに配置され、第3のロケーションが現在表示されている部分1108Dの中にあるという判断に従って、デジタルアシスタントオブジェクト1120は、CGR環境1104内の第3のロケーションに表示される。
【0116】
例えば、図4Cに示されているユーザ入力に基づいて、図4Dでは、判断された第3のロケーションは、CGR環境1104内の(物理的な)棚上のロケーションであり、したがって、デジタルアシスタントオブジェクト1120は、(ユーザ1102の真正面の)第2のロケーションから棚上の第3のロケーションに移動する。棚は現在表示されている部分1108の中にあるので、デバイス1106は、棚の上に「座っている」デジタルアシスタントオブジェクト1120を表示する。
【0117】
ここで図4Eを参照すると、いくつかの実施形態において、デジタルアシスタントセッションは、例えば、ユーザ1102が明示的に(例えば、音声入力、視線入力、ジェスチャ入力、ボタン押下、タップ、コントローラ、タッチスクリーン、又はデバイス入力などを使用して)デジタルアシスタントを退去させる場合に、又は自動的に(例えば、相互作用なしに所定の閾期間の後に)、終了し得る。デジタルアシスタントセッションが終了すると、デバイス1106は、デジタルアシスタントオブジェクト1120を退去させる。図4Eに示されているように、デジタルアシスタントオブジェクト1120の第3のロケーションが現在表示されている部分1108E(例えば、デジタルアシスタントセッションが終了する時点でのユーザ1102の現在の視野)の中にある場合、デジタルアシスタントオブジェクト1120を退去させることは、デジタルアシスタントオブジェクト1120の表示を中止することを含む。
【0118】
いくつかの実施形態において、デジタルアシスタントを退去させることは、退去を示す更なる出力を提供することをも含み得る。退去出力は、聴覚出力(例えば、チャイム、口頭出力など)又は視覚出力(例えば、表示されたオブジェクト、CGR環境1104の照明の変更など)などの指示を含み得る。例えば、図4Eに示されているように、退去出力は、第1のロケーション(例えば、デジタルアシスタントオブジェクト1120の初期ロケーション)に配置されたデジタルアシスタントインジケータ1122を含み、これにより、別のデジタルアシスタントセッションが開始された場合にデジタルアシスタントオブジェクト920が再び出現する場所を示す。第3のロケーションはまだ現在表示されている部分1108E(例えば、第1のデジタルアシスタントセッションが終了した後の時点におけるユーザ1102の現在の視野)の中にあるので、デバイス1106は、デジタルアシスタントインジケータ1122を表示する。
【0119】
いくつかの実施形態において、デジタルアシスタントオブジェクト1120を退去させた後に、デバイス1106は、第3のユーザ入力を検出する。例えば、図4Fに示されているように、デバイス1106は、ユーザ入力「ヘイ、アシスタント」をユーザ1102が発話していることを検出する。図4Aに関して上述されているように、第3の入力がデジタルアシスタントセッションを開始するための基準を満たしている(例えば、既定の音声トリガ、視線トリガ、又はジェスチャトリガに一致する)場合は、第2のデジタルアシスタントセッションが開始される。
【0120】
しかしながら、図4Fに示されているように、ユーザ1102は以前にデジタルアシスタントオブジェクト1120を棚に再配置していたので、第2のデジタルアシスタントセッションを開始することは、デジタルアシスタントオブジェクトを第3のロケーションに配置することを含む。すなわち、いくつかの実施形態において、デジタルアシスタントセッションの最中にデジタルアシスタントオブジェクト1120を手動で再配置した後には、デジタルアシスタントオブジェクト1120のデフォルト(例えば、初期)ロケーションがユーザ1102の要求に従って変わる。
【0121】
図4A図4Fを参照して上述されているプロセスは、任意選択的に、図1A図1Bに示されている構成要素によって実施される。例えば、例示されているプロセスの作業は、電子デバイス(例えば、800a、800b、800c、又は906)によって実施され得る。図1A図1Bに示されている構成要素に基づいて他のプロセスがどのように実施されるかは、当業者には明らかであろう。
【0122】
図5A図5Bは、いくつかの実施形態による、コンピュータ生成現実(CGR)環境の中でデジタルアシスタントの表現を配置する方法1200を示す流れ図である。方法1200は、1つ以上のプロセッサとメモリとを有する1つ以上の電子デバイス(例えば、デバイス800a、800b、800c、及び/又は1106)を使用して実行され得る。いくつかの実施形態において、方法1200は、クライアントサーバシステムを使用して実行され、方法1200の作業は、クライアントデバイス(例えば、800c、1106)とサーバとで任意の方式で分担される。方法1200のいくつかの作業は、任意選択的に組み合わされ、いくつかの作業の順序は、任意選択的に変更され、いくつかの作業は、任意選択的に省略される。
【0123】
方法1200は、CGR環境の少なくとも一部分を表示している間に実行される。すなわち、ある特定の時間に、表示されているCGR環境の特定の部分は、ユーザ(例えば、クライアントデバイス(単数又は複数)のユーザ)の現在の視野を表し、CGR環境のその他の部分(例えば、ユーザの背後又はユーザの周辺視野の外)は表示されない。したがって、方法1200は、例えば、仮想オブジェクトを配置し、且つ「視覚」出力を生成することに言及するが、仮想オブジェクト及び出力のユーザにとっての実際の可視性は、CGR環境の現在表示されている特定の部分に応じて異なり得る。「第1の時間」、「第2の時間」、「第1の部分」、「第2の部分」などの用語は、表示される仮想コンテンツを表示されない仮想コンテンツから区別するために使用され、CGR環境の一定の順序又は既定の部分を示すことを意図していない。
【0124】
いくつかの実施形態において、方法1200のCGR環境は、仮想及び/又は物理的コンテンツ(例えば、物理的デバイス1110、1112、1114、又は1116、ユーザ1102が位置する部屋の中の家具又は壁、及び図4A~4Fに示されている仮想オブジェクト118A~C)を含み得る。CGR環境の内容は、静的であり得、又は動的であり得る。例えば、CGR環境内の静的な物理的オブジェクトは、物理的な家具、壁、及び天井などを含み得るが、CGR環境内の静的な仮想オブジェクトは、CGR環境内の一定のロケーションに位置する仮想オブジェクト(例えば、仮想オブジェクト1118A~Cなどの仮想家具)、又はディスプレイに対して一定のロケーションに位置する仮想オブジェクト(例えば、CGR環境の表示された部分にオーバーレイされるヘッドアップディスプレイ)を含み得る。CGR環境内の動的な物理的オブジェクトは、ユーザ、他のユーザ、ペットなどを含み得、CGR環境内の動的な仮想アイテムは、動くオブジェクト(例えば、仮想キャラクタ、アバター、又はペット)、或いはサイズ、形状、又は形態が変化するオブジェクトを含む。
【0125】
ここで図5Aを参照すると、ブロック1202にでは、方法1200を実施するデバイス(単数又は複数)の1つ以上のセンサによって第1のユーザ入力が検出される。例えば、1つ以上のセンサは、オーディオセンサ(例えば、マイクロフォン)、振動センサ、運動センサ(例えば、加速度計、カメラなど)、ビジュアルセンサ(例えば、光センサ、カメラなど)、タッチセンサなどを含み得る。
【0126】
いくつかの実施形態において、第1のユーザ入力は、聴覚入力を含む。例えば、第1のユーザ入力は、トリガフレーズ(例えば、「ヘイ、アシスタント」)を含む音声入力を含み得る。いくつかの実施形態において、第1のユーザ入力は、視線入力を含む。例えば、ユーザは、少なくとも閾期間にわたって特定のロケーション(例えば、既定のデジタルアシスタントロケーション、デジタルアシスタントが支援できるオブジェクトのロケーションなど)に視線を向けることができる。いくつかの実施形態において、第1のユーザ入力は、ジェスチャ(例えば、ユーザの身体の動き)入力を含む。例えば、ユーザは、「上げて話す」ジェスチャで手首を上げることができる。いくつかの実施形態において、第1のユーザは、ボタン押下、タップ、コントローラ、タッチスクリーン、又はデバイス入力を入力する。例えば、ユーザは、スマートウォッチデバイス910のタッチスクリーンを押し続けることができる。
【0127】
ブロック1204では、第1のユーザ入力がデジタルアシスタントセッションを開始するための基準を満たしているという判断に従って、第1のデジタルアシスタントセッションが開始される。
【0128】
例えば、第1のユーザ入力が聴覚入力を含む場合、基準は、十分な信頼度を有する既定の音声トリガ(例えば、「ヘイ、アシスタント」など)を照合することを含み得る。別の実施例として、第1のユーザ入力が視線入力を含む場合、基準は、ユーザが少なくとも閾期間にわたって特定のロケーション(例えば、既定のデジタルアシスタントロケーション、デジタルアシスタントが相互作用することができるオブジェクトのロケーションなど)に視線を向けることを含み得る。別の実施例として、第1のユーザ入力がジェスチャ(例えば、ユーザの身体の動き)入力を含む場合、基準は、十分な信頼度を有する既定のジェスチャトリガ(例えば、「手首を上げて話す」動きなど)を照合することを含み得る。
【0129】
ブロック1204でデジタルアシスタントセッションを開始することは、ブロック1206にて、第1の時間にCGR環境の中であってCGR環境の第1の(例えば、現在表示されている)部分の外にある第1の(例えば、初期)ロケーションでデジタルアシスタントオブジェクトのインスタンスを生成することを含む。すなわち、ブロック1204を実施する電子デバイスは最初に、デジタルアシスタントセッションが開始されるときにデジタルアシスタントオブジェクトがユーザに見えない(例えば、表示されない、又は「画面外」である)ように、デジタルアシスタントオブジェクトをCGR環境内に配置する。
【0130】
いくつかの実施形態において、CGR環境内の第1の(例えば、初期)ロケーションは、CGR環境内の所定のロケーションである。例えば、所定のロケーションは、CGR環境の座標系内の既定の座標セットであってよい。所定のロケーションは、(例えば、第2のデジタルアシスタントセッションに関して以下で説明するように)以前のデジタルアシスタントセッションでユーザによって決定(例えば、選択)されたものであってもよい。
【0131】
いくつかの実施形態において、ブロック1208では、ユーザが作業している物理的環境、ユーザのポジション、又は複数のユーザのポジションなど、1つ以上の第1の環境要因に基づいて、CGR環境内の第1の(例えば、初期)ロケーションが判断される。1つ以上の第1の環境要因は、例えば、上記で図3Aのブロック1006に関して説明されているように、CGR環境の特性を含み得る。1つ以上の第1の環境要因はまた、ユーザのポジション(例えば、ロケーション及び/又は姿勢)を含み得る。例えば、第1のロケーションは、ユーザの身体又は頭の向き、又はユーザの視線のポジションに基づいて、ユーザの後ろのロケーションであると判断され得る。
【0132】
デジタルアシスタントオブジェクトは、デジタルアシスタント(例えば、デジタルアシスタントセッションのアバター)を表す仮想オブジェクトである。例えば、デジタルアシスタントオブジェクトは、仮想の球体、仮想のキャラクタ、仮想の光の玉などであってよい。デジタルアシスタントオブジェクトは、デジタルアシスタントセッションを通じて外観及び/又は形態を変えることができ、例えば、外観を、球体から仮想の光の玉に、半透明の球体から不透明の球体に、及び/又は同様に、変えることができる。
【0133】
ブロック1210では、第1の時間にCGR環境の第1の(例えば、現在表示されている)部分の中で第2のロケーションに移動するデジタルアシスタントオブジェクトが動画化される。すなわち、第1の(例えば、初期)ロケーションは、CGR環境の第1の(例えば、現在表示されている)部分の外にあるが、デジタルアシスタントオブジェクトはポジションを速やかに変えてユーザに見えるようになり、例えば、CGR環境への没入度を低下させることなく、ユーザの注意をデジタルアシスタントセッションに迅速且つ直感的に引き付けることによって、デジタルアシスタントセッションの効率と有効性を高める。
【0134】
いくつかの実施形態において、ブロック1212では、ブロック1208における第1のロケーションの判断と同様に、1つ以上の第2の環境要因に基づいて第2のロケーションが判断される。
【0135】
1つ以上の第2の環境要因は、CGR環境の特性を含み得る。例えば、第2のロケーションは、CGR環境の中の物理的又は仮想オブジェクトの静的又は動的なロケーションに基づいて判断され得、例えば、デジタルアシスタントオブジェクトがそれらの他のオブジェクトと衝突しない(例えば、視覚的に交差しない)ようにする。例えば、第2のロケーションは、電子デバイスのロケーションにあるか又はその近くにあると判断され得る。デバイスロケーションは、事前に特定されたロケーションに基づいて(例えば、ユーザが手動でデバイスロケーションを特定し、タグ付け)、画像センサデータの視覚的解析に基づいて(例えば、デバイスを認識又は視覚的に理解するために画像センサデータを解析)、他のセンサ又は接続データの解析などに基づいて(例えば、概ね近傍の場合にBluetooth接続を使用)、判断され得る
【0136】
1つ以上の第2の環境要因はまた、ユーザのポジション(例えば、ロケーション及び/又は姿勢)を含み得る。例えば、第1のロケーションは、ユーザの身体又は頭の向き、又はユーザの視線のポジションに基づいて、ユーザの正面にある及び/又はユーザに見えるロケーションであると判断され得る。
【0137】
いくつかの実施形態において、CGR環境の第1の部分の中で第2のロケーションに移動するデジタルアシスタントオブジェクトを動画化することは、第1のロケーションで消失し、第2のロケーションで再び出現する(例えば、あるロケーションから別のロケーションに、瞬時に、又は所定の遅延を伴って、テレポートする)デジタルアシスタントオブジェクトを動画化することを含む。
【0138】
いくつかの実施形態において、ブロック1214では、移動経路が判断される。いくつかの実施形態において、移動経路は、第1のロケーションと第1の時間にCGR環境の第1の(例えば、現在表示されている)部分の中にある第2のロケーションとの間の経路の一部分に相当する。すなわち、第2のロケーションに移動するデジタルアシスタントオブジェクトを動画化することは、デジタルアシスタントオブジェクトが第2のロケーションに到達するために取るべき目に見える動きを判断することを含む。例えば、デジタルアシスタントオブジェクトは、単純に最も短い(例えば、最も直接的な)経路を取ってよく、又は滑らかな「飛行」経路など特定の可視効果を達成するより長い経路、跳ねる、上下する、及び曲がりくねるといった異質な動きを伴う経路などを取ってもよい。
【0139】
いくつかの実施形態において、移動経路は、第1の時間にCGR環境の第1の(例えば、現在表示されている)部分の中に位置する少なくとも1つの追加のオブジェクトを移動経路が通過しないように判断される。例えば、デジタルアシスタントオブジェクトの移動経路はコンテキストアウェアであってよく、CGR環境の中の他の物理的又は仮想オブジェクトを避ける又はかわすように移動する。デジタルアシスタントオブジェクトはまた、部屋に駆け込む(現実の物理的な)ペット、CGR環境の別のユーザ、又は動く仮想オブジェクト(図4A図4Fの仮想オブジェクト1118A~Cなど)など、動的なオブジェクトをかわすことが可能であり得る。
【0140】
いくつかの実施形態において、ブロック1216では、(例えば、第1のデジタルアシスタントセッションの開始後のある時点に)第2のユーザ入力が検出される。例えば、第2のユーザ入力は、口頭によるコマンド、質問、要求、ショートカットなどの口頭入力を含み得る。別の実施例として、第2のユーザ入力はまた、身ぶりによるコマンド、質問、要求などのジェスチャ入力、CGR環境との相互作用を表すジェスチャ(例えば、仮想オブジェクトを「掴む」及び「落とす」)などを含み得る。別の実施例として、第2のユーザ入力は、視線入力を含み得る。
【0141】
いくつかの実施形態において、ブロック1218では、第2のユーザ入力の意図が判断される。意図は、1つ以上のパラメータを使用して実行され得る1つ以上のタスクに対応し得る。例えば、第2のユーザ入力が口頭又は身ぶりによるコマンド、質問、又は要求を含む場合は、図4Cに示されている口頭ユーザ入力「棚に座ってください」からオーディオを再生する意図を判断するなど、自然言語処理技術を用いて意図が判断され得る。別の実施例として、第2のユーザ入力がジェスチャを含む場合は、ジェスチャのタイプ(単数又は複数)、ジェスチャのロケーション(単数又は複数)、及び/又はCGR環境内の様々なオブジェクトのロケーションに基づいて、意図が判断され得る。例えば、掴んで落とすタイプのジェスチャは、「掴む」ジェスチャのロケーション又はその近くに配置された仮想オブジェクトを「落とす」ジェスチャのロケーションに移動させる意図に対応し得る。
【0142】
いくつかの実施形態において、第2のユーザ入力の意図の判断は専ら、デジタルアシスタントオブジェクトの現在のロケーションが、第2のユーザ入力が受け取られる時点にCGR環境の現在表示されている部分の中にあるという判断に従って行われる。すなわち、ユーザが物理的な部屋の中の別の人又はマルチプレーヤゲームの中の別のプレーヤと話すなど、検出されるユーザ入力にはデジタルアシスタントセッションを対象としないものもある。ユーザがデジタルアシスタントオブジェクトを見ている(又はその近くにいる)間に受け取られたユーザ入力のみを処理し、且つそれのみに応答することで、例えば、意図されていない相互作用が生じる見込みが低下し、デジタルアシスタントセッションの効率が向上する。
【0143】
いくつかの実施形態において、ブロック1220では、判断された意図に基づいて第1の出力が提供される。第1の出力を提供することは、判断された意図に対応する1つ以上のタスクを実行させることを含み得る。例えば、図4A図4Fに示されているように、口頭ユーザ入力「棚に座ってください」に対して、第2の出力は、CGR環境の中でデジタルアシスタントオブジェクト1120を棚に再配置することを含む。別の実施例として、身ぶりによる入力「何時ですか?」に対して、第1の出力は、時計の文字盤を示すウィジェットを表示することを含み得る。
【0144】
いくつかの実施形態において、判断された意図に基づいて第2の出力を提供することは、判断された意図がデジタルアシスタントオブジェクトを再配置することに関連するか否かを判断することを含む。例えば、第2のユーザ入力は、図4A図4Fに示されている口頭出力「棚に座ってください」や掴んで落とすジェスチャ入力など、デジタルアシスタントを再配置する明示的な要求を含み得る。別の実施例として、第2のユーザ入力は、デジタルアシスタントオブジェクトの現在のロケーションを起点とし、CGR環境の表示された部分を横切って移動し、新たなロケーションで止まる、特定の視線入力を含み得る。
【0145】
判断された意図がデジタルアシスタントオブジェクトを再配置することに関連するという判断に従って、第2のユーザ入力から第3のロケーションが判断される。例えば口頭入力「棚に座ってください」から「棚の上」の第3のロケーションが判断され得、掴んで落とすジェスチャ入力から「落とす」ジェスチャに位置する若しくはその近くに位置する第3のロケーションが判断され得、又は視線入力からユーザの視線のロケーションに位置する若しくはその近くに位置する第3のロケーションが判断され得る。
【0146】
更に、判断された意図がデジタルアシスタントオブジェクトを再配置することに関連するという判断に従って、デジタルアシスタントオブジェクトは第2のロケーションに配置される。(例えば、第2の時間に)CGR環境の現在表示されている(例えば、第2の)部分の中に第3のロケーションがあるという判断に従って、デジタルアシスタントオブジェクトはCGR環境内の第3のロケーションに表示される。すなわち、デジタルアシスタントオブジェクトを、第2のユーザ入力が検出されたときのそのロケーションから第2のユーザ入力から判断された第3のロケーションに再配置する間に、デジタルアシスタントオブジェクトは、そのロケーションがユーザの現在の視野内に留まる限りは、表示される(例えば、あるロケーションから別のロケーションへのデジタルアシスタントオブジェクトの移動を動画化することを含む)。
【0147】
いくつかの実施形態において、判断された意図に基づいて第1の出力を提供することは、判断された意図が、CGR環境内のオブジェクトロケーションに位置するオブジェクト(例えば、物理的又は仮想オブジェクト)に関連するか否かを判断することを含む。判断された意図がCGR環境内のオブジェクトロケーションに位置するオブジェクトに関連するという判断に従って、デジタルアシスタントはオブジェクトロケーションに近い第4のロケーションに配置される。すなわち、デジタルアシスタントオブジェクトが関連するオブジェクトの近くに移動して、そのオブジェクトとの相互作用を示し、及び/又はそのオブジェクト若しくは相互作用に注意を引く。例えば、図4A図4Fに示されているCGR環境1104において、「コンソールテーブル上には何がありますか?」といった口頭ユーザ入力に対し、デジタルアシスタントオブジェクト1120は、コンソールテーブル上の仮想オブジェクト1118Cの近くに移動でき、その後その仮想オブジェクトに関するより多くの情報を提供する。
【0148】
いくつかの実施形態において、ブロック1222では、第1の出力の1つ以上の特性に基づいて、第2の出力が提供される。第2の出力の1つ以上の特性は、第2の出力のタイプ(例えば、視覚、聴覚、又は触覚)、(例えば、CGR環境内で実行されるタスクのための)CGR環境内の第2の出力のロケーションなどを含み得る。例えば、図4A図4Fに示されているように、口頭ユーザ入力「棚に座ってください」に対して、第2の出力は、棚への実際の移動とともに口頭出力「Ok!」を含み得る。別の実施例として、身ぶりによる入力「何時ですか?」に対して、第2の出力は、表示された時計ウィジェット(例えば、第1の出力)の近くで跳ねる又は小刻みに揺れるデジタルアシスタントオブジェクトを動画化することを含み得る。説明されているように第2の出力を提供することによって、例えば、要求されたタスクの実行及び/又は完了がユーザに直ちに明らかではない場合には、その実行及び/又は完了にユーザの注意を引き付けることによって、デジタルアシスタントセッションの効率が向上する。
【0149】
いくつかの実施形態において、ブロック1224では、2つ以上の異なる出力から選択された第4の出力が提供されて、2つ以上の異なる状態から選択された第1のデジタルアシスタントセッションの状態を示す。第1のデジタルアシスタントセッションの2つ以上の異なる状態は、1つ以上のリスニング状態(例えば、アクティブ又はパッシブリスニング)、1つ以上の応答状態、1つ以上の処理(例えば、思考)状態、1つ以上の失敗状態、1つ以上の注意獲得状態、及び/又は1つ以上の遷移(例えば、移動、出現、又は消失)状態を含み得る。異なる出力と異なる状態との間には一対一の対応関係が存在し得、1つ以上の状態が同じ出力によって表され得、又は1つ以上の出力が同じ状態(又は同じ状態のバリエーション)を表し得る。
【0150】
例えば、図4A図4Fに示されているように、デジタルアシスタントオブジェクト1120は、最初にユーザの注意を引き(例えば、第2のロケーションのポジションに移動)、ユーザ入力に応答する/ユーザの注意を応答に引き付ける間に、異なる外観を呈する。他の第4の(例えば、状態)出力は、デジタルアシスタントオブジェクトのサイズの変更、動きの動画化、聴覚出力(例えば、デジタルアシスタントオブジェクトの現在のロケーションから「発する」指向性音声出力)、照明効果の変化、他の視覚出力、触覚出力などを含み得る。
【0151】
第1のデジタルアシスタントセッション中の任意の時点で、(例えば、ユーザが視点を変えるのに応じて)CGR環境の現在表示されている部分が更新され、デジタルアシスタントオブジェクトの現在のロケーションが現在表示されている部分にもはや含まれなくなった(例えば、ユーザにもはや見えなくなった)場合は、デジタルアシスタントの現在のポジションを示す出力が提供され得る。例えば、現在のポジションを示す追加の出力は、図3A~3Bとブロック1008に関して上述されているように提供され得る(例えば、空間聴覚出力、視覚出力、触覚出力など)。
【0152】
いくつかの実施形態において、第1のデジタルアシスタントセッションは、例えば、ユーザによる明示的な退去の際に、又は相互作用なしに閾期間が経過した後に、終了する。第1のデジタルアシスタントセッションが終了すると、ブロック1226でデジタルアシスタントオブジェクトが退去させられる(例えば、CGR環境から除去される)。デジタルアシスタントセッションが終了する時点でデジタルアシスタントオブジェクトがCGR環境の表示されている部分の中に位置する場合、デジタルアシスタントオブジェクトを退去させることは、デジタルアシスタントオブジェクトの表示を中止することを含む。
【0153】
いくつかの実施形態において、デジタルアシスタントオブジェクトを退去させるときには、デジタルアシスタントオブジェクトの退去を示す第3の出力が提供される。第3の出力は、1つ以上の視覚出力(例えば、かすかな光、CGR環境内の照明をデジタルアシスタントセッション前の状態に戻すことなど)、1つ以上の聴覚出力(例えば、「バイ」などの口頭出力、チャイムなど)、1つ以上の触覚出力などを含み得る。例えば、図4Eに示されているように、第3の出力を提供することは、第3のロケーションにデジタルアシスタントインジケータ1122を配置することを含み得る。第3の出力は、第1のデジタルアシスタントセッションが終了したことをユーザに示すことができ、ユーザが後続の呼び出しにおいてより速やかにデジタルアシスタントオブジェクトの位置を特定する(例えば、デジタルアシスタントオブジェクトを見つける)のに役立つことができる。
【0154】
いくつかの実施形態において、デジタルアシスタントオブジェクトを退去させた後には、第3のユーザ入力が検出される。第3のユーザ入力は、第1のユーザ入力(例えば、第1のデジタルアシスタントセッションを呼び出すユーザ入力)に関して説明されているように、聴覚入力、視線入力、ジェスチャ入力、又はデバイス入力(例えば、ボタン押下、タップ、スワイプなど)であり得る。(例えば、ブロック1204に関して上述されているように)第3のユーザ入力がデジタルアシスタントセッションを開始するための少なくとも1つの基準を満たしているという判断に従って、第2のデジタルアシスタントセッションが開始される。
【0155】
デジタルアシスタントオブジェクトを再配置することに関連する第2のユーザ入力が第1のデジタルアシスタントセッション中に受け取られた実施形態において、第2のデジタルアシスタントセッションを開始することは、第3のロケーション(例えば、第2のユーザ入力で要求されたロケーション)にデジタルアシスタントオブジェクトを配置すること(例えば、そのインスタンスを生成すること)を含む。すなわち、図4A~4Fに示されているように、ユーザがデジタルアシスタントオブジェクトを明示的に移動させた後には、ユーザによって選択されたロケーションが、後続の呼び出しのときにデジタルアシスタントオブジェクトが出現する新しい「デフォルト」位置になる。
【0156】
図5A図5Bを参照して上述されているプロセスは、任意選択的に、図1A図1Bに示されている構成要素によって実施される。例えば、例示されている方法の作業は、システム700を実装するものなど、電子デバイス(例えば、800a、800b、800c、又は906)によって実施され得る。図1A図1Bに示されている構成要素に基づいて他のプロセスがどのように実施されるかは、当業者には明らかであろう。
【0157】
一部の実装形態によれば、コンピュータ可読記憶媒体(例えば、非一時的コンピュータ可読記憶媒体)が提供され、このコンピュータ可読記憶媒体は、電子デバイスの1つ以上のプロセッサによって実行される1つ以上のプログラムを記憶し、それら1つ以上のプログラムは、本明細書で説明される方法又はプロセスのうちのいずれかを実行する命令を含む。
【0158】
一部の実装形態によれば、本明細書で説明される方法又はプロセスのうちのいずれかを実行する手段を備える、電子デバイス(例えば、ポータブル電子デバイス)が提供される。
【0159】
一部の実装形態によれば、本明細書で説明される方法又はプロセスのうちのいずれかを実行するように構成された処理ユニットを備える、電子デバイス(例えば、ポータブル電子デバイス)が提供される。
【0160】
一部の実装形態によれば、1つ以上のプロセッサと、その1つ以上のプロセッサによって実行するための1つ以上のプログラムを記憶しているメモリとを備え、それら1つ以上のプログラムが、本明細書で説明される方法又はプロセスのうちのいずれかを実行する命令を含む、電子デバイス(例えば、ポータブル電子デバイス)が提供される。
【0161】
上記は、説明を目的として、特定の実施形態を参照して記述されている。しかしながら、上記の例示的な論考は、網羅的であること、又は開示される厳密な形態に本発明を限定することを意図するものではない。上記の教示を考慮して、多くの修正及び変形が可能である。本技術の原理、及びそれらの実際の用途を最も良く説明するために、実施形態が選択及び記載されている。それにより、他の当業者は、意図された具体的な用途に適するような様々な修正を用いて、本技術及び様々な実施形態を最も良好に利用することが可能となる。
【0162】
添付図面を参照して、本開示及び例を十分に説明してきたが、様々な変更及び修正が、当業者には明らかとなるであろうことに留意されたい。そのような変更及び修正は、特許請求の範囲によって定義されるような、本開示及び例の範囲内に含まれるものとして理解されたい。
図1A
図1B
図2A
図2B
図2C
図2D
図2E
図3A
図3B
図4A
図4B
図4C
図4D
図4E
図4F
図5A
図5B
【手続補正書】
【提出日】2024-02-20
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
1つ以上のプロセッサ、メモリ、ディスプレイ、及び1つ以上のセンサを有する電子デバイスにおいて、
前記電子デバイスのユーザの現在の視野を表すコンピュータ生成現実(CGR)環境の部分を表示している間に、
前記1つ以上のセンサを用いて第1のユーザ入力を検出することと、
前記第1のユーザ入力がデジタルアシスタントセッションを開始するための少なくとも1つの基準を満たしているという判断に従って、第1のデジタルアシスタントセッションを開始することであって、前記第1のデジタルアシスタントセッションを開始することが、第1の時間に前記CGR環境の中であって前記CGR環境の前記表示されている部分の外にある第1のロケーションにデジタルアシスタントオブジェクトを配置することを含む、開始することと、
前記CGR環境内の前記デジタルアシスタントオブジェクトの前記第1のロケーションを示す第1の出力を提供することと、
を含む、方法。
【請求項2】
前記第1のユーザ入力は、聴覚入力を含む、請求項1に記載の方法。
【請求項3】
前記聴覚入力は、トリガフレーズを含む音声入力を含む、請求項2に記載の方法。
【請求項4】
前記第1のユーザ入力は、視線入力を含む、請求項1~3のいずれか一項に記載の方法。
【請求項5】
前記第1のユーザ入力は、ジェスチャ入力を含む、請求項1~4のいずれか一項に記載の方法。
【請求項6】
1つ以上の環境要因に基づいて、前記CGR環境内の前記第1のロケーションを判断することを更に含む、
請求項1~5のいずれか一項に記載の方法。
【請求項7】
前記1つ以上の環境要因は、前記CGR環境の特性を含む、請求項6に記載の方法。
【請求項8】
前記1つ以上の環境要因は、前記電子デバイスの前記ユーザのポジションを含む、請求項6~7のいずれか一項に記載の方法。
【請求項9】
前記1つ以上の環境要因は、前記CGR環境の複数のユーザの複数のポジションを含む、請求項6~8のいずれか一項に記載の方法。
【請求項10】
前記第1のロケーションを示す前記第1の出力を提供することは、第1の聴覚出力を生成させることを含む、請求項1~9のいずれか一項に記載の方法。
【請求項11】
前記第1の聴覚出力は、少なくとも、複数のスピーカーのうちの第1のスピーカーによって生成される第1のオーディオ成分と、前記複数のスピーカーのうちの第2のスピーカーによって生成される第2のオーディオ成分とを含み、前記第1のロケーションを示す前記第1の出力を提供することは、
前記第1のロケーションが前記複数のスピーカーのうちの前記第1のスピーカーのロケーションに近いか、それとも前記複数のスピーカーのうちの前記第2のスピーカーのロケーションに近いかを判断することと、
前記第1のロケーションが前記第2のスピーカーの前記ロケーションより前記第1のスピーカーの前記ロケーションに近いという判断に従って、前記第1のオーディオ成分を前記第2のオーディオ成分より大音量で生成することと、
前記第1のロケーションが前記第1のスピーカーの前記ロケーションより前記第2のスピーカーの前記ロケーションに近いという判断に従って、前記第2のオーディオ成分を前記第1のオーディオ成分より大音量で生成することとを含む、請求項10に記載の方法。
【請求項12】
前記第1のロケーションを示す前記第1の出力を提供することは、第1の触覚出力を生成させることを含む、請求項1~11のいずれか一項に記載の方法。
【請求項13】
前記第1のロケーションを示す前記第1の出力を提供することは、前記第1のロケーションの視覚的指示を前記ディスプレイに表示することを含む、請求項1~12のいずれか一項に記載の方法。
【請求項14】
第2の時間において、
前記第1のロケーションが前記第2の時間に前記CGR環境の前記表示されている部分の中にあるという判断に従って、前記第1のロケーションに前記デジタルアシスタントオブジェクトを表示することとを更に含む、
請求項1~13のいずれか一項に記載の方法。
【請求項15】
前記1つ以上のセンサを用いて第3の時間に第2のユーザ入力を検出することと、
前記第2のユーザ入力の意図を判断することと、
前記判断された意図に基づいて第2の出力を提供することとを更に含む、
請求項1~14のいずれか一項に記載の方法。
【請求項16】
前記第2のユーザ入力を検出することは、前記デジタルアシスタントオブジェクトが前記第1のロケーションに配置されている間に実行され、前記意図を判断することと前記判断された意図に基づいて前記第2の出力を提供することとは、前記第1のロケーションが前記第3の時間に前記CGR環境の前記表示されている部分の中にあるという前記判断に従って実行される、請求項15に記載の方法。
【請求項17】
前記判断された意図に基づいて前記第2の出力を提供することは、
前記判断された意図が前記デジタルアシスタントオブジェクトを再配置することに関連するという判断に従って、
前記第2のユーザ入力から第2のロケーションを判断することと、
前記第2のロケーションに前記デジタルアシスタントオブジェクトを配置することと、
第4の時間において、前記第2のロケーションが前記第4の時間に前記CGR環境の前記表示されている部分の中にあるという判断に従って、前記CGR環境内の前記第2のロケーションに前記デジタルアシスタントオブジェクトを表示することとを含む、請求項15~16のいずれか一項に記載の方法。
【請求項18】
前記第2のロケーションに前記デジタルアシスタントオブジェクトを配置した後に、前記デジタルアシスタントオブジェクトを退去させることと、
前記1つ以上のセンサを用いて第3のユーザ入力を検出することと、
前記第3のユーザ入力がデジタルアシスタントセッションを開始するための少なくとも1つの基準を満たしているという判断に従って、第2のデジタルアシスタントセッションを開始することであって、前記第2のデジタルアシスタントセッションを開始することが、前記第2のロケーションに前記デジタルアシスタントオブジェクトを配置することを含む、開始することとを更に含む、
請求項17に記載の方法。
【請求項19】
前記判断された意図に基づいて前記第2の出力を提供することは、
前記判断された意図が前記CGR環境内のオブジェクトロケーションに位置するオブジェクトに関連するという判断に従って、前記オブジェクトロケーションの近くの第3のロケーションに前記デジタルアシスタントオブジェクトを配置することを含む、請求項15~16のいずれか一項に記載の方法。
【請求項20】
前記第2の出力を提供している間に、前記第2の出力の1つ以上の特性に基づいて、第3の出力を提供することを更に含む、
請求項14~19のいずれか一項に記載の方法。
【請求項21】
前記デジタルアシスタントオブジェクトを退去させることと、
前記デジタルアシスタントオブジェクトの退去を示す第4の出力を提供することとを更に含む、
請求項1~20のいずれか一項に記載の方法。
【請求項22】
前記第4の出力を提供することは、
前記CGR環境内の前記第1のロケーションにデジタルアシスタントインジケータを配置することを含む、請求項21に記載の方法。
【請求項23】
前記第1のデジタルアシスタントセッションの2つ以上の異なる状態から選択された状態を示す2つ以上の異なる出力から選択された第5の出力を提供することを更に含む、
請求項1~22のいずれか一項に記載の方法。
【請求項24】
請求項1~23のいずれか一項に記載の方法をコンピュータに実行させるためのコンピュータプログラム。
【請求項25】
請求項24に記載のコンピュータプログラムを記憶したメモリと、
前記メモリに記憶されたコンピュータプログラムを実行することができる一以上のプロセッサと、を備える電子デバイスであって、
前記電子デバイスはディスプレイ及び1つ又は2以上のセンサと通信ように構成される、
電子デバイス。
【請求項26】
請求項1~23のいずれか一項に記載の方法を実行する手段を備える、
電子デバイス。
【国際調査報告】