特表2024-542959 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ クゥアルコム・インコーポレイテッドの特許一覧

特表2024-542959エクステンデッドリアリティシステムのための動的コンテンツ提示

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3A
3B
4A
4B
5A
5B
6
7
8
9
10
11

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】

(43)【公表日】2024-11-19

(54)【発明の名称】エクステンデッドリアリティシステムのための動的コンテンツ提示

(51)【国際特許分類】

G06F 3/01 20060101AFI20241112BHJP

G09G 5/00 20060101ALI20241112BHJP

G09G 5/02 20060101ALI20241112BHJP

G09G 5/26 20060101ALI20241112BHJP

G09G 5/32 20060101ALI20241112BHJP

G09G 5/37 20060101ALI20241112BHJP

G09G 5/373 20060101ALI20241112BHJP

G06T 19/00 20110101ALI20241112BHJP

【ＦＩ】

G06F3/01 510

G09G5/00 550C

G09G5/02 B

G09G5/26

G09G5/32 640L

G09G5/32 640S

G09G5/37 300

G09G5/373

G06T19/00 600

【審査請求】未請求

【予備審査請求】未請求

(21)【出願番号】P 2024523715

(86)(22)【出願日】2022-10-19

(85)【翻訳文提出日】2024-04-19

(86)【国際出願番号】 US2022078395

(87)【国際公開番号】W WO2023086728

(87)【国際公開日】2023-05-19

(31)【優先権主張番号】17/454,188

(32)【優先日】2021-11-09

(33)【優先権主張国・地域又は機関】US

(81)【指定国・地域】

【公序良俗違反の表示】

（特許庁注：以下のものは登録商標）

１．ＢＬＵ―ＲＡＹＤＩＳＣ

(71)【出願人】

【識別番号】595020643

【氏名又は名称】クゥアルコム・インコーポレイテッド

【氏名又は名称原語表記】ＱＵＡＬＣＯＭＭＩＮＣＯＲＰＯＲＡＴＥＤ

(74)【代理人】

【識別番号】110003708

【氏名又は名称】弁理士法人鈴榮特許綜合事務所

(72)【発明者】

【氏名】フォルタンプール、ビジャン

(72)【発明者】

【氏名】キース、ジョナサン

【テーマコード（参考）】

5B050

5C182

5E555

【Ｆターム（参考）】

5B050AA03

5B050BA06

5B050BA09

5B050BA20

5B050CA07

5B050CA08

5B050DA04

5B050DA07

5B050EA04

5B050EA19

5B050EA26

5B050FA02

5B050FA05

5B050FA14

5C182AA05

5C182AA26

5C182AB08

5C182AB34

5C182AB35

5C182AC02

5C182AC03

5C182AC13

5C182AC46

5C182BA14

5C182BA29

5C182BA56

5C182BA57

5C182BA75

5C182BC25

5C182BC26

5C182CA32

5C182CB12

5C182CB32

5C182CB42

5C182FA61

5C182FA68

5E555AA64

5E555BA02

5E555BA08

5E555BB02

5E555BB08

5E555BC04

5E555BE17

5E555CA42

5E555CB65

5E555CC03

5E555DA08

5E555DB57

5E555DC31

5E555DC35

5E555EA19

5E555EA22

5E555FA00

(57)【要約】

エクステンデッドリアリティ（ＸＲ）動作のためのシステム及び技法が説明される。ＸＲシステムは、表示設定に従って、ディスプレイを使用して仮想コンテンツを表示する。表示設定は、例えば、表示される仮想コンテンツの位置、向き、及び／又はサイズを識別することができる。仮想コンテンツが、ディスプレイによって、例えばシースルーディスプレイ又はパススルーディスプレイを使用して表示されるときに、環境がディスプレイを使用して視認可能であり得る。撮像システムは、撮像システムのユーザの片眼又は両眼の１つ又は複数の属性に基づいて、ユーザによってディスプレイを使用して表示された仮想コンテンツに対する知覚の程度を判定することができる。属性は、例えば、眼球位置、眼球運動、瞳孔拡張、サッカード、固視、瞬き、及び／又は眼を細めることを識別することができる。ＸＲシステムは、ユーザによる仮想コンテンツに対する知覚の程度に基づいて、表示設定に対する修正を決定することができる。

【特許請求の範囲】

【請求項1】

少なくとも１つのメモリと、
前記少なくとも１つのメモリに結合された１つ又は複数のプロセッサと、
を備えるエクステンデッドリアリティ（ＸＲ）システムであって、
前記１つ又は複数のプロセッサが、
仮想コンテンツを、前記仮想コンテンツに関連付けられた表示設定に従って、ディスプレイを使用して表示させ、前記仮想コンテンツが前記ディスプレイによって表示されるときに、環境が前記ディスプレイを使用して視認可能であり、
ユーザの１つ又は複数の知覚関連属性に基づいて、前記ユーザによって前記ディスプレイを使用して表示された前記仮想コンテンツに対する知覚レベルを決定し、
前記ユーザによる前記仮想コンテンツに対する前記知覚レベルに基づいて、前記仮想コンテンツに対応する前記表示設定に対する修正を決定する、
ように構成されている、ＸＲシステム。

【請求項2】

前記ユーザの前記１つ又は複数の知覚関連属性が、前記ユーザの１つ又は複数の眼に関連付けられている、請求項１に記載のＸＲシステム。

【請求項3】

前記ディスプレイの少なくとも一部分を通過する前記環境からの光に少なくとも部分的に基づいて、前記環境が、前記ディスプレイを使用して視認可能である、請求項１に記載のＸＲシステム。

【請求項4】

前記環境のビューを前記ディスプレイによって表示させるように前記１つ又は複数のプロセッサが構成されていることに少なくとも部分的に基づいて、前記環境が、前記ディスプレイを使用して視認可能である、請求項１に記載のＸＲシステム。

【請求項5】

前記ユーザによる前記仮想コンテンツに対する前記知覚レベルを決定するために、前記１つ又は複数のプロセッサが、１つ又は複数のトレーニングされた機械学習システムへの入力として、前記ユーザの前記１つ又は複数の知覚関連属性を使用するように構成されている、請求項１に記載のＸＲシステム。

【請求項6】

前記１つ又は複数のプロセッサが、
ユーザインターフェースを通して、前記ユーザによる前記仮想コンテンツに対する前記知覚レベルに対応するフィードバックを受信し、
前記フィードバックに基づいて、前記１つ又は複数のトレーニングされた機械学習システムを更新する、
ように構成されている、請求項５に記載のＸＲシステム。

【請求項7】

前記１つ又は複数のプロセッサが、
１つ又は複数のセンサによって捕捉されたセンサデータを受信し、ここにおいて前記センサデータは、前記ユーザの１つ又は複数の眼を示す、
前記センサデータに基づいて、前記ユーザの前記１つ又は複数の知覚関連属性を決定する、
ように構成されている、請求項１に記載のＸＲシステム。

【請求項8】

前記１つ又は複数のセンサを更に備える、請求項７に記載のＸＲシステム。

【請求項9】

前記１つ又は複数のプロセッサが、
１つ又は複数の画像センサによって捕捉されたセンサデータに基づいて、前記ユーザの前記１つ又は複数の知覚関連属性を決定するように構成されており、前記センサデータが、前記ユーザの１つ又は複数の眼の１つ又は複数の画像を含む、請求項１に記載のＸＲシステム。

【請求項10】

前記１つ又は複数のプロセッサが、
前記ユーザによる前記仮想コンテンツに対する前記知覚レベルに基づいて、前記ユーザによる前記仮想コンテンツに対する把握レベルを決定するように構成されており、前記知覚レベルに基づいて前記表示設定に対する前記修正を決定するために、前記１つ又は複数のプロセッサが、前記把握レベルに基づいて、前記表示設定に対する前記修正を決定するように構成されている、請求項１に記載のＸＲシステム。

【請求項11】

前記１つ又は複数のプロセッサが、
前記ユーザに関連付けられた履歴情報を受信するように構成されており、前記ユーザによる前記仮想コンテンツに対する前記把握レベルを決定するために、前記１つ又は複数のプロセッサが、前記ユーザに関する前記履歴情報に基づいて、前記ユーザによる前記仮想コンテンツに対する前記把握レベルを決定するように構成されている、請求項１０に記載のＸＲシステム。

【請求項12】

前記１つ又は複数のプロセッサが、
前記仮想コンテンツの特性を決定するように構成されており、前記ユーザによる前記仮想コンテンツに対する前記知覚レベルを決定するために、前記１つ又は複数のプロセッサが、前記仮想コンテンツの前記特性に更に基づいて、前記知覚レベルを決定するように構成されている、請求項１に記載のＸＲシステム。

【請求項13】

前記１つ又は複数のプロセッサが、
前記仮想コンテンツの複雑さレベルを決定するように構成されており、前記ユーザによる前記仮想コンテンツに対する前記知覚レベルを決定するために、前記１つ又は複数のプロセッサが、前記仮想コンテンツの前記複雑さレベルに基づいて、前記知覚レベルを決定するように構成されている、請求項１に記載のＸＲシステム。

【請求項14】

前記１つ又は複数のプロセッサが、
前記仮想コンテンツの一意性レベルを決定するように構成されており、前記ユーザによる前記仮想コンテンツに対する前記知覚レベルを決定するために、前記１つ又は複数のプロセッサが、前記仮想コンテンツの前記一意性レベルに基づいて、前記知覚レベルを決定するように構成されている、請求項１に記載のＸＲシステム。

【請求項15】

前記仮想コンテンツに対応する前記表示設定に対する前記修正が、前記ディスプレイに、前記仮想コンテンツの少なくとも一部分を表示することを停止させることを備える、請求項１に記載のＸＲシステム。

【請求項16】

前記仮想コンテンツに対応する前記表示設定に対する前記修正が、前記ディスプレイに、前記仮想コンテンツの少なくとも一部分を、前記修正の前よりも顕著に表示させることを備える、請求項１に記載のＸＲシステム。

【請求項17】

前記仮想コンテンツに対応する前記表示設定に対する前記修正が、前記仮想コンテンツの１つ又は複数の特性に対する修正を備え、前記１つ又は複数の特性が、位置、向き、深度、サイズ、色、フォントサイズ、フォント色、フォント、言語、及びレイアウトのうちの少なくとも１つを含む、請求項１に記載のＸＲシステム。

【請求項18】

前記ユーザによる前記仮想コンテンツに対する前記知覚レベルを決定するために、前記１つ又は複数のプロセッサが、前記ユーザが前記仮想コンテンツを知覚したと決定するように構成されている、請求項１に記載のＸＲシステム。

【請求項19】

前記ユーザによる前記仮想コンテンツに対する前記知覚レベルを決定するために、前記１つ又は複数のプロセッサが、前記ユーザが前記仮想コンテンツを知覚していないと決定するように構成されている、請求項１に記載のＸＲシステム。

【請求項20】

信頼レベルであって、前記表示設定に対する前記修正が、前記仮想コンテンツが一定の時間内に前記ユーザによって再視認される尤度、信頼レベルに基づく、請求項１に記載のＸＲシステム。

【請求項21】

前記ユーザによる前記仮想コンテンツに対する前記知覚レベルを判定するために、前記１つ又は複数のプロセッサが、前記ユーザによる前記仮想コンテンツに対する前記知覚レベルに対応する信頼レベルを判定するように構成されており、前記表示設定に対する前記修正が、前記信頼レベルに基づく、請求項１に記載のＸＲシステム。

【請求項22】

前記ユーザの前記１つ又は複数の知覚関連属性が、前記仮想コンテンツに対する前記ユーザの１つ又は複数の眼の１つ又は複数の眼球位置を含む、請求項１に記載のＸＲシステム。

【請求項23】

前記ユーザの前記１つ又は複数の知覚関連属性が、前記ユーザの１つ又は複数の眼による１回又は複数回のサッカードの１つ又は複数の特性を含み、前記１つ又は複数の特性が、頻度、持続時間、タイミング、サッカード速度、サッカード振幅、眼球位置、及び眼球運動のうちの少なくとも１つを含む、請求項１に記載のＸＲシステム。

【請求項24】

前記ユーザの前記１つ又は複数の知覚関連属性が、前記ユーザの１つ又は複数の眼による１回又は複数回の固視の１つ又は複数の特性を含み、前記１つ又は複数の特性が、頻度、持続時間、タイミング、眼球位置、及び眼球運動のうちの少なくとも１つを含む、請求項１に記載のＸＲシステム。

【請求項25】

前記ユーザの前記１つ又は複数の知覚関連属性が、前記ユーザの１つ又は複数の眼による１回又は複数回の瞳孔拡張の１つ又は複数の特性を含み、前記１つ又は複数の特性が、頻度、持続時間、タイミング、瞳孔拡張レベル、眼球位置、及び眼球運動のうちの少なくとも１つを含む、請求項１に記載のＸＲシステム。

【請求項26】

前記ユーザの前記１つ又は複数の知覚関連属性が、前記ユーザの１つ又は複数の瞼による１回又は複数回の瞬きの１つ又は複数の特性を含み、前記１つ又は複数の特性が、頻度、持続時間、タイミング、瞬き速度、眼球位置、及び眼球運動のうちの少なくとも１つを含む、請求項１に記載のＸＲシステム。

【請求項27】

前記ユーザの前記１つ又は複数の知覚関連属性が、前記ユーザの１つ又は複数の瞼による１回又は複数回の眼を細めることの１つ又は複数の特性を含み、前記１つ又は複数の特性が、頻度、持続時間、タイミング、眼を細めるレベル、眼球位置、及び眼球運動のうちの少なくとも１つを含む、請求項１に記載のＸＲシステム。

【請求項28】

前記１つ又は複数のプロセッサが、
前記ユーザによる文字列の読解の程度を、前記仮想コンテンツに対する前記知覚レベルと前記文字列の長さとに基づいて決定するように構成されており、前記仮想コンテンツが、前記文字列を含む、請求項１に記載のＸＲシステム。

【請求項29】

前記ディスプレイを更に備える、請求項１に記載のＸＲシステム。

【請求項30】

エクステンデッドリアリティ（ＸＲ）動作の方法であって、
仮想コンテンツを、前記仮想コンテンツに関連付けられた表示設定に従ってディスプレイを使用して表示させることであって、前記仮想コンテンツが前記ディスプレイによって表示されるときに、環境が前記ディスプレイを使用して視認可能である、表示させることと、
ユーザの１つ又は複数の知覚関連属性に基づいて、前記ユーザによって前記ディスプレイを使用して表示された前記仮想コンテンツに対する知覚レベルを決定することと、
前記ユーザによる前記仮想コンテンツに対する前記知覚レベルに基づいて、前記仮想コンテンツに対応する前記表示設定に対する修正を決定することと、
を備える、方法。

【請求項31】

前記ユーザによる前記仮想コンテンツに対する前記知覚レベルを決定することが、１つ又は複数のトレーニングされた機械学習システムへの入力として、前記ユーザの前記１つ又は複数の知覚関連属性を使用することを含む、請求項３０に記載の方法。

【請求項32】

１つ又は複数の画像センサによって捕捉されたセンサデータに基づいて、前記ユーザの前記１つ又は複数の知覚関連属性を決定することを更に備え、前記センサデータが、前記ユーザの１つ又は複数の眼の１つ又は複数の画像を含む、請求項３０に記載の方法。

【請求項33】

前記ユーザによる前記仮想コンテンツに対する前記知覚レベルに基づいて、前記ユーザによる前記仮想コンテンツに対する把握レベルを決定することを更に備え、前記知覚レベルに基づいて前記表示設定に対する前記修正を決定することが、前記把握レベルに基づいて前記表示設定に対する前記修正を決定することを含む、請求項３０に記載の方法。

【請求項34】

前記仮想コンテンツの複雑さレベルを決定することを更に備え、前記ユーザによる前記仮想コンテンツに対する前記知覚レベルを決定することが、前記仮想コンテンツの前記複雑さレベルに基づく、請求項３０に記載の方法。

【請求項35】

前記仮想コンテンツの一意性レベルを決定することを更に備え、前記ユーザによる前記仮想コンテンツに対する前記知覚レベルを決定することが、前記仮想コンテンツの前記一意性レベルに基づく、請求項３０に記載の方法。

【発明の詳細な説明】

【技術分野】

【0001】

[0001] 本出願は、画像処理に関する。より具体的には、本出願は、仮想コンテンツに対するユーザの知覚レベルを判定し、仮想コンテンツに対するユーザの判定された知覚レベルに基づいて、仮想コンテンツをユーザに表示するための表示設定を修正するシステム及び方法に関する。

【背景技術】

【0002】

[0002] エクステンデッドリアリティ（extended reality、ＸＲ）デバイスは、例えば、ヘッドマウントディスプレイ（head-mounted display、ＨＭＤ）又は他のデバイスを通して、環境をユーザに表示するデバイスである。環境は、ユーザがいる実世界環境とは少なくとも部分的に異なる。ユーザは、概して、例えば、ＨＭＤ又は他のデバイスを傾けるか又は移動させることによって、自身の環境のビューを対話式に変更することができる。仮想現実（virtual reality、ＶＲ）及び拡張現実（augmented reality、ＡＲ）は、ＸＲの例である。

【0003】

[0003] 場合によっては、ＸＲシステムは、ユーザが、ディスプレイを通過する実世界環境からの光に基づいて、ユーザの実世界環境を見ることを可能にする、光学「シースルー」ディスプレイを含むことができる。場合によっては、ＸＲシステムは、デジタル「パススルー」ディスプレイを含むことができ、デジタル「パススルー」ディスプレイにより、ユーザは、１つ又は複数のカメラによって捕捉されディスプレイに表示された環境のビューに基づいて、ユーザの実世界環境のビュー、又はユーザの実世界環境に基づく仮想環境のビューを見ることを可能にする。光学「シースルー」ＸＲシステム又はデジタル「パススルー」ＸＲシステムは、ユーザが自身の実世界環境において活動に関わっている間、ユーザによって装着することができる。

【0004】

[0004] ＸＲシステムは、環境のユーザのビューの上に仮想コンテンツをオーバーレイすることができる。仮想コンテンツは、ＸＲシステムのユーザに有用な情報を提供することができる。しかしながら、仮想コンテンツが、ユーザの実世界環境におけるユーザの活動に干渉するか又はそれからユーザの気を散らす可能性がある状況がある。一方で、ユーザが、ユーザにとって有用であった可能性のある、警告などの仮想コンテンツに気付かない可能性がある状況がある。

【発明の概要】

【0005】

[0005] いくつかの例では、エクステンデッドリアリティ（ＸＲ）コンテンツ管理のためのシステム及び技法が説明される。いくつかの例では、ＸＲシステムは、仮想コンテンツを、この仮想コンテンツに関連付けられた表示設定に従って、ディスプレイを使用して表示させる。表示設定は、例えば、ディスプレイに表示される仮想コンテンツの位置、向き、及び／若しくはサイズ、並びに／又はディスプレイを介して視認可能な環境の部分に対する仮想コンテンツの位置、向き、及び／若しくはサイズを識別することができる。仮想コンテンツが、ディスプレイによって、例えばシースルーディスプレイ又はパススルーディスプレイを介して表示されるときに、環境がディスプレイを介して視認可能であり得る。撮像システムは、撮像システムのユーザの片眼又は両眼の１つ又は複数の位置属性に基づいて、ユーザによってディスプレイを使用して表示された仮想コンテンツに対する知覚レベルを判定することができる。撮像システムは、ユーザの片眼又は両眼に面した１つ又は複数のカメラなど、ユーザに焦点を合わせられた１つ又は複数のセンサに基づいて位置属性を判定することができる。位置属性は、例えば、眼球位置、眼球運動、瞳孔拡張、サッカード（saccades）、固視、瞬き、眼を細めること、視運動性反射若しくは反応、前庭動眼反射若しくは反応、調節反射若しくは反応、又はそれらの組み合わせを識別することができる。いくつかの例では、撮像システムによる仮想コンテンツに対する知覚レベルの判定は、ユーザによる仮想コンテンツに対する把握レベルの判定を含むことができる。ユーザによる仮想コンテンツに対する把握レベルは、ユーザによる仮想コンテンツに対する知覚レベル、仮想コンテンツの複雑さ、仮想コンテンツの一意性、ユーザに関連付けられた履歴データ、及び／又はコンテキストデータに基づくことができる。撮像システムは、ユーザによる仮想コンテンツに対する知覚レベル及び／又はユーザによる仮想コンテンツに対する把握レベルに基づいて、仮想コンテンツに対応する表示設定に対する修正を決定することができる。表示設定に対する修正により、例えば、仮想コンテンツの表示を非表示にする、消去する、縮小する、顕著性を下げる、優先順位を下げる、又は終了することができる。表示設定に対する修正により、例えば、仮想コンテンツを強調する、拡大する、移動する、再度向き設定する、顕著性を上げる、かつ／又は優先度を上げることができる。

【0006】

[0006] 一例では、画像処理のための装置が提供される。装置は、メモリと、メモリに結合された１つ又は複数のプロセッサ（例えば、回路で実装される）とを含む。１つ又は複数のプロセッサは、仮想コンテンツを、仮想コンテンツに関連付けられた表示設定に従って、ディスプレイを使用して表示させ、仮想コンテンツがディスプレイによって表示されるときに、環境がディスプレイを使用して視認可能であり、ユーザの１つ又は複数の知覚関連属性に基づいて、ユーザによってディスプレイを使用して表示された仮想コンテンツに対する知覚レベルを判定し、ユーザによる仮想コンテンツに対する知覚レベルに基づいて、仮想コンテンツに対応する表示設定に対する修正を決定する、ように構成されており、かつこれらを行うことができる。

【0007】

[0007] 別の例では、画像処理の方法が提供される。方法は、仮想コンテンツを、仮想コンテンツに関連付けられた表示設定に従って、ディスプレイを使用して表示させることであって、仮想コンテンツがディスプレイによって表示されるときに、環境がディスプレイを使用して視認可能である、表示させることと、ユーザの１つ又は複数の知覚関連属性に基づいて、ユーザによってディスプレイを使用して表示された仮想コンテンツに対する知覚レベルを判定することと、ユーザによる仮想コンテンツに対する知覚レベルに基づいて、仮想コンテンツに対応する表示設定に対する修正を決定することと、を含む。

【0008】

[0008] 別の例では、命令を記憶した非一時的コンピュータ可読媒体が提供され、命令は、１つ又は複数のプロセッサによって実行されたときに、１つ又は複数のプロセッサに、仮想コンテンツを、仮想コンテンツに関連付けられた表示設定に従って、ディスプレイを使用して表示させるようにさせ、仮想コンテンツがディスプレイによって表示されるときに、環境がディスプレイを使用して視認可能であり、ユーザの１つ又は複数の知覚関連属性に基づいて、ユーザによってディスプレイを使用して表示された仮想コンテンツに対する知覚レベルを判定させ、ユーザによる仮想コンテンツに対する知覚レベルに基づいて、仮想コンテンツに対応する表示設定に対する修正を決定させる。

【0009】

[0009] 別の例では、画像処理のための装置が提供される。装置は、仮想コンテンツを、仮想コンテンツに関連付けられた表示設定に従って、ディスプレイを使用して表示させるための手段であって、仮想コンテンツがディスプレイによって表示されるときに、環境がディスプレイを使用して視認可能である、表示させるための手段と、ユーザの１つ又は複数の知覚関連属性に基づいて、ユーザによってディスプレイを使用して表示された仮想コンテンツに対する知覚レベルを判定するための手段と、ユーザによる仮想コンテンツに対する知覚レベルに基づいて、仮想コンテンツに対応する表示設定に対する修正を決定するための手段と、を含む。

【0010】

[0010] いくつかの態様では、ユーザの１つ又は複数の知覚関連属性は、ユーザの１つ又は複数の眼に関連付けられている。いくつかの態様では、ユーザの１つ又は複数の知覚関連属性は、ユーザの１つ又は複数の眼の１つ又は複数の属性、ユーザの１つ又は複数の表情の１つ又は複数の属性、及びユーザの１つ又は複数のジェスチャ、のうちの少なくとも１つを含む。

【0011】

[0011] いくつかの態様では、ディスプレイの少なくとも一部分を通過する環境からの光に少なくとも部分的に基づいて、環境が、ディスプレイを使用して視認可能である。いくつかの態様では、環境のビューをディスプレイによって表示させることに少なくとも部分的に基づいて、環境が、ディスプレイを使用して視認可能である。

【0012】

[0012] いくつかの態様では、ユーザによる仮想コンテンツに対する知覚レベルを判定することは、１つ又は複数のトレーニングされた機械学習システムへの入力として、ユーザの１つ又は複数の知覚関連属性を使用することを含む。いくつかの態様では、上記で説明された方法、装置、及びコンピュータ可読媒体は、ユーザインターフェースを通して、ユーザによる仮想コンテンツに対する知覚レベルに対応するフィードバックを受信することと、フィードバックに基づいて、１つ又は複数のトレーニングされた機械学習システムを更新することと、を更に含む。

【0013】

[0013] いくつかの態様では、上記で説明された方法、装置、及びコンピュータ可読媒体は、１つ又は複数のセンサによって捕捉された、ユーザの１つ又は複数の眼を示す、センサデータを受信することと、センサデータに基づいて、ユーザの１つ又は複数の知覚関連属性を判定することと、を更に含む。いくつかの態様では、上記で説明された方法、装置、及びコンピュータ可読媒体は、１つ又は複数のセンサを更に備える。

【0014】

[0014] いくつかの態様では、上記で説明された方法、装置、及びコンピュータ可読媒体は、１つ又は複数の画像センサによって捕捉されたセンサデータに基づいて、ユーザの１つ又は複数の知覚関連属性を判定することを更に含み、センサデータが、ユーザの１つ又は複数の眼の１つ又は複数の画像を含む。

【0015】

[0015] いくつかの態様では、上記で説明された方法、装置、及びコンピュータ可読媒体は、ユーザによる仮想コンテンツに対する知覚レベルに基づいて、ユーザによる仮想コンテンツに対する把握レベルを判定することを更に含み、知覚レベルに基づいて表示設定に対する修正を決定することは、把握レベルに基づいて表示設定に対する修正を決定することを含む。いくつかの態様では、上記で説明された方法、装置、及びコンピュータ可読媒体は、ユーザに関連付けられた履歴情報を受信することを更に含み、ユーザによる仮想コンテンツに対する把握レベルを判定することは、ユーザに関する履歴情報に基づく。

【0016】

[0016] いくつかの態様では、上記で説明された方法、装置、及びコンピュータ可読媒体は、仮想コンテンツの特性を判定することを更に含み、ユーザによる仮想コンテンツに対する知覚レベルを判定することは、仮想コンテンツの特性に基づく。いくつかの態様では、上記で説明された方法、装置、及びコンピュータ可読媒体は、仮想コンテンツの複雑さレベルを判定することを更に含み、ユーザによる仮想コンテンツに対する知覚レベルを判定することは、仮想コンテンツの複雑さレベルに基づく。いくつかの態様では、上記で説明された方法、装置、及びコンピュータ可読媒体は、仮想コンテンツの一意性レベルを判定することを更に含み、ユーザによる仮想コンテンツに対する知覚レベルを判定することは、仮想コンテンツの一意性レベルに基づく。いくつかの態様では、上記で説明された方法、装置、及びコンピュータ可読媒体は、環境に対する仮想コンテンツの独自性レベルを判定することを更に含み、ユーザによる仮想コンテンツに対する知覚レベルを判定することは、環境に対する仮想コンテンツの独自性レベルに基づく。

【0017】

[0017] いくつかの態様では、仮想コンテンツに対応する表示設定に対する修正は、ディスプレイに、仮想コンテンツの少なくとも一部分を表示することを停止させることを含む。いくつかの態様では、仮想コンテンツに対応する表示設定に対する修正は、ディスプレイに、仮想コンテンツの少なくとも一部分を、修正の前よりも顕著に表示させることを含む。いくつかの態様では、仮想コンテンツに対応する表示設定に対する修正は、仮想コンテンツの１つ又は複数の特性に対する修正を含み、１つ又は複数の特性は、位置、向き、深度、サイズ、色、フォントサイズ、フォント色、フォント、言語、及びレイアウトのうちの少なくとも１つを含む。

【0018】

[0018] いくつかの態様では、ユーザによる仮想コンテンツに対する知覚レベルを判定することは、ユーザが仮想コンテンツを知覚したと判定することを含む。いくつかの態様では、ユーザによる仮想コンテンツに対する知覚レベルを判定することは、ユーザが仮想コンテンツを知覚していないと判定することを含む。いくつかの態様では、ユーザによる仮想コンテンツに対する知覚レベルを判定することは、ユーザが複数の知覚レベルのうちの第１の知覚レベルまで仮想コンテンツを知覚したと判定することを含む。いくつかの態様では、ユーザによる仮想コンテンツに対する知覚レベルを判定することは、ユーザが複数の知覚レベルのうちの第２の知覚レベルまで仮想コンテンツを知覚したと判定することを含む。

【0019】

[0019] いくつかの態様では、表示設定に対する修正は、仮想コンテンツが閾値時間内にユーザによって再視認される尤度に基づく。

【0020】

[0020] いくつかの態様では、ユーザによる仮想コンテンツに対する知覚レベルを判定することは、ユーザによる仮想コンテンツに対する知覚レベルに対応する信頼レベルを判定することを含み、表示設定に対する修正は、信頼レベルに基づく。

【0021】

[0021] いくつかの態様では、ユーザの１つ又は複数の知覚関連属性は、仮想コンテンツに対するユーザの１つ又は複数の眼の１つ又は複数の眼球位置を含む。いくつかの態様では、ユーザの１つ又は複数の知覚関連属性は、ユーザの１つ又は複数の眼による１回又は複数回のサッカードの１つ又は複数の特性を含み、１つ又は複数の特性は、頻度、持続時間、タイミング、サッカード速度、サッカード振幅、眼球位置、及び眼球運動のうちの少なくとも１つを含む。いくつかの態様では、ユーザの１つ又は複数の知覚関連属性は、ユーザの１つ又は複数の眼による１回又は複数回の固視の１つ又は複数の特性を含み、１つ又は複数の特性は、頻度、持続時間、タイミング、眼球位置、及び眼球運動のうちの少なくとも１つを含む。いくつかの態様では、ユーザの１つ又は複数の知覚関連属性は、ユーザの１つ又は複数の眼による１回又は複数回の瞳孔拡張の１つ又は複数の特性を含み、１つ又は複数の特性は、頻度、持続時間、タイミング、瞳孔拡張レベル、眼球位置、及び眼球運動のうちの少なくとも１つを含む。いくつかの態様では、ユーザの１つ又は複数の知覚関連属性は、ユーザの１つ又は複数の瞼による１回又は複数回の瞬きの１つ又は複数の特性を含み、１つ又は複数の特性は、頻度、持続時間、タイミング、瞬き速度、眼球位置、及び眼球運動のうちの少なくとも１つを含む。いくつかの態様では、ユーザの１つ又は複数の知覚関連属性は、ユーザの１つ又は複数の瞼による１回又は複数回の眼を細めることの１つ又は複数の特性を含み、１つ又は複数の特性は、頻度、持続時間、タイミング、眼を細めるレベル、眼球位置、及び眼球運動のうちの少なくとも１つを含む。

【0022】

[0022] いくつかの態様では、上記で説明された方法、装置、及びコンピュータ可読媒体は、ユーザによる文字列の読解の程度を、仮想コンテンツに対する知覚レベルと文字列の長さとに基づいて判定することを更に含み、仮想コンテンツは、文字列を含む。

【0023】

[0023] いくつかの態様では、上記で説明された方法、装置、及びコンピュータ可読媒体は、ディスプレイを更に備える。

【0024】

[0024] いくつかの態様では、上記で説明された方法、装置、及びコンピュータ可読媒体は、ユーザの１つ又は複数の眼の表現を含むセンサデータに少なくとも部分的に基づいて、ユーザの１つ又は複数の知覚関連属性のうちの少なくとも１つを判定することを更に含み、１つ又は複数のセンサは、センサデータを捕捉するように構成されている。

【0025】

[0025] いくつかの態様では、ユーザによる仮想コンテンツに対する知覚レベルを判定することは、ユーザの１つ又は複数の知覚関連属性に基づいて、ユーザによる仮想コンテンツに対する把握レベルを判定することを含む。いくつかの態様では、ユーザによる仮想コンテンツに対する把握レベルを判定することは、ユーザの１つ又は複数の知覚関連属性と、仮想コンテンツの１つ又は複数の特性、コンテキストデータ、及びユーザのユーザプロファイルのうちの少なくとも１つと、に基づく。いくつかの態様では、ユーザプロファイルは、ユーザに関連付けられた履歴データを含む。いくつかの態様では、コンテキストデータは、仮想コンテンツに対するユーザによる１つ又は複数の反応を含む。いくつかの態様では、コンテキストデータは、ＸＲシステムのロケーションを含む。

【0026】

[0026] いくつかの態様では、装置は、ウェアラブルデバイス、エクステンデッドリアリティデバイス（例えば、仮想現実（ＶＲ）デバイス、拡張現実（ＡＲ）デバイス、又は複合現実（mixed reality、ＭＲ）デバイス）、ヘッドマウントディスプレイ（ＨＭＤ）デバイス、ワイヤレス通信デバイス、モバイルデバイス（例えば、携帯電話及び／若しくは携帯ハンドセット並びに／又はいわゆる「スマートフォン」又は他のモバイルデバイス）、カメラ、パーソナルコンピュータ、ラップトップコンピュータ、サーバコンピュータ、車両若しくは車両のコンピューティングデバイス若しくは構成要素、別のデバイス、あるいはそれらの組み合わせであり、それらの一部であり、かつ／又はそれらを含む。いくつかの態様では、装置は、１つ又は複数の画像を捕捉するための１つのカメラ又は複数のカメラを含む。いくつかの態様では、装置は、１つ又は複数の画像、通知、及び／又は他の表示可能なデータを表示するためのディスプレイを更に含む。いくつかの態様では、上記で説明された装置は、１つ又は複数のセンサ（例えば、１つ又は複数のジャイロスコープ、１つ又は複数のジャイロメータ、１つ又は複数の加速度計、それらの任意の組み合わせ、及び／又は他のセンサなどの、１つ又は複数の慣性測定ユニット（inertial measurement units、ＩＭＵｓ）を含み得る。

【0027】

[0027] 本概要では、特許請求される主題の主要な又は必須の特徴を特定することは意図されず、特許請求される主題の範囲を決定するために独立して使用されることも意図されない。本主題は、この特許の明細書全体、いずれか又は全ての図面、及び各請求項の適切な部分を参照することによって理解されるはずである。

【0028】

[0028] 上記のことは、他の特徴及び実施形態とともに、以下の明細書、特許請求の範囲、及び添付図面を参照すると、より明らかになろう。

【図面の簡単な説明】

【0029】

[0029] 本出願の例示的な実施形態について、以下の図面を参照して以下で詳細に説明する。

【図1】[0030] いくつかの例による、画像捕捉及び処理システムの例示的なアーキテクチャを示すブロック図である。

【図2】[0031] いくつかの例による、ディスプレイを視認しているユーザによってディスプレイを使用して表示された仮想コンテンツに対する知覚レベル及び／又は把握レベルを判定するためのプロセスを実施するエクステンデッドリアリティ（ＸＲ）システムの、例示的なアーキテクチャを示すブロック図である。

【図3A】[0032] いくつかの例による、エクステンデッドリアリティ（ＸＲ）システムとして使用されるヘッドマウントディスプレイ（ＨＭＤ）を示す斜視図である。

【図3B】[0033] いくつかの例による、ユーザによって装着されている図３Ａのヘッドマウントディスプレイ（ＨＭＤ）を示す斜視図である。

【図4A】[0034] いくつかの例による、前向きカメラを含み、エクステンデッドリアリティ（ＸＲ）システムとして使用することができるモバイルハンドセットの前面を示す斜視図である。

【図4B】[0035] いくつかの例による、後ろ向きカメラを含み、エクステンデッドリアリティ（ＸＲ）システムとして使用することができるモバイルハンドセットの背面を示す斜視図である。

【図5A】[0036] いくつかの例による、表示設定に従って表示される仮想コンテンツのオーバーレイ前及びオーバーレイ後の、ボストンの環境の画像を示す概念図である。

【図5B】[0037] いくつかの例による、表示設定に対する修正前及び修正後に仮想コンテンツがオーバーレイされた状態の、ボストンの環境の画像を示す概念図である。

【図6】[0038] いくつかの例による、表示設定に従って表示される仮想コンテンツのオーバーレイ前及びオーバーレイ後の、本を含む画像を示す概念図である。

【図7】[0039] いくつかの例による、表示設定に従って表示される仮想コンテンツのオーバーレイ前及びオーバーレイ後の、街路の環境の画像を示す概念図である。

【図8】[0040] いくつかの例による、１つ又は複数のトレーニングされた機械学習（machine learning、ＭＬ）モデルに基づいて仮想コンテンツに対する知覚レベル及び把握レベルを判定するためのプロセスを示すブロック図である。

【図9】[0041] いくつかの例による、エクステンデッドリアリティコンテンツを視認しているユーザの分析のために、トレーニングされた機械学習システムによって使用され得るニューラルネットワークの一例を示すブロック図である。

【図10】[0042] いくつかの例による、エクステンデッドリアリティ（ＸＲ）表示動作のためのプロセスを示すフロー図である。

【図11】[0043] 本明細書で説明される特定の態様を実装するためのコンピューティングシステムの一例を示す図である。

【発明を実施するための形態】

【0030】

[0044] 本開示の特定の態様及び実施形態が、以下で提供される。当業者に明らかになるように、これらの態様及び実施形態のうちのいくつかが独立して適用されてもよく、それらのうちのいくつかは組み合わせて適用されてもよい。以下の説明では、説明目的で、本出願の実施形態の完全な理解をもたらすために具体的な詳細が記載される。しかしながら、様々な実施形態がこれらの具体的な詳細なしに実践され得ることは明らかであろう。図及び説明は限定的であることが意図されていない。

【0031】

[0045] 以下の説明は、例示的な実施形態を提供するにすぎず、本開示の範囲、適用可能性、又は構成を限定することを意図しない。むしろ、例示的な実施形態の以下の説明は、例示的な実施形態を実装することを可能にする説明を当業者に提供する。添付の特許請求の範囲に記載されるような本出願の趣旨及び範囲から逸脱することなく、要素の機能及び構成において様々な変更が加えられてよいことを理解されたい。

【0032】

[0046] カメラは、画像センサを使用して、光を受け入れるとともに静止画像又はビデオフレームなどの画像フレームを捕捉するデバイスである。「画像」、「画像フレーム」、及び「フレーム」という用語は、本明細書では互換的に使用される。カメラは、様々な画像捕捉及び画像処理設定を用いて構成され得る。異なる設定は、外観の異なる画像をもたらす。ＩＳＯ、露光時間、開口サイズ、ｆ／ストップ、シャッタ速度、焦点、及び利得などのいくつかのカメラ設定は、１つ又は複数の画像フレームの捕捉の前又はその間に決定されて適用される。例えば、設定又はパラメータは、１つ又は複数の画像フレームを捕捉するための画像センサに適用され得る。コントラスト、明るさ、飽和度、鮮明さ、レベル、曲線、又は色の変更などの他のカメラ設定は、１つ又は複数の画像フレームの後処理を構成し得る。例えば、設定又はパラメータは、画像センサによって捕捉された１つ又は複数の画像フレームを処理するためのプロセッサ（例えば、画像信号プロセッサ又はＩＳＰ）に適用され得る。

【0033】

[0047] エクステンデッドリアリティ（ＸＲ）システム又はデバイスは、仮想コンテンツをユーザに提供することができ、かつ／又は物理環境（場面）の実世界ビューと（仮想コンテンツを含む）仮想環境とを組み合わせることができる。ＸＲシステムは、そのような組み合わされたＸＲ環境とのユーザ対話を容易にする。実世界ビューは、実世界オブジェクト（物理的オブジェクトとも呼ばれる）、例えば人、車両、建物、テーブル、椅子、及び／又は他の実世界オブジェクト若しくは物理的オブジェクトなどを含むことができる。ＸＲシステム又はデバイスは、異なるタイプのＸＲ環境との対話を容易にすることができる（例えば、ユーザは、ＸＲ環境と対話するためにＸＲシステム又はデバイスを使用することができる）。ＸＲシステムは、仮想現実（ＶＲ）環境との対話を容易にするＶＲシステム、拡張現実（ＡＲ）環境との対話を容易にするＡＲシステム、複合現実（ＭＲ）環境との対話を容易にするＭＲシステム、及び／又は他のＸＲシステムを含むことができる。ＸＲシステム又はデバイスの例は、特に、ヘッドマウントディスプレイ（ＨＭＤ）、スマートグラスを含む。場合によっては、ＸＲデバイスは、ユーザが仮想コンテンツのアイテムと対話することを可能にするために、ユーザの部分（例えば、ユーザの手及び／又は指先）を追跡することができる。

【0034】

[0048] 拡張現実（ＡＲ）システム、仮想現実（ＶＲ）システム、及び／又は複合現実（ＭＲ）システムなどのエクステンデッドリアリティ（ＸＲ）システムのためのコンテンツ理解及び実世界エンゲージメントを最適化するためのシステム及び技法について本明細書で説明される。ＸＲシステムは、例えば、ＨＭＤ、ＡＲ眼鏡、車両内のヘッドアップディスプレイ、モバイルハンドセット、並びに他のタイプのデバイス及びシステムを含むことができる。

【0035】

[0049] 場合によっては、ＸＲシステムは、光学「シースルー」又はデジタル「パススルー」ディスプレイ（例えば、シースルー又はパススルーＡＲＨＭＤ又はＡＲ眼鏡）を含むことができ、ＸＲシステムが、ビデオコンテンツを表示することなく、ＸＲコンテンツ（例えば、ＡＲコンテンツ）を実世界ビュー上に直接表示することを可能にする。例えば、ユーザは、ディスプレイ（例えば、眼鏡又はレンズ）を通して物理的オブジェクトを視認し得、ＡＲシステムは、ＡＲコンテンツをディスプレイ上に表示し、１つ又は複数の実世界オブジェクトの強化された視知覚をユーザに提供することができる。一例では、光学シースルーＡＲシステムのディスプレイは、各眼の前にレンズ若しくはガラス（又は両眼にわたる単一のレンズ若しくはガラス）を含むことができる。シースルーディスプレイは、ユーザが実世界オブジェクト又は物理的オブジェクトを直接見ることを可能にすることができ、かつそのオブジェクト又は追加のＡＲコンテンツの（例えば、投影された若しくは別様に表示された）強化された画像を表示することができる。これにより、実世界のユーザの視知覚を拡張することが可能となる。

【0036】

[0050] 光学シースルーＸＲシステム又はデジタルパススルーＸＲシステムは、（ユーザが仮想コンテンツに没入し、実世界が完全に遮蔽されるＶＲとは対照的に）ユーザが実世界に関わっている間に装着することができる。スマートフォン、ＰＣ、及び他のコンピューティングデバイスとは異なり、ヘッドマウントＸＲデバイス（例えば、スマートグラス、ＨＭＤなど）は、顔に装着され、したがってユーザの視覚及び聴覚の感覚チャネルを仲介する。このため、ヘッドマウントＸＲデバイス上でコンテンツを提示することが、ユーザがユーザの周囲と効果的に対話してユーザの周囲を認識する能力に干渉するか又はそれからユーザの気を散らす可能性がある場合がある。

【0037】

[0051] ＸＲシステムを動作させるためのＸＲシステム及び技法が本明細書で説明される。いくつかの例では、ＸＲシステムなどの撮像システムは、仮想コンテンツを、この仮想コンテンツに関連付けられた表示設定に従ってディスプレイを使用して表示させる。表示設定は、例えば、ディスプレイに表示される仮想コンテンツの位置、向き、サイズ、色、及び／若しくはレイアウト、並びに／又はディスプレイを介して視認可能な環境の部分に対する仮想コンテンツの位置、向き、サイズ、色、及び／若しくはレイアウトを識別することができる。環境は、仮想コンテンツが、ディスプレイによって、例えばシースルーディスプレイ又はパススルーディスプレイを介して表示されるときに、ディスプレイを介して視認することができる。撮像システムは、撮像システムのユーザの片眼又は両眼の１つ又は複数の属性に基づいて、ユーザの片眼又は両眼を通して、ユーザによってディスプレイを使用して表示された仮想コンテンツに対する知覚レベルを判定することができる。撮像システムは、ユーザの片眼又は両眼に面した１つ又は複数のカメラなど、ユーザに焦点を合わせられた１つ又は複数のセンサに基づいて属性を判定することができる。眼の位置属性は、例えば、眼球位置、眼球運動、瞳孔拡張、サッカード、固視、瞬き、眼を細めること、視運動反射若しくは反応、前庭動眼反射若しくは反応、調節反射若しくは反応、本明細書で説明される眼及び／若しくは瞼に関連する他の属性、又はそれらの組み合わせを識別することができる。仮想コンテンツに対する知覚レベルは、例えば、ユーザがコンテンツを知覚したか否かを識別することができ、いくつかの事例では、ユーザがコンテンツをどれだけよく知覚したかを更に識別することができる。いくつかの例では、撮像システムによる仮想コンテンツに対する知覚レベルの判定は、ユーザによる仮想コンテンツに対する把握レベルの判定を含むことができる。ユーザによる仮想コンテンツに対する把握レベルは、ユーザによる仮想コンテンツに対する知覚レベル、仮想コンテンツの１つ又は複数の特性、ユーザのユーザプロファイル、コンテキストデータ、又はそれらの組み合わせに基づくことができる。仮想コンテンツの１つ又は複数の特性は、仮想コンテンツの複雑さ、仮想コンテンツの一意性、ディスプレイを介して視認可能な環境に対する仮想コンテンツの独自性、及び／又は同様のものを含み得る。ユーザのユーザプロファイルは、ユーザ及び／又はユーザの現在の能力に関連付けられた履歴データを含み得る。撮像システムは、ユーザによる仮想コンテンツに対する知覚レベル及び／又は仮想コンテンツに対する把握レベルに基づいて、仮想コンテンツに対応する表示設定に対する修正を決定することができる。表示設定に対する修正により、例えば、仮想コンテンツの表示を非表示にする、消去する、縮小する、顕著性を下げる、優先順位を下げる、又は終了することができる。表示設定に対する修正により、例えば、仮想コンテンツを強調する、拡大する、移動する、再度向き設定する、顕著性を上げる、かつ／又は優先度を上げることができる。

【0038】

[0052] 本明細書で説明されるＸＲシステム及び技法は、概して、従来のＸＲ技術及びディスプレイ技術に勝る多数の技術的利点及び利益を提供する。例えば、本明細書で説明されるＸＲシステム及び技法は、ユーザのアクション、知覚、及び／又は把握の検出に基づいて、ユーザへの仮想コンテンツ表示を含む、ユーザへのＸＲコンテンツ提示のカスタマイズを提供する。例えば、ユーザへの仮想コンテンツ表示は、仮想コンテンツの分析（例えば、仮想コンテンツの複雑さ、仮想コンテンツの一意性、及び環境に対する仮想コンテンツの独自性）、（例えば、教育及び職業及び以前のアクションなどの履歴データに基づく）ユーザ自身の分析、並びに／又はコンテキストの分析に基づく、仮想コンテンツに対するユーザの知覚レベル及び／若しくは把握レベルの分析に基づいてカスタマイズされる。本明細書で説明されるＸＲシステム及び技法は、特定の仮想コンテンツを他の仮想コンテンツ及び／又は環境のビューよりも優先することによって、限られたディスプレイ面積の使用を最適化する。例えば、本明細書で説明されるＸＲシステム及び技法は、重要な仮想コンテンツ、例えば差し迫った危険をユーザに警告するコンテンツなどを最適化して強調し、あまり重要でない仮想コンテンツ、例えばユーザがすでに見た、かつ／又は閉じたコンテンツなどを最小化若しくは非表示にする。本明細書で説明されるＸＲシステム及び技法は、ユーザが運転、料理、又は手術などの極めて重要で潜在的に危険なタスクに集中する必要があるときに仮想コンテンツによる注意散漫を低減し、代わりに、ユーザが極めて重要なタスクを実施するのを助ける仮想コンテンツを強調することによって、ＸＲ技術の安全性を改善する。本明細書で説明されるＸＲシステム及び技法は、ユーザが仮想コンテンツをすでに知覚及び／又は把握していることに基づいて仮想コンテンツをインテリジェントに非表示にしない又は閉じないシステムと比較して、表示される仮想コンテンツの量、及び／又は仮想コンテンツが表示される持続時間を低減することによって、ＸＲシステム効率を改善する。これらの効率利得は、ディスプレイへの、かつディスプレイからの帯域幅使用量若しくはデータの低減、ディスプレイによる電力使用量の低減、ディスプレイ及び／若しくはプロセッサ及び／若しくは関連構成要素によって生成される熱の低減、ディスプレイ及び／若しくはプロセッサ及び／若しくは関連構成要素に必要とされる熱放散の低減、又はそれらの組み合わせを含む。

【0039】

[0053] 適用例の様々な態様が、図に関して説明される。図１は、画像捕捉及び処理システム１００のアーキテクチャを示すブロック図である。画像捕捉及び処理システム１００は、１つ又は複数の場面の画像（例えば、場面１１０の画像）を捕捉して処理するために使用される様々な構成要素を含む。画像捕捉及び処理システム１００は、スタンドアロン画像（又は写真）を捕捉することができ、かつ／又は、特定の順序で複数の画像（又はビデオフレーム）を含むビデオを捕捉することができる。システム１００のレンズ１１５は、場面１１０に面し、場面１１０から光を受け入れる。レンズ１１５は、画像センサ１３０に向かって光を曲げる。レンズ１１５によって受けられた光は、１つ又は複数の制御機構１２０によって制御される開口を通過し、画像センサ１３０によって受けられる。いくつかの例では、場面１１０は、図２の環境対面センサ２１０が面している環境などの環境内の場面である。いくつかの例では、場面１１０は、図２のユーザ対面センサ２０５が面しているユーザなどのユーザの少なくとも一部分の場面である。例えば、場面１１０は、ユーザの眼の一方若しくは両方、及び／又はユーザの顔の少なくとも一部分の場面であり得る。

【0040】

[0054] １つ又は複数の制御機構１２０は、画像センサ１３０からの情報に基づいて、かつ／又は画像プロセッサ１５０からの情報に基づいて、露光、焦点、及び／又はズームを制御し得る。１つ又は複数の制御機構１２０は、複数の機構及び構成要素を含み得る。例えば、制御機構１２０は、１つ又は複数の露光制御機構１２５Ａ、１つ又は複数の焦点制御機構１２５Ｂ、及び／又は１つ又は複数のズーム制御機構１２５Ｃを含み得る。１つ又は複数の制御機構１２０は、アナログ利得、フラッシュ、ＨＤＲ、被写界深度、及び／又は他の画像捕捉性質を制御する制御機構などの、示されるもの以外の追加の制御機構を含んでもよい。

【0041】

[0055] 制御機構１２０の焦点制御機構１２５Ｂは、焦点設定を取得することができる。いくつかの例では、焦点制御機構１２５Ｂは、メモリレジスタ内に焦点設定を記憶する。焦点設定に基づいて、焦点制御機構１２５Ｂは、画像センサ１３０の位置に対してレンズ１１５の位置を調整することができる。例えば、焦点設定に基づいて、焦点制御機構１２５Ｂは、モータ又はサーボを作動させることによって画像センサ１３０のより近く又は画像センサ１３０からより遠くにレンズ１１５を動かし、それによって、焦点を調整することができる。場合によっては、画像センサ１３０の各フォトダイオードの上方の１つ又は複数のマイクロレンズなどの追加のレンズがシステム１００の中に含まれてよく、それらは各々、光がフォトダイオードに到達する前に、レンズ１１５から受けられる光を対応するフォトダイオードに向かって曲げる。焦点設定は、コントラスト検出自動焦点（contrast detection autofocus、ＣＤＡＦ）、位相検出自動焦点（ＰＤＡＦ）、又はそれらの何らかの組み合わせを介して決定されてよい。焦点設定は、制御機構１２０、画像センサ１３０、及び／又は画像プロセッサ１５０を使用して決定されてよい。焦点設定は、画像捕捉設定及び／又は画像処理設定と呼ばれることがある。

【0042】

[0056] 制御機構１２０の露光制御機構１２５Ａは、露光設定を取得することができる。場合によっては、露光制御機構１２５Ａは、メモリレジスタ内に露光設定を記憶する。この露光設定に基づいて、露光制御機構１２５Ａは、開口のサイズ（例えば、開口サイズ又はｆ／ストップ）、開口が開放されている持続時間（例えば、露光時間又はシャッタ速度）、画像センサ１３０の感度（例えば、ＩＳＯ速度又はフィルム速度）、画像センサ１３０によって適用されるアナログ利得、又はそれらの任意の組み合わせを制御することができる。露光設定は、画像捕捉設定及び／又は画像処理設定と呼ばれることがある。

【0043】

[0057] 制御機構１２０のズーム制御機構１２５Ｃは、ズーム設定を取得することができる。いくつかの例では、ズーム制御機構１２５Ｃは、メモリレジスタ内にズーム設定を記憶する。ズーム設定に基づいて、ズーム制御機構１２５Ｃは、レンズ１１５及び１つ又は複数の追加のレンズを含むレンズ要素の組立体（レンズ組立体）の焦点距離を制御することができる。例えば、ズーム制御機構１２５Ｃは、１つ又は複数のモータ又はサーボを作動させてレンズのうちの１つ又は複数を互いに対して移動させることによって、レンズ組立体の焦点距離を制御することができる。ズーム設定は、画像捕捉設定及び／又は画像処理設定と呼ばれることがある。いくつかの例では、レンズ組立体は、同焦点ズームレンズ又は可変焦点ズームレンズを含んでよい。いくつかの例では、レンズ組立体は、場面１１０から光を最初に受け入れる（場合によっては、レンズ１１５であり得る）集束レンズを含んでよく、次いで、光が画像センサ１３０に到達する前に、集束レンズ（例えば、レンズ１１５）と画像センサ１３０との間の無限焦点ズームシステムを光が通過する。場合によっては、無限焦点ズームシステムは、等しいか又は類似の焦点距離（例えば、閾値差内）の２つの正の（例えば、収束、凸）レンズを、それらの間の負の（例えば、発散、凹）レンズとともに含んでよい。場合によっては、ズーム制御機構１２５Ｃは、負のレンズ、及び正のレンズのうちの一方又は両方などの、無限焦点ズームシステムの中のレンズのうちの１つ以上を動かす。

【0044】

[0058] 画像センサ１３０は、フォトダイオード又は他の感光素子の１つ又は複数のアレイを含む。各フォトダイオードは、画像センサ１３０によって生み出される画像の中の特定の画素に最終的には対応する光の量を測定する。場合によっては、異なるフォトダイオードは、異なるカラーフィルタによって覆われてよく、したがって、フォトダイオードを覆うフィルタの色に整合する光を測定してよい。例えば、ベイヤーカラーフィルタは、赤のカラーフィルタ、青のカラーフィルタ、及び緑のカラーフィルタを含み、画像の各画素は、赤のカラーフィルタで覆われる少なくとも１つのフォトダイオードからの赤い光のデータ、青のカラーフィルタで覆われる少なくとも１つのフォトダイオードからの青い光のデータ、及び緑のカラーフィルタで覆われる少なくとも１つのフォトダイオードからの緑色の光のデータに基づいて生成される。他のタイプの色フィルタは、赤色、青色、及び／又は緑色フィルタの代わりに、又はそれらに加えて、黄色、マゼンダ、及び／又はシアン（「エメラルド」とも呼ばれる）色フィルタを使用してよい。いくつかの画像センサは、カラーフィルタが完全になくてよく、代わりに、ピクセルアレイ全体にわたって（場合によっては、垂直方向に積層された）異なるフォトダイオードを使用してもよい。ピクセルアレイ全体にわたる異なるフォトダイオードは、異なるスペクトル感度曲線を有することができ、したがって、光の異なる波長に応答する。モノクロ画像センサも色フィルタがなくてよく、したがって、色深度もなくてよい。

【0045】

[0059] 場合によっては、画像センサ１３０は、代替又は追加として、ある時間において、かつ／又はいくつかの角度から、いくつかのフォトダイオード又はいくつかのフォトダイオードの部分に光が到達するのを阻止する不透明なかつ／又は反射性のマスクを含んでよく、それは位相検出自動焦点（ＰＤＡＦ）のために使用されてよい。画像センサ１３０はまた、フォトダイオードによって出力されたアナログ信号を増幅するためのアナログゲイン増幅器、並びに／又は、フォトダイオードから出力された（及び／若しくはアナログゲイン増幅器によって増幅された）アナログ信号をデジタル信号に変換するためのアナログデジタル変換器（ＡＤＣ）を含んでよい。場合によっては、その代わりに又は追加として、制御機構１２０のうちの１つ以上に関して論じるいくつかの構成要素又は機能が画像センサ１３０内に含まれてよい。画像センサ１３０は、電荷結合デバイス（charge-coupled device、ＣＣＤ）センサ、電子増倍ＣＣＤ（electron-multiplying CCD、ＥＭＣＣＤ）センサ、アクティブ画素センサ（active-pixel sensor、ＡＰＳ）、相補型金属酸化物半導体（complimentary metal-oxide semiconductor、ＣＭＯＳ）、Ｎ型金属酸化物半導体（N-type metal-oxide-semiconductor、ＮＭＯＳ）、ハイブリッドＣＣＤ／ＣＭＯＳセンサ（例えば、ｓＣＭＯＳ）、又はそれらの何らかの他の組み合わせであってよい。

【0046】

[0060] 画像プロセッサ１５０は、１つ又は複数の画像信号プロセッサ（image signal processors、ＩＳＰ）（ＩＳＰ１５４を含む）、１つ又は複数のホストプロセッサ（ホストプロセッサ１５２を含む）、及び／又はコンピューティングシステム１１００に関して論じる任意の他のタイプのプロセッサ１１１０のうちの１つ又は複数などの、１つ又は複数のプロセッサを含んでよい。ホストプロセッサ１５２は、デジタル信号プロセッサ（digital signal processor、ＤＳＰ）及び／又は他のタイプのプロセッサであり得る。いくつかの実装形態では、画像プロセッサ１５０は、ホストプロセッサ１５２及びＩＳＰ１５４を含む単一の集積回路又はチップ（例えば、システムオンチップ又はＳｏＣと呼ばれる）である。場合によっては、チップは、１つ又は複数の入力／出力ポート（例えば、入力／出力（input/output、Ｉ／Ｏ）ポート１５６）、中央処理ユニット（central processing units、ＣＰＵ）、グラフィックス処理ユニット（graphics processing units、ＧＰＵ）、ブロードバンドモデム（例えば、３Ｇ、４Ｇ又はＬＴＥ（登録商標）、５Ｇなど）、メモリ、接続性構成要素（例えば、Ｂｌｕｅｔｏｏｔｈ（登録商標）、全地球測位システム（Global Positioning System、ＧＰＳ）など）、それらの任意の組み合わせ、及び／又は他の構成要素を含んでもよい。Ｉ／Ｏポート１５６は、インターインテグレーテッドサーキット２（Inter-Integrated Circuit 2、Ｉ２Ｃ）インターフェース、インターインテグレーテッドサーキット３（Inter-Integrated Circuit 3、Ｉ３Ｃ）インターフェース、シリアル周辺インターフェース（Serial Peripheral Interface、ＳＰＩ）インターフェース、シリアル汎用入力／出力（General Purpose Input/Output、ＧＰＩＯ）インターフェース、モバイルインダストリプロセッサインターフェース（Mobile Industry Processor Interface、ＭＩＰＩ）（例えば、ＭＩＰＩＣＳＩ－２物理（physical、ＰＨＹ）層ポート若しくはインターフェースなど）、高度高性能バス（Advanced High-performance Bus、ＡＨＢ）バス、それらの任意の組み合わせ、及び／又は他の入力／出力ポートなどの、１つ又は複数のプロトコル又は仕様による、任意の好適な入力／出力ポート又はインターフェースを含み得る。１つの例示的な例では、ホストプロセッサ１５２は、Ｉ２Ｃポートを使用して画像センサ１３０と通信することができ、ＩＳＰ１５４は、ＭＩＰＩポートを使用して画像センサ１３０と通信することができる。

【0047】

[0061] 画像プロセッサ１５０は、デモザイク処理、色空間変換、画像フレームダウンサンプリング、画素補間、自動露光（automatic exposure、ＡＥ）制御、自動利得制御（automatic gain control、ＡＧＣ）、ＣＤＡＦ、ＰＤＡＦ、自動ホワイトバランス、ＨＤＲ画像を形成するための画像フレームの統合、画像認識、対象物認識、特徴認識、入力の受け入れ、出力の管理、メモリの管理、又はそれらの何らかの組み合わせなどの、いくつかのタスクを実施してもよい。画像プロセッサ１５０は、画像フレーム及び／又は処理された画像を、ランダムアクセスメモリ（random access memory、ＲＡＭ）１４０及び／若しくは１１２０、読取り専用メモリ（read-only memory、ＲＯＭ）１４５及び／若しくは１１２５、キャッシュ、メモリユニット、別の記憶デバイス、又はそれらの何らかの組み合わせに記憶してもよい。

【0048】

[0062] 様々な入力／出力（Ｉ／Ｏ）デバイス１６０が、画像プロセッサ１５０に接続されてよい。Ｉ／Ｏデバイス１６０は、ディスプレイスクリーン、キーボード、キーパッド、タッチスクリーン、トラックパッド、タッチ感知面、プリンタ、任意の他の出力デバイス１１３５、任意の他の入力デバイス１１４５、又はそれらの何らかの組み合わせを含んでもよい。場合によっては、Ｉ／Ｏデバイス１６０の物理キーボード若しくはキーパッドを通じて、又はＩ／Ｏデバイス１６０のタッチスクリーンの仮想キーボード若しくはキーパッドを通じて、キャプションが画像処理デバイス１０５Ｂに入力されてもよい。Ｉ／Ｏ１６０は、システム１００と１つ又は複数の周辺デバイスとの間の有線接続を可能にする、１つ又は複数のポート、ジャック、又は他のコネクタを含んでよく、システム１００は、それを介して、１つ又は複数の周辺デバイスからデータを受信してよく、かつ／又は１つ又は複数の周辺デバイスへデータを送信してよい。Ｉ／Ｏ１６０は、システム１００と１つ又は複数の周辺デバイスとの間のワイヤレス接続を可能にする、１つ又は複数のワイヤレストランシーバを含んでよく、システム１００は、それを介して、１つ又は複数の周辺デバイスからデータを受信してよく、かつ／又は１つ又は複数の周辺デバイスへデータを送信してよい。周辺デバイスは、前に説明したタイプのＩ／Ｏデバイス１６０のうちのいずれかを含んでよく、ポート、ジャック、ワイヤレストランシーバ、又は他の有線及び／若しくはワイヤレスのコネクタに結合されると、それら自体がＩ／Ｏデバイス１６０とみなされてよい。

【0049】

[0063] 場合によっては、画像捕捉及び処理システム１００は、単一のデバイスであってもよい。場合によっては、画像捕捉及び処理システム１００は、画像捕捉デバイス１０５Ａ（例えば、カメラ）及び画像処理デバイス１０５Ｂ（例えば、カメラに結合されたコンピューティングデバイス）を含む、２つ以上の別々のデバイスであってもよい。いくつかの実装形態では、画像捕捉デバイス１０５Ａ及び画像処理デバイス１０５Ｂは、例えば、１つ又は複数のワイヤ、ケーブル、若しくは他の電気的なコネクタを介して、かつ／又は１つ又は複数のワイヤレストランシーバを介してワイヤレスに、結合されてよい。いくつかの実装形態では、画像捕捉デバイス１０５Ａ及び画像処理デバイス１０５Ｂは、互いから切り離されていてよい。

【0050】

[0064] 図１に示すように、垂直の破線は、図１の画像捕捉及び処理システム１００を、画像捕捉デバイス１０５Ａ及び画像処理デバイス１０５Ｂをそれぞれ表す２つの部分へと分割する。画像捕捉デバイス１０５Ａは、レンズ１１５と、制御機構１２０と、画像センサ１３０とを含む。画像処理デバイス１０５Ｂは、画像プロセッサ１５０（ＩＳＰ１５４及びホストプロセッサ１５２を含む）と、ＲＡＭ１４０と、ＲＯＭ１４５と、Ｉ／Ｏ１６０とを含む。場合によっては、ＩＳＰ１５４及び／又はホストプロセッサ１５２などの、画像捕捉デバイス１０５Ａに示すいくつかの構成要素は、画像捕捉デバイス１０５Ａの中に含まれてよい。

【0051】

[0065] 画像捕捉及び処理システム１００は、モバイル若しくは固定の電話ハンドセット（例えば、スマートフォン、携帯電話など）、デスクトップコンピュータ、ラップトップ若しくはノートブックコンピュータ、タブレットコンピュータ、セットトップボックス、テレビ、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲーミングコンソール、ビデオストリーミングデバイス、インターネットプロトコル（Internet Protocol、ＩＰ）カメラ、又は任意の他の好適な電子デバイスなどの、電子デバイスを含み得る。いくつかの例では、画像捕捉及び処理システム１００は、セルラーネットワーク通信、８０２．１１ｗｉ－ｆｉ通信、ワイヤレスローカルエリアネットワーク（wireless local area network、ＷＬＡＮ）通信、又はそれらの何らかの組み合わせなどの、ワイヤレス通信のための１つ又は複数のワイヤレストランシーバを含み得る。いくつかの実装形態では、画像捕捉デバイス１０５Ａ及び画像処理デバイス１０５Ｂは、異なるデバイスであり得る。例えば、画像捕捉デバイス１０５Ａはカメラデバイスを含んでよく、画像処理デバイス１０５Ｂは、モバイルハンドセット、デスクトップコンピュータ、又は他のコンピューティングデバイスなどの、コンピューティングデバイスを含み得る。

【0052】

[0066] 画像捕捉及び処理システム１００はいくつかの構成要素を含むものとして示されるが、画像捕捉及び処理システム１００は図１に示すものより多数の構成要素を含み得ることを、当業者は諒解されよう。画像捕捉及び処理システム１００の構成要素は、ソフトウェア、ハードウェア、又はソフトウェアとハードウェアの１つ又は複数の組み合わせを含み得る。例えば、いくつかの実装形態では、画像捕捉及び処理システム１００の構成要素は、１つ又は複数のプログラマブル電子回路（例えば、マイクロプロセッサ、ＧＰＵ、ＤＳＰ、ＣＰＵ、及び／又は他の適切な電子回路）を含み得る、電子回路若しくは他の電子ハードウェアを含んでよく、かつ／若しくはそれらを使用して実装されてよく、かつ／又は、本明細書において説明する様々な動作を実施するために、コンピュータソフトウェア、ファームウェア、又はそれらの任意の組み合わせを含んでよく、かつ／若しくはそれらを使用して実装されてよい。ソフトウェア及び／又はファームウェアは、コンピュータ可読記憶媒体上に記憶され、画像捕捉及び処理システム１００を実装する電子デバイスの１つ又は複数のプロセッサによって実行可能である、１つ又は複数の命令を含み得る。

【0053】

[0067] 図２は、ディスプレイ２２５を視認しているユーザによってディスプレイ２２５を使用して表示された仮想コンテンツに対する知覚レベル及び／又は把握レベルを判定するためのプロセスを実施するエクステンデッドリアリティ（ＸＲ）システム２００の、例示的なアーキテクチャを示すブロック図である。いくつかの例では、ＸＲシステム２００は、少なくとも１つの画像捕捉及び処理システム１００、画像捕捉デバイス１０５Ａ、画像処理デバイス１０５Ｂ、又はそれらの組み合わせを含む。いくつかの例では、ＸＲシステム２００は、少なくとも１つのコンピューティングシステム１１００を含む。

【0054】

[0068] ＸＲシステム２００は、１つ又は複数のユーザ対面センサ２０５を含む。ユーザ対面センサ２０５は、ユーザの身体の態様及び／又はユーザによる挙動に関する情報を測定及び／又は追跡するセンサデータを捕捉する。いくつかの例では、ユーザ対面センサ２０５は、ユーザの少なくとも一部分に面した１つ又は複数のカメラを含む。１つ又は複数のカメラは、ユーザの少なくとも一部分の画像を捕捉する１つ又は複数の画像センサを含むことができる。例えば、ユーザ対面センサ２０５は、ユーザの片眼又は両眼（及び／又は片瞼若しくは両瞼）に焦点を合わせられた１つ又は複数のカメラを含むことができ、カメラの画像センサは、ユーザの片眼又は両眼の画像を捕捉する。１つ又は複数のカメラは、眼捕捉（eye capturing）センサとも呼ばれ得る。いくつかの実装形態では、１つ又は複数のカメラは、経時的に一連の画像を捕捉することができ、それらの画像は、いくつかの例では、時間的順序で一緒に、例えばビデオにシーケンス化され得る。これらの一連の画像は、例えば、ユーザの眼の運動、瞳孔拡張、（瞼を使用した）瞬き、（瞼を使用して）眼を細めること、サッカード、固視、眼の水分レベル、視運動反射若しくは応答、前庭動眼反射若しくは応答、調節反射若しくは応答、本明細書で説明される眼及び／若しくは瞼に関連する他の属性、又はそれらの組み合わせを描写又は別様に示すことができる。図２において、１つ又は複数の、ユーザ対面センサ２０５は、ユーザの眼に面しており、ユーザの眼の画像を捕捉するカメラとして示されている。ユーザ対面センサ２０５は、ユーザの身体及び／又は挙動に関する情報を追跡する１つ又は複数のセンサ、例えば、カメラ、メイジセンサ、マイクロフォン、心拍数モニタ、オキシメータ、バイオメトリックセンサ、測位受信機、全地球航法衛星システム（Global Navigation Satellite System、ＧＮＳＳ）受信機、慣性測定ユニット（ＩＭＵｓ）、加速度計、ジャイロスコープ、ジャイロメータ、気圧計、温度計、高度計、深度センサ、光検出及び測距（light detection and ranging、ＬＩＤＡＲ）センサ、電波検出及び測距（radio detection and ranging、ＲＡＤＡＲ）センサ、音検出及び測距（sound detection and ranging、ＳＯＤＡＲ）センサ、音航法及び測距（sound navigation and ranging、ＳＯＮＡＲ）センサ、飛行時間（time of flight、ＴｏＦ）センサ、構造化光センサ、本明細書で論じる他のセンサ、又はそれらの組み合わせなどを含み得る。いくつかの例では、１つ又は複数のユーザ対面センサ２０５は、少なくとも１つの画像捕捉及び処理システム１００、画像捕捉デバイス１０５Ａ、画像処理デバイス１０５Ｂ、又はそれらの組み合わせを含む。いくつかの例では、１つ又は複数のユーザ対面センサ２０５は、コンピューティングシステム１１００の少なくとも１つの入力デバイス１１４５を含むか、又はそれ自体がコンピューティングシステム１１００の入力デバイス１１４５である。

【0055】

[0069] ＸＲシステム２００は、仮想コンテンツを生成する仮想コンテンツ生成器２１５を含む。仮想コンテンツには、二次元（two-dimensional、２Ｄ）形状、三次元（three-dimensional、３Ｄ）形状、２Ｄオブジェクト、３Ｄオブジェクト、２Ｄモデル、３Ｄモデル、２Ｄアニメーション、３Ｄアニメーション、２Ｄ画像、３Ｄ画像、テクスチャ、他の画像の部分、英数字、英数字の文字列、又はそれらの組み合わせを含むことができる。図２において、仮想コンテンツ生成器２１５によって生成された仮想コンテンツは、四面体として示されている。英数字の文字列を含む仮想コンテンツの例としては、仮想コンテンツ５２５、仮想コンテンツ５３０、仮想コンテンツ５３５、仮想コンテンツ６３０、及び仮想コンテンツ７３０が挙げられる。いくつかの例では、仮想コンテンツ生成器２１５は、コンピューティングシステム１１００のプロセッサ１１１０、画像プロセッサ１５０、ホストプロセッサ１５２、ＩＳＰ１５４、又はそれらの組み合わせなどのプロセッサ上で実行される、プログラムに対応する命令セットなどのソフトウェア要素を含む。いくつかの例では、仮想コンテンツ生成器２１５は、１つ又は複数のハードウェア要素を含む。例えば、仮想コンテンツ生成器２１５は、コンピューティングシステム１１００のプロセッサ１１１０、画像プロセッサ１５０、ホストプロセッサ１５２、ＩＳＰ１５４、又はそれらの組み合わせなどのプロセッサを含むことができる。いくつかの例では、仮想コンテンツ生成器２１５は、１つ又は複数のソフトウェア要素と１つ又は複数のハードウェア要素との組み合わせを含む。

【0056】

[0070] ＸＲシステム２００は、環境のビューの上に少なくとも部分的にオーバーレイされた仮想コンテンツを表示する、ディスプレイ２２５を含む。環境のビューは、ＸＲシステム２００の周りの実世界環境のビューを含んでもよい。環境のビューは、実世界環境に少なくとも部分的に基づき、少なくとも部分的に仮想である、仮想環境及び／又は混合環境のビューを含んでもよい。いくつかの例では、ディスプレイ２２５は、出力デバイス１１３５を含むことができる。いくつかの例では、出力デバイス１１３５は、ディスプレイ２２５を含むことができる。

【0057】

[0071] いくつかの例では、ＸＲシステム２００のディスプレイ２２５は、ＸＲシステム２００の周りの実世界環境（場面）からの光がディスプレイ２２５を横切って（例えば、通過して）ユーザの片眼又は両眼に到達することを可能にする光学「シースルー」ディスプレイである。例えば、ディスプレイ２２５は、少なくとも部分的に透明、半透明、光透過性、又はそれらの組み合わせであり得る。１つの例示的な例では、ディスプレイ２２５は、透明、半透明、及び／又は光透過性のレンズと投影器とを含む。投影器は、仮想コンテンツをレンズ上に投影する。レンズは、例えば、眼鏡のレンズ、ゴーグルのレンズ、コンタクトレンズ、ヘッドマウントディスプレイ（ＨＭＤ）デバイスのレンズ、又はそれらの組み合わせであってもよい。実世界環境からの光は、レンズを通過し、ユーザの片眼又は両眼に到達する。投影器が仮想コンテンツをレンズ上に投影するので、仮想コンテンツは、ユーザの眼の一方又は両方の視点から、ユーザの環境のビューの上にオーバーレイされるように見える。投影器によってレンズ上に投影される仮想コンテンツの位置決めは、表示設定（例えば、第１の表示設定２５０、第２の表示設定２５５）によって識別及び／又は示すことができる。合成器２２０は、表示設定を決定及び／又は修正することができる。

【0058】

[0072] いくつかの例では、ＸＲシステム２００のディスプレイ２２５は、光学シースルーディスプレイに関して上で論じたレンズを有さない投影器を含む。代わりに、ディスプレイ２２５は、その投影器を使用して、仮想コンテンツをユーザの片眼又は両眼に投影することができる。いくつかの例では、ディスプレイ２２５の投影器は、ユーザの片眼又は両眼の、一方又は両方の網膜上に仮想コンテンツを投影することができる。そのようなディスプレイ２２５は、光学シースルーディスプレイ、仮想網膜ディスプレイ（virtual retinal display、ＶＲＤ）、網膜走査ディスプレイ（retinal scan display、ＲＳＤ）、又は網膜投影器（retinal projector、ＲＰ）と称され得る。実世界環境（場面）からの光は、依然としてユーザの片眼又は両眼に到達する。投影器が仮想コンテンツをユーザの片眼又は両眼に投影するので、仮想コンテンツは、ユーザの眼の一方又は両方の視点からの環境のユーザのビューの上にオーバーレイされるように見える。投影器によってユーザの片眼又は両眼に投影される仮想コンテンツの位置決めは、表示設定（例えば、第１の表示設定２５０、第２の表示設定２５５）によって識別及び／又は示すことができる。合成器２２０は、表示設定を決定及び／又は修正することができる。

【0059】

[0073] いくつかの例では、ＸＲシステム２００のディスプレイ２２５は、環境のビューをディスプレイ２２５上に表示することによってユーザが環境のビューを見ることを可能にする、デジタル「パススルー」ディスプレイである。デジタルパススルーディスプレイに表示される環境のビューは、例えば、ＸＲシステム２００の１つ又は複数の環境対面センサ２１０によって捕捉された（画像）センサデータに基づく、ＸＲシステム２００の周りの実世界環境のビューとすることができる。パススルーディスプレイに表示される環境のビューは、実世界環境とは別個であるが実世界環境に基づく、仮想環境又は混合環境のビューであり得る。例えば、仮想環境又は混合環境は、仮想オブジェクト及び／又は背景を含むことができるが、これらは、ユーザ及びＸＲシステム２００が存在する実世界環境内の空間の、領域及び／又は体積の寸法に基づく寸法を有する、空間の領域及び／又は体積にマッピングされ得る。ＸＲシステム２００は、ユーザ及びＸＲシステム２００が存在する実世界環境内の、空間の面積及び／又は体積の寸法を決定することができる。いくつかの実装形態では、ＸＲシステムは、環境（例えば、ＸＲシステムの周囲）の画像及び／又は環境の深度データを捕捉するＸＲシステム２００の１つ又は複数の環境対面センサ２１０を含み得る。これにより、ユーザがディスプレイ２２５に表示された仮想環境又は混合環境を探索している間に、ユーザが誤って階段を降りたり、壁又は障害物にぶつかったり、さもなければ実世界環境との否定的な相互作用及び／若しくは潜在的に危険な相互作用を有したりしないことを確実にすることができる。

【0060】

[0074] ＸＲシステム２００は、ディスプレイ２２５がデジタルパススルーディスプレイである例では、合成器２２０を使用して、仮想コンテンツ生成器２１５によって生成された仮想コンテンツを、ディスプレイ２２５に表示された環境の少なくとも一部分の上にオーバーレイすることができる。いくつかの例では、合成器２２０は、仮想コンテンツが、ディスプレイ２２５を視認しているユーザの片眼又は両眼の視点から、ディスプレイ２２５に表示された環境の残りの部分の完全に前にあるように見えるように、ディスプレイ２２５に表示された環境の上に完全に仮想コンテンツをオーバーレイすることができる。いくつかの例では、合成器２２０は、仮想コンテンツが、ディスプレイ２２５を視認しているユーザの片眼又は両眼の視点から、ディスプレイ２２５に表示された環境のいくつかの部分の前にあるが、ディスプレイ２２５に表示された環境の他の部分の背後にあるように見えるように、ディスプレイ２２５に表示された環境の部分の上に仮想コンテンツの少なくとも一部分をオーバーレイすることができる。したがって、合成器２２０は、仮想コンテンツにシミュレートされた深度を提供し、仮想コンテンツの部分の上に、ディスプレイ２２５に表示された環境の部分をオーバーレイすることができる。このシミュレートされた深度の例が図５Ｂに示されており、この場合、表示設定５５５に従って、レッド・アワーバックの像の頭部が部分的に仮想コンテンツ５３０の一部分の上にオーバーレイされている。

【0061】

[0075] ＸＲシステム２００は、ディスプレイ２２５が光学シースルーディスプレイである例では、合成器２２０を使用して、実世界環境の一部分が仮想コンテンツ生成器２１５によって生成された仮想コンテンツによってオーバーレイされないようにすることができる。いくつかの例では、合成器２２０は、仮想コンテンツが、ディスプレイ２２５を視認しているユーザの片眼又は両眼の視点から、実世界環境の少なくとも一部分の背後にあるように見えるように、仮想コンテンツをディスプレイ上の実世界環境の上に部分的にのみオーバーレイすることができる。いくつかの例では、合成器２２０は、仮想コンテンツが、ディスプレイ２２５を視認しているユーザの片眼又は両眼の視点から、実世界環境の少なくとも一部分の背後にあり、かつ実世界環境の他の部分の前にあるように見えるように、仮想コンテンツをディスプレイ上の実世界環境の上に部分的にのみオーバーレイすることができる。したがって、合成器２２０は、仮想コンテンツにシミュレートされた深度を提供し、実世界環境の部分が仮想コンテンツによってオーバーレイされないようにすることができる。環境に対する仮想コンテンツの位置決めは、表示設定（例えば、第１の表示設定２５０、第２の表示設定２５５）によって識別及び／又は示すことができる。合成器２２０は、表示設定を決定及び／又は修正することができる。

【0062】

[0076] ＸＲシステム２００の１つ又は複数の環境対面センサ２１０は、ユーザから離れて、かつ／又は実世界環境の一部分に、指し示され、方向付けられ、かつ／又は焦点を合わせられた１つ又は複数のセンサである。例えば、１つ又は複数の環境対面センサ２１０は、ユーザが、かつ／又はＸＲシステム２００の前面が面している方向に、指し示され、方向付けられ、かつ／又は面することができる。環境対面センサ２１０は、実世界環境に関する情報を測定及び／又は追跡するセンサデータを捕捉する。いくつかの例では、環境対面センサ２１０は、実世界環境の少なくとも一部分に面した１つ又は複数のカメラを含む。１つ又は複数のカメラは、実世界環境の少なくとも一部の画像を捕捉する１つ又は複数の画像センサを含むことができる。例えば、環境対面センサ２１０は、実世界環境（例えば、ＸＲシステム２００の周囲）に焦点を合わせられた１つ又は複数のカメラを含むことができ、カメラの画像センサは、実世界環境（例えば、周囲）の画像を捕捉する。そのようなカメラは、経時的に一連の画像を捕捉することができ、いくつかの例では、それらの画像は、時間的順序で一緒に、例えばビデオにシーケンス化され得る。これらの一連の画像は、例えば、床、地面、壁、天井、空、水、植物、ユーザ以外の他の人、ユーザの身体の部分（例えば、腕又は脚）、構造物、車両、動物、デバイス、他のオブジェクト、又はそれらの組み合わせを描写又は別様に示すことができる。図２において、１つ又は複数の環境対面センサ２１０は、家（構造物の一例）に面したカメラとして示されている。いくつかの例では、１つ又は複数の環境対面センサ２１０は、少なくとも１つの画像捕捉及び処理システム１００、画像捕捉デバイス１０５Ａ、画像処理デバイス１０５Ｂ、又はそれらの組み合わせを含む。いくつかの例では、１つ又は複数の環境対面センサ２１０は、コンピューティングシステム１１００の少なくとも１つの入力デバイス１１４５を含むか、又はそれ自体がコンピューティングシステム１１００の入力デバイス１１４５である。

【0063】

[0077] 環境対面センサ２１０は、カメラ、画像センサ、測位受信機、全地球航法衛星システム（ＧＮＳＳ）受信機、慣性測定ユニット（ＩＭＵｓ）、加速度計、ジャイロスコープ、ジャイロメータ、気圧計、温度計、高度計、深度センサ、光検出及び測距（ＬＩＤＡＲ）センサ、電波検出及び測距（ＲＡＤＡＲ）センサ、音検出及び測距（ＳＯＤＡＲ）センサ、音航法及び測距（ＳＯＮＡＲ）センサ、飛行時間（ＴｏＦ）センサ、構造化光センサ、本明細書で論じる他のセンサ、又はそれらの組み合わせを含み得る。

【0064】

[0078] いくつかの例では、ＸＲシステム２００はまた、１つ又は複数の追加のセンサ２０８として、カメラ、画像センサ、測位受信機、全地球航法衛星システム（ＧＮＳＳ）受信機、慣性測定ユニット（ＩＭＵｓ）、加速度計、ジャイロスコープ、ジャイロメータ、気圧計、温度計、高度計、深度センサ、光検出及び測距（ＬＩＤＡＲ）センサ、電波検出及び測距（ＲＡＤＡＲ）センサ、音検出及び測距（ＳＯＤＡＲ）センサ、音航法及び測距（ＳＯＮＡＲ）センサ、飛行時間（ＴｏＦ）センサ、構造化光センサ、本明細書で論じる他のセンサ、又はそれらの組み合わせなどを含むことができる。いくつかの実装形態では、追加のセンサ２０８は、ユーザ対面センサ２０５及び／又は環境対面センサ２１０からのセンサ読み取り値を補完又は精緻化し得る。例えば、仮想コンテンツのユーザ知覚の判定を（例えば、ユーザによる首振り又は頷きを検出することによって）精緻化するために、属性エンジン２３０によって、慣性測定ユニット（ＩＭＵｓ）、加速度計、ジャイロスコープ、又は他のセンサが使用される。別の例では、仮想コンテンツのシミュレートされた深度を作成するときにディスプレイによってオーバーレイされないようにすべき実世界環境の部分（例えば、識別可能なオブジェクト）を識別するために、合成器２２０によって、深度センサ、光検出及び測距（ＬＩＤＡＲ）センサ、電波検出及び測距（ＲＡＤＡＲ）センサ、音検出及び測距（ＳＯＤＡＲ）センサ、音航法及び測距（ＳＯＮＡＲ）センサ、飛行時間（ＴｏＦ）センサが使用されてもよい。

【0065】

[0079] ＸＲシステム２００は、合成器２２０を含む。合成器２２０は、ユーザがディスプレイ２２５を通して視認する環境における（環境内の）仮想コンテンツのビューを構成する、合成する、かつ／又は組み合わせる。ＸＲシステム２００の合成器２２０は、ディスプレイ２２５のための表示設定の第１のセット（例えば、第１の表示設定２５０）を決定することができる。ＸＲシステム２００の合成器２２０は、ディスプレイ２２５のための表示設定の第１のセットを修正して、ディスプレイ２２５のための表示設定の第２のセット（例えば、第２の表示設定２５５）を生成することができる。ディスプレイ２２５がデジタル「パススルー」ディスプレイであるＸＲシステム２００では、合成器２２０は、環境のビューを仮想コンテンツ生成器２１５によって生成された仮想コンテンツと（例えば環境対面センサ２１０からのセンサデータに基づいて）合成する、合成する、かつ／又は組み合わせる画像を生成することができる。合成器２２０によって生成される表示設定は、仮想コンテンツの、並びに／又は仮想コンテンツの特定の要素若しくは部分の、位置、向き、深度、サイズ、色、フォントサイズ、フォント色、テキスト言語、レイアウト、及び／若しくは仮想コンテンツの他の性質を示すことができる。ディスプレイ２２５が光学「シースルー」ディスプレイであるＸＲシステム２００では、合成器２２０は、ディスプレイ２２５によって表示される（例えば、ディスプレイ２２５の投影器によってレンズ上に投影される）仮想コンテンツ並びに／又は仮想コンテンツの特定の要素若しくは部分の、位置、向き、深度、サイズ、色、フォントサイズ、フォント色、テキスト言語、及び／若しくは他の性質を示す表示設定を生成することができる。ディスプレイ２２５が仮想網膜ディスプレイ（ＶＲＤ）であるＸＲシステム２００では、合成器２２０は、ディスプレイ２２５によって表示される（例えば、ディスプレイ２２５の投影器によってユーザの片眼若しくは両眼に投影される）仮想コンテンツ並びに／又は仮想コンテンツの特定の要素若しくは部分の、位置、向き、深度、サイズ、色、フォントサイズ、フォント色、テキスト言語、及び／若しくは他の性質を示す表示設定を生成することができる。図２において、（ＸＲシステム２００の左側にある）合成器２２０は、（四面体によって表される）仮想コンテンツを、（家によって表される）環境のビューに追加するものとして示されている。図２において、（ＸＲシステム２００の左側の）ディスプレイ２２５は、（四面体によって表される）仮想コンテンツのビュー及び（家によって表される）環境のビューの両方を、表示及び／又は提供するディスプレイとして示されている。いくつかの例では、合成器２２０は、コンピューティングシステム１１００のプロセッサ１１１０、画像プロセッサ１５０、ホストプロセッサ１５２、ＩＳＰ１５４、又はそれらの組み合わせなどのプロセッサ上で実行される、プログラムに対応する命令セットなどのソフトウェア要素を含む。いくつかの例では、合成器２２０は、１つ又は複数のハードウェア要素を含む。例えば、合成器２２０は、コンピューティングシステム１１００のプロセッサ１１１０、画像プロセッサ１５０、ホストプロセッサ１５２、ＩＳＰ１５４、又はそれらの組み合わせなどのプロセッサを含むことができる。いくつかの例では、合成器２２０は、１つ又は複数のソフトウェア要素と１つ又は複数のハードウェア要素との組み合わせを含む。

【0066】

[0080] ＸＲシステム２００は、ユーザ対面センサ２０５からのセンサデータに基づいて１つ又は複数の知覚関連属性を決定する、属性エンジン２３０を含む。ユーザの知覚関連属性は、ユーザの１つ若しくは複数の眼の１つ若しくは複数の属性、ユーザの表情の１つ若しくは複数の属性、ユーザの１つ若しくは複数のジェスチャ、又は上記の組み合わせを含むことができる。例えば、ユーザの属性は、特定の時間におけるユーザの片眼又は両眼の位置、ユーザの片眼又は両眼の運動、ユーザの片眼又は両眼のサッカードの眼球位置、ユーザの片眼又は両眼のサッカードの眼球運動、ユーザの片眼又は両眼のサッカード回数、ユーザの片眼又は両眼のサッカード頻度、ユーザの片眼又は両眼のサッカード持続時間、ユーザの片眼又は両眼の固視の眼球位置、ユーザの片眼又は両眼の固視の眼球運動、ユーザの片眼又は両眼の固視回数、ユーザの片眼又は両眼の固視頻度、ユーザの片眼又は両眼の固視持続時間、ユーザの一方若しくは両方の眼及び／又は瞼の、眼及び／又は瞼の瞬き位置、ユーザの一方若しくは両方の眼及び／又は瞼の、眼及び／又は瞼の瞬き運動、ユーザの一方若しくは両方の眼及び／又は瞼の瞬き回数、ユーザの一方若しくは両方の眼及び／又は瞼の瞬き頻度、ユーザの一方若しくは両方の眼及び／又は瞼の瞬き持続時間、ユーザの一方若しくは両方の眼及び／又は瞼の、眼及び／又は瞼を細める位置、ユーザの一方若しくは両方の眼及び／又は瞼の、眼及び／又は瞼を細める運動、ユーザの一方若しくは両方の眼及び／又は瞼の、眼及び／又は瞼を細める回数、ユーザの一方若しくは両方の眼及び／又は瞼の、眼及び／又は瞼を細める頻度、ユーザの一方若しくは両方の眼及び／又は瞼を細める持続時間、ユーザの一方若しくは両方の眼及び／又は瞼を細める程度又はレベル、ユーザの片眼又は両眼の注視眼球位置、ユーザの片眼又は両眼の注視回数、ユーザの片眼又は両眼の注視頻度、ユーザの片眼又は両眼の注視持続時間、ユーザの片眼又は両眼の注視程度又はレベル、ユーザの片眼又は両眼の瞳孔拡張の眼球位置、ユーザの片眼又は両眼の瞳孔拡張の眼球運動、ユーザの片眼又は両眼の瞳孔拡張回数、ユーザの片眼又は両眼の瞳孔拡張頻度、ユーザの片眼又は両眼の瞳孔拡張持続時間、ユーザの片眼又は両眼の瞳孔拡張の程度又はレベル、ユーザの片眼又は両眼の水晶体形状（例えば、毛様体筋を使用した調節に関連付けられる）、ユーザの片眼又は両眼の水晶体形状の変化（例えば、毛様体筋を使用した調節に関連付けられる）、ユーザの片眼又は両眼の水晶体形状の変化の回数、ユーザの片眼又は両眼の水晶体形状の変化の頻度、ユーザの片眼又は両眼の水晶体形状の変化の程度、ユーザの頭部の頭部傾斜回数、ユーザの頭部の頭部傾斜頻度、ユーザの頭部の頭部傾斜持続時間、ユーザの頭部の頭部傾斜程度又はレベル、ユーザの頭部の頭部傾斜回数、ユーザの頭部の頭部傾斜頻度、ユーザの頭部の頭部傾斜持続時間、ユーザの頭部の頭部傾斜程度又はレベル、ユーザによる頭部傾斜中のユーザの片眼又は両眼の眼球位置、ユーザによる頭部傾斜中のユーザの片眼又は両眼の眼球運動、ユーザの頭部の首振り回数、ユーザの頭部の首振り頻度、ユーザの頭部の首振り持続時間、ユーザの頭部の首振り程度又はレベル、ユーザの頭部の首振り回数、ユーザの頭部の首振り頻度、ユーザの頭部の首振り持続時間、ユーザの頭部の首振り程度又はレベル、ユーザによる首振り中のユーザの片眼又は両眼の眼球位置、ユーザによる首振り中のユーザの片眼又は両眼の眼球運動、ユーザの頭部の頷き回数、ユーザの頭部の頷き頻度、ユーザの頭部の頷き持続時間、ユーザの頭部の頷き程度又はレベル、ユーザの頭部の頷き回数、ユーザの頭部の頷き頻度、ユーザの頭部の頷き持続時間、ユーザの頭部の頷き程度又はレベル、ユーザによる頭部の頷き中のユーザの片眼又は両眼の眼球位置、ユーザによる頭部の頷き中のユーザの片眼又は両眼の眼球運動、ユーザによる微笑み回数、ユーザによる微笑み頻度、ユーザによる微笑み持続時間、ユーザによる微笑み程度又はレベル、ユーザによる微笑み回数、ユーザによる微笑み頻度、ユーザによる微笑み持続時間、ユーザによる微笑み程度又はレベル、ユーザによる微笑み中のユーザの片眼又は両眼の眼球位置、ユーザによる微笑み中のユーザの片眼又は両眼の眼球運動、ユーザによる笑いの回数、ユーザによる笑いの頻度、ユーザによる笑いの持続時間、ユーザによる笑いの程度又はレベル、ユーザによる笑いの回数、ユーザによる笑いの頻度、ユーザによる笑いの持続時間、ユーザによる笑いの程度又はレベル、ユーザによる笑いの間のユーザの片眼又は両眼の眼球位置、ユーザによる笑いの間のユーザの片眼又は両眼の眼球運動、ユーザによる眼を細める回数、ユーザによる眼を細める頻度、ユーザによる眼を細める持続時間、ユーザによる眼を細める程度又はレベル、ユーザによる眼を細める回数、ユーザによる眼を細める頻度、ユーザによる眼を細める持続時間、ユーザによる眼を細める程度又はレベル、ユーザによる眼を細めている間のユーザの片眼又は両眼の眼球位置、ユーザによる眼を細めている間のユーザの片眼又は両眼の眼球運動、ユーザによる泣いた回数、ユーザによる泣いた頻度、ユーザによる泣いた持続時間、ユーザによる泣いた程度又はレベル、ユーザによる泣いた回数、ユーザによる泣いた頻度、ユーザによる泣いた持続時間、ユーザによる泣いた程度又はレベル、ユーザによる泣いている間のユーザの片眼又は両眼の眼球位置、ユーザによる泣いている間のユーザの片眼又は両眼の眼球運動、ユーザの片眼又は両眼の水分レベル、ユーザの片眼又は両眼の乾燥レベル、ユーザの片眼又は両眼の視運動性反射又は反応の眼球位置、ユーザの片眼又は両眼の視運動性反射又は反応の眼球運動、ユーザの片眼又は両眼の視運動性反射又は反応の回数、ユーザの片眼又は両眼の視運動性反射又は反応の頻度、ユーザの片眼又は両眼の視運動性反射又は反応の持続時間、ユーザの片眼又は両眼の前庭眼反射又は反応の眼球位置、ユーザの片眼又は両眼の前庭眼反射又は反応の眼球運動、ユーザの片眼又は両眼の前庭眼反射又は反応の回数、ユーザの片眼又は両眼の前庭眼反射又は反応の頻度、ユーザの片眼又は両眼の前庭眼反射又は反応持続時間、本明細書で説明される眼及び／又は瞼に関連する他の属性、ユーザの片眼又は両眼の調節反射又は反応の眼球位置、ユーザの片眼又は両眼の調節反射又は反応の眼球運動、ユーザの片眼又は両眼の調節反射又は反応の回数、ユーザの片眼又は両眼の調節反射又は反応の頻度、ユーザの片眼又は両眼の調節反射又は反応の持続時間、又はそれらの組み合わせを含み得る。

【0067】

[0081] 図２において、属性エンジン２３０は、ユーザの眼の視線方向（黒い実線矢印によって表される）の運動（点線矢印によって表される）を識別するものとして示されている。いくつかの例では、属性エンジン２３０は、コンピューティングシステム１１００のプロセッサ１１１０、画像プロセッサ１５０、ホストプロセッサ１５２、ＩＳＰ１５４、又はそれらの組み合わせなどのプロセッサ上で実行される、プログラムに対応する命令セットなどのソフトウェア要素を含む。いくつかの例では、属性エンジン２３０は、１つ又は複数のハードウェア要素を含む。例えば、属性エンジン２３０は、コンピューティングシステム１１００のプロセッサ１１１０、画像プロセッサ１５０、ホストプロセッサ１５２、ＩＳＰ１５４、又はそれらの組み合わせなどのプロセッサを含むことができる。いくつかの例では、属性エンジン２３０は、１つ又は複数のソフトウェア要素と１つ又は複数のハードウェア要素との組み合わせを含む。いくつかの例では、属性エンジン２３０は、１つ若しくは複数の人工知能（artificial intelligence、ＡＩ）アルゴリズム及び／又は１つ若しくは複数の機械学習（ＭＬ）システムを含む、かつ／又は実行する。１つ若しくは複数のＡＩアルゴリズム及び／又はＭＬシステムは、ユーザ対面センサ２０５からのセンサデータを入力として受信することができ、属性を出力することができる。属性エンジン２３０の１つ又は複数のＭＬシステムの例は、第１のトレーニングされたＭＬモデル８２５及び／又はニューラルネットワーク９００を含む。

【0068】

[0082] ＸＲシステム２００は、（例えば、ユーザの片眼又は両眼を使用して）ユーザによる仮想コンテンツに対する知覚レベルを判定及び／又は推定する、知覚エンジン２３５を含む。知覚エンジン２３５は、属性エンジン２３０が識別する知覚関連属性に基づいて、かつ／又はユーザ焦点センサ２０５からのセンサデータに直接基づいて、仮想コンテンツに対するユーザ知覚レベルを判定及び／又は推定する。知覚エンジン２３５は、合成器２２０によって生成されるような仮想コンテンツのための表示設定（例えば、表示設定２５０）に基づいて、仮想コンテンツに対するユーザ知覚レベルを判定及び／又は推定する。知覚エンジン２３５は、表示設定（例えば、表示設定２５０）を使用して、仮想コンテンツがディスプレイ２２５に沿って表示される場所を識別することができる。知覚エンジン２３５は、属性エンジン２３０が識別する知覚関連属性を使用して、ユーザの片眼又は両眼がどこを見ているか、ユーザの片眼又は両眼がどのように動いているか、ユーザの片眼又は両眼が見ている間に眼を細めている程度、ユーザの片眼又は両眼が瞬きしている程度、ユーザの片眼又は両眼が固視している程度、ユーザの片眼又は両眼がサッカードを行っている程度、ユーザが微笑んでいる程度、ユーザが笑っている程度、ユーザが顔をしかめている程度、ユーザが泣いている程度、又はそれらの組み合わせを判定することができる。知覚エンジン２３５は、ユーザが仮想コンテンツ及び／又は仮想コンテンツの近くを見たか、ユーザが仮想コンテンツ及び／又は仮想コンテンツの近くをどれだけ長く見たか、ユーザの視線と仮想コンテンツの位置とがどれだけ密接に位置合わせされているかなどを判定することができる。知覚エンジン２３５は、例えば、ユーザがディスプレイ２２５に表示された仮想コンテンツ及び／又は別のコンテンツに焦点を合わせていることを示すものとして、眼を細めること及び／又は固視を解釈してもよい。知覚エンジン２３５は、例えば、ユーザが仮想コンテンツ及び／又はディスプレイ２２５に表示された別のコンテンツを潜在的に見逃す（例えば、知覚しない）ことを示すものとして、瞬き及び／又はサッカードを解釈してもよい。知覚エンジン２３５によって出力される、ユーザによる仮想コンテンツに対する知覚レベルは、例えば、仮想コンテンツがディスプレイ２２５に表示されている間に、ユーザが自分の眼を閉じた場合、かつ／又は仮想コンテンツの位置から非常に遠くを見た場合、ユーザによる仮想コンテンツに対する知覚が全くないことを示す値であり得る。知覚エンジン２３５によって出力される、ユーザによる仮想コンテンツに対する知覚レベルは、例えば、ユーザが、仮想コンテンツが長時間表示される位置を凝視していた場合、ユーザによる仮想コンテンツの非常に高い知覚を示す値であり得る。知覚エンジン２３５によって出力される、ユーザによる仮想コンテンツに対する知覚レベルは、上記の知覚なしの例よりも高い知覚レベルを示す値と、上記の高い知覚の例よりも低い知覚レベルを示す値との間の値であり得る。知覚エンジン２３５によって判定され出力される、仮想コンテンツに対する知覚レベルは、仮想コンテンツに対する知覚の程度及び／又は仮想コンテンツに対する知覚のメトリックと呼ぶことができる。

【0069】

[0083] 図２において、知覚エンジン２３５は、ユーザの眼の視線方向（黒い実線矢印によって表される）が仮想コンテンツ（四面体によって表される）の位置に一致するかどうかを識別するものとして示されている。いくつかの例では、知覚エンジン２３５は、コンピューティングシステム１１００のプロセッサ１１１０、画像プロセッサ１５０、ホストプロセッサ１５２、ＩＳＰ１５４、又はそれらの組み合わせなどのプロセッサ上で実行される、プログラムに対応する命令セットなどのソフトウェア要素を含む。いくつかの例では、知覚エンジン２３５は、１つ又は複数のハードウェア要素を含む。例えば、知覚エンジン２３５は、コンピューティングシステム１１００のプロセッサ１１１０、画像プロセッサ１５０、ホストプロセッサ１５２、ＩＳＰ１５４、又はそれらの組み合わせなどのプロセッサを含むことができる。いくつかの例では、知覚エンジン２３５は、１つ又は複数のソフトウェア要素と１つ又は複数のハードウェア要素との組み合わせを含む。いくつかの例では、知覚エンジン２３５は、１つ若しくは複数のＡＩアルゴリズム及び／又は１つ若しくは複数のＭＬシステムを含む、かつ／又は実行する。１つ若しくは複数のＡＩアルゴリズム及び／又は１つ若しくは複数のＭＬシステムは、属性エンジン２３０によって生成された１つ又は複数の知覚関連属性（及び／又はユーザ対面センサ２０５によって捕捉されたセンサデータ）を入力として受信することができ、ユーザによる仮想コンテンツに対する知覚レベルを出力することができる。知覚エンジン２３５の１つ又は複数のＭＬシステムの例は、第２のトレーニングされたＭＬモデル８３５及び／又はニューラルネットワーク９００を含む。

【0070】

[0084] ＸＲシステム２００は、ユーザによる仮想コンテンツに対する把握及び／又は理解レベルを判定及び／又は推定する、把握エンジン２４０を含む。把握エンジン２４０は、知覚エンジン２３５によって判定された、ユーザによる仮想コンテンツに対する知覚レベルに基づいて、ユーザによる仮想コンテンツに対する把握及び／又は理解レベルを、判定及び／又は推定する。いくつかの例では、把握エンジン２４０は、仮想コンテンツ評価エンジン２４５による仮想コンテンツの分析に基づいて、ユーザによる仮想コンテンツに対する把握及び／又は理解レベルを、判定及び／又は推定する。いくつかの例では、把握エンジン２４０は、ユーザに関連付けられた履歴データに基づいて、ユーザによる仮想コンテンツに対する把握及び／又は理解レベルを、判定及び／又は推定する。

【0071】

[0085] いくつかの例では、ＸＲシステム２００は、仮想コンテンツ評価エンジン２４５を含む。仮想コンテンツ評価エンジン２４５は、仮想コンテンツの分析を生成する。いくつかの例では、仮想コンテンツ評価エンジン２４５は、仮想コンテンツの複雑さ、仮想コンテンツの一意性、又はそれらの組み合わせに基づいて、仮想コンテンツの分析を生成する。いくつかの例では、仮想コンテンツ評価エンジンは、一意性に基づいてメトリックを決定する。一意性は、仮想コンテンツがディスプレイ２２５上に（例えば、以前に）表示された場合、どのくらいしばしば（例えば、どのくらいの回数及び／又はどのくらいの頻度）であるかの尺度であってよい。仮想コンテンツが、ディスプレイ２２５上に非常に頻繁に表示されるメッセージ又はオブジェクトを含む場合、仮想コンテンツは、仮想コンテンツが低い一意性を有すると決定し得る。仮想コンテンツが、以前にディスプレイ２２５に表示されたことがないメッセージ又はオブジェクトを含む場合、仮想コンテンツ評価エンジン２４５は、仮想コンテンツが高い一意性を有すると決定し得る。仮想コンテンツが、ディスプレイ２２５上にまれに（例えば、以前に１回又は２回）表示されたメッセージ又はオブジェクトを含む場合、仮想コンテンツ評価エンジン２４５は、仮想コンテンツが中程度の一意性を有すると決定し得る。一意性は、可能な値の範囲内（例えば、低、中、高、及びこれらのうちの任意の２つの間の１つ又は複数の値）にあり得る。いくつかの例では、一意性は、一意性スコア、一意性レベル、一意性メトリック、又は一意性程度と呼ばれることがある。

【0072】

[0086] いくつかの例では、仮想コンテンツは、英数字の文字列（例えば、テキストの文字列）を含む。仮想コンテンツ評価エンジン２４５は、文字列の長さに少なくとも部分的に基づいて、仮想コンテンツの複雑さを評価することができ、より長い文字列は、より短い文字列よりも高い複雑さを有する。仮想コンテンツ評価エンジン２４５は、仮想コンテンツにおける命令のセットに含まれるステップの数に少なくとも部分的に基づいて、仮想コンテンツの複雑さメトリックを生成することができる。例えば、仮想コンテンツ評価エンジン２４５は、より多くのステップを有する命令を含む仮想コンテンツに対してより高い複雑さメトリックを提供し、より少ないステップを有する命令を含む仮想コンテンツに対してより低い複雑さメトリックを提供することができる。仮想コンテンツ評価エンジン２４５は、仮想コンテンツ評価エンジン２４５によって決定された、文字列に含まれる単語の複雑さに少なくとも部分的に基づいて、仮想コンテンツの複雑さを分析することができる。例えば、仮想コンテンツ評価エンジン２４５は、より一般的な日常の単語（例えば、「今日」、「止まる」、「続く」）よりも高度な専門用語（例えば、「半導体」、「排気ガスケット」、「アンチサイホンバルブ」）に、より高い複雑さを割り当てることができる。仮想コンテンツ評価エンジン２４５は、より少ない複雑な単語、並びに／又はより多くの複雑でない単語及び／若しくはあまり複雑でない単語（例えば、一般的及び／又は単純な単語）を含む文字列よりも、より多くの複雑な単語を含む文字列に、より高い複雑さを割り当てるか又は提供することができる。仮想コンテンツ評価エンジン２４５は、仮想コンテンツ評価エンジン２４５によって決定された、文字列に含まれる任意の方程式又は式の複雑さに少なくとも部分的に基づいて、仮想コンテンツの複雑さを分析することができる。例えば、仮想コンテンツ評価エンジン２４５は、より少ない変数を含む、かつ／又は数学のより低い難易度レベルに対応する方程式若しくは式よりも、より多くの変数を含む、かつ／又は数学のより高い難易度レベルに対応する方程式若しくは式に、より高い複雑さを割り当てることができる。仮想コンテンツ評価エンジン２４５は、より少ない複雑な方程式若しくは式、及び／又はあまり複雑でないより多くの方程式若しくは式を含む文字列よりも、より複雑な方程式若しくは式を含む文字列に、より高い複雑さを割り当てることができる。複雑さは、可能な値の範囲内（例えば、低、中、高、及びこれらのうちの任意の２つの間の１つ又は複数の値）にあり得る。いくつかの例では、複雑さは、複雑さスコア、複雑さレベル、複雑さメトリック、又は複雑さ程度と呼ばれることがある。

【0073】

[0087] 仮想コンテンツ評価エンジン２４５は、仮想コンテンツに記述された主題を理解又は把握するために必要とされる事前知識の推定量に少なくとも部分的に基づいて、仮想コンテンツについての複雑さメトリックを生成することができる。例えば、仮想コンテンツ評価エンジン２４５は、高レベルの事前知識に関連付けられた主題を含む仮想コンテンツにより高い複雑さを割り当て、より低いレベルの事前知識を必要とする主題を含む仮想コンテンツにより低い複雑さを割り当てることができる。高レベル及び低レベルの事前知識は、例えば、主題が典型的に教えられかつ／又は学習され得る課程に関連付けることができる。例えば、より低いレベルの事前知識を必要とする主題は、典型的には（小学校）３年生で教えられかつ／又は学習される主題であってもよく、一方、より高いレベルの事前知識を必要とする主題は、典型的には大学院（例えば、別の大学院課程及び多数の学部課程が前提条件である特定の大学院課程）で教えられかつ／又は学習される主題であってもよい。例えば、微分方程式又はバナッハ空間を記述する仮想コンテンツは、ピタゴラスの定理を記述する仮想コンテンツよりも高いレベルの事前知識を必要とする。仮想コンテンツ評価エンジン２４５は、仮想コンテンツに含まれる単語に基づいて、仮想コンテンツの主題を決定することができる。仮想コンテンツ評価エンジン２４５は、主題を、主題に関連付けられた事前知識の対応するレベルを識別するルックアップテーブルと比較することができる。

【0074】

[0088] 仮想コンテンツ評価エンジン２４５は、仮想コンテンツの１つ若しくは複数の形状、オブジェクト、画像、及び／又はテクスチャの複雑さに少なくとも部分的に基づいて、仮想コンテンツの複雑さメトリックを生成することができる。例えば、仮想コンテンツ評価エンジン２４５は、あまり複雑でない多角形及び／又は多面体を含む仮想コンテンツよりも、より複雑な多角形及び／又は多面体を含む仮想コンテンツに、より高い複雑さを割り当てることができる。図２において、仮想コンテンツ評価エンジン２４５は、低複雑さ（三角形によって表される）から、中複雑さ（四面体によって表される）、高複雑さ（星形十二面体によって表される）までの複雑さを識別するものとして示されている。

【0075】

[0089] 場合によっては、仮想コンテンツを評価するために、仮想コンテンツ評価エンジン２４５は、仮想コンテンツについての複雑さメトリック及び一意性メトリックを決定することができる。仮想コンテンツ評価エンジン２４５は、複雑さメトリック及び一意性メトリックを、仮想コンテンツのための単一のメトリックに変換することができる。単一のメトリックは、複雑さメトリックと一意性メトリックとに基づく融合メトリックであり、複雑さメトリックと一意性メトリックとの積、和、又は平均であることができる。１つの例示的な例では、仮想コンテンツは、「警告：熱いストーブ！」という通知を含むことができ、この場合、仮想コンテンツ評価エンジン２４５は、１の値を有する複雑さメトリック及び２の値を有する一意性メトリックを割り当てることができる。仮想コンテンツ評価エンジン２４５は、１×２＝２の値を有する単一のメトリックを決定することができる。別の例示的な例では、仮想コンテンツは、「塩を加え、混合物が泡立ってフォーム状になるまでルーを撹拌してください」という通知を含むことができ、この場合、仮想コンテンツ評価エンジン２４５は、複雑さメトリックが３の値を有すること及び一意性メトリックが５の値を有することを決定することができる。仮想コンテンツ評価エンジン２４５は、３×５＝１５の値を有する単一のメトリックを決定することができる。

【0076】

[0090] ユーザに関連付けられた履歴データは、ある高校、高校の卒業生、ある大学、大学の卒業生、ある大学院（graduate school）、大学院の卒業生、ある大学院（post-graduate school）、大学院の卒業生など、ユーザの教育レベルを含み得る。ユーザに関連付けられた履歴データは、専攻、副専攻、研究分野、授業科目、学校又はプログラム（例えば、工学部、生命科学部）など、ユーザの教育における専門分野を含み得る。ユーザに関連付けられた履歴データは、ユーザの仕事、キャリア、職業、及び／又は専門職を含み得る。ユーザに関連付けられた履歴データは、ユーザの取引履歴、ユーザの閲覧履歴、ユーザのゲームプレイ履歴、ユーザの仮想コンテンツ視認履歴、ユーザのロケーション履歴、ユーザの居住履歴などを含み得る。ユーザに関連付けられた履歴データは、ユーザの年齢、時刻（例えば、ユーザが疲れているかどうかを示してもよい）、以前に提示された仮想コンテンツに対するユーザの把握又は理解の履歴、以前に提示された仮想コンテンツに対する（例えば、フィードバックエンジン２６０を介した）ユーザのフィードバックの履歴、以前に提示された仮想コンテンツによって要求又は提案されたアクションをユーザが成功裏に完了した履歴などを含み得る。

【0077】

[0091] 把握エンジン２４０は、知覚エンジン２３５によって判定された、ユーザによる仮想コンテンツに対する知覚レベル、仮想コンテンツ評価エンジン２４５による仮想コンテンツの分析、ユーザに関連付けられた履歴データ、又はそれらの組み合わせに基づいて、ユーザによる仮想コンテンツに対する把握及び／又は理解レベルを、判定及び／又は推定する。例えば、知覚エンジン２３５が、ユーザが仮想コンテンツを１０秒間見たことを示し、仮想コンテンツが仮想コンテンツ評価エンジン２４５から低い一意性及び低い複雑さの評価を受信し、かつ仮想コンテンツが、ユーザの履歴データに基づいてユーザが非常に精通している主題に関する場合、把握エンジン２４０は、ユーザが仮想コンテンツを、高い把握及び／又は理解レベルまで把握及び／又は理解したと、判定及び／又は推定することができる。一方、知覚エンジン２３５が、ユーザが仮想コンテンツを５秒間見たことを示し、仮想コンテンツが仮想コンテンツ評価エンジン２４５から高い一意性及び高い複雑さの評価を受信し、かつ仮想コンテンツが、ユーザの履歴データに基づいてユーザが精通している主題に関していない場合、把握エンジン２４０は、ユーザが仮想コンテンツを、低い把握及び／又は理解レベルまで把握及び／又は理解したと、判定及び／又は推定することができる。把握エンジン２４０によって判定され出力される、仮想コンテンツの把握及び／又は理解レベルは、仮想コンテンツの把握及び／若しくは理解の程度、並びに／又は仮想コンテンツの把握及び／若しくは理解のメトリックと呼ぶことができる。

【0078】

[0092] 知覚レベルと、仮想コンテンツ評価エンジン２４５からの評価と、ユーザに関連付けられた履歴データとの異なる組み合わせにより、把握エンジン２４０が、ユーザによる仮想コンテンツに対する把握及び／又は理解の異なるレベルを判定及び／又は推定することをもたらし得る。例えば、仮想コンテンツが、ユーザの履歴データに基づいてユーザが非常に精通している主題に関する場合、把握エンジン２４０は、仮想コンテンツが、仮想コンテンツ評価エンジン２４５から高い一意性及び高い複雑さの評価を受信した場合であっても、かつ／又は知覚エンジン２３５が、ユーザが仮想コンテンツを比較的短時間見たことを示す場合であっても、ユーザが仮想コンテンツを合理的に高い把握及び／又は理解レベルまで把握及び／又は理解したと、判定及び／又は推定することができる。知覚エンジン２３５が、ユーザが仮想コンテンツを長時間見たことを示す場合、把握エンジン２４０は、仮想コンテンツが仮想コンテンツ評価エンジン２４５から高い一意性及び高い複雑さの評価を受信した場合であっても、かつ／又は仮想コンテンツがユーザの履歴データに基づいてユーザが精通している主題に関していない場合であっても、ユーザが仮想コンテンツを合理的に高い把握及び／又は理解レベルまで把握及び／又は理解したと、判定及び／又は推定することができる。知覚エンジン２３５が、仮想コンテンツ評価エンジン２４５が仮想コンテンツを低い一意性及び／又は低い複雑さを有するものとして評価したことを示す場合、把握エンジン２４０は、知覚エンジン２３５が、ユーザが仮想コンテンツを比較的短時間見たことを示す場合であっても、かつ／又は仮想コンテンツがユーザの履歴データに基づいてユーザが精通している主題に関していない場合であっても、ユーザが仮想コンテンツを合理的に高い把握及び／又は理解レベルまで把握及び／又は理解したと、判定及び／又は推定することができる。

【0079】

[0093] いくつかの例では、把握エンジン２４０は、属性エンジン２３０によって判定された知覚関連属性に基づいて、ユーザによる仮想コンテンツの把握及び／又は理解レベルを、判定及び／又は推定することができる。例えば、把握エンジン２４０は、属性エンジン２３０によって判定された知覚関連属性が、ユーザが例えば、微笑むこと、笑うこと、顔をしかめること、泣くこと、頷くこと、首を振ること、頭部を傾けること、又は仮想コンテンツに関連する何かを言うことよって仮想コンテンツに反応しているように見えることを示す場合、仮想コンテンツの把握及び／又は理解レベルのその判定及び／又は推定を増加させることができる。いくつかの例では、把握エンジン２４０は、属性エンジン２３０によって判定された知覚関連属性が、ユーザが例えば、顔をしかめること、泣くこと、（例えば、「いいえ」の動きで）首を振ること、又は言葉で否定的な感情を表現することによって仮想コンテンツに否定的に反応しているように見えることを示す場合、これらは、仮想コンテンツを高レベルで理解することができないユーザの能力に起因してユーザが動揺又はいら立っていることを示し得るので、仮想コンテンツの把握及び／又は理解レベルのその判定及び／又は推定を減少させることができる。

【0080】

[0094] いくつかの例では、把握エンジン２４０は、コンテキストデータに基づいて、ユーザによる仮想コンテンツに対する把握及び／又は理解レベルを、判定及び／又は推定することができる。コンテキストデータには、例えば、仮想コンテンツに対するユーザによる反応を含むことができる。いくつかの例では、把握エンジン２４０は、仮想コンテンツが、ユーザが実施することを要求する、又はユーザが実施することを提案するアクションを、ユーザが実施したという識別に基づいて、ユーザによる仮想コンテンツの把握及び／又は理解レベルのその判定及び／又は推定を増加させることができる。例えば、仮想コンテンツが、ユーザがオブジェクトを拾い上げることを要求し、ＸＲシステム２００が、（例えば、ユーザ対面センサ２０５及び／又は環境対面センサ２１０からのセンサデータに基づいて）ユーザがオブジェクトを拾い上げたと判定した場合、把握エンジン２４０は、ユーザが仮想コンテンツを高い把握及び／又は理解レベルまで把握及び／又は理解したと、判定及び／又は推定することができる。いくつかの例では、把握エンジン２４０は、仮想コンテンツが、ユーザが行うことを要求又は提案するものとは反対のアクションをユーザが実施したという識別に基づいて、ユーザによる仮想コンテンツに対する把握及び／又は理解レベルのその判定及び／又は推定を減少させることができる。例えば、仮想コンテンツが、ユーザが特定の街路に曲がることを要求する運転指示を提供し、ＸＲシステム２００が、（例えば、ユーザ対面センサ２０５及び／又は環境対面センサ２１０からのセンサデータに基づいて）ユーザがその街路を曲がっていないと判定した場合、把握エンジン２４０は、ユーザが仮想コンテンツを低い把握及び／又は理解レベルまで把握及び／又は理解したと、判定及び／又は推定することができる。

【0081】

[0095] コンテキストデータには、例えば、ユーザ及び／又は環境内で検出された他のオブジェクトのロケーション、ＸＲシステム２００のロケーション、ＸＲシステム２００の状態（例えば、低バッテリ又は高バッテリ）、時刻、ＸＲシステム２００のユーザインターフェースを介して受信されたユーザ入力、ＸＲシステムによって表示された以前の仮想コンテンツ、ディスプレイ２２５の解像度、ユーザ及び／又はＸＲシステム２００の移動速度、ＸＲシステム２００の周りの環境が静的であるか動的であるか、環境障害物検出、環境雑音レベル、第２の人物がユーザに話しかけていること、又はそれらの何らかの組み合わせを含むことができる。いくつかの例では、把握エンジン２４０は、ユーザが運転中ではなく歩行中である場合、ユーザによる仮想コンテンツに対する把握及び／又は理解レベルのより高い判定及び／又は推定を提供することができる。なぜなら、ユーザは、歩行中よりも運転中の方が仮想コンテンツによってより注意散漫になり得るからである。ＸＲシステム２００は、場合によっては、安全性を向上させるために、ユーザが運転を停止するまで仮想コンテンツの表示を遅延させてもよい。いくつかの例では、把握エンジン２４０は、ユーザ及び／又はＸＲシステム２００の周りの環境雑音レベルが、環境雑音レベルがより高い場合よりも低い場合に、ユーザによる仮想コンテンツに対する把握及び／又は理解レベルのより高い判定及び／又は推定を提供することができる。なぜなら、より低い環境雑音レベルは、より高い環境雑音レベルよりも、ユーザにとって仮想コンテンツによる注意散漫がより少ないことを示唆するからである。いくつかの例では、把握エンジン２４０は、ユーザに話しかけている第２の人物がいない場合よりも、第２の人物がユーザに話しかけている場合に、ユーザによる仮想コンテンツに対する把握及び／又は理解レベルのより低い判定及び／又は推定を提供することができる。なぜなら、ユーザに話しかけている第２の人物が仮想コンテンツからユーザの気を散らすからである。いくつかの例では、把握エンジン２４０は、ユーザ及び／又はＸＲシステム２００がより速い速度ではなくより遅い速度で移動している場合に、ユーザによる仮想コンテンツに対する把握及び／又は理解レベルのより高い判定及び／又は推定を提供することができる。なぜなら、ユーザは、より遅い速度で移動している間よりも、より速い速度で移動しているときに、仮想コンテンツによってより注意散漫になる可能性があるからである。ＸＲシステム２００は、ユーザが車両を運転又は別様に操作している場合の安全性を向上させるために、ユーザがより遅い速度に減速するまで仮想コンテンツの表示を遅延させてもよい。いくつかの例では、把握エンジン２４０は、早朝又は深夜よりも午後の間に、ユーザによる仮想コンテンツに対する把握及び／又は理解レベルのより高い判定及び／又は推定を提供することができる。なぜなら、ユーザは早朝又は深夜よりも午後の間の疲労がより少ない可能性が高いからである。

【0082】

[0096] 把握エンジン２４０によって出力される、ユーザによる仮想コンテンツに対する把握又は理解レベルは、例えば、仮想コンテンツがディスプレイ２２５に表示されている間に、ユーザが自分の眼を閉じた場合、かつ／又は仮想コンテンツの位置から非常に遠くを見た場合、ユーザによる仮想コンテンツに対する把握又は理解が全くないことを示す値であり得る。把握エンジン２４０によって出力される、ユーザによる仮想コンテンツに対する把握又は理解レベルは、ユーザによる仮想コンテンツの非常に高い知覚を示す値とすることができ、例えば、仮想コンテンツが長期間表示される位置をユーザが凝視していた場合、仮想コンテンツは低い複雑さを有し、仮想コンテンツは低い一意性を有し、かつユーザに関連付けられた履歴データは、ユーザが、仮想データが関している主題に非常に精通していることを示す。把握エンジン２４０によって出力される、ユーザによる仮想コンテンツに対する知覚レベルは、上記の把握又は理解なしの例よりも高い知覚レベルを示す値と、上記の高い把握又は理解の例よりも低い知覚レベルを示す値との間の値であり得る。

【0083】

[0097] 図２において、把握エンジン２４０は、仮想コンテンツ（四面体によって表される）からユーザの心への点線矢印によって表される、ユーザが仮想コンテンツを把握又は理解しているかどうかを識別するものとして示されている。いくつかの例では、把握エンジン２４０は、コンピューティングシステム１１００のプロセッサ１１１０、画像プロセッサ１５０、ホストプロセッサ１５２、ＩＳＰ１５４、又はそれらの組み合わせなどのプロセッサ上で実行される、プログラムに対応する命令セットなどのソフトウェア要素を含む。いくつかの例では、把握エンジン２４０は、１つ又は複数のハードウェア要素を含む。例えば、把握エンジン２４０は、コンピューティングシステム１１００のプロセッサ１１１０、画像プロセッサ１５０、ホストプロセッサ１５２、ＩＳＰ１５４、又はそれらの組み合わせなどのプロセッサを含むことができる。いくつかの例では、把握エンジン２４０は、１つ又は複数のソフトウェア要素と１つ又は複数のハードウェア要素との組み合わせを含む。いくつかの例では、把握エンジン２４０は、１つ若しくは複数のＡＩアルゴリズム及び／又は１つ若しくは複数のＭＬシステムを含む、かつ／又は実行する。１つ若しくは複数のＡＩアルゴリズム及び／又は１つ若しくは複数のＭＬシステムは、属性エンジン２３０によって生成された１つ又は複数の知覚関連属性（及び／又はユーザ焦点センサ２０５によって捕捉されたセンサデータ）を入力として受信することができ、仮想コンテンツに対する知覚レベルを出力することができる。把握エンジン２４０の１つ又は複数のＭＬシステムの例は、第３のトレーニングされたＭＬモデル８６５及び／又はニューラルネットワーク９００を含む。

【0084】

[0098] 合成器２２０及びディスプレイ２２５は両方とも、図２のＸＲシステム２００内に２回、すなわちＸＲシステム２００の左側に１回、ＸＲシステム２００の右側に１回示されている。合成器２２０及びディスプレイ２２５のこれらの２つのインスタンスは、同じ合成器２２０及び／又は同じディスプレイ２２５を、異なる時点で表すことができることを理解されたい。例えば、ＸＲシステム２００の左側に示された合成器２２０及びディスプレイ２２５は、第１の表示設定２５０を生成する合成器２２０と、第１の表示設定２５０に基づいて環境のビューの上にオーバーレイされた仮想コンテンツを表示するディスプレイ２２５とを表す。ＸＲシステム２００の右側に示された合成器２２０及びディスプレイ２２５は、第１の表示設定２５０を少なくとも部分的に修正することによって第２の表示設定２５５を生成する合成器２２０と、第２の表示設定２５５に基づいて環境のビューの上にオーバーレイされた仮想コンテンツを表示するディスプレイ２２５とを表す。

【0085】

[0099] 合成器２２０は、１つ又は複数のファクタに基づいて第２の表示設定２５５を生成するために、第１の表示設定２５０の修正を実施することができる。これらのファクタには、例えば、知覚エンジン２３５によって判定されるような、ユーザによる仮想コンテンツに対する知覚レベル、把握エンジン２４０によって判定されるような、ユーザによる仮想コンテンツに対する把握及び／又は理解レベル、属性エンジン２３０によって判定されるユーザの知覚関連属性、ユーザに関する履歴データ、コンテキストデータ、ユーザ対面センサ２０５からのセンサデータ、環境対面センサ２１０からのセンサデータ、又はそれらの組み合わせを含むことができる。第２の表示設定２５５を生成するための合成器２２０による第１の表示設定２５０の修正は、仮想コンテンツの態様を変更することができる。例えば、修正により、仮想コンテンツの、並びに／又は仮想コンテンツの特定の要素若しくは部分の、位置、向き、深度、サイズ、色、フォントサイズ、フォント色、テキスト言語、及び／若しくは他の性質を変更することができる。いくつかの例では、修正により、ディスプレイ２２５上の仮想コンテンツの表示を削除する、消去する、非表示にする、かつ／又は終了することができる。場合によっては、修正により、ディスプレイ２２５上に表示するための追加の仮想コンテンツを追加することができる。１つの例示的な例では、知覚エンジン２３５が、ユーザが仮想コンテンツを高レベルまで知覚したことを示し、かつ／又は把握エンジン２４０が、ユーザが仮想コンテンツを高レベルまで把握したことを示した場合、合成器２２０は、ディスプレイ２２５に表示された仮想コンテンツを縮小するか、又はディスプレイ２２５上の仮想コンテンツの表示を終了することさえできる。一方、知覚エンジン２３５が、ユーザが仮想コンテンツを低レベルまで知覚したことを示し、かつ／又は把握エンジン２４０が、ユーザが仮想コンテンツを低レベルまで把握したことを示すが、属性エンジン２３０からの知覚関連属性が、ユーザが仮想コンテンツを知覚及び／又は把握しようとしていることを示した場合、合成器２２０は、ディスプレイ２２５に表示されたサイズ、仮想コンテンツを大きくし、かつ／又は仮想コンテンツの英数字列のフォントサイズを大きくすることができ、ユーザの注意散漫を低減するために、ディスプレイ２２５上の他の仮想コンテンツの表示を縮小及び／又は終了させることができる。

【0086】

[0100] 図２において、ＸＲシステム２００の左側の合成器２２０は、（四面体によって表される）仮想コンテンツが小さい、第１の表示設定２５０に従って、（家によって表される）環境のビューに、（四面体によって表される）仮想コンテンツを追加するものとして示されている。図２において、ＸＲシステム２００の左側のディスプレイ２２５は、（四面体によって表される）仮想コンテンツ及び（家によって表される）環境のビューの両方のビューを、（四面体によって表される）仮想コンテンツが小さい、第１の表示設定２５０に従って、表示及び／又は提供するディスプレイとして示されている。図２において、ＸＲシステム２００の右側の合成器２２０は、（四面体によって表される）仮想コンテンツが大きい、第２の表示設定２５５に従って、（家によって表される）環境のビューに、（四面体によって表される）仮想コンテンツを追加するものとして示されている。図２において、ＸＲシステム２００の右側のディスプレイ２２５は、（四面体によって表される）仮想コンテンツ及び（家によって表される）環境のビューの両方のビューを、（四面体によって表される）仮想コンテンツが大きい、第２の表示設定２５５に従って、表示及び／又は提供するディスプレイとして示されている。

【0087】

[0101] いくつかの例では、ＸＲシステム２００は、フィードバックエンジン２６０を含む。フィードバックエンジン２６０は、ユーザインターフェースから受信されたフィードバックを検出することができる。フィードバックは、仮想コンテンツ、第１の表示設定２５０から第２の表示設定２５５への合成器２２０による修正、及び／又は第１の表示設定２５０から第２の表示設定２５５への合成器２２０による修正が基づくＸＲシステム２００による判定に関するフィードバックであり得る。ＸＲシステム２００による判定は、例えば、知覚エンジン２３５によって判定されるような、ユーザによる仮想コンテンツに対する知覚レベル、把握エンジン２４０によって判定されるような、ユーザによる仮想コンテンツに対する把握及び／又は理解レベル、属性エンジン２３０によって判定される知覚関連属性、ユーザに関する履歴データ、コンテキストデータ、ユーザ対面センサ２０５からのセンサデータ、環境対面センサ２１０からのセンサデータ、又はそれらの組み合わせを含むことができる。フィードバックエンジン２６０によって受信されるフィードバックは、肯定的フィードバック又は否定的フィードバックであり得る。例えば、仮想コンテンツが、ユーザが特定のアクション（例えば、右折）を実施することを要求又は提案し、ユーザがそのアクションを実施した場合、フィードバックエンジン２６０は、ユーザによるアクションのこの実施を、肯定的フィードバックとして解釈することができる。肯定的なフィードバックはまた、ユーザが微笑んでいる、笑っている、頷いている、肯定的な発言（例えば、「はい」、「確認しました」、「分かりました」、「次」）をする、又は別様に仮想コンテンツに対して肯定的に反応するなどの知覚関連属性に基づくこともできる。一方、仮想コンテンツが、ユーザが特定のアクションを実施する（例えば、ＸＹＺ街路で右折する）ことを要求又は提案し、ユーザがそのアクションを実施しないか又は異なるアクションを実施した（例えば、ユーザがＸＹＺ街路で左折する）場合、フィードバックエンジン２６０は、ユーザによるこのアクションの非実施、又はユーザによるこの異なるアクションの実施を、否定的フィードバックとして解釈することができる。否定的フィードバックはまた、ユーザが顔をしかめる、泣く、（例えば、「いいえ」の動きで）首を振る、否定的な発言（例えば、「いいえ」、「違います」、「良くない」、「これではない」）をする、又は別様に仮想コンテンツに対して否定的に反応するなどの知覚関連属性に基づくこともできる。

【0088】

[0102] いくつかの例では、フィードバックエンジン２６０は、ＸＲシステム２００の１つ又は複数のＭＬシステムにフィードバックを提供して、ＸＲシステム２００の１つ又は複数のＭＬシステムを更新する。フィードバックエンジン２６０は、ＸＲシステム２００の１つ又は複数のＭＬシステムへのトレーニングデータとして、フィードバック、フィードバックをトリガした仮想コンテンツ、フィードバックをトリガした表示設定、フィードバックをトリガした表示設定に対する修正、知覚エンジン２３５によって判定された、ユーザによる仮想コンテンツに対する知覚レベル、把握エンジン２４０によって判定された、ユーザによる仮想コンテンツに対する把握及び／若しくは理解レベル、フィードバックに対応する属性エンジン２３０によって判定された知覚関連属性、フィードバックに対応する、ユーザに関する履歴データ、フィードバックに対応するコンテキストデータ、フィードバックに対応する、ユーザ対面センサ２０５からのセンサデータ、フィードバックに対応する、環境対面センサ２１０からのセンサデータ、又はそれらの組み合わせを提供することができる。例えば、フィードバックエンジン２６０は、そのようなトレーニングデータを、属性エンジン２３０の１つ若しくは複数のＭＬシステム（例えば、第１のトレーニングされたＭＬモデル８２５）に、知覚エンジン２３５の１つ若しくは複数のＭＬシステム（例えば、第２のトレーニングされたＭＬモデル８３５）に、把握エンジン２４０の１つ若しくは複数のＭＬシステム（例えば、第３のトレーニングされたＭＬモデル８６５）に、又はそれらの組み合わせに提供することができる。

【0089】

[0103] いくつかの例では、フィードバックエンジン２６０は、コンピューティングシステム１１００のプロセッサ１１１０、画像プロセッサ１５０、ホストプロセッサ１５２、ＩＳＰ１５４、又はそれらの組み合わせなどのプロセッサ上で実行される、プログラムに対応する命令セットなどのソフトウェア要素を含む。いくつかの例では、フィードバックエンジン２６０は、１つ又は複数のハードウェア要素を含む。例えば、フィードバックエンジン２６０は、コンピューティングシステム１１００のプロセッサ１１１０、画像プロセッサ１５０、ホストプロセッサ１５２、ＩＳＰ１５４、又はそれらの組み合わせなどのプロセッサを含むことができる。いくつかの例では、フィードバックエンジン２６０は、１つ又は複数のソフトウェア要素と１つ又は複数のハードウェア要素との組み合わせを含む。

【0090】

[0104] 経時的に、システムは、メッセージがユーザのために適所に留まるべき時間を学習し、最適化することができる。システムは、例えば、メッセージに対する信頼レベルを展開することによって、メッセージが特定の時間で読まれる／視認される尤度を決定する。高い尤度が決定された場合、眼追跡カメラを使用する必要がない場合がある。

【0091】

[0105] 図３Ａは、エクステンデッドリアリティ（ＸＲ）システム２００として使用されるヘッドマウントディスプレイ（ＨＭＤ）３１０を示す斜視図３００である。ＨＭＤ３１０は、例えば、拡張現実（ＡＲ）ヘッドセット、仮想現実（ＶＲ）ヘッドセット、複合現実（ＭＲ）ヘッドセット、エクステンデッドリアリティ（ＸＲ）ヘッドセット、又はそれらの何らかの組み合わせであってもよい。ＨＭＤ３１０は、ＸＲシステム２００の一例であってもよい。ＨＭＤ３１０は、ＨＭＤ３１０の前部に沿って第１のカメラ３３０Ａ及び第２のカメラ３３０Ｂを含む。第１のカメラ３３０Ａ及び第２のカメラ３３０Ｂは、ＸＲシステム２００の環境対面センサ２１０の例であってもよい。ＨＭＤ３１０は、ユーザの眼がディスプレイ３４０に面したときにユーザの眼に面する、第３のカメラ３３０Ｃと第４のカメラ３３０Ｄとを含む。第３のカメラ３３０Ｃ及び第４のカメラ３３０Ｄは、ＸＲシステム２００のユーザ対面センサ２０５の例であってもよい。いくつかの例では、ＨＭＤ３１０は、単一の画像センサを有する単一のカメラのみを有してもよい。いくつかの例では、ＭＨＤ３１０は、第１のカメラ３３０Ａ、第２のカメラ３３０Ｂ、第３のカメラ３３０Ｃ、及び第４のカメラ３３０Ｄに加えて、１つ又は複数の追加のカメラを含んでもよい。いくつかの例では、ＭＨＤ３１０は、第１のカメラ３３０Ａ、第２のカメラ３３０Ｂ、第３のカメラ３３０Ｃ、及び第４のカメラ３３０Ｄに加えて、１つ又は複数の追加のセンサを含んでもよく、１つ又は複数の追加のセンサは、ＸＲシステム２００のユーザ対面センサ２０５及び／又は環境対面センサ２１０の他のタイプも含んでよい。いくつかの例では、第１のカメラ３３０Ａ、第２のカメラ３３０Ｂ、第３のカメラ３３０Ｃ、及び／又は第４のカメラ３３０Ｄは、画像捕捉及び処理システム１００、画像捕捉デバイス１０５Ａ、画像処理デバイス１０５Ｂ、又はそれらの組み合わせの例であってもよい。

【0092】

[0106] ＨＭＤ３１０は、ユーザ３２０の頭部にＨＭＤ３１０を装着しているユーザ３２０に見える１つ又は複数のディスプレイ３４０を含んでもよい。ＨＭＤ３１０の１つ又は複数のディスプレイ３４０は、ＸＲシステム２００の１つ又は複数のディスプレイ２２５の例であり得る。いくつかの例では、ＨＭＤ３１０は、１つのディスプレイ３４０と２つのビューファインダとを含むことができる。２つのビューファインダは、ユーザ３２０の左眼用の左ビューファインダと、ユーザ３２０の右眼用の右ビューファインダとを含むことができる。左ビューファインダは、ユーザ３２０の左眼がディスプレイの左側を見るように向けることができる。右ビューファインダは、ユーザ３２０の左眼がディスプレイの右側を見るように向けることができる。いくつかの例では、ＨＭＤ３１０は、ユーザ３２０の左眼にコンテンツを表示する左ディスプレイと、ユーザ３２０の右眼にコンテンツを表示する右ディスプレイとを含む、２つのディスプレイ３４０を含んでもよい。ＨＭＤ３１０の１つ又は複数のディスプレイ３４０は、デジタル「パススルー」ディスプレイ又は光学「シースルー」ディスプレイであり得る。

【0093】

[0107] ＨＭＤ３１０は、ＨＭＤ３１０のユーザの１つ又は複数の耳にオーディオを出力するスピーカ及び／又はヘッドホンとして機能することができる、１つ又は複数のイヤピース３３５を含んでもよい。図３Ａ及び図３Ｂには１つのイヤピース３３５が示されているが、ＨＭＤ３１０は、ユーザの各耳（左耳及び右耳）に１つのイヤピースを有する２つのイヤピースを含むことができることを理解されたい。いくつかの例では、ＨＭＤ３１０はまた、１つ又は複数のマイクロフォン（図示せず）を含むことができる。１つ又は複数のマイクロフォンは、ＸＲシステム２００のユーザ対面センサ２０５及び／又は環境対面センサ２１０の例であり得る。いくつかの例では、ＨＭＤ３１０によって１つ又は複数のイヤピース３３５を通してユーザに出力されるオーディオは、１つ又は複数のマイクロフォンを使用して記録されたオーディオを含む、又はそれに基づくことができる。

【0094】

[0108] 図３Ｂは、ユーザ３２０によって装着されている図３Ａのヘッドマウントディスプレイ（ＨＭＤ）を示す斜視図３５０である。ユーザ３２０は、ユーザ３２０の眼の上でユーザ３２０の頭部にＨＭＤ３１０を装着する。ＨＭＤ３１０は、第１のカメラ３３０Ａ及び第２のカメラ３３０Ｂを用いて画像を捕捉することができる。いくつかの例では、ＨＭＤ３１０は、ディスプレイ３４０を使用して、１つ又は複数の出力画像をユーザ３２０の眼に向けて表示する。いくつかの例では、出力画像は、仮想コンテンツ生成器２１５によって生成され、合成器２２０を使用して合成され、かつ／又は表示設定（例えば、第１の表示設定２５０、第２の表示設定２５５）に従ってディスプレイ２２５によって表示された仮想コンテンツを含むことができる。出力画像は、例えば仮想コンテンツがオーバーレイされた状態で、第１のカメラ３３０Ａ及び第２のカメラ３３０Ｂによって捕捉された画像に基づくことができる。出力画像は、場合によっては仮想コンテンツがオーバーレイされ、かつ／又は他の修正が加えられた状態で、環境の立体視ビューを提供してもよい。例えば、ＨＭＤ３１０は、第１のカメラ３３０Ａによって捕捉された画像に基づく第１の表示画像を、ユーザ３２０の右眼に表示することができる。ＨＭＤ３１０は、第２のカメラ３３０Ｂによって捕捉された画像に基づく第２の表示画像を、ユーザ３２０の左眼に表示することができる。例えば、ＨＭＤ３１０は、第１のカメラ３３０Ａ及び第２のカメラ３３０Ｂによって捕捉された画像の上にオーバーレイされた表示画像内に、オーバーレイされた仮想コンテンツを提供することができる。第３のカメラ３３０Ｃ及び第４のカメラ３３０Ｄは、ユーザがディスプレイ３４０によって表示された表示画像を視認する前、視認中、及び／又は視認した後に、眼の画像を捕捉することができる。このようにして、第３のカメラ３３０Ｃ及び／又は第４のカメラ３３０Ｄからのセンサデータは、ユーザの眼（及び／又はユーザの他の部分）による仮想コンテンツに対する反応を捕捉することができる。ＨＭＤ３１０のイヤピース３３５は、ユーザ３２０の耳内に示されている。ＨＭＤ３１０は、イヤピース３３５を通して、及び／又はユーザ３２０の他方の耳（図示せず）内にあるＨＭＤ３１０の別のイヤピース（図示せず）を通して、オーディオをユーザ３２０に出力していてもよい。

【0095】

[0109] 図４Ａは、前向きカメラを含み、エクステンデッドリアリティ（ＸＲ）システム２００として使用することができるモバイルハンドセット４１０の前面を示す斜視図４００である。モバイルハンドセット４１０は、ＸＲシステム２００の一例であってもよい。モバイルハンドセット４１０は、例えば、携帯電話、衛星電話、ポータブルゲームコンソール、音楽プレーヤ、健康追跡デバイス、ウェアラブルデバイス、無線通信デバイス、ラップトップ、モバイルデバイス、本明細書に記載する任意の他のタイプのコンピューティングデバイス若しくはコンピューティングシステム、又はそれらの組み合わせであってもよい。

【0096】

[0110] モバイルハンドセット４１０の前面４２０は、ディスプレイ４４０を含む。モバイルハンドセット４１０の前面４２０は、第１のカメラ４３０Ａ及び第２のカメラ４３０Ｂを含む。第１のカメラ４３０Ａ及び第２のカメラ４３０Ｂは、ＸＲシステム２００のユーザ対面センサ２０５の例であってもよい。第１のカメラ４３０Ａ及び第２のカメラ４３０Ｂは、コンテンツ（例えば、環境の上にオーバーレイされた仮想コンテンツ）がディスプレイ４４０に表示されている間、ユーザの眼を含むユーザに面することができる。ディスプレイ４４０は、ＸＲシステム２００のディスプレイ２２５の一例であってもよい。

【0097】

[0111] 第１のカメラ４３０Ａ及び第２のカメラ４３０Ｂは、モバイルハンドセット４１０の前面４２０上のディスプレイ４４０の周りのベゼル内に示されている。いくつかの例では、第１のカメラ４３０Ａ及び第２のカメラ４３０Ｂは、モバイルハンドセット４１０の前面４２０上のディスプレイ４４０から切り抜かれたノッチ又は切り欠きに配置することができる。いくつかの例では、第１のカメラ４３０Ａ及び第２のカメラ４３０Ｂは、ディスプレイ４４０とモバイルハンドセット４１０の残りの部分との間に配置されたアンダーディスプレイカメラであってもよく、その結果、光は、第１のカメラ４３０Ａ及び第２のカメラ４３０Ｂに到達する前にディスプレイ４４０の一部分を通過する。斜視図４００の第１のカメラ４３０Ａ及び第２のカメラ４３０Ｂは、前向きカメラである。第１のカメラ４３０Ａ及び第２のカメラ４３０Ｂは、モバイルハンドセット４１０の前面４２０の平面に垂直な方向を向いている。第１のカメラ４３０Ａ及び第２のカメラ４３０Ｂは、モバイルハンドセット４１０の１つ又は複数のカメラのうちの２つであってもよい。第１のカメラ４３０Ａ及び第２のカメラ４３０Ｂは、センサ４０５Ａ及びセンサ４０５Ｂそれぞれであってもよい。いくつかの例では、モバイルハンドセット４１０の前面４２０は、単一のカメラのみを有することができる。

【0098】

[0112] いくつかの例では、モバイルハンドセット４１０の前面４２０は、第１のカメラ４３０Ａ及び第２のカメラ４３０Ｂに加えて、１つ又は複数の追加のカメラを含んでもよい。１つ又は複数の追加のカメラもまた、ＸＲシステム２００のユーザ対面センサ２０５の例であってもよい。いくつかの例では、モバイルハンドセット４１０の前面４２０は、第１のカメラ４３０Ａ及び第２のカメラ４３０Ｂに加えて、１つ又は複数の追加のセンサを含んでもよい。１つ又は複数の追加のセンサもまた、ＸＲシステム２００のユーザ対面センサ２０５の例であってもよい。場合によっては、モバイルハンドセット４１０の前面４２０は、２つ以上のディスプレイ４４０を含む。モバイルハンドセット４１０の前面４２０の１つ又は複数のディスプレイ４４０は、ＸＲシステム２００のディスプレイ２２５の例であり得る。例えば、１つ又は複数のディスプレイ４４０は、１つ又は複数のタッチスクリーンディスプレイを含むことができる。

【0099】

[0113] モバイルハンドセット４１０は、モバイルハンドセット４１０のユーザの１つ又は複数の耳にオーディオを出力することができる、１つ又は複数のスピーカ４３５Ａ及び／又は他のオーディオ出力デバイス（例えば、イヤホン又はヘッドホン又はそれらへのコネクタ）を含んでもよい。１つのスピーカ４３５Ａが図４Ａに示されているが、モバイルハンドセット４１０は、２つ以上のスピーカ及び／又は他のオーディオデバイスを含むことができることを理解されたい。いくつかの例では、モバイルハンドセット４１０はまた、１つ又は複数のマイクロフォン（図示せず）を含むことができる。１つ又は複数のマイクロフォンは、ＸＲシステム２００の、ユーザ対面センサ２０５及び／又は環境対面センサ２１０の例であり得る。いくつかの例では、モバイルハンドセット４１０は、モバイルハンドセット４１０の前面４２０に沿って、かつ／又はそれに隣接して１つ又は複数のマイクロフォンを含むことができ、これらのマイクロフォンは、ＸＲシステム２００のユーザ対面センサ２０５の例である。いくつかの例では、モバイルハンドセット４１０によって１つ又は複数のスピーカ４３５Ａ及び／又は他のオーディオ出力デバイスを通してユーザに出力されるオーディオは、１つ又は複数のマイクロフォンを使用して記録されたオーディオを含む、又はそれに基づくことができる。

【0100】

[0114] 図４Ｂは、後ろ向きカメラを含み、エクステンデッドリアリティ（ＸＲ）システム２００として使用することができるモバイルハンドセットの背面４６０を示す斜視図４５０である。モバイルハンドセット４１０は、モバイルハンドセット４１０の背面４６０上に第３のカメラ４３０Ｃ及び第４のカメラ４３０Ｄを含む。斜視図４５０の第３のカメラ４３０Ｃ及び第４のカメラ４３０Ｄは、後ろ向きである。第３のカメラ４３０Ｃ及び第４のカメラ４３０Ｄは、図２のＸＲデバイス２００の環境対面センサ２１０の例であってもよい。第３のカメラ４３０Ｃ及び第４のカメラ４３０Ｄは、モバイルハンドセット４１０の背面４６０の平面に垂直な方向を向いている。

【0101】

[0115] 第３のカメラ４３０Ｃ及び第４のカメラ４３０Ｄは、モバイルハンドセット４１０の１つ又は複数のカメラのうちの２つであってもよい。いくつかの例では、モバイルハンドセット４１０の背面４６０は、単一のカメラのみを有することができる。いくつかの例では、モバイルハンドセット４１０の背面４６０は、第３のカメラ４３０Ｃ及び第４のカメラ４３０Ｄに加えて、１つ又は複数の追加のカメラを含んでもよい。１つ又は複数の追加のカメラもまた、ＸＲシステム２００の環境対面センサ２１０の例であってもよい。いくつかの例では、モバイルハンドセット４１０の背面４６０は、第３のカメラ４３０Ｃ及び第４のカメラ４３０Ｄに加えて、１つ又は複数の追加のセンサを含んでもよい。１つ又は複数の追加のセンサもまた、ＸＲシステム２００の環境対面センサ２１０の例であってもよい。いくつかの例では、第１のカメラ４３０Ａ、第２のカメラ４３０Ｂ、第３のカメラ４３０Ｃ、及び／又は第４のカメラ４３０Ｄは、画像捕捉及び処理システム１００、画像捕捉デバイス１０５Ａ、画像処理デバイス１０５Ｂ、又はそれらの組み合わせの例であってもよい。

【0102】

[0116] モバイルハンドセット４１０は、モバイルハンドセット４１０のユーザの１つ又は複数の耳にオーディオを出力することができる、１つ又は複数のスピーカ４３５Ｂ及び／又は他のオーディオ出力デバイス（例えば、イヤホン又はヘッドホン又はそれらへのコネクタ）を含んでもよい。１つのスピーカ４３５Ｂが図４Ｂに示されているが、モバイルハンドセット４１０は、２つ以上のスピーカ及び／又は他のオーディオデバイスを含むことができることを理解されたい。いくつかの例では、モバイルハンドセット４１０はまた、１つ又は複数のマイクロフォン（図示せず）を含むことができる。１つ又は複数のマイクロフォンは、ＸＲシステム２００の、ユーザ対面センサ２０５及び／又は環境対面センサ２１０の例であり得る。いくつかの例では、モバイルハンドセット４１０は、モバイルハンドセット４１０の背面４６０に沿って、かつ／又はそれに隣接して、ＸＲシステム２００の環境対面センサ２１０の例である１つ又は複数のマイクロフォンを含むことができる。いくつかの例では、モバイルハンドセット４１０によって１つ又は複数のスピーカ４３５Ｂ及び／又は他のオーディオ出力デバイスを通してユーザに出力されるオーディオは、１つ又は複数のマイクロフォンを使用して記録されたオーディオを含む、又はそれに基づくことができる。

【0103】

[0117] モバイルハンドセット４１０は、前面４２０のディスプレイ４４０をパススルーディスプレイとして使用してもよい。例えば、ディスプレイ４４０は、出力画像を表示してもよい。出力画像は、例えば仮想コンテンツがオーバーレイされた状態で、第３のカメラ４３０Ｃ及び／又は第４のカメラ４３０Ｄによって捕捉された画像に基づくことができる。第１のカメラ４３０Ａ及び／又は第２のカメラ４３０Ｂは、仮想コンテンツを含む出力画像のディスプレイ４４０上への表示前、表示中、及び／又は表示後に、ユーザの眼（及び／又はユーザの他の部分）の画像を捕捉することができる。このようにして、第１のカメラ４３０Ａ及び／又は第２のカメラ４３０Ｂからのセンサデータは、ユーザの眼（及び／又はユーザの他の部分）による仮想コンテンツに対する反応を捕捉することができる。

【0104】

[0118] 図５Ａは、表示設定５２０に従って表示される仮想コンテンツのオーバーレイ前及びオーバーレイ後の、ボストンの環境５１０の画像５０５を示す概念図５００である。図５Ａの左側には、ボストンの環境５１０の画像５０５が、仮想コンテンツのオーバーレイなし（オーバーレイ前）の状態で示されている。図５Ａの右側には、ボストンの環境５１０の画像５０５が、仮想コンテンツ５２５、仮想コンテンツ５３０、及び仮想コンテンツ５３５を含む仮想コンテンツのオーバーレイあり（オーバーレイ後）の状態で示されている。仮想コンテンツは、表示設定５２０に従って環境５１０の画像５０５の上にオーバーレイされる。

【0105】

[0119] 環境５１０の画像５０５は、ＸＲシステム２００の環境対面センサ２１０によって捕捉された画像の一例であり得る。例えば、環境５１０の画像５０５は、ＨＭＤ３１０の第１のカメラ３３０Ａ及び／又は第２のカメラ３３０Ｂによって捕捉された画像の一例であり得る。同様に、環境５１０の画像５０５は、モバイルハンドセット４１０の第３のカメラ４３０Ｃ及び／又は第４のカメラ４３０Ｄによって捕捉された画像の一例であり得る。ボストンの環境５１０の画像５０５は、ボストン・セルティックスのコーチ、レッド・アワーバック像のビューを含む。ボストンの環境５１０の画像５０５は、ボストン・セルティックスの選手、ラリー・バードの靴の記念碑のビューを含む。ボストンの環境５１０の画像５０５は、スポーツアパレル店への入口のビューを含む。

【0106】

[0120] 仮想コンテンツ５２５、仮想コンテンツ５３０、仮想コンテンツ５３５は、ＸＲシステム２００の仮想コンテンツ生成器２１５によって生成された仮想コンテンツの一例である。表示設定５２０は、ＸＲシステム２００の合成器２２０によって生成された第１の表示設定２５０の例である。仮想コンテンツ５２５は、「ランドマーク：ボストン・セルティックス選手、ラリー・バードの靴の記念碑」と書かれたテキストを含む。表示設定によって、仮想コンテンツ５２５は、画像５０５においてラリー・バードの靴の記念碑が描写されている画像５０５の下部付近で、環境５１０の画像５０５の上にオーバーレイされている。仮想コンテンツ５３０は、「ランドマーク：ボストン・セルティックスのコーチ、レッド・アワーバックの像」と書かれたテキストを含む。表示設定によって、仮想コンテンツ５３０は、画像５０５においてレッド・アワーバックの像が描写されている画像５０５の中央付近で、環境５１０の画像５０５の上にオーバーレイされている。仮想コンテンツ５３５は、「商店：スポーツアパレル店」と書かれたテキストを含む。表示設定によって、仮想コンテンツ５３０は、画像５０５においてスポーツアパレル店の入口が描写されている画像５０５の右側付近で、環境５１０の画像５０５の上にオーバーレイされている。

【0107】

[0121] 図５Ｂは、表示設定５２０に対する修正前及び修正後に仮想コンテンツがオーバーレイされた状態の、ボストンの環境５１０の画像５０５を示す概念図５５０である。図５Ｂの左側には、ボストンの環境５１０の画像５０５が、図５Ａの右側と同様に、表示設定５２０に従って仮想コンテンツのオーバーレイとともに示されている。図５Ｂの右側には、ボストンの環境５１０の画像５０５が、表示設定５５５に従って仮想コンテンツのオーバーレイとともに示されている。表示設定５５５は、表示設定５２０とは異なる。表示設定５５５は、ＸＲシステム２００の合成器２２０によって生成される第２の表示設定２５５の一例であり得る。表示設定５２０に対する修正、すなわち、表示設定５２０から表示設定５５５への修正は、ＸＲシステム２００の合成器２２０による、第１の表示設定２５０から第２の表示設定２５５への修正の一例であり得る。

【0108】

[0122] 第２の表示設定５５５に従って、（スポーツアパレル店を記述する）仮想コンテンツ５３５は、ここでは表示から非表示にされる、消去される、かつ／又は終了される。いくつかの例では、第２の表示設定５５５における仮想コンテンツ５３５を消去するこの修正は、ユーザがすでに仮想コンテンツ５３５を高レベルまで知覚及び／又は理解したという、ＸＲシステム２００からの（例えば、知覚エンジン２３５及び／又は把握エンジン２４０からの）指示に応答したものであってよい。いくつかの例では、第２の表示設定５５５における仮想コンテンツ５３５を消去するこの修正は、商店に関連する仮想コンテンツをフィルタ除去するための要求、仮想コンテンツ５３５の意図的な回避、ユーザが仮想コンテンツ５３５を見ている間のユーザからの否定的な言語表現（例えば、「いいえ」）の検出、又はそれらの組み合わせなど、フィードバックエンジン２６０を介して受信された仮想コンテンツ５３５への否定的フィードバックに応答したものであってよい。いくつかの例では、第２の表示設定５５５における仮想コンテンツ５３５を消去するこの修正は、ユーザから（例えば、フィードバックエンジン２６０のユーザインターフェースを介して）受信された、ランドマークに関連する仮想コンテンツに焦点を絞るための要求、又は仮想コンテンツ５２５及び／若しくは仮想コンテンツ５３０に高度に焦点を絞るための要求など、フィードバックエンジン２６０を介して受信された仮想コンテンツ５２５及び／又は仮想コンテンツ５３０への肯定的フィードバックに応答したものであってよい。

【0109】

[0123] 第２の表示設定５５５によれば、（ラリー・バードの靴の記念碑を記述する）仮想コンテンツ５２５は、ここでは第１の表示設定５２０に従ったものよりも大きく、テキストはより大きなフォントである。第２の表示設定５５５によれば、仮想コンテンツ５２５は、第１の表示設定５２０に従ったものよりも顕著に、かつ／又はより高い優先度で強調及び／又は表示されている。ここでは仮想コンテンツ５２５のテキストも長くなり、その結果、「ランドマーク：１９７９～１９９２年にボストン・セルティックスの選手だったラリー・バードの靴の記念碑」と書かれている。いくつかの例では、第２の表示設定５５５において仮想コンテンツ５２５を強調するこの修正は、ユーザが仮想コンテンツ５２５をユーザ知覚の十分なレベル（例えば、閾値を超える）まで知覚したが、仮想コンテンツ５２５をまだ十分な把握レベル（例えば、閾値を超える）までは理解していないという、ＸＲシステム２００からの（例えば、知覚エンジン２３５及び／又は把握エンジン２４０からの）指示に応答したものであってよい。いくつかの例では、第２の表示設定５５５における仮想コンテンツ５２５を強調するこの修正は、ユーザが仮想コンテンツ５２５を固視している、かつ／又は仮想コンテンツ５２５に対するサッカードを経験した、かつ／又は仮想コンテンツ５２５を視認している間に瞳孔拡張を経験したという、ＸＲシステム２００からの（例えば、知覚エンジン２３５及び／又は把握エンジン２４０及び／又は知覚関連属性エンジン２３０からの）指示に応答したものであってよい。いくつかの例では、第２の表示設定５５５における仮想コンテンツ５２５を強調するこの修正は、仮想コンテンツ及び／若しくはラリー・バードの靴の記念碑の関連描写に対するユーザの視線の強い焦点、ユーザが仮想コンテンツ５２５を見ている間のユーザからの肯定的な言語表現（例えば、「これについてもっと教えて」）の検出、又はそれらの組み合わせなど、フィードバックエンジン２６０を介して受信された仮想コンテンツ５２５への肯定的フィードバックに応答したものであってよい。いくつかの例では、第２の表示設定５５５における仮想コンテンツ５２５を強調するこの修正は、仮想コンテンツ５３５及び／又は仮想コンテンツ５３０への否定的フィードバックに応答したものであってよい。

【0110】

[0124] 第２の表示設定５５５によれば、（レッド・アワーバックの像を記述する）仮想コンテンツ５３０は、わずかに右に移動され、（深度に関して）後方に移動されて、レッド・アワーバックの像の頭部の一部の背後に現れている。いくつかの例では、第２の表示設定５５５における仮想コンテンツ５３０を移動させるこの修正は、ユーザが仮想コンテンツ５３０を十分なレベル（例えば、閾値を超える）までまだ知覚及び／又は把握していないという、ＸＲシステム２００からの（例えば、知覚エンジン２３５及び／又は把握エンジン２４０からの）指示に応答したものであってよい。いくつかの例では、第２の表示設定５５５における仮想コンテンツ５３０を移動させるこの修正は、ユーザから（例えば、フィードバックエンジン２６０のユーザインターフェースを介して）受信された、ランドマークに関連する仮想コンテンツに焦点を絞るための要求など、フィードバックエンジン２６０を介して受信された仮想コンテンツ５３０及び／又は仮想コンテンツ５２５への肯定的フィードバックに応答したものであってよい。

【0111】

[0125] 図６は、表示設定６２０に従って表示される仮想コンテンツ６３０のオーバーレイ前及びオーバーレイ後の、本を含む環境６１０の画像６０５を示す概念図６００である。図６の左側には、本を含む環境６１０の画像６０５が、仮想コンテンツ６３０のオーバーレイなし（オーバーレイ前）の状態で示されている。明確にするために、画像６０５内の本のテキストに示される唯一の単語は、「超伝導」である。図６の左側には、本を含む環境６１０の画像６０５が、仮想コンテンツ６３０のオーバーレイあり（オーバーレイ後）の状態で示されている。仮想コンテンツ６３０は、表示設定６２０に従って環境６１０の画像６０５の上にオーバーレイされる。

【0112】

[0126] 環境６１０の画像６０５は、ＸＲシステム２００の環境対面センサ２１０によって捕捉された画像の一例であり得る。例えば、環境６１０の画像６０５は、ＨＭＤ３１０の第１のカメラ３３０Ａ及び／又は第２のカメラ３３０Ｂによって捕捉された画像の一例であり得る。同様に、環境６１０の画像６０５は、モバイルハンドセット４１０の第３のカメラ４３０Ｃ及び／又は第４のカメラ４３０Ｄによって捕捉された画像の一例であり得る。

【0113】

[0127] 仮想コンテンツ６３０は、ＸＲシステム２００の仮想コンテンツ生成器２１５によって生成された仮想コンテンツの一例である。表示設定６２０は、ＸＲシステム２００の合成器２２０によって生成された表示設定（例えば、第１の表示設定２５０、第２の表示設定２５５）の一例である。仮想コンテンツ６３０は、本の中の単語「超伝導」の強調表示を含み、本の上方に、「定義：超伝導は、電気抵抗が消失し、磁束場が物質から放出される特定の物質において観察される一連の物理的な性質である。これらの性質を示す物質はいずれも超伝導体である。」と書かれた追加のテキストがオーバーレイされている。

【0114】

[0128] いくつかの例では、表示設定６２０に従って本を含む環境６１０の画像６０５の上にオーバーレイされた仮想コンテンツ６３０の表示は、ユーザが本の中の単語「超伝導」を固視している間に眼を細めている、かつ／又は頭部を傾けているというＸＲシステム２００からの（例えば、知覚エンジン２３５及び／又は把握エンジン２４０及び／又は属性エンジン２３０からの）指示に応答したものであってよい。いくつかの例では、ＸＲシステム２００は、他の単語についても同様に定義を提供する。いくつかの例では、ＸＲシステム２００は、１つの言語から別の言語への単語の翻訳を同様に提供する。

【0115】

[0129] 図７は、表示設定７２０に従って表示される仮想コンテンツ７３０のオーバーレイ前及びオーバーレイ後の、街路の環境７１０の画像７０５を示す概念図７００である。図７の左側には、街路上の環境７１０の画像７０５が、仮想コンテンツ７３０のオーバーレイなし（オーバーレイ前）の状態で示されている。図７の左側には、街路上の環境７１０の画像７０５が、仮想コンテンツ７３０のオーバーレイあり（オーバーレイ後）の状態で示されている。仮想コンテンツ７３０は、表示設定７２０に従って環境７１０の画像７０５の上にオーバーレイされる。

【0116】

[0130] 環境７１０の画像７０５は、ＸＲシステム２００の環境対面センサ２１０によって捕捉された画像の一例であり得る。例えば、環境７１０の画像７０５は、ＨＭＤ３１０の第１のカメラ３３０Ａ及び／又は第２のカメラ３３０Ｂによって捕捉された画像の一例であり得る。同様に、環境７１０の画像７０５は、モバイルハンドセット４１０の第３のカメラ４３０Ｃ及び／又は第４のカメラ４３０Ｄによって捕捉された画像の一例であり得る。

【0117】

[0131] 仮想コンテンツ７３０は、ＸＲシステム２００の仮想コンテンツ生成器２１５によって生成された仮想コンテンツの一例である。表示設定７２０は、ＸＲシステム２００の合成器２２０によって生成された表示設定（例えば、第１の表示設定２５０、第２の表示設定２５５）の一例である。街路上の環境７１０の画像７０５は、カメラに向かって、ひいてはＸＲシステム２００のユーザに向かって走る車を描写している。仮想コンテンツ７３０は、警告アイコンと「警告：車が進入してきます、移動してください！」と書かれたテキストとを伴う警告を含む。警告、及びテキストのフォントサイズは大きい。

【0118】

[0132] いくつかの例では、表示設定７２０に従って街路上の環境７１０の画像７０５の上にオーバーレイされた仮想コンテンツ７３０の表示は、ＸＲシステム２００による環境対面センサ２１０のセンサデータからの車の検出に応答したものであってよい。ＸＲシステム２００は、オブジェクト検出エンジンを含んでもよい。オブジェクト検出エンジンは、特徴検出アルゴリズム、特徴抽出アルゴリズム、特徴認識アルゴリズム、特徴追跡アルゴリズム、オブジェクト検出アルゴリズム、オブジェクト認識アルゴリズム、オブジェクト追跡アルゴリズム、顔検出アルゴリズム、顔認識アルゴリズム、顔追跡アルゴリズム、人物検出アルゴリズム、人物認識アルゴリズム、人物追跡アルゴリズム、車両検出アルゴリズム、車両認識アルゴリズム、車両追跡アルゴリズム、分類器、又はそれらの組み合わせを含んでもよい。オブジェクト検出エンジンは、１つ若しくは複数のＡＩアルゴリズム及び／又はＭＬシステムを含むことができる。オブジェクト検出エンジンは、例えば、ニューラルネットワーク９００を含むことができる。いくつかの例では、表示設定７２０に従って街路上の環境７１０の画像７０５の上にオーバーレイされた仮想コンテンツ７３０の表示は、ユーザがＸＲシステム２００によって検出された車を十分なレベルまで（例えば、閾値を超えるレベルまで）知覚しなかったというＸＲシステム２００からの（例えば、知覚エンジン２３５及び／又は把握エンジン２４０及び／又は属性エンジン２３０からの）指示に応答したものであってよい。

【0119】

[0133] 図８は、１つ又は複数のトレーニングされた機械学習（ＭＬ）モデルに基づいて仮想コンテンツに対する知覚レベル及び把握レベルを判定するためのプロセスを示すブロック図８００である。図８のプロセスは、図２のＸＲシステム２００などの撮像システムによって実施される。

【0120】

[0134] プロセスは、ユーザ８２０の片眼又は両眼８１５に面した１つ又は複数のセンサ８１０によるセンサデータ８０５の捕捉から始まる。センサ８１０は、ＸＲシステム２００のユーザ対面センサ２０５の例であり得る。撮像システムは、入力として、センサデータ８０５を第１のトレーニングされたＭＬモデル８２５に提供する。第１のトレーニングされたＭＬモデル８２５は、撮像システムの一部であってもよい。第１のトレーニングされたＭＬモデル８２５は、いくつかの例では、ＸＲシステム２００の属性エンジン２３０の一部であってもよい。入力としてセンサデータ８０５を受信したことに応答して、第１のトレーニングされたＭＬモデル８２５は、ユーザ８２０の眼８１５に対応する知覚関連属性データ８３０を出力する。知覚関連属性データ８３０は、例えば、ユーザの眼の運動、瞳孔拡張、瞬き、眼を細めること、サッカード、固視、眼の水分レベルなどを識別することができる。

【0121】

[0135] 撮像システムは、入力として、知覚関連属性データ８３０を第２のトレーニングされたＭＬモデル８３５に提供する。撮像システムはまた、入力として、ディスプレイ８４５を介して仮想コンテンツ８４０を表示するための表示設定８３７を、第２のトレーニングされたＭＬモデル８３５に提供する。ディスプレイ８４５は、ＸＲシステム２００のディスプレイ２２５の一例である。表示設定８３７は、ＸＲシステム２００の第１の表示設定２５０及び／又は第２の表示設定２５５の例である。撮像システムはまた、入力として、コンテキスト情報８９０を第２のトレーニングされたＭＬモデル８３５に提供することができる。コンテキスト情報は、例えば、撮像システムのロケーション、周囲音、周囲照明、ユーザによって実施されているものとして検出された活動などを含むことができる。

【0122】

[0136] 第２のトレーニングされたＭＬモデル８３５は、撮像システムの一部であってもよい。第２のトレーニングされたＭＬモデル８３５は、いくつかの例では、ＸＲシステム２００の知覚エンジン２３５の一部であってもよい。知覚関連属性データ８３０及び／又は表示設定８３７及び／又はコンテキスト情報８９０を入力として受信したことに応答して、第２のトレーニングされたＭＬモデル８３５は、眼８１５を使用したユーザ８２０による仮想コンテンツ８４０に対する知覚レベル８５０を出力する。仮想コンテンツ８４０は、ＸＲシステム２００の仮想コンテンツ生成器２１５によって生成され、ＸＲシステム２００の合成器２２０によって決定された表示設定（例えば、第１の表示設定２５０、第２の表示設定２５５）に従ってＸＲシステム２００のディスプレイ２２５によって表示される仮想コンテンツの一例であり得る。ユーザ８２０による仮想コンテンツ８４０に対する知覚レベル８５０は、例えば、仮想コンテンツ８４０が表示設定８３７に従って表示されるディスプレイ８４５上の位置に、又はその近くに、ユーザ８２０の眼８１５の視線が入る程度（例えば、時間及び／又は距離に基づく）に基づくことができる。

【0123】

[0137] 撮像システムは、入力として、ユーザ８２０による仮想コンテンツ８４０に対する知覚レベル８５０を第３のトレーニングされたＭＬモデル８６５に提供する。いくつかの例では、撮像システムはまた、入力として、ユーザ８２０に関連付けられた履歴データ８５５を第３のトレーニングされたＭＬモデル８６５に提供してもよい。いくつかの例では、撮像システムはまた、入力として、コンテキスト情報８９０を第３のトレーニングされたＭＬモデル８６５に提供してもよい。ユーザ８２０に関連付けられた履歴データ８５５は、例えば、ユーザ８２０の教育レベル、ユーザ８２０の職業、ユーザ８２０の履歴行動に関する情報、及び／又はユーザに関連付けられた任意の他の履歴情報を識別することができる。いくつかの例では、撮像システムはまた、入力として、仮想コンテンツの１つ又は複数の特性を第３のトレーニングされたＭＬモデル８６５に提供してもよい。例えば、仮想コンテンツの１つ又は複数の特性は、仮想コンテンツ評価エンジン（例えば、ＸＲシステム２００の仮想コンテンツ評価エンジン２４５など）によって生成された仮想コンテンツ８４０の評価を含んでもよい。評価は、例えば、仮想コンテンツ８４０の複雑さ及び／又は一意性に関する１つ又は複数のメトリックを含むことができる。いくつかの例では、仮想コンテンツ評価エンジンは、複雑さメトリック及び一意性メトリックを生成することができ、これらの２つのメトリックを、複雑さ及び一意性の両方を反映する単一の組み合わされたメトリックに変換することができる。いくつかの例では、仮想コンテンツ評価エンジンは、組み合わせメトリックを生成するために、一意性メトリックの値と複雑さメトリックの値とを平均化する。いくつかの例では、仮想コンテンツ評価エンジンは、組み合わせメトリックを生成するために、一意性メトリックの値と複雑さメトリックの値とを乗算する。いくつかの例では、仮想コンテンツ評価エンジンは、組み合わせメトリックを生成するために、一意性メトリックの値と複雑さメトリックの値とを加算する。

【0124】

[0138] 第３のトレーニングされたＭＬモデル８６５は、撮像システムの一部であってもよい。第３のトレーニングされたＭＬモデル８６５は、いくつかの例では、ＸＲシステム２００の把握エンジン２４０の一部であってもよい。知覚レベル８５０、履歴データ８５５、評価８６０、及び／又はコンテキスト情報８９０を入力として受信したことに応答して、第３のトレーニングされたＭＬモデル８６５は、ユーザ８２０による仮想コンテンツ８４０に対する把握レベル８７０を出力する。把握レベル８７０は、把握レベルの程度８７０及び／又は把握レベルのメトリック８７０と呼ぶことができる。把握レベル８７０は、例えば、知覚レベル８５０が、仮想コンテンツ８４０の複雑さ及び／若しくは一意性を考慮する適切なレベルと一致するか又はそれを超える程度に基づく（例えば、評価８６０に基づく）、ユーザ８２０自身の背景に基づく（例えば、履歴データ８５５に基づく）、コンテキスト情報８９０に基づく、あるいはそれらの組み合わせに基づくことができる。

【0125】

[0139] 撮像システムは、仮想コンテンツ８４０に対する把握レベル８７０、仮想コンテンツ８４０に対する知覚レベル８５０、知覚関連属性データ８３０、及び／又はコンテキスト情報８９０のうちの１つ又は複数を、表示設定８３７に対する修正８７５を生成するための基礎として使用する。表示設定８３７に対する修正８７５は、ＸＲシステム２００の合成器２２０による第１の表示設定２５０から第２の表示設定２５５への修正の一例であり得る。撮像システムは、例えば、フィードバックエンジン（例えば、フィードバックエンジン２６０）のユーザインターフェースを介して、フィードバック８８０を受信することができる。撮像システムは、フィードバック８８０に基づいて、第１のトレーニングされたＭＬモデル８２５、第２のトレーニングされたＭＬモデル８３５、及び／又は第３のトレーニングされたＭＬモデル８６５の、追加のトレーニング８８５を実施することができる。撮像システムは、トレーニング８８５において、肯定的であるフィードバック８８０を使用して、第１のトレーニングされたＭＬモデル８２５、第２のトレーニングされたＭＬモデル８３５、及び／又は第３のトレーニングされたＭＬモデル８６５における重みを強化することができる。撮像システムは、トレーニング８８５において、否定的であるフィードバック８８０を使用して、第１のトレーニングされたＭＬモデル８２５、第２のトレーニングされたＭＬモデル８３５、及び／又は第３のトレーニングされたＭＬモデル８６５における重みを修正、消去、又は追加することができる。第１のトレーニングされたＭＬモデル８２５、第２のトレーニングされたＭＬモデル８３５、及び第３のトレーニングされたＭＬモデル８６５は、図８では別個のＭＬモデルとして示されているが、これらのＭＬモデルのうちの任意の２つ（又は３つ全て）を単一のＭＬモデルで実現することができることを理解されたい。更に、いくつかの例では、図８に示されるトレーニングされたＭＬモデルのいずれか（例えば、第１のトレーニングされたＭＬモデル８２５、第２のトレーニングされたＭＬモデル８３５、又は第３のトレーニングされたＭＬモデル８６５）は、２つ以上の補助的なトレーニングされたＭＬモデルに分割することができる。例えば、１つの補助的なトレーニングされたＭＬモデルは、問題のトレーニングされたＭＬモデルに関連付けられた図８に示される入力を受信することができ、中間データを生成することができる。別の補助的なトレーニングされたＭＬモデルは、その入力のうちの最後の１つとして中間データを受信することができ、問題のトレーニングされたＭＬモデルに関連付けられた図８に示される出力を生成することができ、

【0126】

[0140] ユーザ８２０の知覚レベル８５０及び／又は把握レベル８７０は、ユーザの認知能力及び状態に関連するファクタを含むことができる。認知ベースのファクタの例としては、とりわけ、特定のＸＲタスク（例えば、通知を読むこと）、特定の実世界タスク（例えば、キッチンで料理すること）、拡張された特定の実世界タスク（例えば、都市で歩くこと及びナビゲーション命令を受信すること）、ユーザの教育レベルに関する情報、特定の分野におけるユーザの知識レベルに関する情報、ユーザの職業に関する情報、ユーザの認知障害についての情報、又はそれらの組み合わせなど、特定のタスクに関する以前の経験及び／又はスキルレベルが挙げられ得る。認知ベースのファクタの例として、代替的又は追加的に、とりわけ、サッカード（中心窩を１つの点から別の点に移動させるために使用される眼球運動のタイプ）及び固視時間、注視時間、繰り返し視認、コンテンツとの相互作用（例えば、スクロール、応答、閉じることなど）など、拡張されたコンテンツに適用される注意が挙げられ得る。認知ベースのファクタの例として、代替的又は追加的に、とりわけ、覚醒、疲労、２つ以上の活動に分割された注意などのユーザの精神状態が挙げられ得る。

【0127】

[0141] ＸＲシステムの使用のコンテキストは、ＸＲシステムの使用中の実世界環境の態様を含むことができる。そのような態様の例としては、とりわけ、環境内の雑音レベル（例えば、周囲音、環境内で話している追加の人など）、環境内の照明（例えば、周囲照明）、ユーザの活動、ＸＲシステムが使用されているロケーション、コンテンツと対話する過去の履歴、時刻、環境が静的であるか又は動的（例えば、ユーザが車両、列車、エレベータ、エスカレータなどの動くオブジェクト上にいる場合）であるか、環境内の障害物が挙げられ得る。

【0128】

[0142] ＸＲシステムによって出力されているコンテンツに関連付けられた情報は、仮想コンテンツの特性及び／又は物理的コンテンツ（例えば、拡張のオブジェクト）の特性を含むことができる。そのような特性の例としては、メッセージ又は他の仮想コンテンツの意味的複雑さ、メッセージ又は他の仮想コンテンツの重大度及び重要度、メッセージ又は他の仮想コンテンツの長さ、実施されているタスク（例えば、本を読むこと）に対するメッセージ又は他の仮想コンテンツの関連性、環境に対する仮想コンテンツの独自性、メッセージ又は他の仮想コンテンツがコンテキスト上予想されるかどうか（例えば、メッセージコンテンツを受信することが、状況、時間、場所、活動などに適切又は関連し得るかどうか）が挙げられ得る。

【0129】

[0143] いくつかの態様では、ＸＲシステムは、ユーザ入力、以前に提示された仮想コンテンツの表示持続時間、デバイス状態（例えば、低電力などの電力状態）、ＡＲデバイススクリーン解像度、ＸＲシステム（したがってユーザ）の移動速度、及び／又は他の外部ファクタなど、他の外部ファクタを監視することができる。

【0130】

[0144] 本システム及び技法は、ＸＲシステムにおけるコンテンツの初期提示を決定するために、かつ／又は仮想コンテンツのユーザ知覚を査定し、潜在的な結果を判定するために使用されることができる。例えば、コンテンツの初期提示を決定するために、ＸＲシステムは、ユーザの認知状態、使用のコンテキスト（例えば、実世界環境の態様）、実施されているタスクを監視することができる。場合によっては、ＸＲシステムは、上に拡張コンテンツが表示され得る物理的オブジェクトを含むコンテンツを監視することができる。ＸＲシステムは、認知状態、使用のコンテキスト、及びタスク（及び場合によってはコンテンツ）に基づいて、増強が有益であろうと決定することができる。次いで、ＸＲシステムは、認知状態、コンテキスト、及びタスク（及び場合によってはコンテンツ）に合わせて調整することができる拡張を提供（例えば、出力）することができる。１つの例示的な例では、タスクは、ユーザが図書館の本を読むことを含むことができ、認知は、（例えば、サッカード及び他の眼の特性を監視するＸＲシステムに基づいて）ユーザが眠く、題材をよく吸収していない可能性があることを含むことができ、コンテキストは、ユーザが位置する部屋が、（例えば、周辺光センサ及び全地球航法衛星システム（ＧＮＳＳ）受信機からの入力に基づいて）図書館にあり日中の窓の近くにあることに基づいて、明るいことを含むことができ、コンテンツは、ユーザが読んでいる物理学に関する難易度の高い本、及びユーザが以前に物理学課程を取ったことがないことを含むことができる。本を読んでいる間、ＡＲデバイスは、ユーザが単語を凝視し、両眼を細めていると判定し得る。次いで、ＡＲデバイスは、世界の定義又は翻訳が、単語に対するポップアップとして表示するのに有用であろうと決定することができる。

【0131】

[0145] 上述のように、本システム及び技法は、仮想コンテンツのユーザ知覚を査定し、潜在的な結果を判定するために使用することができる。例えば、ＸＲシステムは、仮想コンテンツ（例えば、「低バッテリ」などの警告通知、「このボタンを押さないこと」というラベルを伴うスイッチの隣の矢印などのＡＲコンテンツ、関心のある地点又は場所に関連付けられた情報を伴うＡＲコンテンツなど）を提示することができる。ユーザが仮想コンテンツに関連付けられたタスクを完了した場合、又は仮想コンテンツを手動で閉じた場合、ＸＲシステムは仮想コンテンツを消去することができる。そうでない場合、ＸＲシステムは、ユーザが仮想コンテンツを知覚したかどうかを判定するために、分析を実施することができる。

【0132】

[0146] ユーザによる仮想コンテンツに対するユーザ知覚を査定するために、本システム及び技法は、仮想コンテンツに対する知覚レベル、又は仮想コンテンツに対するユーザ知覚の度合いを判定することができる。いくつかの例では、ユーザが仮想コンテンツを知覚したかどうか、かつ／又は仮想コンテンツに対する知覚レベル若しくは度合いを判定するために、ＸＲシステムは、コンテンツを評価し、ユーザの眼分析（例えば、サッカード分析）を実施し、かつ／又はユーザの二次分析を（例えば、瞳孔、眼を細めること、及び頭部運動をチェックすることによって）実施することができる。場合によっては、ＸＲシステムは、ユーザが仮想コンテンツを知覚したかどうかを判定するために、（例えば、１つ又は複数のニューラルネットワークを使用した）機械学習（ＭＬ）ベースのパターン認識を使用することができる。ユーザが仮想コンテンツを知覚した（例えば、閾値時間を超えて仮想コンテンツの方向を見た）と判定された場合、ＸＲシステムは、仮想コンテンツを閉じるか又は消去する（例えば、コンテンツをディスプレイから消去する）ことができる。ユーザが仮想コンテンツを知覚していないとＸＲシステムが判定した場合、ＸＲシステムは、コンテンツを適所に維持するかどうか、コンテンツの顕著性を高めるかどうか（例えば、コンテキストに基づいて）、及び／又は他のアクションを実施するかどうかを（例えば、環境光、雑音、ユーザ活動などのコンテキストに基づいて）判定することができる。例えば、環境光が明るいことをコンテキストが示した場合、ＸＲシステムはディスプレイ輝度を高めることができる。別の例では、周囲環境が騒々しいことをコンテキストが示した場合、ＸＲシステムは、（例えば、可聴仮想コンテンツが出力されるときに）ＡＲコンテンツの音量を上げることができる。

【0133】

[0147] いくつかの態様では、眼分析を実施するために、ＸＲシステムは、眼追跡カメラをオンにすることができ、眼追跡カメラを使用して仮想コンテンツ上で眼を追跡することができる。例えば、ＸＲシステムは、仮想コンテンツに払われた注意と、仮想コンテンツの背後の視野内の何かに払われた注意とを明確にすることができる。仮想コンテンツに対して低い値（例えば、閾値１０などの閾値未満の値）が判定された場合、ＸＲシステムは仮想コンテンツを消去することができる。仮想コンテンツに対して高い値（例えば、閾値よりも大きい値）が判定された場合、ＸＲシステムは、ある時間期間（例えば、５秒間、１０秒間など）にわたってコンテンツを適所に維持して、コンテンツを再読する時間をユーザに与えることができる。ユーザが仮想コンテンツを再読しているとＸＲシステムが判定した場合、ＸＲシステムはコンテンツを適所に残すことができる。

【0134】

[0148] いくつかの態様では、二次分析を実施するために、ＸＲシステムは、ユーザの瞳孔、ユーザが眼を細めているかどうか、及び／又はユーザの頭部の運動をチェックすることができる。例えば、ＸＲシステムは、ユーザの瞳孔のうちの１つ又は複数が拡張されていない、ユーザが眼を細めている、ユーザの頭部が横に倒れているか又は前方に傾いている、ユーザが瞬き頻度である、ユーザが仮想コンテンツを特定の持続時間（例えば、３秒以上）の間凝視している、ユーザが特定の頻度（例えば、毎秒２回）でコンテンツを見ていると判定した場合、コンテンツを適所に維持することができる。

【0135】

[0149] 場合によっては、経時的に、ＸＲシステムは、メッセージがユーザのために適所に留まるべき時間を（例えば、ＭＬベースのパターン認識を使用して）学習し、最適化することができる。ＸＲシステムは、仮想コンテンツが閾値時間内（例えば、１秒、２秒、３秒、４秒、５秒、１０秒、１５秒などの閾値時間期間以内）に読まれる、かつ／又は視認される尤度を決定してもよい。いくつかの例では、ＸＲシステムは、この尤度を決定するために、表示された仮想コンテンツ（例えば、仮想メッセージ又は通知）の信頼レベルを展開してもよい。場合によっては、仮想コンテンツの所与の項目について高い尤度が決定された場合、ＸＲシステムは、上記で説明された眼分析のために眼追跡カメラを利用しない可能性がある。

【0136】

[0150] 図９は、エクステンデッドリアリティコンテンツを視認しているユーザの分析のために、トレーニングされた機械学習システムによって使用され得るニューラルネットワーク（neural network、ＮＮ）９００の一例を示すブロック図である。ニューラルネットワーク９００は、畳み込みニューラルネットワーク（convolutional neural network、ＣＮＮ）、オートエンコーダ、ディープビリーフネット（deep belief net、ＤＢＮ）、回帰型ニューラルネットワーク（Recurrent Neural Network、ＲＮＮ）、敵対的生成ネットワーク（Generative Adversarial Network、ＧＡＮ）、及び／又は他のタイプのニューラルネットワークなど、任意のタイプのディープネットワークを含むことができる。ニューラルネットワーク９００は、第１のトレーニングされたＭＬモデル８２５、第２のトレーニングされたＭＬモデル８３５、第３のトレーニングされたＭＬモデル８６５、又はそれらの組み合わせの、１つ又は複数のトレーニングされたニューラルネットワークのうちの１つの例であり得る。

【0137】

[0151] ニューラルネットワーク９００の入力層９１０は入力データを含む。入力層９１０の入力データは、１つ又は複数の入力画像フレームの画素を表すデータを含むことができる。いくつかの例では、入力層９１０の入力データは、（例えば、ユーザ対面センサ２０５、第３のカメラ３３０Ｃ、第４のカメラ３３０Ｄ、第１のカメラ４３０Ａ、第２のカメラ４３０Ｂ、及び／又はセンサ８１０によって捕捉された画像の）画像データの画素を表すデータ、及び／又は画像データに対応するメタデータを含む。いくつかの例では、入力層９１０の入力データは、ユーザ対面センサ２０５、第３のカメラ３３０Ｃ、第４のカメラ３３０Ｄ、第１のカメラ４３０Ａ、第２のカメラ４３０Ｂ、及び／又はセンサ８１０によって捕捉された画像を含む。

【0138】

[0152] いくつかの例では、入力層９１０の入力データは、知覚関連属性データ８３０、及び／又は属性エンジン２３０によって生成された知覚関連属性データなどの、知覚関連属性データを含むことができる。いくつかの例では、入力層９１０の入力データは、第１の表示設定２５０、第２の表示設定２５５、表示設定６５２０、表示設定５５５、表示設定６２０、表示設定７２０、表示設定８３７、又はそれらの組み合わせなどの、仮想コンテンツを表示するための表示設定を含むことができる。

【0139】

[0153] いくつかの例では、入力層９１０の入力データは、知覚レベル８５０、及び／又は知覚エンジン２３５を使用して判定された知覚レベルなどの、ユーザの眼を通したユーザによる仮想コンテンツに対する知覚レベルを含むことができる。いくつかの例では、入力層９１０の入力データは、履歴データ８５５などの、ユーザに関連付けられた履歴データを含むことができる。いくつかの例では、入力層９１０の入力データは、評価８６０、仮想コンテンツ評価エンジン２４５によって生成される評価及び／若しくは測定基準、又はそれらの組み合わせなどの、仮想コンテンツに関連付けられた１つ又は複数の評価を含むことができる。いくつかの例では、入力層９１０の入力データは、コンテキスト情報８９０などの、コンテキストデータ及び／又はコンテキスト情報を含むことができる。いくつかの態様では、評価８６０は、メトリック及び／又はスコアと呼ばれることがある。

【0140】

[0154] 画像は、生の画素データ（例えば、ベイヤーフィルタに基づいて画素ごとに単一の色を含む）を含むイメージセンサからの画像データ、又は処理された画素値（例えば、ＲＧＢ画像のＲＧＢ画素）を含み得る。ニューラルネットワーク９００は、複数の隠れ層９１２Ａ、９１２Ｂから９１２Ｎを含む。隠れ層９１２Ａ、９１２Ｂから９１２Ｎは、「Ｎ」個の隠れ層を含み、ここで、「Ｎ」は、１よりも大きいか又はそれに等しい整数である。隠れ層の個数は、所与の適用例にとって必要とされるのと同数の層を含むようにされ得る。ニューラルネットワーク９００は、隠れ層９１２Ａ、９１２Ｂから９１２Ｎによって実施された処理から生じる出力を提供する出力層９１４を更に含む。いくつかの例では、出力層９１４は、出力画像を提供することができる。いくつかの例では、出力層９１４は、知覚関連属性データ８３０、及び／又は属性エンジン２３０によって生成された知覚関連属性データなどの、知覚関連属性データを提供することができる。いくつかの例では、出力層９１４は、知覚レベル８５０、及び／又は知覚エンジン２３５を使用して判定された知覚レベルなどの、仮想コンテンツに対する知覚レベルを提供することができる。いくつかの例では、出力層９１４は、把握レベル８７０、及び／又は把握エンジン２４０を使用して決定された把握レベルなどの、ユーザによる仮想コンテンツに対する把握及び／又は理解レベルを提供することができる。

【0141】

[0155] ニューラルネットワーク９００は、相互接続されるフィルタの多層ニューラルネットワークである。各フィルタは、入力データを表す特徴を学習するようにトレーニングされ得る。フィルタに関連する情報は異なる層の間で共有され、情報が処理されるにつれて各層が情報を保持する。場合によっては、ニューラルネットワーク９００はフィードフォワードネットワークを含むことができ、その場合、ネットワークの出力がそれ自体にフィードバックされるフィードバック接続はない。場合によっては、ネットワーク９００は再帰ニューラルネットワークを含むことができ、これは、入力を読み取る間に、ノードにわたって情報が搬送されることを可能にするループを有することができる。

【0142】

[0156] 場合によっては、様々な層間のノードとノードの相互接続を通じて、情報を層間で交換することができる。場合によっては、ネットワークは畳み込みニューラルネットワークを含むことができ、これは、ある層の中のあらゆるノードを次の層の中のあらゆる他のノードにつながないことがある。情報が層間で交換されるネットワークでは、入力層９１０のノードは、第１の隠れ層９１２Ａ中のノードのセットをアクティブ化することができる。例えば、図示のように、入力層９１０の入力ノードの各々が第１の隠れ層９１２Ａのノードの各々に接続され得る。隠れ層のノードは、各入力ノードの情報を、この情報にアクティブ化関数（例えば、フィルタ）を適用することによって、変換することができる。変換から導出された情報は、次いで、次の隠れ層９１２Ｂのノードに渡され、それらのノードをアクティブ化することができ、それらのノードは、それら自体の指定された関数を実施することができる。例示的な機能には、畳み込み機能、ダウンサンプリング、アップスケーリング、データ変換、及び／又は任意の他の適切な機能がある。隠れ層９１２Ｂの出力は、次いで、次の隠れ層のノードをアクティブ化することができ、以下同様である。最後の隠れ層９１２Ｎの出力は、出力層９１４の１つ又は複数のノードをアクティブ化することができ、出力層９１４は、処理された出力画像を提供する。場合によっては、ニューラルネットワーク９００の中のノード（例えば、ノード９１６）は、複数の出力線を有するものとして示されるが、ノードは単一の出力を有し、ノードから出力されるものとして示される全ての線が同じ出力値を表す。

【0143】

[0157] 場合によっては、各ノード又はノード間の相互接続は、ニューラルネットワーク９００のトレーニングから導出されるパラメータのセットである、重みを有することができる。例えば、ノード間の相互接続部は、相互接続されたノードについて学習された情報を表すことができる。相互接続は、（例えば、トレーニングデータセットに基づいて）調整され得る調整可能な数値重みを有することができ、ニューラルネットワーク９００が、入力に対して適応的であること、及びますます多くのデータが処理されるにつれて学習できることを可能にする。

【0144】

[0158] ニューラルネットワーク９００は、出力層９１４を通して出力を提供するために、異なる隠れ層９１２Ａ、９１２Ｂから９１２Ｎを使用して入力層９１０中のデータからの特徴を処理するように事前トレーニングされる。

【0145】

[0159] 図１０は、エクステンデッドリアリティ（ＸＲ）表示動作のためのプロセスを示すフロー図である。プロセス１０００は、撮像システムによって実施され得る。いくつかの例では、撮像システムは、例えば、画像捕捉及び処理システム１００、画像捕捉デバイス１０５Ａ、画像処理デバイス１０５Ｂ、画像プロセッサ１５０、ＩＳＰ１５４、ホストプロセッサ１５２、ＸＲシステム２００、ＨＭＤ３１０、モバイルハンドセット４１０、画像５０５を捕捉し、仮想コンテンツ５２５～５３５をオーバーレイする撮像デバイス、画像６０５を捕捉し、仮想コンテンツ６３０をオーバーレイする撮像デバイス、画像７０５を捕捉し、仮想コンテンツ７３０をオーバーレイする撮像デバイス、図８の撮像デバイス、第２のトレーニングされたＭＬモデル８３５の第１のトレーニングされたＭＬモデル８２５、第３のトレーニングされたＭＬモデル８６５、ニューラルネットワーク９００、コンピューティングシステム１１００、プロセッサ１１１０、又はそれらの組み合わせを含むことができる。

【0146】

[0160] 動作１００５において、撮像システムは、仮想コンテンツを、仮想コンテンツに関連付けられた表示設定に従って、ディスプレイを使用して表示させるように構成されており、かつ表示させることができ、仮想コンテンツがディスプレイによって表示されるときに、環境がディスプレイを使用して視認可能である。いくつかの例では、撮像システムは、ディスプレイを含む。ディスプレイの例としては、ディスプレイ２２５、ディスプレイ３４０、ディスプレイ４４０、ディスプレイ８４５、出力デバイス１１３５、本明細書で説明される他のディスプレイ、又はそれらの組み合わせが挙げられる。仮想コンテンツの例としては、仮想コンテンツ生成器２１５によって生成された仮想コンテンツ、仮想コンテンツ５１５、仮想コンテンツ５２５、仮想コンテンツ５３０、仮想コンテンツ５３５、仮想コンテンツ６１５、仮想コンテンツ６３０、仮想コンテンツ７１５、仮想コンテンツ７３０、仮想コンテンツ８４０、本明細書で説明される他の仮想コンテンツ、又はそれらの組み合わせが挙げられる。表示設定の例としては、第１の表示設定２５０、第２の表示設定２５５、表示設定５２０、表示設定５５５、表示設定６２０、表示設定７２０、表示設定８３７（修正８７５の前）、表示設定８３７（修正８７５の後）、本明細書で説明される他の表示設定、又はそれらの組み合わせが挙げられる。

【0147】

[0161] いくつかの例では、撮像システムは、ディスプレイを使用して仮想コンテンツを表示させる前に、仮想コンテンツを生成するように構成されており、かつ生成することができる。例えば、撮像システムの仮想コンテンツ生成器２１５は、仮想コンテンツを生成することができる。いくつかの例では、撮像システムの合成器２２０は、表示設定を生成することができる。

【0148】

[0162] いくつかの例では、ディスプレイの少なくとも一部分を通過する環境からの光に少なくとも部分的に基づいて、環境がディスプレイを使用して視認可能である。例えば、ディスプレイは、少なくとも部分的に透明、半透明、光受容、光透過性、及び／又は光許容であってもよい。そのような例では、撮像システムは、光学シースルーディスプレイを有すると呼ばれることがある。そのような例では、撮像システムは、表示設定に従ってディスプレイを使用して、仮想コンテンツの少なくとも一部分を環境のビューの少なくとも一部分の上に表示させることができる。いくつかの態様では、撮像システムの合成器２２０は、仮想コンテンツの少なくとも一部分を環境のビューの上にオーバーレイするように、表示設定を生成することができる。いくつかの態様では、撮像システムの合成器２２０は、環境の少なくとも一部分が、表示設定ごとに表示されない仮想コンテンツの少なくとも非表示部分の前にあるように見えるように、仮想コンテンツの表示部分をシミュレートされた深度で表示するように、表示設定を生成することができる。

【0149】

[0163] いくつかの例では、撮像システムが環境のビューをディスプレイによって表示させることに少なくとも部分的に基づいて、環境がディスプレイを使用して視認可能である。例えば、撮像システムは、撮像システムの１つ又は複数の環境焦点センサ２１０を使用して、環境のビューを描写する１つ又は複数の画像を捕捉することができる。撮像システムは、ディスプレイに、環境の１つ又は複数の画像を仮想コンテンツと組み合わせて表示させることができる。例えば、撮像システムは、例えば撮像システムの合成器２２０を使用して、仮想コンテンツの少なくとも一部を環境の１つ若しくは複数の画像の少なくとも一部分と組み合わせてかつ／又は合成して合成画像を生成し、結果として得られた合成画像をディスプレイに表示させることによって、仮想コンテンツを表示させることができる。いくつかの態様では、撮像システムの合成器２２０は、仮想コンテンツの少なくとも一部分を環境の１つ又は複数の画像内の環境のビューの少なくとも一部分の上にオーバーレイするように、表示設定を生成することができる。いくつかの態様では、撮像システムの合成器２２０は、（環境の１つ又は複数の画像からの）環境の少なくとも一部分が、表示設定ごとに環境がオーバーレイする仮想コンテンツの少なくとも非表示部分の前にあるように見えるように、仮想コンテンツの表示部分をシミュレートされた深度で表示するように、表示設定を生成することができる。

【0150】

[0164] 動作１０１０において、撮像システムは、ユーザの１つ又は複数の知覚関連属性に基づいて、ユーザによってディスプレイを使用して表示された仮想コンテンツに対する知覚レベルを判定するように構成されており、かつ判定することができる。知覚レベルは、知覚の程度及び／又は知覚のメトリックと呼ばれることがある。いくつかの例では、撮像システムは、撮像システムの属性エンジン２３０、撮像システムの第１のトレーニングされたＭＬモデル８２５、ニューラルネットワーク９００、又はそれらの組み合わせを使用して、ユーザの知覚関連属性を判定することができる。知覚関連属性の例としては、属性エンジン２３０を使用して判定された知覚関連属性、知覚関連属性データ８３０、ＮＮ９００を使用して判定された知覚関連属性、又はそれらの組み合わせが挙げられる。

【0151】

[0165] いくつかの例では、撮像システムは、撮像システムの知覚エンジン２３５、撮像システムの第２のトレーニングされたＭＬモデル８３５、ニューラルネットワーク９００、又はそれらの組み合わせを使用して、ユーザによる仮想コンテンツに対する知覚レベルを判定することができる。いくつかの例では、知覚レベルは把握レベルを含み、撮像システムは、撮像システムの知覚エンジン２３５、撮像システムの把握エンジン２４０、撮像システムの仮想コンテンツ評価エンジン２４５、撮像システムの第２のトレーニングされたＭＬモデル８３５、撮像システムの第３のトレーニングされたＭＬモデル８６５、ニューラルネットワーク９００、又はそれらの組み合わせを使用して、知覚レベル及び／又は把握レベルを判定することができる。ユーザによる仮想コンテンツに対する知覚レベルの例としては、知覚エンジン２３５を使用して判定される知覚レベル、知覚レベル８５０、ＮＮ９００を使用して判定される知覚レベル、又はそれらの組み合わせが挙げられる。いくつかの例では、知覚レベルは把握レベルを含み、知覚レベル及び／又は把握レベルの例としては、知覚エンジン２３５を使用して判定された知覚レベル、把握エンジン２４０を使用して判定された把握レベル、知覚レベル８５０、把握レベル８７０、ＮＮ９００を使用して判定された知覚レベル、ＮＮ９００を使用して判定された把握レベル、又はそれらの組み合わせが挙げられる。

【0152】

[0166] いくつかの例では、ユーザの１つ又は複数の知覚関連属性は、ユーザの１つ又は複数の眼に関連付けられている。いくつかの例では、ユーザの１つ又は複数の知覚関連属性は、ユーザの１つ又は複数の眼の１つ又は複数の属性、ユーザの１つ又は複数の表情の１つ又は複数の属性、ユーザの１つ又は複数のジェスチャ、又はそれらの組み合わせのうちの少なくとも１つを含む。いくつかの例では、ユーザの１つ又は複数の知覚関連属性を判定することは、ユーザの眼の眼球位置を追跡すること、ユーザの眼の眼球位置を追跡すること、ユーザの眼の眼球運動を追跡すること、ユーザの眼の瞳孔拡張を追跡すること、ユーザの眼のサッカードを追跡すること、ユーザの眼による固視を追跡すること、ユーザの瞼による瞬きを追跡すること、ユーザの瞼による眼を細めることを追跡すること、ユーザの眼による視運動反射を追跡すること、ユーザの眼による前庭動眼反射を追跡すること、ユーザの眼による調節反射を追跡すること、ユーザの表情を追跡すること、ユーザによるジェスチャを追跡すること、又はそれらの組み合わせを含む。上に列挙された動作における追跡は、タイミング、頻度、程度、振幅、眼球位置、眼球運動、眼の速度、又はそれらの組み合わせの追跡を指し得る。

【0153】

[0167] いくつかの例では、ユーザの１つ又は複数の知覚関連属性は、仮想コンテンツに対するユーザの１つ又は複数の眼の１つ又は複数の眼球位置を含む。いくつかの例では、ユーザの１つ又は複数の知覚関連属性は、ユーザの１つ又は複数の眼による１つ又は複数のサッカードの１つ又は複数の特性を含む。１つ又は複数の特性は、頻度、持続時間、タイミング、サッカード速度、サッカード振幅、眼球位置、眼球運動、本明細書で論じる他の特性、又はそれらの組み合わせのうちの少なくとも１つを含む。いくつかの例では、ユーザの１つ又は複数の知覚関連属性は、ユーザの１つ又は複数の眼による１つ又は複数の固視の１つ又は複数の特性を含む。１つ又は複数の特性は、頻度、持続時間、タイミング、眼球位置、及び眼球運動のうちの少なくとも１つを含む。いくつかの例では、ユーザの１つ又は複数の知覚関連属性は、ユーザの１つ又は複数の眼による１回又は複数回の瞳孔拡張の１つ又は複数の特性を含む。１つ又は複数の特性は、頻度、持続時間、タイミング、瞳孔拡張レベル、眼球位置、及び眼球運動のうちの少なくとも１つを含む。いくつかの例では、ユーザの１つ又は複数の知覚関連属性は、ユーザの１つ又は複数の瞼による１回又は複数回の瞬きの１つ又は複数の特性を含む。１つ又は複数の特性は、頻度、持続時間、タイミング、瞬き速度、眼球位置、及び眼球運動のうちの少なくとも１つを含む。いくつかの例では、ユーザの１つ又は複数の知覚関連属性は、ユーザの１つ又は複数の瞼による１回又は複数回の眼を細めることの１つ又は複数の特性を含む。１つ又は複数の特性は、頻度、持続時間、タイミング、眼を細めるレベル、眼球位置、及び眼球運動のうちの少なくとも１つを含む。

【0154】

[0168] いくつかの例では、撮像システムは、１つ又は複数のセンサによって捕捉されたセンサデータを受信するように構成されており、かつ受信することができる。センサデータは、ユーザの１つ又は複数の眼を示す。撮像システムは、センサデータに基づいて、ユーザの１つ又は複数の知覚関連属性を判定するように更に構成されており、かつ判定することができる。いくつかの例では、撮像システムは、１つ又は複数のセンサを含む。いくつかの例では、１つ又は複数のセンサは、センサデータを捕捉するように構成されており、かつ捕捉することができる。１つ又は複数のセンサの例としては、ユーザ対面センサ２０５、追加のセンサ２０８、センサ８１０、第３のカメラ３３０Ｃ、第４のカメラ３３０Ｄ、第１のカメラ４３０Ａ、第２のカメラ４３０Ｂ、入力デバイス１１４５、本明細書で説明される他のセンサ、又はそれらの組み合わせが挙げられる。センサデータの例としては、例えばセンサデータ８０５を含む、前文に列挙されたセンサのいずれかによって捕捉されたセンサデータが挙げられる。いくつかの例では、１つ又は複数のセンサは、１つ又は複数の画像センサを含み、センサデータは、１つ又は複数の画像、ビデオ、又はそれらの組み合わせを含む。いくつかの例では、センサデータは、ユーザの１つ又は複数の眼の表現を含む。いくつかの例では、センサデータは含む

【0155】

[0169] いくつかの例では、ユーザによる仮想コンテンツに対する知覚レベルを判定することは、１つ又は複数のトレーニングされた機械学習システムへの入力として、ユーザの１つ又は複数の知覚関連属性を使用することを含む。１つ又は複数のトレーニングされたＭＬシステムの例としては、属性エンジン２３０、知覚エンジン２３５、把握エンジン２４０、第１のトレーニングされたＭＬモデル８２５、第２のトレーニングされたＭＬモデル８３５、第３のトレーニングされたＭＬモデル８６５、ＮＮ９００、又はそれらの組み合わせが挙げられる。いくつかの例では、撮像システムは、ユーザインターフェースを通して、ユーザによる仮想コンテンツに対する知覚レベルに対応するフィードバックを受信するように構成されており、かつ受信することができる。いくつかの例では、撮像システムは、フィードバックに基づいて、１つ又は複数のトレーニングされた機械学習システムを更新するように構成されており、かつ更新することができる。いくつかの例では、撮像システムは、撮像システムがフィードバックを受信し、トレーニングされたＭＬシステムの更なるトレーニング及び／又は学習を使用してトレーニングされたＭＬシステムを更新するために使用する、フィードバックエンジン２６０を含む。フィードバックの例としては、フィードバック８８０が挙げられる。トレーニングの例としては、トレーニング８８５が挙げられる。

【0156】

[0170] いくつかの例では、撮像システムは、ユーザによる仮想コンテンツに対する知覚レベルに基づいて、ユーザによる仮想コンテンツに対する把握レベルを判定するように構成されており、かつ判定することができる。いくつかの例では、ユーザによる仮想コンテンツに対する知覚レベルを判定することは、ユーザによる仮想コンテンツに対する把握レベルを判定することを含む。撮像システムは、把握レベル及び／又は知覚レベルに基づいて、表示設定に対する修正を決定するように構成されており、かつ決定することができる。いくつかの例では、ユーザによる仮想コンテンツに対する把握レベルを判定することは、ユーザの１つ又は複数の知覚関連属性、仮想コンテンツの１つ又は複数の特性、コンテキストデータ、ユーザに関連付けられた履歴情報、ユーザのユーザプロファイル、仮想コンテンツの複雑さの評価、仮想コンテンツの一意性の評価、又はそれらの組み合わせに基づく。いくつかの例では、撮像システムは、ユーザに関連付けられた履歴情報を受信するように構成されており、かつ受信することができる。いくつかの例では、ユーザによる仮想コンテンツに対する把握レベルを判定することは、ユーザに関する履歴情報に基づく。いくつかの例では、ユーザプロファイルは、ユーザに関連付けられた履歴データを含む。いくつかの例では、コンテキストデータは、仮想コンテンツに対するユーザによる１つ又は複数の反応を含む。いくつかの例では、コンテキストデータは、ＸＲシステムのロケーションを含む。

【0157】

[0171] いくつかの例では、撮像システムは、撮像システムの知覚エンジン２３５、撮像システムの把握エンジン２４０、撮像システムの仮想コンテンツ評価エンジン２４５、撮像システムの第２のトレーニングされたＭＬモデル８３５、撮像システムの第３のトレーニングされたＭＬモデル８６５、ニューラルネットワーク９００、又はそれらの組み合わせを使用して、把握レベルを判定することができる。把握レベルの例としては、把握エンジン２４０を使用して判定される把握レベル、把握レベル８７０、ＮＮ９００を使用して判定される把握レベル、又はそれらの組み合わせが挙げられる。

【0158】

[0172] いくつかの例では、撮像システムは、例えば、仮想コンテンツ評価エンジン２４５を使用して、仮想コンテンツの特性を判定するように構成されており、かつ判定することができ、ユーザによる仮想コンテンツに対する知覚レベル及び／又は把握レベルを判定することは、仮想コンテンツの特性に基づく。特性の例としては、仮想コンテンツ評価エンジン２４５による評価、仮想コンテンツ８４０に関連付けられた評価８６０、又はそれらの組み合わせが挙げられる。いくつかの例では、撮像システムは、仮想コンテンツの複雑さレベルを判定するように構成されており、かつ判定することができる。いくつかの態様では、ユーザによる仮想コンテンツに対する知覚レベル及び／又は把握レベルを判定することは、仮想コンテンツの複雑さレベルに基づく。いくつかの例では、撮像システムは、仮想コンテンツの一意性レベルを判定するように構成されており、かつ判定することができる。いくつかの態様では、ユーザによる仮想コンテンツに対する知覚レベル及び／又は把握レベルを判定することは、仮想コンテンツの一意性レベルに基づく。いくつかの例では、撮像システムは、環境に対する仮想コンテンツの独自性レベルを判定するように構成されており、かつ判定することができる。いくつかの態様では、ユーザによる仮想コンテンツに対する知覚レベル及び／又は把握レベルを判定することは、環境に対する仮想コンテンツの独自性レベルに基づく。

【0159】

[0173] いくつかの例では、ユーザによる仮想コンテンツに対する知覚レベルを判定することは、ユーザが仮想コンテンツを知覚したと判定することを含む。いくつかの例では、ユーザによる仮想コンテンツに対する知覚レベルを判定することは、ユーザが仮想コンテンツを知覚していないと判定することを含む。いくつかの例では、ユーザによる仮想コンテンツに対する知覚レベルを判定することは、ユーザが複数の知覚レベルのうちの第１の知覚レベルまで仮想コンテンツを知覚したと判定することを含む。いくつかの例では、ユーザによる仮想コンテンツに対する知覚レベルを判定することは、ユーザが複数の知覚レベルのうちの第２の知覚レベルまで仮想コンテンツを知覚したと判定することを含む。いくつかの態様では、第１の知覚レベルは第２の知覚レベルよりも大きく、第２の知覚レベルは第１の知覚レベルよりも小さい。いくつかの態様では、第２の知覚レベルは第１の知覚レベルよりも大きく、第１の知覚レベルは第２の知覚レベルよりも小さい。

【0160】

[0174] いくつかの例では、ユーザによる仮想コンテンツに対する知覚レベルを判定することは、ユーザによる仮想コンテンツに対する知覚レベルに対応する信頼レベルを判定することを含む。いくつかの態様では、表示設定に対する修正は、信頼レベルに基づく。信頼レベルは、属性エンジン２３０、知覚エンジン２３５、把握エンジン２４０、第１のトレーニングされたＭＬモデル８２５、第２のトレーニングされたＭＬモデル８３５、第３のトレーニングされたＭＬモデル８６５、ＮＮ９００、又はそれらの組み合わせなどの機械学習システムによって提供され得る。

【0161】

[0175] いくつかの例では、ユーザによる仮想コンテンツに対する知覚レベルを判定することは、例えば、１つ又は複数のセンサ（例えば、画像センサ、カメラ、ユーザ焦点センサ２０５、環境焦点センサ２１０）を使用して、ユーザの１つ又は複数のジェスチャを識別することを含む。撮像システムは、環境焦点センサ２１０からのセンサデータを使用して、ユーザの手を追跡することができる。例えば、撮像システムは、ユーザの手が仮想コンテンツに向かって指差している、かつ／又はジェスチャしているかどうかを判定し、知覚レベルを高レベルの知覚に高めることができる。撮像システムは、ユーザの手が仮想コンテンツから離れて指差している、かつ／又はジェスチャしているかどうかを判定し、知覚レベルを低レベルの知覚に低下させることができる。

【0162】

[0176] いくつかの例では、仮想コンテンツは文字列を含む。撮像システムは、仮想コンテンツに対する知覚レベル、文字列の長さ、文字列の複雑さ、及び／又は文字列の一意性に基づいて、ユーザによる文字列の読解の程度を判定するように構成されており、かつ判定することができる。文字列の複雑さ及び／又は一意性は、撮像システムの仮想コンテンツ評価エンジン２４５による評価（例えば、評価８６０）であり得る。例えば、知覚レベルが、ユーザが仮想コンテンツを素早く一瞥したことを示すが、文字列が短く、複雑でなく、かつ／又は一意でない場合、文字列の読解の程度はそれでも高くなり得る。一方、知覚レベルが、ユーザが仮想コンテンツを素早く一瞥したが、文字列が長く、複雑で、かつ／又は一意であることを示す場合、文字列の読解の程度は低くなり得る。知覚レベルが、ユーザが仮想コンテンツを非常に長い時間見たことを示す場合、たとえ文字列が長く、複雑であり、かつ／又は一意であったとしても、文字列の読解の程度は高くなり得る。

【0163】

[0177] 動作１０１５において、撮像システムは、ユーザによる仮想コンテンツに対する知覚レベルに基づいて、仮想コンテンツに対応する表示設定に対する修正を決定するように構成されており、かつ決定することができる。表示設定に対する修正の例としては、図２の第１の表示設定２５０から第２の表示設定２５５への修正、図５Ａ～図５Ｂの表示設定５２０から表示設定５５５への修正、表示設定８３７に対する修正８７５、又はそれらの組み合わせが挙げられる。

【0164】

[0178] いくつかの例では、仮想コンテンツに対応する表示設定に対する修正は、ディスプレイに、仮想コンテンツの少なくとも一部分を表示することを停止させることを含む。この例が図５Ｂに示されており、表示設定５２０から表示設定５５５への修正により、図５Ｂに示されているように、仮想コンテンツ５３５がもはや画像５０５の上にオーバーレイされないようにする。いくつかの例では、仮想コンテンツに対応する表示設定に対する修正は、ディスプレイに、仮想コンテンツの少なくとも一部分を、修正の前よりも顕著に表示させることを含む。この例が図５Ｂに示されており、表示設定５２０から表示設定５５５への修正により、図５Ｂに示されているように、仮想コンテンツ５２５のサイズ、フォントサイズ、及び詳細レベル（情報量）が増加される。いくつかの例では、仮想コンテンツに対応する表示設定に対する修正は、仮想コンテンツの１つ又は複数の特性に対する修正を含み、１つ又は複数の特性は、位置、向き、深度、サイズ、色、フォントサイズ、フォント色、フォント、言語、レイアウト、又はそれらの組み合わせのうちの少なくとも１つを含む。この例が図５Ｂに示されており、表示設定５２０から表示設定５５５への修正により、図５Ｂに示されているように、仮想コンテンツ５２５のサイズ、フォントサイズ、及び詳細レベル（情報量）が増加され、仮想コンテンツ５３０の位置及び深さを変更して、部分的にレッド・アワーバックの像の背後に見えるようにする。

【0165】

[0179] いくつかの例では、表示設定に対する修正は、仮想コンテンツが閾値時間内にユーザによって再視認される尤度に基づく。例えば、図７の仮想コンテンツ７３０の例では、車がユーザに急速に接近しているので、閾値時間は短くすることができ、（例えば、知覚レベル及び／又は把握レベルに基づいて）ユーザが閾値時間内に仮想コンテンツを再視認する可能性が低いと思われる場合に、ユーザが警告されることを確実にするために、修正により、仮想コンテンツ７３０のサイズを迅速に大きくすることができる。

【0166】

[0180] いくつかの例では、撮像システムは、仮想コンテンツを、仮想コンテンツに関連付けられた表示設定に従って、ディスプレイを使用して表示させるための手段であって、仮想コンテンツがディスプレイによって表示されるときに、環境がディスプレイを使用して視認可能である、表示させるための手段と、ユーザの１つ又は複数の知覚関連属性に基づいて、ユーザによってディスプレイを使用して表示された仮想コンテンツに対する知覚レベルを判定するための手段と、ユーザによる仮想コンテンツに対する知覚レベルに基づいて、仮想コンテンツに対応する表示設定に対する修正を決定するための手段と、を含むことができる。

【0167】

[0181] いくつかの例では、仮想コンテンツを表示させるための手段は、画像捕捉及び処理システム１００、画像捕捉デバイス１０５Ａ、画像処理デバイス１０５Ｂ、画像プロセッサ１５０、ＩＳＰ１５４、ホストプロセッサ１５２、ＸＲシステム２００、仮想コンテンツ生成器２１５、環境対面センサ２１０、合成器２２０、ディスプレイ２２５、ディスプレイ３４０、第１のカメラ３３０Ａ、第２のカメラ３３０Ｂ、ディスプレイ４４０、第３のカメラ４３０Ｃ、第４のカメラ４３０Ｄ、仮想コンテンツ５２５、仮想コンテンツ５３０、仮想コンテンツ５３５、仮想コンテンツ６３０、仮想コンテンツ７３０、コンピューティングシステム１１００、又はそれらの組み合わせを含む。いくつかの例では、知覚レベルを判定するための手段は、画像捕捉及び処理システム１００、画像捕捉デバイス１０５Ａ、画像処理デバイス１０５Ｂ、画像プロセッサ１５０、ＩＳＰ１５４、ホストプロセッサ１５２、ＸＲシステム２００、ユーザ対面センサ２０５、属性エンジン２３０、知覚エンジン２３５、把握エンジン２４０、仮想コンテンツスコアリングエンジン２４５、フィードバックエンジン２６０、第１のトレーニングされたＭＬモデル８２５、第２のトレーニングされたＭＬモデル８３５、第３のトレーニングされたＭＬモデル８６５、ＮＮ９００、コンピューティングシステム１１００、又はそれらの組み合わせを含む。いくつかの例では、表示設定に対する修正を決定する手段は、ＸＲシステム２００、合成器２２０、属性エンジン２３０、知覚エンジン２３５、把握エンジン２４０、仮想コンテンツスコアリングエンジン２４５、フィードバックエンジン２６０、第１のトレーニングされたＭＬモデル８２５、第２のトレーニングされたＭＬモデル８３５、第３のトレーニングされたＭＬモデル８６５、ＮＮ９００、コンピューティングシステム１１００、又はそれらの組み合わせを含む。

【0168】

[0182] いくつかの例では、本明細書で説明されるプロセス（例えば、図１、図２、図８、図９、図１０のプロセス及び／又は本明細書で説明される他のプロセス）は、コンピューティングデバイス又は装置によって実施されてもよい。いくつかの例では、図１、図２、図８、図９、及び／又は図１０のプロセスは、画像捕捉及び処理システム１００、画像捕捉デバイス１０５Ａ、画像処理デバイス１０５Ｂ、画像プロセッサ１５０、ＩＳＰ１５４、ホストプロセッサ１５２、ＸＲシステム２００、ＨＭＤ３１０、モバイルハンドセット４１０、画像５０５を捕捉し、仮想コンテンツ５２５～５３５をオーバーレイする撮像デバイス、画像６０５を捕捉し、仮想コンテンツ６３０をオーバーレイする撮像デバイス、画像７０５を捕捉し、仮想コンテンツ７３０をオーバーレイする撮像デバイス、図８の撮像デバイス、第２のトレーニングされたＭＬモデル８３５の第１のトレーニングされたＭＬモデル８２５、第３のトレーニングされたＭＬモデル８６５、ニューラルネットワーク９００、コンピューティングシステム１１００、プロセッサ１１１０、又はそれらの組み合わせによって実施され得る。

【0169】

[0183] コンピューティングデバイスは、モバイルデバイス（例えば、携帯電話）、デスクトップコンピューティングデバイス、タブレットコンピューティングデバイス、ウェアラブルデバイス（例えば、ＶＲヘッドセット、ＡＲヘッドセット、ＡＲ眼鏡、ネットワーク接続されたウォッチ若しくはスマートウォッチ、又は他のウェアラブルデバイス）、サーバコンピュータ、自律ビークル若しくは自律ビークルのコンピューティングデバイス、ロボットデバイス、テレビ、並びに／又は図１、図２、図８、図９、及び／若しくは図１０のプロセスを含む本明細書に説明されるプロセスを実施するためのリソース能力を有する任意の他のコンピューティングデバイスなどの、任意の好適なデバイスを含むことができる。場合によっては、コンピューティングデバイス又は装置は、１つ又は複数の入力デバイス、１つ又は複数の出力デバイス、１つ又は複数のプロセッサ、１つ又は複数のマイクロプロセッサ、１つ又は複数のマイクロコンピュータ、１つ又は複数のカメラ、１つ又は複数のセンサ、及び／又は本明細書で説明するプロセスのステップを実行するように構成される他の構成要素などの、様々な構成要素を含み得る。いくつかの例では、コンピューティングデバイスは、ディスプレイ、データを通信及び／又は受信するように構成されたネットワークインターフェース、それらの任意の組み合わせ、及び／又は他の構成要素を含んでよい。ネットワークインターフェースは、インターネットプロトコル（ＩＰ）ベースのデータ若しくは他のタイプのデータを通信及び／又は受信するように構成され得る。

【0170】

[0184] コンピューティングデバイスの構成要素は、回路に実装され得る。例えば、構成要素は、１つ又は複数のプログラマブル電子回路（例えば、マイクロプロセッサ、グラフィックス処理ユニット（ＧＰＵｓ）、デジタル信号プロセッサ（ＤＳＰｓ）、中央処理ユニット（ＣＰＵｓ）、及び／又は他の好適な電子回路）を含み得る、電子回路若しくは他の電子ハードウェアを含むことができる、及び／若しくはそれらを使用して実装されることが可能であり、並びに／又は本明細書で説明する様々な動作を実行するために、コンピュータソフトウェア、ファームウェア、若しくはそれらの任意の組み合わせを含むことができる、及び／若しくはそれらを使用して実装されることが可能である。

【0171】

[0185] 図１、図２、図８、図９、及び／又は図１０のプロセスは、論理フロー図、ブロック図、又は概念図として示され、それらの動作は、ハードウェア、コンピュータ命令、又はそれらの組み合わせにおいて実装され得る動作のシーケンスを表す。コンピュータ命令のコンテキストでは、動作は、１つ又は複数のプロセッサによって実行されたとき、記載された動作を実行する、１つ又は複数のコンピュータ可読記憶媒体上に記憶されたコンピュータ実行可能命令を表す。概して、コンピュータ実行可能命令は、特定の機能を実行するか又は特定のデータタイプを実装するルーチン、プログラム、オブジェクト、構成要素、データ構造などを含む。動作が説明される順序は、限定として解釈されることを意図せず、任意の数の説明される動作は、プロセスを実装するために任意の順序で、及び／又は並列に組み合わせることができる。

【0172】

[0186] 追加的に、図１、図２、図８、図９、及び／若しくは図１０のプロセス、並びに／又は本明細書において説明される他のプロセスは、実行可能命令を用いて構成された１つ又は複数のコンピュータシステムの制御下で実施されてもよく、１つ若しくは複数のプロセッサ上で、ハードウェアによって、又はそれらの組み合わせで、まとめて実行するコード（例えば、実行可能命令、１つ若しくは複数のコンピュータプログラム、又は１つ若しくは複数のアプリケーション）として実装されてもよい。上述のように、コードは、例えば、１つ又は複数のプロセッサによって実行可能な複数の命令を備えるコンピュータプログラムの形態で、コンピュータ可読記憶媒体又は機械可読記憶媒体上に記憶されてもよい。コンピュータ可読記憶媒体又は機械可読記憶媒体は、非一時的であってもよい。

【0173】

[0187] 図１１は、本技術のいくつかの態様を実装するためのシステムの一例を示す図である。詳細には、図１１は、例えば、システムの構成要素が接続１１０５を使用して互いに通信している、内部コンピューティングシステム、リモートコンピューティングシステム、カメラ、又はそれらの任意の構成要素を構成する、任意のコンピューティングデバイスであり得るコンピューティングシステム１１００の一例を示す。接続１１０５は、バスを使用した物理接続、又はチップセットアーキテクチャなどにおけるプロセッサ１１１０への直接接続であってよい。接続１１０５はまた、仮想接続、ネットワーク接続、又は論理接続であってもよい。

【0174】

[0188] いくつかの実施形態では、コンピューティングシステム１１００は、本開示において説明する機能が、１つのデータセンター、複数のデータセンター、ピアネットワークなどに分散され得る分散型システムである。いくつかの実施形態では、説明されるシステム構成要素の１つ又は複数は、構成要素の説明の対象である機能のうちのいくつか又は全てを各々実施するような多くの構成要素を表す。いくつかの実施形態では、構成要素は物理デバイス又は仮想デバイスとすることができる。

【0175】

[0189] 例示的なシステム１１００は、少なくとも１つの処理ユニット（ＣＰＵ又はプロセッサ）１１１０と、読取り専用メモリ（ＲＯＭ）１１２０及びランダムアクセスメモリ（ＲＡＭ）１１２５などのシステムメモリ１１１５を含む様々なシステム構成要素をプロセッサ１１１０に結合する接続１１０５とを含む。コンピューティングシステム１１００は、プロセッサ１１１０と直接接続されるか、プロセッサ１１１０に極めて近接しているか、又はプロセッサ１１１０の一部として統合される、高速メモリのキャッシュ１１１２を含み得る。

【0176】

[0190] プロセッサ１１１０は、任意の汎用プロセッサと、記憶デバイス１１３０内に記憶され、プロセッサ１１１０、並びにソフトウェア命令が実際のプロセッサ設計に組み込まれた専用プロセッサを制御するように構成された、サービス１１３２、１１３４、及び１１３６などのハードウェアサービス又はソフトウェアサービスとを含み得る。プロセッサ１１１０は基本的に、複数のコア又はプロセッサ、バス、メモリコントローラ、キャッシュなどを含む、完全に自己完結型のコンピューティングシステムであってもよい。マルチコアプロセッサは、対称であってもよく又は非対称であってもよい。

【0177】

[0191] ユーザ対話を可能にするために、コンピューティングシステム１１００は、発話のためのマイクロフォン、ジェスチャ入力又はグラフィカル入力のためのタッチ感知スクリーン、キーボード、マウス、モーション入力、発話などの、任意の数の入力機構を表すことができる、入力デバイス１１４５を含む。コンピューティングシステム１１００はまた、いくつかの出力機構のうちの１つ又は複数であり得る出力デバイス１１３５も含み得る。場合によっては、多モードのシステムは、コンピューティングシステム１１００と通信するためにユーザが複数のタイプの入力／出力を提供することを可能にし得る。コンピューティングシステム１１００は、一般に、ユーザ入力及びシステム出力を支配し管理することができる通信インターフェース１１４０を含み得る。通信インターフェースは、オーディオジャック／プラグ、マイクロフォンジャック／プラグ、ユニバーサルシリアルバス（universal serial bus、ＵＳＢ）ポート／プラグ、Ａｐｐｌｅ（登録商標）Ｌｉｇｈｔｎｉｎｇ（登録商標）ポート／プラグ、Ｅｔｈｅｒｎｅｔ（登録商標）ポート／プラグ、光ファイバーポート／プラグ、プロプライエタリ有線ポート／プラグ、ＢＬＵＥＴＯＯＴＨ（登録商標）ワイヤレス信号転送、ＢＬＵＥＴＯＯＴＨ（登録商標）低エネルギー（low energy、ＢＬＥ）ワイヤレス信号転送、ＩＢＥＡＣＯＮ（登録商標）ワイヤレス信号転送、無線周波識別（radio-frequency identification、ＲＦＩＤ）ワイヤレス信号転送、近距離通信（near-field communications、ＮＦＣ）ワイヤレス信号転送、専用短距離通信（dedicated short range communication、ＤＳＲＣ）ワイヤレス信号転送、８０２．１１Ｗｉ－Ｆｉワイヤレス信号転送、ワイヤレスローカルエリアネットワーク（ＷＬＡＮ）信号転送、可視光通信（Visible Light Communication、ＶＬＣ）、ワールドワイドインターオペラビリティフォーマイクロウェーブアクセス（Worldwide Interoperability for Microwave Access、ＷｉＭＡＸ）、赤外線（infrared、ＩＲ）通信ワイヤレス信号転送、公衆交換電話網（Public Switched Telephone Network、ＰＳＴＮ）信号転送、統合サービスデジタルネットワーク（Integrated Services Digital Network、ＩＳＤＮ）信号転送、３Ｇ／４Ｇ／５Ｇ／ＬＴＥセルラーデータネットワークワイヤレス信号転送、アドホックネットワーク信号転送、電波信号転送、マイクロ波信号転送、赤外線信号転送、可視光信号転送、紫外光信号転送、電磁スペクトルに沿ったワイヤレス信号転送、又はそれらの何らかの組み合わせを利用するものを含む、有線及び／又はワイヤレスのトランシーバを使用する有線通信又はワイヤレス通信の受信及び／又は送信を実施し得るか、又は容易にし得る。通信インターフェース１１４０はまた、１つ又は複数の全地球航法衛星システム（ＧＮＳＳ）システムに関連する１つ又は複数の衛星からの１つ又は複数の信号の受信に基づいて、コンピューティングシステム１１００のロケーションを決定するために使用される、１つ又は複数のＧＮＳＳ受信機又はトランシーバを含んでもよい。ＧＮＳＳシステムは、限定はしないが、米国の全地球測位システム（ＧＰＳ）、ロシアの全地球航法衛星システム（Global Navigation Satellite System、ＧＬＯＮＡＳＳ）、中国の北斗航法衛星システム（BeiDou Navigation Satellite system、ＢＤＳ）、及び欧州のＧａｌｉｌｅｏＧＮＳＳを含む。任意の特定のハードウェア配列で動作することに対して制約がなく、したがって、ここでの基本的な特徴は、それらが開発されるにつれて、改善されたハードウェア配列又はファームウェア配列のために容易に置き換えられてよい。

【0178】

[0192] 記憶デバイス１１３０は、不揮発性のかつ／又は非一時的なかつ／又はコンピュータ可読のメモリデバイスであってもよく、磁気カセット、フラッシュメモリカード、固体メモリデバイス、デジタル多用途ディスク、カートリッジ、フロッピー（登録商標）ディスク、フレキシブルディスク、ハードディスク、磁気テープ、磁気ストリップ／ストライプ、任意の他の磁気記憶媒体、フラッシュメモリ、メモリスタメモリ、任意の他の固体メモリ、コンパクトディスク読取り専用メモリ（compact disc read only memory、ＣＤ－ＲＯＭ）光ディスク、再書き込み可能コンパクトディスク（compact disc、ＣＤ）光ディスク、デジタルビデオディスク（digital video disk、ＤＶＤ）光ディスク、ブルーレイディスク（blu-ray disc、ＢＤＤ）光ディスク、ホログラフィック光ディスク、別の光媒体、セキュアデジタル（secure digital、ＳＤ）カード、マイクロセキュアデジタル（micro secure digital、ｍｉｃｒｏＳＤ）カード、メモリスティック（登録商標）カード、スマートカードチップ、ＥＭＶチップ、加入者識別モジュール（subscriber identity module、ＳＩＭ）カード、ミニ／マイクロ／ナノ／ピコＳＩＭカード、別の集積回路（integrated circuit、ＩＣ）チップ／カード、ランダムアクセスメモリ（ＲＡＭ）、スタティックＲＡＭ（static RAM、ＳＲＡＭ）、ダイナミックＲＡＭ（dynamic RAM、ＤＲＡＭ）、読取り専用メモリ（ＲＯＭ）、プログラマブル読取り専用メモリ（programmable read-only memory、ＰＲＯＭ）、消去可能プログラマブル読取り専用メモリ（erasable programmable read-only memory、ＥＰＲＯＭ）、電気的消去可能プログラマブル読取り専用メモリ（electrically erasable programmable read-only memory、ＥＥＰＲＯＭ（登録商標））、フラッシュＥＰＲＯＭ（flashEPROM、ＦＬＡＳＨＥＰＲＯＭ）、キャッシュメモリ（Ｌ１／Ｌ２／Ｌ３／Ｌ４／Ｌ５／Ｌ＃）、抵抗性ランダムアクセスメモリ（resistive random-access memory、ＲＲＡＭ（登録商標）／ＲｅＲＡＭ）、位相変化メモリ（phase change memory、ＰＣＭ）、スピン転送トルクＲＡＭ（spin transfer torque RAM、ＳＴＴ－ＲＡＭ）、別のメモリチップ若しくはカートリッジ、及び／又はそれらの組み合わせなどの、コンピュータによってアクセス可能であるデータを記憶できるハードディスク又は他のタイプのコンピュータ可読媒体であってよい。

【0179】

[0193] 記憶デバイス１１３０は、そのようなソフトウェアを定義するコードがプロセッサ１１１０によって実行されたときに、システムに機能を実施させる、ソフトウェアサービス、サーバ、サービスなどを含み得る。いくつかの実施形態では、特定の機能を実施するハードウェアサービスは、機能を実行するために、プロセッサ１１１０、接続１１０５、出力デバイス１１３５などの必要なハードウェア構成要素に関してコンピュータ可読媒体内に記憶された、ソフトウェア構成要素を含み得る。

【0180】

[0194] 本明細書で使用する「コンピュータ可読媒体」という用語は、限定はしないが、携帯型又は非携帯型の記憶デバイス、光記憶デバイス、並びに命令及び／又はデータを記憶、格納、又は搬送することが可能な様々な他の媒体を含む。コンピュータ可読媒体は、データが記憶され、かつワイヤレスで若しくは有線接続を介して伝搬する搬送波及び／又は一時的な電子信号を含まない、非一時的媒体を含んでもよい。非一時的媒体の例としては、限定はしないが、磁気ディスク若しくはテープ、コンパクトディスク（ＣＤ）若しくはデジタル多用途ディスク（ＤＶＤ）などの光記憶媒体、フラッシュメモリ、メモリ、又はメモリデバイスが挙げられ得る。コンピュータ可読媒体は、プロシージャ、関数、サブプログラム、プログラム、ルーチン、サブルーチン、モジュール、ソフトウェアパッケージ、クラス、又は命令、データ構造、若しくはプログラムステートメントの任意の組み合わせを表し得る、コンピュータ可読媒体上に記憶されたコード及び／又は機械実行可能命令を有してもよい。コードセグメントは、情報、データ、引数、パラメータ、又はメモリコンテンツを渡すこと及び／又は受けることによって、別のコードセグメント又はハードウェア回路に結合されてもよい。情報、引数、パラメータ、データなどは、メモリ共有、メッセージパッシング、トークンパッシング、ネットワーク伝送などを含む、任意の適切な手段を使用して渡され、転送され、又は伝送されてもよい。

【0181】

[0195] いくつかの実施形態では、コンピュータ可読記憶デバイス、媒体、及びメモリは、ビットストリームなどを含むケーブル又はワイヤレス信号を含み得る。しかしながら、言及する場合、非一時的コンピュータ可読記憶媒体は、エネルギー、キャリア信号、電磁波、及び信号自体などの媒体を明確に除外する。

【0182】

[0196] 本明細書で提供する実施形態及び例の完全な理解を与えるために、上記の説明において具体的な詳細が提供されている。しかしながら、実施形態がこれらの具体的な詳細なしに実践され得ることが当業者によって理解されよう。説明を分かりやすくするために、いくつかの事例では、本技術は、デバイス、デバイス構成要素、ソフトウェアの中で具現される方法におけるステップ若しくはルーチン、又はハードウェアとソフトウェアとの組み合わせを備える機能ブロックを含む、個々の機能ブロックを含むものとして提示されることがある。図中に示され、及び／又は本明細書で説明される構成要素以外の、追加の構成要素が使用されてもよい。例えば、不必要な詳細で実施形態を不明瞭にしないように、回路、システム、ネットワーク、プロセス、及び他の構成要素がブロック図の形態で構成要素として示されてもよい。他の事例では、実施形態を不明瞭にすることを避けるために、よく知られている回路、プロセス、アルゴリズム、構造、及び技法は、不必要な詳細なしに示されてもよい。

【0183】

[0197] 個々の実施形態は、フローチャート、フロー図、データフロー図、構造図、又はブロック図として示されるプロセス又は方法として上記で説明されてもよい。フローチャートは、動作を逐次プロセスとして説明することがあるが、動作の多くは並列に又は同時に実行することができる。加えて、動作の順序は並べ替えられてもよい。プロセスは、その動作が完了するときに終了するが、図に含まれていない追加のステップを有することができる。プロセスは、メソッド、関数、プロシージャ、サブルーチン、サブプログラムなどに対応してもよい。プロセスが関数に対応するとき、その終了は、その関数が呼出し関数又はメイン関数に戻ることに対応することができる。

【0184】

[0198] 上記で説明した例によるプロセス及び方法は、コンピュータ可読媒体に記憶されているか、又はそうでなければコンピュータ可読媒体から入手可能なコンピュータ実行可能命令を使用して実装され得る。そのような命令は、例えば、汎用コンピュータ、専用コンピュータ、若しくは処理デバイスにいくつかの機能若しくは機能の群を実施させるか、又は場合によっては、いくつかの機能若しくは機能の群を実施するように汎用コンピュータ、専用コンピュータ、若しくは処理デバイスを構成する、命令及びデータを含み得る。使用されるコンピュータリソースの部分は、ネットワークを介してアクセス可能であり得る。コンピュータ実行可能命令は、例えば、アセンブリ言語、ファームウェア、ソースコードなどの、バイナリ、中間フォーマット命令であってもよい。命令、使用される情報、及び／又は説明する例による方法の間に作成される情報を記憶するために使用されることがあるコンピュータ可読媒体の例としては、磁気又は光ディスク、フラッシュメモリ、不揮発性メモリを備えたＵＳＢデバイス、ネットワーク接続された記憶デバイスなどが挙げられる。

【0185】

[0199] これらの開示に従ってプロセス及び方法を実装するデバイスは、ハードウェア、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語、又はそれらの任意の組み合わせを含むことができ、様々なフォームファクタのうちのいずれかを取ることができる。ソフトウェア、ファームウェア、ミドルウェア、又はマイクロコードにおいて実装されるとき、必要なタスクを実行するためのプログラムコード又はコードセグメント（例えば、コンピュータプログラム製品）は、コンピュータ可読媒体又は機械可読媒体に記憶されてもよい。プロセッサは、必要なタスクを実行してもよい。フォームファクタの典型的な例は、ラップトップ、スマートフォン、携帯電話、タブレットデバイス又は他の小スペース型パーソナルコンピュータ、携帯情報端末、ラックマウントデバイス、スタンドアロンデバイスなどを含む。本明細書で説明した機能はまた、周辺装置又はアドインカードで具現化され得る。そのような機能はまた、更なる例として、異なるチップのうちの回路基板上、又は単一のデバイスにおいて実行する異なるプロセス上で実装され得る。

【0186】

[0200] 命令、そのような命令を伝えるための媒体、命令を実行するためのコンピューティングリソース、及びそのようなコンピューティングリソースをサポートするための他の構造は、本開示で説明した機能を提供するための例示的な手段である。

【0187】

[0201] 上記の説明では、本出願の態様はそれらの特定の実施形態を参照しながら説明されるが、本出願がそれらに限定されないことを当業者は認識されよう。したがって、本出願の例示的な実施形態が本明細書で詳細に説明されているが、本発明の概念が別のやり方で様々に具現及び採用され得ること、並びに従来技術によって限定される場合を除き、添付の特許請求の範囲がそのような変形を含むものと解釈されることが意図されることを理解されたい。上記で説明した本出願の様々な特徴及び態様は、個別に又は共同で使用され得る。更に、実施形態は、本明細書のより広い趣旨及び範囲から逸脱することなく、本明細書で説明されるもの以外の任意の数の環境及び適用例において利用することができる。したがって、本明細書及び図面は、限定的ではなく例示的とみなされるべきである。例示の目的のために、方法は特定の順序で説明された。代替実施形態では、方法は、説明された順序とは異なる順序で実行されてもよいことを理解されたい。

【0188】

[0202] 本明細書において使用される、よりも小さい（「＜」）及びよりも大きい（「＞」）という記号又は用語は、本説明の範囲から逸脱することなく、以下（「≦」）及び以上（「≧」）という記号それぞれに置き換えることができることを、当業者は理解するであろう。

【0189】

[0203] 構成要素が特定の動作を実行する「ように構成されている」ものとして説明される場合、そのような構成は、例えば、動作を実行するように電子回路若しくは他のハードウェアを設計することによって、動作を実行するようにプログラマブル電子回路（例えば、マイクロプロセッサ、又は他の適切な電子回路）をプログラムすることによって、又はそれらの任意の組み合わせで達成され得る。

【0190】

[0204] 「に結合された」という句は、直接的若しくは間接的のいずれかで別の構成要素に物理的に接続されている任意の構成要素、及び／又は直接的若しくは間接的のいずれかで別の構成要素と通信している（例えば、有線接続若しくはワイヤレス接続及び／又は他の好適な通信インターフェースを介して他の構成要素に接続されている）任意の構成要素を指す。

【0191】

[0205] 集合「のうちの少なくとも１つ」及び／又は集合のうちの「１つ又は複数」と記載する請求項の文言又は他の文言は、集合の１つのメンバー又は集合の（任意の組み合わせでの）複数のメンバーが請求項を満たすことを示す。例えば、「Ａ及びＢのうちの少なくとも１つ」と記載する請求項の文言は、Ａ、Ｂ、又はＡ及びＢを意味する。別の例では、「Ａ、Ｂ、及びＣのうちの少なくとも１つ」と記載する請求項の文言は、Ａ、Ｂ、Ｃ、又はＡ及びＢ、又はＡ及びＣ、又はＢ及びＣ、又はＡ及びＢ及びＣを意味する。集合「のうちの少なくとも１つ」及び／又は集合のうちの「１つ以上」という文言は、集合の中で列挙される項目にその集合を限定しない。例えば、「Ａ及びＢのうちの少なくとも１つ」を記述する請求項の文言は、Ａ、Ｂ、又はＡ及びＢを意味することができ、加えて、Ａ及びＢの集合に列挙されていない項目を更に含むことができる。

【0192】

[0206] 本明細書で開示する実施形態に関して説明した様々な例示的な論理ブロック、モジュール、回路、及びアルゴリズムステップは、電子ハードウェア、コンピュータソフトウェア、ファームウェア、又はそれらの組み合わせとして実装され得る。ハードウェアとソフトウェアのこの互換性を明確に示すために、様々な例示的な構成要素、ブロック、モジュール、回路、及びステップについて、それらの機能に関して概略的に上記で説明した。そのような機能がハードウェアとして実装されるのか又はソフトウェアとして実装されるのかは、特定の適用例及びシステム全体に課される設計上の制約に依存する。当業者は、説明した機能を特定の適用例ごとに様々な方法で実装し得るが、そのような実装の決定は、本出願の範囲から逸脱する原因として解釈されるべきではない。

【0193】

[0207] 本明細書で説明される技法はまた、電子ハードウェア、コンピュータソフトウェア、ファームウェア、又はそれらの任意の組み合わせにおいて実装され得る。そのような技法は、汎用コンピュータ、ワイヤレス通信デバイスハンドセット、又はワイヤレス通信デバイスハンドセット及び他のデバイスにおける適用例を含む複数の用途を有する集積回路デバイスなどの、様々なデバイスのうちのいずれかにおいて実装されてもよい。モジュール又は構成要素として説明した任意の特徴は、集積ロジックデバイスの中で一緒に、又は個別であるが相互動作可能なロジックデバイスとして別々に実装され得る。ソフトウェアで実装される場合、技法は、実行されると、上で説明された方法のうちの１つ又は複数を実施する命令を含むプログラムコードを備える、コンピュータ可読データ記憶媒体によって少なくとも部分的に実現されてよい。コンピュータ可読データ記憶媒体は、コンピュータプログラム製品の一部を形成してもよく、これはパッケージ材料を含んでもよい。コンピュータ可読媒体は、同期ダイナミックランダムアクセスメモリ（synchronous dynamic random access memory、ＳＤＲＡＭ）などのランダムアクセスメモリ（ＲＡＭ）、読取り専用メモリ（ＲＯＭ）、不揮発性ランダムアクセスメモリ（non-volatile random access memory、ＮＶＲＡＭ）、電気的消去可能プログラマブル読取り専用メモリ（ＥＥＰＲＯＭ）、ＦＬＡＳＨ（登録商標）メモリ、磁気又は光データ記憶媒体などの、メモリ又はデータ記憶媒体を備えてもよい。技法は、追加又は代替として、命令又はデータ構造の形態でのプログラムコードを搬送又は通信し得る、かつコンピュータによってアクセスされ、読み取られ、及び／又は実行され得る、伝搬される信号又は波などの、コンピュータ可読通信媒体によって少なくとも部分的に実現されてもよい。

【0194】

[0208] プログラムコードは、１つ又は複数のデジタル信号プロセッサ（ＤＳＰｓ）、汎用マイクロプロセッサ、特定用途向け集積回路（application specific integrated circuits、ＡＳＩＣｓ）、フィールドプログラマブルロジックアレイ（field programmable logic arrays、ＦＰＧＡｓ）、又は他の同等の集積論理回路若しくは個別論理回路などの１つ又は複数のプロセッサを含み得る、プロセッサによって実行されてもよい。そのようなプロセッサは、本開示に記載された技法のいずれかを実施するように構成されてもよい。汎用プロセッサは、マイクロプロセッサであってもよい代わりに、プロセッサは、任意の従来のプロセッサ、コントローラ、マイクロコントローラ、又はステートマシンでもあってもよい。プロセッサはまた、コンピューティングデバイスの組み合わせ、例えば、ＤＳＰとマイクロプロセッサとの組み合わせ、複数のマイクロプロセッサ、ＤＳＰコアと連携した１つ又は複数のマイクロプロセッサ、又は任意の他のそのような構成として実装されてもよい。したがって、本明細書で使用する「プロセッサ」という用語は、上記の構造、上記の構造の任意の組み合わせ、又は本明細書で説明した技法の実装に適した任意の他の構造若しくは装置のうちのいずれかを指すことがある。加えて、いくつかの態様では、本明細書で説明した機能性は、符号化及び復号のために構成された専用のソフトウェアモジュール若しくはハードウェアモジュール内に設けられてよく、又は複合ビデオエンコーダデコーダ（combined video encoder-decoder、ＣＯＤＥＣ）内に組み込まれてよい。

【0195】

[0209] 本開示の例示的な態様は以下を含む。

【0196】

[0210] 態様１：エクステンデッドリアリティ（ＸＲ）システムであって、装置は、メモリと、メモリに結合された１つ又は複数のプロセッサと、を備え、１つ又は複数のプロセッサは、仮想コンテンツを、仮想コンテンツに関連付けられた表示設定に従って、ディスプレイを使用して表示させ、仮想コンテンツがディスプレイによって表示されるときに、環境がディスプレイを使用して視認可能であり、ユーザの１つ又は複数の知覚関連属性に基づいて、ユーザによってディスプレイを使用して表示された仮想コンテンツに対する知覚レベルを判定し、ユーザによる仮想コンテンツに対する知覚レベルに基づいて、仮想コンテンツに対応する表示設定に対する修正を決定する、ように構成されている、ＸＲシステム。

【0197】

[0211] 態様２．ユーザの１つ又は複数の知覚関連属性が、ユーザの１つ又は複数の眼に関連付けられている、態様１に記載のＸＲシステム。

【0198】

[0212] 態様３．ディスプレイの少なくとも一部分を通過する環境からの光に少なくとも部分的に基づいて、環境が、ディスプレイを使用して視認可能である、態様１又は２に記載のＸＲシステム。

【0199】

[0213] 態様４．環境のビューをディスプレイによって表示させるように１つ又は複数のプロセッサが構成されていることに少なくとも部分的に基づいて、環境が、ディスプレイを使用して視認可能である、態様１～３のいずれかに記載のＸＲシステム。

【0200】

[0214] 態様５．ユーザによる仮想コンテンツに対する知覚レベルを判定するために、１つ又は複数のプロセッサが、１つ又は複数のトレーニングされた機械学習システムへの入力として、ユーザの１つ又は複数の知覚関連属性を使用するように構成されている、態様１～４のいずれかに記載のＸＲシステム。

【0201】

[0215] 態様６．１つ又は複数のプロセッサが、ユーザインターフェースを通して、ユーザによる仮想コンテンツに対する知覚レベルに対応するフィードバックを受信し、フィードバックに基づいて、１つ又は複数のトレーニングされた機械学習システムを更新する、ように構成されている、態様５に記載のＸＲシステム。

【0202】

[0216] 態様７．１つ又は複数のプロセッサが、１つ又は複数のセンサによって捕捉されたセンサデータであって、ユーザの１つ又は複数の眼を示す、センサデータを受信し、センサデータに基づいて、ユーザの１つ又は複数の知覚関連属性を判定する、ように構成されている、態様１～６のいずれかに記載のＸＲシステム。

【0203】

[0217] 態様８．１つ又は複数のセンサを更に備える、態様７に記載のＸＲシステム。

【0204】

[0218] 態様９．１つ又は複数のプロセッサが、１つ又は複数の画像センサによって捕捉されたセンサデータに基づいて、ユーザの１つ又は複数の知覚関連属性を判定するように構成されており、センサデータが、ユーザの１つ又は複数の眼の１つ又は複数の画像を含む、態様１～８のいずれかに記載のＸＲシステム。

【0205】

[0219] 態様１０．１つ又は複数のプロセッサが、ユーザによる仮想コンテンツに対する知覚レベルに基づいて、ユーザによる仮想コンテンツに対する把握レベルを判定するように構成されており、知覚レベルに基づいて表示設定に対する修正を決定するために、１つ又は複数のプロセッサが、把握レベルに基づいて、表示設定に対する修正を決定するように構成されている、態様１～９のいずれかに記載のＸＲシステム。

【0206】

[0220] 態様１１．１つ又は複数のプロセッサが、ユーザに関連付けられた履歴情報を受信するように構成されており、ユーザによる仮想コンテンツに対する把握レベルを判定するために、１つ又は複数のプロセッサが、ユーザに関する履歴情報に基づいて、ユーザによる仮想コンテンツに対する把握レベルを判定するように構成されている、態様１０に記載のＸＲシステム。

【0207】

[0221] 態様１２．１つ又は複数のプロセッサが、仮想コンテンツの特性を判定するように構成されており、ユーザによる仮想コンテンツに対する知覚レベルを判定するために、１つ又は複数のプロセッサが、仮想コンテンツの特性に更に基づいて、知覚レベルを判定するように構成されている、態様１～１１のいずれかに記載のＸＲシステム。

【0208】

[0222] 態様１３．１つ又は複数のプロセッサが、仮想コンテンツの複雑さレベルを判定するように構成されており、ユーザによる仮想コンテンツに対する知覚レベルを判定するために、１つ又は複数のプロセッサが、仮想コンテンツの複雑さレベルに基づいて、知覚レベルを判定するように構成されている、態様１～１２のいずれかに記載のＸＲシステム。

【0209】

[0223] 態様１４．１つ又は複数のプロセッサが、仮想コンテンツの一意性レベルを判定するように構成されており、ユーザによる仮想コンテンツに対する知覚レベルを判定するために、１つ又は複数のプロセッサが、仮想コンテンツの一意性レベルに基づいて、知覚レベルを判定するように構成されている、態様１～１３のいずれかに記載のＸＲシステム。

【0210】

[0224] 態様１５．仮想コンテンツに対応する表示設定に対する修正が、ディスプレイに、仮想コンテンツの少なくとも一部分を表示することを停止させることを含む、態様１～１４のいずれかに記載のＸＲシステム。

【0211】

[0225] 態様１６．仮想コンテンツに対応する表示設定に対する修正が、ディスプレイに、仮想コンテンツの少なくとも一部分を、修正の前よりも顕著に表示させることを含む、態様１～１５のいずれかに記載のＸＲシステム。

【0212】

[0226] 態様１７．仮想コンテンツに対応する表示設定に対する修正が、仮想コンテンツの１つ又は複数の特性に対する修正を含み、１つ又は複数の特性が、位置、向き、深度、サイズ、色、フォントサイズ、フォント色、フォント、言語、及びレイアウトのうちの少なくとも１つを含む、態様１～１６のいずれかに記載のＸＲシステム。

【0213】

[0227] 態様１８．ユーザによる仮想コンテンツに対する知覚レベルを判定するために、１つ又は複数のプロセッサが、ユーザが仮想コンテンツを知覚したことを判定するように構成されている、態様１～１７のいずれかに記載のＸＲシステム。

【0214】

[0228] 態様１９．ユーザによる仮想コンテンツに対する知覚レベルを判定するために、１つ又は複数のプロセッサが、ユーザが仮想コンテンツを知覚していないと判定するように構成されている、態様１～１８のいずれかに記載のＸＲシステム。

【0215】

[0229] 態様２０．表示設定に対する修正が、仮想コンテンツが閾値時間内にユーザによって再視認される尤度に基づく、態様１～１９のいずれかに記載のＸＲシステム。

【0216】

[0230] 態様２１．ユーザによる仮想コンテンツに対する知覚レベルを判定するために、１つ又は複数のプロセッサが、ユーザによる仮想コンテンツに対する知覚レベルに対応する信頼レベルを判定するように構成されており、表示設定に対する修正が、信頼レベルに基づく、態様１～２０のいずれかに記載のＸＲシステム。

【0217】

[0231] 態様２２．ユーザの１つ又は複数の知覚関連属性が、仮想コンテンツに対するユーザの１つ又は複数の眼の１つ又は複数の眼球位置を含む、態様１～２１のいずれかに記載のＸＲシステム。

【0218】

[0232] 態様２３．ユーザの１つ又は複数の知覚関連属性が、ユーザの１つ又は複数の眼による１回又は複数回のサッカードの１つ又は複数の特性を含み、１つ又は複数の特性が、頻度、持続時間、タイミング、サッカード速度、サッカード振幅、眼球位置、及び眼球運動のうちの少なくとも１つを含む、態様１～２２のいずれかに記載のＸＲシステム。

【0219】

[0233] 態様２４．ユーザの１つ又は複数の知覚関連属性が、ユーザの１つ又は複数の眼による１回又は複数回の固視の１つ又は複数の特性を含み、１つ又は複数の特性が、頻度、持続時間、タイミング、眼球位置、及び眼球運動のうちの少なくとも１つを含む、態様１～２３のいずれかに記載のＸＲシステム。

【0220】

[0234] 態様２５．ユーザの１つ又は複数の知覚関連属性が、ユーザの１つ又は複数の眼による１回又は複数回の瞳孔拡張の１つ又は複数の特性を含み、１つ又は複数の特性が、頻度、持続時間、タイミング、瞳孔拡張レベル、眼球位置、及び眼球運動のうちの少なくとも１つを含む、態様１～２４のいずれかに記載のＸＲシステム。

【0221】

[0235] 態様２６．ユーザの１つ又は複数の知覚関連属性が、ユーザの１つ又は複数の瞼による１回又は複数回の瞬きの１つ又は複数の特性を含み、１つ又は複数の特性が、頻度、持続時間、タイミング、瞬き速度、眼球位置、及び眼球運動のうちの少なくとも１つを含む、態様１～２５のいずれかに記載のＸＲシステム。

【0222】

[0236] 態様２７．ユーザの１つ又は複数の知覚関連属性が、ユーザの１つ又は複数の瞼による１回又は複数回の眼を細めることの１つ又は複数の特性を含み、１つ又は複数の特性が、頻度、持続時間、タイミング、眼を細めるレベル、眼球位置、及び眼球運動のうちの少なくとも１つを含む、態様１～２６のいずれかに記載のＸＲシステム。

【0223】

[0237] 態様２８．１つ又は複数のプロセッサが、ユーザによる文字列の読解の程度を、仮想コンテンツに対する知覚レベルと文字列の長さとに基づいて判定するように構成されており、仮想コンテンツが、文字列を含む、態様１～２７のいずれかに記載のＸＲシステム。

【0224】

[0238] 態様２９．ディスプレイを更に備える、態様１～２８のいずれかに記載のＸＲシステム。

【0225】

[0239] 態様３０．ＸＲシステムが、モバイルハンドセット、無線通信デバイス、及びヘッドマウントディスプレイのうちの少なくとも１つを含む、態様１～２９のいずれかに記載のＸＲシステム。

【0226】

[0240] 態様３１．１つ又は複数のプロセッサが、環境に対する仮想コンテンツの独自性レベルを判定するように構成されており、ユーザによる仮想コンテンツに対する知覚レベルを判定するために、１つ又は複数のプロセッサが、環境に対する仮想コンテンツの独自性レベルに基づいて、知覚レベルを判定するように構成されている、態様１～３０のいずれかに記載のＸＲシステム。

【0227】

[0241] 態様３２．１つ又は複数のプロセッサが、ユーザの１つ又は複数の眼の表現を含むセンサデータに少なくとも部分的に基づいて、ユーザの１つ又は複数の知覚関連属性のうちの少なくとも１つを判定するように構成されており、１つ又は複数のセンサが、センサデータを捕捉するように構成されている、態様１～３１のいずれかに記載のＸＲシステム。

【0228】

[0242] 態様３３．ユーザの１つ又は複数の知覚関連属性が、ユーザの１つ又は複数の眼の１つ又は複数の属性、ユーザの１つ又は複数の表情の１つ又は複数の属性、及びユーザの１つ又は複数のジェスチャ、のうちの少なくとも１つを含む、態様１～３２のいずれかに記載のＸＲシステム。

【0229】

[0243] 態様３４．ユーザによる仮想コンテンツに対する知覚レベルを判定するために、１つ又は複数のプロセッサが、ユーザの１つ又は複数の知覚関連属性に基づいて、ユーザによる仮想コンテンツに対する把握レベルを判定するように構成されている、態様１～３３のいずれかに記載のＸＲシステム。

【0230】

[0244] 態様３５．ユーザによる仮想コンテンツに対する把握レベルを判定するために、１つ又は複数のプロセッサが、ユーザの１つ又は複数の知覚関連属性と、仮想コンテンツの１つ又は複数の特性、コンテキストデータ、及びユーザのユーザプロファイルのうちの少なくとも１つとに基づいて、ユーザによる仮想コンテンツに対する把握レベルを判定するように構成されている、態様３４に記載のＸＲシステム。

【0231】

[0245] 態様３６．ユーザプロファイルが、ユーザに関連付けられた履歴データを含む、態様３５に記載のＸＲシステム。

【0232】

[0246] 態様３７．コンテキストデータが、仮想コンテンツに対するユーザによる１つ又は複数の反応を含む、態様３５又は３６に記載のＸＲシステム。

【0233】

[0247] 態様３８．コンテキストデータが、ＸＲシステムのロケーションを含む、態様３５～３７のいずれかに記載のＸＲシステム。

【0234】

[0248] 態様３９．ユーザによる仮想コンテンツに対する知覚レベルを判定するために、１つ又は複数のプロセッサが、ユーザが複数の知覚レベルのうちの第１の知覚レベルまで仮想コンテンツを知覚したことを判定するように構成されている、態様１～３８のいずれかに記載のＸＲシステム。

【0235】

[0249] 態様４０．ユーザによる仮想コンテンツに対する知覚レベルを判定するために、１つ又は複数のプロセッサが、ユーザが複数の知覚レベルのうちの第２の知覚レベルまで仮想コンテンツを知覚したことを判定するように構成されている、態様１～３９のいずれかに記載のＸＲシステム。

【0236】

[0250] 態様４１．エクステンデッドリアリティ（ＸＲ）動作の方法であって、方法は、仮想コンテンツを、仮想コンテンツに関連付けられた表示設定に従って、ディスプレイを使用して表示させることであって、仮想コンテンツがディスプレイによって表示されるときに、環境がディスプレイを使用して視認可能である、表示させることと、ユーザの１つ又は複数の知覚関連属性に基づいて、ユーザによってディスプレイを使用して表示された仮想コンテンツに対する知覚レベルを判定することと、ユーザによる仮想コンテンツに対する知覚レベルに基づいて、仮想コンテンツに対応する表示設定に対する修正を決定することと、を含む、方法。

【0237】

[0251] 態様４２．ユーザの１つ又は複数の知覚関連属性が、ユーザの１つ又は複数の眼に関連付けられている、態様４１に記載の方法。

【0238】

[0252] 態様４３．ディスプレイの少なくとも一部分を通過する環境からの光に少なくとも部分的に基づいて、環境が、ディスプレイを使用して視認可能である、態様４１又は４２に記載の方法。

【0239】

[0253] 態様４４．環境のビューをディスプレイによって表示させることに少なくとも部分的に基づいて、環境が、ディスプレイを使用して視認可能である、態様４１～４３のいずれかに記載の方法。

【0240】

[0254] 態様４５．ユーザによる仮想コンテンツに対する知覚レベルを判定することが、１つ又は複数のトレーニングされた機械学習システムへの入力として、ユーザの１つ又は複数の知覚関連属性を使用することを含む、態様４１～４４のいずれかに記載の方法。

【0241】

[0255] 態様４６．ユーザインターフェースを通して、ユーザによる仮想コンテンツに対する知覚レベルに対応するフィードバックを受信することと、フィードバックに基づいて、１つ又は複数のトレーニングされた機械学習システムを更新することと、を更に含む、態様４５に記載の方法。

【0242】

[0256] 態様４７．１つ又は複数のセンサによって捕捉されたセンサデータであって、ユーザの１つ又は複数の眼を示す、センサデータを受信することと、センサデータに基づいて、ユーザの１つ又は複数の知覚関連属性を判定することと、を更に含む、態様４１～４６のいずれかに記載の方法。

【0243】

[0257] 態様４８．方法が、１つ又は複数のセンサを含むＸＲシステムによって実施される、態様４１～４７のいずれかに記載の方法。

【0244】

[0258] 態様４９．１つ又は複数の画像センサによって捕捉されたセンサデータに基づいて、ユーザの１つ又は複数の知覚関連属性を判定することを更に含み、センサデータが、ユーザの１つ又は複数の眼の１つ又は複数の画像を含む、態様４１～４８のいずれかに記載の方法。

【0245】

[0259] 態様５０．ユーザによる仮想コンテンツに対する知覚レベルに基づいて、ユーザによる仮想コンテンツに対する把握レベルを判定することを更に含み、知覚レベルに基づいて表示設定に対する修正を決定することが、把握レベルに基づいて表示設定に対する修正を決定することを含む、態様４１～４９のいずれかに記載の方法。

【0246】

[0260] 態様５１．ユーザに関連付けられた履歴情報を受信することを更に含み、ユーザによる仮想コンテンツに対する把握レベルを判定することが、ユーザに関する履歴情報に基づく、態様５０に記載の方法。

【0247】

[0261] 態様５２．仮想コンテンツの特性を判定することを更に含み、ユーザによる仮想コンテンツに対する知覚レベルを判定することが、仮想コンテンツの特性に基づく、態様４１～５１のいずれかに記載の方法。

【0248】

[0262] 態様５３．仮想コンテンツの複雑さレベルを判定することを更に含み、ユーザによる仮想コンテンツに対する知覚レベルを判定することが、仮想コンテンツの複雑さレベルに基づく、態様４１～５２のいずれかに記載の方法。

【0249】

[0263] 態様５４．仮想コンテンツの一意性レベルを判定することを更に含み、ユーザによる仮想コンテンツに対する知覚レベルを判定することが、仮想コンテンツの一意性レベルに基づく、態様４１～５３のいずれかに記載の方法。

【0250】

[0264] 態様５５．仮想コンテンツに対応する表示設定に対する修正が、ディスプレイに、仮想コンテンツの少なくとも一部分を表示することを停止させることを含む、態様４１～５４のいずれかに記載の方法。

【0251】

[0265] 態様５６．仮想コンテンツに対応する表示設定に対する修正が、ディスプレイに、仮想コンテンツの少なくとも一部分を、修正の前よりも顕著に表示させることを含む、態様４１～５５のいずれかに記載の方法。

【0252】

[0266] 態様５７．仮想コンテンツに対応する表示設定に対する修正が、仮想コンテンツの１つ又は複数の特性に対する修正を含み、１つ又は複数の特性が、位置、向き、深度、サイズ、色、フォントサイズ、フォント色、フォント、言語、及びレイアウトのうちの少なくとも１つを含む、態様４１～５６のいずれかに記載の方法。

【0253】

[0267] 態様５８．ユーザによる仮想コンテンツに対する知覚レベルを判定することが、ユーザが仮想コンテンツを知覚したと判定することを含む、態様４１～５７のいずれかに記載の方法。

【0254】

[0268] 態様５９．ユーザによる仮想コンテンツに対する知覚レベルを判定することが、ユーザが仮想コンテンツを知覚していないと判定することを含む、態様４１～５８のいずれかに記載の方法。

【0255】

[0269] 態様６０．表示設定に対する修正が、仮想コンテンツが閾値時間内にユーザによって再視認される尤度に基づく、態様４１～５９のいずれかに記載の方法。

【0256】

[0270] 態様６１．ユーザによる仮想コンテンツに対する知覚レベルを判定することが、ユーザによる仮想コンテンツに対する知覚レベルに対応する信頼レベルを判定することを含み、表示設定に対する修正が、信頼レベルに基づく、態様４１～６０のいずれかに記載の方法。

【0257】

[0271] 態様６２．ユーザの１つ又は複数の知覚関連属性が、仮想コンテンツに対するユーザの１つ又は複数の眼の１つ又は複数の眼球位置を含む、態様４１～６１のいずれかに記載の方法。

【0258】

[0272] 態様６３．ユーザの１つ又は複数の知覚関連属性が、ユーザの１つ又は複数の眼による１回又は複数回のサッカードの１つ又は複数の特性を含み、１つ又は複数の特性が、頻度、持続時間、タイミング、サッカード速度、サッカード振幅、眼球位置、及び眼球運動のうちの少なくとも１つを含む、態様４１～６２のいずれかに記載の方法。

【0259】

[0273] 態様６４．ユーザの１つ又は複数の知覚関連属性が、ユーザの１つ又は複数の眼による１回又は複数回の固視の１つ又は複数の特性を含み、１つ又は複数の特性が、頻度、持続時間、タイミング、眼球位置、及び眼球運動のうちの少なくとも１つを含む、態様４１～６３のいずれかに記載の方法。

【0260】

[0274] 態様６５．ユーザの１つ又は複数の知覚関連属性が、ユーザの１つ又は複数の眼による１回又は複数回の瞳孔拡張の１つ又は複数の特性を含み、１つ又は複数の特性が、頻度、持続時間、タイミング、瞳孔拡張レベル、眼球位置、及び眼球運動のうちの少なくとも１つを含む、態様４１～６４のいずれかに記載の方法。

【0261】

[0275] 態様６６．ユーザの１つ又は複数の知覚関連属性が、ユーザの１つ又は複数の瞼による１回又は複数回の瞬きの１つ又は複数の特性を含み、１つ又は複数の特性が、頻度、持続時間、タイミング、瞬き速度、眼球位置、及び眼球運動のうちの少なくとも１つを含む、態様４１～６５のいずれかに記載の方法。

【0262】

[0276] 態様６７．ユーザの１つ又は複数の知覚関連属性が、ユーザの１つ又は複数の瞼による１回又は複数回の眼を細めることの１つ又は複数の特性を含み、１つ又は複数の特性が、頻度、持続時間、タイミング、眼を細めるレベル、眼球位置、及び眼球運動のうちの少なくとも１つを含む、態様４１～６６のいずれかに記載の方法。

【0263】

[0277] 態様６８．ユーザによる文字列の読解の程度を、仮想コンテンツに対する知覚レベルと文字列の長さとに基づいて判定することを更に含み、仮想コンテンツが、文字列を含む、態様４１～６７のいずれかに記載の方法。

【0264】

[0278] 態様６９．方法が、ディスプレイを含むＸＲシステムによって実施される、態様４１～６８のいずれかに記載の方法。

【0265】

[0279] 態様７０．方法が、モバイルハンドセット、無線通信デバイス、及びヘッドマウントディスプレイのうちの少なくとも１つを含むＸＲシステムによって実施される、態様４１～６９のいずれかに記載の方法。

【0266】

[0280] 態様７１．環境に対する仮想コンテンツの独自性レベルを判定することを更に含み、ユーザによる仮想コンテンツに対する知覚レベルを判定することが、環境に対する仮想コンテンツの独自性レベルに基づく、態様４１～７０のいずれかに記載の方法。

【0267】

[0281] 態様７２．ユーザの１つ又は複数の眼の表現を含むセンサデータに少なくとも部分的に基づいて、ユーザの１つ又は複数の知覚関連属性のうちの少なくとも１つを判定することを更に含み、１つ又は複数のセンサが、センサデータを捕捉するように構成されている、態様４１～７１のいずれかに記載の方法。

【0268】

[0282] 態様７３．ユーザの１つ又は複数の知覚関連属性が、ユーザの１つ又は複数の眼の１つ又は複数の属性、ユーザの１つ又は複数の表情の１つ又は複数の属性、及びユーザの１つ又は複数のジェスチャ、のうちの少なくとも１つを含む、態様４１～７２のいずれかに記載の方法。

【0269】

[0283] 態様７４．ユーザによる仮想コンテンツに対する知覚レベルを判定することが、ユーザの１つ又は複数の知覚関連属性に基づいて、ユーザによる仮想コンテンツに対する把握レベルを判定することを含む、態様４１～７３のいずれかに記載の方法。

【0270】

[0284] 態様７５．ユーザによる仮想コンテンツに対する把握レベルを判定することが、ユーザの１つ又は複数の知覚関連属性と、仮想コンテンツの１つ又は複数の特性、コンテキストデータ、及びユーザのユーザプロファイルのうちの少なくとも１つと、に基づく、態様７４に記載の方法。

【0271】

[0285] 態様７６．ユーザプロファイルが、ユーザに関連付けられた履歴データを含む、態様７５に記載の方法。

【0272】

[0286] 態様７７．コンテキストデータが、仮想コンテンツに対するユーザによる１つ又は複数の反応を含む、態様７５又は７６に記載の方法。

【0273】

[0287] 態様７８．方法が、ＸＲシステムによって実施され、コンテキストデータが、ＸＲシステムのロケーションを含む、態様７５～７７のいずれかに記載の方法。

【0274】

[0288] 態様７９．ユーザによる仮想コンテンツに対する知覚レベルを判定することが、ユーザが複数の知覚レベルのうちの第１の知覚レベルまで仮想コンテンツを知覚したと判定することを含む、態様４１～７８のいずれかに記載の方法。

【0275】

[0289] 態様８０．ユーザによる仮想コンテンツに対する知覚レベルを判定することが、ユーザが複数の知覚レベルのうちの第２の知覚レベルまで仮想コンテンツを知覚したと判定することを含む、態様４１～７９のいずれかに記載の方法。

【0276】

[0290] 態様８１：命令を記憶した非一時的コンピュータ可読媒体であって、命令は、１つ又は複数のプロセッサによって実行されたときに、１つ又は複数のプロセッサに、仮想コンテンツを、仮想コンテンツに関連付けられた表示設定に従って、ディスプレイを使用して表示させるようにさせ、仮想コンテンツがディスプレイによって表示されるときに、環境がディスプレイを使用して視認可能であり、ユーザの１つ又は複数の知覚関連属性に基づいて、ユーザによってディスプレイを使用して表示された仮想コンテンツに対する知覚レベルを判定させ、ユーザによる仮想コンテンツに対する知覚レベルに基づいて、仮想コンテンツに対応する表示設定に対する修正を決定させる、非一時的コンピュータ可読媒体。

【0277】

[0291] 態様８２：態様２～４０のいずれか及び／又は態様４２～８０のいずれかを更に含む、態様８１に記載の非一時的コンピュータ可読媒体。

【0278】

[0292] 態様８３：画像処理のための装置であって、装置は、仮想コンテンツを、仮想コンテンツに関連付けられた表示設定に従って、ディスプレイを使用して表示させるための手段であって、仮想コンテンツがディスプレイによって表示されるときに、環境がディスプレイを使用して視認可能である、表示させるための手段と、ユーザの１つ又は複数の知覚関連属性に基づいて、ユーザによってディスプレイを使用して表示された仮想コンテンツに対する知覚レベルを判定するための手段と、ユーザによる仮想コンテンツに対する知覚レベルに基づいて、仮想コンテンツに対応する表示設定に対する修正を決定するための手段と、を備える、装置。

【0279】

[0293] 態様８４：態様２～４０のいずれか及び／又は態様４２～８０のいずれかを更に含む、態様８３に記載の装置。

【図1】