特許6720385 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社メルカリの特許一覧

特許6720385プログラム、情報処理方法、及び情報処理端末

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B1)

(11)【特許番号】6720385

(24)【登録日】2020年6月19日

(45)【発行日】2020年7月8日

(54)【発明の名称】プログラム、情報処理方法、及び情報処理端末

(51)【国際特許分類】

G06T 19/00 20110101AFI20200629BHJP

G06F 3/01 20060101ALI20200629BHJP

【ＦＩ】

G06T19/00 600

G06F3/01 510

【請求項の数】13

【全頁数】28

(21)【出願番号】特願2019-91433(P2019-91433)

(22)【出願日】2019年5月14日

【審査請求日】2019年5月21日

(31)【優先権主張番号】特願2019-20953(P2019-20953)

(32)【優先日】2019年2月7日

(33)【優先権主張国】JP

【早期審査対象出願】

(73)【特許権者】

【識別番号】514053169

【氏名又は名称】株式会社メルカリ

(74)【代理人】

【識別番号】100079108

【弁理士】

【氏名又は名称】稲葉良幸

(74)【代理人】

【識別番号】100109346

【弁理士】

【氏名又は名称】大貫敏史

(74)【代理人】

【識別番号】100117189

【弁理士】

【氏名又は名称】江口昭彦

(74)【代理人】

【識別番号】100134120

【弁理士】

【氏名又は名称】内藤和彦

(72)【発明者】

【氏名】▲柳▼澤慧

【審査官】村松貴士

(56)【参考文献】

【文献】特表２０１６−５２１３９１（ＪＰ，Ａ）

【文献】特開２０１４−１０９８０２（ＪＰ，Ａ）

【文献】国際公開第２０１０／０７３６１６（ＷＯ，Ａ１）

【文献】特開２０１１−０８１５５６（ＪＰ，Ａ）

【文献】特開２０１７−０６８８５１（ＪＰ，Ａ）

【文献】特開２０１１−０９５７９７（ＪＰ，Ａ）

【文献】特開２０１１−０５５２５０（ＪＰ，Ａ）

【文献】特開２００９−１０４２４９（ＪＰ，Ａ）

【文献】特開２０１６−２１８６１５（ＪＰ，Ａ）

【文献】国際公開第２０１２／０３３０９５（ＷＯ，Ａ１）

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ０６Ｔ１９／００

Ｇ０６Ｆ３／０１

Ｇ０６Ｆ３／０４８ − ３／０４８９

Ｈ０４Ｎ１３／００ − １３／３９８

(57)【特許請求の範囲】

【請求項1】

情報処理端末に、
撮像部により撮像された画像、及び前記情報処理端末の位置を示す位置情報を取得することと、
前記画像及び前記位置情報を情報処理装置に送信することと、
前記情報処理装置から、前記画像及び前記位置情報を用いて特定された一つの物体の三次元モデルのデータを受信することであって、前記三次元モデルは、前記物体の内部を示す三次元モデルを含む、前記受信することと、
加速度センサ及び磁気センサにより測定されたセンサ情報に基づいて、前記情報処理端末を利用するユーザの視線方向を推定することと、
前記視線方向を用いて前記三次元モデルにより示される前記物体の内部の表示データを特定することと、
前記表示データを出力することと、
予め設定された所定操作を検知することと、
前記所定操作に応じて、前記表示データの表示倍率又は前記表示データに対応する視点位置を更新することと、
前記所定操作に応じて前記表示データに対応する視点位置が更新された状態で、予め設定された他の操作を検知することと、
前記他の操作に応じて、前記物体の内部の任意方向を出力可能な表示データに切り替えることと、を実行させるプログラム。

【請求項2】

前記情報処理端末に、
予め設定された第１操作を検知することをさらに実行させ、
前記送信することは、
前記第１操作に応じて、前記画像及び前記位置情報を情報処理装置に送信する、請求項１に記載のプログラム。

【請求項3】

前記情報処理端末に、
前記所定操作に応じて、前記物体に関する物体情報の情報量を変更して出力すること、をさらに実行させる、請求項１に記載のプログラム。

【請求項4】

前記物体情報の情報を変更して出力することは、
前記物体に近づく方向に表示データが出力されると、前記物体情報の情報量を多くして出力することを含む、請求項３に記載のプログラム。

【請求項5】

前記情報処理端末に、
前記物体の内部の各位置に対応する支配情報を管理する外部システムにより送信された前記支配情報を、前記情報処理装置を介して受信することと、
前記支配情報を、前記物体の内部の各位置に対応付けて出力することと、をさらに実行させる請求項１乃至４のいずれか一項に記載のプログラム。

【請求項6】

前記物体が店舗である場合、前記三次元モデルは、各商品棚に陳列された各商品を含む、請求項１乃至５のいずれか一項に記載のプログラム。

【請求項7】

前記表示データを出力することは、
前記撮像部により撮像された画像内の物体の位置を特定し、特定された当該位置に前記表示データを出力することを含む、請求項１乃至６のいずれか一項に記載のプログラム。

【請求項8】

前記情報処理端末に、
消去対象の物体を示す消去物体情報を取得することをさらに実行させ、
前記特定することは、
前記消去物体情報に基づいて、前記消去対象の物体の背景に位置する前記三次元モデルの表示データを特定する、請求項１に記載のプログラム。

【請求項9】

前記出力することは、
前記消去物体情報が所定の物体情報の場合に、前記表示データを、所定のデータに置き換えて出力することを含む、請求項８に記載のプログラム。

【請求項10】

情報処理端末が、
撮像部により撮像された画像、及び前記情報処理端末の位置を示す位置情報を取得することと、
前記画像及び前記位置情報を情報処理装置に送信することと、
前記情報処理装置から、前記画像及び前記位置情報を用いて特定された一つの物体の三次元モデルのデータを受信することであって、前記三次元モデルは、前記物体の内部を示す三次元モデルを含む、前記受信することと、
加速度センサ及び磁気センサにより測定されたセンサ情報に基づいて、前記情報処理端末を利用するユーザの視線方向を推定することと、
前記視線方向を用いて前記三次元モデルにより示される前記物体の内部の表示データを特定することと、
前記表示データを出力することと、
予め設定された所定操作を検知することと、
前記所定操作に応じて、前記表示データの表示倍率又は前記表示データに対応する視点位置を更新することと、
前記所定操作に応じて前記表示データに対応する視点位置が更新された状態で、予め設定された他の操作を検知することと、
前記他の操作に応じて、前記物体の内部の任意方向を出力可能な表示データに切り替えることと、を実行する情報処理方法。

【請求項11】

情報処理端末であって、
撮像部と、
前記撮像部により撮像された画像、及び前記情報処理端末の位置を示す位置情報を取得する取得部と、
前記画像及び前記位置情報を情報処理装置に送信する送信部と、
前記情報処理装置から、前記画像及び前記位置情報を用いて特定された一つの物体の三次元モデルのデータを受信する受信部であって、前記三次元モデルは、前記物体の内部を示す三次元モデルを含む、前記受信部と、
加速度センサ及び磁気センサにより測定されたセンサ情報に基づいて、前記情報処理端末を利用するユーザの視線方向を推定する推定部と、
前記視線方向を用いて前記三次元モデルにより示される前記物体の内部の表示データを特定する特定部と、
前記表示データを出力する出力部と、
予め設定された所定操作を検知する検知部と、を備え、
前記特定部は、前記所定操作に応じて、前記表示データの表示倍率又は前記表示データに対応する視点位置を更新し、
前記検知部は、前記所定操作に応じて前記表示データに対応する視点位置が更新された状態で、予め設定された他の操作を検知し、
前記特定部は、前記他の操作に応じて、前記物体の内部の任意方向を出力可能な表示データに切り替えること、を含む、情報処理端末。

【請求項12】

情報処理装置に、
情報処理端末から、撮像部により撮像された画像、及び前記情報処理端末の位置を示す位置情報を受信することと、
記憶装置に記憶される複数の物体の三次元モデルのデータの中から、前記画像及び前記位置情報を用いて一の物体の三次元モデルのデータを特定することであって、前記三次元モデルは、前記物体の内部を示す三次元モデルを含む、前記特定することと、
前記情報処理端末に、特定された三次元モデルのデータを送信することと、
前記物体が店舗であって、当該店舗内に１又は複数の撮像装置がある場合、各撮像装置により撮像された画像を画像解析して特定された前記店舗内の商品位置情報や商品情報を、前記三次元モデルに対応付けることと、を実行させるプログラム。

【請求項13】

情報処理装置が、
情報処理端末から、撮像部により撮像された画像、及び前記情報処理端末の位置を示す位置情報を受信することと、
記憶装置に記憶される複数の物体の三次元モデルのデータの中から、前記画像及び前記位置情報を用いて一の物体の三次元モデルのデータを特定することであって、前記三次元モデルは、前記物体の内部を示す三次元モデルを含む、前記特定することと、
前記情報処理端末に、特定された三次元モデルのデータを送信することと、
前記物体が店舗であって、当該店舗内に１又は複数の撮像装置がある場合、各撮像装置により撮像された画像を画像解析して特定された前記店舗内の商品位置情報や商品情報を、前記三次元モデルに対応付けることと、を実行する情報処理方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、プログラム、情報処理方法、及び情報処理端末に関する。

【背景技術】

【0002】

従来から、ユーザの頭部に装着して使用するメガネ型やヘッドマウントディスプレイ型のウェアラブル端末が存在する。これらのウェアラブル端末は、所定の情報をユーザに対して表示することが可能であり、ユーザは現実の景観を視認しつつ、現実の景観に重畳表示された情報を確認することができる。

【0003】

例えば、非特許文献１には、ヘルメット型のウェアラブル端末を装着したユーザが建設現場を歩くと、壁の向こう側を透視することが可能であり、例えば、暖房ダクトや送水管、制御盤などを確認し、また、三次元モデルのレイヤーを剥ぎ取れば、ビルの鉄骨構造や断熱、材料の加工や表面処理も確認することができる技術が開示されている。

【先行技術文献】

【非特許文献】

【0004】

【非特許文献1】Redshift、“建設現場でARを活用することで壁の向こう側を透視”、［online］、2017年6月14日、Mogura VR、［2019年2月7日検索］、インターネット〈URL：https://www.moguravr.com/ar-in-construction-redshift/〉

【発明の概要】

【発明が解決しようとする課題】

【0005】

しかしながら、上述した従来技術では、ユーザは情報確認のために事前に建設現場のモデルを呼び出す必要があるため、建設現場が変わると、ユーザはその建設現場に対応するモデルを都度呼び出さなければならない。また、例えばユーザが街を散策中に、まだ知らない物体（例えば店舗やホテル、宅配便の配達員等）の中や現在の状態等の詳細な情報を、その物体の外にいながら知りたいというニーズがある。

【0006】

そこで、本開示は、ユーザの目の前にある物体について、その場にいながらユーザに物体内部等の詳細情報を容易に確認させることが可能なプログラム、情報処理方法、及び情報処理端末を提供することを目的とする。

【課題を解決するための手段】

【0007】

本開示の一態様に係るプログラムは、情報処理端末に、撮像部により撮像された画像、及び前記情報処理端末の位置を示す位置情報を取得することと、前記画像及び前記位置情報を情報処理装置に送信することと、前記情報処理装置から、前記画像及び前記位置情報を用いて特定された物体の三次元モデルのデータを受信することと、加速度センサ及び磁気センサにより測定されたセンサ情報に基づいて、前記情報処理端末を利用するユーザの視線方向を推定することと、前記視線方向を用いて前記三次元モデルの表示データを特定することと、前記表示データを出力することと、を実行させる。

【発明の効果】

【0008】

本開示によれば、ユーザの目の前にある物体について、その場にいながらユーザに物体内部等の詳細情報を容易に確認させることが可能である。

【図面の簡単な説明】

【0009】

【図1】第１実施形態に係るシステム概要を説明するための図である。

【図2】第１実施形態に係る通信システム１を示す図である。

【図3】第１実施形態に係るサーバ１１０のハードウェア構成の一例を示す図である。

【図4】第１実施形態に係る情報処理端末１３０のハードウェア構成の一例を示す図である。

【図5】第１実施形態に係るウェアラブル端末１３０Ａの外観の一例を示す図である。

【図6】第１実施形態に係るサーバ１１０の各機能の一例を示す図である。

【図7】第１実施形態に係る情報処理端末１３０の各機能の一例を示す図である。

【図8】第１実施形態に係る透視機能及び表示倍率変更機能の一例を説明するための図である。

【図9】第１実施形態に係るパノラマ機能の一例を説明するための図である。

【図10】第１実施形態に係る文字表示機能の一例を説明するための図である。

【図11】第１実施形態に係る支配情報確認機能の一例を説明するための図である。

【図12】第１実施形態に係る通信システム１による処理の一例を示すシーケンス図である。

【図13】第２実施形態に係るシステム概要を説明するための図である。

【図14】第２実施形態に係るサーバ１１０のハードウェア構成の一例を示す図である。

【図15】第２実施形態に係る通信システム１による処理の一例を示すシーケンス図である。

【図16】第３実施形態に係るシステム概要を説明するための図である。

【図17】第３実施形態に係る通信システム１による処理の一例を示すシーケンス図である。

【発明を実施するための形態】

【0010】

添付図面を参照して、本開示の実施形態について説明する。なお、各図において、同一の符号を付したものは、同一又は同様の構成を有する。

【0011】

［第１実施形態］
＜システム概要＞
図１は、第１実施形態に係る通信システムの概要を説明するための図である。図１に示す例では、物体の一例として店舗を用い、情報処理端末１３０の一例として撮像部や出力部を有するメガネを用いる。情報処理端末１３０を装着したユーザＵが街を散策中に、まだ行ったことがない店舗であるＡＡショップを発見したとする。このとき、ユーザＵは、例えばＡＡショップを見ながら簡易な操作（例えば所定のジェスチャ）をすることで、情報処理端末１３０が位置情報とＡＡショップの画像とをサーバに送信する。

【0012】

次に、サーバは、位置情報と物体の画像とに基づいて、物体の内部を示す三次元モデルを取得し、情報処理端末１３０に三次元モデルのデータを送信する。情報処理端末１３０は、取得した三次元モデルの少なくとも一部の表示データＤ１０を、実空間に重畳して表示する。実空間に重畳して表示することは、眼鏡などのレンズ越しに３Ｄモデルの表示データを表示して実空間に重畳することや、撮像部から撮像される映像を実空間として表示画面を介してユーザに視認させつつ、さらにその映像に３Ｄモデルの表示データを含めることなどを含む。

【0013】

図１に示す例では、情報処理端末１３０がプロジェクタタイプを使用してユーザの前方の空間上に表示データＤ１０を出力することを示したが、これに限られず、情報処理端末１３０のレンズに表示データＤ１０を表示してもよいし、網膜に表示データＤ１０を表示してもよい。また、情報処理端末１３０は、メガネ型や、ヘッドマウントディスプレイ型や、スマートフォンなどの情報処理端末でもよい。

【0014】

これにより、ユーザは、内部が未知の物体の前に来ると、その物体の内部を示す表示データが実空間に重畳して表示されるため、物体内部を容易に確認すること、いわゆる透視機能を容易に実行することが可能になる。

【0015】

図２は、第１実施形態に係る通信システム１を示す図である。図１に示す例に関する処理を実行可能な通信システム１は、サーバ（情報処理装置）１１０、ウェアラブル端末１３０Ａ及び端末１３０Ｂを備える。サーバ１１０、ウェアラブル端末１３０Ａ及び端末１３０Ｂは、インターネットや無線ＬＡＮ、Bluetooth（登録商標）、有線通信等の通信ネットワークＮを介して互いに通信可能に接続される。なお、通信システム１が備えるサーバ１１０、ウェアラブル端末１３０及び端末１２０の数は一つに限られず、複数備えてもよい。また、サーバ１１０は、１つの機器から構成されてもよいし、複数の機器から構成されてもよいし、クラウド上で実現されるサーバであってもよい。

【0016】

ウェアラブル端末１３０Ａは、ユーザが装着する電子デバイスである。ウェアラブル端末１３０Ａは、例えば、拡張現実（ＡＲ: Augmented Reality）技術を利用可能なメガネ型端末（スマートグラス）、コンタクトレンズ型端末（スマートコンタクトレンズ）、ヘッドマウントディスプレイ、又は義眼等であってもよい。なお、ウェアラブル端末はＡＲ技術を用いるものに限定されず、調整現実（Mediated Reality）や、複合現実（Mixed Reality）、人工現実（Virtual Reality）、減損現実（Diminished Reality）等の技術を用いるものでもよい。

【0017】

端末１３０Ｂは、例えば、撮影部と出力部とを有するスマートフォン、タブレット端末、携帯電話機、パーソナルコンピュータ（ＰＣ）、携帯情報端末（ＰＤＡ:Personal Digital Assistant）、家庭用ゲーム機器等であってもよい。以下、ウェアラブル端末１３０Ａと端末１３０Ｂとを区別しない場合は、まとめて情報処理端末１３０と称する。また、本実施形態においては、情報処理端末１３０の一例として、ウェアラブル端末１３０Ａのメガネ型端末（スマートグラス）を用いて説明する。

【0018】

＜ハードウェア構成＞
通信システム１の各装置のハードウェアについて説明する。図３を用いて、位置情報と物体の画像とを用いて３Ｄモデルを特定するサーバ（情報処理装置）１１０のハードウェアを説明し、図４を用いて、サーバ１１０から取得した３Ｄモデルを出力する情報処理端末１３０のハードウェアを説明する。

【0019】

（サーバ１１０のハードウェア）
図３は、第１実施形態に係るサーバ１１０のハードウェア構成の一例を示す図である。サーバ１１０は、ＣＰＵ（Central Processing Unit）１１２、通信ＩＦ（Interface）１１４及び記憶装置１１６を有する。これらの各構成は、相互にデータ送受信可能に接続される。

【0020】

ＣＰＵ１１２は、記憶装置１１６に記憶されたプログラムの実行に関する制御やデータの演算、加工を行う制御部である。ＣＰＵ１１２は、通信ＩＦ１１４からデータを受け取り、データの演算結果を出力デバイスに出力したり、記憶装置１１６に記憶したりしてもよい。

【0021】

通信ＩＦ１１４は、サーバ１１０を通信ネットワークＮに接続するデバイスである。通信ＩＦ１１４は、サーバ１１０の外部に設けられてもよい。その場合、通信ＩＦ１１４は、例えばＵＳＢ(Universal Serial Bus)等のインタフェースを介してサーバ１１０に接続される。

【0022】

記憶装置１１６は、各種情報を記憶するデバイスである。記憶装置１１６は、データの書き換えが可能な揮発性の記憶媒体やデータの読み出しのみが可能な不揮発性の記憶媒体であってもよい。

【0023】

記憶装置１１６は、例えば、物体の外観、及び／又は内部を示す三次元モデル（３Ｄモデル）のデータや、物体に関する情報を示す物体情報を記憶する。３Ｄモデルは、例えば、所定のユーザが提供する内部の画像情報などに基づき生成される。所定のユーザは、店舗側のユーザでもよいし、店舗の利用者でもよいし、システム提供者であってもよい。また、３Ｄモデルは、システム提供者や、システム提供者により依頼されたベンダーなどが生成してもよい。さらに３Ｄモデルは、リアルタイムに生成されてもよい。また、３Ｄモデルは、後述するマッチング処理用に、内部だけではなく外観の画像データを保持しておいてもよい。

【0024】

物体情報は、例えば、物体の名称や物体内部に関する情報を含む。物体が店舗である場合、物体情報は、店舗名、販売商品、商品の金額などを含む。また、物体が宿泊施設である場合、物体情報は、宿泊施設名、宿泊施設のタイプ（旅館、ビジネスホテルなど）、各部屋の概要、各部屋の設備などを含む。また、物体が装置等である場合、物体情報は、この装置名、装置の内部の部品名などを含む。物体が人である場合、物体情報は、この人によって事前に登録された感情や洋服などを含む。また、物体情報は、後述する表示倍率と連動するため、上位層から下位層への階層構造を用いて保持されるようにしてもよい。

【0025】

また、記憶装置１１６は、後述する外部システムから、物体の各位置に関する支配情報を取得する場合に、この支配情報を記憶してもよい。支配情報は、例えば、ホテルの各部屋の空室情報や、飲食店の各席の空席情報である。

【0026】

（情報処理端末１３０のハードウェア）
図４は、第１実施形態に係る情報処理端末１３０のハードウェア構成の一例を示す図である。情報処理端末１３０は、ＣＰＵ２０２、記憶装置２０４、通信ＩＦ２０６、出力デバイス２０８、撮像部２１０、及びセンサ２１２を有する。これらの各構成は、相互にデータ送受信可能に接続される。図４に示すＣＰＵ２０２、記憶装置２０４及び通信ＩＦ２０６は、図３に示すサーバ１１０が備えるＣＰＵ１１２、記憶装置１１６及び通信ＩＦ１１４と同様の構成を有するため説明を省略する。なお、情報処理端末１３０の記憶装置２０４は、サーバ１１０から３Ｄモデルデータや物体情報が取得された場合に、これらの情報を記憶する。

【0027】

出力デバイス２０８は、情報を出力するためのデバイスである。例えば、出力デバイス２０８は、液晶ディスプレイ、有機ＥＬ(Electronic Luminescent)ディスプレイ、スピーカ及び物体表面や空間、網膜上に情報を投影するプロジェクタ等であってもよい。

【0028】

撮像部２１０は、画像（静止画像及び動画像を含む）を撮像するためのデバイスである。例えば、撮像部２１０は、ＣＣＤイメージセンサ、ＣＭＯＳイメージセンサ、レンズ等の撮像素子を含んでいてもよい。撮像部２１０は、スマートグラスタイプのウェアラブル端末１３０Ａであれば、ユーザの視線方向を撮像するような位置に設けられる（例えば図５参照）。

【0029】

センサ２１２は、加速度センサ、及び磁気センサを少なくとも含むセンサであり、角速度センサをさらに含んでもよい。センサ２１２は、例えばセンサ情報として方位情報などを取得することが可能である。方位情報は、加速度センサからのデータを用いて磁気センサの傾き補正を行うことで、適切な方位情報が取得可能である。

【0030】

なお、情報処理端末１３０は、端末の種類に応じて、入力デバイスなどが備えられてもよい。例えば、情報処理端末１３０がスマートフォンなどの場合は、情報処理端末１３０は、入力デバイスを有する。入力デバイスは、ユーザから情報の入力を受け付けるためのデバイスである。入力デバイスは、例えばタッチパネル、ボタン、キーボード、マウス及びマイク等であってもよい。

【0031】

＜ウェアラブル端末１３０Ａの外観＞
図５は、第１実施形態に係るウェアラブル端末１３０Ａの外観の一例を示す図である。ウェアラブル端末１３０Ａは、撮像部２１０、ディスプレイ１３６、フレーム１３７、ヒンジ部１３８及びテンプル１３９を備える。

【0032】

上述したように、撮像部２１０は、画像を撮像するためのデバイスである。撮像部２１０は、図示しないＣＣＤイメージセンサ、ＣＭＯＳイメージセンサ、レンズ等の撮像素子等を含んでいてもよい。撮像部２１０は、ユーザの視線方向が撮像できる位置に設けられるとよい。

【0033】

ディスプレイ１３６は、後述する出力部４１０の制御に基づいて、商品情報等の各種情報を表示する出力デバイス２１０である。ディスプレイ１３６は、ウェアラブル端末１３０Ａを装着したユーザが実空間の景観を視認可能なように可視光を透過させる部材で形成されていてもよい。例えば、ディスプレイ１３６は、透明基板を用いた液晶ディスプレイや有機ＥＬディスプレイであってもよい。

【0034】

フレーム１３７は、ディスプレイ１３６の外周を囲むように設けられ、ディスプレイ１３６を衝撃等から保護する。フレーム１３７は、ディスプレイ１３６の外周全域にわたって設けられていてもよいし、一部に設けられていてもよい。フレーム１３７は、例えば、金属や樹脂等で形成されていてもよい。

【0035】

ヒンジ部１３８は、テンプル１３９をフレーム１３７に対して回動可能に接続する。テンプル１３９は、フレーム１３７の両端から延在する蔓であり、例えば、金属や樹脂等で形成されていてもよい。ウェアラブル端末１３０Ａは、フレーム１３７から離間するように開かれたテンプル１３９がユーザのこめかみ付近に位置するように装着される。

【0036】

テンプル１３９は、一部が窪んだ係止部１３９ａを有している。係止部１３９ａは、ウェアラブル端末１３０Ａが装着された状態でユーザの耳に係るように位置し、ウェアラブル端末１３０Ａがユーザの頭部から脱落することを防止する。

【0037】

＜機能構成＞
次に、通信システム１の各装置の機能について説明する。図６を用いて、位置情報と物体の画像とを用いて３Ｄモデルを特定するサーバ１１０の各機能を説明し、図７を用いて、サーバ１１０から取得した３Ｄモデルを出力する情報処理端末１３０の各機能を説明する。

【0038】

（サーバの機能構成）
図６は、第１実施形態に係るサーバ１１０の各機能の一例を示す図である。図６に示す例では、サーバ１１０は、送信部３０２、受信部３０４、特定部３０６、及び更新部３０８を備える。送信部３０２、受信部３０４、特定部３０６、及び更新部３０８は、サーバ１１０のＣＰＵ１１２が、記憶装置１１６に記憶されたプログラムを実行することにより実現することができる。

【0039】

送信部３０２は、通信ネットワークＮを介して情報処理端末１３０に所定の情報を送信する。所定の情報は、例えば、物体の３Ｄモデルのデータや物体情報などである。

【0040】

受信部３０４は、通信ネットワークＮを介して情報処理端末１３０から所定の情報を受信する。所定の情報は、例えば、情報処理端末１３０の位置情報、及び物体が撮像された画像などである。

【0041】

特定部３０６は、記憶装置１１６に記憶される複数の物体の三次元モデル（３Ｄモデル）のデータの中から、物体が撮像された画像及び位置情報を用いて一つの３Ｄモデルのデータを特定する。３Ｄモデルは、例えば、物体の３Ｄモデルであり、物体の外観から内部までを三次元でモデル化し、実空間で物体が存在する位置を示す位置情報（例えば、経度及び緯度の情報）に関連付けられている。また、位置情報と３Ｄモデルは、１対Ｎ（複数）で関連付けられてもよいし、１対１で関連付けられてもよい。

【0042】

また、３Ｄモデルは、物体の３Ｄモデルだけではなく、道路や街並みを含めた実空間に近い形で生成されてもよい。この場合、位置情報は、３Ｄモデルの特徴部分（物体や道路や建物など）に関連付けられる。

【0043】

例えば、特定部３０６は、情報処理端末１３０が送信した位置情報から所定範囲内にある物体を特定し、さらに、情報処理端末１３０から取得した物体の画像と、特定された物体に対応する３Ｄモデルの外観の画像とのマッチング処理により、一つの３Ｄモデルを特定する。

【0044】

これにより、簡便な処理で、つまり、位置情報で物体を絞り込み、絞り込まれた物体の画像を用いてマッチング処理を行うことで、ユーザの目の前にある物体に対応する３Ｄモデルを特定することができる。この場合、位置情報を用いて容易に物体に絞り込みができ、さらに限られた数の画像を用いてのマッチング処理が行われるため、サーバ１１０の処理に負荷をかけずに済む。

【0045】

また、特定部３０６は、３Ｄモデルが地球全体を示す３Ｄモデルの場合、情報処理端末１３０から取得した位置情報と、方位情報とを取得し、位置情報と方位情報とに基づいて、全体の３Ｄモデルの空間内で物体を特定し、この物体に対応する３Ｄモデルを特定する。なお、この場合でも、詳細な位置情報を用いれば一つの３Ｄモデルを特定することができるが、物体認識の精度を上げるために、画像のマッチング処理が実行されてもよい。

【0046】

また、特定部３０６は、特定された物体に対応する物体情報を特定してもよい。物体情報は、物体名や物体の内部に関する内部情報を含む。物体名は、例えば店舗名、施設名、装置名、設備名などを含み、内部情報は、例えば、店舗の業態、販売商品のカテゴリ、販売商品名、値段、措置内部の部品名、宿泊施設の部屋タイプなどを含む。

【0047】

更新部３０８は、３Ｄモデルを所定のタイミングで更新し、実際の物体や物体内部と、３Ｄモデルとに違いがなるべく生じないようにする。例えば、更新部３０８は、物体が店舗であって、この店舗内に１又は複数の撮像装置（例えば監視カメラ）がある場合、所定のタイミングで各撮像装置により撮像された画像を画像解析する。さらに、更新部３０８は、現在の画像と過去の画像との誤差を算出し、誤差が所定値以上であれば、画像解析を行ってもよい。

【0048】

更新部３０８は、画像解析をして特定された店舗内の商品位置情報や商品情報を、この物体の３Ｄモデルに対応付けて更新する。これにより、実空間の物体の変化に応じて、仮想空間の３Ｄモデルを変更することが可能になる。更新部３０８は、複数の物体内画像から３Ｄモデルを生成してもよい。

【0049】

また、サーバ１１０は、店舗やホテルの予約システムと連携してもよい。例えば、予約システムは、飲食店などの店舗やホテルなどの物体の内部の各位置（例えば席や部屋）に対応する支配情報を管理する。このとき、更新部３０８は、店舗の席やホテルの部屋の空き状況（支配情報）を３Ｄモデルの内部の各位置に対応付けることができ、送信部３０２は、３Ｄモデルのデータや物体情報とともに、この物体の支配情報を情報処理装置２００に送信可能になる。

【0050】

これにより、物体内部の支配情報を出力することが可能になり、例えばユーザが店舗に入らなくても、そのユーザに対し、店舗の席の空席状況やホテルの部屋の予約状況を知らせることができる。

【0051】

（情報処理端末の機能構成）
図７は、第１実施形態に係る情報処理端末１３０の各機能の一例を示す図である。図７に示す例では、情報処理端末１３０は、送信部４０２、受信部４０４、取得部４０６、推定部４０８、特定部４１０、出力部４１２、及び受付部４１４を備える。送信部４０２、受信部４０４、取得部４０６、推定部４０８、特定部４１０、出力部４１２、及び受付部４１４は、情報処理端末１３０のＣＰＵ２０２が、記憶装置２０４に記憶されたプログラムを実行することにより実現することができる。このプログラムは、サーバ１１０からダウンロードされて情報処理端末１３０にインストール可能なプログラム（アプリケーション）であってもよい。

【0052】

送信部４０２は、通信ネットワークＮを介してサーバ１１０に所定の情報を送信する。所定の情報は、例えば、情報処理端末１３０の位置情報、及び物体が撮像された画像などである。

【0053】

受信部４０４は、通信ネットワークＮを介してサーバ１１０から所定の情報を受信する。所定の情報は、例えば、少なくとも物体の３Ｄモデルのデータを含み、物体情報や支配情報などを含んでもよい。

【0054】

取得部４０６は、撮像部２１０により撮像された画像、及び情報処理端末１３０の位置を示す位置情報を取得する。取得部４０６は、位置情報について、公知のＧＰＳやＢｅａｃｏｎ、ＶＰＳ（Visual Positioning Service）を用いて情報処理端末１３０の位置情報を取得してもよい。

【0055】

推定部４０８は、位置情報及び磁気センサを含むセンサ２１２により測定されたセンサ情報に基づいて、情報処理端末１３０を利用するユーザの視線方向を推定する。例えば、推定部４０８は、位置情報に基づいて、受信された３Ｄモデル内のユーザの位置を特定し、さらに、加速度センサや磁気センサからのセンサ情報に基づいて、３Ｄモデル内のユーザの位置からの方位方向を視線方向として推定する。また、推定部４０８は、視点位置について、例えば、３Ｄモデルのユーザの位置の地面から所定の高さの位置をユーザの視点位置と推定してもよい。推定部４０８は、所定の高さについて、予め１６５ｃｍなどを設定しておいてもよいし、ユーザの身長を事前に設定しておいてもよい。さらに推定部４０８は、撮像された画像に基づいて視点位置を推定してもよい。

【0056】

特定部４１０は、推定部４０８により推定された視線方向を用いて３Ｄモデル内の表示データを特定する。例えば、特定部４１０は、３Ｄモデル内で、ユーザの位置と、視線方向とを決めることで、３Ｄモデル内の所定領域の表示データを特定することが可能になる。また、特定部４１０は、ユーザの視点位置からの視線方向を決めることで、より適切な表示データを特定することが可能になる。

【0057】

出力部４１２は、特定部４１０により特定された表示データを、出力デバイス２０８を用いて出力する。例えば、出力部４１２は、出力デバイス２０８がレンズのディスプレイである場合、ディスプレイ上に表示データを表示する。また、出力部４１２は、出力デバイス２０８がプロジェクタ等であれば、ユーザの目の前の空間に表示データを表示し、出力デバイス２０８が網膜プロジェクタであれば、ユーザの網膜に表示データが表示されるよう出力する。

【0058】

これにより、ユーザの位置と物体の画像とに基づいて、ユーザから離れた位置にある物体の内部を適切に特定し、表示することで、実空間の見え方と乖離を少なくして内部の情報をユーザに知らせることができる。例えば、ユーザは知らない街を歩いていても、店舗の外にいながら、その店舗の内部を透視することが可能な機能を利用することができる。

【0059】

検知部４１４は、撮像部２１０により撮像される画像や所定のデバイスを用いて、予め設定された第１ジェスチャ（第１操作の一例である）を検知する。所定のデバイスとして、ジェスチャを認識可能な公知のデバイス（例えば、Galaxy NoteのSペン、Ring Zero、Viveコントローラ、グローブ型のデバイス、筋電センサなど）を用いることが可能である。検知部４１４は、このデバイスから受け取る信号に応じてジェスチャを検知してもよい。第１ジェスチャは、例えば、手で丸を作るジェスチャである。

【0060】

送信部４０２は、この第１ジェスチャに応じて、画像及び位置情報をサーバ１１０に送信する。例えば、検知部４１４は、第１ジェスチャが検知されると、取得部４０６により取得される画像及び位置情報をサーバ１１０に送信するよう指示する。第１ジェスチャの検知がトリガになって、上述した透視機能が開始される。

【0061】

これにより、ユーザは、自分の好きなタイミングで第１ジェスチャをすることで、この透視機能を利用することができる。また、第１ジェスチャを手で丸を作ることに設定することで、ユーザは手で丸を作り、店舗内部をのぞき込むようなジェスチャをすることで、この透視機能を利用することができる。

【0062】

また、検知部４１４は、例えば、画像や所定のデバイスを用いて、ユーザの第２ジェスチャを検知してもよい。第２ジェスチャは、例えば、指をさして右回転、又は左回転させることである。

【0063】

出力部４１２は、第２ジェスチャに応じて、表示データの表示倍率又は表示データに対応する視点位置を更新してもよい。例えば、第２ジェスチャが右回転の場合、表示倍率は大きくなり、左回転の場合、表示倍率は小さくなる。

【0064】

この場合、出力部４１２は、検知部４１４から第２ジェスチャを検知したことを通知されると、表示データの表示倍率を、回転の向きに応じて変更する。また、表示倍率の程度は、第２ジェスチャの回数や、動作時間に応じて調整される。例えば、第２ジェスチャの回数が多い、又は動作時間が長いほど、表示倍率は大きくなる。また、表示倍率については、３Ｄモデル内の視点位置（仮想カメラの位置）を物体に近づけたり、遠ざけたりすることでも同様の機能を達成することができる。

【0065】

これにより、ユーザは、第２ジェスチャをすることで、ユーザはその場にいながら、物体内部を遠くから見たり、近くから見たりすることができる。

【0066】

また、出力部４１２は、第２ジェスチャに応じて、物体に関する物体情報の情報量を変更して出力してもよい。例えば、物体が店舗である場合、出力部４１２は、表示データに対応する店舗の店舗情報の情報量を変更して表示してもよい。より具体的には、出力部４１２は、第２ジェスチャに応じて、表示される店舗情報を多く表示したり、少なく表示したりする。

【0067】

これにより、第２ジェスチャの動作内容に応じて、表示データの表示倍率、及び表示される店舗情報の情報量が連動して変更されることを可能にする。

【0068】

また、出力部４１２は、第２ジェスチャに応じて物体に近づく方向に表示データが出力されると、物体情報の情報量を多くして出力してもよく、また、第２ジェスチャに応じて物体が遠ざかる方向に表示データが出力されると、物体の情報量を少なくして出力してもよい。

【0069】

例えば、店舗情報は、店舗名、商品ジャンル名、商品名、商品の金額などの文字情報が上位から下位に階層化して保存されており、表示倍率が大きくなる（物体に近づく）につれて、情報が上位から下位になり、より詳細な情報が表示されるようになる。他方、表示倍率が小さくなる（物体から遠ざかる）につれて、情報が下位から上位になり、より大まかな情報が表示されてもよい。店舗情報のデータの保持の仕方はこれに限られず、情報に優先順位が付与され、表示倍率が高くなるにつれて、優先順が低い店舗情報が表示されるようにしてもよい。最上位又は再下位の情報が表示された場合、それ以上のデータはないため、情報量の変化が停止する。

【0070】

これにより、第２ジェスチャに応じて表示倍率、及び表示される情報量を連動して変化させることができ、拡張現実の表示データが拡大すれば、より詳細な物体情報を表示させ、拡張現実の表示データが縮小すれば、より大まかな物体情報を表示させることができる。

【0071】

また、検知部４１４は、第２ジェスチャに応じて表示データに対応する視点位置が更新された状態で、予め設定された第３ジェスチャを検知してもよい。第３ジェスチャは、例えば手を開くジェスチャである。

【0072】

このとき、出力部４１２は、第３ジェスチャの検知に応じて、物体内部の任意方向を出力可能な表示データに切り替えてもよい。例えば、出力部４１２は、３Ｄモデル空間上のユーザの視点位置（仮想カメラの位置）を基点にすることで、その視点位置から３６０度の表示データを出力可能にする。

【0073】

第２ジェスチャと第３ジェスチャとにより実現される機能の違いについて、第２ジェスチャの場合は、３Ｄモデルの仮想空間上のユーザの位置と、物体の位置との間を視線方向を変えずに視線位置が移動するのに対し、第３ジェスチャの場合は、第３ジェスチャの検知時点の位置にある視点位置から視線方向を３６０度変更できることが異なる。

【0074】

これにより、ユーザは、例えば物体内部の仮想空間上の位置で第３ジェスチャを行うことで、物体内部を３６０度見渡すことができるようになる。ユーザは、実空間では物体の外側にいながら、仮想空間上で物体内部を３６０度見渡すことができるようになる。

【0075】

受信部４０４は、物体の内部の各位置に対応する支配情報を管理する外部システムにより送信された支配情報を、サーバ１１０を介して受信してもよい。例えば、サーバ１１０が、表示対象の物体を特定した際に、外部システムから、対応する物体の支配情報を取得する。一例として、物体がレストランやホテルとすると、支配情報は、席の予約情報や部屋の空室情報である。サーバ１１０は、この各位置に対応する支配情報と、物体の３Ｄモデル上での各位置とを関連付けて、情報処理端末１３０に送信する。

【0076】

この場合、出力部４１２は、受信された支配情報を、３Ｄモデルの物体の内部の各位置に対応付けて出力してもよい。例えば、出力部４１２は、レストランの空席情報を、３Ｄモデルの対応する位置に表示する。また、出力部４１２は、ホテルの空室情報を、３Ｄモデルの対応する部屋の位置に表示する。

【0077】

これにより、ユーザは、物体の外側にいながら、物体内部の支配情報を把握することができる。例えば、物体をレストランやホテルとすると、実際に行ったり電話したりしなくても、部屋の位置を確認しながら、その部屋の空き情報を把握することが可能になる。

【0078】

物体が店舗である場合、３Ｄモデルは、各商品棚に陳列された各商品を含んでもよい。店舗に監視カメラなどの撮像装置がある場合、その撮像装置からの画像、または、他のユーザから送信された画像などから物体認識をすることで、商品を特定することが可能である。この特定された商品は３Ｄモデルに含まれる。また、サーバ１１０の管理者等により、３Ｄモデルに商品棚や商品が設定されてもよい。

【0079】

これにより、ユーザは、物体が店舗である場合に、その店舗で何を販売しているかを外部から視覚的に把握することが可能になり、商品の位置等も店舗に入る前に把握することが可能になる。

【0080】

また、出力部４１２は、撮像部２１０により撮像された画像内の物体の位置を特定し、特定された位置に表示データを出力することを含んでもよい。例えば、出力部４１２は、実際に撮像されている物体の輪郭を、エッジ抽出処理などで特定することで、実空間の物体の輪郭に合わせて、重畳される３Ｄモデルの表示データの輪郭を調整して出力することが可能である。

【0081】

これにより、ユーザに対し、実空間上の物体と、仮想空間上の物体との位置が合うように表示されるため、実際に透視しているような感覚を受けつつ、物体内部を適切に把握させることができる。

【0082】

＜具体例＞
次に、図８〜１１を用いて、実施形態に係る各機能を、３Ｄモデルの表示データの見え方とともに説明する。図８〜１１に示す例では、ウェアラブル端末１３０Ａをスマートグラスとした場合にレンズ越しにユーザが見る景色の例を表している。

【0083】

図８は、第１実施形態に係る透視機能及び表示倍率変更機能の一例を説明するための図である。レンズＤ１２越しの景色には、実空間の店舗の外観と、手で第１ジェスチャＧ１０をしている様子とが含まれる。この第１ジェスチャは、撮像部２１０により撮像される。

【0084】

レンズＤ１４越しの景色には、第１ジェスチャに応じて、仮想空間上の店舗の３Ｄモデルの内部を示す表示データが表示される（透視機能が実行される）。実際には、Ｄ１２に示す実空間の店舗の外観に、Ｄ１４に示す仮想空間の表示データが重畳されるが、以降に示す例においても、実空間の景色を省略して説明する。

【0085】

このとき、Ｄ１４に表示される表示データは、仮想空間上の３ＤモデルＭ１０において、ユーザＵの位置における視点位置Ｖ１０から物体方向（視線方向）の表示データであり、３Ｄモデルの店舗Ｓ１０の表示データである。

【0086】

レンズＤ１６越しの景色には、仮想空間上の表示データと、手で第２ジェスチャＧ１２をしている様子とが含まれる。この第２ジェスチャは、撮像部２１０により撮像される。第２ジェスチャは、例えば、指をさし、指先を右に回すジェスチャである。指先を右に回すジェスチャが拡大を示し、指先を左に回すジェスチャが縮小を示す。この時の仮想空間上の３ＤモデルＭ１２は、３ＤモデルＭ１０と同じである。

【0087】

レンズＤ１８には、第２ジェスチャに応じて、仮想空間上の店舗の３Ｄモデルの内部を示す表示データの表示倍率が変更されて表示される（表示倍率変更機能が実行される）。

【0088】

このとき、仮想空間上の３ＤモデルＭ１４において、仮想空間上ではユーザＵの位置は変わらないが、視点位置Ｖ１０から物体方向（視線方向）に近づく。レンズＤ１８には、変更後の視点位置Ｖ１０から見た物体の表示データであり、３Ｄモデルの店舗Ｓ１０の表示データが表示される。

【0089】

図９は、第１実施形態に係るパノラマ機能の一例を説明するための図である。図９に示す例において、レンズＤ２０越しの景色には、仮想空間上の表示データと、手で第３ジェスチャＧ１４をしている様子とが含まれる。この第３ジェスチャは、撮像部２１０により撮像される。第３ジェスチャは、例えば、手を開くジェスチャである。この時の仮想空間上の３ＤモデルＭ２０は、図８に示す３ＤモデルＭ１４と同じである。

【0090】

レンズＤ２２には、第３ジェスチャに応じて、仮想空間上の店舗の３Ｄモデルの視点位置から、３６０度のパノラマの表示データが表示可能になる（パノラマ機能が利用可能になる）。例えば、ユーザは、実空間で右を向くことで、３Ｄモデルの視点位置Ｖ１０から、実空間と同じだけ右を向いた場合の仮想空間上の表示データが表示される。

【0091】

このとき、仮想空間上の３ＤモデルＭ２２において、仮想空間上ではユーザＵの位置が視点位置Ｖ１０に移動することで、この仮想位置Ｖ１０から３６０度の任意の方向の表示データが表示可能になる。

【0092】

図１０は、第１実施形態に係る文字表示機能の一例を説明するための図である。図１０に示す例において、レンズＤ３０越しの景色には、仮想空間上の表示データと、その物体に関する物体情報Ｉ３０とが含まれる。物体情報は、例えば、第１ジェスチャに応じて、表示データとともに表示されてもよいし、別のジェスチャが割り当てられ、この別のジェスチャが検知された場合に、物体情報が表示されるようにしてもよい。

【0093】

図１０に示す例において、物体情報Ｉ３０には、例えば店舗名「ＡＢＣショップ」、販売商品のカテゴリ「雑貨」が含まれる。図１０に示す例はあくまでも一例であって、この例に限られない。

【0094】

レンズＤ３２越しの景色には、レンズＤ３０越しの景色にさらに、ユーザの手が第２ジェスチャをしている様子が含まれる。この第２ジェスチャの検知に応じて、出力部４１２は、レンズＤ３４越しの景色が表示されるように制御する。

【0095】

レンズＤ３４越しの景色には、表示倍率が大きくなった表示データと、より詳細な物体情報Ｉ３２とが含まれる。物体情報Ｉ３２には、店舗名「ＡＢＣショップ」と、販売商品とが含まれる。販売商品には、より詳細化されており、コスメ、文房具、お菓子などが含まれる。よって、１つのジェスチャに対し、表示倍率と表示される情報量の調整が設定されており、ユーザへの利便性を向上させた機能を提供することが可能である。

【0096】

図１１は、第１実施形態に係る支配情報確認機能の一例を説明するための図である。図１１に示す例において、レンズＤ４０越しの景色には、実空間の景色（ホテルを含む景色）と、第１ジェスチャをしている様子とを含む。出力部４１２は、第１ジェスチャに応じて、３Ｄモデルの表示データと、物体内部の各位置の支配情報（ホテルの各部屋の空き情報）とを出力する。

【0097】

レンズＤ４２越しの景色には、実空間に仮想上の支配情報が表示される例を示すが、さらに、物体内部の表示データが出力されてもよい。図１１に示す例では、ユーザは、実際にどの部屋が空いているかを実空間上に重畳された支配情報で把握することができる。

【0098】

さらに、部屋を指定するジェスチャ、及び予約するジェスチャが予め設定されており、ユーザの氏名、住所、電話番号などのユーザ情報が予め設定されていれば、レンズＤ４２越しの景色から、部屋を選択し、選択された部屋を予約するジェスチャをすることで、設定されたユーザ情報を、ホテルの部屋を管理する外部システムに送信することが可能になり、空き情報の確認から予約までをシームレスに実行することが可能になる。

【0099】

＜動作＞
図１２は、第１実施形態に係る通信システム１による処理の一例を示すシーケンス図である。図１２を用いて各ジェスチャに応じた情報処理端末１３０の各機能に係る処理を説明する。

【0100】

ステップＳ１０２で、ユーザは第１ジェスチャを行う。情報処理端末１３０の撮像部２１０は、この第１ジェスチャを撮像する。第１ジェスチャは、検知部４１４により検知される。

【0101】

ステップＳ１０４で、情報処理端末１３０の取得部４０６は、この情報処理端末１３０の位置情報を取得する。位置情報は、ＧＰＳ機能やＢｅａｃｏｎなどを用いて取得されればよい。

【0102】

ステップＳ１０６で、情報処理端末１３０の取得部４０６は、加速度センサ及び磁気センサを含むセンサ２１２を用いて、方位情報を取得する。磁気センサの傾きを加速度センサの情報を用いて傾き補正することで、適切な方位情報を取得することが可能になる。

【0103】

ステップＳ１０８で、情報処理端末１３０の送信部４０２は、方位情報及び位置情報とともに、撮像部２１０により撮像された画像をサーバ１１０に送信する。

【0104】

ステップＳ１１０で、サーバ１１０の特定部３０６は、受信された方位情報と位置情報と画像に基づいて、物体の３Ｄデータを取得する。例えば、特定部３０６は、位置情報及び方位情報により１又は複数の物体に絞り込み、画像のパターンマッチングを用いて一つの物体を特定する。

【0105】

ステップＳ１１２で、サーバ１１０の特定部３０６は、特定された物体に対応する物体情報を取得する。

【0106】

ステップＳ１１４で、サーバ１１０の送信部３０２は、物体の３Ｄモデルのデータと物体情報とを、情報処理端末１３０に送信する。

【0107】

ステップＳ１１６で、情報処理端末１３０の推定部４０８は、情報処理端末１３０の位置情報と方位情報とに基づいて、仮想空間内の視点位置と視線方向を推定し、特定部４１０は、推定された視点位置及び視線方向から３Ｄモデルにおいて表示される表示データを特定し、出力部４１２は、特定された表示データを、実空間に重畳して出力する（透視機能の実行）。出力の仕方は、上述したとおり様々なやり方がある。

【0108】

ステップＳ１１８で、ユーザは、第２ジェスチャを行う。情報処理端末１３０の撮像部２１０は、この第２ジェスチャを撮像する。第２ジェスチャは、検知部４１４により検知される。

【0109】

ステップＳ１２０で、情報処理端末１３０の出力部４１２は、第２ジェスチャに応じて表示倍率を変更した表示データを出力する（表示倍率変更機能の実行）。

【0110】

ステップＳ１２２で、ユーザは、第３ジェスチャを行う。情報処理端末１３０の撮像部２１０は、この第３ジェスチャを撮像する。第３ジェスチャは、検知部４１４により検知される。

【0111】

ステップＳ１２４で、情報処理端末１３０の出力部４１２は、第３ジェスチャに応じて、仮想空間の視点位置から３６０度表示可能にし、その後、ユーザの向きに応じてその向きの表示データを出力する（パノラマの機能の実行）。

【0112】

なお、ステップＳ１１０において、方位情報は、上述したとおり、３Ｄモデルの特定には必ずしも必要なデータではないため、ステップＳ１０８において、方位情報が送信されなくてもよい。また、表示倍率変更機能やパノラマ機能は、本実施形態において任意の機能である。

【0113】

［第２実施形態］
図１３乃至図１５を参照して、第２実施形態に係る通信システムの構成について、第１実施形態との差異点を中心に説明する。図１３は、第２実施形態に係るシステム概要を説明するための図である。本実施形態では、情報処理端末１３０を装着したユーザＵは、他の人物ＢＢを見ながらジェスチャ等の簡易な操作をすることで、情報処理端末１３０Ａが位置情報と人物ＢＢの画像とをサーバ１１０に送信する。

【0114】

サーバ１１０は、位置情報と人物ＢＢの画像とに基づいて、人物ＢＢのユーザ情報を特定する。さらにサーバ１１０は、ユーザＵのユーザ情報と、特定した人物ＢＢのユーザ情報とに基づいて、人物ＢＢに重畳させる服飾品の三次元モデルを取得し、情報処理端末１３０に三次元モデルのデータを送信する。その後の処理は第１実施形態と同様である。

【0115】

次に、図１４は、第２実施形態に係るサーバ１１０のハードウェア構成の一例を示す図である。本実施形態にかかるサーバ１１０の記憶装置１１６は、第１実施形態における物体情報に代えてユーザ情報を記憶している。ユーザ情報は、ユーザの識別子や、属性（年齢、性別、居住地、所属コミュニティ）、お気に入りの商品等の情報を含む。ユーザ情報は、ユーザＵや人物ＢＢが自身の端末を操作して登録することができる。
その他のサーバ１１０のハードウェア構成は第１実施形態と同様である。

【0116】

次に、本実施形態に係るサーバ１１０の機能構成について説明する。本実施形態では、特定部３０６は、記憶装置１１６に記憶される複数の服飾品（例えば服、帽子、アクセサリー、靴等）の三次元モデル（３Ｄモデル）のデータの中から、物体（人物）が撮像された画像と、位置情報と、ユーザ情報とを用いて一つの３Ｄモデルのデータを特定する。なお、服飾品の三次元モデルはアニメーションやボーンの有無、リギングやスキニング済みかは問わない。

【0117】

例えば、特定部３０６は、ウェアラブル端末１３０Ａを装着したユーザＵと物体（人物ＢＢ）との関係（ユーザ情報に同じコミュニティ所属することが登録されているか、性別や年齢が同じか等）に基づいて、選択する３Ｄモデルを変更してもよい。より具体的には、例えば特定部３０６は、人物ＢＢが学生で、ユーザＵが、人物ＢＢが応募した企業の面接官である場合には、スーツの３Ｄモデルを選択し、ユーザＵが人物ＢＢと同じ学校の学生である場合には、カジュアルなファッションの３Ｄモデルを選択してもよい。さらに例えば、特定部３０６は、ユーザＵの位置情報が当該ユーザＵの居住地であり、物体（人物ＢＢ）のユーザ情報に、ユーザＵに荷物を届ける配達員であることが属性情報として記録されている場合には、配送会社の制服の３Ｄモデルを選択し、配達員であることが記録されていない場合には、３Ｄモデルを選択しなくてもよい。

【0118】

このように、特定部３０６が、ユーザ情報に応じて選択する３Ｄモデルを変更することで、ウェラブル端末１３０ＡのユーザＵは、物体（人物ＢＢ）の属性や自分との関係性を、視認することができる。
その他のサーバ１１０の機能構成は第１実施形態と同様である。

【0119】

次に、本実施形態に係る情報処理端末１３０の機能構成について説明する。本実施形態に係る特定部４１０は、撮像部２１０により撮像された画像から物体（人物）の身体をリアルタイムにトラッキングし、３Ｄモデルの表示位置を特定することができる。具体的には、特定部４１０は、撮像部２１０に撮像された画像から、既存の人体姿勢推定技術を用いて、鼻、目、耳、首、肩、肘、手首、腰、膝、足首など人体の特徴点を検出する。なお、情報処理端末１３０に赤外線深度センサがある場合には、赤外線の奥行きを計算することで特徴点を検出してもよい。また、人体姿勢推定で検出した人体の特徴点の記憶方法は、二次元でも三次元でもよい。

【0120】

サーバ１１０から取得した３Ｄモデルに人体に関するボーンが対応付けられている場合には、当該ボーンと人体から検出した特徴点（肩や肘など）の位置とを紐付けて、３Ｄモデルの表示位置を特定する。他方、サーバ１１０から取得した３Ｄモデルに人体に関するボーンが対応づけられていない場合には、人物ＢＢがあらかじめ設定した位置が３Ｄモデルの表示位置として特定される。この場合には、記憶装置１１６に記憶されるユーザ情報に表示位置に関する情報が紐付けられており、当該紐付けられた表示位置に関する情報をサーバ１１０から取得することが好ましい。

【0121】

なお、例えば服の３Ｄモデルを人物ＢＢ上に表示して正面からユーザＵが見る場合、ユーザＵからは服の背中の裏地部分は見えるべきではない。このため、特定部４１０は、撮像部２１０に撮像された画像から、セマンティック・セグメンテーション等の技術を用いて人体の表面を取得し、オクルージョン・カリング等の技術を用いて背中の裏地部分を表示しないことが好ましい。
その他の情報処理端末１３０の機能構成は第１実施形態と同様である。

【0122】

図１５は、第２実施形態に係る通信システム１による処理の一例を示すシーケンス図である。図１５を用いて第１実施形態との処理フローの差異点を説明する。

【0123】

ステップＳ１０８で、情報処理端末１３０の送信部４０２が、方位情報及び位置情報とともに、撮像部２１０により撮像された画像をサーバ１１０に送信すると、ステップＳ２１０で、サーバ１１０の特定部３０６は、受信された位置情報と画像とに基づいて、物体（人物）のユーザ情報を絞り込む。

【0124】

ステップＳ２１２で、特定部３０６は、位置情報と画像と絞り込んだユーザ情報とに基づいて物体（人物）に対応する３Ｄモデルを取得する。

【0125】

ステップＳ２１４で、サーバ１１０の送信部３０２は、物体（人物）に対応する３Ｄモデルのデータとユーザ情報とを、情報処理端末１３０に送信する。

【0126】

ステップＳ２１６で、情報処理端末１３０の特定部４１０は、撮影した画像から物体（人物）の身体をリアルタイムにトラッキングし、３Ｄモデルの表示位置を特定する。そして、ステップＳ２１７で、特定部４１０は、特定した表示位置（人物の身体の上）に、３Ｄモデルのデータとユーザ情報とを表示させる。
その他の通信システム１の処理フローは第１実施形態と同様である。

【0127】

［第３実施形態］
図１６乃至図１７を参照して、第３実施形態に係る通信システムの構成について、第１実施形態との差異点を中心に説明する。図１６は、第３実施形態に係るシステム概要を説明するための図である。本実施形態では、情報処理端末１３０を装着したユーザＵは、或る景色を見ながらジェスチャ等の簡易な操作をすることで、情報処理端末１３０Ａが位置情報と景色の画像とをサーバ１１０に送信する。図１６に示す例では、ＡＡＡ、ＢＢＢ、ＣＣＣ、ＤＤＤという４つの看板が壁に設置されており、ユーザＵが情報処理端末１３０を用いて、これらの看板を見るとする。このとき、ユーザＵは、その景色から消去したい物体（例えば看板ＣＣＣ）を指定する。サーバ１１０は、消去対象の物体を受け付けると、その消去対象の物体の背後に位置する３Ｄモデルの位置を特定し、その位置の３Ｄモデルの表示データＤ１００（例えば、看板ＣＣＣの背後にある壁）を情報処理端末１３０に送信する。

【0128】

情報処理端末１３０は、サーバ１１０から消去対象の物体の表示データＤ１００を取得すると、画像から消去対象の物体を消去し、その物体の位置に表示データＤ１００を表示するよう制御する。なお、消去対象の物体は、ユーザによりその都度指定されてもよいし、事前に消去対象の物体のカテゴリや画像上の特徴などサーバ１１０に記憶させておき、物体検出などにより特定されてもよい。なお、情報処理端末１３０は、消去対象の物体を画像から消去しなくても、表示データをＤ１００を重畳すればよい。

【0129】

これにより、ユーザにとって不要な情報や、他人が情報処理端末１３０を利用する場合に、その他人に見て欲しくない物体などの情報を消去することが可能になり、情報処理端末１３０を利用する視聴者側に情報の選別を行うことが可能になる。例えば、数多くの情報の中から、そのユーザにとって不要な情報を消去したり、子供が使用する場合に、子供の教育上ふさわしくない情報を消去したりすることができる。なお、不要な情報や教育上ふさわしくない情報を見せなくする方法として、該当する情報に例えば別の情報を重畳して隠す方法等も考えられる。しかし、別の情報を重畳して隠した場合、ユーザはなにかが隠されていることに気づいてしまう。この場合、ユーザは情報処理端末１３０を外して隠された情報を確認しようと考える場合がある。本実施形態のように不要な情報や教育上ふさわしくない情報に背景を重畳して消去することで、ユーザに情報が隠されたことさえ気づかせないことができる。

【0130】

第３実施形態において、サーバ１１０及び情報処理端末１３０のハードウェア構成は、第１実施形態に示すハードウェア構成と同様であるため、説明を省略する。次に、サーバ１１０の機能構成について説明する。第３実施形態に係るサーバ１１０の機能構成は、図６に示すサーバ１１０の機能構成と同様であるが、差異点を主に説明する。

【0131】

受信部３０４は、情報処理端末１３０から消去対象の物体情報（以下、「消去物体情報」とも称す。）を受信する。この消去物体情報が受信されると、特定部３０６は、この消去物体情報の位置の背景にある、３Ｄモデルの位置を特定する。なお、３Ｄモデル自体は、第１実施形態において説明したように、受信された画像や位置情報を用いて特定されればよい。送信部３０２は、特定された３Ｄモデルの位置に対応する表示データを、情報処理端末１３０に送信する。なお、第１実施形態と同様に、送信部３０２は、３Ｄモデルデータと、特定された３Ｄモデル内の位置情報とを情報処理端末１３０に送信してもよい。この場合、例えば、情報処理端末１３０は、受信された位置情報に基づいて、３Ｄモデルの表示データを特定して、消去物体情報に重畳して表示するよう制御する。

【0132】

また、サーバ１１０は、消去物体情報を、ユーザＩＤなどに関連付けて記憶しておいてもよい。この場合、受信部３０４は、第１実施形態と同様に画像と位置情報とを受信し、さらにユーザＩＤを受信する。ユーザＩＤについて、受信部３０４は、このアプリケーションへのログイン時に用いられたユーザＩＤなどを受信する。次に、特定部３０６は、ユーザＩＤに基づいて、このユーザの消去物体情報を予め設定しておき、画像から物体検索を行って、消去物体情報に対応する物体が画像内にあるか否かを判定する。画像内に消去物体情報があれば、上述した処理と同様の処理が行われる。

【0133】

なお、特定部３０６は、物体検出の一例として、ＳｅｍａｎｔｉｃＳｅｇｍｅｎｔａｔｉｏｎの手法を用いて、ピクセルごとにラベル付けを行い、このラベルに基づいて複数の領域に分類することで物体検出を行ってもよい。例えば、特定部３０６は、分類された領域に対応する領域を物体と特定してもよい。

【0134】

次に、第３実施形態に係る情報処理端末１３０の機能構成について説明する。第３実施形態に係る情報処理端末１３０の機能構成は、図７に示す情報処理端末１３０の機能構成と同様であるが、差異点を主に説明する。

【0135】

取得部４０６は、撮像部２１０により撮像される画像上で、ユーザから消去物体情報が指定された場合、指定された画像上の位置からエッジ検出等により指定された位置を含む物体情報を取得する。なお、物体を検出するための技術は、公知の技術を用いてもよい。消去物体情報の指定については、物体の位置を示して所定のジェスチャにより指定されてもよいし、ユーザが操作ボタンなどを用いることにより指定されてもよい。送信部４０２は、ユーザにより消去物体情報が指定された場合、この消去物体情報をサーバ１１０に送信する。

【0136】

受信部４０４は、サーバ１１０から、消去物体情報の背景に対応する表示データを受信する。この場合、推定部４０８及び特定部４１０の処理はなくてもよく、出力部４１２は、消去物体情報の位置に、受信された表示データを出力する。出力デバイス２０８がディスプレイである場合には、出力部４１２は、画像内の消去物体情報の位置に表示データを重畳して表示してもよい。また、出力部４１２は、画像内の消去物体情報を消去してから、その位置の表示データを出力するようにしてもよい。この場合、画像上で完全に物体を消去できるので、レンズのディスプレイを用いてリアルな世界を見る場合は、ユーザは物体が消去されていることに気づかずに、３Ｄモデルの表示データをユーザに見せることが可能になる。また、出力デバイス２０８がプロジェクタの場合、出力部４１２は、表示データの領域を可能な限り不透過に設定し、実際の消去対象の物体が視認できないようにする。

【0137】

また、受信部４０４は、３Ｄモデルデータと、特定された３Ｄモデル内の位置を示す位置情報とを受信してもよい。この場合、特定部４１０は、物体の位置情報に基づいて、３Ｄモデル内の位置を特定し、特定された位置と、消去物体情報のサイズとに基づいて表示データを特定する。出力部４１２は、特定された表示データを用いて、上述した出力処理を実行する。これにより、情報処理端末１３０側で、消去物体情報の位置を特定しておくことで、ユーザの立ち位置が変わり、消去対象の物体を見る角度が変わったとしても、情報処理端末１３０側で違和感のない３Ｄモデルの表示データを表示することが可能になる。

【0138】

次に、第３実施形態に係る処理について説明する。図１７は、第３実施形態に係る通信システム１による処理の一例を示すシーケンス図である。図１７を用いて、第１実施形態の処理フローとの差異点を説明する。

【0139】

ステップＳ３０２で、ユーザは、情報の要否を分類する否かに対する操作を行う。例えば、ユーザは、消去対象の物体を画面上で指定することで、情報の要否を分類することを情報処理端末１３０に指示する。情報処理端末１３０の取得部４０６は、ユーザから何も指示がなければ、情報の要否の分類は不要と判定してもよいし、ユーザから情報が必要な物体の指定を受け付けてもよい。また、取得部４０６は、ユーザの属性や行動履歴に応じて、情報の要否の分類が必要か否かを取得してもよい。例えば、予めユーザが情報の要否の分類が必要であると設定している場合は、取得部４０６は、このアプリケーションを起動した際に、情報の要否の分類が必要であることを取得する。また、ユーザの行動履歴として、所定回以上、情報の要否の分類が必要であると指示していた場合は、取得部４０６は、その回数以降、情報の要否の分類が必要であることを取得する。

【0140】

ステップＳ３０４、Ｓ３０６、Ｓ３０８は、図１２に示すステップＳ１０２、Ｓ１０４、Ｓ１０６と同様である。なお、ステップＳ３０４の第１ジェスチャは、第１実施形態における第１ジェスチャとは異なるジェスチャにしてもよく、第１実施形態における処理と、第３実施形態における処理とをジェスチャにより区別して両方実装されるようにしてもよい。

【0141】

ステップＳ３１０で、情報処理端末１３０の送信部４０２は、撮像された画像と、情報の要否を分類するか否かを示す情報とをサーバ１１０に送信する。ここでは、情報の要否の分類が行われるとする。

【0142】

ステップＳ３１２で、サーバ１１０の特定部３０６は、情報の要否に基づき、画像に対して領域検出（物体検出）を行う。領域検出として、ＳｅｍａｎｔｉｃＳｅｇｍｅｎｔａｔｉｏｎが実行されてもよい。

【0143】

ステップＳ３２０で、サーバ１１０の特定部３０６は、検出された領域（又は物体）に対して、その領域の情報が要るか否かを特定する。例えば、ユーザにより消去対象の物体が指示されている場合は、その物体に対応する領域に関する情報は不要であり、その他の物体に対応する領域に関する情報は必要であるとし、検出された領域がなくなるまで、情報が必要な場合の処理（ステップＳ３３２〜Ｓ３３４）、又は情報が不要な場合の処理（ステップＳ３４２〜Ｓ３４６）を繰り返す。

【0144】

ステップ３３２で、サーバ１１０の特定部３０６は、検出された物体の領域と、その領域に関する情報（例えば、物体の名称等の関連付けられている情報）を特定し、送信部３０２は、これらの情報を情報処理端末１３０に送信する。

【0145】

ステップＳ３３４で、情報処理端末１３０の出力部４１２は、受信部４０４により取得された情報のうち、概要情報を出力してもよい。なお、概要情報は必ずしも出力しなくてもよい。

【0146】

ステップＳ３４２で、サーバ１１０の特定部３０６は、物体の領域（位置及びサイズ）と、その物体の背景の３Ｄモデルを特定し、送信部３０２は、これらの情報を情報処理端末１３０に送信する。

【0147】

ステップＳ３４４で、情報処理端末１３０の出力部４１２は、画像内において、受信された物体の領域を切り抜いて消去する。

【0148】

ステップＳ３４６で、情報処理端末１３０の出力部４１２は、方位、位置情報、及び物体の領域情報に基づいて、背景の３Ｄデータの表示データを表示するよう制御する。例えば、特定部４１０が、方位及び位置情報から３Ｄモデルに対する視点と視線方向を求め、３Ｄモデルの表示面を特定する。次に、特定部４１０は、物体の領域情報に含まれる位置及びサイズの情報に基づいて、表示面のうち、どの領域を表示するかを特定し、これを表示データとして特定する。

【0149】

ステップＳ３５０で、サーバ１１０の送信部３０２は、検出された領域について、情報の要否が設定されていなければ、ｎｕｌｌを情報処理端末１３０に送信する。

【0150】

ステップＳ３５２で、サーバ１１０の特定部３０６は、物体の領域検出に失敗すれば、ｎｕｌｌを情報処理端末１３０に送信する。

【0151】

ステップＳ３６２で、ユーザは、第２ジェスチャを行う。情報処理端末１３０の撮像部２１０は、この第２ジェスチャを撮像する。第２ジェスチャは、検知部４１４により検知される。

【0152】

ステップＳ３６４で、情報処理端末１３０の出力部４１２は、第２ジェスチャに応じて表示倍率を変更し、例えばその物体の詳細情報を表示するよう制御する。なお、第３ジェスチャが行われた場合には、図１２に示す第３ジェスチャに関する処理が実行されればよい。

【0153】

次に、第３実施形態に係る具体的な適用例について説明する。第３実施形態では、不要な情報を消去することができるため、例えば、学校において、事前に校内の３Ｄモデルを用意しておき、新入生や保護者などに校内を説明する際に、不要な情報を、３Ｄモデルを用いて消去し、必要な情報を残して説明することが考えられる。

【0154】

また、ユーザが自宅の不用品をまとめて整理する際に、売りたいもの（出品物）だけを残して説明するために、出品しないものを消去して、出品しない家具等の領域には、家の３Ｄモデルの一部を表示することで、出品物だけを説明することが可能になる。

【0155】

また、ユーザがレストランで食事をする際に、関係者以外の他の客を消去して、プライベート感を演出することが可能になる。この場合、レストランの３Ｄモデルがなく、レストランに設置された監視カメラの映像をサーバ１１０が取得することが可能であれば、この映像を用いて、客がいない場合の背景画像等を保存しておくことで、客を消去した場合の背景画像を生成することが可能になる。

【0156】

また、自動運転車等から得られるカメラ画像を用いて、リアルタイムに屋外で３Ｄモデルを作成することができれば（例えばＮｖｉｄｉａ社の技術。参考ＵＲＬ：https://www.theverge.com/2018/12/3/18121198/ai-generated-video-game-graphics-nvidia-driving-demo-neurips）、その自動運転車の近隣にいるユーザに対し、リアルタイムに作成された３Ｄモデルを用いて不必要な情報を消去することが可能になる。

【0157】

また、ルート検索時や、加盟店又はユーザが行きたい店舗などの目的の場所を、レンズのディスプレイなどにマップ表示する際に、不必要な情報を消去することも可能である。

【0158】

また、自分の映像を映して商品説明などが行われる場合に、自分を消去して他のデータ（例えば小動物などのアバター）に置き換えて表示することも可能である。これは、上述した技術において、背景の３Ｄモデルの代わりにアバター等を用いることで実現することが可能である。つまり、このアバター等が自身に代わって商品説明を行うことになる。例えば、サーバ１１０は、所定のユーザＩＤに関連付けてアバターの３Ｄモデルを関連付けて記憶しておき、この所定のユーザから画像情報等が受信されれば、消去物体情報における位置にアバターが表示されるよう、このアバターのモデルを情報処理端末１３０に送信する。これにより、自分を表示したくないユーザに対して、このサービスの利用促進を図ることができる。

【0159】

また、上述した商品説明の場合において、自分の部屋を綺麗に見せるために、部屋の中の所定の物を消去し、部屋の３Ｄモデルの一部を代わりに表示することも可能である。

【0160】

また、工場見学が行われる際に、見学者に情報処理端末１３０を利用してもらい、工場内の秘密情報を削除することで、機密情報の漏洩リスクを低減することが可能になる。この場合、工場内の監視カメラ等の映像を利用することができれば、監視カメラの映像から、秘密情報の背景にある領域や物体を特定し、特定された領域や物体を表示させるとよい。

【0161】

なお、本開示は、上述した各実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲内において、他の様々な形で実施することができる。このため、上記各実施形態はあらゆる点で単なる例示にすぎず、限定的に解釈されるものではない。例えば、上述した各処理ステップは処理内容に矛盾を生じない範囲で任意に順番を変更し、または並列に実行することができる。

【0162】

本開示の各実施形態に係るプログラムは、コンピュータに読み取り可能な記憶媒体に記憶された状態で提供されてもよい。記憶媒体は、「一時的でない有形の媒体」に、プログラムを記憶可能である。プログラムは、限定でなく例として、ソフトウェアプログラムやコンピュータプログラムを含む。

【0163】

＜変形例＞
上述した各実施形態では、サーバ１１０は、特定した３Ｄモデルを情報処理端末１３０に送信するようにしたが、特定した３Ｄモデルの表示データの画面情報を送信するようにしてもよい。この場合、サーバ１１０は、情報処理端末１３０から、視点位置及び視線方向の情報を受信し、この情報を用いて更新した３Ｄモデルの表示データの画面情報を、情報処理端末１３０に送信してもよい。これにより、端末側の処理負荷を軽減させることができる。

【0164】

また、物体が店舗である場合、サーバ１１０は、その店舗の販売システムと連携することで、商品を購入できるようにしてもよい。例えば、実空間に重畳された３Ｄモデル内の商品をユーザが選択するジェスチャを行うことで、サーバ１１０は、ジェスチャ先の商品を、物体認識を行うことで特定する。物体認識は、商品の正解画像を有するデータベースなどを用いてパターンマッチングを行うことで、サーバ１１０は、誤差が一番小さい商品を特定する。その後、サーバ１１０は、特定した商品の識別情報（例えば商品名、商品のＪＡＮコード等）を、ユーザ情報とともに販売システムに送信する。ユーザ情報は、ユーザ名や住所、銀行口座やクレジット番号などの支払情報を含むとよい。これにより、ユーザは、店舗の外にいながら、店舗内の商品を特定し、購入することができるようになり、ユーザの時間と手間を省くことができる。

【0165】

また、視線方向の推定について、加速度センサ及び磁気センサを用いる以外にも、撮像装置がユーザの目を撮像することができれば、その撮像装置から取得される画像を情報処理端末１３０が取得し、その画像から目を認識し、認識した目から視線方向を推定してもよい。

【0166】

また、ウェアラブル端末１３０Ａへの操作について、既述の実施形態では、検知部４１４がユーザのジェスチャを検知して、検知したジェスチャに応じて出力部４１２が出力する表示データを更新する構成について説明したが、これに限定されない。例えば、検知部４１４が音声認識機能を備える場合には、ユーザの音声（「内部を確認したい」「拡大したい」等）によってウェラブル端末１３０Ａを操作可能にしてもよい。さらに、検知部４１４は、情報処理端末１３０の位置情報が更新されたこと（物体に近づく、または遠ざかること）を検知して、出力部４１２に出力する表示データを更新させてもよい。

【0167】

また例えば、サーバ１１０の特定部３０６は、情報処理端末１３０から取得した物体の画像と、特定された物体に対応する３Ｄモデルの外観の画像とのマッチング処理を行う際に、物体の特徴（建物の場合は例えば看板の文字やコーポレートカラー、人物の場合は例えば年齢や性別、身長、髪の毛の色や長さである。）を用いてもよい。この場合、あらかじめ物体の写真やユーザの入力に基づいて、物体の特徴を物体情報において設定しておくことが好ましい。

【0168】

また、既述の実施形態では、検知部４１４が第１操作を検知することで透視機能が有効になる例を説明したが、これに限定されない。透視機能は情報処理端末１３０の電源が入った際に自動で有効化されてもよい。

【符号の説明】

【0169】

１…通信システム、１１０…サーバ、１１２…ＣＰＵ、１１４…通信ＩＦ、１１６…記憶装置、１３０…情報処理端末、２０２…ＣＰＵ、２０４…記憶装置、２０６…通信ＩＦ、２０８…出力デバイス、２１０…撮像部、２１２…センサ、１３０Ａ…ウェアラブル端末、１３６…ディスプレイ、１３７…フレーム、１３８…ヒンジ部、１３９…テンプル、１３９ａ…係止部、３０２…送信部、３０４…受信部、３０６…特定部、３０８…更新部、４０２…送信部、４０４…受信部、４０６…取得部、４０８…推定部、４１０…特定部、４１２…出力部、４１４…検知部

【要約】

【課題】ユーザの目の前にある物体について、その場にいながらユーザに物体内部等の詳細情報を容易に確認させること。
【解決手段】情報処理端末に、撮像部により撮像された画像、及び情報処理端末の位置を示す位置情報を取得することと、画像及び位置情報を情報処理装置に送信することと、情報処理装置から、画像及び位置情報を用いて特定された物体の三次元モデルのデータを受信することと、加速度センサ及び磁気センサにより測定されたセンサ情報に基づいて、情報処理端末を利用するユーザの視線方向を推定することと、視線方向を用いて三次元モデルの表示データを特定することと、表示データを出力することと、を実行させるプログラム。
【選択図】図１２

【図1】