(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-09-20
(54)【発明の名称】テレプレゼンステレビ会議のための正確なカメラ・ディスプレイ間の較正
(51)【国際特許分類】
G06T 7/80 20170101AFI20240912BHJP
【FI】
G06T7/80
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2023539850
(86)(22)【出願日】2022-09-01
(85)【翻訳文提出日】2023-10-12
(86)【国際出願番号】 US2022075813
(87)【国際公開番号】W WO2024049480
(87)【国際公開日】2024-03-07
(81)【指定国・地域】
(71)【出願人】
【識別番号】502208397
【氏名又は名称】グーグル エルエルシー
【氏名又は名称原語表記】Google LLC
【住所又は居所原語表記】1600 Amphitheatre Parkway 94043 Mountain View, CA U.S.A.
(74)【代理人】
【識別番号】110001195
【氏名又は名称】弁理士法人深見特許事務所
(72)【発明者】
【氏名】ペロー,ジョン・ディ
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096AA06
5L096AA09
5L096CA05
5L096DA01
5L096EA15
5L096EA16
5L096FA32
5L096FA67
5L096FA69
(57)【要約】
テレプレゼンスビデオ会議ディスプレイおよびカメラを較正する技術は、ミラーの指定されたミラー面点および指定された反射ディスプレイ面点を示す複数の画像に基づいて、ディスプレイ基準フレーム内に6DoFカメラの位置および向きベクトルを規定するステップを含む。いくつかの実装形態では、指定されたミラー面点はミラー上に印刷された起点マーカに位置する。いくつかの実装形態では、指定された反射ディスプレイ面点は、ディスプレイ上の起点マーカの市松模様パターンに配置される。
【特許請求の範囲】
【請求項1】
方法であって、
複数の画像を表わす画像データを受信するステップを含み、前記複数の画像の各々は、(i)カメラに対して複数のミラー姿勢のそれぞれのミラー姿勢で保持されるミラーの面内の指定点と、(ii)虚像ディスプレイ面内の指定点とを示し、前記虚像ディスプレイ面はディスプレイの画像を含み、前記方法はさらに、
前記ミラーの前記面内の前記指定点および前記虚像ディスプレイ面内の前記指定点に基づいて前記ディスプレイの基準フレーム内の前記カメラの位置および向きを決定するステップと、
前記カメラの前記決定された位置および向きに従って前記ディスプレイ上の画像をユーザに対して提示させるステップとを含む、方法。
【請求項2】
前記ミラーの前記面内の前記指定点は、前記ミラー上に印刷された起点マーカに位置する、請求項1に記載の方法。
【請求項3】
前記起点マーカは、紫外線プリンタを用いて、直接、ミラー上に印刷される、請求項2に記載の方法。
【請求項4】
前記虚像ディスプレイ面内の前記指定点は、前記虚像ディスプレイ面において起点マーカの市松模様パターンに配置される、請求項1に記載の方法。
【請求項5】
前記画像データを受信するステップは、
前記起点マーカの市松模様パターンに対して反転演算を実行して、反転された市松模様パターンを生成するステップを含み、
前記ディスプレイの基準フレーム内の前記カメラの前記位置および前記向きを決定するステップは、
前記反転された市松模様パターンに配置された指定点の位置を記録するステップを含む、請求項4に記載の方法。
【請求項6】
前記ディスプレイの基準フレーム内の前記カメラの前記位置および前記向きを決定するステップは、
前記ミラーの前記面内のカメラ位置を決定するステップを含み、前記ミラーの前記面内の前記カメラ位置は、前記虚像ディスプレイ面における前記市松模様パターンの点の位置に基づく、請求項4に記載の方法。
【請求項7】
前記ミラーの面内の前記カメラ位置は、前記虚像ディスプレイ面における前記市松模様パターンの前記点の前記位置の定数倍であり、前記定数は、前記ミラーの前記面内の前記指定点と、前記虚像ディスプレイ面における前記市松模様パターンの点の位置と、前記ミラーの向きとに基づく、請求項6に記載の方法。
【請求項8】
前記ディスプレイの基準フレーム内の前記カメラの前記位置および前記向きを決定するステップは、
前記ミラーの前記面内の前記ディスプレイの位置および向きを決定するステップを含む、請求項1に記載の方法。
【請求項9】
前記ディスプレイの基準フレーム内の前記カメラの前記位置および前記向きを決定するステップは、
前記複数のミラー姿勢に関して前記ディスプレイの前記基準フレーム内の前記カメラの位置を平均化するステップを含む、請求項1に記載の方法。
【請求項10】
前記複数のミラー姿勢に関して前記ディスプレイの前記基準フレーム内の前記カメラの回転を平均化するステップをさらに含み、前記平均化するステップは、
ミラー姿勢に対応する四元数投影行列を生成するステップと、
前記四元数投影行列の最大固有値に対応する固有関数を計算するステップとを含む、請求項9に記載の方法。
【請求項11】
非一時的な記憶媒体を備えるコンピュータプログラムプロダクトであって、前記コンピュータプログラムプロダクトは、処理回路によって実行されると前記処理回路に方法を実行させるコードを含み、前記方法は、
複数の画像を表わす画像データを受信するステップを含み、前記複数の画像の各々は、(i)カメラに対して複数のミラー姿勢のそれぞれのミラー姿勢で保持されるミラーの面内の指定点と、(ii)虚像ディスプレイ面内の指定点とを示し、前記虚像ディスプレイ面はディスプレイの画像を含み、前記方法はさらに、
前記ミラーの前記面内の前記指定点および前記虚像ディスプレイ面内の前記指定点に基づいて前記ディスプレイの基準フレーム内の前記カメラの位置および向きを決定するステップと、
前記カメラの前記決定された位置および向きに従って前記ディスプレイ上の画像をユーザに対して提示させるステップとを含む、コンピュータプログラムプロダクト。
【請求項12】
前記ミラーの前記面内の前記指定点は、前記ミラー上に印刷された起点マーカに位置する、請求項11に記載のコンピュータプログラムプロダクト。
【請求項13】
前記起点マーカは、紫外線プリンタを用いて、直接、ミラー上に印刷される、請求項12に記載のコンピュータプログラムプロダクト。
【請求項14】
前記虚像ディスプレイ面内の前記指定点は、前記虚像ディスプレイ面において起点マーカの市松模様パターンに配置される、請求項11に記載のコンピュータプログラムプロダクト。
【請求項15】
前記画像データを受信するステップは、
前記起点マーカの市松模様パターンに対して反転演算を実行して、反転された市松模様パターンを生成するステップを含み、
前記ディスプレイの基準フレーム内の前記カメラの前記位置および前記向きを決定するステップは、
前記反転された市松模様パターンに配置された指定点の位置を記録するステップを含む、請求項14に記載のコンピュータプログラムプロダクト。
【請求項16】
前記ディスプレイの基準フレーム内の前記カメラの前記位置および前記向きを決定するステップは、
前記ミラーの前記面内のカメラ位置を決定するステップを含み、前記ミラーの前記面内の前記カメラ位置は、前記虚像ディスプレイ面における前記市松模様パターンの点の位置に基づく、請求項14に記載のコンピュータプログラムプロダクト。
【請求項17】
前記ミラーの面内の前記カメラ位置は、前記虚像ディスプレイ面における前記市松模様パターンの前記点の前記位置の定数倍であり、前記定数は、前記ミラーの前記面内の前記指定点と、前記虚像ディスプレイ面における前記市松模様パターンの点の位置と、前記ミラーの向きとに基づく、請求項16に記載のコンピュータプログラムプロダクト。
【請求項18】
前記ディスプレイの基準フレーム内の前記カメラの前記位置および前記向きを決定するステップは、
前記ミラーの前記面内の前記ディスプレイの位置および向きを決定するステップを含む、請求項11に記載のコンピュータプログラムプロダクト。
【請求項19】
前記ディスプレイの基準フレーム内の前記カメラの前記位置および前記向きを決定するステップは、
前記複数のミラー姿勢に関して前記ディスプレイの前記基準フレーム内の前記カメラの位置を平均化するステップを含む、請求項11に記載のコンピュータプログラムプロダクト。
【請求項20】
前記複数のミラー姿勢に関して前記ディスプレイの前記基準フレーム内の前記カメラの回転を平均化するステップをさらに含み、前記平均化するステップは、
ミラー姿勢に対応する四元数投影行列を生成するステップと、
前記四元数投影行列の最大固有値に対応する固有関数を計算するステップとを含む、請求項19に記載のコンピュータプログラムプロダクト。
【発明の詳細な説明】
【背景技術】
【0001】
背景
テレプレゼンスは、自分が実際に存在している位置以外の場所に自分自身が存在しているかのように感じることを人に可能にする任意の一式の技術を指す。テレプレゼンスは、ユーザの感覚が特定の刺激、例えば視覚、聴覚、触覚、嗅覚等と相互に緩衝し合うことを含み得る。テレプレゼンステレビ会議等の適用例では、視覚および聴覚の刺激が考慮される。
【発明の概要】
【発明が解決しようとする課題】
【0002】
概要
本明細書に記載の実装形態は、テレプレゼンステレビ会議のための立体3次元(three-dimensional:3D)ディスプレイ内で正確なユーザの眼の位置を得るために複数のカメラを較正することに関する。立体3Dディスプレイは左目および右目用のインターリーブピクセルを表示するので、ディスプレイピクセルに対するユーザの目の正確な推定値を得ることが望まれる。ディスプレイ内のユーザの眼の位置をこのように正確に測定するには、6自由度(six degrees of freedom:6DoF)、すなわち、カメラ・ディスプレイ間変換の3つの位置座標および3つの向き座標を測定する必要がある。本明細書では、ミラーの指定されたミラー面点および指定された反射ディスプレイ面点を示す複数の画像に基づいてディスプレイ基準フレーム内の6DoFカメラの位置および向きベクトルが決定される方法を提供する。いくつかの実装形態では、指定されたミラー面点は、ミラー上に印刷された起点マーカに位置する。いくつかの実装形態では、指定された反射ディスプレイ面点は、ディスプレイ上において起点マーカの市松模様パターンに配置される。
【課題を解決するための手段】
【0003】
概略的な一局面では、方法は、複数の画像を表わす画像データを受信するステップを含み得る。当該複数の画像の各々は、(i)カメラに対して複数のミラー姿勢のそれぞれのミラー姿勢で保持されるミラーの面内の指定点と、(ii)ディスプレイの画像を含む虚像ディスプレイ面内の指定点とを示す。当該方法はまた、当該ミラーの当該面内の当該指定点および当該虚像ディスプレイ面内の当該指定点に基づいて当該ディスプレイの基準フレーム内の当該カメラの位置および向きを決定するステップを含み得る。当該方法はさらに、当該カメラの当該決定された位置および向きに従って、当該ディスプレイ上の画像をユーザに対して提示させるステップを含み得る。
【0004】
別の概略的な局面では、コンピュータプログラムプロダクトは非一時的な記憶媒体を備え、当該コンピュータプログラムプロダクトは、処理回路によって実行されると当該処理回路に方法を実行させるコードを含む。当該方法は、複数の画像を表わす画像データを受信するステップを含み得る。当該複数の画像の各々は、(i)カメラに対して複数のミラー姿勢のそれぞれのミラー姿勢で保持されるミラーの面内の指定点と、(ii)ディスプレイの画像を含む虚像ディスプレイ面内の指定点とを示す。当該方法はまた、当該ミラーの当該面内の当該指定点および当該虚像ディスプレイ面内の当該指定点に基づいて当該ディスプレイの基準フレーム内の当該カメラの位置および向きを決定するステップを含み得る。当該方法はさらに、当該カメラの当該決定された位置および向きに従って当該ディスプレイ上の画像をユーザに対して提示させるステップを含み得る。
【0005】
1つ以上の実装形態の詳細が添付の図面および以下の説明に記載される。他の特徴が以下の説明および添付の図面ならびに添付の特許請求の範囲から明らかになるだろう。
【図面の簡単な説明】
【0006】
【
図1A】本明細書に記載の実装形態に従った例示的なテレプレゼンスビデオ会議システムを示す正面図である。
【
図1B】本明細書に記載の実装形態に従った例示的なテレプレゼンスビデオ会議システムを示す側面図である。
【
図2】立体3Dディスプレイにおけるカメラの位置および向きを決定するように構成された例示的な処理回路を示す図である。
【
図3】立体3Dディスプレイにおけるカメラの位置および向きを決定する例示的な方法を示すフローチャートである。
【
図4】立体3Dディスプレイ上の起点マークの市松模様パターンの画像を反射する起点マークを備えた例示的なミラーを示す図である。
【
図5】ミラー、虚像およびディスプレイにおけるカメラの位置および向きを決定するための例示的なジオメトリを示す図である。
【
図6】ミラーによるカメラの反射である仮想カメラを用いてディスプレイ内のカメラ位置を決定するための例示的なジオメトリを示す図である。
【発明を実施するための形態】
【0007】
詳細な説明
本開示は、テレプレゼンス技術へのアクセスを拡張し、テレプレゼンス技術を改善することに関する。テレプレゼンスは、自分が実際に存在している位置以外の場所に自分自身が存在しているかのように感じることを人に可能にする任意の一式の技術を指す。テレプレゼンスは、ユーザの感覚が特定の刺激、例えば視覚、聴覚、触覚、嗅覚等と相互に緩衝し合うことを含み得る。テレプレゼンステレビ会議等の適用例では、視覚および聴覚の刺激のみが考慮される。
【0008】
テレプレゼンステレビ会議システム100を
図1Aに示す。システム100は、3つのカメラ130(1)~130(3)が配置されるモニタ110を含む。
図1Aに示すように、システム100は、モニタ110に面するユーザが占有する部屋内に固定されている。モニタに面するユーザは、テレプレゼンステレビ会議の同僚参加者を視認する。いくつかの実装形態では、ユーザが見るモニタ110上の画像は、同僚参加者が当該ユーザとともに部屋に存在しているように見えるように構成される。例えば、カメラ130(1)~130(3)は、様々な視点(例えば、角度)からのユーザの画像を提供し得る。このような情報は、深度撮像情報を提供するために用いられてもよい。テレプレゼンステレビ会議の同僚参加者が占有する空間内のユーザの3次元画像をシミュレートするために、深度撮像情報をテクスチャ情報と結合したものが用いられてもよい。
【0009】
モニタ110は立体3次元ディスプレイを含み得る。立体3Dディスプレイは、観察者に没入型体験を提供するために、観察者の両眼の各々にわずかに異なる透視図を送信することによって観察者に3D画像を提示する。観察者の視覚系は、観察者が画像を3Dで見ることができるように両眼立体視をもたらすことにより奥行き知覚を含む画像を翻訳変換するように2つの透視画像を処理し得る。立体視ディスプレイの中には、立体画像を観察者の左眼および右眼の各々に、それぞれ左側チャネルおよび右側チャネルを介して送信するものもある。
【0010】
立体画像を用いて奥行きを翻訳変換するので、ディスプレイ座標に対してユーザの眼を正確に測定することが望まれる。ディスプレイ内のユーザの眼の位置をこのように正確に測定するには、6自由度(6DoF)、すなわち、カメラ・ディスプレイ間変換の3つの位置座標および3つの向き座標、を測定する必要がある。これを達成するために、従来のテレプレゼンスビデオ会議ディスプレイは6DoFカメラ・ディスプレイ間変換の推定値を提供する。
【0011】
上述の従来のテレプレゼンスビデオ会議ディスプレイに関する技術的問題は、従来のテレプレゼンスビデオ会議ディスプレイにおいて提供されるこのような推定値が、テレプレゼンスシステムの如何なる基本的なジオメトリにも基づかない経験的なヘッドオフセット誤差を必要とすることである。したがって、このような不正確な誤差により、結果として、L-Rクロストークを減らすための措置が講じられる際の動作ヘッド体積が小さくなる。
【0012】
本明細書に記載の実装形態に従うと、上述の技術的問題に対する技術的解決策は、ミラーの指定されたミラー面点および指定された反射ディスプレイ面点を示す複数の画像に基づいてディスプレイ基準フレーム内に6DoFカメラの位置および向きベクトルを規定することを含む。いくつかの実装形態では、指定されたミラー面点はミラー上に印刷された起点マーカに位置する。いくつかの実装形態では、指定された反射ディスプレイ面点は、ディスプレイ上において起点マーカの市松模様パターンに配置される。
【0013】
技術的解決策の技術的利点は、テレプレゼンスビデオ会議ディスプレイを改善することにより経験的なヘッドオフセット誤差が不要となり、これによりカメラ・ディスプレイ間の較正の精度が改善され、したがって、動作ヘッド体積とL-Rクロストーク低減とのトレードオフが殆どない大きなフィールドが提供されることとなる。
【0014】
いくつかの実装形態では、ミラーの面内の指定点は、ミラー上に印刷された起点マーカに位置する。
【0015】
いくつかの実装形態では、起点マーカは、紫外線プリンタを用いて、直接、ミラー上に印刷される。
【0016】
いくつかの実装形態では、虚像ディスプレイ面内の指定点は、虚像ディスプレイ面において起点マーカの市松模様パターンに配置される。
【0017】
いくつかの実装形態では、画像データを受信するステップは、起点マーカの市松模様パターンに対して反転演算を実行して、反転された市松模様パターンを生成するステップを含む。このような実装形態では、ディスプレイの基準フレーム内のカメラの位置および向きを決定するステップは、反転された市松模様パターンに配置された指定点の位置を記録するステップを含む。
【0018】
いくつかの実装形態では、ディスプレイの基準フレーム内のカメラの位置および向きを決定するステップは、ミラーの面内のカメラ位置を決定するステップを含み、ミラーの面内のカメラ位置は、虚像ディスプレイ面における市松模様パターンの点の位置に基づいている。
【0019】
いくつかの実装形態では、ミラーの面内のカメラ位置は、チェス盤状虚像点の定数倍であり、当該定数は、ミラーの面内の指定点と虚像ディスプレイ面における市松模様パターンの点の位置とミラーの向きとに基づいている。
【0020】
いくつかの実装形態では、ディスプレイの基準フレーム内のカメラの位置および向きを決定するステップは、ミラーの面内のディスプレイの位置および向きを決定するステップを含む。
【0021】
いくつかの実装形態では、ディスプレイの基準フレーム内のカメラの位置および向きを決定するステップは、複数のミラー姿勢に関してディスプレイの基準フレーム内のカメラの位置を平均化するステップを含む。
【0022】
いくつかの実装形態では、複数のミラー姿勢に関してディスプレイの基準フレーム内のカメラの回転を平均化するステップをさらに含み、当該平均化するステップは、ミラー姿勢に対応する四元数投影行列を生成するステップと、当該四元数投影行列の最大固有値に対応する固有関数を計算するステップとを含む。
【0023】
図1Aは、例示的なテレプレゼンステレビ会議システム100の正面図を示す。
図1Aに示すように、テレプレゼンステレビ会議システム100は、ディスプレイ110と、処理回路120と、各々がそれぞれのカメラを含む3つのカメラポッド130(1)~130(3)とを含む。
【0024】
ディスプレイ110は、テレプレゼンステレビ会議に用いられる立体3Dディスプレイである。立体3Dディスプレイは、観察者に没入型体験を提供するために、観察者の両眼の各々にわずかに異なる透視図を送信することによって観察者に3D画像を提示する。観察者の視覚系は、観察者が画像を3Dで見ることができるように両眼立体視をもたらすことにより奥行き知覚を含む画像を翻訳変換するように2つの透視画像を処理し得る。立体視ディスプレイの中には、立体画像を観察者の左眼および右眼の各々に、それぞれ左側チャネルおよび右側チャネルを介して送信するものもある。
【0025】
いくつかの実装形態では、ディスプレイ110は3Dライトフィールドディスプレイである。3Dライトフィールドディスプレイは、観察者が着用する特別なヘッドギアを用いることなく、観察者が立体画像を認識することを可能にする自動立体効果をもたらす立体ディスプレイである。例示的な3Dライトフィールドディスプレイは、自動立体効果をもたらすためにレンチキュラー光学系を用いる。レンチキュラー光学系は、ディスプレイスクリーン上に適合されるシート上に形成された一連の垂直配向型円柱レンズとして形成され得る。
【0026】
カメラ130(1)~130(3)は、
図1Aに示すように、ディスプレイ110の周囲でディスプレイ110を取り囲み、ディスプレイ110の前方に座っているユーザの画像を取込むためにディスプレイ110から外方向を向いている。これらのカメラは、様々な視点からのユーザの画像を記録するとともに、別のユーザに対して表示するために3次元または高解像度にされた集約画像を形成し得る。
【0027】
ディスプレイ110は立体3Dディスプレイであるので、ディスプレイにおいてユーザの眼を正確に位置付けることが望ましい。これは、ディスプレイ110におけるカメラ位置140および向きが綿密に較正されることを意味する。この目的のために、処理回路120は、この較正を実行し、ディスプレイ110におけるカメラ、例えば130(1)、の正確な位置を決定するように構成される。
【0028】
較正を実行する一方法として、ミラーを用いてカメラにディスプレイ内容を示す方法が挙げられる。ミラー上の位置は起点マークを用いて示されてもよく、ミラー内のディスプレイの画像上の位置は市松模様パターンに配置された起点マークを用いて示されてもよい。これについては
図4~
図7においてさらに詳細に説明する。
【0029】
図1Bは、例示的なテレプレゼンステレビ会議システム100の側面図である。システム100の側面図は、ディスプレイ110の前方に座っているユーザ150を示す。カメラ130(2)は、適切に較正されると、ディスプレイ内の、すなわちディスプレイ座標における、ユーザの眼の位置160を正確に記録する。例えば、改善されたテレプレゼンステレビ会議ディスプレイ110は、従来のテレプレゼンステレビ会議ディスプレイでの15mm~25mmレベルの不正確さとは対照的に、2mm未満のgeocal(geometric camera calibration:幾何学的カメラ較正)精度レベルを有する。
【0030】
本明細書において「精度」とは、geocal忠実度によって決定される静的、すなわち時間に依存しない誤差を意味することが理解される。これは、システム待ち時間によって決定される動的精度とは異なるものであって、本明細書では取扱わない。不正確さまたは誤差の1つの要因として、較正中にミラーが異なるスタイルで移動することが原因として挙げられる可能性もあり、これがトラッカーカメラ姿勢に系統的誤差をもたらすことが疑われている。
【0031】
図2は処理回路120の一例を示す図である。処理回路120は、ネットワークインターフェイス222、1つ以上の処理ユニット224、および非一時的メモリ226を含む。ネットワークインターフェイス222は、ネットワークから受信した電子信号および/または光信号を処理回路120で使用するための電子形式に変換するために、例えば、イーサネット(登録商標)アダプタ、トークンリングアダプタ等を含む。処理ユニット224のセットは1つ以上の処理チップおよび/またはアセンブリを含む。メモリ226は、揮発性メモリ(例えば、RAM)と、1つ以上のROM、ディスクドライブ、ソリッドステートドライブ等の不揮発性メモリとをともに含む。処理ユニットのセット224およびメモリ226は一緒に、本明細書で記載するような様々な方法および機能を実行するように構成および配置される処理回路を形成する。
【0032】
いくつかの実装形態では、処理回路120の構成要素の1つ以上は、メモリ226に記憶された命令を処理するように構成されたプロセッサ(例えば、処理ユニット224)であり得るかまたは当該プロセッサを含み得る。
図2に示すような命令の例は、画像マネージャ230、較正マネージャ240、および最小二乗平均化マネージャ250を含む。さらに、
図2に示すように、メモリ226は様々なデータを記憶するように構成され、当該データは、このようなデータを用いるそれぞれのマネージャに関して記述されている。
【0033】
画像マネージャ230は画像データ232を取得するように構成される。いくつかの実装形態では、画像マネージャ230は、ネットワークにわたりネットワークインターフェイス222を介して画像データ232を取得する。いくつかの実装形態では、画像マネージャ230は、直接接続を介して画像データ232を取得する。いくつかの実装形態では、画像マネージャ230はローカルストレージデバイスから画像データ232を取得する。
【0034】
画像データ232は、いくつかの特定の姿勢をとるミラーにディスプレイ110の画像を表わす。画像データ232は、ディスプレイ基準フレーム、すなわちディスプレイ座標、内のカメラ(例えば、カメラ130(2))の正確な位置および向きを決定するために較正マネージャ240によって用いられる。画像データの各画像は、カメラに保持されたミラーの特定の姿勢を表わす。ミラーにおけるディスプレイの例示的な画像を
図4に示す。
【0035】
図4は、立体3Dディスプレイ(例えば、ディスプレイ110)上の起点マークの市松模様パターン420の画像を反射する起点マーク410(1)~410(4)を備えた例示的なミラー400を示す図である。
【0036】
画像を生成する際に、カメラ(例えば、カメラ130(2))に対し、印刷されたチャートを用いて直視的にgeocal内部較正を実行したものと仮定する。さらに、照明、カメラ焦点、露光時間、信号対雑音比(signal-to-noise ratio:SNR)、および動きがミラーマーカおよびディスプレイの鮮明な画像のために最適化されたものと仮定する。
【0037】
いくつかの実装形態では、起点マーカ410(1)~410(4)は正方形のArUcoマーカである。ArUcoマーカは、幅広で黒色の境界とその識別子を決定する内部バイナリ行列とによって構成される合成された正方形マーカである。黒色の境界は、画像内で当該境界を高速で検出することを容易にし、バイナリコード化は、その識別ならびに誤り検出および訂正技術の適用を可能にする。マーカサイズは内部行列のサイズを決定する。例えば、4×4のマーカサイズは16ビットで構成される。なお、マーカが環境内で回転しているのを見出すことができる。しかしながら、検出プロセスは、各角部が明確に識別され得るように、その元の回転を判別できるものでなければならない。これは、バイナリコード化に基づいて行われてもよい。
【0038】
いくつかの実装形態では、ArUcoマーカは、紫外線(ultraviolet:UV)プリンタを用いてミラー400の基板上に直接印刷される。このようなUVプリンタの例として、1インチ当たりのドット数(dots per inch:DPI)1200×600、600×600、および600×300をサポートするHP(Hewlett-Packard)Scitex FB550が挙げられる。いくつかの実装形態では、基板は、1インチ当たり1波長までは平坦であり、これは、12インチミラーにわたって平面偏差が5nm未満であることを示している。いくつかの実装形態では、ミラーは300mmの半導体ウェハである。
【0039】
いくつかの実装形態では、ディスプレイ(例えば、ディスプレイ110)上の起点マークの市松模様パターン420はChArUcoパターンである。ArUcoマーカおよびボードは、迅速に検出できるとともに汎用性を有するので非常に有用である。しかしながら、ArUcoマーカの問題の1つとして、サブピクセル精細化を適用した後であってもそれらの角部位置の精度があまり高くない点が挙げられる。対照的に、チェス盤パターンの角部は、各角部が2つの黒い正方形によって囲まれているので、より正確に精細化することができる。しかしながら、チェス盤パターンを発見することはArUcoボードを発見することほどには融通性がなく、完全に可視でなければならず、オクルージョンは許容されない。ChArUcoパターンは、これら2つのアプローチの利点を組合わせたものである。ArUco部分は、オクルージョンまたは部分的視野を可能にするので、マーカボードの汎用性を有するようにチェス盤角部の位置を補間するために用いられる。さらに、補間された角部はチェス盤に属するので、サブピクセル精度の点では非常に正確である。
【0040】
図2に戻ると、画像データ232は、
図2に示すように、複数の起点マーカ位置234(1)…234(N)(例えば、ArUcoマーカ位置)を含み、ここで、Nは、画像データ232に表わされる姿勢の数である。起点マーカ位置の各々、例えば234(1)は、ミラー400(または、300mm半導体ウェハの場合、円形ミラーに内接する正方形)の各角部における4つのマーカの位置を含む。較正マネージャ240が各姿勢の4つのマーカを用いて、カメラ座標、すなわち、カメラ基準系
【0041】
【0042】
に対するミラーの6DoF姿勢を計算する。式中、Rは向きベクトルであり、Tは並進(位置)ベクトルである。
【0043】
画像データ232はまた、
図2に示すように、複数の市松模様パターン位置236(1)…236(N)、例えばChArUcoパターンマーカ位置を含む。市松模様パターン位置の各々、例えば236(1)は、市松模様パターン位置236(1)…236(N)における起点マーカ角部の各々の位置を含む。次いで、較正マネージャ240がこれらの位置を用いて、カメラ座標、すなわち、カメラ基準系
【0044】
【0045】
に対するディスプレイの虚像の6DoF姿勢を計算する。
いくつかの実装形態では、画像マネージャ230は市松模様反転マネージャ231を含む。市松模様反転マネージャ231は、検出すべき市松模様パターン位置236(1)…236(N)を反転させる、すなわちミラー400の面内の軸に沿ってひっくり返す、ように構成される。これらの位置が画像マネージャ230によって検出されると、市松模様反転マネージャ231は、仮想の市松模様パターン420の画像点を記録するためにミラー400の面内の軸に沿ってひっくり返したものを反転させるように構成される。
【0046】
画像データ232はまた、
図2に示すように、複数のミラー向き238(1)…238(N)を含む。各ミラー向き、例えば238(1)は、ミラー表面から外方向を向いたミラー面の法線の方向を示す。いくつかの実装形態では、複数のミラー向き238(1)…238(N)は複数の起点マーカ位置234(1)…234(N)から決定される。
【0047】
較正マネージャ240は、画像データ232に基づいてディスプレイ110の基準フレーム内のカメラ、例えば130(2)、の位置および向きを決定するように構成される。いくつかの実装形態では、較正マネージャ240は、画像データ232に基づいて中間計算を実行して較正データ242を生成し、当該較正データ242は、ディスプレイ110の基準フレーム内のカメラ、例えば130(2)、の位置および向きを生成するために用いられる。
図2に示すように、較正データは、
【0048】
【0049】
とを含む。
較正マネージャ240はまた、ミラー上の反射点を推定するように構成され、このような推定は、いくつかの実装形態では、後続の反射変換を実行するために用いられる。このような推定を
図5に示す。
【0050】
図5は、画像データ232を前提として、ミラー510、虚像530、およびディスプレイ520における反射点
【0051】
【0052】
を決定するための例示的なジオメトリ500を示す図である。反射点は、以下のように直線と平面との交差問題を解くことによって計算され得る。
【0053】
【0054】
すなわち、ミラー510における反射点
【0055】
【0056】
は、虚像ディスプレイ面における市松模様パターンの点の位置の定数倍である。
較正マネージャ240はまた、カメラ・ディスプレイ間位置ベクトルを計算するように構成される。ディスプレイ位置は基準ミラーフレーム(すなわち、ミラー座標)において計算される。
【0057】
【0058】
基準ミラーフレーム内のディスプレイ位置は次式によって与えられる。
【0059】
【0060】
【0061】
いくつかの実装形態では、
図6に示すように、仮想カメラの役割を考慮に入れることが有用である。
図6は、ミラー610によるカメラの反射である仮想カメラ650を用いて、ディスプレイ620内のカメラ640の位置を決定するための例示的なジオメトリを示す図である。カメラ640のミラー610の画像を考慮に入れると、様々な姿勢から物理的ディスプレイを視認する仮想カメラ650としてgeocal実験が想定され得る。
図6に示すように、仮想カメラ650の姿勢はミラー610の姿勢から決定される。
【0062】
カメラ・ディスプレイ並進は
図6の三角形Δを考慮して生成される。仮想カメラジオメトリは、ベクトル方程式構造を単純化し、カメラ・ディスプレイ並進(すなわち、ディスプレイ座標におけるカメラ)を測定量の点から明確に表現する。上述の式を代入することにより、カメラ・ディスプレイ並進は以下のとおりとなる。
【0063】
【0064】
最後に、画像データ232の画像ごとのカメラ・ディスプレイの向き回転行列が計算される。反射演算子Mは、カメラ・虚像の回転行列を反射させるために用いられるが、ミラー(すなわち、極)対称性を維持するために「サンドイッチ」方式で適用されなければならない。
【0065】
【0066】
最小二乗平均化マネージャ250は、カメラ・ディスプレイ並進ベクトルの最小二乗推定値を最小二乗平均化データ252として見出すために、いくつかの姿勢に関してカメラ対ディスプレイの位置を平均化するように構成される。
【0067】
【0068】
対照的に、回転ベクトルおよび/または行列推定値は、「平均」カメラベースの回転ベクトルを見つけるために平均化することはできない。しかしながら、ユニタリ制約下で、フロベニウスノルム(Frobenius norm)を最小化する回転行列推定値(3DoF)が見出される可能性がある。
【0069】
【0070】
いくつかの実装形態では、回転行列の最小二乗推定値は四元数を用いて計算され得る。四元数を用いることの利点は、反復非線形オプティマイザを回避することと、勾配降下中に極小値にとどめられることとを含む。最小二乗誤差を最小化する四元数は、四元数投影行列Q251の最大固有値に対応する固有ベクトル(例えば、固有ベクトルデータ254(1)…254(N))である。なお、i番目の四元数qiは、ロドリゲス(Rodrigues)ベクトル定義を用いてミラー姿勢ごとに構築されることに留意されたい。
【0071】
【0072】
最終結果は、ディスプレイ座標データ260におけるカメラ位置
【0073】
【0074】
である。この6DoFデータの効果は、カメラのこの決定された位置および向きに従ってディスプレイ上の画像をユーザに対して提示させることである。
【0075】
処理回路120の構成要素(例えば、モジュール、処理ユニット224)は、1つ以上のタイプのハードウェア、ソフトウェア、ファームウェア、オペレーティングシステム、ランタイムライブラリ等を含み得る1つ以上のプラットフォーム(例えば、1つ以上の同様のまたは異なるプラットフォーム)に基づいて動作するように構成され得る。いくつかの実装形態では、処理回路120の構成要素は、デバイスのクラスタ(例えば、サーバファーム)内で動作するように構成され得る。このような実装形態では、処理回路120の構成要素の機能および処理は、デバイスのクラスタのうちのいくつかのデバイスに分散させることができる。
【0076】
処理回路120の構成要素は、属性を処理するように構成された任意のタイプのハードウェアおよび/またはソフトウェアであり得るかまたはそれらを含み得る。いくつかの実装形態では、
図2の処理回路120の構成要素に示される構成要素の1つ以上の部分は、ハードウェアベースのモジュール(例えば、デジタル信号プロセッサ(digital signal processor:DSP)、フィールドプログラマブルゲートアレイ(field programmable gate array:FPGA)、メモリ)、ファームウェアモジュール、および/もしくはソフトウェアベースのモジュール(例えば、コンピュータコードのモジュール、コンピュータにおいて実行可能なコンピュータ可読命令のセット)であり得るか、またはこれらを含み得る。例えば、いくつかの実装形態では、処理回路120の構成要素の1つ以上の部分は、少なくとも1つのプロセッサ(図示せず)による実行のために構成されたソフトウェアモジュールであり得るかまたはそれを含み得る。いくつかの実装形態では、構成要素の機能は、2つの構成要素として示される機能を単一の構成要素に組合わせることを含め、
図2に示すものとは異なるモジュールおよび/または異なる構成要素に含まれ得る。
【0077】
図示していないが、いくつかの実装形態では、処理回路120の構成要素(またはその部分)は、例えば、データセンタ(例えばクラウドコンピューティング環境)、コンピュータシステム、1つ以上のサーバ/ホストデバイス等内で動作するように構成され得る。いくつかの実装形態では、処理回路120の構成要素(またはその部分)はネットワーク内で動作するように構成され得る。このため、処理回路120の構成要素(またはその部分)は、1つ以上のデバイスおよび/または1つ以上のサーバデバイスを含み得る様々なタイプのネットワーク環境内で機能するように構成され得る。例えば、ネットワークは、ローカルエリアネットワーク(local area network:LAN)、ワイドエリアネットワーク(wide area network:WAN)等であり得るか、またはそれらを含み得る。ネットワークは、ワイヤレスネットワーク、および/または、例えば、ゲートウェイデバイス、ブリッジ、スイッチ等を用いて実装されるワイヤレスネットワークであり得るかまたはそれを含み得る。ネットワークは、1つ以上のセグメントを含み得、ならびに/または、インターネットプロトコル(Internet Protocol:IP)および/もしくはプロプライエタリプロトコル等の様々なプロトコルに基づく部分を有し得る。ネットワークはインターネットの少なくとも一部を含み得る。
【0078】
いくつかの実装形態では、サーチシステムの構成要素のうちの1つ以上は、メモリに記憶された命令を処理するように構成されたプロセッサであり得るかまたはそれを含み得る。例えば、画像マネージャ230(および/またはその一部)、較正マネージャ240(および/またはその一部)、ならびに最小二乗平均化マネージャ250(および/またはその一部)はこのような命令の例である。
【0079】
いくつかの実装形態では、メモリ126は、ランダムアクセスメモリ、ディスクドライブメモリ、フラッシュメモリ等の任意のタイプのメモリであり得る。いくつかの実装形態では、メモリ226は、処理回路120の構成要素に関連付けられた2つ以上のメモリ構成要素(例えば、2つ以上のRAM構成要素またはディスクドライブメモリ)として実装され得る。いくつかの実装形態では、メモリ226はデータベースメモリであり得る。いくつかの実装形態では、メモリ226は、非ローカルメモリであり得るかまたは非ローカルメモリを含み得る。例えば、メモリ226は、複数のデバイス(図示せず)によって共有されるメモリであり得るかまたはそれを含み得る。いくつかの実装形態では、メモリ226は、ネットワーク内のサーバデバイス(図示せず)に関連付けられ得るとともに、処理回路120の構成要素のために機能するように構成され得る。
図2に示すように、メモリ226は、画像データ232および画像較正データ242を含む様々なデータを記憶するように構成される。
【0080】
図3は、画像較正のための補正波面を生成する例示的な方法300を示すフローチャートである。方法300は、処理回路120のメモリ226内に存在するとともに処理ユニットのセット224によって実行される、
図2に関連付けて説明したソフトウェア構成によって実行され得る。
【0081】
302で、画像マネージャ230が複数の画像を表わす画像データ(232)を受信する。複数の画像の各々は、(i)カメラ(例えば、130(2))に対して複数のミラー姿勢のそれぞれのミラー姿勢で保持されるミラーの面内の指定点と、(ii)ディスプレイ(110)の画像を含む虚像ディスプレイ面内の指定点とを示す。
【0082】
304で、較正マネージャ240は、ミラーの面内の指定点および虚像ディスプレイ面内の指定点に基づいて、ディスプレイの基準フレーム内のカメラの位置および向きを決定する。
【0083】
306で、処理回路120は、決定されたカメラの位置および向きに従ってディスプレイ上の画像をユーザに対して提示させる。
【0084】
いくつかの実装形態を説明してきたが、本明細書の精神および範囲から逸脱することなく、様々な変更がなされ得ることが理解されるだろう。
【0085】
また、要素が別の要素上にあるか、別の要素に接続されるか、別の要素に電気的に接続されるか、別の要素に結合されるか、または別の要素に電気的に結合されるものとして言及される場合、当該要素は、他の要素上に直接あり得るか、他の要素に接続され得るかもしくは他の要素に結合され得るか、または、1つ以上の介在要素が存在し得ることも理解されるだろう。対照的に、要素が別の要素上に直接存在するか、別の要素に直接接続されるか、または別の要素に直接結合されるものとして言及される場合、介在要素は存在しない。直接上にあるか、直接接続されるか、または直接結合されるという語句は、詳細な説明全体にわたって使用されない可能性もあるが、直接上にあるか、直接接続されるか、または直接結合されるものとして示される要素をこのように言及することもできる。本願の添付の特許請求の範囲は、本明細書に記載されるかまたは図に示される例示的な関係を列挙するように補正されてもよい。
【0086】
記載した実装形態のいくつかの特徴が本明細書に記載のとおりに例示されているが、当業者には、多くの変形例、置換例、変更例および同等例が想到されるだろう。したがって、添付の特許請求の範囲が、実装形態の範囲内に収まるようにすべてのこのような変形例および変更例を包含するよう意図されていることを理解されたい。これらは、限定ではなく例としてのみ提示されたものであり、形態および詳細が様々に変更され得ることを理解されたい。本明細書に記載の装置および/または方法の任意の部分は、相互排他的組合わせを除いて、任意の組合わせで組合わされてもよい。本明細書に記載の実装形態は、記載される様々な実装形態の機能、構成要素および/または特徴の様々な組合せおよび/または部分的組合せを含み得る。
【0087】
加えて、図に示す論理フローは、望ましい結果を達成するために、図示した特定の順序または連続的順序を必要としない。加えて、他のステップが提供されてもよく、または、説明したフローからステップが排除されてもよく、説明したシステムに他の構成要素が追加されてもよく、または当該システムから排除されてもよい。したがって、他の実装形態は添付の特許請求の範囲内にある。
【手続補正書】
【提出日】2023-12-20
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
方法であって、
複数の画像を表わす画像データを受信するステップを含み、前記複数の画像の各々は、(i)カメラに対して複数のミラー姿勢のそれぞれのミラー姿勢で保持されるミラーの面内の指定点と、(ii)虚像ディスプレイ面内の指定点とを示し、前記虚像ディスプレイ面はディスプレイの画像を含み、前記方法はさらに、
前記ミラーの前記面内の前記指定点および前記虚像ディスプレイ面内の前記指定点に基づいて前記ディスプレイの基準フレーム内の前記カメラの位置および向きを決定するステップと、
前記カメラの前記決定された位置および向きに従って前記ディスプレイ上の画像をユーザに対して提示させるステップとを含む、方法。
【請求項2】
前記ミラーの前記面内の前記指定点は、前記ミラー上に印刷された起点マーカに位置する、請求項1に記載の方法。
【請求項3】
前記起点マーカは、紫外線プリンタを用いて、直接、ミラー上に印刷される、請求項2に記載の方法。
【請求項4】
前記虚像ディスプレイ面内の前記指定点は、前記虚像ディスプレイ面において起点マーカの市松模様パターンに配置される、請求項1に記載の方法。
【請求項5】
前記画像データを受信するステップは、
前記起点マーカの市松模様パターンに対して反転演算を実行して、反転された市松模様パターンを生成するステップを含み、
前記ディスプレイの基準フレーム内の前記カメラの前記位置および前記向きを決定するステップは、
前記反転された市松模様パターンに配置された指定点の位置を記録するステップを含む、請求項4に記載の方法。
【請求項6】
前記ディスプレイの基準フレーム内の前記カメラの前記位置および前記向きを決定するステップは、
前記ミラーの前記面内のカメラ位置を決定するステップを含み、前記ミラーの前記面内の前記カメラ位置は、前記虚像ディスプレイ面における前記市松模様パターンの点の位置に基づく、請求項4に記載の方法。
【請求項7】
前記ミラーの面内の前記カメラ位置は、前記虚像ディスプレイ面における前記市松模様パターンの前記点の前記位置の定数倍であり、前記定数は、前記ミラーの前記面内の前記指定点と、前記虚像ディスプレイ面における前記市松模様パターンの点の位置と、前記ミラーの向きとに基づく、請求項6に記載の方法。
【請求項8】
前記ディスプレイの基準フレーム内の前記カメラの前記位置および前記向きを決定するステップは、
前記ミラーの前記面内の前記ディスプレイの位置および向きを決定するステップを含む、請求項1に記載の方法。
【請求項9】
前記ディスプレイの基準フレーム内の前記カメラの前記位置および前記向きを決定するステップは、
前記複数のミラー姿勢に関して前記ディスプレイの前記基準フレーム内の前記カメラの位置を平均化するステップを含む、請求項1に記載の方法。
【請求項10】
前記複数のミラー姿勢に関して前記ディスプレイの前記基準フレーム内の前記カメラの回転を平均化するステップをさらに含み、前記平均化するステップは、
ミラー姿勢に対応する四元数投影行列を生成するステップと、
前記四元数投影行列の最大固有値に対応する固有関数を計算するステップとを含む、請求項9に記載の方法。
【請求項11】
処理回路によって実行されると前記処理回路に
請求項1~10のいずれか1項に記載の方法を実行させるコードを含む、コンピュータプログラ
ム。
【国際調査報告】