(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-03-24
(54)【発明の名称】遠隔会議装置
(51)【国際特許分類】
H04N 7/15 20060101AFI20220316BHJP
G06T 7/70 20170101ALI20220316BHJP
G06T 7/20 20170101ALI20220316BHJP
G06T 7/00 20170101ALI20220316BHJP
【FI】
H04N7/15
G06T7/70 Z
G06T7/20 300B
G06T7/20 300Z
G06T7/00 350B
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2021543536
(86)(22)【出願日】2020-02-03
(85)【翻訳文提出日】2021-08-26
(86)【国際出願番号】 IL2020050126
(87)【国際公開番号】W WO2020161701
(87)【国際公開日】2020-08-13
(32)【優先日】2019-02-10
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】521330415
【氏名又は名称】マイゼッピ リミテッド.
【氏名又は名称原語表記】MYZEPPI LTD.
【住所又は居所原語表記】51 Haaliya Street 2238716 Nahariyya Israel
(74)【代理人】
【識別番号】100120662
【氏名又は名称】川上 桂子
(74)【代理人】
【識別番号】100216770
【氏名又は名称】三品 明生
(74)【代理人】
【識別番号】100217364
【氏名又は名称】田端 豊
(72)【発明者】
【氏名】ラビー、 エイタン
【テーマコード(参考)】
5C164
5L096
【Fターム(参考)】
5C164FA10
5C164UB81S
5C164VA03P
5C164VA06P
5C164VA07S
5L096AA06
5L096CA04
5L096DA02
5L096FA67
5L096FA69
5L096HA05
5L096JA22
5L096KA04
(57)【要約】
遠隔会議装置であって、推進システム、投影ユニット、遠隔会議装置を取り囲んでいる環境のマッピングを可能にする情報を取得することが可能な少なくとも1つのセンサー、ならびに、少なくとも1つのセンサーから情報を取得し、その取得した情報を使用して、遠隔会議装置を取り囲んでいる環境をマッピングし、遠隔会議装置の少なくとも1人のユーザーのその遠隔会議装置に関する位置および向きを追跡して、その少なくとも1人のユーザーに関して遠隔会議装置の表面の所与の部分の所望の位置および向きを決定し、推進システムを作動させて遠隔会議装置を決定された所望の位置および向きに飛行させ、遠隔装置によって捕捉された画像のストリームを受信し、受信した画像のストリームを表面の所与の部分上に投影するように投影ユニットに指示するように構成された、処理ユニットを含む。
【選択図】
図4
【特許請求の範囲】
【請求項1】
遠隔会議装置であって、
表面を有する前記遠隔会議装置を飛行させるための推進システムであって、前記遠隔会議装置を適所でホバリングさせ、その位置を変えることが可能な推進システムと、
投影ユニットであって、前記投影ユニットに関して固定位置を有する前記表面の少なくとも所与の部分上に画像を投影することが可能な投影ユニットと、
前記遠隔会議装置を取り囲んでいる環境のマッピングを可能にする情報を取得することが可能な少なくとも1つのセンサーと、
処理ユニットであって、
前記少なくとも1つのセンサーから情報を取得することと、
前記取得した情報を使用して、前記遠隔会議装置を取り囲んでいる前記環境をマッピングすることであって、前記環境は前記遠隔会議装置の少なくとも1人のユーザーを含むことと、
前記マッピングされた環境内で、前記遠隔会議装置の少なくとも1人のユーザーの、前記遠隔会議装置に関する位置および向きを追跡することと、
前記少なくとも1人のユーザーの前記追跡された位置と向きおよび1つ以上のセッション関連パラメータに少なくとも基づき、前記少なくとも1人のユーザーに関して前記表面の前記所与の部分の所望の位置および向きを決定することと、
前記推進システムを作動させて、前記表面の前記所与の部分が前記決定された所望の位置および向きに位置付けられていない状態に際して、前記遠隔会議装置を前記決定された所望の位置および向きに飛行させることと、
遠隔装置によって捕捉された画像のストリームを受信することと、
前記受信した画像のストリームを前記表面の前記所与の部分上に投影するように前記投影ユニットに指示することと
を行うように構成された、処理ユニットと
を備える、遠隔会議装置。
【請求項2】
前記セッション関連パラメータは、画像の前記ストリームがそれを通して受信されるネットワーク接続の測定された信号強度または信号品質を含む、請求項1に記載の遠隔会議装置。
【請求項3】
前記処理ユニットは、前記ユーザーによって視聴される前記画像の視聴質を推定するようにさらに構成され、かつ前記セッション関連パラメータは前記推定された視聴質を含む、請求項1に記載の遠隔会議装置。
【請求項4】
少なくとも1つのスピーカーをさらに備え、前記処理ユニットは、
前記遠隔装置によって捕捉された音声のストリームを受信することと、
前記音声を前記少なくとも1つのスピーカーを介して前記少なくとも1人のユーザーに出力することと、
前記ユーザーによって受信された前記音声の音質を推定することと
を行うようにさらに構成され、かつ
前記セッション関連パラメータは前記推定された音質を含む、
請求項1に記載の遠隔会議装置。
【請求項5】
少なくとも1つのマイクロホンをさらに備え、かつ前記処理ユニットは、前記マイクロホンを使用して音声を取得することと、前記取得した音声を分析することにより周囲騒音レベルを判断することとを行うようにさらに構成され、前記セッション関連パラメータは前記判断された周囲騒音レベルを含む、請求項1に記載の遠隔会議装置。
【請求項6】
前記処理ユニットは、(a)光の量および(b)光の方向の少なくとも1つを、前記遠隔会議装置を取り囲んでいる前記環境内のそれぞれ複数の位置において判断するようにさらに構成され、前記セッション関連パラメータは前記判断された光の量または光の方向を含む、請求項1に記載の遠隔会議装置。
【請求項7】
前記遠隔会議装置の空気浮力を引き起こすためのバルーンに取付け可能な機械的連結装置をさらに備え、前記表面は前記バルーンの表面である、請求項1に記載の遠隔会議装置。
【請求項8】
前記推進システムは空気ジェットを含む、請求項7に記載の遠隔会議装置。
【請求項9】
前記ホバリングは前記バルーンによって引き起こされた空気浮力によって得られる、請求項7に記載の遠隔会議装置。
【請求項10】
前記所望の位置および向きは、前記表面の前記所与の部分と前記少なくとも1人のユーザーとの間で遮られない視線が維持されるように決定される、請求項1に記載の遠隔会議装置。
【請求項11】
前記前センサーは少なくとも1つのカメラである、請求項1に記載の遠隔会議装置。
【請求項12】
前記処理ユニットは、前記マッピングされた環境を利用し、かつ使用シナリオ分類器を使用して、前記遠隔会議装置の使用シナリオを分類するようにさらに構成され、前記所望の位置および向きは前記使用シナリオを使用して決定される、請求項1に記載の遠隔会議装置。
【請求項13】
前記使用シナリオ分類器は、前記マッピングされた環境を、複数の事前に分類された使用シナリオの所与の使用シナリオに分類するように構成され、前記事前に分類された使用シナリオの各事前に分類された使用シナリオは、もし前記遠隔会議装置が物理的に存在するユーザーであったなら、前記物理的に存在するユーザーのそれぞれ別個の挙動をシミュレートする、請求項12に記載の遠隔会議装置。
【請求項14】
前記分類器は、前記ユーザーによって実行された活動、前記ユーザーの顔の表情、前記ユーザーの音声量、前記ユーザーの声の表情、前記ユーザーの体動速度における変化、前記ユーザーの体位における変化、または前記ユーザーの身体挙動における変化、の1つ以上に基づいて前記分類を実行する、請求項13に記載の遠隔会議装置。
【請求項15】
前記使用シナリオ分類器は、機械学習分類器である、請求項12に記載の遠隔会議装置。
【請求項16】
遠隔会議装置を操作するための方法であって、
表面を有する前記遠隔会議装置を飛行させるための推進システムであって、前記遠隔会議装置を適所でホバリングさせ、その位置を変えることが可能な推進システムと、
投影ユニットであって、前記投影ユニットに関して固定位置を有する前記表面の少なくとも所与の部分上に画像を投影することが可能な投影ユニットと、
前記遠隔会議装置を取り囲んでいる環境のマッピングを可能にする情報を取得することが可能な少なくとも1つのセンサーと、
処理ユニットであって、
前記遠隔会議装置の少なくとも1つのセンサーから情報を取得することであって、前記センサーは前記遠隔会議装置を取り囲んでいる環境のマッピングを可能にする情報を取得することが可能であることと、
前記取得した情報を使用して、前記遠隔会議装置を取り囲んでいる前記環境をマッピングすることであって、前記環境は前記遠隔会議装置の少なくとも1人のユーザーを含むことと、
前記マッピングされた環境内で、前記遠隔会議装置の少なくとも1人のユーザーの、前記遠隔会議装置に関する位置および向きを追跡することと、
前記少なくとも1人のユーザーの前記追跡された位置と向きおよび1つ以上のセッション関連パラメータに少なくとも基づき、前記少なくとも1人のユーザーに関して前記遠隔会議装置の表面の前記所与の部分の所望の位置および向きを決定することと、
前記遠隔会議装置の推進システムを作動させて、前記表面の前記所与の部分が前記決定された所望の位置および向きに位置付けられていない状態に際して、前記遠隔会議装置を前記決定された所望の位置および向きに飛行させることであって、前記推進システムは前記遠隔会議装置を適所でホバリングさせ、その位置を変えることが可能であることと、
遠隔装置によって捕捉された画像のストリームを受信することと、
投影ユニットに関して固定位置を有する前記表面の少なくとも所与の部分上に画像を投影することが可能な、前記投影ユニットに、前記受信した画像のストリームを前記表面の前記所与の部分上に投影するように指示することと
を行うように構成された、処理ユニットと
を含む、方法。
【請求項17】
前記セッション関連パラメータは、画像の前記ストリームがそれを通して受信されるネットワーク接続の測定された信号強度または信号品質を含む、請求項16に記載の方法。
【請求項18】
前記ユーザーによって視聴される前記画像の視聴質を推定することをさらに含み、前記セッション関連パラメータは前記推定された視聴質を含む、請求項16に記載の方法。
【請求項19】
前記遠隔装置によって捕捉された音声のストリームを受信することと、
前記音声を前記遠隔会議装置の少なくとも1つのスピーカーを介して前記少なくとも1人のユーザーに出力することと、
前記ユーザーによって受信された前記音声の音質を推定することと
をさらに含み、
前記セッション関連パラメータは前記推定された音質を含む、
請求項16に記載の方法。
【請求項20】
前記遠隔会議装置のマイクロホンを使用して音声を取得することと、前記取得した音声を分析することにより周囲騒音レベルを判断することとをさらに含み、前記セッション関連パラメータは前記判断された周囲騒音レベルを含む、請求項16に記載の方法。
【請求項21】
(a)光の量および(b)光の方向の少なくとも1つを、前記遠隔会議装置を取り囲んでいる前記環境内のそれぞれ複数の位置において判断することをさらに含み、前記セッション関連パラメータは前記判断された光の量または光の方向を含む、請求項16に記載の方法。
【請求項22】
前記遠隔会議装置は、前記遠隔会議装置の空気浮力を引き起こすためのバルーンにそれを取り付けることが可能な機械的連結装置をさらに含み、前記表面は前記バルーンの表面である、請求項16に記載の方法。
【請求項23】
前記推進システムは空気ジェットを含む、請求項22に記載の方法。
【請求項24】
前記ホバリングは前記バルーンによって引き起こされた空気浮力によって得られる、請求項22に記載の方法。
【請求項25】
前記所望の位置および向きは、前記表面の前記所与の部分と前記少なくとも1人のユーザーとの間で遮られない視線が維持されるように決定される、請求項16に記載の方法。
【請求項26】
前記前センサーは少なくとも1つのカメラである、請求項16に記載の方法。
【請求項27】
前記マッピングされた環境を利用し、かつ使用シナリオ分類器を使用して、前記遠隔会議装置の使用シナリオを分類することをさらに含み、前記所望の位置および向きは前記使用シナリオを使用して決定される、請求項16に記載の方法。
【請求項28】
前記使用シナリオ分類器は、前記マッピングされた環境を、複数の事前に分類された使用シナリオの所与の使用シナリオに分類するように構成され、前記事前に分類された使用シナリオの各事前に分類された使用シナリオは、もし前記遠隔会議装置が物理的に存在するユーザーであったなら、前記物理的に存在するユーザーのそれぞれ別個の挙動をシミュレートする、請求項27に記載の方法。
【請求項29】
前記分類器は、前記ユーザーによって実行された活動、前記ユーザーの顔の表情、前記ユーザーの音声量、前記ユーザーの声の表情、前記ユーザーの体動速度における変化、前記ユーザーの体位における変化、または前記ユーザーの身体挙動における変化、の1つ以上に基づいて前記分類を実行する、請求項28に記載の方法。
【請求項30】
前記使用シナリオ分類器は、機械学習分類器である、請求項27に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示の主題の例示的な実施形態は、ビデオ通話装置に関し、より詳細には、飛行ビデオ通話装置に関する。
【背景技術】
【0002】
2人以上の人が面と向かって会話をしている場合、彼らは他の人々の位置および向きに応じて特定の位置および向きに自然に移動する。彼らはまた、他の人々の挙動に従い、および様々な環境要因に従っても動く。例えば、2人は、会話のために互いの間に1~2メートルの特定の心地良い距離を選択して、相互に直接対面するであろう。第3の人が会話に加わる場合、彼らは相互の間の直線距離を追加の半メートルだけ増やして、円を作るように自分の向きを変えるであろう。背景雑音がある場合、彼らは相互の間の距離を減らして、音声量を上げるであろう。1人が強い照明で目が見えないような場合、他の人々は自分の位置を変えて光源ベクトルから離れるであろう。1人が座ると、残りの人も自然に座ろうとするであろう。テーブルの上に大きな花瓶がある場合、人々は、相互に間に遮られない視線がもたらされるように座席を選択するであろう。2人が会話をしていて、その間、1人が皿を洗っている場合、第2の人に対する自然な位置は、1メートル半離れた、調理台の横であろう。
【0003】
現在のビデオ通話装置は単に、かかる要因を考慮に入れることができず、それは、ビデオ通話中にユーザーに対してビデオ通話装置の動的位置が不十分な結果となり、そのためユーザーに異なる窮屈な位置および挙動をとることを強いる。
【0004】
それ故、2人以上の人々が、通話中の他の人々の相対位置、人々の挙動および環境要因に従って、人の挙動を模倣することが可能であるような遠隔ビデオ通話を行うことを可能にするために新しい方法およびシステムに対する当技術分野における必要性がある。
【0005】
本開示の主題に対する背景として関連があると考えられる参照文献が以下にリストされる。本明細書における参照文献の承認は、これらは本開示の主題の特許性に何らかの点で関連することを意味すると推測されるべきではない。
【0006】
飛行ディスプレイ装置。2018年2月13日に公開された、米国特許第9,891,885号(Beomshik)はディスプレイ装置を開示し、ディスプレイ装置は、ディスプレイユニット、そのディスプレイユニットに接続された少なくとも1つの飛行体、ディスプレイ装置の現在の位置に関する情報を取得する位置情報受信ユニット、ユーザーの情報を取得するセンサーユニット、ディスプレイ装置の飛行を自動的に制御する飛行制御ユニット、ディスプレイ装置の姿勢情報を取得する姿勢情報取得ユニット、ディスプレイ装置のそれぞれの構成要素の動作全体を制御する主制御ユニット、ディスプレイ装置またはディスプレイユニットの角度を変える姿勢補正ユニット、振動システム、音声認識ユニット、通信モジュール、入力情報を通信モジュールに送信する入力部材、電源ユニット、障害物検知ユニット、少なくとも1つの飛行体とディスプレイユニットを連結する関節マニピュレータ、およびディスプレイユニットとディスプレイ装置を接続するコネクタを含む。
【0007】
バルーンおよびバルーン制御方法。2011年12月1日に公開された、米国特許第20110292348号(Hiroaki)は、エンベロープおよび画像を投影する投影ユニットを含むバルーンを開示し、それは、エンベロープ上の投影ユニットによって投影された画像を表示する第1の表示モードと、エンベロープを通して外部オブジェクト上の投影ユニットによって投影された画像を表示する第2の表示モードとの間で表示モードを切り替える。
【0008】
高耐久性無人飛翔体。2018年2月28日に公開された、WIPO特許第2018122830号(Jayant)は、UAVおよびドローンの全体効率および/もしくは飛行時間は、空気より軽いガスを含んでいる要素を追加することにより、ならびに/またはモーターの任意の組合せに供給される電力の低下および/もしくは除去によって全体の電力消費を低下させることにより、向上できることを開示する。一態様では、飛行船ドローンの構成は、空気より軽いガスで充填された、少なくとも1つの空洞/チャンバ/容器を含む。3Dチャンバは、掃引されたか、または押し出された閉じた2D形状から作られて、ドローンから取外し可能であり、透明か、または色がカモフラージュされている。飛行体の制御および高度を維持するために、揚力面を組み込むことができる。かかる揚力面は、飛行安定性を維持するための能動および/または受動制御面を含み得る。追加として、空洞、裂溝(fissure)、開口部および弁が飛行体の表面に追加されて、他の効率利点を得る。
【0009】
視覚投影を伝達するための移動(ambulatory)システム。米国特許第20150092020号(Vaughn)、2015年4月2日は、視覚投影を伝達するための移動システムを開示する。移動伝達のための装置の一実施形態は:適所でホバリングして、ユーザーに従うことを含み、装置が飛行するのを可能にする推進システム、装置のユーザーまたは装置のユーザー近くの場面の画像を記録するためのステレオカメラ、ステレオカメラによって生成されたビデオデータを、遠隔ユーザーとの通信のためのネットワークを経由して、第2の装置に送信するための送信機、遠隔ユーザーからネットワークを経由してビデオデータを受信するための受信機、および受信したビデオを含む画像をユーザーに対して投影するためのビデオ投影機構を含む。
【0010】
ビデオ会議においてネットワークカメラを動的に選択するためのシステムおよび方法。米国特許第20160227168号(Vendrow)、2016年8月4日は、リアルタイムカメラフィードをビデオ会議に供給するための1つ以上のネットワークカメラを動的に選択するために提供されたシステムおよび方法を開示する。本システムおよび方法は、会議参加者の領域と関連付けられた1つ以上のネットワークカメラを識別することを含み得る。サーバーは、識別されたカメラからのリアルタイムカメラフィードを分析して、その参加者のビューを有するビデオフィードを選択し得る。サーバーは選択されたフィードを、会議ブリッジを経由して、ビデオ会議に提供し、その参加者のより良いビューを有する別のカメラフィードのために、その参加者の領域と関連付けられたカメラのカメラフィードの監視を継続し得る。ネットワークカメラは、その参加者と関連付けられていないが、ビデオ会議での使用のために自分のカメラをサーバーに登録している、個人によって所有されて操作される固定およびモバイルカメラを含み得る。
【0011】
情報処理装置、情報処理方法、および端末装置。米国特許第20180131901号(Tobita)、2018年5月10日は、情報処理装置を開示し、それは、実空間を捕捉するカメラ、遠隔ユーザーによって使用される端末装置と通信する通信ユニット、その情報処理装置自体が、実空間を捕捉する複数の装置の中から遠隔ユーザーによって選択される場合にカメラによって捕捉された第1のビデオを通信ユニットから端末装置にストリーミングするストリーミング制御ユニット、および第1のビデオが端末装置にストリーミングされている間に遠隔ユーザーのユーザー画像を表示するディスプレイを含む。
【0012】
協力(collaboration)のための無人飛翔体。米国特許第20170029098号(Clark)、2017年2月2日は、モバイルテレプレゼンスシステムを開示し、それは、フレーム、そのフレームに動作可能に連結されて、指定された空間を通ってフレームを進める推進システム、フレームに可動に連結された画面、およびフレームに連結された画像出力装置を含み得る。フレームは、フレームの縦軸を画定する中心体、中心体の第1の端部における第1のアーム、および、中心体の第1の端部の反対側の、中心体の第2の端部における第2のアームを含み得る。推進システムは、外部コマンドに応答してフレームを推進する、第1および第2のアームの反対端部におけるローターを含み得る。画像出力装置は外部コマンドに応答して、画像を画面に投影し得る。
【0013】
テレプレゼンス。WIPO特許第2018136072号(Bortolini)、2018年7月26日は、モバイル位置装置、およびモバイル位置装置に対する配向に基づき、第1のユーザーを表す画像を第2のユーザーの周囲環境内で視覚化するためのヘッドマウントディスプレイ組立体を含むテレプレゼンスシステムを含むいくつかの例を開示する。ヘッドマウントディスプレイ組立体は、無線通信システムを経由してビデオ会議装置と通信する。
【0014】
従って、当技術分野において、遠隔ユーザーがローカル環境内に存在し、彼の存在は、面と向かっての会話において受け入れられている文化挙動を忠実に守っているという感覚をローカルユーザーに対して作り出す目的で、ローカルユーザーの位置、向き、挙動および環境要因に従って、とりわけ、その位置および向きを自律的に更新することが可能であるような新規のビデオ通話装置に対するニーズがある。
【発明の概要】
【発明が解決しようとする課題】
【0015】
今まで使用された一般的なビデオ通話システムでは、カメラおよび画面は、固定であって、ラップトップなどの異なる計算システムに接続されているか、または通話中に手で保持する必要があるモバイルスマートフォンの一部であるか、のいずれかである。いくつかのより先進的な事例では、画面およびカメラは、1人のユーザーに従おうと試みるか、または遠隔ユーザーからの制御要求を受け入れる、地上移動ロボットの上部に設置される。これらのソリューションは、遠隔ユーザーが、もし面と向かって会話しているのであれば取り得るのと同じ自然な位置および姿勢にその画面を動的に移動させるのを可能にして、遠隔ユーザーの実際のサイズを表示するには、画面サイズが十分に大きくないので、2人以上の人々の間での面と向かっての会話の実際の経験を真に再現することはできない。
【0016】
相対位置を評価して更新するために、本システムは、人間が会話中に評価し、それら識別に従って動作する、技術的および挙動的態様の両方を評価できることが必要であろう。
【課題を解決するための手段】
【0017】
遠隔会議装置およびビデオ通話飛行ユニット(Video Call Aerial Unit)300という用語は本明細書では区別しないで使用され、投影ユニットおよびプロジェクタ/ディスプレイ710という用語は本明細書では区別しないで使用され、センサーおよびカメラ700という用語は本明細書では区別しないで使用され、機械学習分類器1250および使用シナリオ分類器という用語は本明細書では区別しないで使用されることに留意すべきである。
【0018】
本開示によれば、例えば、任意選択で浮力を提供するガスが充填されたバルーンが、任意選択で、例えば、必要なハードウェアおよびシステムを提供するエレクトロニクスベルトと一緒に組み合わされたシステムが提供され得、そこではバルーンは必要に応じて新しいものと容易に交換され得る。
【0019】
本開示によれば、ビデオ通話用のエンドポイントを、市販されている追加の類似のエンドポイントまたは他のタイプのエンドポイントと共に提供するための、コンピュータ、ネットワーク、カメラ、マイクロホン、スピーカー、および投影ディスプレイが提供され得る。
【0020】
本開示によれば、コンピュータシステムがそのデータリポジトリを分析、比較および更新し、それに応じてその位置および向きを更新するために推進システムに命令を提供するのに必須の入力を提供するために、環境、照明状態をマッピングし、障害物を検出して、ユーザーの身体的および挙動パラメータを追跡するために使用され得る情報を取得するためのセンサーが提供され得る。
【0021】
本開示によれば、システム位置に対する更新が必要であるか、またはスピーカー音量の変更が必要であるかどうかを識別するために、ダイレクト音声コマンドを検出し、ユーザーの会話言葉(conversation word)を検出して、コンピュータシステムがそのデータリポジトリを分析、比較および更新するための、音声センサーが提供され得る。
【0022】
本開示によれば、様々な入力コマンドに従ってユニットがその飛行位置を維持および更新するのを可能にする、制御システム、加速器センサーおよび位置決めセンサーならびに、充電式電池を備えた、空気推進エンジンのセットが提供され得る。
【0023】
本開示によれば、ガス充填バルーンを使用する場合、飛行ユニットが自律的に戻るためのドッキングステーションが提供され得、ドッキングステーションはバルーンと接続して必要に応じてバルーンをガスで補充する。
【0024】
本開示によれば、飛行ユニットが自律的に戻るためのドッキングステーションが提供され得、ドッキングステーションはベルトと接続して必要に応じてベルトの電池を充電する。
【0025】
本開示における技術によれば、ユーザーは、本明細書でさらに詳述されるように、人々が会話中に自分の仲間および環境条件に対して相対的に自身を位置付ける本能的挙動に関して、ユーザーの自然な環境において実際の面と向かっての会話に非常に近い方法でビデオ通話を経験することが可能であり得る。本開示は、ローカルユーザーとの関連でその位置決めに関して人間の挙動を模倣する能力をディスプレイに提供する。
【0026】
本開示の主題の一態様によれば、遠隔会議装置が提供され、本遠隔会議装置は、表面を有する遠隔会議装置を飛行させるための推進システムであって、遠隔会議装置を適所でホバリングさせ、その位置を変えることが可能な推進システム、投影ユニットに関して固定位置を有する表面の少なくとも所与の部分上に画像を投影することが可能な投影ユニット、遠隔会議装置を取り囲んでいる環境のマッピングを可能にする情報を取得することが可能な少なくとも1つのセンサー、ならびに、少なくとも1つのセンサーから情報を取得し、その取得した情報を使用して、遠隔会議装置を取り囲んでいる環境をマッピングし、その環境は遠隔会議装置の少なくとも1人のユーザーを含み、マッピングされた環境内で、遠隔会議装置の少なくとも1人のユーザーの遠隔会議装置に関する位置および向きを追跡して、その少なくとも1人のユーザーの追跡された位置と向きおよび1つ以上のセッション関連パラメータに少なくとも基づき、少なくとも1人のユーザーに関して表面の所与の部分の所望の位置および向きを決定し、推進システムを作動させて、表面の所与の部分が決定された所望の位置および向きに位置付けられていない状態に際して、遠隔会議装置を決定された所望の位置および向きに飛行させて、遠隔装置によって捕捉された画像のストリームを受信し、受信した画像のストリームを表面の所与の部分上に投影するように投影ユニットに指示するように構成された、処理ユニットを含む。
【0027】
いくつかの事例では、セッション関連パラメータは、画像のストリームがそれを通して受信されるネットワーク接続の測定された信号強度または信号品質を含む。
【0028】
いくつかの事例では、処理ユニットは、ユーザーによって視聴される画像の視聴質を推定するようにさらに構成され、セッション関連パラメータは推定された視聴質を含む。
【0029】
いくつかの事例では、遠隔会議装置は少なくとも1つのスピーカーをさらに含み、処理ユニットは、遠隔装置によって捕捉された音声のストリームを受信し、その音声を少なくとも1つのスピーカーを介して少なくとも1人のユーザーに出力し、ユーザーによって受信された音声の音質を推定するようにさらに構成され、セッション関連パラメータは推定された音質を含む。
【0030】
いくつかの事例では、遠隔会議装置は、少なくとも1つのマイクロホンをさらに含み、処理ユニットは、マイクロホンを使用して音声を取得し、取得した音声を分析することにより周囲騒音レベルを判断するようにさらに構成され、セッション関連パラメータは判断された周囲騒音レベルを含む。
【0031】
いくつかの事例では、処理ユニットは、(a)光の量および(b)光の方向の少なくとも1つを、遠隔会議装置を取り囲んでいる環境内のそれぞれ複数の位置において判断するようにさらに構成され、セッション関連パラメータは判断された光の量または光の方向を含む。
【0032】
いくつかの事例では、遠隔会議装置は、遠隔会議装置の空気浮力を引き起こすためのバルーンに取付け可能な機械的連結装置をさらに含み、表面はバルーンの表面である。
【0033】
いくつかの事例では、推進システムは空気ジェットを含む。
【0034】
いくつかの事例では、ホバリングはバルーンによって引き起こされた空気浮力によって得られる。
【0035】
いくつかの事例では、所望の位置および向きは、表面の所与の部分と少なくとも1人のユーザーとの間で遮られない視線が維持されるように、決定される。
【0036】
いくつかの事例では、センサーは少なくとも1つのカメラである。
【0037】
いくつかの事例では、処理ユニットは、マッピングされた環境を利用し使用シナリオ分類器を使用して、遠隔会議装置の使用シナリオを分類するようにさらに構成され、所望の位置および向きは使用シナリオを使用して決定される。
【0038】
いくつかの事例では、使用シナリオ分類器は、マッピングされた環境を、複数の事前に分類された使用シナリオの所与の使用シナリオに分類するように構成され、事前に分類された使用シナリオの各事前に分類された使用シナリオは、もし遠隔会議装置が物理的に存在するユーザーであったなら、その物理的に存在するユーザーのそれぞれ別個の挙動をシミュレートする。
【0039】
いくつかの事例では、分類器は、ユーザーによって実行された活動、ユーザーの顔の表情、ユーザーの音声量、ユーザーの声の表情、ユーザーの体動速度における変化、ユーザーの体位における変化、またはユーザーの身体挙動における変化、の1つ以上に基づいて分類を実行する。
【0040】
いくつかの事例では、使用シナリオ分類器は、機械学習分類器である。
【0041】
本開示の主題の別の態様によれば、遠隔会議装置を操作するための方法が提供され、本方法は、表面を有する遠隔会議装置を飛行させるための推進システムであって、遠隔会議装置を適所でホバリングさせ、その位置を変えることが可能な推進システム、投影ユニットに関して固定位置を有する表面の少なくとも所与の部分上に画像を投影することが可能な投影ユニット、遠隔会議装置を取り囲んでいる環境のマッピングを可能にする情報を取得することが可能な少なくとも1つのセンサー、ならびに、遠隔会議装置の少なくとも1つのセンサーから情報を取得し、センサーは遠隔会議装置を取り囲んでいる環境のマッピングを可能にする情報を取得することが可能であり、その取得した情報を使用して、遠隔会議装置を取り囲んでいる環境をマッピングし、その環境は遠隔会議装置の少なくとも1人のユーザーを含み、マッピングされた環境内で、遠隔会議装置の少なくとも1人のユーザーのその遠隔会議装置に関する位置および向きを追跡して、その少なくとも1人のユーザーの追跡された位置と向きおよび1つ以上のセッション関連パラメータに少なくとも基づき、少なくとも1人のユーザーに関して遠隔会議装置の表面の所与の部分の所望の位置および向きを決定し、遠隔会議装置の推進システムを作動させて、表面の所与の部分が決定された所望の位置および向きに位置付けられていない状態に際して、遠隔会議装置を決定された所望の位置および向きに飛ばし、推進システムは遠隔会議装置を適所でホバリングさせ、その位置を変えることが可能であり、遠隔装置によって捕捉された画像のストリームを受信し、投影ユニットに関して固定位置を有する表面の少なくとも所与の部分上に画像を投影することが可能な、投影ユニットに、受信した画像のストリームを表面の所与の部分上に投影するように指示するように構成された、処理ユニットを含む。
【0042】
いくつかの事例では、セッション関連パラメータは、画像のストリームがそれを通して受信されるネットワーク接続の測定された信号強度または信号品質を含む。
【0043】
いくつかの事例では、本方法は、ユーザーによって視聴される画像の視聴質を推定することをさらに含み、セッション関連パラメータは推定された視聴質を含む。
【0044】
いくつかの事例では、本方法は、遠隔装置によって捕捉された音声のストリームを受信すること、その音声を遠隔会議装置の少なくとも1つのスピーカーを介して少なくとも1人のユーザーに出力すること、ユーザーによって受信された音声の音質を推定することをさらに含み、セッション関連パラメータは推定された音質を含む。
【0045】
いくつかの事例では、本方法は、遠隔会議装置のマイクロホンを使用して音声を取得すること、および取得した音声を分析することにより周囲騒音レベルを判断することをさらに含み、セッション関連パラメータは判断された周囲騒音レベルを含む。
【0046】
いくつかの事例では、本方法は、(a)光の量および(b)光の方向の少なくとも1つを、遠隔会議装置を取り囲んでいる環境内のそれぞれ複数の位置において、判断することをさらに含み、セッション関連パラメータは判断された光の量または光の方向を含む。
【0047】
いくつかの事例では、遠隔会議装置は、遠隔会議装置の空気浮力を引き起こすためのバルーンにそれを取り付けることが可能な機械的連結装置をさらに含み、表面はバルーンの表面である。
【0048】
いくつかの事例では、推進システムは空気ジェットを含む。
【0049】
いくつかの事例では、ホバリングはバルーンによって引き起こされた空気浮力によって得られる。
【0050】
いくつかの事例では、所望の位置および向きは、表面の所与の部分と少なくとも1人のユーザーとの間で遮られない視線が維持されるように、決定される。
【0051】
いくつかの事例では、センサーは少なくとも1つのカメラである。
【0052】
いくつかの事例では、本方法は、マッピングされた環境を利用し使用シナリオ分類器を使用して、遠隔会議装置の使用シナリオを分類することをさらに含み、所望の位置および向きは使用シナリオを使用して決定される。
【0053】
いくつかの事例では、使用シナリオ分類器は、マッピングされた環境を、複数の事前に分類された使用シナリオの所与の使用シナリオに分類するように構成され、事前に分類された使用シナリオの各事前に分類された使用シナリオは、もし遠隔会議装置が物理的に存在するユーザーであったなら、その物理的に存在するユーザーのそれぞれ別個の挙動をシミュレートする。
【0054】
いくつかの事例では、分類器は、ユーザーによって実行された活動、ユーザーの顔の表情、ユーザーの音声量、ユーザーの声の表情、ユーザーの体動速度における変化、ユーザーの体位における変化、またはユーザーの身体挙動における変化、の1つ以上に基づいて分類を実行する。
【0055】
いくつかの事例では、使用シナリオ分類器は、機械学習分類器である。
【図面の簡単な説明】
【0056】
【
図1】バルーンおよびその構成要素に接続可能なベルトを示す説明図である。
【
図2】バルーンおよびその構成要素を示す説明図である。
【
図3】バルーンをベルトに接続し/バルーンをベルトから取り外すための接続機構を示す説明図である。
【
図4】2人の子供の間の位置を要求する提示されたシナリオに従い、システムによって選択された例示的な位置を示す説明図である。
【
図5】2人の子供に向いている一側面上の位置を必要とする提示されたシナリオに従い、システムによって選択された例示的な位置を示す説明図である。
【
図6】提案されたソリューションに必要なシステムモジュールの一例を示すブロック図である。
【
図7】本システムにおけるビデオ通話機能に必要なモジュールの一例を示すブロック図である。
【
図8】本システムにおける自律移動機能に必要なモジュールの一例を示すブロック図である。
【
図9】本システムにおける浮力機能に必要なモジュールの一例を示すブロック図である。
【
図10】本システムにおける身体的および挙動的ユーザー追跡機能に必要なモジュールの一例を示すブロック図である。
【
図11】本システムにおけるドッキングステーション機能に必要なモジュールの一例を示すブロック図である。
【
図12】様々な監視入力に従って位置および向きを維持および更新するためのシステムプロセスの一例を示す流れ図である。
【
図13】1つのエンドポイントからのビデオ通話のためのシステムプロセスの一例を示す流れ図である。
【発明を実施するための形態】
【0057】
以下の詳細な説明では、本開示の主題の完全な理解を提供するために多数の特定の詳細が記載される。しかし、本開示の主題は、これら特定の詳細なしで実施され得ることが当業者によって理解されるであろう。他の事例では、周知の方法、手順、および構成要素は、本開示の主題を曖昧にしないために詳細には説明されていない。
【0058】
図面および記載される説明では、同一の参照番号は、異なる実施形態または構成に共通の構成要素を示す。
【0059】
特に断らない限り、以下の説明から明らかなように、本明細書を通して、「取得する」、「マッピングする」、「追跡する」、「決定する」、「作動させる」、「受信する」、「指示する」、「推定する」、「出力する」、「獲得する」、「分析する」、「分類する」または同様のものなどの用語を利用した説明は、データを操作し、かつ/もしくはデータを他のデータに変換するコンピュータの動作および/またはプロセスを含み、前記データは、例えば、電子量などの物理量として表され、かつ/もしくは前記データは物理的実体として表されることが理解されよう。「コンピュータ」、「プロセッサ」、および「コントローラ」という用語は、データ処理機能を備えた任意の種類の電子装置を含めると広く解釈されるべきであり、非限定的例として、パーソナルデスクトップ/ラップトップコンピュータ、サーバー、コンピューティングシステム、通信装置、スマートフォン、タブレットコンピュータ、スマートテレビ、プロセッサ(例えば、デジタル信号プロセッサ(DSP)、マイクロコントローラ、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)など)、様々なタスクの実行を共有する複数の物理マシンのグループ、単一の物理マシン上に共在する(co-residing)仮想サーバー、任意の他の電子コンピューティング装置、および/またはそれらの任意の組合せを含む。
【0060】
本明細書の教示に従った操作は、所望の目的のために特別に構築されたコンピュータによって、または持続性コンピュータ可読記憶媒体内に格納されたコンピュータプログラムにより所望の目的のために特別に構成された汎用コンピュータによって、実行され得る。「持続性」という用語は本明細書では、一時的な、伝搬信号を除外するが、そうでなければ用途に適した任意の揮発性または不揮発性コンピュータメモリ技術を含むために使用される。
【0061】
本明細書では、「例えば(for example)」、「~など」、「例えば(for instance)」という語句およびそれらの異表記は、本開示の主題の限定されない実施形態を記述する。本明細書での「一事例」、「いくつかの事例」、「他の事例」またはそれらの異表記への言及は、実施形態(複数可)に関連して説明される特定の特徴、構造または特性が本開示の主題の少なくとも1つの実施形態に含まれることを意味する。従って、「一事例」、「いくつかの事例」、「他の事例」またはそれらの異表記の出現は、必ずしも同一の実施形態(複数可)を参照しない。
【0062】
特に断らない限り、明確にするために、別々の実施形態の文脈で説明される、本開示の主題のある特徴は、単一の実施形態内で組み合わせても提供され得ることが理解されよう。逆に、明確にするために、単一の実施形態の文脈で説明される、本開示の主題の様々な特徴は、別々に、または任意の適切な部分的組合せでも提供され得る。
【0063】
本開示の主題の実施形態では、
図12~
図13に示されるものよりも少ない、多い、および/または異なるステージが実行され得る。本開示の主題の実施形態では、
図12~
図13に示される1つ以上のステージは、異なる順序で実行され得、かつ/またはステージの1つ以上のグループが同時に実行され得る。
図1~
図11は、本開示の主題の一実施形態に従ったシステムアーキテクチャの概略図である。
図1~
図11の各モジュールは、本明細書で定義されて説明されるような機能を実行するソフトウェア、ハードウェアおよび/またはファームウェアの任意の組合せで構成できる。
図1~
図11のモジュールは、1つの位置に集中されるか、または2つ以上の位置に分散され得る。本開示の主題の他の実施形態では、本システムは、
図1~
図11に示されるものよりも少ない、多い、および/または異なるモジュールを含み得る。
【0064】
本明細書における方法に対する任意の言及は、変更すべきところは変更して、その方法を実行可能なシステムに適用されるべきであり、変更すべきところは変更して、一旦、コンピュータによって実行されると、その方法の実行となる命令を格納する持続性コンピュータ可読媒体に適用されるべきである。
【0065】
本明細書におけるシステムに対する任意の言及は、変更すべきところは変更して、そのシステムによって実行され得る方法に適用されるべきであり、変更すべきところは変更して、そのシステムによって実行され得る命令を格納する持続性コンピュータ可読媒体に適用されるべきである。
【0066】
本明細書における持続性コンピュータ可読媒体に対する任意の言及は、変更すべきところは変更して、その持続性コンピュータ可読媒体内に格納された命令を実行可能なシステムに適用されるべきであり、変更すべきところは変更して、その持続性コンピュータ可読媒体内に格納された命令を読み取るコンピュータによって実行され得る方法に適用されるべきである。
【0067】
これを念頭に置き、
図1に注目すると、ベルトおよびその構成要素の例を示す説明図が示されている。ベルト100は50グラムよりも軽い可能性があり、任意選択で、任意選択の浮力バルーンに取り付けられるシステムの必要な構成要素を保持する物理的容器として使用され得る。いくつかの事例では、構成要素は、特にベルト以外の他の位置内または位置上、例えば限定されず、バルーン自体上、バルーン内、ドッキングステーション上、室内の壁上、他の電子装置の部分として、装着可能な布上、仮想および/または拡張現実メガネとしてなど、に取り付けられ得る。ベルト100は、ナビゲーション、ビデオ通話、障害物検出、環境マッピングならびにユーザーの身体的および挙動追跡を容易にするために1つ以上のカメラ110を含み得る。ベルト100は、ビデオ通話のために使用され、任意選択でユーザーに対する音声を生成する、1つ以上のスピーカー120も含み得る。ベルト100は、ビデオ通話のため、および周囲音レベルを測定するために使用されるマイクロホン130も含み得る。ベルト100は、任意選択で、空気を特定の方向および速度で推進させてシステムのホバリングおよび移動能力を制御する、空気ジェットまたは他の推進機構140も含み得る。ベルト100は、任意選択で、ビデオ通話のためにディスプレイを投影するために使用されるプロジェクタ150も含み得る。表示方法に対する追加の例は任意選択で、バルーン上もしくはバルーン内に設置されたプロジェクタ、システム全体の外部に設置されたプロジェクタ、バルーンの境界/表面上に設置されたディスプレイまたはその他、であり得る。ベルト100は、任意選択でベルト上の全ての装置およびモジュールに電力を供給する充電式電池160も含み得る。ベルト100は、コンピュータ処理のために必要な電子機器、コントローラおよび無線ネットワークを任意選択で保持する計算およびネットワークモジュール170も含み得る。本明細書で示されるように、いくつかの事例では、カメラ110、スピーカー120、マイクロホン130、プロジェクタ150ならびにベルト100および/または他の構成要素を操作するために使用される任意の処理資源は、ベルト100の外部にでき、ベルト100はそれらと有線/無線接続を経由して通信できることに留意されたい。処理資源(本明細書では処理ユニット(複数可)とも呼ばれる)は任意選択で分散できることにさらに留意されたい。
【0068】
図2は、浮力バルーン200およびその構成要素の一例を示す説明図である。バルーン200は、エネルギーをホバリングで浪費しないようにシステム全体の浮き上がりを提供するために、例えば、ヘリウムなどの、空気よりも軽いガスを保持し得る。バルーン200は、外部プロジェクタ150の真正面に少なくとも一部透明な表面を含み得、そのため投影は任意選択でバルーン200の一面を通り抜けて、任意選択で一部透明な反対面220上に出現して、バルーン200のその外面220上の画像をユーザーが外側から見るのを可能にする。バルーン200は、任意選択で、例えば、ヘリウムなどの、空気よりも軽いガスが注入できる、ガス補充コネクタ230も含み得る。補充コネクタ230は、外部ガス源に直接連結し得るか、またはベルト100上の追加のアダプタを通してその外部ガス源に連結され得る。
【0069】
図3は、ベルト100とバルーン200を、接着剤、ねじ、ボルトまたは他の機構などの任意の追加の接続要素を必要とすることなく、機械的に取り付けるための方法の一例を示す説明図である。バルーン200は、ヒップ形状320を有し得、例えば、そこにベルト100が収まり、そのためベルト100を適所に留めるための力を必要としないであろう。ベルト100をバルーン200と一緒に機械的に取り付けると、本開示の主題の実施形態の一例であるビデオ通話飛行ユニット300が作られ得る。
【0070】
図2&3は、バルーン200およびベルト100に言及するが、本開示の主題は、変更すべきところは変更して、他の飛行/浮力装置(例えば、ドローン)にも適用可能であることに留意されたい。
【0071】
図4は、座っておもちゃで遊びながら互いに向き合っている第1の子供410および第2の子供420が存在している任意選択の場面に従った、ビデオ通話飛行ユニット300(バルーン200およびベルト100、または任意の他の飛行/浮力装置であり得る)の所望の位置および向きに対する一例の説明図である。ビデオ通話飛行ユニット300に対する所望の位置は、この例では、あたかも親が2人の子供と輪になって座っていて、2人の子供の両方に向いているかのようである。
【0072】
図5は、
図4と同じ位置にいる第1の子供410および、向きを変えて第1の子供410と同じ方向を向いている第2の子供420が存在している場面に従った、ビデオ通話飛行ユニット300の好適な位置および向きに対する別の例の説明図である。
【0073】
その例示的な場面では、ビデオ通話飛行ユニット300の所望の位置および向きは、2人の子供と向き合う、飛行ユニット300の右への移動を必要とする。ビデオ通話飛行ユニット300の位置における所望の変更は、本明細書で、とりわけ
図12を参照して、さらに詳述されるように判断できる。
【0074】
この例示的なシナリオでは、第2の子供420の位置における変化は、カメラ700によって捕捉され得、カメラ700は取得した情報をユーザーの位置および向きの追跡1241に渡し得、それは第2の子供420の位置における変化を検出し得、第1の子供410が以前と同じ位置および向きを維持していることも検出し得る。カメラ700は、取得した情報をユーザーの挙動の追跡モジュール1242にも渡し得、それは第2の子供420の顔および/もしくは身体表情または他の挙動指標における変化を検出し得る。検出された変化は機械学習分類器1250に渡され得、それは、任意選択で、ビデオ通話飛行ユニット300がその位置および向きを変更する必要性を決定するために、新しい場面を記録された場面の履歴と比較し得る。決定された場合、機械学習分類器1250は、新しい位置の実行1240を開始し得る、新しい位置の計算1230を開始し得る、位置更新事象1220を初期化し得、新しい位置の実行1240は、推進&浮力コマンド1200にコマンドのセットを送信して、ビデオ通話飛行ユニット300をその新しい所望の位置に物理的に移動させ得る。
【0075】
図6は、提案されたソリューションに必要な装置モジュールの一例を示すブロック図である。ビデオ通話飛行ユニット300は、バルーン200およびベルト100から成り得る。バルーンおよびベルト100は、
図6にリストされる装置モジュールから成り得る。装置モジュールは、物理的に配置されてビデオ通話飛行ユニット300に接続され得るか、または異なる物理的位置上に配置されて有線もしくは無線ネットワークによって接続され得る。
【0076】
ビデオ通話システム600は、2人以上のユーザーの間でビデオ通話を行うために必要なソフトウェアおよびハードウェアを含み得るか、またはそうでなければ、機能性の一部をそれに提供できる他の装置に有線もしくは無線で接続され得る。追加のエンドポイントは、追加の類似のエンドポイント、またはプライベートコンピュータ、携帯電話、タブレットおよび他の例などの、様々な既存のエンドポイントであり得る。推進および位置決めシステム610は、好ましい位置および向きでホバリングするため、ならびに/または他のシステムの入力に従ってその位置および向きを変更するために必要なソフトウェアおよびハードウェアモジュールを含み得る。バルーン100およびベルト200から成るビデオ通話飛行ユニット300を使用する場合、ビデオ通話システム600は、ヘリウムなどの、空気より軽いガスを維持して、ビデオ通話飛行ユニット300の重量平衡を保ち、ホバリングで浪費されるエネルギー消費を減らす責任を負い得る浮力システム620を含み得る。環境および挙動システム650は、任意選択で、より自然な感覚のビデオ通話に対して求められるビデオ通話飛行ユニット300の追加の移動ならびに位置および向きの変更を決定するために、自律移動の目的で環境を検知してマッピングし、同様に、ユーザー移動およびユーザー挙動を検知して追跡する責任を負い得る。
【0077】
ドッキングシステム640は、ビデオ通話飛行ユニット300が作動していない場合にそれを保持して、システムの資源を補充する、例えば、電池を充電し、浮力ガスを補充する、責任を負い得る。
【0078】
サポートシステム630は、追加の計算、メモリ記憶および他の資源が必要とされるが、重量制限などの、様々な理由のためにビデオ通話飛行ユニット300に直接追加できない場合に、必要とされ得る追加のネットワークおよび計算モジュールを提供し得る。サポートシステム630は、例えば、ドッキングシステム640上または計算クラウド内に配置され得る。
【0079】
図7は、本システムにおけるビデオ通話機能に必要であり得るモジュールの一例を示すブロック図である。1つのエンドポイントの1人以上のユーザーのビデオを取得するために1つ以上のカメラ700が必要とされ得る。ビデオは、通信バス770を経由して無線ネットワーク760にストリーミングされ得、ビデオストリームは無線ネットワーク760を通って別のエンドポイントにストリーミングされ得る。プロジェクタ/ディスプレイ710は、他のエンドポイントから受信したビデオストリームを、それらが無線ネットワーク760から受信され得るときに、表示するために使用され得る。マイクロホン720は、1人以上のユーザーからの音声音を受信し、任意選択で、ビデオストリームと同様の方法でそれらをストリーミングするために使用され得る。スピーカー730は、音声が、任意選択で、他のエンドポイントから無線ネットワーク760を通してストリーミングされたときに、その音声をローカルユーザーに伝達するために使用され得る。電池740は、電力を全ての構成要素およびモジュールに、任意選択で、ローカルシステム内の通信および電力バス770を通して供給し得る。ビデオ通話制御モジュール750は、ハードウェアおよびソフトウェアから成り得、例えば、ビデオ通話の調整、エンドポイントと接点の管理、エンドポイントの接続性、可用性の確認、およびビデオ通話ハードウェア構成要素の制御の責任を負い得る。無線ネットワーク760は、必要なネットワークサービスがそれを通して提供され得るローカルモデムまたはルーターにシステムを接続する責任を負い得る。無線ネットワーク760は、様々なRFまたは光媒体(lighting medium)、例えば限定されず、Bluetooth、WIFI、P2Pレーザー、セルラーデータネットワーク、を通して動作できる
【0080】
図8は、本システムにおける自律移動機能に必要であり得るモジュールの一例を示すブロック図である。カメラ700は、ビデオ通話のために使用される同じカメラ700、または任意選択で、追加の専用カメラであり得る。カメラ700は、情報を取得し、任意選択で、画像認識アルゴリズムが、ビデオ通話飛行ユニット300が移動しているかどうかを、それを通して識別できる位置制御モジュールに画像をアップロードするため、および任意選択で、コマンドを推進システム850に送信することにより、位置を補正するために必要な応答を引き出すために、使用され得る。センサー710は、例えば:LIDAR、超音波センサーおよび/もしくはRadarセンサー、または移動および/もしくは環境の監視を可能にする任意の他の装置であり得る。カメラ720と一緒に、センサー710は、壁、家具、ランプおよび他の潜在的な障害物を含む環境を記録し得る。マッピングは、以前にマッピングされた環境と比較されて、データリポジトリ830にアップロードされ得る。推進システム850は、例えば、空気ジェット、プロペラまたは空気圧縮機であるが、それらに限定されない、様々なソリューションに基づき得る。加速度計860も、ビデオ通話飛行ユニット300の移動を監視するため、および任意選択で、それらの測定を追加の補正のために位置制御モジュール810に送信するために、使用され得る。ユーザー追跡モジュール800は、カメラ700から画像を受信し、任意選択で、追跡されるユーザーを識別し、任意選択で、環境および挙動システム650から追加の入力を受信して、任意選択で、所望の位置更新を位置制御モジュール810に送信し得る。慣性航行システム820は、ビデオ通話飛行ユニット300の現在の位置および向きに対する基準点を提供するために使用され得、そのパラメータを位置および制御モジュール810に送信し得る。
【0081】
図9は、バルーン200およびベルト100を使用する場合、本システムにおける浮力機能に必要なモジュールの一例を示すブロック図である。浮力アクチュエータ900は、バルーン200とベルト100との間の力を測定し得る。測定された力における変化は、ガス制御モジュール940に送信され得、それによりガス制御モジュール940は、任意選択で、浮力平衡に達するまでガス量またはガス濃度を変更することができる。量コントローラ910は、任意選択で、バルーン200の表面積を変更することにより、ガス量の物理的増加または減少を可能にし得る。ガス分析器920は、浮力ガスの濃度を測定し得、必要な変更をガス制御モジュール940に送信し、それにより、ガス制御モジュール940は、任意選択で、例えば、ドッキングシステム640上の外部供給源からより高い濃度ガスの補充を要求し得る。圧力アクチュエータ930は、バルーン200内部のガスの圧力レベルを測定し得、ガス制御モジュール940に圧力レベルを送信し、それにより、ガス制御モジュール940は、圧力レベルを、任意選択で、ガスを追加するか、または除去することによって、変更するかどうかを決定し得る。
【0082】
図10は、本システムにおける環境および挙動機能650に必要なモジュールの一例を示すブロック図である。カメラ700、プロジェクタ/ディスプレイ710、マイクロホン720、スピーカー730および他の潜在的センサーを含むが、それらに限定されない、任意選択の入力および出力装置は、他の図で提案された追加の目的のために使用され得、かつまたは、
図10で提案された機能の目的のために別個で専用であり得る。環境および挙動システム650は、追跡、検出、分析および、
図8の位置制御モジュール810などの、他のサブシステムへのコマンド送信に対して責任を負い得る。任意選択で、ビデオ通話飛行ユニット300の位置を更新するために評価され得るセッション関連パラメータに対する例は、照明評価モジュール1000を含み得、照明評価モジュール1000で、例えば、本システムは光量が低い潜在的な位置を検出し、プロジェクタ/ディスプレイ710の輝度を低下させて電池残量を節約できるようにするために、ビデオ通話飛行ユニット300をその位置に移動させ得る。照明評価モジュール1000に対する別の例は、強力な光源が、ローカルユーザーに対してビデオ通話飛行ユニット300と同じ視線にあることを検出し、任意選択で、ビデオ通話飛行ユニット300を、窓から入ってくる太陽光などの特定の方向からの強力な光のベクトルとは異なるベクトルに移動させるためであり得る。ネットワーク評価モジュール1010は、例えば、無線ネットワークの信号強度を監視して、ネットワーク接続強度が、ビデオ通話ストリーミングに影響を及ぼすほど弱い領域を検出するか、または他の態様において、ネットワーク評価モジュール1010は、任意選択で、ネットワーク強度が以前にもっと強いと測定された保存された位置への、位置変更を要求するコマンドを送信し得る。音声評価モジュール1020は、例えば、ローカルユーザーに隣接した背景周囲騒音レベルを取得および監視して、任意選択で、ローカルユーザーに近いビデオ通話飛行ユニット300を移動させるためにコマンドを送信し得、それによりそのユーザーがビデオ通話飛行ユニットのスピーカー730をより良好に聞き、ローカルユーザーの音声を、マイクロホン720を通してより良好に受信することが可能になるようにし得る。別の例は、任意選択で、そのマイクロホン720およびスピーカー730を特定のローカルユーザーの方にフォーカスするか、またはマイクロホン720を、動作中のエアコンなどの、強い音源から引き離すために、音声評価モジュール1020がビデオ通話飛行ユニット300にその向きを変えるように指示するためであり得る。品質評価モジュール1021は、例えば、ビデオ通話の画像および音声品質を監視し、それに応じて位置変更要求を送信し得る。例えば、ローカルユーザーの画像品質が、例えば、カメラ700からの距離もしくは光量または他の理由の結果として低い場合、ビデオ通話飛行ユニット300は、画像品質を改善するためにローカルユーザーにもっと接近するか、またはローカルユーザーに対するその相対位置を変更する必要があり得る。追加の例として、ローカルユーザーによって受信された推定された音声品質が容認可能な閾値を下回っている場合、ビデオ通話飛行ユニット300は、その位置および向きを変更してスピーカーの方向を改善し、ローカルユーザーにもっと近接し、かつ/または任意選択で、音声音レベルを上げ得る。顔面/身体評価モジュール1030は、任意選択で、ビデオ通話飛行ユニット300の位置および向きの変更の必要性を示し得る表情を検出するために、例えば、ローカルまたは遠隔ユーザーの顔の表情を監視し得る。例えば、ユーザーが、プロジェクタ/ディスプレイ710上に何があるかを見ようと努力して目を細めている場合、顔面/身体評価モジュール1030は、ビデオ通話飛行ユニット300に対してそのユーザーにもっと近づく要求を送信し得るか、または遠隔ユーザーが目を細めている場合には、ローカルのビデオ通話飛行ユニット300に対して、任意選択で、ローカルユーザーのサイズを大きくするために、ローカルユーザーにもっと近づくように要求し得る。追加の例では、ビデオ通話飛行ユニット300からの音声を聞こうとしている時に自分の頭の向きをわずかに変えているユーザーは、手を上げて自分の耳のそばに当てている可能性があり、顔面/身体評価モジュール1030は、その表情をより良く聞こうとする試みと識別し得、ビデオ通話飛行ユニット300の位置を変更するか、またはスピーカー音量を上げるコマンドを送信し得る。追加の例は、顔および手のジェスチャから、ビデオ通話飛行ユニット300がユーザーに近接して位置付けられ得るかを識別することであり得る。自然な会話では、人々は略半メートルの最小限のプライベートスペースに慣れている可能性があるが、その距離は人によって、文化によって、および、部屋の大きさ、室内で利用可能なオープンスペース、背景雑音、障害物などであるが、それらに限定されない、他の環境要因に従って、異なり得る。顔面/身体評価モジュール1030は、ローカルユーザーの頭が後ろに傾いている、手を組んでいる、または不快感の他の顔のジェスチャの場合、ローカルユーザーは心地良くないことを検出し得る。ビデオ通話飛行ユニット300の位置および向きにおける変更を必要とし得るこれらおよび他の任意選択のシナリオの検出は、任意選択で、テキスト評価モジュール1040を通してユーザーが言った言葉の分析結果でもあり得る。例えば、ユーザーが繰り返して「何」と尋ねている場合、テキスト評価モジュール1040はその入力を、ビデオ通話飛行ユニット300に対する、もっと近づき、かつ/またはその音量を上げるための要求として翻訳し得る。テキスト評価モジュール1040は、例えば、「もっと近づいて」、「後ろに下がって」、「通話終了」、「向きを変えて」、「ジョンを見つけて」などと解釈される動作を要求している異なるユーザーからの直接の言葉による指示も検出し得る。相対性評価モジュール1050は、例えば、会話内に2人以上のローカルユーザーがいることを検出して、実在の人が選ぶような位置と向きを模倣するために、ビデオ通話飛行ユニット300に新しい位置と向きに移動するように要求し得る。
図4から
図5への動きの変化は、かかる位置および向きに対する多くの例の1つであり得る。環境評価モジュール1060は、例えば、部屋のレイアウト、壁、床、天井、ドア、階段、窓、家具、照明および任意選択で、ビデオ通話飛行ユニット300の移動、潜在的な移動、位置、向きまたは任意の他の要因に影響を及ぼし得る任意の他の物体の位置を検出し得る。環境評価モジュール1060は、所望の位置および向きが、カメラがローカルユーザーを明瞭に捕捉するため、ならびにローカルユーザーがビデオ通話飛行ユニット300上のディスプレイ表面全体をはっきりと見るために、遮られない視線を維持していることも検証し得る。
図10中の異なるモジュールからの異なる要求は、位置制御モジュール810に送信され得、位置制御モジュール810は、任意選択で、様々な入力を、ビデオ通話飛行ユニット300の位置および向きの変更に関する最終決定に統合するために、他のモジュールに対する追加の入力を追加し得る。
図10中の異なるモジュールは、任意選択で、例えば、検出、分析、計算または任意の他のタイプの必要な分析を行うために、特定のアルゴリズムまたは機械学習ベースのアルゴリズムを使用し得る。データリポジトリ830は、異なるモジュール、モジュールのアルゴリズム、機械学習アルゴリズムまたは本システムの任意の他の任意選択の構成要素に対して必要な様々な参照データを格納、編集と更新および取得するために使用され得る。
【0083】
図11は、本システムにおけるドッキングシステム機能に必要なモジュールの一例を示すブロック図である。ビーコンモジュール1100は、例えば、任意選択で、ビデオ通話飛行ユニット300が位置決めしてドッキングシステム640に戻るのを支援するために、ビデオ通話飛行ユニット300上のセンサーの1つによって検出されるRF信号を送信し得る。ガス補充コネクタ1110は、例えば、バルーン補充コネクタ230を通してバルーン200に接続し、任意選択でガス補充制御モジュール1140によって指示される通りに、任意選択で、バルーン200を浮力ガスで補充し得る。充電コネクタ1120は、例えば、電池160に接続して、任意選択で充電制御モジュール1150によって指示される通りに、任意選択で、電池を充電し得る。電力アダプタ1130は、例えば、外部の壁コンセントに接続して、任意選択で、電力をドッキングシステムおよびそのモジュールに供給し得る。二次計算モジュール1160は、例えば、追加の計算能力が必要な事例において、ビデオ通話飛行ユニット300上の計算モジュール170を任意選択でサポート、または置換するために追加の計算、記憶、メモリおよび他の構成要素を含み得る。クラウド計算モジュール1170は、任意選択で既存のクラウド計算システムを利用するように二次計算モジュール1160を拡張して、追加の計算、記憶、メモリおよび他の構成要素がビデオ通話飛行ユニット300上の計算モジュール170を任意選択でサポートし得る。無線&物理ネットワーク1180は、例えば、ビデオ通話飛行ユニット300がドッキングシステムに物理的に接続されていない場合、任意選択で無線ネットワーク760に接続することにより、ビデオ通話飛行ユニット300へのネットワーク接続を提供し得る。無線および物理ネットワーク1180は、例えば、クラウドサービス、他のビデオ通話エンドポイントへの接続、第3者ソフトウェアへの接続などであるが、それらに限定されない、様々な機能性のために、任意選択で物理ケーブルを通して、または任意選択で追加の無線コネクタを通して、ローカルモデムもしくはルーターまたは遠隔セルラーデータネットワークにも接続し得る。無線&物理ネットワーク1180は、ドッキングシステム640に対するローカルネットワークアダプタとして、またはビデオ通話飛行ユニット300に対するネットワークブリッジとして、またはその両方として、機能し得る。二次データリポジトリ1190は、追加の資源が必要な場合に備えてビデオ通話飛行ユニット300上のデータリポジトリ830に対する拡張として機能し得るか、または任意選択でそれを置換して、ビデオ通話飛行ユニット300がそれを搭載しないようにできる。
【0084】
図12は、様々な監視入力に従い、かつ様々な保存および学習されたシナリオに従って、ホバリング、位置および向きの維持および更新のためのシステムプロセスの一例を示す流れ図である。処理ユニット1270は、リポジトリのアクセス1260を通してリポジトリ830とやり取りし、推進および浮力コマンド1200を通して制御コマンドを送信している間に必要な様々な処理操作を行い得る。詳細な流れの例は、ビデオ通話飛行ユニット300の所望の位置および向きが達成されている場合に生じる。ホバリング位置および向き1210は、例えば、任意選択で、突風が本システムを押した場合に、同じ位置を継続して維持するために、推進システム850にコマンドを送信し得る。追跡装置および監視装置例1241、1242、1243、1245は、様々なセンサーを使用して現在のセッション関連パラメータ、および任意選択でそのパラメータにおける変化を取得して、そのパラメータを、所望の位置更新事象1220を開始するかどうかを決定し得る機械学習分類器1250に送信し得る。
【0085】
ユーザーの位置および向きの追跡1241は、1つまたは複数のユーザーの位置、向きおよび動きを、ビデオ通話飛行ユニット300に関して、相互もしくは任意の他の参照点/物体に関して、例えば限定されず、ユーザーは室内のどこに位置しているか、ユーザーは座っているか、もしくは立っているか、ユーザーはどの方向を向いているか、ユーザーある方向に歩いているか、ローカルユーザーは別のローカルユーザーとも話しているかなど、を追跡し得る。ユーザーの位置および向きの追跡1241は、ユーザー追跡モジュール800および/または相対性評価モジュール1050を使用し得る。
【0086】
ユーザーの挙動の追跡1242は、1人または複数のユーザーの顔および身体のジェスチャ、例えば限定されず、目を細める、顔を横に向ける、立っている間に腕を組む、微笑む、眉をひそめる、ひるむ、首を横に振るなど、を追跡し得る。ユーザーの挙動の追跡1242は、顔面/身体評価モジュール1030を使用し得る。
【0087】
音声コマンドの監視1243は、音声入力を監視し、1人以上のユーザーによる言葉を識別して、任意選択で、音声を分析可能なテキストに変換し:もっと近づいて、後ろに下がって、通話終了、おばあちゃんに電話して、音量を上げて、電話に出て、聞こえます、何という発言の繰返しなどであるが、それらに限定されない、潜在的な言葉による指示を識別し得る。音声コマンドの監視1243は、テキスト評価モジュール1040を使用し得る。
【0088】
音声コマンドの監視1243は、ユーザーの声の表情も監視し得、機械学習プロセス1250に、声の表情のタイプが、ビデオ通話飛行ユニット300の所望の位置および向きにおける変化に対する指標であり得るかどうかを分類するように要求し得る。例えば、ユーザーが立腹している可能性があると識別すると、そのため、そのユーザーに対する距離を増やす。
【0089】
環境の監視およびマッピング1244は、ユーザーまたは複数のユーザーが存在し得る場所の周辺領域を監視し得、本システム内の既にマッピングされた領域からの変化または違いをチェックし得る。例えば、椅子が移動されている、ドアが閉まっている、新しいタンスが導入されている、新しい部屋で初めて、窓が開いている、などであるが、それらに限定されない。環境の監視およびマッピング1244は、環境評価モジュール1060、照明評価モジュール1000、ネットワーク評価モジュール1010、音声評価モジュール1020および/または品質評価モジュール1021を使用し得る。機械学習プロセス1250は、機械学習または他のアルゴリズムサービスも追跡装置および監視装置例1241、1242、1243、1244、1245に提供して、各分類フォーカスにおける変化を識別するのを支援し得る。アルゴリズムに対する方法例は、異なるセンサーから作成された3Dマップを構築および保持し、現在のマップを既存の3Dマップと比較して、潜在的な変化を識別することであろう。各監視装置は、3Dマップの特定の態様にフォーカスし得る。現在のマップがどの格納されたマップと最も類似しているかを比較し、従って、新しいシナリオを定義するために、潜在的な変化も、データリポジトリ830内に分類されて格納された様々な3Dマップと比較され得る。機械学習プロセス1250は、3Dマップの集合を完全なシナリオ、例えば、2人が互いの前のテーブルの周りに座って話をしている、または2人の子供が互いの前におもちゃを置いて床に座って遊んでいる、または1人が話をしながら皿を洗っている、などに処理し得る。これらの事前に分類された場面の各々に対して、機械学習プロセス1250は、ビデオ通話飛行ユニット300に対する所望の位置および向きを有し得る。
【0090】
機械学習分類器1250は、任意選択で、さらに分類された情報を収集するため、またはリポジトリ1260を更新するために、リポジトリ1260にアクセスし得る。リポジトリ1260の更新は、新しいシナリオの識別または既存のシナリオに対する変化の識別または他の理由の結果として生じ得る。一旦、機械学習分類器1250が新しい所望の位置および向きが要求されることを識別すると、それは位置更新事象を開始し得、本システムは、任意選択で、追跡装置、監視装置およびリポジトリのアクセス1260からの様々な入力に従い、かつ、任意選択で、機械学習分類器1250プロセスを使用して、新しい位置の計算1230を行い得る。計算結果は次いで、新しい位置の実行1240に渡され得、新しい位置の実行1240は、要求された新しい位置、向きおよび経路を、推進システム850に対する任意選択のコマンドに翻訳し、それに応じて推進システム850がそれらを実行し得る。
【0091】
遠隔コマンドの監視1245は、ビデオ通話中であり得るか、またはビデオ通話に対してサポートおよびサービスを提供している可能性がある、遠隔ユーザーもしくは複数のユーザーによって送信された様々なコマンドを監視し得る。これらのコマンドは、例えば限定されず、遠隔音声コマンド、遠隔モバイルアプリケーション、遠隔デスクトップアプリケーション、人工知能コマンド他、から到着し得る。遠隔コマンドの監視1245は、様々な外部コマンドを受信するために無線ネットワーク760を使用し得る。
【0092】
ビデオ通話飛行ユニット300を新しい所望の位置および向きに導き得る遠隔コマンドは、リポジトリのアクセス1260を通してデータリポジトリ830に分類および保存される新しいシナリオを更新および作成するためにも使用され得る。
【0093】
図13は、1つのエンドポイントからのビデオ通話のためのシステムプロセスの一例を示す流れ図である。ローカルユーザーは、ビデオの表示1340を通して遠隔ユーザーのプロジェクタ/ディスプレイ710上のビデオを視聴し得る。そのローカルユーザーは、スピーカー730で生成された音声の出力1330を通して遠隔ユーザーからの音声も聞き得る。
【0094】
これらの出力例は、マイクロホン720を使用する音声の受信1300およびビデオの受信1310を通して収集されて、カメラ700を通して記録され得、それらは次いで無線または有線ネットワークを経由してストリーミング1320され得る。本システムは、双方向に動作して、世界中の様々な位置を含む、遠距離にわたるローカルおよび遠隔の、2人のユーザー間での面と向かったビデオ通話を可能にし得る。
【国際調査報告】