特許第6456286号(P6456286)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ アルカテル−ルーセントの特許一覧

特許6456286ビデオ会議中の参加者の映像ミュートを可能にするための方法および装置
<>
  • 特許6456286-ビデオ会議中の参加者の映像ミュートを可能にするための方法および装置 図000002
  • 特許6456286-ビデオ会議中の参加者の映像ミュートを可能にするための方法および装置 図000003
  • 特許6456286-ビデオ会議中の参加者の映像ミュートを可能にするための方法および装置 図000004
  • 特許6456286-ビデオ会議中の参加者の映像ミュートを可能にするための方法および装置 図000005
  • 特許6456286-ビデオ会議中の参加者の映像ミュートを可能にするための方法および装置 図000006
  • 特許6456286-ビデオ会議中の参加者の映像ミュートを可能にするための方法および装置 図000007
  • 特許6456286-ビデオ会議中の参加者の映像ミュートを可能にするための方法および装置 図000008
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6456286
(24)【登録日】2018年12月28日
(45)【発行日】2019年1月23日
(54)【発明の名称】ビデオ会議中の参加者の映像ミュートを可能にするための方法および装置
(51)【国際特許分類】
   H04N 21/4402 20110101AFI20190110BHJP
【FI】
   H04N21/4402
【請求項の数】13
【全頁数】14
(21)【出願番号】特願2015-524764(P2015-524764)
(86)(22)【出願日】2013年7月30日
(65)【公表番号】特表2015-531197(P2015-531197A)
(43)【公表日】2015年10月29日
(86)【国際出願番号】EP2013065999
(87)【国際公開番号】WO2014020022
(87)【国際公開日】20140206
【審査請求日】2015年3月30日
【審判番号】不服2017-9519(P2017-9519/J1)
【審判請求日】2017年6月29日
(31)【優先権主張番号】12305965.1
(32)【優先日】2012年8月3日
(33)【優先権主張国】EP
(73)【特許権者】
【識別番号】391030332
【氏名又は名称】アルカテル−ルーセント
(74)【代理人】
【識別番号】110001173
【氏名又は名称】特許業務法人川口國際特許事務所
(72)【発明者】
【氏名】リーベンス,サミー
(72)【発明者】
【氏名】ティトガット,ドニー
(72)【発明者】
【氏名】アーツ,マールテン
(72)【発明者】
【氏名】ナンブーディリ,ビナイ
(72)【発明者】
【氏名】シックス,エルウィン
【合議体】
【審判長】 鳥居 稔
【審判官】 小池 正彦
【審判官】 樫本 剛
(56)【参考文献】
【文献】 特表2010−541398(JP,A)
【文献】 特開平7−222129(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N21/00-21/858
(57)【特許請求の範囲】
【請求項1】
ビデオ会議の場所(ルーム1)における参加者の存在を隠すように、前記ビデオ会議中の前記場所におけるカメラによって記録されるビデオデータ(ビデオルーム1)を適合させるための方法であって、前記場所(ルーム1)における前記ビデオ会議の任意の参加者によって、場合によって行われることになる既定のジェスチャを登録するステップと、前記ジェスチャを検出し、それについて検出すると、前記場所(ルーム1)において前記ジェスチャを行った少なくとも一人の参加者を識別し、前記ジェスチャを行った前記少なくとも一人の参加者に関するデータを前記ビデオデータから削除するように、前記ビデオデータを適合させ、それにより、他の場所(ルーム2、…、ルームn)における前記ビデオ会議の他の参加者に送信されるための、適合させたビデオデータ(ビデオaルーム1)を生成するステップとを含む、方法。
【請求項2】
前記既定のジェスチャ(G1)が、前記ビデオデータ(ビデオルーム1)を分析することによって検出される、請求項1に記載の方法。
【請求項3】
前記既定のジェスチャが、その上で前記既定のジェスチャが前記少なくとも一人の参加者によって行われる物体(O11、O1m)からの、および物体(O11、O1m)によって送信される、トリガ検出(G11、G1m)信号を受信することを用いて検出される、請求項1に記載の方法。
【請求項4】
前記場所(ルーム1)において前記ジェスチャを行った前記少なくとも一人の参加者の識別が、前記場所における前記ビデオ会議の前記ビデオデータ(ビデオルーム1)を分析することによって行われる、請求項1から3のいずれか一項に記載の方法。
【請求項5】
前記場所(ルーム1)において前記ジェスチャを行った前記少なくとも一人の参加者の識別が、前記物体(O11、O1m)からの前記トリガ検出信号を分析することによって行われる、請求項3に記載の方法。
【請求項6】
ビデオ会議中の場所(ルーム1)におけるカメラ(cam1)によって記録されるビデオデータ(ビデオルーム1)を適合させるためのビデオ分析および適合デバイス(VAAS)であって、前記ビデオデータ(ビデオルーム1)を受信し、既定のジェスチャを行った前記場所における前記ビデオ会議の少なくとも一人の参加者を検出するために前記ビデオデータ(ビデオルーム1)を分析し、前記既定のジェスチャを行った前記少なくとも一人の参加者を検出すると、前記少なくとも一人の参加者に関するビデオデータを前記ビデオデータから削除するように、前記ビデオデータ(ビデオルーム1)を適合させ、それにより、適合させたビデオデータ(ビデオaルーム1)を生成するステップを行い、前記適合させたビデオデータ(ビデオaルーム1)を前記ビデオ適合デバイスの出力に提供するように適合された、ビデオ分析および適合デバイス(VAAS)。
【請求項7】
前記既定のジェスチャの存在を示すトリガ信号を受信し、前記トリガ信号を受信すると、前記既定のジェスチャを行った前記少なくとも一人の参加者の検出を開始するようにさらに適合された、請求項6に記載のビデオ分析および適合デバイス(VAAS)。
【請求項8】
前記既定のジェスチャ(G1)を検出するために前記ビデオデータ(ビデオルーム1)を分析し、前記既定のジェスチャを検出すると、前記既定のジェスチャを行う前記少なくとも一人の参加者の検出を開始するようにさらに適合された、請求項6に記載のビデオ分析および適合デバイス(VAAS)。
【請求項9】
場所(ルーム1)におけるビデオ会議を記録するカメラ(cam1)からビデオデータ(ビデオルーム1)を受信するように適合されたビデオ会議クライアント(VCC1)であって、前記ビデオ会議クライアント(VCC1)が、請求項6から8のいずれか一項に記載のビデオ分析および適合デバイス(VAAS)をさらに含み、前記ビデオ会議クライアント(VCC1)が、少なくとも1つの他の場所(ルーム2;ルームn)における前記ビデオ会議の他の参加者にサービス提供する少なくとも1つの他のビデオ会議クライアント(VCC2;VCCn)に向けて、適合させたビデオデータ(ビデオaルーム1)を送信するようにさらに適合されていることを特徴とする、ビデオ会議クライアント(VCC1)。
【請求項10】
前記既定のジェスチャに関するユーザ情報を受信し、格納するように適合された登録手段(GR1)をさらに含む、請求項9に記載のビデオ会議クライアント(VCC1)。
【請求項11】
その上で前記既定のジェスチャが前記少なくとも一人の参加者によって行われる物体(O11、O1m)からの、および物体(O11、O1m)によって送信される、トリガ検出(G11、G1m)信号を受信するようにさらに適合された、請求項9または10に記載のビデオ会議クライアント(VCC1)。
【請求項12】
請求項6から8のいずれか一項に記載のビデオ適合デバイスを含むことを特徴とする、ビデオ会議サーバ。
【請求項13】
データ処理装置上で実行されるとき、前記データ処理装置に請求項1から5のいずれか一項に記載の方法ステップを実行させるためのコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ビデオ会議に参加するユーザが、ビデオ会議システムの他のリモートユーザに見えるようになるか否かを制御することについて可能にするための、方法および装置に関する。これは、これらのユーザに、ユーザ自身を「映像ミュート(visual mute)」の状態にする可能性を提供することに関する。
【背景技術】
【0002】
この問題を解決するための簡単なソリューションは、単にそのルームを去ることである。しかし、ユーザは、積極的に会合に参加しないまでも、受身的に会合について行くことをなお望むことがあるので、これは常に適当とは限らない。
【0003】
別のソリューションは、人である全体的な会合先導者が、ビデオ会議通話の特定の参加者ごとに、映像状態を手動で制御することである。しかしながら、これもまた、多くの参加者が出席している、またはシステムへの多くのミュート(ミュート解除)要求がなされる場合には、実現可能なソリューションではない。
【発明の概要】
【発明が解決しようとする課題】
【0004】
したがって、本発明の実施形態の目的は、知られているタイプでありながら、上述された欠点を示さない方法を提示することである。
【課題を解決するための手段】
【0005】
本発明の実施形態によれば、この目的は、ビデオ会議の場所における参加者の存在を隠すようになど、前記ビデオ会議中の前記場所におけるカメラによって記録されるビデオデータを適合させるための方法によって達成され、前記方法は、前記場所における前記ビデオ会議の任意の参加者によって、場合によって行われることになる既定のジェスチャを登録するステップと、前記ジェスチャを検出するステップと、それについて検出すると、前記場所において前記ジェスチャを行った少なくとも一人の参加者を識別するステップと、前記ジェスチャを行った前記少なくとも一人の参加者に関するデータを前記ビデオデータから削除するようになど、前記ビデオデータを適合させるステップと、それにより、他の場所における前記ビデオ会議の他の参加者に送信されるための、適合させたビデオデータを生成するステップとを含む。
【0006】
このようにして、あらかじめ登録された既定のジェスチャを行う参加者を検出すると、この参加者の映像ミューティングを可能にする、自動化された、簡単なソリューションが提供される。
【0007】
一変形例において、前記既定のジェスチャは、前記ビデオデータを分析することによって検出される。
【0008】
この変形例において、ジェスチャ認識は、ビデオデータそれ自体の画像認識、その他などの、ビデオ分析技法を介して行われ得る。
【0009】
別の変形例において、前記既定のジェスチャは、その上で前記既定のジェスチャが前記少なくとも一人の参加者によって行われる物体からの、および物体によって送信される、トリガ検出信号を受信することを用いて検出される。
【0010】
この変形例は、たとえば、会議場所に存在する物体からの信号を受信することによって、代替的なやり方でジェスチャを検出することを可能にし、そのような物体は、一般に、ビデオ会議クライアントと通信し、参加者によって行われているジェスチャを示す信号を送信するように適合されている。そのような信号を受信すると、このジェスチャを行った会議参加者を認識するために、ビデオデータはさらに分析されてよい。あるいは、他の実施形態において、トリガ検出信号それ自体が既に、ジェスチャを行った参加者に関する情報を含むことができ、その結果、前記場所において前記ジェスチャを行った前記少なくとも一人の参加者の識別が、前記物体からの前記トリガ検出信号を分析することによって行われる。
【0011】
一実施形態において、ビデオデータは、前記少なくとも一人の参加者に関係するビデオデータを、背景ビデオデータに差し替えることによって、適合されてよい。
【0012】
これは、参加者の映像ミューティングのための簡単なやり方を提示する。
【0013】
本発明は加えて、ビデオ会議中の場所におけるカメラによって記録されるビデオデータを適合させるためのビデオ分析および適合デバイスの実施形態に関し、前記ビデオ分析および適合デバイスは、前記ビデオデータを受信し、既定のジェスチャを行った前記場所における前記ビデオ会議の少なくとも一人の参加者を検出するために前記ビデオデータを分析し、前記既定のジェスチャを行った前記少なくとも一人の参加者を検出すると、前記少なくとも一人の参加者に関するデータを前記ビデオデータから削除するようになど、前記ビデオデータを適合させるステップを行い、それにより、適合させたビデオデータを生成して、前記適合させたビデオデータを前記ビデオ適合デバイスの出力に提供するように適合されている。
【0014】
一変形例において、ビデオ適合デバイスは、前記少なくとも一人の参加者に関係するビデオデータを、背景ビデオデータに差し替えることによって、前記ビデオデータを適合させることできる。
【0015】
別の変形例において、ビデオ分析および適合デバイスは、前記既定のジェスチャの存在を示すトリガ信号を受信し、前記トリガ信号を受信すると、前記既定のジェスチャを行った前記少なくとも一人の参加者の検出を開始するようにさらに適合されている。
【0016】
別の実施形態において、ビデオ分析および適合デバイスは、前記既定のジェスチャを検出するために前記ビデオデータを分析し、前記既定のジェスチャを検出すると、前記既定のジェスチャを行う前記少なくとも一人の参加者の検出を開始するようにさらに適合されている。
【0017】
本発明は加えて、場所におけるビデオ会議を記録するカメラからビデオデータを受信するように適合されたビデオ会議クライアントの実施形態に関し、前記ビデオ会議クライアントは、請求項6から8のいずれか一項に記載のビデオ分析および適合デバイスをさらに含み、前記ビデオ会議クライアントは、少なくとも1つの他の場所における前記ビデオ会議の他の参加者にサービス提供する少なくとも1つの他のビデオ会議クライアントに向けて、適合させたビデオデータを送信するようにさらに適合されていることを特徴とする。
【0018】
一実施形態において、ビデオ会議クライアントは、前記既定のジェスチャに関するユーザ情報を受信し、格納するように適合された登録手段をさらに含む。
【0019】
一変形例において、前記ユーザ情報は、物体の上で人によって行われるジェスチャ情報を含む。
【0020】
別の実施形態において、ビデオ会議クライアントは、その上で前記既定のジェスチャが前記少なくとも一人の参加者によって行われる物体からの、および物体によって送信される、トリガ検出信号を受信するようにさらに適合されている。
【0021】
これらの変形例において、ビデオ会議クライアントは、前記既定のジェスチャを検出し、認識するようになど、そのような物体と通信するように適合されている。
【0022】
本発明は加えて、場所におけるビデオ会議の少なくとも一人の参加者によって行われる既定のジェスチャを検出するように適合された物体の実施形態に関し、前記物体は、前記既定のジェスチャを検出すると、トリガ検出信号を生成し、前記トリガ検出信号を前記場所におけるビデオ会議クライアントに提供するようにさらに適合されている。
【0023】
一実施形態において、物体は、前記既定のジェスチャに関する登録要求を生成し、前記ビデオ会議クライアントに送信するようにさらに適合されている。
【0024】
さらに他の実施形態において、前記物体は、ポータブル通信デバイスであり、その結果、前記ビデオ会議クライアントは、ビデオ会議の時間中に前記ポータブル通信デバイスを取り扱う前記ビデオ会議の参加者によって、場合によって行われる前記既定のジェスチャに関する前記ユーザ情報を提供するための登録要求を、前記ポータブル通信デバイスから受信することができる。
【0025】
いくつかの変形例において、物体は、通信ユニット、および動き検出器またはタッチセンサを含む。
【0026】
一実施形態において、前記物体は、モバイル電話機、ゲームコンソール、タブレットコンピュータ、ラップトップ、その他などのポータブル通信デバイスであってよい。
【0027】
あるいは、任意の有形の日用品的な物体、たとえば、トースター、コーヒーマシン・・・で、小型の通信ユニットおよびタッチセンサが装備されたものが、会合ルームなどのそのような場所で使用されてもよい。
【0028】
本発明は加えて、先の請求項6から8のいずれか一項に記載のビデオ分析および適合デバイスを含むビデオ会議サーバの実施形態に関する。
【0029】
ビデオ会議サーバは、これらのそれぞれの場所における会議参加者のビデオデータを、それぞれのビデオ会議クライアントから受信することがさらにできてよい。
【0030】
一変形例において、これらのビデオ会議クライアントはまた、既定のジェスチャ情報をサーバに向けて送信することができる。他の実施形態において、これらの既定のジェスチャは、すべてのクライアントについて同じであってもよく、サーバ内に集中的に格納されてよい。いくつかの実施形態において、会議サーバは、前記既定のジェスチャ情報を、異なる場所におけるビデオ会議クライアントに向けて伝達する。これらの実施形態について、ビデオ会議クライアントの実施形態は、参加者によって行われている既定のジェスチャを検出すると、行われているジェスチャを示す信号を、ビデオ会議サーバに送信するように適合されている。サーバは次いで、この特定のクライアントから受信されたビデオ画像をさらに分析し、ビデオデータをそれに応じて適合させることができる。
【0031】
本発明は加えて、データ処理装置上で実行されるとき、請求項1から5のいずれか一項に記載の方法ステップを行うように適合されたソフトウェアを含む、コンピュータプログラム製品に関する。
【0032】
特許請求の範囲において使用される用語「結合される(coupled)」は、直接接続のみに限定的であるように解釈されるべきではないことに留意されたい。したがって、「デバイスBに結合されたデバイスA」という表現の範囲は、デバイスAの出力が、デバイスBの入力に直接結合されるデバイスまたはシステムに限定されるべきではない。それは、Aの出力とBの入力との間にパスが存在し、それが他のデバイスまたは手段を含むパスであってもよいことを意味する。
【0033】
特許請求の範囲において使用される用語「含む(comprising)」は、そこに挙げられた手段に限定的であるように解釈されるべきではないことに留意されたい。したがって、「手段AおよびBを含むデバイス」という表現の範囲は、構成要素AおよびBのみからなるデバイスに限定されるべきではない。それは、本発明に関して、デバイスのただ関係があるだけの構成要素がAおよびBであることを意味する。
【0034】
本発明の上の、ならびに他の目的および特徴は、添付の図面と併用して一実施形態の以下の説明を参照することによって、より明らかとなり、本発明それ自体が最もよく理解されるだろう。
【図面の簡単な説明】
【0035】
図1】分散化されたビデオ会議クライアントアーキテクチャによる、n個の場所の間で開催されるビデオ会議の例示的な状況を示す図である。
図2】分散化されたビデオ会議クライアントアーキテクチャについて、映像ミュートするための方法の詳細な実施形態を示す図である。
図3】クライアント−サーバビデオ会議アーキテクチャについて、映像ミュートするための方法の詳細な実施形態を示す図である。
図4】クライアント/サーバビデオ会議アーキテクチャによる、n個の場所の間で開催されるビデオ会議の例示的な状況を示す図である。
図5】特定の場所における会議参加者によって行われるジェスチャの登録のための第1の変形例を示す図である。
図6】特定の場所におけるm人の会議参加者によって行われるジェスチャの登録のための別の変形例を示す図である。
図7図4に図示されたアーキテクチャにおけるビデオ会議サーバの実施形態を示す図である。
【発明を実施するための形態】
【0036】
図1は、ルーム1、ルーム2からルームnによって示される、n個の異なる場所の間で開催されるビデオ会議の状況を図示する。これらの場所はルームと表示されている事実に関わらず、そのような場所はまた、屋外のどこかであってもよく、または、たとえば、作業フロア、舞台、ガレージなどの、「ルーム」とは異なり得る屋内の場所にあってもよい。各場所は、その特定の場所におけるビデオ会議の異なる参加者を記録するための1つまたは複数のビデオカメラにより装備されている。図1では、各ルームが、cam1、cam2からcamnとそれぞれ表示された、1つのカメラを有する状況が図示されている。しかしながら、他の状況では、1つの場所でいくつかのカメラが、異なる参加者を記録するために使用されてもよい。
【0037】
場所の各々には、それぞれの場所、ルーム1、ルーム2からルームnの場合、VCC1、VCC2からVCCnとそれぞれ表示された、ビデオ会議クライアントデバイスがさらに装備されている。そのようなビデオ会議クライアントは、そのそれぞれの場所で、ビデオ会議クライアントに結合されたそれぞれのカメラによって記録されるビデオデータを受信して、たとえば、データを圧縮し、符号化することによって、または、いくつかのカメラが1つのビデオ会議クライアントに結合されている場合は、データを1つの作成されたビデオの中にミキシングし、それに続いてこの結果として作成されたビデオを符号化することによって、ビデオデータを処理するように適合されている。1つの場所からの符号化されたビデオは次いで、ビデオ会議クライアントによって、他の場所における他のビデオ会議クライアントに送信される。これはまた、特定のビデオ会議クライアント、たとえばVCC1が、したがってまた、場所ルーム2からルームnより処理されたビデオを受信し、これらをディスプレイユニットD、たとえば、特定の場所におけるスクリーンに提供することになることを意味する。
【0038】
本発明の実施形態は、所定のジェスチャを行う参加者を用いて、この参加者によるトリガを受信すると、場所におけるビデオ会議のこの参加者の存在を隠すようになど、この場所におけるこのビデオ会議中に、1つまたは複数のカメラによって記録されるビデオデータを適合させるための方法を提供することを狙いとする。このジェスチャは、たとえば、左手を振る、財布を上下に裏返す、椅子を押す、ゲームコンソール、タブレットコンピュータ、携帯電話機などのなんらかの動き検出および通信能力が装備されたモバイルデバイスをひっくり返す、または回転させるなど、何であってもよい。参加者自身をミュートするために、一定の場所の任意の参加者について1つのみのジェスチャが使用されることになる一実施形態において、この特定のジェスチャは、一定の場所内のすべての参加者によって同意済みであり、この場所におけるビデオ会議クライアントによって登録されている。これらの実施形態において、各場所は、映像ミュートをトリガすることになる、別々の場所固有の同意済みのジェスチャを有することができる。あるいは、より集中化されたアプローチによるビデオ会議システムは、すべての場所にわたって同じである、最初に定義された、または事前構成されたジェスチャを使用することができる。そのような状況において、ビデオ会議クライアントの各々は、このジェスチャによってトリガすることになるように事前構成されてよい。このケースでは、特定の場所におけるビデオ会議の参加者によって、場合によって行われることになる既定のジェスチャを登録するステップは、たとえば、このジェスチャを異なるビデオ会議クライアント内に単に格納することに還元することができる。場所ごとに認識されることになるジェスチャに参加者が最初に同意することができる、先に説明された状況において、このジェスチャの登録は、初期化ステップにおいて行われることになる。
【0039】
他の、より複雑な実施形態においては、いくつかのジェスチャが登録されて、異なるジェスチャに基づいて、各人物が自分自身をミュートすることを可能にすることができる。しかしながら、これらの実施形態においては、登録手順はより複雑になる。
【0040】
場所ごとに1つのみの共通のジェスチャが使用される図1の実施形態において、それぞれの場所、ルーム1、ルーム2からルームnごとに、これらのそれぞれの場所におけるそれぞれのビデオ会議クライアント、VCC1、VCC2からVCCnへの、それぞれのジェスチャ情報を表示する異なる入力、G1、G2からGnを用いて、これらの異なるジェスチャの登録が概略的に表示されている。これは、前記場所におけるカメラによって、任意の参加者によるこのジェスチャを行う行為を記録することを含むことができる。登録中、各人物が自らをミュートするために異なるジェスチャを行うことが可能にされない限り、ジェスチャを行う人物ではなく、ジェスチャのみが登録されることになることが注目されるべきである。1つのみのジェスチャが場所ごとに映像ミュートを可能にするという実施形態において、この場所固有のジェスチャを行う人物により記録されるビデオ情報は、この場所の関連付けられたビデオ会議クライアントに、カメラによって提供されることになる。これは、たとえば図5に図示されており、手を振るジェスチャが記録され、登録されることになる。G1は、そのとき、その手を振る任意の人物のビデオ情報である。この状況において、ルーム1についてのジェスチャ情報G1は、したがって、ジェスチャ行う任意の参加者によって最初に提供され、カメラcam1によって記録され、カメラcam1は次いで、ジェスチャ情報入力を収容する画像を、ビデオ会議クライアントVCC1に転送することになる。
【0041】
各人物がミュートされるために異なるジェスチャを使用することができる、より複雑な実施形態では、これら人物の各々はそのとき、自分の特定のジェスチャで登録しなければならない。
【0042】
ビデオ会議クライアント内には、VCC1の場合、GR1と表示されたジェスチャ登録手段が存在して、既定のジェスチャG1に関するそのような情報を受信し、格納することができる。上述された実施形態において、この登録手段は、したがってまた、後で認識されることになるジェスチャによるカメラからのビデオ情報を受信することができる。しかしながら、他の実施形態においては、そのような別々のジェスチャ登録手段は必要なく、その機能性が、VCCそれ自体のメモリまたは処理ユニット内に組み込まれていてもよい。
【0043】
そのジェスチャが既定のジェスチャのビデオを用いてシステムに伝達される、場所ごとに1つのみの共通の登録されたジェスチャを用いる、図1および図5に図示されたこれらの実施形態においては、ビデオ会議は、登録の後で開始されることになる。カメラは、継続的にビデオ会議を記録することになり、画像は、特定のジェスチャを検出するためにVCC内で継続的に分析されることになる。特定のジェスチャを検出すると、ビデオデータは、実際にこのジェスチャを行っている、特定の場所における前記ビデオ会議の一人または複数の参加者を認識するために、さらに分析される。特定のジェスチャを行っている人物を検出すると、これらの人々の映像ミューティングが行われることになる。この映像ミュートを実現するために、記録されるビデオにおいて、この、もしくはこれらの参加者を削除する、または隠すようになど、カメラによって記録されるビデオデータが適合される。この適合は、これらの参加者に関係する画像ピクセルデータを、適切な背景ビデオデータに差し替えることを含むことができる。
【0044】
図1で、ビデオルーム1と表示され、cam1と表示されたカメラによって記録される会議ビデオデータの分析および適合が、VAASと表示されたビデオ分析および適合デバイス内で行われる。図1の状況において、このビデオ分析および適合デバイスは、それぞれのビデオ会議クライアント内に含まれる。しかしながら、図4に図示されるものなどの他の状況においては、このビデオ分析および適合デバイスはまた、中央ビデオ会議サーバの中に存在することができる。これは、後の段落でより詳細に明らかにされることになる。
【0045】
VAASと表示されたビデオ分析および適合デバイスは、場合によって符号化され、前記ビデオ会議に参加する他の場所における他の参加者に送信されるための、適合させたビデオデータを生成している。図1に図示された実施形態において、適合させたビデオは、ビデオaルーム1と表示され、VAASによって生成される。
【0046】
図1に図示された状況では、ルーム1のビデオデータが適合されると、VAASが、ビデオaルーム1と表示されたこのようにして適合させたビデオを、ビデオ会議クライアントVCC1の送信ユニットVT1に提供することになる。VT1は、圧縮および符号化を行い、場合によって符号化され、適合させたビデオデータを、他の場所におけるビデオ会議の他の参加者にサービス提供する他のビデオ会議クライアントVCC2からVCCnに向けて、送信することができる。
【0047】
ジェスチャそれ自体に応じて、その検出は、会議ビデオデータの単なる分析によって行われてもよい。これはたとえば、ジェスチャが、たとえば、(図5に図示されたような)手で合図する、頭を下げるなどの、もっぱら人体それ自体によって行われることになるジェスチャに関する場合の、または、木製テーブルの一部をカチカチ鳴らす、革財布の向きを変えるなどの、さらなる通信の手段を有さない物体に関係したケースである。
【0048】
あるいは、既定のジェスチャは、ビデオ会議の参加者によってタッチされると物体によって送信される、信号の存在によって検出されてもよい。これは、たとえば、ジェスチャが、モバイル電話機、ラップトップなどのなんらかの動き感知および通信能力を有するデバイスの特定のボタンにタッチすること、モバイル電話機またはタブレットコンピュータの向きを変えること、bluetoothなどのタッチスクリーンおよび通信能力を有する腕時計にタッチすること、その他に関する場合のケースであってよい。
【0049】
これらの状況において、既定のジェスチャは、たとえば、物体に動きセンサが装備されたケースにおいて、この物体それ自体によって簡単に検出され得る。このジェスチャを検出すると、物体は次いで、特定のトリガ検出信号を生成し、ビデオ会議クライアントに送信することになる。たとえば、各ビデオ会議クライアントがビデオ分析および適合デバイスVAASを含むときのいくつかのケースにおいて、この物体はまた、このトリガ検出信号をこのVAASに直接送信することができる。そのような状況において、ジェスチャの登録はそのとき、この特定の物体によるそのような信号をVCCまたはVAASに最初に送信することに還元されることになり、VCCまたはVAASは次いで、それに応じてこれを格納することになる。この状況は、これらのそれぞれの参加者1からmによって、それぞれのモバイル電話機O11からO1mを上下に裏返す場合の図6に示されており、これらのそれぞれのモバイル電話機によって、それぞれのトリガ検出信号G11からG1mを生成することになり、それにより、すべてがこれらのモバイル電話機からVCCへと、最初に伝達されることになる。あるいは、各ビデオ会議クライアントは既に、そのような物体によって送信されているそのような信号を即座に認識するようになど、事前構成されていてもよい。この状況において、各参加者1からmは、自分の特定のモバイル電話機に結び付けられているので、トリガ検出信号もまた、既定のジェスチャを行った人物についての情報を含むことになる。この状況は、たとえば、会議場所における任意の参加者によってタッチされると、スマートコーヒーマシンがまた、トリガ検出信号を送ることができる場合のケースとは異なっている。これらのケースでは、特定のジェスチャを行った人物の別々の検出が行われることになる。
【0050】
トリガ検出信号はしたがって、携帯電話機などの物体によって送信される信号であってよく、信号は、この物体による特定の動き(たとえば、ひっくり返す、または上下に裏返す)を検出すると、この物体によって生成される。別の例において、信号は、特定のボタンが押されたことなどが腕時計によって検出されると、物体、たとえばこの腕時計によって送信される信号であってよい。当然ながら、これらの能力を有するすべてのタイプの物体が、この目的に対して使用されてよい。
【0051】
ジェスチャ検出信号が物体によって生成されるすべてのそのようなケースでは、ビデオ分析および適合デバイスはそのとき、トリガ信号によってトリガされると、カメラからのビデオを単に分析し、適合させることになる。このトリガ信号は、VCCからVAASへと送信されてもどちらでもよく、その信号はそれ自体が、タッチされた物体によってトリガ検出信号が受信されると、VCCによって生成される。あるいは、トリガ信号は、この物体から、VAASによって直接受信されてもよい。先に言及されたように、図1に図示されるなどの非集中化された状況において、物体はまた、各VCCに存在するVAASと直接通信し、したがって、VAASを直接トリガすることができる。図4に図示されるなどのより集中化された状況において、VCCはなお非集中化されて場所ごとに存在するので、物体は、VCCとのみ通信することができる。VCCは次いで、それに応じて、追加のトリガ信号をサーバにおけるVAASに提供することになる。
【0052】
特定の実装において、ビデオ会議クライアントと通信する物体は、したがって、モバイル電話機、ラップトップ、ゲームコンソール、その他などのポータブル通信デバイスであってよい。そのようなデバイスはそのとき、たとえば、ビデオ会議の開始前に、参加者によって場合によって行われる既定のジェスチャ、たとえば、このデバイスを上下に裏返すことなどのジェスチャに関する、ユーザ情報を提供するための登録要求を生成するように適合されている。そのような登録要求の生成はそのとき、このデバイスによるこの特定の動きの検出を含意し、特定の場所におけるビデオ会議クライアントへの特定のトリガ検出信号の生成がそれに続く。
【0053】
その場所におけるすべての参加者がこの機能を享受したいと望むケースにおいて、すべてのこれらのデバイスは次いで、それらの登録信号を会議クライアントに送る必要がある。これは、図6に概略的に示されたもので、ここでは、参加者1から参加者mが、自分の携帯電話機を上下に裏返すことができ、m個のトリガ信号G11からG1mの生成がそれに続く。
【0054】
この実施形態において、各人物は、固有のトリガを有する自分の物体に結び付けられているので、VAASはしたがって、ジェスチャを行った人物を即座に認識することになる。
【0055】
どのモバイル電話機がどのユーザに属するか、および、任意のモバイル電話機からの任意のジェスチャ検出信号がこのモバイル電話機にタッチした人物の映像ミューティングにつながり得るという直接登録が存在しない他の実施形態では、ビデオ会議データの分析を用いた、ジェスチャを行った特定の人物の検出がなおも必要とされる。
【0056】
図2は、図1の分散化された構成のための方法の高レベル実施形態を概略的に示す。
【0057】
図4に図示された、VAASがビデオ会議サーバの一部であるより集中化された状況では、方法の実施形態は、図3に図示されたようなステップを有することができる。
【0058】
他の実施形態において、1つの場所でビデオ会議クライアントがまた、他の場所におけるビデオ会議クライアントのために、ビデオ会議サーバの機能を組み込むことになる、なんらかの混合されたアーキテクチャが存在してもよい。
【0059】
ビデオ会議サーバの別の実施形態のより詳細な実施形態が、図7に図示されている。ビデオ会議サーバは、GRと表示された中央ジェスチャ登録モジュールと、中央ジェスチャ検出モジュールGDと、映像ミュート領域セレクタVMRSと、出力作成モジュールOCとを含む。ジェスチャ登録モジュールGRは、登録されたジェスチャを受け入れ、円柱ブロック「ジェスチャ情報」GIによって表示された中央データベースまたはメモリに記憶する。図7に図示された実施形態におけるジェスチャ検出モジュールは、たとえば、物体における通信ユニットに結合されたジャイロスコープ検出器から来る、別々のジェスチャ入力信号を受信するように適合されている。GDは、ジェスチャ入力信号を受信すると、ジェスチャ入力信号が、メモリまたはデータベースからのあらかじめ登録されたジェスチャ情報に対応するかどうかを検査することになる。このジェスチャを行った人物の映像ミュートを可能にする特定のジェスチャが存在することが判明した場合、GDは引き続き、この信号を分析する、および/または、これがジェスチャ入力信号それ自体から明瞭でなかった場合、どの人物がこのジェスチャを実際に行ったのかを検査するために、受信されたビデオを分析することになる。参加者が認識されると、この情報は、映像ミュート領域セレクタVMRSへと転送されることになり、そのモジュールが、特定の場所から受信されたカメラビデオ入力から、検出された参加者をミュートすることになる。モジュールOC内では、すべてのカメラからのミュートされた、またはミュートされないビデオ入力が再び取りまとめられて、全体の出力を作成されたビデオとし、そのビデオが次いで、異なる個々の場所へと再び分散されることになる。
【0060】
さらに他の実施形態において、特定の人物の映像ミューティングを、既定のジェスチャを行う別の人物によって可能にすることさえあり得てよい。そのようなケースにおいては、ジェスチャ登録データベースが、どのジェスチャがどの人物をミュートするべくトリガすることになるかについての相互参照情報を収容することになる。
【0061】
本明細書におけるあらゆるブロック図は、本発明の原理を具体化する説明的な回路の概念的視点を表すことが、当業者によって認められるべきである。同様に、あらゆる流れ図(flow chart)、フロー図(flow diagram)、状態遷移図、擬似コード、その他は、コンピュータ可読媒体において実質的に表されてよく、かつコンピュータまたはプロセッサが明示的に示されていても、いなくても、そのようなコンピュータまたはプロセッサによってそのように実行され得る、さまざまなプロセスを表すことが認められるだろう。
【0062】
本発明の原理が特定の装置と関連して上で説明されてきたが、この説明は、例としてのみなされ、添付の特許請求の範囲において定義されるような、本発明の範囲への限定としてなされたものでないことが明白に理解されるべきである。本発明の特許請求の範囲において、指定された機能を行うための手段として表現されるいずれの要素も、その機能を行うあらゆるやり方をも包含するように意図される。これは、たとえば、その機能を行う電子的もしくは機械的な要素の組合せ、または、機能を行うためにそのソフトウェアを実行するための適切な回路と組み合わされた、したがって、ファームウェア、マイクロコードなどを含む任意の形態のソフトウェア、ならびに、存在すれば、ソフトウェア制御された回路に結合された機械的な要素を含むことができる。そのような特許請求の範囲によって定義される本発明は、さまざまな列挙された手段によって提供される機能性が、特許請求の範囲が求めるやり方で組み合わされ、一緒にされており、別段そのように定義されない限り、いずれの物理的な構造も、特許請求される発明の新規性に対しては、ほとんど、またはまったく重要でないという事実に帰する。したがって出願人は、それらの機能性を提供することができるいずれの手段も、本明細書に示された機能性と均等であるものとみなす。
図1
図2
図3
図4
図5
図6
図7