IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ KDDIアジャイル開発センター株式会社の特許一覧

特開2024-120350データ処理装置、データ処理方法及びデータ処理システム
<>
  • 特開-データ処理装置、データ処理方法及びデータ処理システム 図1
  • 特開-データ処理装置、データ処理方法及びデータ処理システム 図2
  • 特開-データ処理装置、データ処理方法及びデータ処理システム 図3
  • 特開-データ処理装置、データ処理方法及びデータ処理システム 図4
  • 特開-データ処理装置、データ処理方法及びデータ処理システム 図5
  • 特開-データ処理装置、データ処理方法及びデータ処理システム 図6
  • 特開-データ処理装置、データ処理方法及びデータ処理システム 図7
  • 特開-データ処理装置、データ処理方法及びデータ処理システム 図8
  • 特開-データ処理装置、データ処理方法及びデータ処理システム 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024120350
(43)【公開日】2024-09-05
(54)【発明の名称】データ処理装置、データ処理方法及びデータ処理システム
(51)【国際特許分類】
   H04N 7/15 20060101AFI20240829BHJP
   H04N 21/2343 20110101ALI20240829BHJP
   H04N 21/233 20110101ALI20240829BHJP
【FI】
H04N7/15
H04N21/2343
H04N21/233
【審査請求】有
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2023027087
(22)【出願日】2023-02-24
(71)【出願人】
【識別番号】523066772
【氏名又は名称】KDDIアジャイル開発センター株式会社
(74)【代理人】
【識別番号】110004222
【氏名又は名称】弁理士法人創光国際特許事務所
(74)【代理人】
【識別番号】100166006
【弁理士】
【氏名又は名称】泉 通博
(74)【代理人】
【識別番号】100154070
【弁理士】
【氏名又は名称】久恒 京範
(74)【代理人】
【識別番号】100153280
【弁理士】
【氏名又は名称】寺川 賢祐
(72)【発明者】
【氏名】南 翔太郎
(72)【発明者】
【氏名】本田 悠真
(72)【発明者】
【氏名】浅川 善則
【テーマコード(参考)】
5C164
【Fターム(参考)】
5C164FA10
5C164GA07
5C164PA31
5C164PA41
5C164SB02P
5C164SB04P
5C164VA13P
(57)【要約】
【課題】リモート会議の臨場感を向上させる。
【解決手段】データ処理装置1は、第1拠点においてリモート会議に参加する一以上の第1参加者を撮像した第1画像データと、一以上の第1参加者の第1音声データと、複数の第2拠点からリモート会議に参加する複数のリモート参加者に対応する複数のリモート画像データと、各リモート参加者のリモート音声データと、を取得する。また、データ処理装置1は、複数のリモート画像データを合成した第1合成画像データと、第1合成画像データにおける複数のリモート参加者それぞれの位置に基づいて複数のリモート音声データを処理した処理済音声データとを生成する。そして、データ処理装置1は、第1拠点の一以上の電子機器に第1合成画像データと処理済音声データとを送信するとともに、第1画像データと第1音声データとを複数の第2拠点の複数の情報端末に送信する。
【選択図】図4
【特許請求の範囲】
【請求項1】
3以上の拠点間でリモート会議を行うシステムにおけるデータ処理装置であって、第1拠点においては一以上の電子機器を介して前記リモート会議の画像が表示され、
前記第1拠点において前記リモート会議に参加する一以上の第1参加者を撮像することにより生成された第1画像データと、前記一以上の第1参加者の第1音声データと、前記第1拠点と異なる複数の第2拠点から前記リモート会議に参加する複数のリモート参加者に対応する複数のリモート画像データと、前記複数のリモート参加者の複数のリモート音声データと、を取得する取得部と、
前記複数のリモート画像データを合成することにより第1合成画像データを生成する画像データ生成部と、
前記第1合成画像データにおける前記複数のリモート参加者それぞれの位置に基づいて複数の前記リモート音声データを処理することにより処理済音声データを生成する音声データ生成部と、
前記第1拠点において前記リモート会議に参加する前記一以上の第1参加者が前記リモート会議の視聴のために使用する一以上の電子機器に前記第1合成画像データと前記処理済音声データとを送信するとともに、前記第1画像データと前記第1音声データとを前記複数のリモート参加者が使用する複数の情報端末に送信するデータ送信部と、
を有するデータ処理装置。
【請求項2】
前記画像データ生成部は、前記複数のリモート画像データのうち1つのリモート画像データを除く一以上のリモート画像データと前記第1画像データとを合成することにより第2合成画像データを生成し、
前記データ送信部は、前記1つのリモート画像データに対応する前記リモート参加者が使用する前記情報端末に、当該リモート参加者に対応する前記1つのリモート画像データを含まない前記第2合成画像データを送信する、
請求項1に記載のデータ処理装置。
【請求項3】
前記画像データ生成部は、前記第1画像データにおいて前記第1参加者が含まれていない位置に前記複数のリモート画像データを合成することにより前記第2合成画像データを生成する、
請求項2に記載のデータ処理装置。
【請求項4】
前記画像データ生成部は、前記第1画像データと異なる領域に前記少なくとも一部のリモート画像データを合成することにより前記第2合成画像データを生成する、
請求項2に記載のデータ処理装置。
【請求項5】
前記画像データ生成部は、机の画像データの周囲の所定の範囲内の領域に前記少なくとも一部のリモート画像データを合成することにより前記第2合成画像データを生成する、
請求項4に記載のデータ処理装置。
【請求項6】
前記データ送信部は、前記第1参加者が前記リモート会議の視聴のために使用する一以上の電子機器に前記第1画像データを送信し、
前記画像データ生成部は、当該一以上の電子機器を介して取得した前記第1画像データに基づいて前記第1拠点に設置された表示装置が表示した前記第1画像データにおいて指定された位置に複数のリモート画像のデータそれぞれの少なくとも一部を合成することにより前記第2合成画像データを生成する、
請求項2に記載のデータ処理装置。
【請求項7】
前記音声データ生成部は、前記第1合成画像データにおける前記リモート画像データの位置に基づいて、前記第1拠点の第1位置に設置された第1位置スピーカに出力するための第1位置音声データと、前記第1拠点の第2位置に設置された第2位置スピーカに出力するための第2位置音声データと、を含む、前記リモート画像データに対応する前記リモート参加者の音声に対応する前記処理済音声データを生成する、
請求項1に記載のデータ処理装置。
【請求項8】
前記リモート会議の属性の設定を受け付ける設定受付部をさらに有し、
前記取得部は、前記複数のリモート参加者それぞれの撮像画像データ及びアバター画像データを取得し、
前記画像データ生成部は、前記リモート会議の属性に基づいて、前記リモート画像データとして前記撮像画像データを用いるか前記アバター画像データを用いるかを決定する、
請求項1に記載のデータ処理装置。
【請求項9】
コンピュータが実行する、
第1拠点と前記第1拠点とは異なる複数の第2拠点との間のリモート会議に第1拠点において参加する一以上の第1参加者を撮像することにより生成された第1画像データと、前記一以上の第1参加者の第1音声データと、前記複数の第2拠点から前記リモート会議に参加する複数のリモート参加者に対応する複数のリモート画像データと、前記複数のリモート参加者の複数のリモート音声データと、を取得するステップと、
前記複数のリモート画像データを合成することにより第1合成画像データを生成するステップと、
前記第1合成画像データにおける前記複数のリモート参加者それぞれの位置に基づいて複数の前記リモート音声データを処理することにより処理済音声データを生成するステップと、
前記第1拠点において前記リモート会議に参加する前記第1参加者が前記リモート会議の視聴のために使用する一以上の電子機器に前記第1合成画像データと前記処理済音声データとを送信するとともに、前記第1画像データと前記第1音声データとを前記複数のリモート参加者が使用する複数の情報端末に送信するステップと、
を有するデータ処理方法。
【請求項10】
第1拠点に設置された電子機器と、
前記第1拠点と異なる複数の第2拠点に設置された複数の情報端末と、
前記第1拠点と前記複数の第2拠点とのリモート会議に前記第1拠点において参加する一以上の第1参加者を撮像することにより生成された第1画像データと、前記一以上の第1参加者の第1音声データと、前記複数の第2拠点から前記リモート会議に参加する複数のリモート参加者に対応する複数のリモート画像データと、前記複数のリモート参加者の複数のリモート音声データと、を取得する取得部と、
前記複数のリモート画像データを合成することにより第1合成画像データを生成する画像データ生成部と、前記第1合成画像データにおける前記複数のリモート参加者それぞれの位置に基づいて複数の前記リモート音声データを処理することにより処理済音声データを生成する音声データ生成部と、
前記第1拠点において前記リモート会議に参加する前記第1参加者が前記リモート会議の視聴のために使用する一以上の前記電子機器に前記第1合成画像データと前記処理済音声データとを送信するとともに、前記第1画像データと前記第1音声データとを前記複数のリモート参加者が使用する前記複数の情報端末に送信するデータ送信部と、
を有するデータ処理システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、データ処理装置、データ処理方法及びデータ処理システムに関する。
【背景技術】
【0002】
従来、離れた場所にいる複数の人が会議をするためのリモート会議システムが知られている(例えば、特許文献1を参照)。従来のリモート会議システムでは、複数の会議参加者それぞれの撮像画像を仮想の会議テーブルに配置した画像を作成することにより、臨場感を高めている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2022-54192号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
従来のリモート会議システムでは、複数の会議参加者それぞれの個別の撮像画像が仮想の会議テーブルに配置されていたが、複数の会議参加者が実際の会議室に集まっており、一部の会議参加者が離れた拠点から会議に参加するという場合がある。このような場合に、仮想の会議テーブルの周囲に全ての拠点で撮像された画像をそのまま配置した合成画像が各会議室で表示されると、臨場感が低下してしまう。
【0005】
本発明の目的の1つは、リモート会議の臨場感を向上させることにある。
【課題を解決するための手段】
【0006】
本発明の第1の態様のデータ処理装置は、3以上の拠点間でリモート会議を行うシステムにおけるデータ処理装置であって、第1拠点においては一以上の電子機器を介して前記リモート会議の画像が表示され、前記第1拠点において前記リモート会議に参加する一以上の第1参加者を撮像することにより生成された第1画像データと、前記一以上の第1参加者の第1音声データと、前記第1拠点と異なる複数の第2拠点から前記リモート会議に参加する複数のリモート参加者に対応する複数のリモート画像データと、前記複数のリモート参加者の複数のリモート音声データと、を取得する取得部と、前記複数のリモート画像データを合成することにより第1合成画像データを生成する画像データ生成部と、前記第1合成画像データにおける前記複数のリモート参加者それぞれの位置に基づいて複数の前記リモート音声データを処理することにより処理済音声データを生成する音声データ生成部と、前記第1拠点において前記リモート会議に参加する前記一以上の第1参加者が前記リモート会議の視聴のために使用する一以上の電子機器に前記第1合成画像データと前記処理済音声データとを送信するとともに、前記第1画像データと前記第1音声データとを前記複数のリモート参加者が使用する複数の情報端末に送信するデータ送信部と、を有する。
【0007】
前記画像データ生成部は、前記複数のリモート画像データのうち1つのリモート画像データを除く一以上のリモート画像データと前記第1画像データとを合成することにより第2合成画像データを生成し、前記データ送信部は、前記1つのリモート画像データに対応する前記リモート参加者が使用する前記情報端末に、当該リモート参加者に対応する前記1つのリモート画像データを含まない前記第2合成画像データを送信してもよい。
【0008】
前記画像データ生成部は、前記第1画像データにおいて前記第1参加者が含まれていない位置に前記複数のリモート画像データを合成することにより前記第2合成画像データを生成してもよい。
【0009】
前記画像データ生成部は、前記第1画像データと異なる領域に前記少なくとも一部のリモート画像データを合成することにより前記第2合成画像データを生成してもよい。
【0010】
前記画像データ生成部は、机の画像データの周囲の所定の範囲内の領域に前記少なくとも一部のリモート画像データを合成することにより前記第2合成画像データを生成してもよい。
【0011】
前記データ送信部は、前記第1参加者が前記リモート会議の視聴のために使用する一以上の電子機器に前記第1画像データを送信し、前記画像データ生成部は、当該一以上の電子機器を介して取得した前記第1画像データに基づいて前記第1拠点に設置された表示装置が表示した前記第1画像データにおいて指定された位置に複数のリモート画像のデータそれぞれの少なくとも一部を合成することにより前記第2合成画像データを生成してもよい。
【0012】
前記音声データ生成部は、前記第1合成画像データにおける前記リモート画像データの位置に基づいて、前記第1拠点の第1位置に設置された第1位置スピーカに出力するための第1位置音声データと、前記第1拠点の第2位置に設置された第2位置スピーカに出力するための第2位置音声データと、を含む、前記リモート画像データに対応する前記リモート参加者の音声に対応する前記処理済音声データを生成してもよい。
【0013】
前記データ処理装置は、前記リモート会議の属性の設定を受け付ける設定受付部をさらに有し、前記取得部は、前記複数のリモート参加者それぞれの撮像画像データ及びアバター画像データを取得し、前記画像データ生成部は、前記リモート会議の属性に基づいて、前記リモート画像データとして前記撮像画像データを用いるか前記アバター画像データを用いるかを決定してもよい。
【0014】
本発明の第2の態様のデータ処理方法は、コンピュータが実行する、第1拠点と前記第1拠点とは異なる複数の第2拠点との間のリモート会議に第1拠点において参加する一以上の第1参加者を撮像することにより生成された第1画像データと、前記一以上の第1参加者の第1音声データと、前記複数の第2拠点から前記リモート会議に参加する複数のリモート参加者に対応する複数のリモート画像データと、前記複数のリモート参加者の複数のリモート音声データと、を取得するステップと、前記複数のリモート画像データを合成することにより第1合成画像データを生成するステップと、前記第1合成画像データにおける前記複数のリモート参加者それぞれの位置に基づいて複数の前記リモート音声データを処理することにより処理済音声データを生成するステップと、前記第1拠点において前記リモート会議に参加する前記第1参加者が前記リモート会議の視聴のために使用する一以上の電子機器に前記第1合成画像データと前記処理済音声データとを送信するとともに、前記第1画像データと前記第1音声データとを前記複数のリモート参加者が使用する複数の情報端末に送信するステップと、を有する。
【0015】
本発明の第3の態様のデータ処理システムは、第1拠点に設置された電子機器と、前記第1拠点と異なる複数の第2拠点に設置された複数の情報端末と、前記第1拠点と前記複数の第2拠点とのリモート会議に前記第1拠点において参加する一以上の第1参加者を撮像することにより生成された第1画像データと、前記一以上の第1参加者の第1音声データと、前記複数の第2拠点から前記リモート会議に参加する複数のリモート参加者に対応する複数のリモート画像データと、前記複数のリモート参加者の複数のリモート音声データと、を取得する取得部と、前記複数のリモート画像データを合成することにより第1合成画像データを生成する画像データ生成部と、前記第1合成画像データにおける前記複数のリモート参加者それぞれの位置に基づいて複数の前記リモート音声データを処理することにより処理済音声データを生成する音声データ生成部と、前記第1拠点において前記リモート会議に参加する前記第1参加者が前記リモート会議の視聴のために使用する一以上の前記電子機器に前記第1合成画像データと前記処理済音声データとを送信するとともに、前記第1画像データと前記第1音声データとを前記複数のリモート参加者が使用する前記複数の情報端末に送信するデータ送信部と、を有する。
【発明の効果】
【0016】
本発明によれば、リモート会議の臨場感を向上させることができるという効果を奏する。
【図面の簡単な説明】
【0017】
図1】データ処理システムの概要を説明するための図である。
図2】各拠点で表示される画像の例を模式的に示す図である。
図3】複数の拠点間での画像及び音声のデータの流れの概要を示す図である。
図4】データ処理装置の構成を示す図である。
図5】第2参加者が第2画像データを合成する位置を指定する方法を説明するための図である。
図6】第2参加者のための空席領域が作り出された例を模式的に示す図である。
図7】リモート拠点において表示される画像の例を模式的に示す図である。
図8】空席領域が作り出される例を模式的に示す図である。
図9】データ処理装置1における処理の流れを示すフローチャートである。
【発明を実施するための形態】
【0018】
[データ処理システムSの概要]
図1は、データ処理システムSの概要を説明するための図である。データ処理システムSは、複数の拠点にいる複数の人がリモート会議をするためのシステムである。以下の説明において、リモート会議に参加する人を参加者という。
【0019】
図1には、第1拠点及び複数の第2拠点が示されており、これらの拠点はネットワークNにより接続されている。ネットワークNは、例えばインターネット又はイントラネットを含む。ネットワークNには、データ処理装置1と各拠点の電子機器とが接続されている。ネットワークNには、有線及び無線の少なくとも1つが含まれてよい。例えば、ネットワークNは、有線によって構成されてもよいし、無線によって構成されてもよいし、有線区間及び無線区間の双方を含んで構成されてもよい。無線による通信には、例えば、セルラー通信、無線LAN(local area network)通信、及び、衛星通信の少なくとも1つが含まれてよい。データ処理システムSには、4以上の拠点が含まれていてもよい。
【0020】
第1拠点には、ルータ21と、コンピュータ22と、カメラ23と、ディスプレイ24と、スピーカ25(スピーカ25L及びスピーカ25R)が設置されている。第1拠点においては、一以上の第1参加者である参加者A1、A2、A3、A4がテーブルの周囲に着席している。ルータ21、コンピュータ22、カメラ23、ディスプレイ24及びスピーカ25は、第1拠点において参加者A1、A2、A3、A4がリモート会議を視聴するために使用する電子機器(第1電子機器に対応)である。
【0021】
本実施形態においては、カメラ23がマイクロホンを有しており、カメラ23が第1拠点内を撮影した第1画像に基づく第1画像データと第1拠点内の第1音声に基づく第1音声データとを生成する場合を例示するが、これらの電子機器は一体化されていてもよく、さらに多くの電子機器により同等の機能が提供されてもよい。
【0022】
複数の第2拠点のそれぞれには、コンピュータ31(第2電子機器に対応)が設置されている。コンピュータ31は、カメラ、マイクロホン及びスピーカを有する。複数の第2拠点のそれぞれにおいては、コンピュータ31の前に第2参加者である参加者Rが着席している。コンピュータ31は、参加者Rを撮影した第2画像に基づく第2画像データと参加者Rの第2音声に基づく第2音声データとを生成する。
【0023】
以下において、複数の参加者A1、A2、A3、A4を区別しない場合、「参加者A」のように略記することがある。一方、1~n(nは2以上の整数)の複数の第2拠点における参加者Rを区別する場合、「参加者R1~Rn」のように表記することがある。
【0024】
第1拠点及び第2拠点の少なくとも1つにおいて、カメラは、例えば、複数の方向から参加者A又は参加者Rを撮影するために複数台設けられている。また、第1拠点及び第2拠点の少なくとも1つにおいて、マイクロホンは、個々の参加者A又は参加者Rが使用するピンマイクロホンであってもよい。
【0025】
データ処理装置1は、複数の拠点間でのリモート会議をするための各種の処理を実行するコンピュータであり、例えばクラウドサーバである。詳細については後述するが、データ処理装置1は、ある拠点から送られてきた画像及び音声を他の拠点に送信する。これにより、各拠点の参加者は、他の複数の拠点の参加者の画像を見ながら、他の複数の拠点の参加者の音声を聞くことができる。例えば、複数の第2拠点のそれぞれにおけるコンピュータ31のディスプレイには、第1拠点の参加者A1~A4の画像とともに、参加者R1~R4の音声がコンピュータ31のスピーカから出力される。
【0026】
ここで、例えば第1拠点の参加者A1~A4と複数の第2拠点それぞれの参加者Rとが同じ組織(例えば部署又は会社)に属しているような場合、参加者Rにとっては、参加者A1~A4と他の参加者Rとがコンピュータ31のディスプレイにおいて別々に(例えば、複数に区分された表示領域の異なる領域に)表示されていると違和感がある。
【0027】
そこで、データ処理装置1は、第1拠点から送られてきた第1画像に第2拠点(以下、「リモート拠点」とも称する)のそれぞれから送られてきた第2画像(以下、「リモート画像」とも称する)のうち、合成画像データの送信対象に該当する参加者Ri(iは1~nの何れか1人)を除いた他の参加者Rj(jはj≠iを満たす1~nの何れか1人以上)に対応する個々のリモート画像の少なくとも一部を合成する。
【0028】
データ処理装置1が、このように合成した合成画像データを参加者Riのコンピュータ31へ送信することにより、1又は複数の参加者Rjは、第1拠点の参加者A1~A4と一緒に第1拠点からリモート会議に参加しているかのような臨場感を得ることができる。なお、リモート画像データの少なくとも一部は、リモート画像データにおいて参加者Rが示されている領域のデータ(以下、「人物画像データ」とも称する)である。
【0029】
以下の説明において、リモート画像データの少なくとも一部を合成することを、リモート画像データを合成するという場合がある。また、「画像データ」は、適宜、「画像」と略称される場合がある。
【0030】
また、データ処理装置1は、例えば、仮想的な会議室の画像データ(以下、「バーチャル会議室画像データ」とも称する)を生成し、生成したバーチャル会議室画像データに、2以上のリモート拠点のそれぞれから送られてきたリモート画像の少なくとも一部(例えば、人物画像データ)を合成する。また、データ処理装置1は、リモート画像を合成したバーチャル会議室画像と、リモート拠点のそれぞれから送られてきた音声データとを、第1拠点へ送信する。
【0031】
バーチャル会議室画像データは、例えば、第1拠点の会議室内の空間を模した画像である。データ処理装置1は、例えば、1つのバーチャル会議室画像データに含まれる仮想的なテーブル(あるいは机)の周囲に複数のリモート参加者R1~Rnそれぞれの人物画像データを合成(あるいは配置)する。
【0032】
このような画像の合成処理によって、第1拠点の参加者Aは、別々のリモート拠点に位置する各リモート参加者R1~Rnが1つの会議室空間に集まってリモート会議に参加しているかのように会議を行うことができる。ここで、例えば、バーチャル会議室画像を第1拠点の会議室内の空間を模した画像とすることで、第1拠点の参加者Aと各リモート参加者R1~Rnとの会議の一体感あるいは臨場感を高める効果が期待できる。
【0033】
図2は、各拠点で表示される画像の例を模式的に示す図である。図2では、便宜的に、第1拠点の参加者Aが2人の参加者A1及びA2である場合を想定する。図2(a)は、2人の参加者A1及びA2が位置する第1拠点におけるディスプレイ24に表示される画像を示す。図2(b)は、2人のリモート参加者R1及びR2のうちのリモート参加者R1が位置するリモート拠点のコンピュータ31に表示される画像(別言すると、リモート参加者R1が視聴する映像)を示す。図2(c)は、リモート参加者R2が位置するリモート拠点のコンピュータ31に表示される画像(別言すると、リモート参加者R2が視聴する映像)を示す。図2に示す表示態様は一例に過ぎず、後述するように、各種の設定又は条件によって表示態様が決定されてもよい。
【0034】
図2(a)に示すように、第1拠点にはリモート拠点のそれぞれにおいて参加者R1及びR2が撮影された各リモート画像(人物画像)が1つのバーチャル会議室画像における仮想的なテーブルVTの周囲に合成された画像が表示される。このような表示態様によって、第1拠点の参加者A1、A2は、別々のリモート拠点に位置するリモート参加者R1及びR2が1つのバーチャル会議室空間に集まってリモート会議に参加しているような映像を視聴できる。
【0035】
なお、バーチャル会議室画像におけるリモート参加者R1及びR2の合成(又は配置)位置は、例えば、設定、又は、リモート参加者Riが属する組織あるいはリモート参加者Riが所属する組織といった条件によって決定あるいは制御されてよい。個々のリモート参加者Riの属する組織に関する情報が、リモート参加者Riの人物画像と共に第1拠点のディスプレイ24に表示されてもよい。
【0036】
図2(b)に示すように、リモート参加者R1が使用するコンピュータ31のディスプレイには、第1拠点において参加者A1及びA2が撮影された第1画像に他のリモート拠点において他のリモート参加者R2が撮影されたリモート画像を合成した画像が表示されている。リモート参加者R2の画像は、例えば、第1拠点におけるテーブルRTの周囲において参加者A1及びA2と異なる(あるいは重ならない)領域に合成されている。このような表示態様によって、リモート参加者R1は、他のリモート参加者R2が第1拠点における参加者A1及びA2と一緒に第1拠点において会議に参加しているかのような臨場感を得ることができる。
【0037】
同様に、図2(c)に示すように、リモート参加者R2が使用するコンピュータ31のディスプレイには、第1拠点において参加者A1及びA2が撮影された第1画像に他のリモート拠点において他の参加者R1が撮影されたリモート画像を合成した画像が表示されている。リモート参加者R1の画像は、例えば、第1拠点におけるテーブルRTの周囲において参加者A1及びA2と異なる(あるいは重ならない)領域に合成されている。このような表示態様によって、リモート参加者R2は、他のリモート参加者R1が第1拠点における参加者A1及びA2と一緒に第1拠点において会議に参加しているかのような臨場感を得ることができる。
【0038】
なお、リモート参加者R1及びR2の一方のリモート画像は、当該一方のリモート参加者には視聴されなくても構わないので、第1画像のテーブルRTの周囲においてリモート参加者R1及びR2の他方のリモート画像と重なる位置に合成されてもよい。例えば、図2(b)において、リモート参加者R2のリモート画像は、図2(c)においてリモート参加者R1のリモート画像が合成される位置に相当する位置に合成されてもよい。同様に、図2(c)において、リモート参加者R1のリモート画像は、図2(b)においてリモート参加者R2のリモート画像が合成される位置に相当する位置に合成されてもよい。なお、リモート参加者R1及びR2の表示と共に、例えば、リモート参加者R1及びR2のそれぞれが第1拠点には実際には居ないこと(例えば、第1拠点へのリモート参加であること)を示す情報が各拠点のディスプレイに表示されてもよい。
【0039】
[複数の拠点間でのデータの流れ]
図3は、複数の拠点間での画像及び音声のデータの流れの概要を示す図である。第1拠点のルータ21は、カメラ23が生成した第1画像データ及び第1音声データをデータ処理装置1に送信する。複数の第2拠点(リモート拠点)のコンピュータ31のそれぞれは、生成したリモート画像データ及びリモート音声データ(すなわち第2画像データ及び第2音声データ)をデータ処理装置1に送信する。
【0040】
データ処理装置1は、バーチャル会議室画像データを作成し、作成したバーチャル会議室画像データにリモート画像データそれぞれの少なくとも一部を合成した第1合成画像データ、及び、リモート音声データが処理された第1処理済音声データを第1拠点に送信する。第1処理済音声データは、例えば、バーチャル会議室画像データにおけるリモート画像データの位置からリモート参加者Riの音声が聞こえるように、リモート音声データのそれぞれがリモート画像データの位置に基づいて処理されたステレオ音声データ又は三次元音声データである。
【0041】
データ処理装置1は、第1拠点から受信した第1画像データと、複数のリモート画像データとのうち、送信対象のリモート拠点におけるリモート参加者Riを除いた他の複数のリモート参加者Rjのリモート画像それぞれの一部と、を合成して、リモート拠点のそれぞれに送信する第2合成画像データを作成する。
【0042】
また、データ処理装置1は、受信した第1音声データと、送信対象のリモート拠点におけるリモート参加者Riを除いた他のリモート参加者Rjのリモート音声データを処理して、リモート拠点のそれぞれに送信する第2処理済音声データを作成する。第2処理済音声データは、例えば、第1画像データに合成されるリモート画像データの位置からリモート参加者Rjの音声が聞こえるように、リモート音声データが処理されたステレオ音声データ又は三次元音声データである。
【0043】
データ処理装置1は、バーチャル会議室画像データに各リモート画像データが合成された第1合成画像データと、リモート音声データが処理された第1処理済音声データとを第1拠点に送信する。また、データ処理装置1は、第2合成画像データ、第2処理済音声データ、及び第1音声データを各リモート拠点に送信する。なお、データ処理装置1は、合成前の第1画像データとリモート画像データとをリモート拠点へ送信してもよい。また、データ処理装置1は、リモート画像データの位置に基づく処理前のリモート音声データをリモート拠点へ送信してもよい。
【0044】
[データ処理装置1の構成及び動作]
図4は、データ処理装置1の構成を示す図である。データ処理装置1は、通信部11と、記憶部12と、制御部13と、を有する。制御部13は、取得部131と、設定受付部134と、画像データ生成部135と、音声データ生成部136と、データ送信部137と、を有する。
【0045】
通信部11は、ネットワークNを介してルータ21、又はコンピュータ31との間でデータを送信するための通信インターフェースを有する。通信部11は、ルータ21から受信した第1画像データ及び第1音声データを取得部131に入力する。通信部11は、コンピュータ31から受信したリモート画像データ及びリモート音声データを取得部131に入力する。
【0046】
通信部11は、ルータ21、コンピュータ31、又は他の情報端末が送信した設定データを設定受付部134に入力する。設定データは、例えば、リモート会議の属性、参加者の属性、又は画面に表示する画像の態様を示すデータであり、リモート会議の主催者、又はいずれかの参加者により入力されたデータである。リモート会議の主催者は、複数の参加者に含まれていてもよく、複数の参加者に含まれていなくてもよい。
【0047】
また、通信部11は、データ送信部137から入力された各種のデータを各拠点に送信する。具体的には、通信部11は、図3に示したように、合成画像のデータ及び処理済音声のデータ等を各拠点において参加者がリモート会議を視聴するために使用する一以上の電子機器に送信する。
【0048】
記憶部12は、例えばROM(Read Only Memory)、RAM(Random Access Memory)及びSSD(Solid State Drive)等の記憶媒体を有する。記憶部12は、制御部13が実行するプログラムを記憶する。また、記憶部12は、通信部11が受信した各種の設定データを記憶する。さらに、記憶部12は、各拠点から送信された画像データ及び音声データを一時的に記憶する。
【0049】
制御部13は、例えばCPU(Central Processing Unit)を有する。制御部13は、記憶部12に記憶されたプログラムを実行することにより、取得部131、設定受付部134、画像データ生成部135、音声データ生成部136及びデータ送信部137として機能する。
【0050】
取得部131は、第1拠点においてリモート会議に参加する一以上の第1参加者を撮像することにより生成された第1画像データを取得する。また、取得部131は、第1拠点において取得された一以上の第1参加者の音声を含む第1音声データを取得する。取得部131は、通信部11を介して第1画像データ及び第1音声データを取得する。取得部131は、第1音声データを音声データ生成部136に入力し、第1音声データを画像データ生成部135に入力する。
【0051】
また、取得部131は、複数のリモート拠点においてリモート会議に参加するリモート参加者のそれぞれが発した音声に基づく複数のリモート音声データと、リモート参加者のそれぞれに対応する複数のリモート画像データと、を取得する。リモート画像データは、リモート拠点においてリモート参加者を撮像することにより生成された撮像画像データであってもよく、予め作成されたリモート参加者のアバター画像データであってもよい。すなわち、取得部131は、リモート参加者の撮像画像データ又はアバター画像データの少なくともいずれかを取得してもよい。取得部131は、例えば、撮像画像データ及びアバター画像データのうち、画像データ生成部135から要求された方の画像データを取得する。
【0052】
また、取得部131は、リモート拠点において取得されたリモート参加者の音声を含む第2音声データを取得する。取得部131は、通信部11を介してリモート画像データ及びリモート音声データを取得する。取得部131は、リモート画像データを画像データ生成部135に入力し、リモート音声データを音声データ生成部136に入力する。
【0053】
設定受付部134は、通信部11を介して、リモート会議の主催者、又はいずれかの参加者により入力された設定データを取得することにより、各種の設定を受け付ける。設定受付部134は、不図示のキーボード及びマウス等のユーザインターフェースを介して設定を受け付けてもよい。設定受付部134は、例えばリモート会議の属性の設定を受け付ける。設定受付部134は、受け付けたリモート会議の属性を画像データ生成部135に通知する。
【0054】
画像データ生成部135は、ある拠点のディスプレイに表示される画像データとして、複数のリモート拠点から送られてきた複数のリモート画像データそれぞれの少なくとも一部を合成した第1合成画像データを生成する。第1合成画像データは、例えば、既述のバーチャル会議室画像データにリモート画像データそれぞれの少なくとも一部を合成した画像データである。画像データ生成部135は、生成した画像データをデータ送信部137に入力する。
【0055】
一例として、画像データ生成部135は、図2(a)に示したように、バーチャル会議室画像データにおける仮想的なテーブルの周囲に各リモート画像データを合成した第1合成画像データを生成する。また、画像データ生成部135は、複数のリモート画像のうち1つのリモート画像を除く一以上のリモート画像データと、第1拠点から送られてきた第1画像データとを合成することにより、第2合成画像データを生成する。
【0056】
一例として、画像データ生成部135は、図2(b)に示したように、第1拠点の第1画像データ内にリモート参加者R1及びR2のうちリモート参加者R2のリモート画像データを合成した、リモート参加者R1向けの第2合成画像データを生成する。また、図2(c)に示したように、画像データ生成部135は、例えば、第1拠点の第1画像データ内にリモート参加者R1及びR2のうちリモート参加者R1のリモート画像データを合成した、リモート参加者R2向けの第2合成画像データを生成する。
【0057】
第2合成画像データにおいて、個々のリモート画像データは、第1拠点の第1画像データにおけるテーブルの周囲の所定の範囲内の領域に合成されてよい。所定の範囲とは、例えば、第1画像データにおいてテーブル周囲の椅子が配置された領域であってよい。
【0058】
音声データ生成部136は、リモート会議に参加している各拠点に設置されたスピーカから出力される音声データを生成する。音声データ生成部136は、例えば、第1合成画像データにおけるリモート画像データそれぞれの位置に基づいて個々のリモート参加者の音声データを処理することにより、第1拠点の参加者に聞かせる音声に対応する第1処理済音声データを生成する。
【0059】
音声データ生成部136は、第2合成画像データにおけるリモート画像データの位置に基づいてリモート参加者の音声データを処理することにより、他のリモート参加者に聞かせる音声に対応する第2処理済音声データを生成する。音声データ生成部136は、第1拠点の第1参加者の音声を含み、リモート拠点のリモート参加者に聞かせるための音声データを生成してもよい。音声データ生成部136は生成した処理済音声データをデータ送信部137に入力する。
【0060】
音声データ生成部136は、ある拠点のスピーカから出力される音声データとして、他の複数の拠点から送られてきた複数の音声を含むマルチチャンネルの処理済音声データを生成する。マルチチャンネルの処理済音声データは、第1位置(例えば右側)スピーカと第2位置(例えば左側)スピーカから出力される第1位置音声データと第2位置音声データとを含む。マルチチャンネルの処理済音声データは、3以上の位置に対応する3以上の音声データを含んでもよい。
【0061】
一例として、音声データ生成部136は、第1合成画像データにおけるリモート画像の位置に基づいて、第1拠点の第1位置に設置された第1位置スピーカに出力するための第1位置音声データと、第1拠点の第2位置に設置された第2位置スピーカに出力するための第2位置音声データと、を含む第1処理済音声データを生成する。具体的には、音声データ生成部136は、リモート参加者のリモート画像の位置が第2位置よりも第1位置に近い場合に、第1位置音声データに含まれる当該リモート参加者の音声の割合が、第2位置音声データに含まれる当該リモート参加者の音声の割合よりも大きくなるように処理した第1処理済音声データを生成する。
【0062】
音声データ生成部136は、逆に、リモート参加者のリモート画像の位置が第1位置よりも第2位置に近い場合に、第2位置音声データに含まれる当該リモート参加者の音声の割合が、第1位置音声データに含まれる当該リモート参加者の音声の割合よりも大きくなるように処理した第1処理済音声データを生成する。
【0063】
なお、リモート参加者のリモート画像の位置が、第1位置及び第2位置に対してそれぞれ同等の距離である場合、音声データ生成部136は、第1位置音声データ及び第2位置音声データのそれぞれに含まれるリモート参加者の音声の割合が同等であるように処理した第1処理済音声データを生成してよい。
【0064】
音声データ生成部136は、第1合成画像データにおけるリモート画像データの位置の第1拠点における奥行方向の位置を特定した結果にさらに基づいて、第1処理済音声データを生成してもよい。一例として、図2(c)に示した例の場合、リモート参加者R2のリモート画像データの位置は、他のリモート参加者R1よりも奥側なので、音声データ生成部136は、リモート参加者R2の音声がリモート参加者R1よりも小さくなるように処理した第1処理済音声データを生成してもよい。音声データ生成部136がこのような第1処理済音声データを生成することで、当該データに基づく音声を聞く参加者の臨場感が高まる。
【0065】
なお、リモート参加者のリモート画像の位置が、第2位置よりも第1位置に近いか、第1位置よりも第2位置に近いかによらず、音声データ生成部136は、リモート参加者の属性によって、第1位置音声データに含まれる第2参加者の音声の割合が増えるように処理した第1処理済音声データを生成してもよい。音声データ生成部136は、例えば、リモート参加者の声の大きさ、声質、声の通りやすさといった属性を基に、上述したような音声データの割合制御を行ってもよい。
【0066】
具体的には、音声データ生成部136は、バーチャル会議室画像においてリモート参加者R1が他のリモート参加者R1よりも手前側に配置されたとしても、リモート参加者R1の声の大きさが閾値未満である場合、又は声質が聞こえづらいという条件を満たす場合、リモート参加者R1の音声の割合が増えるようにしてもよい。
【0067】
上述した音声データの割合制御は、図2(b)及び図2(c)に示したような第1拠点の第1画像データにリモート画像データが合成される場合について、第1処理済音声データと同様に、第2処理済音声データに適用されてよい。
【0068】
データ送信部137は、画像データ生成部135から入力された画像データ及び音声データ生成部136から入力された音声データを、通信部11を介して、それぞれのデータを送信するべき拠点に向けて送信する。具体的には、データ送信部137は、第1拠点においてリモート会議に参加する一以上の参加者がリモート会議の視聴のために使用する一以上の電子機器に第1合成画像データと第1処理済音声データとを送信する。
【0069】
また、データ送信部137は、第2合成画像データを個々のリモート参加者が使用する情報端末に送信する。すなわち、データ送信部137は、リモート参加者がリモート会議の視聴のために使用するコンピュータ31に第2合成画像データ及び第2処理済音声データを送信する。データ送信部137は、リモート会議の主催者又は参加者から設定を受け付けるためのデータを各拠点に向けて送信してもよい。
【0070】
なお、上述したデータ処理装置1の機能(例えば、制御部13の各種機能)は、複数のデータ処理装置1によって実現されてもよい。例えば、画像データの生成、音声データの生成といった各種の処理は、複数のデータ処理装置1(例えば、複数のサーバのそれぞれに搭載されたプロセッサ)によって分散して行われてもよい。
【0071】
[合成画像データの生成方法]
以下、画像データ生成部135が合成画像データを生成する処理の詳細を説明する。
画像データ生成部135は、例えば、各リモート参加者Riを配置するバーチャル会議室画像データを生成し、生成したバーチャル会議室画像データにリモート拠点におけるリモート参加者のリモート画像データそれぞれの少なくとも一部を合成することにより、図2(a)に例示したような、第1拠点のディスプレイ24に表示される第1合成画像データを生成する。
【0072】
また、画像データ生成部135は、例えば図2(b)及び図2(c)に示したように、第1拠点で撮像された第1画像データにおいて一以上の第1参加者が含まれていない位置に、リモート画像データそれぞれの少なくとも一部を合成することにより、第2合成画像データを生成する。
【0073】
画像データ生成部135は、例えば、第1画像データにおける予め記憶部12に記憶された顔の標準画像データとの類似度が閾値以上の領域を顔の領域として特定し、特定した領域と異なる領域にリモート画像データを合成する。画像データ生成部135は、参加者の身体の領域を特定し、特定した領域と異なる領域にリモート画像データを合成してもよい。
【0074】
画像データ生成部135がバーチャル会議室画像データ又は第1拠点の第1画像データにおいてリモート画像データを合成する位置を決定する方法は任意であり、記憶部12に記憶された合成位置情報を参照することにより、予め決定された位置にリモート画像データを合成してもよい。画像データ生成部135は、例えば、第1画像データの右上又は左上にリモート画像データを合成してもよく、第1画像データの下方の領域にリモート画像データを合成してもよい。第1画像データの下方の領域に一部のリモート参加者のリモート画像データが合成された場合、第1拠点の参加者Aに、当該一部のリモート参加者の拠点が、他のリモート参加者の拠点よりも第1拠点に近いという印象を与えやすくできる。なお、画像データ生成部135は、個々のリモート拠点の位置を示す情報(例えば、都道府県名あるいは住所といった情報)が個々のリモート画像と共に表示されるように合成画像データを生成してもよい。
【0075】
画像データ生成部135は、リモート会議の主催者又は参加者が指定した位置にリモート画像データを合成してもよい。一例として、データ送信部137は、第1画像データをリモート参加者が使用する情報端末であるコンピュータ31に送信し、画像データ生成部135は、コンピュータ31に表示された第1画像データに基づく画像においてリモート参加者により指定された位置にリモート画像データの少なくとも一部を合成することにより第2合成画像データを生成する。画像データ生成部135がこのように動作することで、リモート参加者は、自身が望ましいと思う位置に自身の画像が表示されるようにすることができる。なお、データ送信部137がコンピュータ31に送信する第1画像データは、第1拠点から送信された第1画像データから一以上の第1参加者の画像以外の部分が改変された画像データであってもよい。
【0076】
図5は、リモート参加者がリモート画像データを合成する位置を指定する方法を説明するための図である。図5(a)は、リモート参加者R1又はR2のコンピュータ31に表示される、合成位置を指定するための画面である。図5(a)に示す画面においては、リモート画像データを合成できる位置として、星マークX、星マークYの位置が示されている。図5(b)は、リモート参加者R1が図5(a)における星マークXの位置を指定した場合にリモート参加者R2が使用するコンピュータ31のディスプレイに表示される第2合成画像データである。図5(c)は、リモート参加者R2が図5(a)における星マークYの位置を指定した場合にリモート参加者R1が使用するコンピュータ31のディスプレイに表示される第2合成画像データである。
【0077】
画像データ生成部135は、例えば、人を示す基準画像データとの類似度が閾値以上の領域を第1画像データ内で探索することにより、第1画像データにおける第1参加者の画像の領域を特定し、特定した領域以外の領域に、リモート画像データを合成できる位置を示すマークを付した画像をコンピュータ31に表示させる。画像データ生成部135は、特定した領域以外の領域における、第1参加者の画像の領域の大きさと同程度の大きさの領域の中心位置に、リモート画像データを合成できる位置を示すマークを付した画像をコンピュータ31に表示させてもよい。画像データ生成部135がこのようにして、第2画像データを合成できる位置をリモート参加者に提示することで、リモート参加者が適切に位置を指定することができる。
【0078】
データ送信部137が、第1画像データをリモート会議の主催者として登録された参加者が使用する情報端末に送信し、画像データ生成部135は、主催者の情報端末に表示された第1画像データに基づく画像において指定された位置にリモート画像データの少なくとも一部を合成することにより第2合成画像データを生成してもよい。画像データ生成部135がこのように動作することで、リモート会議の主催者が、複数の参加者の関係又はリモート会議の目的等に適した位置にリモート参加者の画像を配置することができる。
【0079】
データ送信部137が、第1拠点における一以上の第1参加者がリモート会議の視聴のために使用する一以上の電子機器にバーチャル会議室画像データを送信し、画像データ生成部135は、当該一以上の電子機器(例えばルータ21又はコンピュータ22)を介して取得したバーチャル会議室画像データに基づいて第1拠点に設置された表示装置であるディスプレイ24が表示したバーチャル会議室画像において指定された位置にリモート画像データの少なくとも一部を合成することにより第1合成画像データを生成してもよい。画像データ生成部135がこのように動作することで、第1拠点の参加者がバーチャル会議室を見ながら、適切な位置にリモート参加者のリモート画像データを配置することが可能になる。
【0080】
ところで、リモート拠点向けの第2合成画像データにおいて、複数の第1参加者の画像の間にリモート参加者の画像を配置する方がよい場合と、リモート参加者の拠点ごとにリモート参加者の画像を表示させる領域を分ける方がよい場合とがある。一例として、画像データ生成部135は、第1拠点から送られてきた第1画像データに複数の第1参加者が含まれており、他の少なくとも1つのリモート拠点から送られてきたリモート画像に1人のリモート参加者が含まれている場合、図2(b)及び図2(c)に示したように、複数の第1参加者の間にリモート画像を配置した第2合成画像データを生成する。
【0081】
画像データ生成部135がこのような第2合成画像データを生成することで、第2合成画像データに基づく画像を見るリモート拠点のリモート参加者の臨場感が高まる。
【0082】
画像データ生成部135は、複数のリモート参加者の別に、あるいは複数のリモート参加者をグループ分けしたグループの別に、バーチャル会議室画像データを区分した領域の異なる領域にリモート画像を配置した第1合成画像データを生成してもよい。また、画像データ生成部135は、複数のバーチャル会議室画像データを生成し、複数のリモート画像を異なるバーチャル会議室画像データに振り分けて合成することによって第1合成画像データを生成してもよい。
【0083】
画像データ生成部135は、第2合成画像データにおいて、第1拠点から送られてきた第1画像データと異なる領域に少なくとも一部のリモート画像を合成してもよい。例えば、画像データ生成部135は、図6(a)及び図6(b)に示すように、第1拠点の複数の参加者Aが写っている第1画像の領域と異なる領域にリモート拠点のリモート参加者R1又はR2の画像を合成する。
【0084】
画像データ生成部135は、設定受付部134が受け付けた設定の内容に基づいて、図6(a)及び図6(b)に示したように、第1拠点の複数の参加者Aが写っている第1画像の領域と異なる領域にリモート拠点のリモート参加者R1又はR2の画像を配置するか、図2(b)及び図2(c)に示したように、第1拠点の複数の参加者Aが写っている領域内に他の拠点の参加者の画像を配置するかを決定してもよい。複数の参加者が写っている領域は、例えば、複数の参加者の画像を含む最も小さな長円又は楕円の領域である。
【0085】
一例として、画像データ生成部135は、第1拠点の第1参加者Aとリモート拠点のリモート参加者R2(又はR1)とが同じ部署又は企業に属している場合のように、異なる拠点の参加者を同じ領域に表示させるように設定されている場合に、図2(b)(又は図2(c))に示したように、第1拠点の一以上の第1参加者Aが写っている領域内(例えば、テーブルRTの周囲)にリモート参加者R2(又はR1)のリモート画像を配置する。
【0086】
一方、画像データ生成部135は、第1拠点の第1参加者Aとリモート拠点のリモート参加者R2(又はR1)とが異なる部署又は企業に属している場合のように、異なる拠点の参加者を同じ領域に表示させないように設定されている場合に、図6(a)(又は図6(b))に示したように、第1拠点の一以上の第1参加者が写っている領域と異なる領域(例えば、テーブルRTから離れた領域)にリモート参加者R2(又はR1)のリモート画像を配置する。画像データ生成部135がこのように動作することで、各拠点の参加者の所属関係に適した態様で表示されるので、リモート拠点におけるリモート参加者における臨場感がさらに高まる。また、各拠点における参加者の関係性の視認性が向上し、例えば、会議の円滑な進行に資することが期待できる。
【0087】
[第1画像データにおいてリモート参加者のリモート画像データを合成できる位置を指定することが難しい場合]
第1画像データに多数の第1参加者が含まれている場合のように、図5(a)に示したような位置指定が難しい場合がある。例えば、第1拠点に対応する第1画像においてリモート参加者が位置できる候補の位置又は領域(別言すると、空席位置又は空席領域)が存在しない場合があり得る。
【0088】
このようなケースにおいて、画像データ生成部135は、第1拠点に対応する第1画像データの少なくとも一部を加工あるいは改変することにより、リモート参加者のための空席領域を作り出してよい。非限定的な一例として、画像データ生成部135は、第1画像データにおけるテーブルRTに対応する画像データのサイズあるいは形状を変更(例えば、長さ方向に延伸あるいは拡張)することによって、リモート参加者のリモート画像を配置可能な空席領域を仮想的に作り出してよい。
【0089】
図7は、空席領域が作り出される例を模式的に示す図である。図7(a)は、第1拠点におけるテーブルRTの周囲に5名の参加者A1~A5が位置しており、当該テーブルの周囲にはリモート参加者に対応するリモート画像を合成可能な位置(又は領域)の候補が存在しない例を示している。
【0090】
この場合に、画像データ生成部135は、例えば図7(b)に示すように、第1拠点の第1画像データにおけるテーブルRTに対応する画像データ(以下において「テーブル画像データ」と称することがある)を、テーブルRTの長さ方向(矢印で示す方向)に延伸加工する。このような加工によって、テーブルRTの周囲にリモート参加者のリモート画像を合成可能な空席領域が仮想的に作り出される。図7(b)は、テーブルRTを挟んで対面する2つの空席領域X1及びY1が作り出される例を示している。画像データ生成部135は、これら2つの候補である空席領域X1及びY1のいずれか1つを、リモート参加者の画像を合成できる位置として示す画面をリモート参加者に提示する。
【0091】
図8は、空席領域が作り出された状態の画像の例を模式的に示す例であり、第1拠点に4人の第1参加者A1~A4が位置する場合を想定する。図8(a)においては、第1拠点のテーブルRTに仮想的なテーブルVT2が追加されており、テーブルVT2の周囲に空席領域X1及びY1が表示されている。この画面においてリモート参加者R2が空席領域X1又はY1を指定することで、画像データ生成部135は、指定された領域にリモート参加者R2のリモート画像を合成した、図8(b)に示すような第2合成画像データを生成する。
【0092】
画像データ生成部135によるこのような処理によって、リモート参加者のリモート画像が第1拠点において表示される第1画像に合成できないようなケースを減らすことができるため、会議の臨場感を損なわずに、リモート参加者を第1拠点に仮想的に登場させられる確率を高めることができる。
【0093】
なお、画像データ生成部135は、第1画像データ内に空席領域がないことを条件にして空席領域を作り出してもよいが、空席領域がある場合に空席領域を作り出してもよい。一例として、画像データ生成部135は、第1拠点の参加者A及びリモート拠点のリモート参加者の何れかから、空席領域を増やすための指示を受けたことに応じて空席領域を作り出してもよい。
【0094】
また、画像データ生成部135は、第1画像データ内の空席領域の有無に依らずに、仮想的なテーブルVT2を第1画像データにおいて配置してもよい。例えば、画像データ生成部135は、第1拠点のディスプレイ24に表示されたテーブルRTに、バーチャル会議室画像における仮想的なテーブルVT(例えば図2(a)参照)が視覚的に繋がって見えるように仮想的なテーブルVT2を第1画像データに配置してよい。あるいは、画像データ生成部135は、例えば、ディスプレイ24に表示されたバーチャル会議室画像におけるテーブルRTに、第1拠点に配置された現実のテーブルが近接して配置されているかのように見せるために仮想的なテーブルVT2を第1画像データに配置してもよい。
【0095】
このような仮想テーブルVT2の配置によって、第1拠点における第1参加者は、第1拠点と各リモート参加者が位置するバーチャル会議室とがあたかも1つの会議室空間において会議を行っているかのように感じることができ、会議の一体感や会議の臨場感を更に向上できる。
【0096】
[リモート参加者の撮像画像データの加工]
ところで、リモート拠点では、リモート参加者が、リモート会議に使用するラップトップPCのような情報端末のカメラに向かって正対している場合がある。このような場合、データ処理装置1において取得されるリモート拠点のリモート画像データは、リモート参加者を正面から撮像した画像データ(以下、「正面画像データ」も称する)である。
【0097】
このような正面画像データを第1画像データ(又は第3拠点の第3画像データ)にそのまま合成した場合、第1画像データにおいて、第1拠点における参加者の顔の向き又は身体の向きと、リモート参加者の顔の向き又は身体の向きとが一致しない可能性がある。
【0098】
例えば、第1拠点のディスプレイ24に視線を向けた姿勢の第1参加者が含まれる第1画像データに、リモート拠点におけるリモート参加者の正面画像データをそのまま合成した場合、ディスプレイ24から逸れた方向に視線を向けた姿勢の第2参加者が含まれる合成画像データが生成される。
【0099】
このような場合、不自然な向きに配置されたリモート参加者を含む合成画像データが、第1拠点において表示されるため、リモート会議の一体感あるいは臨場感が低下し得る。このような不自然さを低減すべく、画像データ生成部135は、リモート画像データを加工(例えば、変形)することにより、合成画像データにおけるリモート参加者の向きを調整してよい。
【0100】
例えば、画像データ生成部135は、リモート画像データにおけるリモート参加者の顔領域に対応する画像データ(以下、「顔画像データ」とも称する)を、視線方向がディスプレイ24に向かう方向となるように変形する。一例として、画像データ生成部135は、リモート画像データの手前方向に視線方向が向くように顔画像データを変形する。また、画像データ生成部135は、例えば、リモート画像データにおけるリモート参加者の身体領域に対応する画像データ(以下、「身体画像データ」とも称する)を、第1画像データにおけるテーブルの配置方向に基づいて、当該テーブルに向かう方向に変形する。
【0101】
別言すると、画像データ生成部135は、第2画像データに含まれる顔画像と身体画像とに個別に(例えば、異なる)画像処理を施すことにより第2参加者の撮像画像データを変形してよい。
【0102】
以上のような第2画像データの加工処理によって、第1拠点において表示される合成画像データにおけるリモート参加者の不自然さを軽減できる。したがって、リモート会議の一体感あるいは臨場感が低下することを抑制できる。
【0103】
[撮像画像とアバター画像の利用]
各拠点に設置されたディスプレイに表示される画像には、各参加者の撮像画像が表示されてもよいが、各参加者のアバター画像が表示されてもよい。画像データ生成部135は、例えば設定受付部134が受け付けたリモート会議の主催者又は参加者による設定の内容に基づいて、各参加者の撮像画像データを含む合成画像データを生成するか、各参加者のアバター画像データを含む合成画像データを生成するかを決定する。
【0104】
画像データ生成部135は、ディスプレイに同時に表示される複数の拠点の複数の参加者の画像が、撮像画像又はアバター画像のいずれかに統一されるようにしてもよい。一例として、画像データ生成部135は、第1拠点の第1参加者の画像をアバター画像とすることが設定された場合、リモート拠点のリモート参加者の画像を撮像画像にするかアバター画像にするかの設定が行われていないとしても、第1参加者のアバター画像データが含まれる第1画像データにリモート参加者のアバター画像データを合成することにより第2合成画像データを生成する。
【0105】
一方、画像データ生成部135は、第1拠点の第1参加者の画像を撮像画像とすることが設定された場合、リモート拠点のリモート参加者の画像を撮像画像にするかアバター画像にするかの設定が行われていないとしても、第1参加者の撮像画像データが含まれる第1画像データにリモート参加者の撮像画像データを合成することにより第2合成画像データを生成する。このように、画像データ生成部135が、撮像画像データ又はアバター画像データのいずれか一方により構成される合成画像データを生成することで、一部の参加者の画像の種類が異なることによる違和感が生じることを防げる。
【0106】
画像データ生成部135は、設定受付部134を介して設定されたリモート会議の属性に基づいて、リモート画像データとして撮像画像データを用いるかアバター画像データを用いるかを決定してもよい。一例として、画像データ生成部135は、リモート会議の属性が社内会議である場合にリモート画像データとしてアバター画像データを使用し、リモート会議の属性が社外の人との会議である場合に撮像画像データを使用する。画像データ生成部135がこのように動作することで、例えば、アバター画像を表示すれば足りるリモート会議のためにリモート参加者が服装を整える必要がなくなる。
【0107】
[データ処理装置1における処理の流れ]
図9は、データ処理装置1における処理の流れを示すフローチャートである。図9に示すフローチャートは、リモート会議の主催者がリモート会議を開始する操作を行い、リモート会議を開始する要求を設定受付部134が取得した時点から開始している。
【0108】
リモート会議が開始すると、取得部131は、第1拠点の第1画像データ、複数のリモート拠点それぞれのリモート画像データを取得する(S11)。図9には示していないが、取得部131は、継続的に第1画像データ、リモート画像データを取得する。
【0109】
この間、設定受付部134は、リモート画像データを合成する位置を指定する要求がリモート拠点のコンピュータ31から送信されてきたか否かを監視する(S12)。設定受付部134が、合成位置を指定する要求を受けたと判定した場合(S12においてYES)、画像データ生成部135は、例えば、要求の送信元に対応するリモート参加者が第1拠点の参加者と同じ組織に所属しているか否かを判定する(S13)。
【0110】
画像データ生成部135は、当該リモート参加者が第1拠点の参加者と同じ組織に所属していると判定した場合(S13においてYES)、第1画像データに基づく位置指定画面データをリモート参加者のコンピュータ31に送信する(S14)。画像データ生成部135は、位置指定画面をコンピュータ31に送信した後に、第2参加者が指定した位置を示す情報をコンピュータ31から取得した場合、当該情報が示す位置を第1画像データにおけるリモート画像(すなわち第2画像)の合成位置に決定する(S15)。
【0111】
S12において所定の期間にわたって合成位置を指定する要求が送られてこない場合(S12においてNO)、画像データ生成部135は、リモート参加者の指示によることなく第1画像におけるリモート画像(すなわち第2画像)の合成位置を決定する(S15)。一例として、画像データ生成部135は、リモート参加者が第1拠点の参加者と同じ組織に所属している場合に、第1画像データにおいてリモート参加者の画像データが含まれている領域内の位置(例えば、第1拠点のテーブルRTの周囲の位置)をリモート画像データの合成位置に決定する。リモート参加者が第1拠点の参加者と同じ組織に所属していない場合、画像データ生成部135は、第1画像データにおいて第1参加者の画像が含まれていない領域内の位置(例えば、第1拠点のテーブルRTから離れた位置)をリモート画像データの合成位置に決定する。
【0112】
続いて、画像データ生成部135は、各リモート参加者Riのリモート画像をバーチャル会議室画像に合成した第1合成画像データを生成すると共に、第1画像データにおける合成位置にリモート画像データを配置することにより、第2合成画像データを生成する(S16)。また、音声データ生成部136は、リモート画像データの合成位置に基づいて処理済音声データを生成する(S17)。データ送信部137は、画像データ生成部135が生成した合成画像データ、及び音声データ生成部136が生成した処理済音声データを、各データに対応する拠点に送信する(S18)。なお、合成画像データの生成(S16)は、処理済音声データの生成(S17)よりも後に行われてもよいし、処理済音声データの生成(S17)と並行して行われてもよい。
【0113】
設定受付部134がリモート会議を終了するための指示をリモート会議の主催者から受けていない場合(S19においてNO)、取得部131は、第1画像データ、複数のリモート画像データ(すなわち第2画像データ)を取得し(S20)、画像データ生成部135、音声データ生成部136及びデータ送信部137は、S16からS18までの処理を繰り返す。設定受付部134がリモート会議を終了するための指示をリモート会議の主催者から受けた場合(S19においてYES)、制御部13は処理を終了する。
【0114】
[変形例1]
以上の説明においては、複数のリモート拠点のそれぞれにおいてリモート参加者が1名であることを想定したが、1つのリモート拠点に複数のリモート参加者が存在していてもよい。この場合、画像データ生成部135は、複数のリモート参加者に対応する複数のリモート画像データそれぞれの一部を、第1画像データにおける一以上の第1参加者に対応する位置と異なる位置に合成する。
【0115】
また、第1拠点の参加者とリモート拠点の一部又は全部の参加者とが同じ組織に属しており、個々のリモート拠点に表示される画像において、第1拠点の一以上の第1参加者とリモート拠点の一以上のリモート参加者とが混在した状態で表示される方がよいという場合もある。このような場合、画像データ生成部135は、第1画像データ及びリモート画像データから、一以上の第1参加者の画像データと一以上のリモート参加者の画像データとを抽出し、抽出した複数の画像データを合成することにより、リモート拠点に送信する合成画像データを生成してもよい。
【0116】
[データ処理装置1による効果]
以上説明したように、画像データ生成部135は、第1拠点及び複数のリモート拠点のそれぞれに一以上の参加者がいるリモート会議において、複数のリモート拠点のそれぞれにおいて撮影された複数のリモート画像をバーチャル会議室画像に合成することにより第1合成画像データを生成する。また、音声データ生成部136は、合成画像データにおけるリモート画像データの位置に基づいてリモート参加者の音声を処理することにより処理済音声データを生成する。そして、データ送信部137は、合成画像データ及び処理済音声データを第1拠点における第1参加者が視聴できるように、第1拠点の一以上の電子機器に送信する。データ処理装置1がこのように構成されていることで、第1拠点の第1参加者は、複数のリモート拠点それぞれのリモート参加者がバーチャル会議室画像に集まって第1参加者と一緒にリモート会議に参加しているような臨場感を得ることができる。
【0117】
上述した実施の形態において、「画像データ」には2次元データに限られず3次元データ(例えば、参加者を立体的に表すホログラムデータ)が含まれてもよい。例えば、3次元ホログラフィ技術によって参加者を立体的に表示(あるいは投影)する場合に、上述した実施の形態において説明したような画像処理が適用されてもよい。
【0118】
上述した実施の形態において、「拠点」という用語は、例えば、「ベース」、「スペース」、「会議室」、あるいは「部屋」といった、リモート会議に参加する人が位置する場所を意味する用語に読み替えられてもよい。「組織」という用語は、例えば、「団体」、「グループ」、「チーム」、あるいは「サークル」といった人の集まり(集団)を意味する用語に読み替えられてもよい。また、「送信」という用語は、例えば、「出力」に読み替えられてよく、「(画像データの)合成」という用語は、例えば、「重畳」に読み替えられてもよい。「特定」という用語は、例えば、「検出」あるいは「識別」に読み替えられてもよい。
【0119】
また、上述した実施の形態に例示した構成について使用した「~部」という用語は、例えば、「~手段」、「~回路」、あるいは「~デバイス」といった他の用語に互いに読み替えられてもよい。
【0120】
また、上述した実施の形態において、「第1」、「第2」、「第3」といった用語は、2以上の要素間を区別するために便宜的に用いられ、当該用語が参照する要素の物理量、優劣、あるいは順序を限定しない。
【0121】
なお、本発明により、国連が主導する持続可能な開発目標(SDGs)の目標9「産業と技術革新の基盤をつくろう」に貢献することが可能となる。
【0122】
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を併せ持つ。
【符号の説明】
【0123】
1 データ処理装置
11 通信部
12 記憶部
13 制御部
21 ルータ
22 コンピュータ
23 カメラ
24 ディスプレイ
25 スピーカ
31 コンピュータ
131 取得部
134 設定受付部
135 画像データ生成部
136 音声データ生成部
137 データ送信部
図1
図2
図3
図4
図5
図6
図7
図8
図9