(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024121239
(43)【公開日】2024-09-06
(54)【発明の名称】処理装置、プログラム及び処理方法
(51)【国際特許分類】
H04N 7/15 20060101AFI20240830BHJP
H04L 51/04 20220101ALI20240830BHJP
H04L 67/104 20220101ALI20240830BHJP
【FI】
H04N7/15 120
H04N7/15
H04L51/04
H04L67/104
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2023028216
(22)【出願日】2023-02-27
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.JAVASCRIPT
(71)【出願人】
【識別番号】000000295
【氏名又は名称】沖電気工業株式会社
(74)【代理人】
【識別番号】100129067
【弁理士】
【氏名又は名称】町田 能章
(74)【代理人】
【識別番号】100183162
【弁理士】
【氏名又は名称】大塚 義文
(74)【代理人】
【識別番号】110001807
【氏名又は名称】弁理士法人磯野国際特許商標事務所
(72)【発明者】
【氏名】小林 将平
【テーマコード(参考)】
5C164
【Fターム(参考)】
5C164FA10
5C164GA03
5C164UD63S
5C164VA13P
5C164VA22P
(57)【要約】
【課題】ビデオ会議システムにおけるトラフィック量を低減させる。
【解決手段】SFU(Selective Forwarding Unit)サーバであるメディアサーバ1Aは、送受信部11、合成部12を備えている。例えば、送受信部11は、スマートフォン10、PC20、ネットワークカメラ30、その他端末40、及び外部端末50の各々からメディアデータを受信する。合成部12は、受信した各メディアデータを合成した合成済みメディアデータを生成する。送受信部11は、合成済みメディアデータをスマートフォン10に送信する。また、その他端末40が、PC20からのメディアデータを要求(希望)する場合、メディアサーバ1Aは、その他端末40とPC20と、それぞれの端末に対してP2P(Pier to Pier)接続を確立し、送受信部11は、その要求(設定部13が設定情報として保持)に基づいて、PC20からのメディアデータをその他端末40に送信する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
複数の装置と接続される処理装置であって、
第2の装置から第2設定の情報を受信し、第3の装置から第3設定の情報を受信する第1の処理部と、
第1の装置から第1メディアの情報を受信し、前記第2の装置から第2メディアの情報を受信し、前記第3の装置から第3メディアの情報を受信する第2の処理部と、
前記第1メディアの情報と前記第2メディアの情報とを合成して第4メディアの情報を生成する第3の処理部と、
前記第2の装置に対して、前記第2設定の情報に基づいて、前記第1メディアの情報をP2P(Pier to Pier)にて送信し、前記第3メディアの情報をP2Pにて送信し、前記第3の装置に対して、前記第3設定の情報に基づいて、前記第4メディアの情報をP2Pにて送信する第4の処理部と、
を備えることを特徴とする処理装置。
【請求項2】
前記処理装置としての第1処理装置と、前記処理装置としての第2処理装置が前記第1メディアの情報、前記第2メディアの情報、前記第3メディアの情報、及び前記第4メディアの情報を送受信する、請求項1に記載の処理装置。
【請求項3】
前記第1処理装置で生成した前記第4メディアの情報を第5メディアの情報とし、
前記第2処理装置で生成した前記第4メディアの情報を第6メディアの情報とした場合、
前記処理装置としての第3処理装置が、前記第1処理装置から受信した前記第5メディアの情報と、前記第2処理装置から受信した前記第6メディアの情報とを合成して第7メディアの情報を生成する、請求項2に記載の処理装置。
【請求項4】
前記第1の装置、前記第2の装置、及び前記第3の装置の少なくとも何れかが、WebRTC(Web Real-Time Communication)のマルチチャネル未対応の端末であり、
前記処理装置がWebRTCゲートウェイである、請求項1から請求項3の何れか1項に記載の処理装置。
【請求項5】
複数の装置と接続される処理装置であって、
少なくとも一つ以上の前記装置からメディアの情報の要求を受信し、設定の情報として保持させる第1の処理部と、
前記装置からメディアの情報を受信する第2の処理部と、
複数の前記装置から受信した前記メディアの情報を合成して、合成済みのメディアの情報を生成する第3の処理部と、
前記設定の情報に基づいて、前記メディアの情報及び前記合成済みのメディアの情報の一方又は双方を、P2P(Pier to Pier)にて前記装置に送信する第4の処理部と、
を備えることを特徴とする処理装置。
【請求項6】
コンピュータを、複数の装置と接続される処理装置として機能させるプログラムであって、
前記コンピュータを、
第2の装置から第2設定の情報を受信し、第3の装置から第3設定の情報を受信する第1の処理部、
第1の装置から第1メディアの情報を受信し、前記第2の装置から第2メディアの情報を受信し、前記第3の装置から第3メディアの情報を受信する第2の処理部、
前記第1メディアの情報と前記第2メディアの情報とを合成して第4メディアの情報を生成する第3の処理部、
前記第2の装置に対して、前記第2設定の情報に基づいて、前記第1メディアの情報をP2Pにて送信し、前記第3メディアの情報をP2Pにて送信し、前記第3の装置に対して、前記第3設定の情報に基づいて、前記第4メディアの情報をP2Pにて送信する第4の処理部、
として機能させることを特徴とするプログラム。
【請求項7】
コンピュータを、複数の装置と接続される処理装置として機能させるプログラムであって、
前記コンピュータを
少なくとも一つ以上の前記装置からメディアの情報の要求を受信し、設定の情報として保持させる第1の処理部、
前記装置からメディアの情報を受信する第2の処理部、
複数の前記装置から受信した前記メディアの情報を合成して、合成済みのメディアの情報を生成する第3の処理部、
前記設定の情報に基づいて、前記メディアの情報及び前記合成済みのメディアの情報の一方又は双方を、P2P(Pier to Pier)にて前記装置に送信する第4の処理部、
として機能させることを特徴とするプログラム。
【請求項8】
複数の装置と接続される処理装置における処理方法であって、
前記処理装置は、
第2の装置から第2設定の情報を受信し、第3の装置から第3設定の情報を受信する第1のステップと、
第1の装置から第1メディアの情報を受信し、前記第2の装置から第2メディアの情報を受信し、前記第3の装置から第3メディアの情報を受信する第2のステップと、
前記第1メディアの情報と前記第2メディアの情報とを合成して第4メディアの情報を生成する第3のステップと、
前記第2の装置に対して、前記第2設定の情報に基づいて、前記第1メディアの情報をP2Pにて送信し、前記第3メディアの情報をP2Pにて送信し、前記第3の装置に対して、前記第3設定の情報に基づいて、前記第4メディアの情報をP2Pにて送信する第4のステップと、
を実行することを特徴とする処理方法。
【請求項9】
複数の装置と接続される処理装置における処理方法であって、
前記処理装置は、
少なくとも一つ以上の前記装置からメディアの情報の要求を受信し、設定の情報として保持させる第1のステップと、
前記装置からメディアの情報を受信する第2のステップと、
複数の前記装置から受信した前記メディアの情報を合成して、合成済みのメディアの情報を生成する第3のステップと、
前記設定の情報に基づいて、前記メディアの情報及び前記合成済みのメディアの情報の一方又は双方を、P2P(Pier to Pier)にて前記装置に送信する第4のステップと、
を実行することを特徴とする処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、処理装置、プログラム及び処理方法に関する。
【背景技術】
【0002】
従来、WebRTC(Web Real-Time Communication)を用いたビデオ会議システムでは、MCU(Multi-point Control Unit)と比べてトラフィック量は増加するがサーバの負荷を低減できる、SFU(Selective Forwarding Unit)による実装が一般的となっている。WebRTCについては、非特許文献1に開示されている。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】“VTVジャパン株式会社”、“Web会議がブラウザから参加できるしくみ:WebRTCとは?”、[online]、[令和5年2月3日検索]、インターネット<URL:https://www.vtv.co.jp/vtvonline/know-learn/dictionary/001-webrtc.html>
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、SFUでは、SFUサーバは、あるクライアント端末に対して、SFUサーバに接続されたクライアント端末の数だけ、P2P(Pier to Pier)を確立する必要がある。具体的には、SFUサーバに接続された全クライアント端末がメディアデータを送信し、かつ、クライアント端末が自機以外の全てのクライアント端末のメディアデータを受信する場合、クライアント端末は[サーバに接続されたクライアント端末の数]だけP2Pを確立させることとなり、SFUサーバは[接続されたクライアント端末の数]の2乗の数だけ、P2Pを確立させることとなる。
さらに、SFUでは、基本的に1つのP2Pにつき、1台のクライアント端末のメディアデータを送信、もしくは受信を行う。そのため、SFUサーバに接続されるクライアント端末の数が増えるにつれ、トラフィック量も増加してしまう。
これらのことから、トラフィック量に制限のある環境下、もしくはトラフィック量に応じてコストが変動する環境下にて、SFUによるテレビ会議を行う場合、制限を超えないように、トラフィック量に制限する必要がある。
【0005】
上記事情に鑑みて、本発明は、ビデオ会議システムにおけるトラフィック量を低減させることを課題とする。
【課題を解決するための手段】
【0006】
前記課題を解決する本発明は、
複数の装置と接続される処理装置であって、
第2の装置から第2設定の情報を受信し、第3の装置から第3設定の情報を受信する第1の処理部と、
第1の装置から第1メディアの情報を受信し、前記第2の装置から第2メディアの情報を受信し、前記第3の装置から第3メディアの情報を受信する第2の処理部と、
前記第1メディアの情報と前記第2メディアの情報とを合成して第4メディアの情報を生成する第3の処理部と、
前記第2の装置に対して、前記第2設定の情報に基づいて、前記第1メディアの情報をP2P(Pier to Pier)にて送信し、前記第3メディアの情報をP2Pにて送信し、前記第3の装置に対して、前記第3設定の情報に基づいて、前記第4メディアの情報をP2Pにて送信する第4の処理部と、
を備えることを特徴とする処理装置である。
また、本発明は、
複数の装置と接続される処理装置であって、
少なくとも一つ以上の前記装置からメディアの情報の要求を受信し、設定の情報として保持させる第1の処理部と、
前記装置からメディアの情報を受信する第2の処理部と、
複数の前記装置から受信した前記メディアの情報を合成して、合成済みのメディアの情報を生成する第3の処理部と、
前記設定の情報に基づいて、前記メディアの情報及び前記合成済みのメディアの情報の一方又は双方を、P2P(Pier to Pier)にて前記装置に送信する第4の処理部と、
を備えることを特徴とする処理装置である。
【0007】
また、本発明は、
コンピュータを、複数の装置と接続される処理装置として機能させるプログラムであって、
コンピュータを、
第2の装置から第2設定の情報を受信し、第3の装置から第3設定の情報を受信する第1の処理部、
第1の装置から第1メディアの情報を受信し、前記第2の装置から第2メディアの情報を受信し、前記第3の装置から第3メディアの情報を受信する第2の処理部、
前記第1メディアの情報と前記第2メディアの情報とを合成して第4メディアの情報を生成する第3の処理部、
前記第2の装置に対して、前記第2設定の情報に基づいて、前記第1メディアの情報をP2Pにて送信し、前記第3メディアの情報をP2Pにて送信し、前記第3の装置に対して、前記第3設定の情報に基づいて、前記第4メディアの情報をP2Pにて送信する第4の処理部、
として機能させることを特徴とするプログラムである。
また、本発明は、
コンピュータを、複数の装置と接続される処理装置として機能させるプログラムであって、
前記コンピュータを
少なくとも一つ以上の前記装置からメディアの情報の要求を受信し、設定の情報として保持させる第1の処理部、
前記装置からメディアの情報を受信する第2の処理部、
複数の前記装置から受信した前記メディアの情報を合成して、合成済みのメディアの情報を生成する第3の処理部、
前記設定の情報に基づいて、前記メディアの情報及び前記合成済みのメディアの情報の一方又は双方を、P2P(Pier to Pier)にて前記装置に送信する第4の処理部、
として機能させることを特徴とするプログラムである。
【0008】
また、本発明は、
複数の装置と接続される処理装置における処理方法であって、
前記処理装置は、
第2の装置から第2設定の情報を受信し、第3の装置から第3設定の情報を受信する第1のステップと、
第1の装置から第1メディアの情報を受信し、前記第2の装置から第2メディアの情報を受信し、前記第3の装置から第3メディアの情報を受信する第2のステップと、
前記第1メディアの情報と前記第2メディアの情報とを合成して第4メディアの情報を生成する第3のステップと、
前記第2の装置に対して、前記第2設定の情報に基づいて、前記第1メディアの情報をP2Pにて送信し、前記第3メディアの情報をP2Pにて送信し、前記第3の装置に対して、前記第3設定の情報に基づいて、前記第4メディアの情報をP2Pにて送信する第4のステップと、
を実行することを特徴とする処理方法である。
また、本発明は、
複数の装置と接続される処理装置における処理方法であって、
前記処理装置は、
少なくとも一つ以上の前記装置からメディアの情報の要求を受信し、設定の情報として保持させる第1のステップと、
前記装置からメディアの情報を受信する第2のステップと、
複数の前記装置から受信した前記メディアの情報を合成して、合成済みのメディアの情報を生成する第3のステップと、
前記設定の情報に基づいて、前記メディアの情報及び前記合成済みのメディアの情報の一方又は双方を、P2P(Pier to Pier)にて前記装置に送信する第4のステップと、
を実行することを特徴とする処理方法である。
【発明の効果】
【0009】
本発明によれば、ビデオ会議システムにおけるトラフィック量を低減させることができる。
【図面の簡単な説明】
【0010】
【
図1】第1実施形態におけるビデオ会議システムの機能構成図である。
【
図2】第1実施形態におけるメディアデータ及び合成済みメディアデータの送受信の説明図である。
【
図3】第2実施形態におけるビデオ会議システムの機能構成図である。
【
図4】第2実施形態におけるメディアデータ及び合成済みメディアデータの送受信の説明図である。
【
図5】第3実施形態におけるビデオ会議システムの機能構成図である。
【
図6】第3実施形態におけるメディアデータ及び合成済みメディアデータの送受信の説明図である。
【
図7】メディアサーバが実行する処理を示すフローチャートである。
【発明を実施するための形態】
【0011】
以下、図面を参照して、本発明の実施の形態について詳細に説明する。各図は、本発明を十分に理解できる程度に、概略的に示してあるに過ぎない。よって、本発明は、図示例のみに限定されるものではない。また、参照する図面において、本発明を構成する部材の寸法は、説明を明確にするために誇張して表現されている場合がある。なお、各図において、共通する構成要素や同様な構成要素については、同一の符号を付し、それらの重複する説明を省略する。
【0012】
[第1実施形態]
第1実施形態では、SFUサーバで、受信したメディアデータの合成処理を行い、所定のクライアント端末に合成したメディアデータを送信することで、トラフィック量を削減するシステムを実現する。
【0013】
<構成>
図1は、第1実施形態におけるビデオ会議システムの機能構成図である。
図1に示すように、ビデオ会議システム100A(100)は、メディアサーバ1A(1)と、スマートフォン10と、PC20と、ネットワークカメラ30と、その他端末40と、外部端末50とを備えている。メディアサーバ1A、スマートフォン10、PC20、ネットワークカメラ30、その他端末40、及び外部端末50は、通信可能に接続されている。メディアサーバ1A、スマートフォン10、PC20、ネットワークカメラ30、およびその他端末40は、プライベートネットワークNW1上に配置されている。外部端末50は、パブリックネットワークNW2を介してメディアサーバ1A、スマートフォン10、PC20、ネットワークカメラ30、及びその他端末40と通信できる。
【0014】
スマートフォン10(タブレットでもよい)、PC20、ネットワークカメラ30、その他端末40、及び外部端末50は、メディアデータを処理してビデオ会議を行うクライアント端末である。説明の便宜上、スマートフォン10、PC20、ネットワークカメラ30、その他端末40、及び外部端末50をそれぞれ、「端末」と称する場合がある。メディアデータ(実細線矢印)は、ビデオ会議用の画像データ、映像データ、音声データ等を含む。
【0015】
端末10~50のユーザがビデオ会議に参加する際、端末10~50は、ユーザ自身を撮影した映像データ等をメディアデータとしてメディアサーバ1Aに送信できる。ビデオ会議を行う端末10~50はそれぞれ、メディアデータをメディアサーバ1Aに送信するため、メディアサーバ1Aとの間でP2P接続を確立する。ここで、メディアサーバ1Aは、端末10~50それぞれから受信したメディアデータを他の端末に送信するため、他の端末との間でP2P接続を確立している。また、端末10~50はそれぞれ、自身のユーザ以外のユーザを撮影した映像データ等をメディアデータとして受信できる。例えば、端末10~50はそれぞれ、SFUの方式に従い、受信したメディアデータをレンダリングの技術を用いて再生できる。具体的には、端末10~50はそれぞれ、各ユーザを撮影した映像データを表示サイズや表示レイアウト等を調整してまとめて画面表示できる。
【0016】
メディアサーバ1Aは、SFUサーバである。メディアサーバ1Aは、SFUと同等の方法で端末10~50とP2Pで接続し、端末10~50の各々からメディアデータを受信する。
図1に示すように、メディアサーバ1Aは、送受信部11と、合成部12と、設定部13とを備えている。
【0017】
送受信部11は、端末10~50との間でメディアデータを送受信する。メディアサーバ1Aは、端末10~50との間でP2P接続を確立している。
【0018】
合成部12は、端末10~50の一部又はすべてから受信したメディアデータを合成する。例えば、合成部12は、SFUの方式に従い、受信したメディアデータをレンダリングの技術を用いて合成できる。具体的には、合成部12、端末10~50の各ユーザを撮影した映像データを表示サイズや表示レイアウト等を調整してまとめてメディアデータを合成済みメディアデータ(実太線矢印)として生成できる。送受信部11は、合成済みメディアデータを端末10~50に送信できる。
【0019】
設定部13は、メディアデータ及び合成メディアデータを端末10~50に送信する際のルールを示す設定情報を保持する。送受信部11は、設定情報に基づいて、メディアデータ及び合成済みメディアデータを端末10~50に送信できる。設定情報は、端末10~50の各々に対して用意できる。よって、送受信部11は、端末10~50の各々に対して、異なるメディアデータや、異なる合成メディアデータを送信できる。また、設定部13は、端末10~50の各々から設定情報を受信(取得)する。
【0020】
例えば、合成部12は、受信したすべての端末10~50のメディアデータを合成済みメディアデータとして合成できる。また、例えば、合成部12は、合成済みメディアデータの送信先となる端末を除くすべての端末から受信したメディアデータを合成済みメディアデータとして合成できる。
【0021】
送受信部11は、合成済みメディアデータを希望する(要求する)端末10~50に対し、1つのP2P接続で合成済みメディアデータを送信できる。このとき、端末10~50はそれぞれ、合成済みメディアデータの要求と併せて、特定のメディアデータをメディアサーバ1Aに要求することができる。「特定のメディアデータ」とは、例えば、要求を行う端末以外の端末からメディアサーバ1Aが取得するメディアデータであるが、これに限定されない。設定部13は、端末10~50の各々が合成済みメディアデータ及び特定のメディアデータを要求する際の要求内容を設定情報として端末10~50ごとに保持できる。設定情報は、要求を満たすのに必要となるP2P接続の確立を示す情報も含む。そのため、メディアサーバ1Aは、要求(希望)の対象となる合成済みメディアデータや、要求(希望)の対象となる特定のメディアデータを、要求(希望)をした端末10~50に個別に送信できる。
【0022】
図2は、第1実施形態におけるメディアデータ及び合成済みメディアデータの送受信の説明図である。メディアデータ及び合成済みメディアデータが、
図2に示すように送受信されていたとする。
具体的には、スマートフォン10は、自身のメディアデータをメディアサーバ1Aに送信する。また、スマートフォン10は、PC20、ネットワークカメラ30、及び外部端末50の各々のメディアデータを合成部12で合成した合成済みメディアデータをメディアサーバ1Aから受信する(特定のメディアデータの受信は無い)。
PC20は、自身のメディアデータをメディアサーバ1Aに送信する。また、PC20は、スマートフォン10、ネットワークカメラ30、その他端末40、及び外部端末50の各々から各自のメディアデータを受信する(合成済みメディアデータの受信は無い)。
ネットワークカメラ30は、自身のメディアデータをメディアサーバ1Aに送信する(特定のメディアデータの受信も合成済みメディアデータの受信も無い)。
その他端末40は、自身のメディアデータをメディアサーバ1Aに送信する。また、その他端末40は、PC20からPC20のメディアデータを受信する(合成済みメディアデータの受信は無い)。
外部端末50は、自身のメディアデータをメディアサーバ1Aに送信する。また、外部端末50は、スマートフォン10、PC20、ネットワークカメラ30、及びその他端末40の各々のメディアデータを合成部12で合成した合成済みメディアデータをメディアサーバ1Aから受信する(特定のメディアデータの受信は無い)。
【0023】
図2の場合、設定部13は、スマートフォン10から設定情報を事前に取得している。スマートフォン10からの設定情報には、PC20、ネットワークカメラ30、及び外部端末50の各々のメディアデータを合成した合成済みメディアデータの要求が含まれている。また、スマートフォン10からの設定情報には、他の端末に関するメディアデータの要求は無いため、メディアサーバ1Aを介したスマートフォン10と他の端末とのP2P接続の確立を示す情報は無い。メディアサーバ1Aは、スマートフォン10からの設定情報に基づいて、合成部12に合成済みメディアデータを合成させ、スマートフォン10に送信する。
また、設定部13は、PC20から設定情報を事前に取得している。PC20からの設定情報には、スマートフォン10、ネットワークカメラ30、その他端末40、及び外部端末50の各々のメディアデータの要求が含まれている。また、PC20からの設定情報には、メディアサーバ1Aを介したPC20と、スマートフォン10、ネットワークカメラ30、その他端末40、及び外部端末50の各々とのP2P接続の確立を示す情報が含まれている。メディアサーバ1Aは、PC20からの設定情報に基づいて、スマートフォン10、ネットワークカメラ30、その他端末40、及び外部端末50の各々のメディアデータをPC20に送信する。
また、設定部13は、ネットワークカメラ30から設定情報を事前に取得している。ネットワークカメラ30からの設定情報には、合成済みメディアデータの要求も他の端末に関するメディアデータの要求も無い。また、ネットワークカメラ30からの設定情報には、他の端末に関するメディアデータの要求は無いため、メディアサーバ1Aを介したネットワークカメラ30と他の端末とのP2P接続の確立を示す情報は無い。メディアサーバ1Aは、ネットワークカメラ30からの設定情報に基づいて、ネットワークカメラ30に合成済みメディアデータも他の端末に関するメディアデータも送信しない。
また、設定部13は、その他端末40から設定情報を事前に取得している。その他端末40からの設定情報には、PC20のメディアデータの要求が含まれている。また、その他端末40からの設定情報には、メディアサーバ1Aを介したその他端末40と、PC20とのP2P接続の確立を示す情報が含まれている。メディアサーバ1Aは、その他端末40からの設定情報に基づいて、PC20のメディアデータをPC20に送信する。
また、設定部13は、外部端末50から設定情報を事前に取得している。外部端末50からの設定情報には、スマートフォン10、PC20、ネットワークカメラ30、及びその他端末40の各々のメディアデータを合成した合成済みメディアデータの要求が含まれている。また、外部端末50からの設定情報には、他の端末に関するメディアデータの要求は無いため、メディアサーバ1Aを介した外部端末50と他の端末とのP2P接続の確立を示す情報は無い。メディアサーバ1Aは、外部端末50からの設定情報に基づいて、合成部12に合成済みメディアデータを合成させ、外部端末50に送信する。
【0024】
<効果>
第1実施形態によれば、SFU機能を持つメディアサーバ1Aに対して、合成部12としてのメディア合成機能を取り入れることで、従来のSFUによるメディアデータの通信に加えて、P2Pの接続数やトラフィック量を抑えつつ、複数の映像や音声を含んだメディアデータの通信を行うことが可能となる。
【0025】
加えて、メディアサーバ1AをWebRTCやSIP(Session Initiation Protocol)などといった複数の通信プロトコルに対応させることで、従来のSFUでは接続できないWebRTCのマルチチャネル未対応であるSIP端末などの端末を、メディアサーバ1Aに収容できる。また、WebRTCのマルチチャネル未対応の端末には、合成したメディアデータを送信することで、複数の映像や音声を含んだメディアデータの通信を行うことが可能となる。具体的には、メディアサーバ1AにWebRTCゲートウェイを実装するとよい。また、その他端末40をWebRTCのマルチチャネル未対応であるSIP端末とした場合、WebRTCゲートウェイとSIP端末との間で、SIP⇔JSEP(JavaScript Session Establishment Protocol)といった制御信号のプロトコル変換を行うとよい。また、RTP(Real-time Transport Protocol)⇔SRTP(Secure Real-time Transport Protocol)/RTCP-mux(RTP Control Protocol-mux)といったメディア(音声/映像/テキスト等)のプロトコル変換を行うとよい。このメディアのプロトコル変換では、RTPパケットとRTCPパケットとの分離が、RTPパケットとRTCPパケットとの多重化に置き換わったり、その逆が行われたりする。
【0026】
[第2実施形態]
第2実施形態の説明の際、第1実施形態と相違する点について主に説明し、重複する点については説明を省略する。第2実施形態では、第1実施形態で示したクライアント端末に対する合成したメディアデータの通信だけではなく、メディアサーバ1同士の通信を行うことができるものとする。
【0027】
<構成>
図3は、第2実施形態におけるビデオ会議システムの機能構成図である。
図3に示すように、ビデオ会議システム100B(100)は、メディアサーバ1B(1),1C(1)と、端末61~66とを備えている。メディアサーバ1B,1C、及び端末61~66は、通信可能に接続されている。特に、端末61~63がメディアサーバ1Bに接続しており通信可能である。また、メディアサーバ1B,1C同士が接続しており通信可能である。また、端末64~66がメディアサーバ1Cに接続しており通信可能である。
【0028】
端末61~66は、メディアデータを処理してビデオ会議を行うクライアント端末である。端末61~66は、端末10~50と同等の機能を有する。
メディアサーバ1B,1Cは、SFUサーバである。メディアサーバ1B,1Cは、メディアサーバ1Aと同等の機能を有する。
図3に示すように、メディアサーバ1Bは、送受信部11bと、合成部12bと、設定部13bとを備えている。送受信部11b、合成部12b、及び設定部13bはそれぞれ、メディアサーバ1Aの送受信部11、合成部12、及び設定部13の各々と同等の機能を有する。また、メディアサーバ1Cは、送受信部11cと、合成部12cと、設定部13cとを備えている。送受信部11c、合成部12c、及び設定部13cはそれぞれ、メディアサーバ1Aの送受信部11、合成部12、及び設定部13の各々と同等の機能を有する。
図3に示すように、メディアサーバ1B,1Cが特定のメディアデータや合成済みメディアデータをやり取り可能な、冗長構成のビデオ会議システムを実装できる。ここで、設定部13b,13cは、設定部13b,13cの各々が保持する情報を共有することが好ましい。これにより、メディアサーバ1Bは、メディアサーバ1C側の設定情報を取得でき、メディアサーバ1Cに接続している端末64~66からの要求を満たすようにメディアデータ及び合成済みメディアデータを送受信できる。また、メディアサーバ1Cは、メディアサーバ1B側の設定情報を取得でき、メディアサーバ1Bに接続している端末61~63からの要求を満たすようにメディアデータ及び合成済みメディアデータを送受信できる。
【0029】
図4は、第2実施形態におけるメディアデータ及び合成済みメディアデータの送受信の説明図である。メディアデータ及び合成済みメディアデータが、
図4に示すように送受信されていたとする。なお、図示の便宜上、送受信部11b,11c、及び設定部13b,13cの図示は省略する。
【0030】
具体的には、端末61は、自身のメディアデータをメディアサーバ1Bに送信する。また、端末61は、端末64~66の各々のメディアデータを合成部12cで合成した合成済みメディアデータを、メディアサーバ1Cを介して、メディアサーバ1Bから受信する。また、端末61は、端末62,63の各々から各自のメディアデータをメディアサーバ1Bから受信する。
端末62は、自身のメディアデータをメディアサーバ1Bに送信する。また、端末62は、端末61,63の各々のメディアデータを合成部12bで合成した合成済みメディアデータをメディアサーバ1Bから受信する(特定のメディアデータの受信は無い)。
端末63は、自身のメディアデータをメディアサーバ1Bに送信する。また、端末63は、端末65から自身のメディアデータを、メディアサーバ1Cを介して、メディアサーバ1Bから受信する。
【0031】
端末64は、自身のメディアデータをメディアサーバ1Cに送信する。また、端末64は、端末61~63の各々のメディアデータを合成部12bで合成した合成済みメディアデータを、メディアサーバ1Bを介して、メディアサーバ1Cから受信する。また、端末64は、端末65,66の各々から各自のメディアデータをメディアサーバ1Cから受信する。
端末65は、自身のメディアデータをメディアサーバ1Cに送信する。また、端末65は、端末64,66の各々のメディアデータを合成部12cで合成した合成済みメディアデータをメディアサーバ1Cから受信する(特定のメディアデータの受信は無い)。
端末66は、自身のメディアデータをメディアサーバ1Cに送信する。また、端末66は、端末62から自身のメディアデータを、メディアサーバ1Bを介して、メディアサーバ1Cから受信する。
【0032】
図4の場合、設定部13bは、端末61から設定情報を事前に取得している。端末61からの設定情報には、端末64~66の各々のメディアデータを合成した合成済みメディアデータの要求が含まれている。また、端末61からの設定情報には、端末62,63の各々のメディアデータの要求が含まれている。また、端末61からの設定情報には、メディアサーバ1Bを介した端末62,63の各々とのP2P接続の確立を示す情報が含まれている。メディアサーバ1Bは、端末61からの設定情報に基づいて、メディアサーバ1Cの合成部12cに合成済みメディアデータを合成させ、メディアサーバ1Cから受信した合成済みメディアデータを端末61に送信する。また、メディアサーバ1Bは、端末61からの設定情報に基づいて、端末62,63の各々のメディアデータを端末61に送信する。
また、設定部13bは、端末62から設定情報を事前に取得している。端末62からの設定情報には、端末61,63の各々のメディアデータを合成した合成済みメディアデータの要求が含まれている。また、端末62からの設定情報には、他の端末に関するメディアデータの要求は無いため、メディアサーバ1Bを介した端末62と他の端末とのP2P接続の確立を示す情報は無い。メディアサーバ1Bは、端末62からの設定情報に基づいて、合成部12bに合成済みメディアデータを合成させ、端末62に送信する。
また、設定部13bは、端末63から設定情報を事前に取得している。端末63からの設定情報には、端末65のメディアデータの要求が含まれている。また、端末63からの設定情報には、メディアサーバ1B及びメディアサーバ1Cを介した端末63と、端末65とのP2P接続の確立を示す情報が含まれている。メディアサーバ1Bは、端末63からの設定情報に基づいて、メディアサーバ1Cから受信した、端末65のメディアデータを端末63に送信する。
【0033】
また、設定部13cは、端末64から設定情報を事前に取得している。端末64からの設定情報には、端末61~63の各々のメディアデータを合成した合成済みメディアデータの要求が含まれている。また、端末64からの設定情報には、端末65,66の各々のメディアデータの要求が含まれている。また、端末64からの設定情報には、メディアサーバ1Cを介した端末65,66の各々とのP2P接続の確立を示す情報が含まれている。メディアサーバ1Cは、端末64からの設定情報に基づいて、メディアサーバ1Bの合成部12bに合成済みメディアデータを合成させ、メディアサーバ1Bから受信した合成済みメディアデータを端末64に送信する。また、メディアサーバ1Cは、端末64からの設定情報に基づいて、端末65,66の各々のメディアデータを端末64に送信する。
また、設定部13cは、端末65から設定情報を事前に取得している。端末65からの設定情報には、端末64,66の各々のメディアデータを合成した合成済みメディアデータの要求が含まれている。また、端末65からの設定情報には、他の端末に関するメディアデータの要求は無いため、メディアサーバ1Cを介した端末65と他の端末とのP2P接続の確立を示す情報は無い。メディアサーバ1Cは、端末65からの設定情報に基づいて、合成部12cに合成済みメディアデータを合成させ、端末65に送信する。
また、設定部13cは、端末66から設定情報を事前に取得している。端末66からの設定情報には、端末62のメディアデータの要求が含まれている。また、端末66からの設定情報には、メディアサーバ1C及びメディアサーバ1Bを介した端末66と、端末62とのP2P接続の確立を示す情報が含まれている。メディアサーバ1Cは、端末66からの設定情報に基づいて、メディアサーバ1Bから受信した、端末62のメディアデータを端末65に送信する。
【0034】
<効果>
第2実施形態によれば、第1実施形態と同様の効果を奏する。また、第2実施形態によれば、メディアサーバ1同士での通信を行えるようにすることで、拠点間でのテレビ会議におけて、トラフィック量を抑えつつ、複数の映像や音声を含んだメディアデータの通信を行うことが可能となる。また、複数のメディアサーバ1でビデオ会議システムを構成することにより、1つ、ないし、複数のメディアサーバ1に、特定のメディアデータを集約することが可能となる。
【0035】
[第3実施形態]
第3実施形態の説明の際、第1、第2実施形態と相違する点について主に説明し、重複する点については説明を省略する。第3実施形態では、複数のメディアサーバ1で合成した合成済みメディアデータ同士をさらに合成した合成済みメディアデータをクライアント端末に送信することを特徴とする。
【0036】
<構成>
図5は、第3実施形態におけるビデオ会議システムの機能構成図である。
図5に示すように、ビデオ会議システム100C(100)は、第2実施形態のメディアサーバ1B(1),1C(1)と、端末61~66とを備えており、さらに、メディアサーバ1D(1)を備えている。メディアサーバ1B~1D、及び端末61~66は、通信可能に接続されている。特に、端末61~63がメディアサーバ1Bに接続しており通信可能である。また、メディアサーバ1B,1D同士が接続しており通信可能である。また、メディアサーバ1C,1D同士が接続しており通信可能である。また、端末64~66がメディアサーバ1Cに接続しており通信可能である。
【0037】
メディアサーバ1Dは、SFUサーバである。メディアサーバ1Dは、メディアサーバ1Aと同等の機能を有する。
図5に示すように、メディアサーバ1Dは、送受信部11dと、合成部12dと、設定部13dとを備えている。送受信部11d、合成部12d、及び設定部13dはそれぞれ、メディアサーバ1Aの送受信部11、合成部12、及び設定部13の各々と同等の機能を有する。
図5に示すように、メディアサーバ1B~1Dが特定のメディアデータや合成済みメディアデータをやり取り可能な、冗長構成のビデオ会議システムを実装できる。ここで、設定部13b~13dは、設定部13b~13dの各々が保持する情報を共有することが好ましい。これにより、メディアサーバ1Bは、メディアサーバ1C,1D側の設定情報を取得でき、メディアサーバ1Cに接続している端末64~66からの要求を満たすように特定のメディアデータ及び合成済みメディアデータを送受信できる。また、メディアサーバ1Cは、メディアサーバ1B,1D側の設定情報を取得でき、メディアサーバ1Bに接続している端末61~63からの要求を満たすように特定のメディアデータ及び合成済みメディアデータを送受信できる。また、メディアサーバ1Dは、メディアサーバ1B,1C側の設定情報を取得でき、端末61~66からの要求を満たすように特定のメディアデータ及び合成済みメディアデータを、メディアサーバ1B,1Cの各々との間で送受信できる。
【0038】
図6は、第3実施形態における特定のメディアデータ及び合成済みメディアデータの送受信の説明図である。特定のメディアデータ及び合成済みメディアデータが、
図6に示すように送受信されていたとする。なお、図示の便宜上、送受信部11b~11d、及び設定部13b~13dの図示は省略する。
【0039】
具体的には、端末61は、自身のメディアデータをメディアサーバ1Bに送信する。また、端末61は、端末64~66の各々のメディアデータを合成部12cで合成した合成済みメディアデータを、メディアサーバ1C,1Dを介して、メディアサーバ1Bから受信する。また、端末61は、端末62,63の各々から各自のメディアデータをメディアサーバ1Bから受信する。
端末62は、自身のメディアデータをメディアサーバ1Bに送信する。また、端末62は、端末61,63の各々のメディアデータをメディアサーバ1Bの合成部12bで合成した合成済みメディアデータ、及び端末64~66の各々のメディアデータをメディアサーバ1Cの合成部12cで合成した合成済みメディアデータを、メディアサーバ1Dの合成部12dでさらに合成した合成済みメディアデータを、メディアサーバ1Dを介して、メディアサーバ1Bから受信する(特定のメディアデータの受信は無い)。
端末63は、自身のメディアデータをメディアサーバ1Bに送信する。また、端末63は、端末65から自身のメディアデータを、メディアサーバ1C,1Dを介して、メディアサーバ1Bから受信する。
【0040】
端末64は、自身のメディアデータをメディアサーバ1Cに送信する。また、端末64は、端末61、63の各々のメディアデータを合成部12bで合成した合成済みメディアデータを、メディアサーバ1B,1Dを介して、メディアサーバ1Cから受信する。また、端末64は、端末65,66の各々から各自のメディアデータをメディアサーバ1Cから受信する。
端末65は、自身のメディアデータをメディアサーバ1Cに送信する。また、端末65は、端末64,66の各々のメディアデータを合成部12cで合成した合成済みメディアデータをメディアサーバ1Cから受信する(特定のメディアデータの受信は無い)。
端末66は、自身のメディアデータをメディアサーバ1Cに送信する。また、端末66は、端末62から自身のメディアデータを、メディアサーバ1B,1Dを介して、メディアサーバ1Cから受信する。
【0041】
図6の場合、設定部13bは、端末61から設定情報を事前に取得している。端末61からの設定情報には、端末64~66の各々のメディアデータを合成した合成済みメディアデータの要求が含まれている。また、端末61からの設定情報には、端末62,63の各々のメディアデータの要求が含まれている。また、端末61からの設定情報には、メディアサーバ1Bを介した端末62,63の各々とのP2P接続の確立を示す情報が含まれている。メディアサーバ1Bは、端末61からの設定情報に基づいて、メディアサーバ1Cの合成部12cに合成済みメディアデータを合成させ、メディアサーバ1Dを介してメディアサーバ1Cから受信した合成済みメディアデータを端末61に送信する。また、メディアサーバ1Bは、端末61からの設定情報に基づいて、端末62,63の各々のメディアデータを端末61に送信する。
また、設定部13bは、端末62から設定情報を事前に取得している。端末62からの設定情報には、端末61、63、端末64~66の各々のメディアデータを合成した合成済みメディアデータの要求が含まれている。また、端末62からの設定情報には、他の端末に関するメディアデータの要求は無いため、メディアサーバ1Bを介した端末62と他の端末とのP2P接続の確立を示す情報は無い。メディアサーバ1Bは、端末62からの設定情報に基づいて、メディアサーバ1Dの合成部12dに合成済みメディアデータを合成させ、端末62に送信する。
また、設定部13bは、端末63から設定情報を事前に取得している。端末63からの設定情報には、端末65のメディアデータの要求が含まれている。また、端末63からの設定情報には、メディアサーバ1B、メディアサーバ1D及びメディアサーバ1Cを介した端末63と、端末65とのP2P接続の確立を示す情報が含まれている。メディアサーバ1Bは、端末63からの設定情報に基づいて、メディアサーバ1Dを介してメディアサーバ1Cから受信した、端末65のメディアデータを端末63に送信する。
【0042】
また、設定部13cは、端末64から設定情報を事前に取得している。端末64からの設定情報には、端末61、63の各々のメディアデータを合成した合成済みメディアデータの要求が含まれている。また、端末64からの設定情報には、端末65,66の各々のメディアデータの要求が含まれている。また、端末64からの設定情報には、メディアサーバ1Cを介した端末65,66の各々とのP2P接続の確立を示す情報が含まれている。メディアサーバ1Cは、端末64からの設定情報に基づいて、メディアサーバ1Bの合成部12bに合成済みメディアデータを合成させ、メディアサーバ1Dを介してメディアサーバ1Bから受信した合成済みメディアデータを端末64に送信する。また、メディアサーバ1Cは、端末64からの設定情報に基づいて、端末65,66の各々のメディアデータを端末64に送信する。
また、設定部13cは、端末65から設定情報を事前に取得している。端末65からの設定情報には、端末64,66の各々のメディアデータを合成した合成済みメディアデータの要求が含まれている。また、端末65からの設定情報には、他の端末に関するメディアデータの要求は無いため、メディアサーバ1Cを介した端末65と他の端末とのP2P接続の確立を示す情報は無い。メディアサーバ1Cは、端末65からの設定情報に基づいて、合成部12cに合成済みメディアデータを合成させ、端末65に送信する。
また、設定部13cは、端末66から設定情報を事前に取得している。端末66からの設定情報には、端末62のメディアデータの要求が含まれている。また、端末66からの設定情報には、メディアサーバ1C、メディアサーバ1D及びメディアサーバ1Bを介した端末66と、端末62とのP2P接続の確立を示す情報が含まれている。メディアサーバ1Cは、端末66からの設定情報に基づいて、メディアサーバ1Dを介してメディアサーバ1Bから受信した、端末62のメディアデータを端末65に送信する。
【0043】
<効果>
第3実施形態によれば、第1,第2実施形態と同様の効果を奏する。また、第3実施形態によれば、2段階で合成した合成済みデータをクライアント端末に送信できるため、ビデオ会議システムにおけるトラフィック量をさらに減少させることができる。
【0044】
[処理]
本実施形態の処理について説明する。
図7は、メディアサーバが実行する処理を示すフローチャートである。まず、送受信部11は、クライアント端末の各々から設定情報を取得する(ステップS1)。設定部13は、取得した設定情報を保持する。次に、送受信部11は、クライアント端末の各々から各自のメディアデータを取得する(ステップS2)。次に、合成部12は、設定情報に基づいて、メディアデータを合成する(ステップS3)。最後に、送受信部11は、合成済みメディアデータ及び特定のメディアデータをクライアント端末の各々に送信する(ステップS4)。クライアント端末の各ユーザは、希望した合成済みメディアデータ及び特定のメディアデータに基づく画面を視聴しつつ、他のクライアントのユーザとやり取りできる。
【0045】
[特許請求の範囲との関係]
端末10~50,61~66はそれぞれ、特許請求の範囲の「複数の装置」、「第1の装置」、「第2の装置」、「第3の装置」に相当する。
メディアデータは、特許請求の範囲の「第1メディアの情報」、「第2メディアの情報」、「第3のメディア情報」に相当する。
合成済みメディアデータは、特許請求の範囲の「第4メディアの情報」、「第5メディアの情報」、「第6メディアの情報」、「第7メディアの情報」に相当する。
設定部13,13b~13dが保持する設定情報は、特許請求の範囲の「第2の設定情報」、「第3の設定情報」に相当する。
メディアサーバ1,1A~1Dはそれぞれ、特許請求の範囲の「処理装置」に相当する。
送受信部11,11b~11dはそれぞれ、特許請求の範囲の「第1の処理部」、「第2の処理部」、「第4の処理部」に相当する。
合成部12,12b~12dはそれぞれ、特許請求の範囲の「第3の処理部」に相当する。
【0046】
[付記]
なお、以上の実施形態の説明に関して、更に以下の付記を開示する。
(付記1)
本発明の第1の態様は、
複数の装置と接続される処理装置であって、
第2の装置から第2設定の情報を受信し、第3の装置から第3設定の情報を受信する第1の処理部と、
第1の装置から第1メディアの情報を受信し、前記第2の装置から第2メディアの情報を受信し、前記第3の装置から第3メディアの情報を受信する第2の処理部と、
前記第1メディアの情報と前記第2メディアの情報とを合成して第4メディアの情報を生成する第3の処理部と、
前記第2の装置に対して、前記第2設定の情報に基づいて、前記第1メディアの情報をP2P(Pier to Pier)にて送信し、前記第3メディアの情報をP2Pにて送信し、前記第3の装置に対して、前記第3設定の情報に基づいて、前記第4メディアの情報をP2Pにて送信する第4の処理部と、
を備えることを特徴とする処理装置である。
(付記2)
本発明の第2の態様は、
前記処理装置としての第1処理装置と、前記処理装置としての第2処理装置が前記第1メディアの情報、前記第2メディアの情報、前記第3メディアの情報、及び前記第4メディアの情報を送受信する、第1の態様の処理装置である。
(付記3)
本発明の第3の態様は、
前記第1処理装置で生成した前記第4メディアの情報を第5メディアの情報とし、
前記第2処理装置で生成した前記第4メディアの情報を第6メディアの情報とした場合、
前記処理装置としての第3処理装置が、前記第1処理装置から受信した前記第5メディアの情報と、前記第2処理装置から受信した前記第6メディアの情報とを合成して第7メディアの情報を生成する、第2の態様の処理装置である。
(付記4)
本発明の第4の態様は、
前記第1の装置、前記第2の装置、及び前記第3の装置の少なくとも何れかが、WebRTC(Web Real-Time Communication)のマルチチャネル未対応の端末であり、
前記処理装置がWebRTCゲートウェイである、第1の態様から第3の態様の何れか1つの態様の処理装置。
(付記5)
本発明の第5の態様は、
複数の装置と接続される処理装置であって、
少なくとも一つ以上の前記装置からメディアの情報の要求を受信し、設定の情報として保持させる第1の処理部と、
前記装置からメディアの情報を受信する第2の処理部と、
複数の前記装置から受信した前記メディアの情報を合成して、合成済みのメディアの情報を生成する第3の処理部と、
前記設定の情報に基づいて、前記メディアの情報及び前記合成済みのメディアの情報の一方又は双方を、P2P(Pier to Pier)にて前記装置に送信する第4の処理部と、
を備えることを特徴とする処理装置である。
【0047】
[変形例]
(a):メディアサーバ1が合成済みデータを特定のクライアント端末に送信する場合、その合成済みデータを構成する各メディアデータの少なくとも1つを、合成済みデータとともにその特定のクライアント端末に送信してもよい。特定のクライアント端末のユーザは、合成済みメディアデータに基づく画面と、メディアデータに基づく画面を同時に視聴することができる。レンダリング処理によるメディアデータの合成は、多少なりとも画質の劣化を招く可能性がある。このため、合成済みメディアデータに基づく画面が不鮮明であった場合、同時に受信したメディアデータに基づく画面を視聴することで上記の不鮮明の問題を解消することができる。なお、特定のクライアント端末は、合成済みデータを構成するメディアデータの要求(希望)を含む設定情報をメディアサーバ1に送信する。例えば、設定情報の送信は、ビデオ会議が開始する前に行ってもよいし、受信した合成済みメディアデータに基づく画面が不鮮明であるとユーザが判定した時、つまりビデオ会議の開始後に行ってもよい。
(b):第3実施形態において、メディアサーバ1B,1C間でメディアデータや合成済みメディアデータをやり取りしてもよい。
【0048】
(c):上記した発明特定事項は、適宜組み合わせ可能である。
(d):ソフトウェアで実現可能な手段をハードウェアで実現することができ、ハードウェアで実現可能な手段をソフトウェアで実現することができる。
【符号の説明】
【0049】
100,100A~100C ビデオ会議システム
1,1A~1D メディアサーバ
10 スマートフォン、端末
20 PC、端末
30 ネットワークカメラ、端末
40 その他端末、端末
50 外部端末、端末
61~66 端末
11,11b~11d 送受信部
12,12b~12d 合成部
13,13b~13d 設定部