特表2024-542647 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ライブアリーナテクノロジーズアクチエボラグの特許一覧

特表2024-542647ビデオストリームを生成するシステムおよび方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6a
6b
6c
6d
6e
6f
7
8a
8b
8c
8d
9

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】

(43)【公表日】2024-11-15

(54)【発明の名称】ビデオストリームを生成するシステムおよび方法

(51)【国際特許分類】

H04N 7/15 20060101AFI20241108BHJP

H04N 21/2665 20110101ALI20241108BHJP

H04N 21/242 20110101ALI20241108BHJP

【ＦＩ】

H04N7/15 120

H04N21/2665

H04N21/242

【審査請求】未請求

【予備審査請求】未請求

(21)【出願番号】P 2024532231

(86)(22)【出願日】2022-11-07

(85)【翻訳文提出日】2024-07-26

(86)【国際出願番号】 SE2022051034

(87)【国際公開番号】W WO2023101589

(87)【国際公開日】2023-06-08

(31)【優先権主張番号】2151461-7

(32)【優先日】2021-11-30

(33)【優先権主張国・地域又は機関】SE

(81)【指定国・地域】

(71)【出願人】

【識別番号】524135738

【氏名又は名称】ライブアリーナテクノロジーズアクチエボラグ

【氏名又は名称原語表記】ＬＩＶＥＡＲＥＮＡＴＥＣＨＮＯＬＯＧＩＥＳＡＢ

(74)【代理人】

【識別番号】100109380

【弁理士】

【氏名又は名称】小西恵

(74)【代理人】

【識別番号】100109036

【弁理士】

【氏名又は名称】永岡重幸

(72)【発明者】

【氏名】ビョークマン，アンドレアス

(72)【発明者】

【氏名】ニルソン，アンダース

(72)【発明者】

【氏名】エルマン，ラーズ

【テーマコード（参考）】

5C164

【Ｆターム（参考）】

5C164FA10

5C164FA26

5C164MA02S

5C164SB10P

5C164SC04P

5C164VA13P

5C164VA36P

(57)【要約】

第２のデジタルビデオストリームを提供する方法は、以下のステップを含む：収集ステップにおいて、少なくとも２つの異なるデジタルビデオ情報源（１２１）から、第１の一次デジタルビデオストリームおよび第２の一次デジタルビデオストリームを収集し；第１の生成ステップ（１３５'）において、前記第１および第２の一次デジタルビデオストリームに基づいて、第１の生成ビデオストリームを生成し；第２の生成ステップ（１３５''）において、前記第１の生成ビデオストリームに基づいて、また前記第１および第２の一次デジタルビデオストリームに基づいて、前記第２のストリームを生成し；ここで、前記第２の生成ステップ（１３５''）において、前記第１の生成ステップ（１３５'）から生じる前記第１の生成ビデオストリームの待ち時間を考慮して、前記第１の生成ビデオストリームと時間同期させるように、前記第１および第２の一次デジタルビデオストリームを時間遅延させ、ここで、前記第２の生成ストリームは、前記時間遅延された第１および第２の一次デジタルビデオストリームに基づいて生成される。本発明はまたシステムおよびコンピュータソフトウエア製品に関する。
【選択図】図８ａ

【特許請求の範囲】

【請求項1】

第２のデジタルビデオストリームを提供する方法であって、該方法は以下のステップを含む方法：
割り当てステップにおいて、複数の参加者クライアント（１２１）を、そうした参加者クライアント（１２１）の少なくとも２つのグループ（１２１'，１２１''，１２１'''）に亘って割り当て；
収集ステップにおいて、第１の参加者クライアント（１２１）から第１の一次デジタルビデオストリームを収集し、第２の参加者クライアント（１２１）から第２の一次デジタルビデオストリームを収集し、第３の参加者クライアント（１２１）から第３の一次デジタルビデオストリームを収集し、第４の参加者クライアント（１２１）から第４の一次デジタルビデオストリームを収集し、第５の参加者クライアント（１２１）から第５の一次デジタルビデオストリームを収集し、ここで、前記第１および第２の一次ビデオストリームは、参加者クライアント（１２１）の第１の割り当てグループ（１２１'）に割り当てられた参加者クライアント（１２１）から収集され、前記第４および第５の一次ビデオストリームは、参加者クライアント（１２１）の第３のグループ（１２１'''）に割り当てられた参加者クライアントから収集され；
公開ステップにおいて、前記第１の参加者クライアント（１２１）および前記第２の参加者クライアント（１２１）の少なくとも１つに対して、前記第１の一次デジタルビデオストリーム、前記第２の一次デジタルビデオ、および、前記第１および第２の一次ビデオストリームの少なくとも１つに基づいて生成された第１の生成ビデオストリームの少なくとも１つを提供し；
第２の生成ステップ（１３５''）において、前記第１の一次デジタルビデオストリーム、前記第２の一次デジタルビデオストリーム、前記第３の一次デジタルビデオストリームに基づいて、および前記第４および第５の一次ビデオストリームの少なくとも１つに基づいて、前記第２の生成ビデオストリームをデジタルビデオストリームとして生成し、ここで、前記第２の生成ステップ（１３５''）は、前記第２の生成ビデオストリームが、前記公開ステップにおいて前記第１または第２の参加者クライアント（１２１）に提供されるいずれのビデオストリームとも時間的に非同期であるように、時間遅延を導入し；
第３の生成ステップ（１３５'''）において、前記第４および第５の一次ビデオストリームに基づいて、第３の生成ビデオストリームを生成し、ここで、前記第３の生成ステップ（１３５'''）は、前記第３の生成ビデオストリームが、前記第１の生成ビデオストリームに対して時間的に非同期であるように、前記第４および第５の一次ビデオストリームを時間遅延させることを含み、
前記公開ステップはさらに、前記第２の生成ビデオストリームを、前記第１または第２の参加者クライアントではない少なくとも１つの消費者クライアント（１２１；１５０）に連続的に提供し、前記第３の生成ビデオストリームを、前記第３のグループに割り当てられた少なくとも１つの参加者クライアントに連続的に提供することを含む。

【請求項2】

第２のデジタルビデオストリームを提供する方法であって、該方法は以下のステップを含む方法：
割り当てステップにおいて、複数の参加者クライアント（１２１）を、そうした参加者クライアント（１２１）の少なくとも２つのグループ（１２１'，１２１''，１２１'''）に亘って割り当て；
収集ステップにおいて、参加者クライアント（１２１）の第１の割り当てグループ（１２１'）に割り当てられた少なくとも２つの異なる参加者クライアント（１２１）から、第１の一次デジタルビデオストリームおよび第２の一次デジタルビデオストリームを収集し、参加者クライアント（１２１）の第３のグループ（１２１'''）に割り当てられた参加者クライアント（１２１）から、第４の一次デジタルビデオストリームおよび第５の一次デジタルビデオストリームを収集し；
第１の生成ステップ（１３５'）において、前記第１および第２の一次デジタルビデオストリームに基づいて、第１の生成ビデオストリームをデジタルビデオストリームとして生成し；
第２の生成ステップ（１３５''）において、前記第１の生成ビデオストリームおよび前記第１および第２の一次デジタルビデオストリームに基づいて、さらに前記第４および第５の一次ビデオストリームの少なくとも１つに基づいて、前記第２の生成ビデオストリームをデジタルビデオストリームとして生成し；
第３の生成ステップ（１３５'''）において、前記第４および第５の一次ビデオストリームに基づいて、第３の生成ビデオストリームを生成し、ここで、前記第３の生成ステップ（１３５'''）は、前記第３の生成ビデオストリームが、前記第１の生成ビデオストリームに対して時間的に非同期であるように、前記第４および第５の一次ビデオストリームを時間遅延させることを含み；
公開ステップ（１３６'''）において、前記第２の生成ビデオストリームを、前記第１または第２の参加者クライアントではない少なくとも１つの消費者クライアント（１２１；１５０）に連続的に提供し、前記第３の生成ビデオストリームを、前記第３のグループに割り当てられた少なくとも１つの参加者クライアントに連続的に提供し、ここで、
前記第２の生成ステップ（１３５''）において、前記第１の生成ステップ（１３５'）から生じる前記第１の生成ビデオストリームの待ち時間を考慮して、前記第１の生成ビデオストリームと時間同期させるように、前記第１および第２の一次デジタルビデオストリームを時間遅延させ、ここで、前記第２の生成ビデオストリームは、前記時間遅延された第１および第２の一次デジタルビデオストリームに基づいて生成される。

【請求項3】

請求項２に記載の方法であって、該方法はさらに以下を含む：
公開ステップ（１３６'）において、前記第１の生成ビデオストリームを、第１の参加者クライアント（１２１）および第２の参加者クライアント（１２１）の少なくとも１つに連続的に提供する。

【請求項4】

請求項３に記載の方法であって、該方法はさらに以下を含む：
前記第１の参加者クライアント（１２１）は、前記第１の一次デジタルビデオストリームを提供し、前記第２の参加者クライアント（１２１）は、前記第２の一次デジタルビデオストリームを提供する。

【請求項5】

第２のデジタルビデオストリームを提供する方法であって、該方法は以下のステップを含む方法：
割り当てステップにおいて、複数の参加者クライアント（１２１）を、そうした参加者クライアント（１２１）の少なくとも２つのグループ（１２１'，１２１''，１２１'''）に亘って割り当て；
収集ステップにおいて、第１の参加者クライアント（１２１）から第１の一次デジタルビデオストリームを収集し、第２の参加者クライアント（１２１）から第２の一次デジタルビデオストリームを収集し、第３の参加者クライアント（１２１）から第３の一次デジタルビデオストリームを収集し、第４の参加者クライアント（１２１）から第４の一次デジタルビデオストリームを収集し、第５の参加者クライアント（１２１）から第５の一次デジタルビデオストリームを収集し、ここで、前記第１および第２の一次ビデオストリームは、参加者クライアント（１２１）の第１の割り当てグループ（１２１'）に割り当てられた参加者クライアント（１２１）から収集され、前記第４および第５の一次ビデオストリームは、参加者クライアント（１２１）の第３のグループ（１２１'''）に割り当てられた参加者クライアントから収集され；
第１の生成ステップ（１３５'）において、前記第１および第２の一次デジタルビデオストリームに基づいて、第１の生成ビデオストリームをデジタルビデオストリームとして生成し、ここで、前記第１の生成デジタルビデオストリームは、第１の待ち時間で公開されるために連続的に生成され；
第２の生成ステップ（１３５''）において、前記第１、第２および第３の一次デジタルビデオストリームに基づいて、さらに前記第４および第５の一次ビデオストリームの少なくとも１つに基づいて、前記第２の生成ビデオストリームをデジタルビデオストリームとして生成し、ここで、前記第２の生成ビデオストリームは、第２の待ち時間で公開されるために連続的に生成され、前記第２の待ち時間は、前記第１の待ち時間よりも大きく；
第３の生成ステップ（１３５'''）において、前記第４および第５の一次ビデオストリームに基づいて、第３の生成ビデオストリームを生成し、ここで、前記第３の生成ステップ（１３５'''）は、前記第３の生成ビデオストリームが、前記第１の生成ビデオストリームに対して時間的に非同期であるように、前記第４および第５の一次ビデオストリームを時間遅延させることを含み；および、
公開ステップ（１３６'）において、前記第１の一次デジタルビデオストリーム、前記第２の一次デジタルビデオストリーム、および前記第１の生成ビデオストリームのうちの少なくとも１つを、前記第１の参加者クライアント（１２１）および前記第２の参加者クライアント（１２１）のうちの少なくとも１つに連続的に提供し、前記第２の生成ビデオストリームを、少なくとも１つの他の参加者クライアント（１２１）に連続的に提供し、および、前記第３の生成ビデオストリームを、前記第３のグループに割り当てられた少なくとも１つの他の参加者クライアント（１２１）に連続的に提供する。

【請求項6】

請求項３から５のいずれか１項に記載の方法であって、該方法はさらに以下を含む：
前記公開ステップ（１３６''）において、前記第２の生成ビデオストリームを、前記第１または第２の参加クライアントではない少なくとも１つの消費者クライアント（１２１；１５０）に連続的に提供する。

【請求項7】

請求項１、および３から６のいずれか１項に記載の方法であって、該方法はさらに以下を含む：
前記第１および第２の一次デジタルビデオストリームは、共有デジタルビデオ通信サービス（１１０）の一部として提供され、前記第１の参加者クライアント（１２１）および前記第２の参加者クライアント（１２１）はいずれも、前記共有デジタルビデオ通信サービス（１１０）にそれぞれ遠隔接続された参加者クライアントである。

【請求項8】

請求項７に記載の方法であって、
前記収集ステップ（１３１）は、前記共有デジタルビデオ通信サービス（１１０）から前記第１および／または第２の一次デジタルビデオストリームを収集することを含む。

【請求項9】

請求項７または８に記載の方法であって、
前記収集ステップ（１３１）は、前記共有デジタルビデオ通信サービス（１１０）の外部である情報源（３００）から収集された外部デジタルビデオストリーム（３０１）として、少なくとも１つの一次デジタルビデオストリームを収集することを含み、ここで、
前記第１および／または第２の生成ビデオストリームは、前記外部デジタルビデオストリーム（３０１）に基づいて生成される。

【請求項10】

請求項１から９のいずれか１項に記載の方法であって、
前記第１の（１３５'）および／または第２の（１３５''）生成ステップは、前記生成デジタルビデオストリームの視覚的および／または聴覚的ビデオコンテンツ配置における前記第１および／または第２の一次デジタルビデオストリームの個々のものの可視性；使用される視覚的または聴覚的効果；および／または前記生成デジタルビデオストリームの出力モード、に関する予め決定されたおよび／または動的に可変なパラメータのセットに基づいて、当該それぞれの生成ビデオストリームを生成することを含む。

【請求項11】

請求項１から１０のいずれか１項に記載の方法であって、
前記第１の（１３５'）および／または第２の（１３５''）生成ステップは、中央サーバ（１３０）によって実行され、前記第２の生成ビデオストリーム（２３０）を、ＡＰＩ（１３７）を介してライブビデオストリームとして１つまたは複数の同時接続消費者クライアントに提供する。

【請求項12】

請求項１から１１のいずれか１項に記載の方法であって、
前記第１の生成ステップ（１３５'）は、前記第１および第２の一次ビデオストリームを互いに同期させるように時間遅延させることを含み、ここで、
前記第３の生成ステップ（１３５'''）は、前記第４および第５の一次ビデオストリームを時間遅延させて互いに時間同期させるが、前記第１の生成ステップにおいて前記第１および第２の一次ビデオストリームを時間遅延させるために使用される最大時間遅延よりも小さい最大時間遅延を使用するように、前記第４および第５の一次ビデオストリームを時間遅延させることを含み、その結果、前記第１の生成ビデオストリームは、前記第３の生成ビデオストリームと時間同期されない。

【請求項13】

請求項１から１２のいずれか１項に記載の方法であって、
前記グループ（１２１'，１２１''，１２１'''）のそれぞれに割り当てられた参加者クライアント（１２１）は、第２の生成ビデオストリームが公開されるビデオ通信サービス（１１０）に参加することを含み、ここで、前記方法はさらに以下を含む：
前記グループ（１２１'，１２１''，１２１'''）の異なるものを、前記ビデオ通信サービス（１１０）における異なる参加者対話権限に関連付け；および、
前記グループ（１２１'，１２１''，１２１'''）の異なるものを、当該グループ（１２１'，１２１''，１２１'''）に割り当てられた参加者クライアント（１２１）に公開されるそれぞれの生成ビデオストリームを生成するために使用される異なる最大時間遅延に関連付ける。

【請求項14】

請求項１３に記載の方法であって、
前記グループ（１２１'，１２１''，１２１'''）のそれぞれの前記最大時間遅延は、当該グループ（１２１'，１２１''，１２１'''）内の参加クライアント（１２１）に連続的に公開されるすべての一次ビデオストリームおよびあらゆる生成ビデオストリームに亘る最大の待ち時間差として決定される。

【請求項15】

第２のデジタルビデオストリームを提供するコンピュータソフトウエア製品であって、該コンピュータプログラム機能は実行される際に、以下のステップを実行するコンピュータソフトウエア製品：
割り当てステップにおいて、複数の参加者クライアント（１２１）を、そうした参加者クライアント（１２１）の少なくとも２つのグループ（１２１'，１２１''，１２１'''）に亘って割り当て；
収集ステップにおいて、第１の参加者クライアント（１２１）から第１の一次デジタルビデオストリームを収集し、第２の参加者クライアント（１２１）から第２の一次デジタルビデオストリームを収集し、第３の参加者クライアント（１２１）から第３の一次デジタルビデオストリームを収集し、第４の参加者クライアント（１２１）から第４の一次デジタルビデオストリームを収集し、第５の参加者クライアント（１２１）から第５の一次デジタルビデオストリームを収集し、ここで、前記第１および第２の一次ビデオストリームは、参加者クライアント（１２１）の第１の割り当てグループ（１２１'）に割り当てられた参加者クライアント（１２１）から収集され、前記第４および第５の一次ビデオストリームは、参加者クライアント（１２１）の第３のグループ（１２１'''）に割り当てられた参加者クライアントから収集され；
公開ステップにおいて、前記第１の参加者クライアント（１２１）および前記第２の参加者クライアント（１２１）の少なくとも１つに対して、前記第１の一次デジタルビデオストリーム、前記第２の一次デジタルビデオ、および、前記第１および第２の一次ビデオストリームの少なくとも１つに基づいて生成された第１の生成ビデオストリームの少なくとも１つを提供し；
第２の生成ステップ（１３５''）において、前記第１の一次デジタルビデオストリーム、前記第２の一次デジタルビデオストリーム、前記第３の一次デジタルビデオストリームに基づいて、および前記第４および第５の一次ビデオストリームの少なくとも１つに基づいて、前記第２の生成ビデオストリームをデジタルビデオストリームとして生成し、ここで、前記第２の生成ステップ（１３５''）は、前記第２の生成ビデオストリームが、前記公開ステップにおいて前記第１または第２の参加者クライアント（１２１）に提供されるいずれのビデオストリームとも時間的に非同期であるように、時間遅延を導入し；
第３の生成ステップ（１３５'''）において、前記第４および第５の一次ビデオストリームに基づいて、第３の生成ビデオストリームを生成し、ここで、前記第３の生成ステップ（１３５'''）は、前記第３の生成ビデオストリームが、前記第１の生成ビデオストリームに対して時間的に非同期であるように、前記第４および第５の一次ビデオストリームを時間遅延させることを含み、
前記公開ステップはさらに、前記第２の生成ビデオストリームを、前記第１または第２の参加者クライアントではない少なくとも１つの消費者クライアント（１２１；１５０）に連続的に提供し、前記第３の生成ビデオストリームを、前記第３のグループに割り当てられた少なくとも１つの参加者クライアントに連続的に提供することを含む。

【請求項16】

共有デジタルビデオストリームを提供するコンピュータソフトウエア製品であって、該コンピュータプログラム機能は実行される際に、以下のステップを実行するコンピュータソフトウエア製品：
割り当てステップにおいて、複数の参加者クライアント（１２１）を、そうした参加者クライアント（１２１）の少なくとも２つのグループ（１２１'，１２１''，１２１'''）に亘って割り当て；
収集ステップにおいて、参加者クライアント（１２１）の第１の割り当てグループ（１２１'）に割り当てられた少なくとも２つの異なる参加者クライアント（１２１）から、第１の一次デジタルビデオストリームおよび第２の一次デジタルビデオストリームを収集し、参加者クライアント（１２１）の第３の割り当てグループ（１２１'''）に割り当てられた参加者クライアント（１２１）から、第４の一次デジタルビデオストリームおよび第５の一次デジタルビデオストリームを収集し；
第１の生成ステップ（１３５'）において、前記第１および第２の一次デジタルビデオストリームに基づいて、第１の生成ビデオストリームをデジタルビデオストリームとして生成し；
第２の生成ステップ（１３５''）において、前記第１の生成ビデオストリームおよび前記第１および第２の一次デジタルビデオストリームに基づいて、さらに前記第４および第５の一次ビデオストリームの少なくとも１つに基づいて、前記第２の生成ビデオストリームをデジタルビデオストリームとして生成し；
第３の生成ステップ（１３５'''）において、前記第４および第５の一次ビデオストリームに基づいて、第３の生成ビデオストリームを生成し、ここで、前記第３の生成ステップ（１３５'''）は、前記第３の生成ビデオストリームが、前記第１の生成ビデオストリームに対して時間的に非同期であるように、前記第４および第５の一次ビデオストリームを時間遅延させることを含み；
公開ステップ（１３６'''）において、前記第２の生成ビデオストリームを、前記第１または第２の参加者クライアントではない少なくとも１つの消費者クライアント（１２１；１５０）に連続的に提供し、前記第３の生成ビデオストリームを、前記第３のグループに割り当てられた少なくとも１つの参加者クライアントに連続的に提供し、ここで、
前記第２の生成ステップ（１３５''）において、前記第１の生成ステップ（１３５'）から生じる前記第１の生成ビデオストリームの待ち時間を考慮して、前記第１の生成ビデオストリームと時間同期させるように、前記第１および第２の一次デジタルビデオストリームを時間遅延させ、ここで、前記第２の生成ビデオストリームは、前記時間遅延された第１および第２の一次デジタルビデオストリームに基づいて生成される。

【請求項17】

共有デジタルビデオストリームを提供するコンピュータソフトウエア製品であって、該コンピュータプログラム機能は実行される際に、以下のステップを実行するコンピュータソフトウエア製品：
割り当てステップにおいて、複数の参加者クライアント（１２１）を、そうした参加者クライアント（１２１）の少なくとも２つのグループ（１２１'，１２１''，１２１'''）に亘って割り当て；
収集ステップにおいて、第１の参加者クライアント（１２１）から第１の一次デジタルビデオストリームを収集し、第２の参加者クライアント（１２１）から第２の一次デジタルビデオストリームを収集し、第３の参加者クライアント（１２１）から第３の一次デジタルビデオストリームを収集し、第４の参加者クライアント（１２１）から第４の一次デジタルビデオストリームを収集し、第５の参加者クライアント（１２１）から第５の一次デジタルビデオストリームを収集し、ここで、前記第１および第２の一次ビデオストリームは、参加者クライアント（１２１）の第１の割り当てグループ（１２１'）に割り当てられた参加者クライアント（１２１）から収集され、前記第４および第５の一次ビデオストリームは、参加者クライアント（１２１）の第３のグループ（１２１'''）に割り当てられた参加者クライアントから収集され；
第１の生成ステップ（１３５'）において、前記第１および第２の一次デジタルビデオストリームに基づいて、第１の生成ビデオストリームをデジタルビデオストリームとして生成し、ここで、前記第１の生成デジタルビデオストリームは、第１の待ち時間で公開されるために連続的に生成され；
第２の生成ステップ（１３５''）において、前記第１、第２および第３の一次デジタルビデオストリームに基づいて、さらに前記第４および第５の一次ビデオストリームの少なくとも１つに基づいて、前記第２の生成ビデオストリームをデジタルビデオストリームとして生成し、ここで、前記第２の生成ビデオストリームは、第２の待ち時間で公開されるために連続的に生成され、前記第２の待ち時間は、前記第１の待ち時間よりも大きく；
第３の生成ステップ（１３５'''）において、前記第４および第５の一次ビデオストリームに基づいて、第３の生成ビデオストリームを生成し、ここで、前記第３の生成ステップ（１３５'''）は、前記第３の生成ビデオストリームが、前記第１の生成ビデオストリームに対して時間的に非同期であるように、前記第４および第５の一次ビデオストリームを時間遅延させることを含み；および、
公開ステップ（１３６'）において、前記第１の一次デジタルビデオストリーム、前記第２の一次デジタルビデオストリーム、および前記第１の生成ビデオストリームのうちの少なくとも１つを、前記第１の参加者クライアント（１２１）および前記第２の参加者クライアント（１２１）のうちの少なくとも１つに連続的に提供し、前記第２の生成ビデオストリームを、少なくとも１つの他の参加者クライアント（１２１）に連続的に提供する。

【請求項18】

第２のデジタルビデオストリームを提供するシステム（１００）であって、該システム（１００）は中央サーバ（１３０）を備え、該中央サーバ（１３０）は、以下の機能を備えるシステム：
複数の参加者クライアント（１２１）を、そうした参加者クライアント（１２１）の少なくとも２つのグループ（１２１'，１２１''，１２１'''）に亘って割り当てるよう構成される割り当て機能；
第１の参加者クライアント（１２１）から第１の一次デジタルビデオストリームを収集し、第２の参加者クライアント（１２１）から第２の一次デジタルビデオストリームを収集し、第３の参加者クライアント（１２１）から第３の一次デジタルビデオストリームを収集し、第４の参加者クライアント（１２１）から第４の一次デジタルビデオストリームを収集し、第５の参加者クライアント（１２１）から第５の一次デジタルビデオストリームを収集するよう構成される収集機能、ここで、前記第１および第２の一次ビデオストリームは、参加者クライアント（１２１）の第１の割り当てグループ（１２１'）に割り当てられた参加者クライアント（１２１）から収集され、前記第４および第５の一次ビデオストリームは、参加者クライアント（１２１）の第３のグループ（１２１'''）に割り当てられた参加者クライアントから収集され；
前記第１の参加者クライアント（１２１）および前記第２の参加者クライアント（１２１）の少なくとも１つに対して、前記第１の一次デジタルビデオストリーム、前記第２の一次デジタルビデオ、および、前記第１および第２の一次ビデオストリームの少なくとも１つに基づいて生成された第１の生成ビデオストリームの少なくとも１つを提供するよう構成される公開機能；
前記第１の一次デジタルビデオストリーム、前記第２の一次デジタルビデオストリーム、前記第３の一次デジタルビデオストリームに基づいて、および前記第４および第５の一次ビデオストリームの少なくとも１つに基づいて、前記第２の生成ビデオストリームをデジタルビデオストリームとして生成するよう構成される第２の生成機能（１３５''）、ここで、前記第２の生成機能（１３５''）は、前記第２の生成ビデオストリームが、前記公開機能において前記第１または第２の参加者クライアント（１２１）に提供されるいずれのビデオストリームとも時間的に非同期であるように、時間遅延を導入し；
前記第４および第５の一次ビデオストリームに基づいて、第３の生成ビデオストリームを生成するよう構成される第３の生成機能（１３５'''）、ここで、前記第３の生成機能（１３５'''）は、前記第３の生成ビデオストリームが、前記第１の生成ビデオストリームに対して時間的に非同期であるように、前記第４および第５の一次ビデオストリームを時間遅延させることを含み、
前記公開機能はさらに、前記第２の生成ビデオストリームを、前記第１または第２の参加者クライアントではない少なくとも１つの消費者クライアント（１２１；１５０）に連続的に提供し、前記第３の生成ビデオストリームを、前記第３のグループに割り当てられた少なくとも１つの参加者クライアントに連続的に提供することを含む。

【請求項19】

共有デジタルビデオストリームを提供するシステム（１００）であって、該システム（１００）は中央サーバ（１３０）を備え、該中央サーバ（１３０）は、以下の機能を備えるシステム：
複数の参加者クライアント（１２１）を、そうした参加者クライアント（１２１）の少なくとも２つのグループ（１２１'，１２１''，１２１'''）に亘って割り当てるよう構成される割り当て機能；
参加者クライアント（１２１）の第１の割り当てグループ（１２１'）に割り当てられた少なくとも２つの異なる参加者クライアント（１２１）から、第１の一次デジタルビデオストリームおよび第２の一次デジタルビデオストリームを収集し、参加者クライアント（１２１）の第３の割り当てグループ（１２１'''）に割り当てられた参加者クライアント（１２１）から、第４の一次デジタルビデオストリームおよび第５の一次デジタルビデオストリームを収集するよう構成される収集機能；
前記第１および第２の一次デジタルビデオストリームに基づいて、第１の生成ビデオストリームをデジタルビデオストリームとして生成するよう構成される第１の生成機能（１３５'）；
前記第１の生成ビデオストリームおよび前記第１および第２の一次デジタルビデオストリームに基づいて、さらに前記第４および第５の一次ビデオストリームの少なくとも１つに基づいて、前記第２の生成ビデオストリームをデジタルビデオストリームとして生成するよう構成される第２の生成機能（１３５''）；
前記第４および第５の一次ビデオストリームに基づいて、第３の生成ビデオストリームを生成するよう構成される第３の生成機能（１３５'''）、ここで、前記第３の生成機能（１３５'''）は、前記第３の生成ビデオストリームが、前記第１の生成ビデオストリームに対して時間的に非同期であるように、前記第４および第５の一次ビデオストリームを時間遅延させることを含み；および、
前記第２の生成ビデオストリームを、前記第１または第２の参加者クライアントではない少なくとも１つの消費者クライアント（１２１；１５０）に連続的に提供し、前記第３の生成ビデオストリームを、前記第３のグループに割り当てられた少なくとも１つの参加者クライアントに連続的に提供するよう構成される公開機能（１３６'''）、ここで、
前記第２の生成機能（１３５''）において、前記第１の生成機能（１３５'）から生じる前記第１の生成ビデオストリームの待ち時間を考慮して、前記第１の生成ビデオストリームと時間同期させるように、前記第１および第２の一次デジタルビデオストリームを時間遅延させ、ここで、前記第２の生成ビデオストリームは、前記時間遅延された第１および第２の一次デジタルビデオストリームに基づいて生成される。

【請求項20】

共有デジタルビデオストリームを提供するシステム（１００）であって、該システム（１００）は中央サーバ（１３０）を備え、該中央サーバ（１３０）は、以下の機能を備えるシステム：
複数の参加者クライアント（１２１）を、そうした参加者クライアント（１２１）の少なくとも２つのグループ（１２１'，１２１''，１２１'''）に亘って割り当てるよう構成される割り当て機能；
第１の参加者クライアント（１２１）から第１の一次デジタルビデオストリームを収集し、第２の参加者クライアント（１２１）から第２の一次デジタルビデオストリームを収集し、第３の参加者クライアント（１２１）から第３の一次デジタルビデオストリームを収集し、第４の参加者クライアント（１２１）から第４の一次デジタルビデオストリームを収集し、第５の参加者クライアント（１２１）から第５の一次デジタルビデオストリームを収集するよう構成される収集機能、ここで、前記第１および第２の一次ビデオストリームは、参加者クライアント（１２１）の第１の割り当てグループ（１２１'）に割り当てられた参加者クライアント（１２１）から収集され、前記第４および第５の一次ビデオストリームは、参加者クライアント（１２１）の第３のグループ（１２１'''）に割り当てられた参加者クライアントから収集され；
前記第１および第２の一次デジタルビデオストリームに基づいて、第１の生成ビデオストリームをデジタルビデオストリームとして生成するよう構成される第１の生成機能（１３５'）、ここで、前記第１の生成デジタルビデオストリームは、第１の待ち時間で公開されるために連続的に生成され；
前記第１、第２および第３の一次デジタルビデオストリームに基づいて、さらに前記第４および第５の一次ビデオストリームの少なくとも１つに基づいて、前記第２の生成ビデオストリームをデジタルビデオストリームとして生成するよう構成される第２の生成機能（１３５''）、ここで、前記第２の生成ビデオストリームは、第２の待ち時間で公開されるために連続的に生成され、前記第２の待ち時間は、前記第１の待ち時間よりも大きく；
前記第４および第５の一次ビデオストリームに基づいて、第３の生成ビデオストリームを生成するよう構成される第３の生成機能（１３５'''）、ここで、前記第３の生成機能（１３５'''）は、前記第３の生成ビデオストリームが、前記第１の生成ビデオストリームに対して時間的に非同期であるように、前記第４および第５の一次ビデオストリームを時間遅延させることを含み；および、
前記第１の一次デジタルビデオストリーム、前記第２の一次デジタルビデオストリーム、および前記第１の生成ビデオストリームのうちの少なくとも１つを、前記第１の参加者クライアント（１２１）および前記第２の参加者クライアント（１２１）のうちの少なくとも１つに自動的かつ連続的に提供し、前記第２の生成ビデオストリームを、少なくとも１つの他の参加者クライアント（１２１）に連続的に提供するよう構成される公開機能（１３６'）。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、デジタルビデオストリームを生成するための、特に、２つ以上の異なるデジタル入力ビデオストリームに基づいてデジタルビデオストリームを生成するための、システム、コンピュータソフトウエア製品および方法に関する。好ましい実施形態において、デジタルビデオストリームは、特に複数の異なる同時接続ユーザが参加するデジタルビデオ会議、またはデジタルビデオ会議ないしミーティングシステムのコンテキストにおいて生成される。生成されたデジタルビデオストリームは、外部に公開(published)されてもよいし、デジタルビデオ会議またはデジタルビデオ会議システム内で公開されてもよい。

【0002】

他の実施形態では、本発明は、デジタルビデオ会議ではないが、複数のデジタルビデオ入力ストリームが同時に処理され、生成されるべきデジタルビデオストリームに結合されるコンテキストに適用される。例えば、このようなコンテキストは、教育的または指導的なものであってよい。

【背景技術】

【0003】

Microsoft（登録商標）Teams（登録商標）、Zoom（登録商標）、Google（登録商標） Meet（登録商標）など、多くのデジタルビデオ会議システムが知られており、２人以上の参加者が、ローカルで録画されたデジタルビデオとオーディオを使用してバーチャルに会議を行い、参加者全員にブロードキャストすることで、物理的な会議をエミュレートすることができる。

【0004】

このようなデジタルビデオ会議ソリューションを改善する一般的なニーズがあり、特に、視聴コンテンツの生成（制作）に関して、どのようなコンテンツを、どのような時間に、誰に、どのような配信チャネルを通じて見せるかといったことが重要である。

【0005】

たとえば、現在発話中の参加者を自動的に検出し、その発話中の参加者の対応するビデオフィード(video feed)を他の参加者に表示するシステムもある。多くのシステムでは、現在表示されている画面、ビューイングウィンドウ、デジタルプレゼンテーションなどのグラフィックを共有することが可能である。しかし、バーチャルミーティングがより複雑になるにつれ、現在利用可能なすべての情報のうち、どの情報を各時点で各参加者に表示すべきかをサービス側が把握することは、すぐに難しくなるであろう。

【0006】

他の例では、プレゼンテーションしている参加者がデジタルプレゼンテーションのスライドについて話しながらステージ上を動き回る。この場合、システムは、プレゼンテーションを表示するか、発表者を表示するか、あるいはその両方を表示するか、あるいはその２つを切り替えるかを決定する必要がある。

【0007】

自動生成プロセスによって、多数の入力デジタルビデオストリームに基づいて１つまたは複数の出力デジタルビデオストリームを生成し、そのような生成されたデジタルビデオストリームまたはストリーム群を１人または複数の消費者に提供することが望ましい場合がある。

【発明の開示】

【発明が解決しようとする課題】

【0008】

しかしながら多くの場合、このようなデジタルビデオ会議システムが直面する多くの技術的な困難のために、動的な会議画面のレイアウトマネージャや他の自動化された生成機能が、どのような情報を表示すべきかを選択することは困難である。

【0009】

第１に、デジタルビデオ会議はリアルタイム性を重視するため、遅延が小さいことが重要である。異なる参加者が異なるハードウエアを使用して参加するなど、異なる受信デジタルビデオストリームが、異なる遅延、異なるフレームレート、異なるアスペクト比、または異なる解像度と関連付けられる場合、これは問題となる。多くの場合、このような受信デジタルビデオストリームは、整形された(well-formed)ユーザ体験のための処理が必要とする。

【0010】

第２に、時間同期の問題がある。外部デジタルビデオストリームや参加者が提供するデジタルビデオストリームなどの、多様な入力デジタルビデオストリームは、典型的には中央サーバ等に供給されるため、そのようなデジタルビデオフィードをそれぞれ同期させる絶対的な時間は存在しない。大き過ぎる遅延と同様に、同期されていないデジタルビデオフィードは、ユーザ体験の低下につながる。

【0011】

第３に、複数参加者間のデジタルビデオ会議は、異なるエンコーディングまたはフォーマットを持つ異なるデジタルビデオストリームを含む可能性があり、これはデコードと再エンコーディングを必要とし、遅延と同期の点で問題が生じる。また、このようなエンコーディングは、計算負荷が高く、ハードウエア要件の点で高価となる。

【0012】

第４に、異なるデジタルビデオソースが異なるフレームレート、異なるアスペクト比、異なる解像度に関連付けられる可能性があるという事実は、メモリ割り当てのニーズが予測不可能に変化すること、継続的なバランスを必要とし得る。その結果、遅延や同期の問題が追加的に発生する可能性がある。その結果、大きなバッファが必要となる。

【0013】

第５に、参加者は、接続性の変動、離脱／再接続などの点で様々な困難を経験する可能性があり、整形されたユーザ体験を自動的に生成する上でさらなる困難をもたらす。

【0014】

これらの問題は、多数の参加者がいる；参加者が異なるハードウエアおよび／またはソフトウエアを使用して接続している；外部から提供されたデジタルビデオストリームを使用している；画面共有をしている；複数のホストを使用しているなど、より複雑な会議の状況で増幅される。

【0015】

教育や指導のためのデジタルビデオ生成システムのように、複数の入力デジタルビデオストリームに基づいて出力デジタルビデオストリームを生成すべき場合、対応する問題が他のコンテキストで生じる。

【0016】

スウェーデン特許出願ＳＥ２１５１２６７－８（本出願の有効優先日時点では未公開）は、上述の問題に対する様々な解決策を開示している。

【0017】

複数の参加者を含むデジタルビデオ環境では、さらに遅延に関する問題がある。特に、遅延の要件は異なる参加者の間で異なる可能性がある。このような環境では、時間遅延がコミュニケーションに悪影響を与えないように、すべての参加者に良好な時間同期された体験を提供することが困難であることが判明している。これは特に、複雑な構成のビデオ環境、例えば、中間的に生成された複数の参加者を含むビデオストリームを使用する場合、および／または複数のタイプの参加者を含む場合である。

【0018】

本発明は、上述した問題の１つまたは複数を解決するものである。

【課題を解決するための手段】

【0019】

したがって、本発明は、第２のデジタルビデオストリームを提供する方法に関し、該方法は以下のステップを含む：収集ステップにおいて、第１の参加者クライアントから第１の一次デジタルビデオストリームを収集し、第２の参加者クライアントから第２の一次デジタルビデオストリームを収集し、第３の参加者クライアントから第３の一次デジタルビデオストリームを収集し；公開ステップにおいて、前記第１の参加者クライアントおよび前記第２の参加者クライアントの少なくとも１つに対して、前記第１の一次デジタルビデオストリーム、前記第２の一次デジタルビデオストリーム、および、前記第１および第２の一次ビデオストリームの少なくとも１つに基づいて生成された第１の生成ビデオストリームの少なくとも１つを提供し；第２の生成ステップにおいて、前記第１の一次デジタルビデオストリーム、前記第２の一次デジタルビデオストリーム、および前記第３の一次デジタルビデオストリームに基づいて、前記第２の生成ビデオストリームをデジタルビデオストリームとして生成し、ここで、記第２の生成ステップは、前記第２の生成ビデオストリームが、前記公開ステップにおいて前記第１または第２の参加者クライアントに提供されるいずれのビデオストリームとも時間的に非同期であるように、時間遅延を導入し；ここで、前記公開ステップはさらに、前記第２の生成ビデオストリームを、前記第１または第２の参加者クライアントではない少なくとも１つの消費者クライアントに連続的に提供することを含む。

【0020】

本発明はまた、第２のデジタルビデオストリームを提供する方法に関し、該方法は以下のステップを含む：収集ステップにおいて、なくとも２つの異なるデジタルビデオ情報源から、第１の一次デジタルビデオストリームおよび第２の一次デジタルビデオストリームを収集し；第１の生成ステップにおいて、前記第１および第２の一次デジタルビデオストリームに基づいて、第１の生成ビデオストリームをデジタルビデオストリームとして生成し；第２の生成ステップにおいて、前記第１の生成ビデオストリームに基づいて、また前記第１および第２の一次デジタルビデオストリームに基づいて、前記第２の生成ビデオストリームをデジタルビデオストリームとして生成し；ここで、前記第２の生成ステップにおいて、前記第１の生成ステップから生じる前記第１の生成ビデオストリームの待ち時間を考慮して、前記第１の生成ビデオストリームと時間同期させるように、前記第１および第２の一次デジタルビデオストリームを時間遅延させ、ここで、前記第２の生成ビデオストリームは、前記時間遅延された第１および第２の一次デジタルビデオストリームに基づいて生成される。

【0021】

本発明はまた、第２のデジタルビデオストリームを提供する方法に関し、該方法は以下のステップを含む：収集ステップにおいて、第１の参加者クライアントから第１の一次デジタルビデオストリームを収集し、第２の参加者クライアントから第２の一次デジタルビデオストリームを収集し、第３の参加者クライアントから第３の一次デジタルビデオストリームを収集し；第１の生成ステップにおいて、前記第１および第２の一次デジタルビデオストリームに基づいて、第１の生成ビデオストリームをデジタルビデオストリームとして生成し、ここで、前記第１の生成デジタルビデオストリームは、第１の待ち時間で公開されるために連続的に生成され；第２の生成ステップにおいて、前記第１、第２および第３の一次デジタルビデオストリームに基づいて、前記第２の生成ビデオストリームをデジタルビデオストリームとして生成し、ここで、前記第２の生成ビデオストリームは、第２の待ち時間で公開されるために連続的に生成され、前記第２の待ち時間は、前記第１の待ち時間よりも大きく；および、公開ステップにおいて、前記第１の一次デジタルビデオストリーム、前記第２の一次デジタルビデオストリーム、および前記第１の生成ビデオストリームのうちの少なくとも１つを、前記第１の参加者クライアントおよび前記第２の参加者クライアントのうちの少なくとも１つに連続的に提供し、前記第２の生成ビデオストリームを、少なくとも１つの他の参加者クライアントに連続的に提供する。

【0022】

本発明はまた、第２のデジタルビデオストリームを提供するコンピュータソフトウエア製品に関し、該コンピュータプログラム機能は実行される際に、以下のステップを実行する：収集ステップにおいて、第１の参加者クライアントから第１の一次デジタルビデオストリームを収集し、第２の参加者クライアントから第２の一次デジタルビデオストリームを収集し、第３の参加者クライアントから第３の一次デジタルビデオストリームを収集し；公開ステップにおいて、前記第１の参加者クライアントおよび前記第２の参加者クライアントの少なくとも１つに対して、前記第１の一次デジタルビデオストリーム、前記第２の一次デジタルビデオストリーム、および、前記第１および第２の一次ビデオストリームの少なくとも１つに基づいて生成された第１の生成ビデオストリームの少なくとも１つを提供し；第２の生成ステップにおいて、前記第１の一次デジタルビデオストリーム、前記第２の一次デジタルビデオストリーム、および前記第３の一次デジタルビデオストリームに基づいて、前記第２の生成ビデオストリームをデジタルビデオストリームとして生成し、ここで、前記第２の生成ステップは、前記第２の生成ビデオストリームが、前記公開ステップにおいて前記第１または第２の参加者クライアントに提供されるいずれのビデオストリームとも時間的に非同期であるように、時間遅延を導入し；ここで、前記公開ステップはさらに、前記第２の生成ビデオストリームを、前記第１または第２の参加者クライアントではない少なくとも１つの消費者クライアントに連続的に提供することを含む。

【0023】

本発明はまた、共有デジタルビデオストリームを提供するコンピュータソフトウエア製品に関し、該コンピュータプログラム機能は実行される際に、以下のステップを実行する：収集ステップにおいて、少なくとも２つの異なるデジタルビデオ情報源から、第１の一次デジタルビデオストリームおよび第２の一次デジタルビデオストリームを収集し；第１の生成ステップにおいて、前記第１および第２の一次デジタルビデオストリームに基づいて、第１の生成ビデオストリームをデジタルビデオストリームとして生成し；第２の生成ステップにおいて、前記第１の生成ビデオストリームに基づいて、また前記第１および第２の一次デジタルビデオストリームに基づいて、前記第２の生成ビデオストリームをデジタルビデオストリームとして生成し、ここで、前記第２の生成ステップにおいて、前記第１の生成ステップから生じる前記第１の生成ビデオストリームの待ち時間を考慮して、前記第１の生成ビデオストリームと時間同期させるように、前記第１および第２の一次デジタルビデオストリームを時間遅延させ、ここで、前記第２の生成ビデオストリームは、前記時間遅延された第１および第２の一次デジタルビデオストリームに基づいて生成される。

【0024】

本発明はまた、共有デジタルビデオストリームを提供するコンピュータソフトウエア製品に関し、該コンピュータプログラム機能は実行される際に、以下のステップを実行する：収集ステップにおいて、第１の参加者クライアントから第１の一次デジタルビデオストリームを収集し、第２の参加者クライアントから第２の一次デジタルビデオストリームを収集し、第３の参加者クライアントから第３の一次デジタルビデオストリームを収集し；第１の生成ステップにおいて、前記第１および第２の一次デジタルビデオストリームに基づいて、第１の生成ビデオストリームをデジタルビデオストリームとして生成し、ここで、前記第１の生成デジタルビデオストリームは、第１の待ち時間で公開されるために連続的に生成され；第２の生成ステップにおいて、前記第１、第２および第３の一次デジタルビデオストリームに基づいて、前記第２の生成ビデオストリームをデジタルビデオストリームとして生成し、ここで、前記第２の生成ビデオストリームは、第２の待ち時間で公開されるために連続的に生成され、前記第２の待ち時間は、前記第１の待ち時間よりも大きく；および、公開ステップにおいて、前記第１の一次デジタルビデオストリーム、前記第２の一次デジタルビデオストリーム、および前記第１の生成ビデオストリームのうちの少なくとも１つを、前記第１の参加者クライアントおよび前記第２の参加者クライアントのうちの少なくとも１つに連続的に提供し、前記第２の生成ビデオストリームを、少なくとも１つの他の参加者クライアントに連続的に提供する。

【0025】

本発明はまた、第２のデジタルビデオストリームを提供するシステムに関し、該システムは中央サーバを備え、該中央サーバは以下の機能を備える：第１の参加者クライアントから第１の一次デジタルビデオストリームを収集し、第２の参加者クライアントから第２の一次デジタルビデオストリームを収集し、第３の参加者クライアントから第３の一次デジタルビデオストリームを収集するよう構成される収集機能；前記第１の参加者クライアントおよび前記第２の参加者クライアントの少なくとも１つに対して、前記第１の一次デジタルビデオストリーム、前記第２の一次デジタルビデオストリーム、および、前記第１および第２の一次ビデオストリームの少なくとも１つに基づいて生成された第１の生成ビデオストリームの少なくとも１つを提供するよう構成される公開機能；前記第１の一次デジタルビデオストリーム、前記第２の一次デジタルビデオストリーム、および前記第３の一次デジタルビデオストリームに基づいて、前記第２の生成ビデオストリームをデジタルビデオストリームとして生成するよう構成される第２の生成機能、ここで、前記第２の生成機能は、前記第２の生成ビデオストリームが、前記公開機能において前記第１または第２の参加者クライアントに提供されるいずれのビデオストリームとも時間的に非同期であるように、時間遅延を導入し；ここで、前記公開機能はさらに、前記第２の生成ビデオストリームを、前記第１または第２の参加者クライアントではない少なくとも１つの消費者クライアントに連続的に提供することを含むよう構成される。

【0026】

本発明はまた、共有デジタルビデオストリームを提供するシステムに関し、該システムは中央サーバを備え、該中央サーバは下の機能を備える：少なくとも２つの異なるデジタルビデオ情報源から、第１の一次デジタルビデオストリームおよび第２の一次デジタルビデオストリームを収集するよう構成される収集機能；前記第１および第２の一次デジタルビデオストリームに基づいて、第１の生成ビデオストリームをデジタルビデオストリームとして生成するよう構成される第１の生成機能；前記第１の生成ビデオストリームに基づいて、また前記第１および第２の一次デジタルビデオストリームに基づいて、前記第２の生成ビデオストリームをデジタルビデオストリームとして生成するよう構成される第２の生成機能、ここで、前記第２の生成機能において、前記第１の生成機能から生じる前記第１の生成ビデオストリームの待ち時間を考慮して、前記第１の生成ビデオストリームと時間同期させるように、前記第１および第２の一次デジタルビデオストリームを時間遅延させ、ここで、前記第２の生成ビデオストリームは、前記時間遅延された第１および第２の一次デジタルビデオストリームに基づいて生成される。

【0027】

本発明はまた、共有デジタルビデオストリームを提供するシステムに関し、該システムは中央サーバを備え、該中央サーバは以下の機能を備える：第１の参加者クライアントから第１の一次デジタルビデオストリームを収集し、第２の参加者クライアントから第２の一次デジタルビデオストリームを収集し、第３の参加者クライアントから第３の一次デジタルビデオストリームを収集するよう構成される収集機能；前記第１および第２の一次デジタルビデオストリームに基づいて、第１の生成ビデオストリームをデジタルビデオストリームとして生成するよう構成される第１の生成機能、ここで、前記第１の生成デジタルビデオストリームは、第１の待ち時間で公開されるために連続的に生成され；前記第１、第２および第３の一次デジタルビデオストリームに基づいて、前記第２の生成ビデオストリームをデジタルビデオストリームとして生成するよう構成される第２の生成機能、ここで、前記第２の生成ビデオストリームは、第２の待ち時間で公開されるために連続的に生成され、前記第２の待ち時間は、前記第１の待ち時間よりも大きく；および、前記第１の一次デジタルビデオストリーム、前記第２の一次デジタルビデオストリーム、および前記第１の生成ビデオストリームのうちの少なくとも１つを、前記第１の参加者クライアントおよび前記第２の参加者クライアントのうちの少なくとも１つに連続的に提供し、前記第２の生成ビデオストリームを、少なくとも１つの他の参加者クライアントに連続的に提供するよう構成される公開機能。

【0028】

さらに、本発明はシステムに関する。

【0029】

以下では、本発明の例示的な実施形態および添付の図面を参照しながら、本発明を詳細に説明する。

【図面の簡単な説明】

【0030】

【図1】図１は、第１の例示的システムを示す図である。

【図2】図２は、第２の例示的システムを示す図である。

【図3】図３は、第３の例示的システムを示す図である。

【図4】図４は、中央サーバを示す図である。

【図5】図５は、第１の方法を示す図である。

【図6a】図６ａは、図５に示す方法における異なる方法ステップに関連した後続する状態を示す図である。

【図6b】図６ｂは、図５に示す方法における異なる方法ステップに関連した後続する状態を示す図である。

【図6c】図６ｃは、図５に示す方法における異なる方法ステップに関連した後続する状態を示す図である。

【図6d】図６ｄは、図５に示す方法における異なる方法ステップに関連した後続する状態を示す図である。

【図6e】図６ｅは、図５に示す方法における異なる方法ステップに関連した後続する状態を示す図である。

【図6f】図６ｆは、図５に示す方法における異なる方法ステップに関連した後続する状態を示す図である。

【図7】図７は、共通プロトコルを概念的に示す図である。

【図8a】図８ａは、第２の方法を示す図である。

【図8b】図８ｂは、第３の方法を示す図である。

【図8c】図８ｃは、第４の方法を示す図である。

【図8d】図８ｄは、第５の方法を示す図である。

【図9】図９は、第４の例示的システムを示す図である。

【発明を実施するための形態】

【0031】

すべての図は、同一または対応する部分の参照符号を共有するものである。

【0032】

図１は、デジタルビデオストリーム、例えば共有デジタルビデオストリーム、を提供するための本発明に係る方法を実行するように構成された、本発明に係るシステム１００を示す。

【0033】

システム１００は、ビデオ通信サービス１１０を備えてもよいが、ビデオ通信サービス１１０は、いくつかの実施形態では、システム１００の外部にあってもよい。以下で説明するように、複数のビデオ通信サービス１１０が備えられてよい。

【0034】

システム１００は、１つまたは複数の参加者クライアント１２１を備えてよいが、１つ、いくつか、またはすべての参加者クライアント１２１は、いくつかの実施形態では、システム１００の外部であってもよい。

【0035】

システム１００は中央サーバ１３０を備える。

【0036】

本明細書で使用する場合、「中央サーバ」という用語は、明確に定義されたＡＰＩ（アプリケーション・プログラミング・インタフェース）を介するなど、論理的に一元化された方法でアクセスできるように構成された、コンピュータに実装された機能である。このような中央サーバの機能は、純粋にコンピュータソフトウエアに実装されてもよいし、ソフトウエアと仮想ハードウエアおよび／または物理ハードウエアの組み合わせに実装されてもよい。また、スタンドアロンの物理的または仮想的なサーバコンピュータに実装してもよいし、相互接続された複数の物理的および／または仮想的なサーバコンピュータに分散させて実装してもよい。

【0037】

中央サーバ１３０が実行する物理的または仮想的ハードウエア、言い換えれば、中央サーバ１３０の機能を定義するコンピュータソフトウエアは、それ自体従来のＣＰＵ、それ自体従来のＧＰＵ、それ自体従来のＲＡＭ／ＲＯＭメモリ、それ自体従来のコンピュータバス、およびインターネット接続のようなそれ自体従来の外部通信機能から構成され得る。

【0038】

ビデオ通信サービス１１０は、それが使用される限りにおいて、上記意味での中央サーバでもあり、それは中央サーバ１３０とは異なる中央サーバであってもよいし、中央サーバ１３０の一部であってもよい。

【0039】

これに対応して、参加者クライアント１２１のそれぞれは、対応する解釈で、各参加者クライアント１２１が実行する物理的または仮想的ハードウエア、言い換えれば、参加者クライアント１２１の機能を定義するコンピュータソフトウエアが、それ自体従来のＣＰＵ／ＧＰＵ、それ自体従来のＲＡＭ／ＲＯＭメモリ、それ自体従来のコンピュータバス、およびインターネット接続のようなそれ自体従来の外部通信機能を備える、上記意味での中央サーバであってもよい。

【0040】

各参加者クライアント１２１はまた、典型的には、進行中のビデオ通信の一部として参加者クライアント１２１に提供されるビデオコンテンツを表示するように配置されたコンピュータスクリーンと、ビデオ通信の一部として参加者クライアント１２１に提供されるサウンドコンテンツを発するように配置されたスピーカと、ビデオカメラと、ビデオ通信に対する人間の参加者１２２にローカルにサウンドを記録するように配置されたマイクロフォンとを備えるか、またはそれらと通信しており、参加者１２２は、当該参加者クライアント１２１を使用してビデオ通信に参加する。

【0041】

言い換えれば、各参加者クライアント１２１のそれぞれのヒューマン・マシン・インタフェースにより、それぞれの参加者１２２は、ビデオ通信において、他の参加者、および／または多様なソースから提供されるオーディオ／ビデオストリームと、当該クライアント１２１で対話することができる。

【0042】

一般に、各参加者クライアント１２１は、デジタルビデオストリーム、デジタルオーディオストリームおよび／または他のデジタルデータを受信するための、上記ビデオカメラ；上記マイクロフォン；キーボード；コンピュータマウスまたはトラックパッド；および／またはＡＰＩから構成され得る、それぞれの入力手段１２３を備える。入力手段１２３は、特に、ビデオ通信サービス１１０および／または中央サーバ１３０などの中央サーバからビデオストリームおよび／またはオーディオストリームを受信するように構成され、そのようなビデオストリームおよび／またはオーディオストリームは、ビデオ通信の一部として提供され、好ましくは、そのようなデジタルデータ入力ストリームの少なくとも２つのソース、たとえば参加者クライアント１２１および／または外部ソース（後述）から上記中央サーバに提供される対応するデジタルデータ入力ストリームに基づいて生成される。

【0043】

さらに一般的に、各参加者クライアント１２１は、上記コンピュータスクリーン；上記スピーカ；およびデジタルビデオおよび／またはオーディオストリームを発するＡＰＩから構成され得るそれぞれの出力手段１２４を備える。こうしたストリームは、当該参加者クライアント１２１を使用した、参加者１２２に対するローカルにキャプチャされたビデオおよび／またはオーディオを代表するものである。

【0044】

実際には、各参加者クライアント１２１は、スクリーン、スピーカ、マイク、およびインターネット接続を備える携帯電話などのモバイルデバイスであってもよく、モバイルデバイスは、ローカルでコンピュータソフトウエアを実行するか、リモートで実行されるコンピュータソフトウエアにアクセスして、当該参加者クライアント１２１の機能を実行する。これに対応して、参加者クライアント１２１は、厚型または薄型のラップトップまたは据え置き型コンピュータであってもよく、ローカルにインストールされたアプリケーションを実行したり、ウェブブラウザを介してリモートアクセスされた機能を使用したりすることもできる。

【0045】

本実施形態の１つの同じビデオ通信で使用される参加者クライアント１２１は、１つ以上、例えば少なくとも３つ、または少なくとも４つ存在してよい。

【0046】

参加クライアントの少なくとも２つの異なるグループが存在してよい。参加クライアントの各々は、そのような各グループに割り当てられてよい。グループは、参加クライアントの異なる役割、参加クライアントの異なる仮想的または物理的な場所、および／または参加クライアントの異なる対話権限(interaction rights)を反映してよい。

【0047】

そのような役割としては、多様なものが利用可能であり、例えば、「リーダ」または「会議主催者」、「スピーカ」、「パネリスト」、「対話する聴衆」、「遠隔リスナ」であってよい。

【0048】

そのような物理的な場所としては、多様なものが利用可能であり、例えば「ステージ上」、「パネル内」、「物理的に存在する聴衆」、「物理的に離れた聴衆」であってよい。

【0049】

仮想的な場所は、物理的な場所という観点から定義されてよいが、物理的な場所と部分的に重複し得る仮想的なグルーピングを含んでもよい。例えば、物理的に存在する聴衆参加者を第１の仮想グループと第２の仮想グループとに分け、物理的に存在する一部の聴衆参加者を、物理的に離隔する一部の聴衆参加者とともに１つの同じ仮想グループにグルーピングしてよい。

【0050】

このような対話権限としては、多様なものが利用可能であり、例えば、「完全な対話」（制限なし）、「話すことはできるが、マイクを要求した後でなければ話せない」（ビデオ会議サービスで仮想の手を挙げるなど）、「話すことはできないが、共通のチャットに書き込むことができる」、「見る／聞くだけ」であってよい。

【0051】

ある実施態様では、定義された各役割、および／または物理的／仮想的な場所は、ある所定の対話権限に関して定義されるかもしれない。他の例では、同じ対話権限を持つすべての参加者がグループを形成する。したがって、定義された役割、場所、および／または対話権限は、多様なグループ割当てを反映することができ、異なるグループは、必要に応じて相互に異なっても、または重複してもよい。

【0052】

これは以下に例示的に説明される。

【0053】

ビデオ通信は、本明細書で説明し例示するように、少なくとも一部がビデオ通信サービス１１０によって提供され、少なくとも一部が中央サーバ１３０によって提供され得る。

【0054】

この用語が本明細書で使用される場合、「ビデオ通信」とは、少なくとも２つ、好ましくは少なくとも３つまたは少なくとも４つのビデオストリームを含む双方向デジタル通信セッションであり、好ましくは、１つまたは複数の混合または共同デジタルビデオ／オーディオストリームを生成するために使用され、ビデオおよび／またはオーディオを介してビデオ通信に貢献してもしなくてもよい１人または複数の消費者（例えば、上述のタイプの参加者クライアント）により消費されるオーディオストリームとも一致する。このようなビデオ通信は、リアルタイムであり、一定の待ち時間または遅延があってもなくてもよい。このようなビデオ通信に参加する少なくとも１人、好ましくは少なくとも２人、または少なくとも４人の参加者１２２は、ビデオ／オーディオ情報を提供および消費する双方向の方法でビデオ通信に関与する。

【0055】

参加者クライアント１２１の少なくとも１つ、または参加者クライアント１２１のすべては、ローカル同期ソフトウエア機能１２５を備えており、その詳細は後述する。

【0056】

ビデオ通信サービス１１０は、以下により詳細に説明するように、共通時間基準を備えるか、または共通時間基準にアクセスすることができる。

【0057】

少なくとも１つの中央サーバ１３０のそれぞれは、当該中央サーバ１３０の外部のエンティティとデジタル通信するためのＡＰＩ１３７を含んでいてもよい。このような通信は、入力と出力の両方を含んでよい。

【0058】

中央サーバ１３０などのシステム１００は、外部から提供されるビデオストリームなどの外部情報ソース３００とデジタル通信し、特に外部情報ソース３００からオーディオおよび／またはビデオストリームデータなどのデジタル情報を受信するように構成され得る。情報ソース３００が「外部」であるということは、中央サーバ１３０から、または中央サーバ１３０の一部として提供されないことを意味する。好ましくは、外部情報ソース３００によって提供されるデジタルデータは、中央サーバ１３０から独立しており、中央サーバ１３０はその情報内容に影響を与えることができない。例えば、外部情報ソース３００は、公のスポーツイベントや進行中のニュースイベントや報道のような、ライブキャプチャされたビデオおよび／またはオーディオであってもよい。また、外部情報ソース３００は、参加者クライアント１２１のいずれかによってではなく、ウェブカメラなどによってキャプチャされてもよい。したがって、そのようなキャプチャされたビデオは、参加者クライアント１２１のいずれか１つと同じ局所（地域）を描写することができるが、参加者クライアント１２１の活動の一部としてキャプチャされることはない。外部から提供される情報ソース３００と内部から提供される情報ソース１２０との間の１つのあり得る相違点は、内部から提供される情報ソースは、上記定義されたタイプのビデオ通信への参加者として、その能力において提供され得るが、外部から提供される情報ソース３００はそうではなく、代わりに、当該ビデオ会議の外部であるコンテキストの一部として提供されることである。

【0059】

また、オーディオおよび／またはビデオストリームなどの当該タイプのデジタル情報を中央サーバ１３０に並行して提供する、複数の外部情報ソース３００が存在してもよい。

【0060】

図１に示すように、各参加者クライアント１２１は、説明したように、当該参加者クライアント１２１によってビデオ通信サービス１１０に提供されるそれぞれの情報（ビデオおよび／またはオーディオ）ストリーム１２０のソースを構成する。

【0061】

中央サーバ１３０などのシステム１００は、外部消費者１５０とデジタル通信し、特に外部消費者１５０にデジタル情報を発するようにさらに構成されてもよい。例えば、中央サーバ１３０によって生成されたデジタルビデオおよび／またはオーディオストリームは、上記ＡＰＩ１３７を介して、１つまたは複数の外部消費者１５０に、リアルタイムまたはほぼリアルタイムで、連続的に提供され得る。ここでも、消費者１５０が「外部」であるということは、消費者１５０が中央サーバ１３０の一部として提供されないこと、および／または当該ビデオ通信の当事者ではないことを意味する。

【0062】

特に断りのない限り、本明細書におけるすべての機能および通信は、適切なコンピュータハードウエア上で実行されるコンピュータソフトウエアによって実現され、インターネットのようなデジタル通信ネットワークまたはチャネルを介して通信されて、デジタル的かつ電子的に提供される。

【0063】

したがって、図１に示されるシステム１００の構成では、多数の参加者クライアント１２１が、ビデオ通信サービス１１０によって提供されるデジタルビデオ通信に参加する。各参加者クライアント１２１は、それゆえ、ビデオ通信サービス１１０に対する進行中のログイン、セッション、または同様のものを有し、ビデオ通信サービス１１０によって提供される１つの同じ進行中のビデオ通信に参加することができる。言い換えれば、ビデオ通信は、参加者クライアント１２１の間で「共有」され、したがって、対応する人間の参加者１２２によっても「共有」される。

【0064】

図１では、中央サーバ１３０は、自動参加者クライアント１４０を備え、これは参加者クライアント１２１に対応する自動クライアントであるが、人間の参加者１２２には関連付けられない。その代わりに、自動参加者クライアント１４０は、参加者クライアント１２１と同じ共有ビデオ通信に参加するために、ビデオ通信サービス１１０に参加者クライアントとして追加される。このような参加者クライアントとして、自動参加者クライアント１４０には、ビデオ通信サービス１１０によって進行中のビデオ通信の一部として提供される、連続的に生成されるデジタルビデオおよび／またはオーディオストリーム（複数可）へのアクセスが付与され、こうしたストリームは自動参加者クライアント１４０を介して中央サーバ１３０によって消費されることができる。好ましくは、自動参加者クライアント１４０は、ビデオ通信サービス１１０から、各参加者クライアント１２１に配信される、または配信され得る共通のビデオおよび／またはオーディオストリーム；１つまたは複数の参加者クライアント１２１の各々からビデオ通信サービス１１０に提供され、ビデオ通信サービス１１０によってすべての参加者クライアント１２１または要求している参加者クライアント１２１に生データまたは修正された形式で中継されるそれぞれのビデオおよび／またはオーディオストリーム；および／または共通時間基準、を受信する。

【0065】

中央サーバ１３０は、後述するように処理するために、自動参加者クライアント１４０から、場合によっては上記外部情報ソース（複数可）３００からも、上記タイプのビデオストリームおよび／またはオーディオストリームを複数受信し、その後、ＡＰＩ１３７を介して生成されたビデオストリーム、例えば共有ビデオストリームを提供するように構成された収集機能１３１を備えてよい。たとえば、この生成されたビデオストリームは、外部の消費者１５０によって、および／またはビデオ通信サービス１１０によって消費され、ビデオ通信サービス１１０によって、参加者クライアント１２１のすべてまたは要求する任意の１つに配信される。

【0066】

図２は図１と同様であるが、自動参加者クライアント１４０を使用する代わりに、中央サーバ１３０は、ビデオ通信サービス１１０のＡＰＩ１１２を介して、進行中のビデオ通信からビデオおよび／またはオーディオストリームデータを受信する。

【0067】

図３も図１と同様であるが、ビデオ通信サービス１１０は示されていない。この場合、参加者クライアント１２１は、中央サーバ１３０のＡＰＩ１３７と直接通信し、例えば、中央サーバ１３０にビデオおよび／またはオーディオストリームデータを提供し、および／または中央サーバ１３０からビデオおよび／またはオーディオストリームデータを受信する。次に、生成された共有ストリームは、外部消費者１５０に、および／またはクライアント参加者１２１のうちの１つまたは複数に提供され得る。

【0068】

図４は、中央サーバ１３０をより詳細に示している。図示されるように、収集機能１３１は、１つまたは好ましくは複数の、フォーマット固有の収集機能１３１ａから構成され得る。フォーマット固有の収集機能１３１ａの各々は、所定のバイナリエンコーディングフォーマットおよび／または所定のストリームデータコンテナのような所定のフォーマットを有するビデオおよび／またはオーディオストリームを受信するように構成され、具体的には、上記フォーマットのバイナリビデオおよび／またはオーディオデータを解析(parse)して、個々のビデオフレーム、ビデオフレームのシーケンスおよび／またはタイムスロットに分類するように構成される。

【0069】

中央サーバ１３０は、収集機能１３１からバイナリストリームデータなどのビデオおよび／またはオーディオストリームデータを受信し、受信した複数のデータストリームの個々の１つに対してそれぞれのイベント検出を実行するように構成された、イベント検出機能１３２をさらに備える。イベント検出機能１３２は、イベント検出を実行するためのＡＩ（人工知能）コンポーネント１３２ａを備えてよい。イベント検出は、収集された個別の複数のストリームを最初に時間同期させることなく実行されてよい。

【0070】

中央サーバ１３０は、収集機能１３１によって提供され、イベント検出機能１３２によって処理されてよい複数のデータストリームを時間同期させるように構成された同期機能１３３をさらに備える。同期機能１３３は、時間同期を実行するためのＡＩコンポーネント１３３ａを備えてよい。

【0071】

中央サーバ１３０は、受信した複数のデータストリームの少なくとも１つでもよいが、多くの場合は少なくとも２つ、例えば少なくとも３つまたは少なくとも４つ、例えばすべて、の組み合わせに基づいてパターン検出を実行するように構成されたパターン検出機能１３４をさらに備えてよい。パターン検出はさらに、イベント検出機能１３２によって上記複数のデータストリームの個々の１つごとに検出された１つ、場合によっては少なくとも２つ以上のイベントに基づいてもよい。パターン検出機能１３４によって考慮されるそのような検出されたイベントは、個々の収集されたストリームに関して時間に亘って分布し得る。パターン検出機能１３４は、パターン検出を実行するためのＡＩコンポーネント１３４ａを備えてよい。パターン検出はさらに、上述したグルーピングに基づいてもよく、特に、１つのグループに関してのみ発生する特定のパターンを検出するように構成されてもよく、すべてのグループではなくいくつかのグループに関してのみ発生する特定のパターンを検出するように構成されてもよく、すべてのグループに関して発生する特定のパターンを検出するように構成されてもよい。

【0072】

中央サーバ１３０は、収集機能１３１から提供された複数のデータストリームに基づいて、さらに、場合によっては検出されたあらゆるイベントおよび／またはパターンに基づいて、例えば共有デジタルビデオストリームなどの生成されたデジタルビデオストリームを生成するように構成された、生成機能１３５をさらに備える。生成されたビデオストリームは、少なくとも、収集機能１３１によって提供された、生データの、再フォーマットされた、または変換されたビデオストリームの１つまたは複数を備えるように生成されたビデオストリームを含み、対応するオーディオストリームデータを含んでもよい。以下に例示するように、複数の生成されたビデオストリームが存在してよく、そのような生成されたビデオストリームの１つは、上述の方法で生成されてよいが、別の既に生成されたビデオストリームにさらに基づいて生成されてよい。

【0073】

すべての生成されたビデオストリームは、好ましくは連続的に、好ましくはほぼリアルタイムで生成される（本明細書で後述するタイプの待ち時間や遅延を差し引いた後）。

【0074】

中央サーバ１３０はさらに、上述のＡＰＩ１３７を介するなどして、生成された共有デジタルビデオストリームを公開する(publish)ように構成された公開機能１３６を備えてよい。

【0075】

図１、図２および図３は、本明細書で説明する原理を実施するために、特に本発明による方法を提供するために、中央サーバ１３０をどのように使用できるかの３つの異なる例を示しているが、１つまたは複数のビデオ通信サービス１１０を使用する、または使用しない他の構成も可能であることに留意されたい。

【0076】

したがって、図５は、生成されたデジタルビデオストリームを提供するための方法を図示する。図６ａから図６ｆは、図５に示される方法ステップの結果として生じる異なるデジタルビデオ／オーディオデータストリームの状態を示す。

【0077】

最初のステップで、本方法は始まる。

【0078】

続く収集ステップにおいて、それぞれの複数の一次デジタルビデオストリーム２１０、３０１が、例えば収集機能１３１によって、上記デジタルビデオソース１２０、３００のうちの少なくとも２つから収集される。このような複数の一次データストリーム２１０、３０１はそれぞれ、オーディオ部分２１４および／またはビデオ部分２１５を備えてよい。このコンテキストにおける「ビデオ」は、かかるデータストリームの動画および／または静止画像コンテンツを示すことが理解される。各一次データストリーム２１０、３０１は、（当該一次ストリーム２１０、３０１を提供するエンティティによって使用されるそれぞれのコーデックを使用して）任意のビデオ／オーディオ符号化標準に従ってエンコードされてよく、符号化フォーマットは、１つの同じビデオ通信で同時に使用される当該複数の一次ストリーム２１０、３０１の異なるもの間で異なってよい。複数の一次データストリーム２１０、３０１の少なくとも１つ、例えば全ては、バイナリデータのストリームとして提供されることが好ましく、場合によっては、それ自体従来のデータコンテナデータ構造で提供される。複数の一次データストリーム２１０、３０１の少なくとも１つ、例えば少なくとも２つ、あるいはすべてが、それぞれのライブビデオ録画として提供されることが好ましい。

【0079】

複数の一次データストリーム２１０、３０１は、収集機能１３１によって受信されるとき、時間的に同期していない可能性があることに留意されたい。これは、それらが互いに対して異なる待ち時間または遅延に関連付けられていることを意味し得る。例えば、２つの一次ビデオストリーム２１０、３０１がライブ録画である場合、これは、収集機能１３１によって受信されたときに、それらが録画時間に関して異なる待ち時間に関連付けられていることを意味し得る。

【0080】

また、複数の一次データストリーム２１０、３０１は、それ自体が、ウェブカメラからのそれぞれのライブカメラフィード；現在共有されている画面やプレゼンテーション；視聴されているフィルムクリップ；あるいは、１つの同じ画面内に様々な方法で配置されたこれらの任意の組み合わせであったりすることに留意されたい。

【0081】

収集ステップは、図６ａおよび図６ｂに示されている。図６ｂでは、収集機能１３１が、各一次ビデオストリーム２１０、３０１を、バンドルされたオーディオ／ビデオ情報として、または関連するビデオストリームデータから分離されたオーディオストリームデータとして、どのように格納できるかも示されている。図６ｂは、一次ビデオストリーム２１０、３０１のデータが、個々のフレーム２１３またはフレームの集積／クラスタとしてどのように格納されるかを図示し、「フレーム」は、ここでは、画像データおよび／または任意の関連するオーディオデータの時間制限された部分を指し、たとえば、各フレームは、個々の静止画像であるか、または連続する一連の画像（たとえば、最大で１秒の動画像を構成するような一連の画像）であり、一緒に動画像ビデオコンテンツを形成する。

【0082】

イベント検出機能１３２によって実行される後続のイベント検出ステップにおいて、複数の一次デジタルビデオストリーム２１０、３０１は、イベント検出機能１３２、特にＡＩコンポーネント１３２ａなどによって分析され、第１のイベントセットから選択された少なくとも１つのイベント２１１を検出する。これを図６ｃに示す。

【0083】

このイベント検出ステップは、少なくとも１つの、例えば少なくとも２つの、例えば全ての、一次ビデオストリーム２１０、３０１に対して行われ、当該一次ビデオストリーム２１０、３０１の各々に対して個別に行われることが好ましい。換言すれば、イベント検出ステップは、好ましくは、当該特定の一次ビデオストリーム２１０、３０１の一部として含まれる情報のみを考慮し、特に、他の一次ビデオストリームの一部として含まれる情報を考慮することなく、当該個々の一次ビデオストリーム２１０、３０１に対して行われる。さらに、イベント検出は、好ましくは、複数の一次ビデオストリーム２１０、３０１に関連付けられるあらゆる共通の時間基準２６０を考慮することなく行われる。

【0084】

一方、好ましくは、イベント検出は、ある時間間隔に亘って、例えば、０秒より長い、例えば、少なくとも０．１秒、例えば、少なくとも１秒のような一次ビデオストリームの履歴時間間隔に亘って、当該個別に分析された一次ビデオストリームの一部として含まれる情報を考慮する。

【0085】

イベント検出は、一次ビデオストリーム２１０、３０１の一部として含まれるオーディオおよび／またはビデオデータに含まれる情報を考慮してもよい。

【0086】

上記第１のイベントセットには、当該一次ビデオストリーム２１０、３０１を構成する、または当該一次ビデオストリーム２１０、３０１の一部であるスライドプレゼンテーションにおけるスライドの変化；当該一次ビデオストリーム２１０、３０１を提供するソース１２０、３００の接続品質の変化であって、画像品質の変化、画像データの損失、または画像データの再取得をもたらす接続品質の変化；および、ビデオ内の人物またはオブジェクトの動き、ビデオ内の照明の変化、オーディオ内の突然の鋭いノイズ、またはオーディオ品質の変化などの当該一次ビデオストリーム２１０、３０１内で検出された動きの物理的イベント等の、任意の数のタイプのイベントが含まれ得る。これは、網羅的なリストであることを意図するものではなく、これらの例は、現在説明されている原理の適用可能性を理解するために提供されるものであることを理解されたい。

【0087】

同期機能１３３によって実行される後続の同期ステップにおいて、複数の一次デジタルビデオストリーム２１０は、時間同期される。この時間同期は、共通の時間基準２６０に対して実行されてよい。図６ｄに示されるように、この時間同期は、例えば共通時間基準２６０を使用して、複数の一次ビデオストリーム２１０、３０１を互いに対して整列させることを含んでよく、これにより、それらが組み合わされて、時間同期されたコンテキストを形成することができる。共通時間基準２６０は、データのストリーム、ハートビート信号または他のパルスデータ、または個別の複数の一次ビデオストリーム２１０、３０１のそれぞれに適用可能な時間アンカであってもよい。共通時間基準を個別の複数の一次ビデオストリーム２１０、３０１のそれぞれに適用できるようにすることによって、共通の時間軸に関して、当該一次ビデオストリーム２１０、３０１の情報コンテンツを共通時間基準に対して一義的に関連付けることができる。言い換えれば、共通時間基準により、複数の一次ビデオストリーム２１０、３０１は、タイムシフトを介して、現在の感覚(present sense)において時間同期されるように整列させられる。他の実施形態では、時間同期は、測定値など、当該一次ビデオストリーム２１０、３０１間の時間差に関する既知の情報に基づいてもよい。

【0088】

図６ｄに示されるように、時間同期は、複数の一次ビデオストリーム２１０、３０１のそれぞれについて、例えば、共通時間基準２６０に関連して、またはビデオストリーム２１０、３０１のそれぞれについて、他方のビデオストリーム２１０、３０１に関連してまたは他の複数のビデオストリーム２１０、３０１に関連して、１つまたは複数のタイムスタンプ２６１を決定することを含んでよい。

【0089】

パターン検出機能１３４によって実行される後続のパターン検出ステップにおいて、時間同期された複数の一次デジタルビデオストリーム２１０、３０１は、第１のパターンセットから選択された少なくとも１つのパターン２１２を検出するために分析される。これを図６ｅに示す。

【0090】

イベント検出ステップとは対照的に、パターン検出ステップは、好ましくは、時間同期された複数の一次ビデオストリーム２１０、３０１の少なくとも２つの一部として含まれるビデオおよび／またはオーディオ情報に基づいて実行される。

【0091】

上記第１のパターンのセットは、複数の参加者が入れ替わり立ち替わりまたは同時に発話する；またはプレゼンテーションスライドの変更が別の参加者が発話するなどの別のイベントとして同時に発生するなど、任意の数のタイプのパターンを含んでよい。このリストは網羅的なものではなく、例示的なものである。

【0092】

代替的実施形態では、検出されたパターン２１２は、複数の一次ビデオストリーム２１０、３０１のうちの複数に含まれる情報ではなく、複数の一次ビデオストリーム２１０、３０１のうちの１つのみに含まれる情報に関連してよい。そのような場合、そのようなパターン２１２は、少なくとも２つの検出されたイベント２１１、例えば２つ以上の連続して検出されたプレゼンテーションスライド変更または接続品質変更に跨る、その単一の一次ビデオストリーム２１０、３０１に含まれるビデオおよび／またはオーディオ情報に基づいて検出されることが好ましい。一例として、検出されたスライド変更イベントごとの１つの個別のスライド変更パターンとは対照的に、時間の経過とともに急速に互いに続く複数の連続したスライド変更が、１つの単一のスライド変更パターンとして検出される場合がある。

【0093】

第１のイベントセットおよび第１のパターンセットは、パラメータおよびパラメータ間隔のそれぞれのセットを使用して定義された、所定のタイプのイベント／パターンを備えてよいことが理解される。以下に説明するように、上記セットのイベント／パターンは、様々なＡＩツールを使用して定義および検出することもできる。

【0094】

生成機能１３５によって実行される後続の生成ステップにおいて、共有デジタルビデオストリームは、時間同期された複数の一次デジタルビデオストリーム２１０、３０１の連続的に考慮された複数のフレーム２１３と、検出されたパターン２１２とに基づいて、出力デジタルビデオストリーム２３０として生成される。

【0095】

以下に説明し詳述するように、本発明により、例えば出力デジタルビデオストリーム２３０のようなビデオストリームを完全に自動生成することができる。

【0096】

例えば、このような生成は、どの一次ビデオストリーム２１０、３０１からどのようなビデオおよび／またはオーディオ情報を、出力ビデオストリーム２３０でどの程度使用するかの選択；出力ビデオストリーム２３０のビデオスクリーンレイアウト；時間に亘る異なるそのような使用またはレイアウト間の切り替えパターンなどを含んでよい。

【0097】

これは、図６ｆにも示されており、この図６ｆには、出力ビデオストリーム２３０の生成において、（例えば共通時間基準２６０に対して）時間同期され、時間同期された複数の一次ビデオストリーム２１０、３０１と協働して使用され得る、追加デジタルビデオ情報ストリームなどの、時間に関連する（共通時間基準２６０に関連してよい）デジタルビデオ情報２２０の１つまたは複数の追加部分が示されている。例えば、追加ストリーム２２０は、検出されたパターンに動的に基づくような、使用する任意のビデオおよび／またはオーディオ特殊効果に関する情報；ビデオ通信のための計画されたタイムスケジュールなどを含んでよい。

【0098】

公開機能１３６によって実行される後続の公開ステップにおいて、生成された出力デジタルビデオストリーム２３０は、上述のように、共有デジタルビデオストリームの消費者１１０、１５０に連続的に提供される。生成されたデジタルビデオストリームは、例えばビデオ通信サービス１１０を介して、１つまたは複数の参加者クライアント１２１に提供され得る。

【0099】

後続するステップで、本方法は終了する。しかしながら、最初に、本方法は、図５に示されるように、出力ビデオストリーム２３０を連続的に提供されるストリームとして生成するために、任意の回数、反復されてもよい。好ましくは、出力ビデオストリーム２３０は、リアルタイムまたはほぼリアルタイム（途中のすべてのステップによって付加される待ち時間の合計を考慮する）で、かつ連続的に（より多くの情報が利用可能になったときに直ちに公開されるが、ただし、以下に説明する意図的に付加される待ち時間はカウントしない）消費されるように生成される。このようにして、出力ビデオストリーム２３０は、双方向（インタラクティブ）方式で消費されてよく、これにより、ビデオ通信サービス１１０に、または、閉じたフィードバックループを形成するように収集機能１３１に再び供給される一次ビデオストリーム２１０の生成の基礎を形成する他のコンテキストに、出力ビデオストリーム２３０がフィードバックされ；または、異なる（システム１００の外部、または、少なくとも中央サーバ１３０の外部の）コンテキストに、出力ビデオストリーム２３０が消費され、そこで、リアルタイムの双方向ビデオ通信の基礎を形成することができる。

【0100】

上述したように、いくつかの実施形態では、複数の一次デジタルビデオストリーム２１０、３０１の少なくとも２つ、例えば少なくとも３つ、例えば少なくとも４つまたは少なくとも５つは、ビデオ通信サービス１１０によって提供されるような共有デジタルビデオ通信の一部として提供され、このビデオ通信は、当該一次デジタルビデオストリーム２１０を提供するそれぞれの遠隔接続された参加者クライアント１２１を含む。このような場合、収集ステップは、共有デジタルビデオ通信サービス１１０自体から、当該ビデオ通信サービス１１０内からビデオおよび／またはオーディオストリームデータへのアクセスを順番に付与された自動参加者クライアント１４０を介して、および／またはビデオ通信サービス１１０のＡＰＩ１１２を介して、当該一次デジタルビデオストリーム２１０の少なくとも１つを収集することから構成され得る。

【0101】

さらに、この場合および他の場合において、収集ステップは、共有デジタルビデオ通信サービス１１０の外部である情報ソース３００から収集されたそれぞれの外部デジタルビデオストリーム３０１として、上記複数の一次デジタルビデオストリーム２１０、３０１の少なくとも１つを収集することを備えてよい。このような外部ビデオソース３００の１つまたは複数が、中央サーバ１３０の外部にあってもよいことに留意されたい。

【0102】

いくつかの実施形態では、複数の一次ビデオストリーム２１０、３０１は、同じ方法でフォーマットされていない。そのような異なるフォーマットは、それらが異なるタイプのデータコンテナ（ＡＶＩまたはＭＰＥＧなど）で収集機能１３１に供給される形式であり得るが、好ましい実施形態では、複数の一次ビデオストリーム２１０、３０１の少なくとも１つは、（一次ビデオストリーム２１０、３０１の少なくとも１つの他のものに対して）偏位する(deviating)フォーマットに従ってフォーマットされ、これは、偏位する一次デジタルビデオストリーム２１０、３０１が偏位するビデオ符号化；偏位する固定または可変フレームレート；偏位するアスペクト比；偏位するビデオ解像度；および／または偏位するオーディオサンプルレートを有するという点においてである。

【0103】

収集機能１３１は、収集されたすべての一次ビデオストリーム２１０、３０１で発生するすべての符号化フォーマット、コンテナ規格などを読み取り、解釈するように事前に構成されていることが好ましい。これにより、本明細書で説明するような処理を実行することが可能になり、これらの処理の比較的後の段階まで（当該一次ストリームがそれぞれのバッファに入れられるまで；イベント検出ステップの後まで；あるいはイベント検出ステップの後までなど）、デコーディングを必要としない。しかしながら、一次ビデオフィード２１０、３０１のうちの１つまたは複数が、収集機能１３１がデコードせずには解釈できないコーデックを使用して符号化されているという稀なケースでは、収集機能１３１は、そのような一次ビデオストリーム２１０、３０１のデコードおよび分析を実行し、その後、例えばイベント検出機能によって処理できるフォーマットへの変換を実行するように構成されてよい。この場合でも、この段階で再エンコードを実行しないことが好ましいことに留意されたい。

【0104】

例えば、ビデオ通信サービス１１０によって提供されるような、複数当事者間のビデオイベントからフェッチされる一次ビデオストリーム２２０は、典型的には、低遅延に対する要求があり、したがって、典型的には、参加者１２２が効果的な通信を行うことを可能にするために、可変フレームレートおよび可変ピクセル解像度と関連付けられる。言い換えれば、全体的なビデオおよびオーディオの品質は、低遅延のために必要に応じて低下する。

【0105】

一方、外部ビデオフィード３０１は、典型的には、より安定したフレームレートを持ち、高画質であるが、それゆえ遅延が大きくなる可能性がある。

【0106】

したがって、ビデオ通信サービス１１０は、各時点で、外部ビデオソース３００とは異なる符号化（エンコーディング）および／またはコンテナを使用し得る。したがって、本明細書で説明する分析およびビデオ生成プロセスは、この場合、異なるフォーマットのこれら複数のストリーム２１０、３０１を、結合された経験のために新たな１つのストリームに結合する必要がある。

【0107】

上述したように、収集機能１３１は、フォーマット固有の収集機能１３１ａのセットを備えてよく、それぞれが、特定のタイプのフォーマットの一次ビデオストリーム２１０、３０１を処理するように構成される。たとえば、これらのフォーマット固有の収集機能１３１ａの各１つは、Windows（登録商標）Media（登録商標）またはDivX（登録商標）などの異なるビデオそれぞれのエンコード方法／コーデックを使用してエンコードされた複数の一次ビデオストリーム２１０、３０１を処理するように構成されてよい。

【0108】

しかしながら、好ましい実施形態では、収集ステップは、複数の一次デジタルビデオストリーム２１０、３０１の少なくとも２つ、例えばすべて、を共通プロトコル２４０に変換することを含む。

【0109】

この文脈で使用されるように、用語「プロトコル」は、デジタルビデオ／オーディオストリームに含まれる情報をどのように格納かを特定する情報構造化規格またはデータ構造を示す。しかしながら、共通プロトコルは、好ましくは、デジタルビデオおよび／またはオーディオ情報を、例えばバイナリレベルなど（すなわち、音および画像自体を指示する符号化／圧縮されたデータ）、どのように格納するかを規定するのではなく、代わりに、そのようなデータを格納するための所定のフォーマットの構造を形成する。言い換えれば、共通プロトコルは、そのような格納に関連してデジタルビデオデコーディングまたはデジタルビデオエンコーディングを何ら実行することなく、場合によってはバイナリ形式のバイト列を連結および／または分割することとは別に既存のバイナリ形式を全く修正することなく、生データのバイナリ形式でデジタルビデオデータを格納することを規定している。代わりに、当該一次ビデオストリーム２１０、３０１の生データの（符号化／圧縮された）バイナリデータコンテンツは、プロトコルによって定義されたデータ構造でこの生データのバイナリデータを再パック(repacking)しながら、保持される。いくつかの実施形態では、共通プロトコルは、ビデオファイルコンテナフォーマットを定義する。

【0110】

図７は、一例として、それぞれのフォーマット固有収集機能１３１ａによって再構築され、上記共通プロトコル２４０を使用する、図６ａに示す複数の一次ビデオストリーム２１０、３０１を示す。

【0111】

したがって、共通プロトコル２４０は、デジタルビデオおよび／またはオーディオデータを、好ましくは、当該一次ビデオストリーム２１０、３０１に関連する時間軸に沿って、離散的で連続したデータのセットに分割されたデータセット２４１に格納することを規定する。このような各データセットは、１つまたはいくつかのビデオフレーム、および関連するオーディオデータを含むことができる。

【0112】

共通プロトコル２４０はまた、格納されたデジタルビデオおよび／またはオーディオデータセット２４１に関連して、指定された時点に関連付けられるメタデータ２４２を格納することを規定してよい。

【0113】

メタデータ２４２は、当該生データのバイナリデータを生成するために使用されるデジタルビデオエンコーディング方法またはコーデック；ビデオデータの解像度；ビデオフレームレート；フレームレート変動フラグ；ビデオ解像度；ビデオアスペクト比；オーディオ圧縮アルゴリズム；またはオーディオサンプリングレートに関する等の、当該一次デジタルビデオストリーム２１０の生データのバイナリフォーマットに関する情報を含んでよい。また、メタデータ２４２は、例えば当該一次ビデオストリーム２１０、３０１自体の時間基準に関連する、または上述の異なるビデオストリームに関連する、格納されたデータのタイムスタンプに関する情報を含んでよい。

【0114】

フォーマット固有の収集機能１３１ａを共通プロトコル２４０と組み合わせて使用することにより、受信したビデオ／オーディオデータをデコーディング／再エンコーディングすることによる待ち時間（遅延）を追加することなく、一次ビデオストリーム２１０、３０１の情報コンテンツを迅速に収集することが可能になる。

【0115】

したがって、収集ステップは、当該一次ビデオストリーム２１０、３０１を解析し、解析された生データのバイナリデータを、任意の関連するメタデータとともに、共通プロトコルを使用してデータ構造に格納するために、複数のフォーマット固有収集機能１３１ａのうち異なる収集機能１３１ａを使用して、異なるバイナリビデオおよび／またはオーディオエンコーディングフォーマットを使用してエンコードされた複数の一次デジタルビデオストリーム２１０、３０１を収集することを備えてよい。自明であるが、どの一次ビデオストリーム２１０、３０１に対してどのフォーマット固有の収集機能１３１ａを使用するかについての決定は、当該一次ビデオストリーム２１０、３０１のそれぞれの所定のおよび／または動的に検出された特性に基づいて、収集機能１３１によって実行されてよい。

【0116】

このように収集された各一次ビデオストリーム２１０、３０１は、中央サーバ１３０内のＲＡＭメモリバッファのような、それ自身の別個のメモリバッファに格納されてよい。

【0117】

各フォーマット固有の収集機能１３１ａによって実行される一次ビデオストリーム２１０、３０１の変換は、したがって、こうして変換された各一次デジタルビデオストリーム２１０、３０１の生データのバイナリデータを、順序付けられたセットのより小さいデータセット２４１に分割することを備えてよい。

【0118】

さらに、変換は、より小さいセット２４１のそれぞれ（またはサブセット、例えば当該一次ストリーム２１０、３０１のそれぞれの時間軸に沿って規則的に分布するサブセット）を、例えば共通時間基準２６０に関連して、共有の時間軸に沿ったそれぞれの時間に関連付けることも備えてよい。この関連付けは、以下に説明する原理方法のいずれか、または他の方法で、生データのバイナリビデオおよび／またはオーディオデータの分析によって実行されてもよく、一次ビデオストリーム２１０、３０１の後続する時間同期を実行できるようにするために実行されてもよい。使用される共通時間基準２６０のタイプに応じて、各データセット２４１のこの関連付けの少なくとも一部は、同期機能１３３によっても、またはその代わりに実行されてもよい。後者の場合、収集ステップは、代わりに、より小さいセット２４１の各々またはそのサブセットを、当該一次ストリーム２１０、３０１に固有の時間軸のそれぞれの時間に関連付けることを含んでよい。

【0119】

いくつかの実施形態では、収集ステップはまた、複数の一次ビデオストリーム２１０、３０１から収集された生データのバイナリビデオおよび／またはオーディオデータを、均一な品質に変換、および／または周波数を更新することを含む。これは、必要に応じて、複数の一次デジタルビデオストリーム２１０、３０１の生データのバイナリデジタルビデオおよび／またはオーディオデータを、共通のビデオフレームレート；共通のビデオ解像度；または共通のオーディオサンプリングレートにダウンサンプリングまたはアップサンプリングすることを含んでよい。当該フォーマット固有収集機能１３１ａが正しいバイナリ符号化ターゲットフォーマットに従って生データのバイナリデータを直接処理することができるため、このような再サンプリングは、完全なデコーディング／再エンコーディングを実行することなく、あるいは、デコーディングを全く実行することすらなく、実行することができることに留意されたい。

【0120】

好ましくは、複数の一次デジタルビデオストリーム２１０、３０１の各々は、上述したように、個々のフレーム２１３またはフレーム２１３のシーケンスとして、個々のデータ格納バッファ２５０に格納され、また、各々は、共通時間基準２６０に順に関連付けられた対応するタイムスタンプに関連付けられる。

【0121】

例示のために提供される具体例では、ビデオ通信サービス１１０は、Microsoft（登録商標） Teams（登録商標）であり、同時接続の複数参加者１２２が関与するビデオ会議を実行している。自動参加者クライアント１４０は、Teams（登録商標）会議の会議参加者として登録されている。

【0122】

次に、一次ビデオ入力信号２１０が、自動参加者クライアント１４０を介して収集機能１３０に提供され、収集機能１３０によって取得される。これらはＨ２６４フォーマットの生データ信号であり、各ビデオフレームのタイムスタンプ情報を含む。

【0123】

関連するフォーマット固有の収集機能１３１ａは、設定可能な事前定義されたＴＣＰポート上で、ＩＰ（クラウドのＬＡＮネットワーク）経由で生データをピックアップする。すべてのTeams（登録商標）会議参加者と関連する音声データは、個別のポートに関連付けられる。次に、収集機能１３１は、オーディオ信号（５０Ｈｚ）からのタイムスタンプを使用し、ビデオデータを２５Ｈｚの固定出力信号にダウンサンプリングしてから、ビデオストリーム２２０をそれぞれの個別のバッファ２５０に格納する。

【0124】

上述のように、共通プロトコル２４０は、データを生データのバイナリ形式で保存する。これは、非常に低レベルで、ビデオ／オーディオデータの生データのビットおよびバイトを処理するように設計することができる。好ましい実施形態では、データは、単純なバイト配列または対応するデータ構造（スライスなど）として共通プロトコル２４０に格納される。これは、データが従来のビデオコンテナに入れられる必要が全くないことを意味する（共通プロトコル２４０は、この文脈ではそのような従来のコンテナを構成しない）。また、ビデオのエンコードおよびデコードは、計算量的に重いので、遅延を引き起こし、高価なハードウエアを必要とする。さらに、この問題は参加者の数によってスケーリングされる。

【0125】

共通プロトコル２４０を使用すると、Teams（登録商標）の各会議参加者１２２に関連付けられた一次ビデオストリーム２１０と、任意の外部ビデオソース３００のために、収集機能１３１内のメモリを確保し、プロセス中にオンザフライで割り当てメモリ量を変更することが可能になる。このようにして、入力ストリームの数を変更することが可能になり、その結果、各バッファを有効に保つことができる。例えば、解像度、フレームレートなどの情報は可変であるが、共通プロトコル２４０にメタデータとして格納されるため、この情報を使用して、必要に応じて各バッファのサイズを迅速に変更することができる。

【0126】

以下は、本タイプの共通プロトコル２４０の仕様の一例である。

【0127】

【表1】

【0128】

上記表では、「もしあれば、検出されたイベント（Detected event in, if any）」データは、共通プロトコル２６０の仕様の一部として含まれている。しかしながら、いくつかの実施形態では、この情報（検出されたイベントに関する）は、代わりに別のメモリバッファに入れてもよい。

【0129】

いくつかの実施形態では、オーバーレイまたはエフェクトであり得るデジタルビデオ情報２２０の上記少なくとも１つの追加部分もまた、共通時間基準２６０に順に関連付けられた対応するタイムスタンプにそれぞれ関連付けられた個々のフレームまたはフレームのシーケンスとして、それぞれの個別バッファ２５０に格納される。

【0130】

上記に例示したように、イベント検出ステップは、共通プロトコル２４０を使用して、検出されたイベント２１１を記述するメタデータ２４２を、当該イベント２１１が検出された一次デジタルビデオストリーム２１０、３０１に関連付けて記憶することを含んでよい。

【0131】

イベント検出は、異なる方法で実行することができる。ＡＩコンポーネント１３２ａによって実行されるいくつかの実施形態では、イベント検出ステップは、第１の訓練されたニューラルネットワークまたは他の機械学習コンポーネントが、前記イベント２１１のいずれかを自動的に検出するために、複数の一次デジタルビデオストリーム２１０、３０１の少なくとも１つ、例えばいくつか、または全部を個別に分析することを含む。これは、ＡＩコンポーネント１３２ａが、管理された分類において、一次ビデオストリーム２１０、３０１のデータを、予め定義されたイベントのセットに分類すること、および／または、管理されていない分類において、動的に決定されたイベントのセットに分類することを含んでよい。

【0132】

いくつかの実施形態では、検出されたイベント２１１は、当該一次ビデオストリーム２１０、３０１である、またはこれに含まれるプレゼンテーションのプレゼンテーションスライドの変更である。

【0133】

例えば、プレゼンテーションの発表者が、聴衆に対してその時点で行っているプレゼンテーションのスライドを変更することを決定した場合、これは、所定の視聴者にとって興味深いものが変化し得ることを意味する。新しく表示されるスライドは、いわゆる「バタフライ」モード（例えば、出力ビデオストリーム２３０でスライドを発表者のビデオと並べて表示する）で短時間見るのに最適な全体レベルの画像に過ぎないかもしれない。あるいは、スライドには、詳細が多く、フォントサイズが小さいテキストなどが含まれる場合もある。後者の場合、スライドはフルスクリーンで表示され、通常の場合よりも多少長い時間表示される。この場合のスライドは、発表者の顔よりもプレゼンテーションを見る人の興味を引くかもしれないので、バタフライモードはそれほど適切ではないかもしれない。

【0134】

実際には、イベント検出ステップは、以下の少なくとも１つで構成される。

【0135】

まず第１に、イベント２１１は、検出されたスライドの第１の画像と、それに後続する検出されたスライドの第２の画像との差の画像解析に基づいて検出することができる。一次ビデオストリーム２２０、３０１の性質がスライドを示すものであることは、ＯＣＲ（光学式文字認識）と組み合わせた動き検出を使用するなど、それ自体は従来のデジタル画像処理を使用して自動的に決定することができる。

【0136】

これは、自動コンピュータ画像処理技術を使用して、検出されたスライドが、実際にスライドの変更として分類するのに十分なほど大きく変化したかどうかをチェックすることを含んでよい。これは、ＲＧＢカラー値に関して、現在のスライドと前のスライドとの間のデルタ(delta)をチェックすることによって行うことができる。例えば、問題のスライドがカバーする画面領域で、ＲＧＢ値がどの程度グローバルに変化したかを評価し、同時に、これに協調して変化する隣接するピクセルのグループを見つけることが可能かどうかを評価することができる。こうすることで、関連するスライドの変化を検出することができ、同時に、例えば、画面全体にわたるコンピュータのマウスの動きのような無関係な変化をフィルタリングすることができる。このアプローチで完全な構成可能性が実現される。例えば、発表者がコンピュータのマウスを使って異なるものを指し示しながら何かを詳細に発表したい場合など、コンピュータのマウスの動きをキャプチャできることが望まれることがある。

【0137】

第２に、イベント２１１は、より高い特異性でイベントの種類を決定するために、第２の画像自体の情報複雑性の画像解析に基づいて検出されてもよい。

【0138】

これは例えば、問題のスライド上のテキスト情報の総量や、関連するフォントサイズを評価することを含むかもしれない。これは、ディープラーニングに基づく文字認識技術など、従来のＯＣＲ手法を使用して行うことができる。

【0139】

評価されたビデオストリーム２１０、３０１の生データのバイナリフォーマットが既知であるため、これは、最初にビデオデータをデコードまたは再エンコードすることなく、バイナリドメインで直接実行されてもよいことに留意されたい。例えば、イベント検出機能１３２は、画像解釈サービスのための関連するフォーマット固有の収集機能を呼び出してもよく、またはイベント検出機能１３２自体が、多数の異なるサポートされる生データのバイナリビデオデータフォーマットに対して、個々のピクセルレベルなどへの画像情報を評価するための機能を含んでもよい。

【0140】

別の例では、検出されたイベント２１１は、デジタルビデオ通信サービス１１０に対する参加者クライアント１２１の通信接続の喪失である。この場合、検出ステップは、当該参加者クライアント１２１に対応する一次デジタルビデオストリーム２１０の一連の後続ビデオフレーム２１３の画像解析に基づいて、当該参加者クライアント121が通信接続を喪失したことを検出することを含んでよい。

【0141】

参加者クライアント１２１は、異なる物理的な場所や異なるインターネット接続に関連付けられているため、誰かがビデオ通信サービス１１０または中央サーバ１３０への接続を喪失することが起こり得る。そのような状況では、生成された出力ビデオストリーム２３０に黒または空の画面が表示されないようにすることが望ましい。

【0142】

これに替えて、このような接続の喪失は、イベント検出機能１３２によってイベントとして検出することができ、例えば、使用される２つのクラスが接続されている／接続されていない（データなし）である２クラス分類アルゴリズムを適用することによって検出することができる。この場合、「データなし」は、発表者が意図的に黒いスクリーンを送信することとは異なると理解される。わずか１フレームまたは２フレームのような短時間の黒いスクリーンは、最終的に生成されるストリーム２３０では目立たない可能性があるため、２クラス分類アルゴリズムを経時的に適用して時系列を作成することができる。次に、接続中断の最小長さを指定する閾値を使用して、接続が喪失したかどうかを決定することができる。

【0143】

以下で説明されるように、上記で例示されたタイプの検出されたイベントは、パターン検出機能１３４によって、適切かつ所望のように、様々な対応をするために使用され得る。

【0144】

上記のように、個々の一次ビデオストリーム２１０、３０１は、それぞれ共通の時間基準２６０に関連しており、同期機能１３３が互いに対して時間同期させることができる。

【0145】

いくつかの実施形態では、共通時間基準２６０は、共通オーディオ信号１１１（図１から図３参照）に基づくか、または共通オーディオ信号１１１を備え、共通オーディオ信号１１１は、上述したように、少なくとも２つの遠隔接続された参加者クライアント１２１が参加する共有デジタルビデオ通信サービス１１０に共通であり、各々が、一次デジタルビデオストリーム２１０のそれぞれの１つを提供する。

【0146】

上述したMicrosoft（登録商標）Teams（登録商標）の例では、共通オーディオ信号が生成され、自動参加者クライアント１４０を介して、および／またはＡＰＩ１１２を介して、中央サーバ１３０によってキャプチャされ得る。この例および他の例では、このような共通オーディオ信号をハートビート信号として使用して、このハートビート信号に基づいて個々の一次ビデオストリーム２２０を特定の時点に結合することによって、個々の複数の一次ビデオストリーム２２０を時間同期させることができる。このような共通オーディオ信号は、別個の（他の一次ビデオストリーム２１０の各々との関係において）信号として提供されてもよく、これにより、他の一次ビデオストリーム２１０は各々、当該他の一次ビデオストリーム２１０に含まれるオーディオに基づいて、または（自動画像処理ベースのリップシンク技術を使用するなど）そこに含まれる画像情報に基づいて、共通オーディオ信号に個別に時間相関(time -correlated)されてもよい。

【0147】

言い換えると、個々の一次ビデオストリーム２１０に関連する可変の待ち時間および／または異なる待ち時間を処理し、結合されたビデオ出力ストリーム２３０の時間同期を実現するために、このような共通オーディオ信号が、中央サーバ１３０内のすべての一次ビデオストリーム２１０のためのハートビートとして使用される（ただし、おそらく外部の一次ビデオストリーム３０１ではない）。言い換えれば、他のすべての信号は、すべてが時間同期していることを確認するために、この共通のオーディオ時間のハートビートにマッピングされる。

【0148】

別の例では、時間同期は、出力デジタルビデオストリーム２３０に導入され、参加者クライアント１２１の１つまたはいくつかの個々のものの一部として提供されるそれぞれのローカル時間同期ソフトウエア機能１２５によって検出される時間同期要素２３１を使用して達成される。ローカルソフトウエア機能１２５は、出力ビデオストリーム２３０における時間同期要素２３１の到着時間(time of arrival)を検出するように構成される。理解されるように、このような実施形態では、出力ビデオストリーム２３０は、ビデオ通信サービス１１０にフィードバックされるか、そうでない場合、各参加者クライアント１２１および当該ローカルソフトウエア機能１２５に利用可能となる。

【0149】

例えば、時間同期要素２３１は、一定の時間間隔で出力ビデオ２３０に配置または更新される、所定の順序または方法で色が変化する画素などの視覚的マーカ；出力ビデオ２３０に更新および表示される視覚的時計；（例えば、十分に低い振幅および／または十分に高い周波数を有することによって、参加者１２２に聞こえないように設計され得る）音声信号であって、出力ビデオストリーム２３０の一部を形成する音声に追加される音声信号、であってよい。ローカルソフトウエア機能１２５は、適切な画像処理および／または音声処理を使用して、時間同期要素（のそれぞれ）２３１のそれぞれの到着時間を自動的に検出するように構成される。

【0150】

次に、共通時間基準２６０は、少なくとも部分的には、検出された到着時間に基づいて決定され得る。例えば、ローカルソフトウエア機能１２５の各々は、検出された到着時間を示すそれぞれの情報を中央サーバ１３０に通信してもよい。

【0151】

このような通信は、当該参加者クライアント１２１と中央サーバ１３０との間の直接通信リンクを介して行われてよい。ただし、通信は、当該参加クライアント１２１に関連付けられた一次ビデオストリーム２１０を介して行われてもよい。例えば、参加者クライアント１２１は、中央サーバ１３０による自動検出のために、当該参加者クライアント１２１によって生成される一次ビデオストリーム２１０に、上述したタイプのような視覚的または可聴的コードを導入し、共通時間基準２６０を決定するために使用してもよい。

【0152】

さらに追加的な実施例では、各参加者クライアント１２１は、ビデオ通信サービス１１０に対して、すべての参加者クライアント１２１が視聴可能な共通ビデオストリームにおいて画像検出を実行し、そのような画像検出の結果を、上述したものに対応する方法で中央サーバ１３０に中継し、そこで経時的に、互いに対する各参加者クライアント１２１のそれぞれのオフセットを決定するために使用されてもよい。このようにして、共通時間基準２６０は、個々の相対オフセットのセットとして決定され得る。例えば、共通に利用可能なビデオストリームの選択された基準ピクセルは、ローカルソフトウエア機能１２５などによって、いくつかの、またはすべての参加クライアント１２１によってモニタリングされ、そのピクセルの現在の色が中央サーバ１３０に伝達されてもよい。中央サーバ１３０は、多数の（またはすべての）参加クライアント１２１の各々から連続して受信されたそのような色値に基づいてそれぞれの時系列を計算し、相互相関(cross-correlation)を実行することにより、異なる参加クライアント１２１間に亘る相対的な時間オフセットの推定されるセットを生成してもよい。

【0153】

実際には、ビデオ通信サービス１１０に供給された出力ビデオストリーム２３０は、当該ビデオ通信のすべての参加者クライアントの共有画面の一部として含まれてよく、したがって、参加者クライアント１２１に関連付けられるそのような時間オフセットを評価するために使用されてよい。特に、ビデオ通信サービス１１０に供給された出力ビデオストリーム２３０は、自動参加者クライアント１４０および／またはＡＰＩ１１２を介して、中央サーバに再び利用可能になってよい。

【0154】

いくつかの実施形態では、共通時間基準２６０は、複数の一次デジタルビデオストリーム２１０、３０１のうちの第１のもののオーディオ部分２１４と、複数の一次デジタルビデオストリーム２１０、３０１のうちの上記第１のものの画像部分２１５との間の検出された不一致(discrepancy)に少なくとも部分的に基づいて決定され得る。このような不一致は、例えば、当該第１の一次デジタルビデオストリーム２１０、３０１において視聴される発話中の参加者１２２のデジタルリップシンクビデオ画像分析に基づくものでよい。このようなリップシンク解析はそれ自体従来のものであり、例えば訓練されたニューラルネットワークを使用してもよい。分析は、利用可能な共通のオーディオ情報に関連して、各一次ビデオストリーム２１０、３０１について同期機能１３３によって実行されてもよく、個々の一次ビデオストリーム２１０、３０１に亘る相対的なオフセットは、この情報に基づいて決定されてもよい。

【0155】

いくつかの実施形態では、同期ステップは、最大３０秒、例えば最大５秒、例えば最大１秒、例えば最大０．５秒、ただし０秒よりも長い遅延（この文脈において「遅延」および「待ち時間」は同じものを意味することが意図される）を意図的に導入することを含み、これにより、出力デジタルビデオストリーム２３０には少なくともその遅延が提供される。いずれの長さであっても、意図的に導入される遅延は、収集ステップにおける任意の再サンプリング後に格納されるこの数のフレーム（または個別の画像）のような、少なくとも３つ、あるいは少なくとも５つ、さらには１０つといった、少なくとも複数のビデオフレーム分である。本明細書で使用する場合、「意図的に」という用語は、同期の問題などに基づいてそのような遅延を導入する必要性とは無関係に遅延が導入されることを意味する。言い換えれば、意図的に導入される遅延は、複数の一次ビデオストリーム２１０、３０１間の互いの時間同期をとるために、一次ビデオストリーム２１０、３０１の同期の一部として導入される遅延に加えて導入される。意図的に導入される遅延は、共通時間基準２６０との関係で、予め決められたもの、固定されたもの、または可変のものであってもよい。遅延時間は、複数の一次ビデオストリーム２１０、３０１のうち最も潜在的(latent)でない１つに関連して測定されてよく、上記時間同期の結果、これらのストリーム２１０、３０１のより多くの潜在的なものが、相対的に小さい意図的に追加された遅延に関連付けられるようにしてもよい。

【0156】

いくつかの実施形態では、０．５秒以下のような比較的小さな遅延が導入される。この遅延は、出力ビデオストリーム２３０を使用するビデオ通信サービス１１０の参加者にはほとんど気づかれない。他の実施形態では、出力ビデオストリーム２３０が対話型コンテキストでは使用されず、代わりに外部消費者１５０への一方向通信で公開される場合などに、より大きな遅延が導入される可能性がある。

【0157】

この意図的に導入された遅延は、同期機能１３３が、収集された個別のプライマリストリーム２１０、３０１のビデオフレームを正しい共通時間基準２６０のタイムスタンプ２６１にマッピングするのに十分な時間を達成するのに十分なものであってよい。また、失われた一次ストリーム２１０、３０１の信号、スライドの変更、解像度の変更などを検出するために、上述のイベント検出を実行するのに十分な時間をもたらすのに十分なものであってよい。さらに、遅延を意図的に導入することにより、以下に説明するように、パターン検出機能１３４を改善するのに十分なものであってよい。

【0158】

遅延の導入は、当該バッファリングされたフレーム２１３を使用して出力ビデオストリーム２３０を公開する前に、収集され時間同期された複数の一次ビデオストリーム２１０、３０１の各々をバッファリング２５０することを含むことが理解される。言い換えれば、複数の一次ビデオストリーム２１０、３０１の少なくとも１つ、いくつか、またはすべてのビデオデータおよび／またはオーディオデータは、キャッシュのように、しかし（従来のキャッシュバッファのように）帯域幅が変化する状況に対処できることを意図して使用されるのではなく、上記の理由のために、特にパターン検出機能１３４によって使用されるように、バッファリングされた方法で中央サーバ１３０に存在することになってよい。

【0159】

そのため、いくつかの実施形態では、パターン検出ステップは、複数の一次デジタルビデオストリーム２１０、３０１の少なくとも１つ、例えばいくつか、例えば少なくとも４つ、またはすべて、の特定の情報を考慮することを含み、この特定の情報は、出力デジタルビデオストリーム２３０の生成においてまだ使用されていない、時間同期された一次デジタルビデオストリーム２１０のフレームよりも後のフレーム２１３に存在する。したがって、新たに追加されたフレーム２１３は、出力ビデオストリーム２３０の一部（またはその基礎）を形成する前の特定の待ち時間の間、当該バッファ２５０に存在する。この期間中、当該フレーム２１３の情報は、出力ビデオストリーム２３０の現在のフレームを生成するために現在使用されているフレームとの関係において、「未来」の情報を構成する。出力ビデオストリーム２３０のタイムラインが当該フレーム２１３に達すると、当該フレームは出力ビデオストリーム２３０の対応するフレームの生成に使用され、その後は破棄されてもよい。

【0160】

言い換えれば、パターン検出機能１３４は、出力ビデオストリーム２３０を生成するためにまだ使用されていないビデオ／オーディオフレーム２１３のセットを自由に利用でき、このデータを使用して上記パターンを検出する。

【0161】

パターン検出は、異なる方法で実行することができる。ＡＩコンポーネント１３４ａによって実行されるいくつかの実施形態では、パターン検出ステップは、第２の訓練されたニューラルネットワークまたは他の機械学習コンポーネントが、上記パターン２１２を自動的に検出するために、複数の一次デジタルビデオストリーム１２０、３０１の少なくとも２つ、例えば少なくとも３つ、例えば少なくとも４つ、あるいはすべて、を協調して(in concert)分析することを含む。

【0162】

いくつかの実施形態において、検出されたパターン２１２は、共有ビデオ通信サービス１１０に対する、各々がそれぞれの参加者クライアント１２１に関連付けられた、少なくとも２人、例えば少なくとも３人、例えば少なくとも４人の異なる発話中の参加者１２２を含む発話パターンを備え、これら発話中の参加者１２２の各々は、複数の一次デジタルビデオストリーム２１０、３０１のそれぞれの１つにおいて視覚的に視聴される。

【0163】

好ましくは、生成ステップは、出力ビデオストリーム２３０の現在の生成状態を決定し、追跡し、更新することを含む。例えば、そのような状態は、どのような参加者１２２（もしあれば）が出力ビデオストリーム２３０において可視であるか、および画面上のどこで可視であるか；いずれかの外部ビデオストリーム３００が出力ビデオストリーム２３０において可視であるか、および画面上のどこで可視であるか；いずれかのスライドまたは共有画面が、フルスクリーンモードで表示されるか、またはいずれかのライブビデオストリームと組み合わせて表示されるか、などを決定付けることができる。したがって、生成機能１３５は、生成された出力ビデオストリーム２３０に関するステートマシン(state machine)として見ることができる。

【0164】

出力ビデオストリーム２３０を、例えば最終消費者１５０によって視聴される結合されたビデオ体験として生成するために、中央サーバ１３０は、個々の一次ビデオストリーム２１０、３０１に関連付けられる個々のイベントを単に検出するよりも深いレベルで何が起こるかを理解できることが有利である。

【0165】

第１の例では、プレゼンテーションしている参加者クライアント１２１が、現在表示されているスライドを変更している。このスライド変更は、上述したようにイベント検出機能１３２によって検出され、スライド変更が起こったことを示すメタデータ２４２が当該フレームに追加される。プレゼンテーションしている参加者クライアント１２１が多数のスライドを前方に急速に連続してスキップしていることが判明し、その結果、一連の「スライド変更」のイベントが、検出機能１３２によっても検出され、当該一次ビデオストリーム２１０の個別のバッファ２５０に対応するメタデータ２４２とともに格納されるので、これは何回も起こる。実際には、そのような急速に前方にスキップされた各スライドは、ほんの数秒の間しか表示されないことがある。

【0166】

パターン検出機能１３４は、これらの検出されたスライド変更の複数にまたがる、当該バッファ２５０内の情報を参照して、多数のまたは急速に実行されたスライド変更ではなく、１つの単一のスライド変更に対応するパターンを検出する（すなわち、前方スキップにおける最後のスライドへの単一のスライド変更であり、一旦急速なスキップが終了すると、その最後のスライドは可視のままである）。言い換えれば、パターン検出機能１３４は、例えば、非常に短時間に１０回のスライド変更があったこと、なぜそれらが１つの単一のスライド変更を意味する検出されたパターンとして扱われるのかに注目する。その結果、生成機能１３５は、パターン検出機能１３４によって検出されたパターンへのアクセスを持ち、この最後のスライドが上記ステートマシンにおいて潜在的に重要であると判断するので、出力ビデオストリーム２３０において数秒間フルスクリーンモードでその最後のスライドを表示することを選択することができる。また、出力ストリーム２３０において、中間的に閲覧されるスライドを全く表示しないことを選択することもできる。

【0167】

複数の急速なスライド変更を有するパターンの検出は、単純なルールベースのアルゴリズムによって検出されてもよいが、これに替えて、分類によって動画像のそのようなパターンを検出するように設計され訓練されたニューラルネットワークを使用して検出されてもよい。

【0168】

別の例では、例えば、ビデオ通信がトークショー、パネル討論、または同様のものである場合に有用である可能性があるが、一方では、穏やかで滑らかな出力ビデオストリーム２３０を生成して公開することによって消費者１５０に関連する視聴体験を与えながら、一方では、現在の話者の間で視覚的注目を素早く切り替えることが望ましい可能性がある。この場合、イベント検出機能１３２は、各一次ビデオストリーム２１０、３０１を連続的に分析して、その特定の一次ビデオストリーム２１０、３０１において視聴されている人物が現在話しているか否かを常に判定することができる。これは、例えば、それ自体従来の画像処理ツールを使用して、上述のように実行され得る。次に、パターン検出機能１３４は、複数の一次ビデオストリーム２１０、３０１を含む、特定の全体的なパターン(overall patterns)を検出するように動作可能であってもよく、このパターンは、滑らかな出力ビデオストリーム２３０を生成するのに有用である。例えば、パターン検出機能１３４は、現在の話者間の非常に頻繁なスイッチのパターンおよび／または複数の同時話者を含むパターンを検出することができる。

【0169】

次に、生成機能１３５は、例えば、半秒しか話さずに再び無音になる話者に視覚的フォーカスを自動的に切り替えないようにしたり、両者が入れ替わりながら又は同時に話しているある時間帯に複数の話者が並んで表示される状態に切り替えるようにしたりするなど、生成状態に関連して自動化された決定を行う際に、このような検出されたパターンを考慮することができる。この状態決定プロセスは、それ自体、時系列パターン認識技術を使用して、または訓練されたニューラルネットワークを使用して実行することができるが、少なくとも部分的に所定のルールセットに基づくこともできる。

【0170】

いくつかの実施形態では、並行して検出され、生成機能１３５のステートマシンへの入力を形成する複数のパターンがあってもよい。このような複数のパターンは、生成機能１３５によって、異なるＡＩコンポーネント、コンピュータビジョン検出アルゴリズムなどで使用され得る。一例として、一部の参加者クライアント１２１の不安定な接続を同時に検出しながら、恒久的なスライドの変更を検出することができ、他のパターンは現在の主な発話中の参加者１２２を検出する。このような利用可能なパターンデータをすべて使用して、このようなパターンデータの時系列を分析するために、分類器ニューラルネットワークを訓練し、および／またはルールのセットを開発することができる。このような分類は、少なくとも部分的に、例えば完全に、上記の生成で使用される決定された所望の状態変化をもたらすように、教師付きにすることができる。例えば、様々な異なる生成スタイルおよび要望に従って出力ビデオストリーム２３０を自動的に生成するように特に構成された、異なるそのような所定の分類器を生成することができる。訓練は、所望の出力としての既知の生成状態変化シーケンス、および訓練データとしての既知のパターン時系列データに基づいて行うことができる。いくつかの実施形態では、ベイズモデルを使用して、そのような分類器を生成することができる。具体的な例では、経験豊富なプロデューサから先験的に情報を得ることができ、「トークショーでは、話者Ａから話者Ｂに直接切り替わることはしないが、他の話者が非常に支配的で大きな声で話す場合を除き、他の話者に焦点を当てる前に、常に最初に概要を示す」といった入力を提供することができる。この生成ロジックは、「もしＸが真であれば｜Ｙが真であるという事実が与えられれば｜Ｚを実行する」という一般的な形式のベイズモデルとして表現される。実際の検出（誰かが大きな声で話しているかどうかなど）は、分類器や閾値ベースのルールを使って行うことができる。

【0171】

（パターン時系列データの）大規模なデータセットがあれば、ディープラーニングの手法を用いて、ビデオストリームの自動生成に使用するための、正しく魅力的な生成フォーマットを開発することができる。

【0172】

要約すると、個別の複数の一次ビデオストリーム２１０、３０１に基づくイベント検出；意図的に導入された遅延；複数の時間同期された一次ビデオストリーム２１０、３０１および検出されたイベントに基づくパターン検出；および検出されたパターンに基づく生成プロセスの組み合わせを使用することにより、テイストおよびスタイルの幅広い可能な選択に従って、出力デジタルビデオストリーム２３０の自動生成を実現することが可能になる。この結果は、イベント検出機能１３２、パターン検出機能１３４、および生成機能１３５によって使用される、可能なニューラルネットワークおよび／またはルールに基づく分析技術の広い範囲に亘って有効である。特に、第１の生成ビデオストリームが第２の生成ビデオストリームの自動生成に使用されること；および参加者クライアントの異なるグループに対して異なる意図的に追加された遅延を使用すること、を特徴とする以下に説明する実施形態においてこれは有効である。

【0173】

上記に例示したように、生成ステップは、出力デジタルビデオストリーム２３０における複数の一次デジタルビデオストリーム２１０、３０１の個々のものの可視性；視覚的および／または聴覚的ビデオコンテンツの配置；使用される視覚的または聴覚的効果；および／または出力デジタルビデオストリーム２３０の出力モードに関する、予め決定されたおよび／または動的に可変なパラメータのセットに基づいて、出力デジタルビデオストリーム２３０を生成することを含んでよい。このようなパラメータは、生成機能１３５のステートマシンによって自動的に決定され、および／または生成を制御するオペレータによって設定され（半自動にされ）、および／またはある先験的な構成上の要望（出力ビデオストリーム２３０のレイアウト変更または上記例示されたタイプの状態変更の間の最短時間など）に基づいて予め決定されてよい。

【0174】

実際の例では、ステートマシンは、フルスクリーンの発表者ビュー（現在発話中の参加者１２２をフルスクリーンで示す）；スライドビュー（現在共有されているプレゼンテーションスライドをフルスクリーンで示す）；「バタフライビュー」（現在発話中の参加者１２２と現在共有されているプレゼンテーションスライドの両方を並べたビューで示す）；マルチスピーカビュー（参加者１２２のすべてまたは選択されたサブセットを並べてまたはマトリックスレイアウトで示す）など、出力ビデオストリーム２３０に適用され得る所定の標準レイアウトのセットをサポートしてよい。様々な利用可能な生成フォーマットは、利用可能な状態のセット（上記標準レイアウトのセットなど）と共に、（上記に例示したような）ステートマシン状態変更ルールのセットによって定義することができる。例えば、そのような生成フォーマットの１つは「パネルディスカッション」であり、別の生成フォーマットは「プレゼンテーション」などである。中央サーバ１３０へのＧＵＩまたは他のインタフェースを介して特定の生成フォーマットを選択することによって、システム１００のオペレータは、予め定義されたそのような制作フォーマットのセットのうちの１つを迅速に選択することができ、次いで、中央サーバ１３０が、完全に自動的に、上記のような利用可能な情報に基づいて、当該生成フォーマットに従って出力ビデオストリーム２３０を生成することを可能にする。

【0175】

さらに、生成中に、上述のように、各会議参加者クライアント１２１または外部ビデオソース３００に対して、それぞれのメモリ内バッファが作成され、維持される。これらのバッファは、その場で容易に削除、追加、および変更することができる。次に、中央サーバ１３０は、出力ビデオストリーム２３０の生成中に、追加／削除(dropped-off)された参加者クライアント１２１およびスピーチを行う予定の参加者１２２；プレゼンテーションの予定されたまたは予期せぬ一時停止／再開；現在使用されている生成フォーマットに対する所望の変更などに関する情報を受信するように構成されてよい。このような情報は、例えば、上述したように、オペレータＧＵＩまたはインタフェースを介して中央サーバ１３０に供給されてよい。

【0176】

上記に例示したように、いくつかの実施形態では、複数の一次デジタルビデオストリーム２１０、３０１の少なくとも１つは、デジタルビデオ通信サービス１１０に提供され、次に、公開ステップは、出力デジタルビデオストリーム２３０をその同じ通信サービス１１０に提供することを含んでよい。例えば、出力ビデオストリーム２３０は、ビデオ通信サービス１１０の参加者クライアント１２１に提供されてもよく、または、ＡＰＩ１１２を介して、ビデオ通信サービス１１０への外部ビデオストリームとして提供されてもよい。このようにして、出力ビデオストリーム２３０は、ビデオ通信サービス１１０によって現在実現されているビデオコミュニケーションイベントの参加者の複数または全員が利用できるようにすることができる。

【0177】

上述もしたように、追加的または代替的に、出力ビデオストリーム２３０は、１つまたは複数の外部消費者１５０に提供されてよい。

【0178】

一般に、生成ステップは、中央サーバ１３０によって実行され、出力デジタルビデオストリーム２３０を、ＡＰＩ１３７を介してライブビデオストリームとして１つまたは複数の同時消費者に提供することができる。

【0179】

図８ａは、本発明の第１の態様に係る方法を示す図であり、上述した開示を参照して以下に説明する。すなわち、デジタルビデオストリーム（以下では、「第２の」デジタルビデオストリームと表記する）を提供するための図８ａに示される方法では、デジタルビデオストリームの収集、イベント検出、同期、パターン検出、生成、および公開に関して上述したすべてのメカニズムおよび原理を適用することができる。

【0180】

本発明の第２の態様に係る方法を示す図８ｂ、本発明の第３の態様に係る方法を示す図８ｃ、および本発明の第４の態様に係る方法を示す図８ｄについても、概ね同様のことがいえる。

【0181】

上記第１、第２、第３および第４の態様は自由に組み合わせることができる。特に、第４の態様に係る方法は、第１、第２および第３の態様のいずれか１つによる方法と組み合わせて使用することができる。

【0182】

さらに、図９は、図８ａから図８ｄに示された方法を実行するための構成を備えるシステム１００の簡略図である。

【0183】

中央サーバ１３０は、上記のような収集機能１３１を備えている。

【0184】

中央サーバ１３０はまた、第１の生成機能１３５'、第２の生成機能１３５''および第３の生成機能１３５'''を備える。このような各生成機能１３５'、１３５''、１３５'''は、生成機能１３５に対応し、生成機能１３５に関連して上記で説明したことは、生成機能１３５'、１３５''、１３５'''にも同様に適用される。生成機能１３５'、１３５''、１３５'''は、中央サーバ１３０の詳細な構成に応じて、別個のものであってもよいし、複数の機能を１つの単一の論理関数に共有配置してもよく、３つを超える数の生成機能が存在してもよい。生成機能１３５'、１３５''、１３５'''は、場合によっては、１つの同じ生成機能１３５の異なる機能的側面であってもよい。生成機能１３５'、１３５''、１３５'''と他のエンティティとの間の様々な通信は、適切なＡＰＩを介して行われてよい。

【0185】

さらに、生成機能１３５'、１３５''、１３５'''またはそのような生成機能のグループのそれぞれに対して別個の収集機能１３１が存在してもよく、詳細な構成に応じて、各々がそれぞれの収集機能１３１を有する、論理的に分離された複数の中央サーバ１３０が存在してもよいことが理解される。

【0186】

さらに、中央サーバ１３０は、第１の公開機能１３６'、第２の公開機能１３６''、および第３の公開機能１３６'''を備える。このような各公開機能１３６'、１３６''、１３６'''は、公開機能１３６に対応し、公開機能１３６に関連して上記で説明したことは、公開機能１３６'、１３６''、１３６'''にも同様に適用される。公開機能１３６'、１３６''、１３６'''は、中央サーバ１３０の詳細な構成に応じて、別個の機能であってもよく、複数の機能を備えた１つの単一の論理機能に共有配置されてもよく、また、３つを超える数の公開機能が存在してもよい。公開機能１３６'、１３６''、１３６'''は、場合によっては、１つの同じ公開機能１３６の異なる機能的側面であってもよい。

【0187】

図９では、本明細書で開示する原理を説明するために、参加者クライアントの３つのセットまたはグループが示されており、それぞれが上述の参加者クライアント１２１に対応している。したがって、このような参加者クライアント１２１の第１のグループ１２１'、このような参加者クライアントの第２のグループ１２１''、およびこのような参者加クライアントの第３のグループ１２１'''が存在する。これらのグループの各々は、１つまたは好ましくは少なくとも２つの、参加者クライアントから構成され得る。このようなグループは、詳細な構成に応じて、２つだけであってもよいし、３つ以上であってもよい。グループ１２１'、１２１''、１２１'''間の割り当ては、各参加者クライアント１２１が最大１つのグループ１２１'、１２１''、１２１'''に割り当てられるという意味で、排他的であってもよい。代替的構成では、少なくとも１つの参加者クライアント１２１が、同時に複数のそのようなグループ１２１'、１２１''、１２１'''に割り当てられてもよい。

【0188】

図９はまた、外部消費者１５０を示しており、上述のように、そのような外部消費者１５０が複数存在してもよいことが理解される。

【0189】

図９は、単純化の目的のためビデオ通信サービス１１０を示していないが、上述の一般的なタイプのビデオ通信サービスを中央サーバ１３０と共に使用してもよく、例えば、上述の方法で中央サーバ１３０を使用して各参加者クライアント１２１に共有ビデオ通信サービスを提供してもよいことが理解される。

【0190】

図８ａに戻り、最初のステップで方法が開始される。

【0191】

後続の収集ステップにおいて、多数の一次ビデオストリーム、この例示的な場合では少なくとも第１の一次デジタルビデオストリーム、第２の一次デジタルビデオストリーム、および第３の一次デジタルビデオストリームのそれぞれが、それぞれの参加者クライアント１２１から収集される。したがって、第１の一次デジタルビデオストリームが第１の参加者クライアントから収集され、第２の一次デジタルビデオストリームが第２の参加者クライアントから収集され、第３の一次デジタルビデオストリームが第３の参加者クライアントから収集される。

【0192】

後続する公開ステップにおいて、少なくとも１つのビデオストリームが、第１の参加者クライアントおよび第２の参加者クライアントの少なくとも一方に提供される。すなわち、このビデオストリームは、第１の一次デジタルビデオストリーム、第２の一次デジタルビデオストリーム、および、第１および第２の一次ビデオストリームのうちの少なくとも１つに基づいて生成された第１の生成ビデオストリームのうちの少なくとも１つである。このような一次ビデオストリームの生成は、以下に説明するように、第１の生成機能１３５'によって実行されてもよく、例えば、当該生成の結果として第１の生成デジタルビデオストリームの遅延を導入することを含んでもよい。

【0193】

当該提供や公開は、連続的であってよく、リアルタイムであってもよい。

【0194】

例えば、第１および第２の参加者は、本明細書の他の箇所でも説明されているように、ビデオ会議などの同じビデオ通信サービスに参加することができる。そして、例えば第１の参加者クライアント１２１は、第１の参加者クライアント１２１のスクリーン１２４で視聴するための第２のデジタルビデオストリームを提供されてよく、その逆であってもよく、これにより、第１および第２の参加者クライアント１２１のユーザ１２２同士が互いを見て対話するようにできる。それに加えてまたはそれに替えて、第１および第２の参加者クライアントの各々または一方には、当該参加者クライアント１２１のそれぞれのスクリーン１２４で視聴するための第１の生成デジタルビデオストリームが提供されてよい。第１の生成デジタルビデオストリームと、第１および第２の一次ビデオストリームのいずれか１つとの両方が連動して提供される場合、当該一次ビデオストリームは、当該参加者クライアント１２１で表示されるビデオストリームを時間同期させるように、後述するように遅延させることができる。

【0195】

第２の生成機能１３５''によって実行される後続する第２の生成ステップにおいて、第２の生成ビデオストリームは、第１の一次デジタルビデオストリームおよび第２の一次デジタルビデオストリームに基づき、さらに第３の一次デジタルビデオストリームにも基づくデジタルビデオストリームとして生成される。第３の一次デジタルビデオストリームは、好ましくは、そのままでも、または生成されたデジタルビデオストリームの一部としてでも、第１または第２の参加者クライアントに提供されないことに留意されたい。本明細書の他の箇所で説明されているように、第１および第２の参加者クライアントは、第３の参加者クライアントと比較して、参加者クライアントの異なるグループに割り当てられてよい。

【0196】

第２の生成ステップは、第２の生成ビデオストリームが、上記公開ステップにおいて第１または第２の参加者クライアントに提供され得るビデオストリームのいずれとも時間的に非同期であるように、時間遅延を導入することを含む。この時間遅延は、本明細書で説明される方法のいずれかにおいて、意図的に追加され、および／または第２の生成デジタルビデオストリームの生成の直接的な結果であってよい。好ましくは、第２の生成デジタルビデオストリームは、第１および／または第２の参加者クライアントで公開された任意のビデオストリームに関連して遅延して公開されるために利用可能である。これについて考慮する１つの方法は、第２の生成デジタルビデオストリームの任意の消費者クライアントは、第１および第２の参加者クライアントのビデオストリーム消費「タイムゾーン」よりも（時間的に）わずかに後の「タイムゾーン」において、この第２の生成デジタルビデオストリームを消費するということである。

【0197】

例えば、１つまたは複数の一次デジタルビデオストリームが第１および／または第２の参加者クライアントに提供される場合、そのような提供は、（意図的に導入された時間遅延を使用することなく）直接的であってよく、および／または当該参加者クライアントへの提供の前に計算上比較的軽量な処理のみを含んでよく、一方、第２の生成デジタルビデオストリームの生成は、第１のおよび／または第２の一次デジタルビデオストリームの公開のための最も早い遅延に関連して、第２の生成デジタルビデオストリームが最も早い公開のために遅延して生成されることにつながる、意図的に導入された時間遅延および／または比較的重量級の処理を含んでよい。第１の生成ビデオストリームが第１および／または第２の参加者クライアントに提供される場合、第１の生成デジタルビデオストリームは、比較的短い意図的に加えられた時間遅延および／または比較的軽量な処理を用いて生成され、一方、第２の生成デジタルビデオストリームは、比較的長い意図的に加えられた時間遅延および／または比較的重量級の処理を用いて生成され、その結果、第２の生成デジタルビデオストリームは、対応して、第１の生成デジタルビデオストリームの最も早い遅延に関連して、最も早い公開のために遅延して生成される。

【0198】

通常、第２の生成デジタルビデオストリームは、第１または第２の参加者クライアントにおいて公開されるために提供されるのではなく、例えば第３の参加者クライアント（第２のグループ１２１''などの異なるグループに割り当てられる）および／または外部の消費者クライアント１５１などの、第１および第２のクライアントが属するグループとは異なるグループ（第１のグループ１２１'など）に割り当てられる参加クライアントにおいて提供される。

【0199】

そのため、図８ａに示されるように、上記公開ステップは、第２の生成ビデオストリームを、第１または第２の参加者クライアントではない少なくとも１つの消費者クライアント１２１、１５０に連続的に提供することをさらに含む。

【0200】

図８ａにも示されているように、本方法は、当該デジタルビデオストリームを連続的に生成し、提供／公開することを繰り返してよい。

【0201】

後続するステップで本方法は終了する。

【0202】

図８ｂは、第２の態様に係る方法を示す。

【0203】

最初のステップで本方法はスタートする。

【0204】

後続する収集ステップにおいて、多数の一次ビデオストリーム、この例示的な例では、参加者クライアントの第１のグループから選択されたそれぞれの参加者クライアント１２１'から収集された少なくとも第１の一次デジタルビデオストリームおよび第２の一次デジタルビデオストリーム、が収集される。

【0205】

図８ａに示される方法の場合と同様に、収集は上述のように実行されてよく、収集機能１３１は例えば再エンコードを実行することなく生データを処理する。また、第１の生成デジタルビデオストリームを生成する目的で、参加者クライアント１２１'の第１のグループから収集された一次デジタルビデオストリームに適用される、上述の一般的なタイプのイベント検出ステップ、同期ステップ、およびパターン検出ステップも存在してよい。

【0206】

すなわち、後続する第１の生成ステップにおいて、第１の生成機能１３５'は、収集機能１３１からそれぞれのデジタルビデオストリームとして第１および第２の一次ビデオストリームを受信し、第１および第２の一次デジタルビデオストリームに基づいて第１の生成デジタルビデオストリームを生成する。好ましくは、上記第１のデジタルビデオストリームは、第１のグループ１２１'に割り当てられた参加者クライアントとは別の、１つの同じビデオ通信サービス１１０に接続された他の参加者クライアント１２１に基づいては生成されず、そうした他の参加者クライアント１２１がビデオ通信サービス１１０上で第１のグループ１２１'のメンバーと対話できるような方法では生成されない。他方、第１の生成ビデオストリームは、外部ビデオフィード、静的データまたはグラフィックスなどの他の情報に基づいて生成されてよい。明確化のため、図８ｂに関連して説明されたこれらおよび他のことは、図８ａ、図８ｃおよび図８ｄに示された方法にも適用され得る。

【0207】

したがって、この第１の生成の結果は、上述のタイプの生成されたデジタルビデオストリームであり、それは、例えば、サブパートとして、処理された形態または処理されていない形態で、１つまたは複数の当該一次ビデオストリームを視覚的に含んでよい。この第１の生成ビデオストリームは、中央サーバ１３０によって生成されたビデオ出力ストリームに関連して概略上述したように、ライブキャプチャされたビデオストリーム、スライド、外部から提供されたビデオまたは画像などを含んでよい。第１の生成ビデオストリームはまた、概略上述した方法で、第１のグループ１２１'の参加者クライアントによって提供される、意図的に遅延されたまたはリアルタイムの第１および／または第２の一次ビデオストリームの、検出されたイベントおよび／またはパターンに基づいて生成されてよい。

【0208】

後続する第２の生成ステップにおいて、第２の生成デジタルビデオストリームは、第１の生成ビデオストリーム、および参加者クライアント１２１'の第１のグループから収集された第１および第２の一次デジタルビデオストリームの双方に基づいて、デジタルビデオストリームとして生成される。第１および第２の一次デジタルビデオストリームは、収集機能１３１から第２の生成機能１３５''に提供されてよく、一方、第１の生成ビデオストリームは、第１の生成機能１３５'から第２の生成機能１３５''に提供されてよい。第１および第２の生成機能１３５'、１３５''が１つの同じ論理ユニットである場合（その場合もある）、生成は、その生成機能において単純に２つの連続するステップで実行される。

【0209】

後続するステップで本方法は終了する。

【0210】

第２の生成ステップ１３５''に供給される第１および／または第２の一次ビデオストリームは、第２の生成ステップ１３５''の前に様々な方法で予めフォーマットされ得ることが理解される。また、概略上述したように、イベントおよび／またはパターンを検出するために、意図的に遅延させることもできる。

【0211】

第２の生成ステップは、上述した生成ステップのいずれかと同様であってもよく、生成機能１３５、１３５'の機能に関して上述したことはすべて、第２の生成機能１３５''にも対応して適用可能である。例えば、第２の生成機能１３５''は、生成プロセスの一部として、様々な方法で一次ビデオストリームをフォーマットすることによって、第２の生成ビデオストリームを生成してよい。

【0212】

上述したように、第１および第２の一次ビデオストリームは、第１の生成機能１３５'に供給される前に、例えば上述したいずれかの方法で共通時間基準を使用するなどして、互いに時間同期させることができる。

【0213】

しかしながら、第２の生成ステップにおいて、第１および第２の一次デジタルビデオストリームを意図的に時間遅延させることができる（例えば、複数の一次ビデオストリームを互いに時間同期させるため、および／または第１の生成機能１３５'で使用するためのイベントおよび／またはパターンを検出できるようにするために実行される、既に適用された時間遅延に加えて、意図的に時間遅延させる）。ここで意図的に導入された時間遅延の目的および結果は、第２の生成ビデオストリームで使用される前に、第１の生成ビデオストリームと時間同期させることである。したがって、第１および第２の一次ビデオストリームに関して導入される追加遅延は、その後、第１の生成ステップの実行に関連する待ち時間に等しいか、実質的に等しいか、または少なくともその関数として決定される。追加される正確な待ち時間は、例えば、上述の一般的なタイプの検出された共通時間基準に基づいて決定することができる。

【0214】

すなわち、第１の生成ビデオストリームが生成される第１の生成ステップは、通常、（第１の生成ステップ１３５'自体のデータ処理に起因する）ある待ち時間と関連付けられ、それは、例えば、利用可能な計算能力および第１の生成ステップ１３５'の複雑さに依存し得る。この待ち時間は、通常、第１および第２のビデオストリーム自体には存在せず（または、いかなる待ち時間もいずれにせよ小さい）、それらビデオストリームは、単純にキャプチャされ、任意に上述の方法で処理され、その後、収集機能１３１によって第２の生成機能１３５''に提供され、第２の生成機能１３５''によって使用される。

【0215】

第１の生成ステップの結果生じる第１の生成ビデオストリームの待ち時間を考慮して、この（追加的な）遅延を第１および第２の一次ビデオストリームに意図的に導入してこれら３つのビデオストリームを時間同期させることにより、第２の生成ビデオストリームが、第１および第２の一次ビデオストリームに基づいてだけでなく、同じ第１および第２の一次ビデオストリームに基づき生成された第１の生成ビデオストリームにも基づいて生成される場合であっても、同期の問題なしに第２のビデオストリームを生成することが可能になる。すなわち、第２の生成ビデオストリームは、時間遅延された第１および第２の一次デジタルビデオストリームに基づいて生成される。

【0216】

したがって、第１の生成ビデオストリームは、第２の生成ステップ１３５''に供給されてよく、第２の生成ビデオストリームは、したがって、２つの（またはそれ以上の）生成ステップ１３５'、１３５''を使用して生成され、そこで、収集機能１３１によって提供される一次ビデオストリームの共通時間基準に関連して異なる待ち時間に関連付けられた少なくとも２つのそのような生成ステップにおいて、同じ一次ビデオストリームが使用される。

【0217】

例示的な実施例では、第１のグループ１２１'の参加者クライアントは討論パネルの一部であり、相対的に低い待ち時間でビデオ通信サービス１１０を使用して通信し、これらの参加者クライアントの各々は、第１の生成ビデオストリーム（または、前述の図８ａに関連して説明したように、互いのそれぞれの一次ビデオストリーム）を連続的に供給される。討論パネルの聴衆は、第２のグループ１２１''の参加者クライアントによって構成され、第２の生成ビデオストリームが連続的に供給され、順に、わずかにより高い待ち時間に関連付けられる。第２の生成ビデオストリームは、上述の一般的な方法で、討論パネルの個々のスピーカ（第１のグループ１２１'に割り当てられた参加者クライアント、このようなビューは収集機能１３１から直接提供される）のビューと、すべての討論パネルのスピーカを表示する生成されたビュー（このビューは第１の生成ビデオストリームである）との間で自動的にシフトするように、自動的に生成され得る。第１および／または第２の態様に係る本発明を使用して、パネルのスピーカが最小の待ち時間で互いに対話することができる一方で、聴衆は、良好に制作された経験を享受することができる。

【0218】

第２の生成ステップに関連して第１および第２の一次ビデオストリームに意図的に追加される遅延は、少なくとも０．１秒、例えば少なくとも０．２秒、例えば少なくとも０．５秒であってもよく、最大５秒、例えば最大２秒、例えば最大１秒であってもよい。

【0219】

上述の一般的な方法で第２の生成機能１３５''で使用するためのパターン検出を改良するために、第１および第２の一次ビデオストリーム、ならびに第１の生成ビデオストリームはすべて、追加的に意図的に遅延させることができることが理解される。

【0220】

図９は、中央サーバ１３０によって生成された様々な生成されたビデオストリームを公開する、多数の代替または同時実行の方法を示している。

【0221】

一般に、第１の生成機能１３５'から第１の生成ビデオストリームを受信するよう構成される第１の公開機能１３６'によって実行される後続の公開ステップにおいて、第１の生成ビデオストリームは、第１の参加者クライアント１２１および第２の参加者クライアント１２１の少なくとも一方に連続的に提供され得る。例えば、この第１の参加者クライアントは、第１の一次デジタルビデオストリームを提供するグループ１２１'からの参加者クライアントであってもよく、および／または、第２の参加者クライアントは、第２の一次デジタルビデオストリームを提供するグループ１２１'からの参加クライアントであってもよい。

【0222】

換言すれば、第１の生成ビデオストリームは、第１の参加者クライアントおよび第２の参加者クライアントの少なくとも一方に連続的に提供され得る。

【0223】

いくつかの実施形態では、グループ１２１'の参加者クライアントの１つまたは複数は、第２の生成機能１３５''から第２の生成ビデオストリームを受信するよう構成される第２の公開機能１３６''によって、第２の生成ビデオストリームを受信してよい。

【0224】

したがって、第１のグループ１２１'に割り当てられている、一次ビデオストリームを提供する参加者クライアントの各々は、上記一次デジタルビデオストリームを直接提供されない場合、第１の生成ビデオストリームを提供されてよく、この第１の生成ビデオストリームは、複数の一次ビデオストリーム間の同期に起因する一定の遅延または待ち時間を含み、さらに、上述したように、イベントおよび／またはパターン検出のための十分な時間を確保するために、意図的に追加される可能性のある遅延または待ち時間を含んでよい。

【0225】

これに対応して、第２のグループ１２１''に割り当てられている参加者クライアントの各々は、第２の生成ビデオストリームを提供されてよく、この第２の生成ビデオストリームは、第１の生成ビデオストリームを第１および第２の一次ビデオストリームと時間同期させる目的で追加された、第２の生成ステップに関連して意図的に追加された遅延をも含む。この超過の遅延は、例えば、第２のグループ１２１''の参加者クライアントが第１のグループ１２１'の参加者クライアントとは異なる方法でビデオ通信サービス１１０と対話することに起因して（下記参照）、第２のグループ１２１''の参加者クライアント間の通信障害を引き起こす場合もあるし、引き起こさない場合もある。他の実施形態（例えば、第１のグループ１２１'の参加者クライアントが一次デジタルビデオストリームを直接提供される場合）では、第２のグループ１２１''に割り当てられた参加者クライアントの各々は、第１の生成ビデオストリームを直接提供されてよい。

【0226】

したがって、第１のグループ１２１'の参加者クライアントは、当該ビデオ通信サービス１１０に現在参加しているすべての参加者クライアント１２１のサブグループを形成し、第１の生成ビデオストリームまたは第２の生成ビデオストリームなどの生成されたビデオストリームを連続的に提供されているどの参加クライアントよりもわずかに先（１～３秒先など）の「タイムゾーン」において当該サービスに存在して当該サービスを使用している。それでもなお、他の参加者クライアント（第１のグループ１２１'に割り当てられておらず、代わりに第２のグループ１２１''に割り当てられている）は、第２の生成ビデオストリームを連続的に提供され、この第２の生成ビデオストリームは、第１および第２の一次ビデオストリームに基づいて生成されるが（各時点で、いずれかまたは両方を含む可能性がある）、わずかに遅い「タイムゾーン」にある。第１の生成ビデオストリームは、第１および第２の一次ビデオストリームに基づいて直接生成されるため、一次ビデオストリーム自体に基づいて既に生成されたビデオストリームに時間同期させるために遅延や待ち時間が追加されることはなく、より直接的で低遅延のビデオ通信サービス１１０の経験が、これらの参加者クライアント１２１に提供される。

【0227】

この場合も、第１のグループ１２１'に割り当てられた参加者クライアント１２１には、第２の生成ビデオストリームへのアクセスが提供されないことを意味し得る。

【0228】

すなわち、第１および第２の一次デジタルビデオストリームは、上述の一般的なタイプの共有デジタルビデオ通信サービス１１００の一部として提供されてよく、第１の参加者クライアントおよび第２の参加者クライアント（同じ第１のグループ１２１'に属する）は、いずれも、共有デジタルビデオ通信サービス１１００へのそれぞれの遠隔接続された参加者クライアントであってよい。第２のグループ１２１''の参加者クライアント（および第３のグループ１２１''の参加者クライアントも）は、共有デジタルビデオ通信サービス１１０に遠隔接続された参加者クライアントであってよい。

【0229】

この文脈では、「遠隔接続」とは、そのような参加者クライアント１２１または対応するユーザ１２２が、必ずしも異なる部屋、敷地、または地理的位置に配置されていることを意味するのではなく、ユーザ１２２が、当該参加者クライアント１２１を使用してビデオ通信サービス１１０と音声／視覚的に対話することを意味することが理解される。

【0230】

上記収集ステップは、例えば上述したいずれかの方法で、共有デジタルビデオ通信サービス１１０から第１および／または第２の一次デジタルビデオストリームを収集することを含んでよい。

【0231】

図８ｃは、第３の態様に係る方法を示す。上述のように、図８ｃに示す方法は、図８ｄに示す方法についても同様であるが、図８ａおよび図８ｂに示す方法と同様であり、本発明のこれら４つの態様は自由に組み合わせることができる。これらの態様の１つに関連して述べたことはすべて、互換性がある限り、対応する態様で他の態様にも容易に適用できる。

【0232】

最初のステップで本方法はスタートする。

【0233】

後続する収集ステップで、第１のグループ１２１'に割り当てられた第１の参加者クライアントから、第１の一次デジタルビデオストリームが収集され、同じく第１のグループ１２１'に割り当てられた第２の参加者クライアントから、第２の一次デジタルビデオストリームが収集される。さらに、第３のデジタルビデオストリームが、第１のグループ１２１'に割り当てられていない可能性のある第３の参加者クライアントから収集される。例えば、第３の参加者クライアントは、第２のグループ１２１''に割り当てられていてよい。この収集ステップは、図８ｂに関連して説明した収集ステップと同様であってよい。

【0234】

図８ｂに関連して説明された第１の生成ステップと同様であってよい、後続する第１の生成ステップにおいて、第１の生成ビデオストリームは、収集された第１および第２の一次デジタルビデオストリームに基づいて、デジタルビデオストリームとして生成され得る。ここで、第１の生成ビデオストリームが第３の一次ビデオストリームに基づいて生成されなくてもよいことに留意されたい。

【0235】

第１の生成デジタルビデオストリームは、いくつかの消費者クライアントへの公開のために、第１の待ち時間で連続的に生成される。換言すれば、この第３の態様によれば、第１の生成デジタルビデオストリームは、第１の生成デジタルビデオストリームの新たに生成された各フレームが当該フレームの生成時に直ちに公開される場合、当該フレームの公開が第１の待ち時間で行われるように生成される。

【0236】

後続する第２の生成ステップでは、図８ｂに関連して説明した第２の生成ステップと同様であり得るが、第２の生成ビデオストリームは、３つの一次デジタルストリームのすべて、言い換えれば、第１、第２および第３の一次デジタルビデオストリームのすべてに基づくデジタルビデオストリームとして生成される。

【0237】

第１の生成ビデオストリームおよび第１の待ち時間に対応する方法で、第２の生成デジタルビデオストリームは、公開のために、第２の待ち時間で連続的に生成される。第２の待ち時間は、第１の待ち時間よりも大きい。これは、第１および第２の生成ビデオストリームが双方とも、例えば、第１の一次ビデオストリームからのフレームを含む場合、そのようなフレームは、第２の生成ビデオストリームの即時の公開と比較して、第１の生成ビデオストリームの即時の公開においてより早く表示されることを意味する。

【0238】

図８ｂに関連して説明した公開ステップと同様であり得る、後続する公開ステップで、第１の一次デジタルビデオストリーム、第２の一次デジタルビデオストリーム、および第１の生成ビデオストリームのうちの少なくとも１つ（例えば、これら複数のストリームのうちの１つ以上の任意のセット）が、第１の参加者クライアントおよび第２の参加者クライアントのうちの少なくとも１つに連続的に提供される。これは、上述の図８ａに関連して説明した方法と同様である。

【0239】

また、第２の生成ビデオストリームは、少なくとも１つの他の参加者クライアントに連続的に提供される。

【0240】

後続するステップで本方法は終了する。

【0241】

第２の態様の解決手段の実際の適用を説明するために使用した同じ例を使用して、この第３の態様を実装する方法を説明することもできる。第３の一次ビデオストリームは、第１および第２の一次ビデオストリームを提供する第１のグループ１２１'の参加者クライアントよりも待ち時間に対する要求が低い第２のグループ１２１'の参加者クライアントから収集されるので、第２の生成ビデオストリームは、より待ち時間が長い方法で提供され、所望の自動生成を達成することが可能になり、一方、第１のグループ１２１'のパネル討論スピーカは、より低い待ち時間で対話することができる。

【0242】

当然ながら、第３の一次ビデオストリームに加えて、より多くの第２のグループ１２１''が提供する一次ビデオストリームが存在してよく、これらは対応して使用されてよい。

【0243】

図８ｂおよび図８ｃに関連して説明される公開ステップにおいて、第２の生成ビデオストリームは、第１または第２の参加者クライアントではない少なくとも１つの消費者クライアントに連続的に提供され得る。より一般的には、第２の生成ビデオストリームは、第１のグループ１２１'に割り当てられていない参加クライアント１２１、および／または外部消費者１５０に連続的に提供され得る。

【0244】

上述したように、収集ステップ１３１は、共有デジタルビデオ通信サービス１１０の外部である情報源３００から収集された、上述のタイプの外部デジタルビデオストリーム３０１として、第１および第２の一次ビデオストリームに加えて例えば追加の一次ビデオストリームなどの、一次デジタルビデオストリームの少なくとも１つを収集することを含んでよい。また上述したように、このような外部ビデオストリーム３０１は、収集機能１３１と第１の生成機能１３５'との間に論理的に位置する（データフローの点で）同期機能１３３によって、第１および第２の一次ビデオストリームに時間同期され得る。対応することは、本明細書で説明される第３、第４および第５の一次ビデオストリームにも適用される。その場合、第１および／または第２の生成ビデオストリームは、外部デジタルビデオストリーム３０１に基づいて生成され得る。

【0245】

また、概略的に上述したように、第１の生成ステップ１３５'および／または第２の生成ステップ１３５''はさらに、当該生成されたデジタルビデオストリームにおける第１および／または第２の一次デジタルビデオストリーム２１０の個々のものの可視性；視覚的および／または聴覚的ビデオコンテンツの配置；使用される視覚的または聴覚的効果；および／または当該生成されたデジタルビデオストリームの出力モードに関する、予め決定されたおよび／または動的に可変なパラメータのセットに基づいて、当該それぞれの生成された（第１および／または第２の）ビデオストリームを生成すること、を含んでよい。

【0246】

また上述したように、第１の生成ステップ１３５'および／または第２の生成ステップ１３５''は、中央サーバ１３０によって実行され、第２の生成ビデオストリームを、上記で説明された一般的なタイプのＡＰＩ１３７を介して、ライブビデオストリームとして１つまたは複数の同時（外部および／または参加）消費者クライアントに提供してよい。

【0247】

したがって、参加者クライアント１２１の異なるグループ１２１'、１２１''、１２１'''は、遅延耐性の点で異なる要件を有し得る。これは特に、参加者クライアント１２１として１つの同じライブビデオ通信サービス１１０に参加する場合に当てはまる。このことは、以下でさらに例示される。

【0248】

図８ｄは、本発明の第４の態様に係る方法を示す。

【0249】

最初のステップで本方法はスタートする。

【0250】

一般に、図８ｄに示されるように、第２の生成デジタルビデオストリームを生成するための方法は、後続する割り当てステップを含んでいてもよく、それは初期ステップであってもよいが、例えば再割り当てステップとして、方法中の任意の時点で実行されてもよい。

【0251】

この割り当てステップでは、複数の参加者クライアント１２１を、そのような参加者クライアント１２１の少なくとも２つのグループ１２１'、１２１''、１２１'''に亘って割り当ててよい。本実施例では、割り当ては、少なくとも第１のグループ１２１'と第３のグループ１２１''に行われるが、参加クライアント１２１は、当然、第３のグループ１２１''にも割り当てることができる。

【0252】

より詳細には、第１の一次デジタルビデオストリームおよび第２の一次デジタルビデオストリームは、例えば収集機能１３１によって、および後続の収集ステップにおいて、参加者クライアントの第１のグループ１２１'に割り当てられたそれぞれの参加者クライアント１２１から、収集され得る。しかしながら、第４の一次デジタルビデオストリームおよび第５の一次デジタルビデオストリームも、収集機能１３１によって、および上記収集ステップにおいて、参加者クライアントの第３のグループ１２１'''に割り当てられたそれぞれの参加者クライアント１２１から収集され得る。

【0253】

図９に示す例では、第３のグループ１２１''に割り当てられた参加者クライアント１２１は、第１のグループ１２１'に割り当てられた参加者クライアント１２１よりも厳格な待ち時間の要件を持たなくてよい。例えば、第１のグループ１２１'の参加者クライアント１２１は、上述の討論パネルのメンバー（リアルタイムで互いに対話するため低待ち時間を必要とする）であってよく、一方、第３のグループ１２１''の参加者クライアント１２１は、パネルと対話するが、より構造化された方法（明確な質問／回答を使用するなど）で対話する専門家パネルまたは同様のパネルを構成してよく、したがって、第１のグループ１２１'よりも大きい待ち時間を許容することができる。

【0254】

第１の生成ビデオストリームは、上述したように、第１の生成機能１３５'によって、第１および第２の一次ビデオストリーム（ならびに説明したように任意の追加入力コンテンツ）に基づいて生成され得る。第３の生成ビデオストリームも、対応する方法で生成されるが、第３の生成機能１３５'''によって、および（少なくとも）第４および第５の一次ビデオストリームに基づいて生成される。

【0255】

第１の生成ビデオストリームと第３の生成ビデオストリームの双方は、場合によっては、第２の生成ビデオストリームの生成の基礎とするために、第２の生成機能１３５''に供給されてよい。

【0256】

しかしながら、この第４の態様によれば、第２の生成機能１３５''によって実行される第２の生成ステップにおいて、第２の生成ビデオストリームは、上述したような方法で、第１および第２の一次ビデオストリームの少なくとも１つに基づいて、さらに第４および第５の一次ビデオストリームの少なくとも１つに基づいて、生成される。第２の生成機能１３５''は、任意のクロスストリーム時間同期、イベント検出などを含む、第１および第２の一次ビデオストリームと対応する方法で、収集機能１３１から第４および第５の一次ビデオストリームを提供されてよい。第２の生成ビデオストリームは、例えば、第２の生成ビデオストリームが、第１および第２の一次ビデオストリームに基づく第１の生成ビデオストリームに基づくことによって、第１および／または第２の一次ビデオストリームに直接的または間接的に基づいてもよく；対応して、第４および第５の一次ビデオストリームおよび第３の生成ビデオストリームについても同様であること、に特に留意されたい。

【0257】

上記第３の生成ビデオストリームは、後続する第３の生成ステップで生成される。

【0258】

第４の態様によれば、第３の生成ステップは、第４および第５の一次ビデオストリームに対して、互いに時間同期されるが、第１の生成ビデオストリームに対して時間非同期される（時間同期されない）ように、意図的に時間遅延を導入することを含む。この時間遅延は、第３の生成機能１３５'''自体、または当該第３の生成機能１３５'''の上流の対応する同期機能１３３において導入され得ることが理解される。

【0259】

したがって、第１の生成ステップ１３５'は、第１および第２の一次ビデオストリームの同期の一部として導入される遅延に加えて導入され、例えば、効率的なイベントおよび／またはパターン検出を実行するために十分な時間を達成するように導入される、上述したタイプの意図的な遅延または待ち時間を導入することを含んでよい。このような意図的な遅延または待ち時間の導入は、上記同期機能１３３によって実行される同期の一部として行われ得る（簡略化の理由から図９には示されていない）。第３の生成ステップ１３５'''についても同様であるが、第１の生成ステップ１３５'のために意図的に導入された遅延または待ち時間とは異なる意図的な遅延または待ち時間を導入してよい。

【0260】

特に、意図的に導入された遅延または待ち時間は、第１の生成ビデオストリームと第３の生成ビデオストリームとの間の時間非同期をもたらす。これは、第１および第３の生成ビデオストリームが、個々のフレームそれぞれの生成時に即時かつ連続的に公開される場合に、共通のタイムラインに従わないことを意味する。

【0261】

上述したように、第２の生成ビデオストリームは、第１の生成ビデオストリームよりも大きい遅延に関連付けられてよく、場合によっては、第３の生成ビデオストリームよりも大きい遅延にも関連付けられてよい。したがって、第２の生成機能１３５''は、第２の生成ビデオストリームに組み込む前に、第１、第２、第４および第５の一次ビデオストリームにそれぞれの追加的遅延を追加することによってこれら第１、第２、第４および第５の一次ビデオストリームを同期させるように構成されてよい。

【0262】

公開ステップにおいて、第３の生成ビデオストリームは、第３のグループ１２１'''に割り当てられた少なくとも１つの参加者クライアントに連続的に提供され、そこで当該ユーザ１２２に連続的に公開されてよい。同様に、第１の生成ビデオストリームは、第１のグループ１２１'に割り当てられた少なくとも１つの参加者クライアントに連続的に提供され、そこで当該ユーザ１２２に公開され得る；および／または第２の生成ビデオストリームは、上述のように提供および公開され得る。

【0263】

後続するステップで本方法は終了する。

【0264】

したがって、この第４の態様では、３つの別個に生成されたビデオストリームが、異なる「タイムゾーン」において、同時に生成され、消費／公開されてよい。これらは少なくとも部分的に同じ一次ビデオ素材に基づいているにもかかわらず、生成されたビデオストリームは異なる待ち時間で公開される。第１のグループ１２１'は、最も小さい待ち時間を必要とし、第１の生成ビデオストリームを使用して対話することができ、非常に小さい待ち時間を提供する。第３のグループ１２１'''は、わずかに大きい待ち時間を受け入れることをいとわず、第２の生成ビデオストリームを使用して対話することができ、より多くの待ち時間を提供するが、他方では、本明細書の他の箇所に開示されているように、より良好な自動生成を達成するように、意図的に追加された遅延の点でより大きな柔軟性を提供する。一方、遅延にそれほど敏感でない第２のグループ１２１''は、第１のグループ１２１'および第３のグループ１２１'''からの素材を組み込むことができ、また非常に柔軟な方法で自動的に生成される第２の生成ビデオストリームを使用して対話を楽しむことができる。参加者ユーザのこれら全てのグループ１２１'、１２１''、１２１'''は、上記の様々な遅延を使用し、したがって異なる「タイムゾーン」で行動しているにもかかわらず、上記ビデオ通信サービス１１０を使用して互いに対話することに特に留意されたい。しかしながら、各生成機能における個々の入力ビデオストリームの同期により、参加者ユーザ１２１は、それぞれの観点から、異なる待ち時間に気付くことがない。

【0265】

上記第１の生成ステップ１３５'は、上述したように、第１および第２の一次ビデオストリームを互いに時間同期させるように時間遅延させることを含んでよい。

【0266】

これに対応して、上記第３の生成ステップ１３５''（または対応する同期ステップ１３３）は、第４および第５の一次ビデオストリームを互いに時間同期させるように時間遅延させることを含んでよい。しかしながら、ここでは、第１の生成ステップ１３５'（または対応する同期ステップ１３３）において第１および第２の一次ビデオストリームを時間遅延させるために使用される最大時間遅延よりも大きな最大時間遅延を使用し、その結果、第１の生成ビデオストリームは、第３の生成ビデオストリームと上述の方法では時間同期されない。

【0267】

上述したように、上記グループ１２１'、１２１''、１２１'''のそれぞれに割り当てられたそれぞれの参加者クライアント１２１は、第２の生成ビデオストリームが連続的に公開される１つの同じビデオ通信サービス１１０に参加することができる。

【0268】

そして、上記グループ１２１'、１２１''、１２１'''の異なるものは、ビデオ通信サービス１１０における異なる参加者の対話権限に関連付けられ、上記グループ１２１'、１２１''、１２１'''の異なるものは、当該グループ１２１'、１２１''、１２１'''に割り当てられた参加者クライアント１２１に対して公開されるそれぞれの生成ビデオストリームを生成するために使用される異なる最大時間遅延（待ち時間）に関連付けられてよい。

【0269】

例えば、パネル討論の参加者クライアントの第１のグループ１２１'は、完全な対話権限に関連付けられてもよく、望めばいつでも発言することができる。参加者クライアントの第３のグループ１２１'''は、例えば、ビデオ通信サービス１１０がマイクのミュートを解除することによって発言できるようになる前にフロアを要求する必要があるなど、わずかに制限された対話権限に関連付けられてよい。聴衆参加者ユーザの第２のグループ１２１''は、例えば、共通のチャットルームへのテキスト投稿により質問を投げかけることができるだけで、発言することはできないなど、さらに制限された対話権限と関連付けられてよい。

【0270】

したがって、参加者ユーザの様々なグループは、待ち時間が対話権限の減少の増加関数となるように、異なる対話権限と、それらに公開されるそれぞれの生成ビデオストリームに対する異なる待ち時間とに関連付けられてよい。当該参加者ユーザ１２１が、ビデオ通信サービス１１０によって、他のユーザと対話することがより自由に許可されるほど、許容される待ち時間は低くなる。許容される待ち時間が低いほど、対応する自動生成機能が検出されたイベントやパターンなどを考慮する可能性が小さくなる。

【0271】

最大の待ち時間を持つグループは、ビデオ通信サービスに受動的に参加する以外に対話する権利を持たない、視聴者だけのグループであってよい。

【0272】

特に、上記グループ１２１'、１２１''、１２１'''の各々についてのそれぞれの最大時間遅延（待ち時間）は、すべての一次ビデオストリームと、当該グループの参加者クライアントに連続的に公開される任意の生成ビデオストリームとに亘る最大の待ち時間の差として決定され得る。この合計には、上述したように、イベントおよび／またはパターンを検出する目的で意図的に追加された追加的時間遅延を加えることができる。

【0273】

本明細書で使用される場合、「生成」および「生成デジタルビデオストリーム」という用語は、異なるタイプの生成を参照する場合がある。ある例では、単一の、明確に定義されたデジタルビデオストリームが、中央サーバ１３０などの中央エンティティによって生成されて、当該生成デジタルビデオストリームを消費することになる参加者クライアント１２１の特定のセットのそれぞれへの提供および公開のために、当該生成デジタルビデオストリームを形成する。他の態様では、異なる個々のそのような参加者クライアント１２１は、当該生成デジタルビデオストリームのわずかに異なるバージョンを視聴することができる。例えば、生成デジタルビデオストリームは、参加者クライアント１２１のローカルソフトウエア機能１２５が当該ユーザ１２２に切り替えさせたり、スクリーン１２４上に配置させたり、またはその他の方法で構成もしくは処理させることができるような、複数の個別または結合されたデジタルビデオストリームを含んでよい。多くの場合、重要なのは、時間同期されたサブコンポーネントを含む生成デジタルビデオストリームが、どの「タイムゾーン」で（すなわち、どの待ち時間で）提供されるかである。したがって、図８ａに関連して上述した、第１および第２の参加者クライアントが互いの一次ビデオストリームを提供されるケースは、（生データのまたは処理された第１および第２の一次デジタルビデオストリームの時間同期されたセットが第１および第２の参加者クライアントの双方で利用可能になるという意味で）第１の生成デジタルビデオストリームが第１および第２の参加者クライアントに提供されると見なすことができる。

【0274】

上述した参加者クライアントのグループ１２１'、１２１''、１２１'''の使用をさらに明確にし、例示するために、３つの異なる同時「タイムゾーン」を含むビデオ通信サービスミーティングの形式で、以下の例を説明する。

【0275】

参加者クライアント１２１'の第１のグループは、リアルタイムで、または少なくともほぼリアルタイムで（不可避のハードウエアおよびソフトウエアの遅延に依存する）対話を経験している。これらの参加者クライアントは、当該ユーザ１２２間のこのような対話およびコミュニケーションを実現するために、互いから音声を含むビデオを提供される。第１のグループ１２１'は、ミーティングの中核となるユーザ１２２にサービスを提供することができ、その対話は、他の（第１のグループ１２１'以外の）参加者クライアントにとって参加することに関心を持ち得る。

【0276】

そのような他の参加クライアント１２１''の第２のグループは、同じミーティングに参加するが、第１のグループの参加者クライアント１２１'よりもリアルタイムから離れた、異なる「タイムゾーン」にいる。例えば、第２のグループ１２１''は、第１のグループ１２１'に質問を投げかけることができるなどの対話権限を有する聴衆であってもよい。第２のグループ１２１''の「タイムゾーン」は、提起された質問と回答が気付くことができるが短い遅延に関連付けられるように、第１のグループ１２１'の「タイムゾーン」との関係で遅延を有してよい。一方、このわずかに大きい遅延により、この第２のグループ１２１''の参加者クライアントは、より複雑な方法で自動的に生成された生成デジタルビデオストリームを体験することができ、より快適なユーザ体験を提供することができる。

【0277】

このような他の参加者クライアント１２１'''の第３のグループも、同じミーティングに参加するが、視聴者としてのみ参加する。この第３のグループ１２１'''は、第２の「タイムゾーン」よりもさらに大きい遅延を有する第３の「タイムゾーン」で消費される、さらに精巧かつ複雑な方法で自動的に生成され得る生成デジタルビデオストリームを消費する。しかしながら、第３のグループ１２１'''は、第１のグループ１２１'および第２のグループ１２１''に影響を与えるような方法で通信サービスに入力を提供することができないので、第３のグループ１２１'''は、会議が「リアルタイム」かつ納得できる演出で行われることを体験する。

【0278】

当然、このような参加者クライアントのグループは３つ以上あってもよく、本明細書で説明する原則を用いて、時間的な遅延が次第に大きくなり、生成の複雑さが増す、それぞれのミーティング「タイムゾーン」に関連付けられる。

【0279】

本発明はまた、上述の内容に従って第２のデジタルビデオストリームを提供するためのコンピュータソフトウエア機能に関する。そして、そのようなコンピュータソフトウエア機能は、実行時に、特に第１、第２、第３および／または第４の態様に関して、上述した収集、イベント検出、同期、パターン検出、生成、および公開ステップの少なくともいくつかを実行するように構成され得る。コンピュータソフトウエア機能は、上述したように、中央サーバ１３０の物理ハードウエアまたは仮想ハードウエア上で実行するように構成されてよい。

【0280】

本発明はまた、第２のデジタルビデオストリームを提供するためのシステムであり、順に中央サーバ１３０を備える、そのようなシステム１００に関する。中央サーバ１０３は、順に、特に第１、第２、第３および／または第４の態様に関して、上述した収集、イベント検出、同期、パターン検出、生成、および公開ステップの少なくともいくつかを実行するように構成され得る。例えば、これらのステップは、上述のような前記ステップを実行するための前記コンピュータソフトウエア機能を実行する中央サーバ１３０によって実行され得る。

【0281】

このような入力ビデオストリームの時間同期、イベントおよび／またはパターン検出などを含む、上述した利用可能な入力ビデオストリームのセットに基づく自動生成の原理は、異なるレベルで同時に適用されてもよいことが理解される。したがって、このような自動生成されたビデオストリームの１つは、ビデオストリームを生成する下流の自動生成機能に対する利用可能な入力ビデオストリームを形成してよい。

【0282】

中央サーバ１３０は、個々の参加者クライアント１２１に対するグループ１２１'、１２１''、１２１'''の割り当てを制御するように構成され得る。例えば、ライブビデオ通信サービスセッションの過程で、特定のそのような参加者クライアントに対するグループ割り当てを動的に変更することは、中央サーバ１３０による当該ビデオ通信サービスの自動生成の一部であってもよい。このような再割当は、所定のタイムテーブルに基づいて、または、例えば、個々の参加者クライアントのユーザ１２２の（当該クライアント１２１を介して提供される）要求に応じて、例えば、時間とともに動的に変化し得るパラメータデータの関数として動的にトリガされ得る。

【0283】

これに対応して、中央サーバ１３０は、ビデオ通信サービスの過程で、所定の時間枠（例えば、予定されているパネル討論の間）だけ特定のグループを使用するなど、グループ構成を動的に変更するように構成されてよい。

【0284】

グループ割り当ての１つの可能な実用的解決手段は、いくつかのビデオ会議システムで利用可能な「ブレイクアウトルーム」の概念を使用することである。特定のグループ１２１'、１２１''、１２１'''に割り当てられた参加者クライアント１２１は、そのようなブレイクアウトルームに割り当てられ、中央サーバ１３０は、次に、中央サーバ１３０における下流の生成ステップで使用するために、個々の一次ビデオストリームまたは生成ビデオストリームなどのビデオストリームデータを、そのブレイクアウトルームから取得することができる。このようなビデオストリームの抽出は、それ自体、上述したように行われ得る。

【0285】

上述のすべての態様において、本発明は、第１のグループの少なくとも１つの参加者クライアント（第１のグループは第１の待ち時間と関連付けられる）が、第２のグループの少なくとも１つの参加者クライアント（第２のグループは第２の待ち時間と関連付けられる）と二方向（双方向）で対話する対話ステップをさらに含んでよく、ここで、第２の待ち時間は第１の待ち時間とは異なる。これらの参加者クライアントはすべて、上述のタイプの１つの同じ通信サービスの参加者であってもよいことが理解される。

【0286】

このような場合、異なる待ち時間（または上述の「タイムゾーン」）に関連付けられる参加者クライアントが、一時的に同じ「タイムゾーン」、言い換えれば、同じ待ち時間に関連付けられることが好ましい。例えば、これは、より大きな待ち時間に一時的に関連付けられている参加者クライアントの１つが、当該参加者クライアントに関連付けられている待ち時間よりも小さな待ち時間を使用して生成されている、１つまたは複数の一次／生成デジタルビデオストリームを一時的に提供されることによって行われてよい。換言すると、より大きな待ち時間を有する１つまたは複数のビデオストリームを通常は継続的に提供されている参加者クライアントが、より小さな待ち時間を有する１つまたは複数のビデオストリームを継続的に提供されている参加者クライアントと対話したい場合、前者の参加者クライアントは、代わりに、後者のビデオストリームの１つまたは複数を一時的に継続的に提供される。したがって、大きい待ち時間の参加者クライアントは、小さい待ち時間の参加クライアントが関連する小さい待ち時間の「タイムゾーン」に一時的に切り替える。対話終了後、大きい待ち時間の参加者クライアントは、対話前に使用していた大きい待ち時間の通信環境に戻る。

【0287】

例えば、上記のパネル討論の聴衆のメンバーが質問を投げかけたいと思うかもしれない。この場合、その聴衆メンバーは発言機会を与えられ、パネル討論の「タイムゾーン」に切り替えられる。つまり、その聴衆は、より小さい遅延時間でパネルを視聴することになるが、あまり凝った演出ではない。より詳細には、聴衆は、対話の間、パネルのメンバーに提供される１つまたは複数の同じビデオストリームを視聴することができる。それ以外の聴衆は、より大きい遅延時間の聴衆の「タイムゾーン」に留まるため、違いに気付くことはない。発言する聴衆メンバーとパネルとの間の対話の後、発言した聴衆は、対話の前と同様に、より大きい待ち時間のビデオストリームまたはストリームを再び提供される。

【0288】

異なる「タイムゾーン」間の切り替えは、中央サーバ１３０によって自動的に実行され得る。

【0289】

以上、好適な実施形態について説明した。しかしながら、本発明の基本的な思想から逸脱することなく、開示された実施形態に多くの変更を加えることができることは、当業者には明らかである。

【0290】

例えば、本明細書で説明するシステム１００の一部として、本明細書では説明しない多くの追加機能を提供することができる。一般に、ここで開示されている解決手段は、ビデオデータのストリームが通信に使用される多種多様な具体的アプリケーションに対応するために、詳細な機能性および特徴を構築することができるフレームワークを提供する。

【0291】

一例としては、デモンストレーションの状況があり、一次ビデオストリームには、プレゼンターのビュー、共有されたデジタルスライドベースのプレゼンテーション、デモンストレーションされる製品のライブビデオが含まれる。

【0292】

別の例としては、教育の状況があり、一次ビデオストリームには、教師の映像、教える対象である物理的実体のライブ映像、質問を投げかけ教師と対話する複数の生徒のライブ映像が含まれる。

【0293】

これら2つの例のいずれにおいても、（システムの一部であってもなくてもよい）ビデオ通信サービスが、一次ビデオストリームの１つまたは複数を提供してよく、および／または、複数の一次ビデオストリームが、本明細書で開示されるタイプの外部ビデオソースとして提供されてよい。

【0294】

多様なグループは、討論パネル、専門家パネル、聴衆として例示された。しかしながら、デジタルビデオ通信サービスにおける参加者ユーザを２つ以上のグループに分けることは、実行される通信の現在の対象および構造を反映して可能である。例えば、１つまたは複数のグループには、異なる地理的位置からビデオ通信サービスに遠隔アクセスする参加者ユーザが含まれ、一方、１つまたは複数の他のグループには、講義室のような共通の中央位置からビデオ通信サービスにアクセスする参加者ユーザが含まれる。このような場合はすべて、上述と同じ原則が適用される。

【0295】

一般に、本方法に関して開示したことはすべて、本システムおよびコンピュータソフトウエア製品に適用可能であり、その逆もまた同様である。

【0296】

したがって、本発明は、記載された実施形態に限定されるものではなく、添付の特許請求の範囲内で種々の変更が可能である。

【図1】