(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2022-04-22
(45)【発行日】2022-05-06
(54)【発明の名称】コンテンツ配信サーバ
(51)【国際特許分類】
H04N 21/854 20110101AFI20220425BHJP
H04N 7/173 20110101ALI20220425BHJP
【FI】
H04N21/854
H04N7/173
(21)【出願番号】P 2022503425
(86)(22)【出願日】2021-09-17
(86)【国際出願番号】 JP2021034436
【審査請求日】2022-01-20
【早期審査対象出願】
(73)【特許権者】
【識別番号】522021468
【氏名又は名称】株式会社TOMODY
(74)【代理人】
【識別番号】100169591
【氏名又は名称】小島 浩嗣
(74)【代理人】
【識別番号】100152630
【氏名又は名称】東 智朗
(72)【発明者】
【氏名】冨森 健史
(72)【発明者】
【氏名】桂 ▲隆▼俊
(72)【発明者】
【氏名】倉内 浩昌
【審査官】古市 徹
(56)【参考文献】
【文献】特開2009-267999(JP,A)
【文献】特開2016-039612(JP,A)
【文献】特開2002-199331(JP,A)
【文献】国際公開第2005/013618(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 21/854
H04N 7/173
(57)【特許請求の範囲】
【請求項1】
ネットワークを介して接続された複数の配信者端末からの配信者動画を受信してストリーミングコンテンツを生成し、視聴者端末に前記ストリーミングコンテンツを配信するコンテンツ配信サーバであって、
前記複数の配信者動画を受信する配信者動画受信部と、
前記複数の配信者動画を一時記憶するバッファ部と、
前記バッファ部内の複数の配信者動画を
一覧表示し、一覧表示された前記複数の配信者動画を対象とする前記ストリーミングコンテンツの編集操作を、前記ネットワークを介して接続された編集者端末か
ら受け付けるための編集画面を生成する編集画面生成部と、
前記編集者端末に前記編集画面を送信し、前記編集者端末から前記編集画面を介して入力された前記編集操作を編集情報として受信する編集情報送受信部と、
前記編集情報に基づいて、前記バッファ部内に保持された前記複数の配信者動画から前記ストリーミングコンテンツを生成するストリーミングコンテンツ生成部と、
前記ネットワークを介して視聴者端末に前記ストリーミングコンテンツを配信するストリーミングコンテンツ配信部と、
を備え、
前記編集情報は、前記ストリーミングコンテンツにおける画面構成と、前記画面構成に配置される前記複数の配信者動画の切替指示を含み、
前記コンテンツ配信サーバは配信者動画記憶手段を有し、
前記配信者動画記憶手段は、前記バッファ部に記憶された前記複数の配信者動画のうちの一部または全部を記憶し、
前記編集情報送受信部は、前記編集者端末により前記編集画面を介して入力されたプレイバック指示を前記編集情報に含めて受信する機能を有し、
前記プレイバック指示は、プレイバック対象となる前記配信者動画記憶手段内の配信者動画の指定と、前記ストリーミングコンテンツにおける切替挿入対象となる前記プレイバック対象動画の時間の範囲の指示を含み、
前記ストリーミングコンテンツ生成部は、受信した前記編集情報に基づいて前記プレイバック指示で指定された前記配信者動画記憶手段内の指定された配信者動画の範囲を用いて前記ストリーミングコンテンツを生成することを特徴とするコンテンツ配信サーバ。
【請求項2】
ネットワークを介して接続された複数の配信者端末からの配信者動画を受信してストリーミングコンテンツを生成し、視聴者端末に前記ストリーミングコンテンツを配信するコンテンツ配信サーバであって、
前記複数の配信者動画を受信する配信者動画受信部と、
前記複数の配信者動画を一時記憶するバッファ部と、
前記バッファ部内の複数の配信者動画を
一覧表示し、一覧表示された前記複数の配信者動画を対象とする前記ストリーミングコンテンツの編集操作を、前記ネットワークを介して接続された編集者端末か
ら受け付けるための編集画面を生成する編集画面生成部と、
前記編集者端末に前記編集画面を送信し、前記編集者端末から前記編集画面を介して入力された前記編集操作を編集情報として受信する編集情報送受信部と、
前記編集情報に基づいて、前記バッファ部内に保持された前記複数の配信者動画から前記ストリーミングコンテンツを生成するストリーミングコンテンツ生成部と、
前記ネットワークを介して視聴者端末に前記ストリーミングコンテンツを配信するストリーミングコンテンツ配信部と、
ジェスチャ認識部を備え、
前記ジェスチャ認識部は、前記バッファ部から受信した前記複数の配信者動画からいずれかの配信者が所定のジェスチャを行ったことを識別し、前記ジェスチャがストリーミングコンテンツにおける切替操作を要求するジェスチャである場合、検知したジェスチャに基づいて前記ストリーミングコンテンツ生成部に編集情報を送信することを特徴とするコンテンツ配信サーバ。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、複数台カメラからの動画像を中継して、複数の視聴者端末にライブストリーミング放送を配信する映像配信サーバに関する。
【背景技術】
【0002】
近年、携帯電話網等のネットワーク環境の充実や撮像装置の普及により、用いる端末の機種や場所を問わずに誰もが動画像によるストリーミング配信を行うことが可能になっている。特にオンラインのビデオ会議システムの発達により、オンラインのビデオ会議システムを用いて、互いに遠隔でネットワークで接続された複数の端末からの撮像動画を中継してストリーミング配信を行うオンライントーク配信やオンラインレッスンなどが行われるようになっている。
【0003】
また一方で、従来のテレビ放送などの映像コンテンツ制作においては、複数のカメラ画像入力に対して切替操作を行い、放送用の映像を出力する装置として、スイッチャーと呼ばれる編集機器が用いられている。
【0004】
特許文献1には、複数カメラによる映像を入力しながら、入力中の複数のカメラ映像データを編集してストリーミング配信をするライブストリーミング放送装置が開示されている。このライブストリーミング放送装置の編集機能の一つとしてスイッチャー機能が提供されている。
【先行技術文献】
【特許文献】
【0005】
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明者は、ネットワーク上に分散する複数の動画像配信者が参加するようなオンライントーク配信やオンラインレッスンなどのライブストリーミング配信を、従来のビデオ会議システムを使って行う場合、映像の編集機能、特にスイッチャー機能を十分に提供することができないという新規の課題を見出した。
【0007】
複数端末からの撮像動画によりストリーミング配信を行う方法としてビデオ会議システムを用いる場合、画面の切替や撮像動画の画面上の配置などは、ビデオ会議システムにて話者の検知による画面切替や画面構成があらかじめ固定されたものから自動で選択されるため、配信者側で任意に画面を切替たり画面構成を変更するなどの番組構成の意図が反映しづらいなどの問題点がある。
【0008】
この問題点を解決するために、従来のテレビ放送用などのスイッチャーを組み合わせた場合には、以下の課題があることがわかった。従来のテレビ放送用などのスイッチャーは、ハードウエア機器として提供されており、複数のカメラからの映像をスイッチャーに集約して接続する必要がある。特許文献1においても映像の入力は複数のカメラから出力をスイッチャーの入力する構成となっている。いずれの構成もネットワークを介して送信された映像の直接入力には対応していないため、前述のような配信者同士が遠隔でネットワークを介して接続されている場合でスイッチングを実現しようとした場合、ネットワーク上の各配信者の端末との通信を中継する端末を配信者ごとに用意し、それらの中継端末を介して映像の入力をしなければならない。そのため機器の構成が大規模になり、機器の設置の手間やコストなどの面から一般のユーザが導入しづらいという問題点がある。また、機器の構成規模の問題からスイッチャーを含む編集機器が物理的に移動しづらいため、スイッチングを担当する編集者と配信者の少なくとも一人が同じ場所から配信したい場合、大規模な編集機材をその配信者が配信をしようとする場所に運搬するか、スイッチング機器を設置している編集者の場所にその配信者が移動するかしなければならず、物理的な制限が生じることになる。
【0009】
本発明の目的は、サーバによる動画編集手段を提供し、ネットワークで接続された複数の配信者動画からストリーミング配信を行う際のコンテンツ編集機能を、物理的な制限を受けることなく、低コストで提供可能な映像配信サーバを提供することである。
【0010】
このような課題を解決するための手段を以下に説明するが、その他の課題と新規な特徴は、本明細書の記述及び添付図面から明らかになるであろう。
【課題を解決するための手段】
【0011】
本発明の一実施の形態によれば、下記の通りである。
【0012】
ネットワークを介して接続された複数の配信者端末からの配信者動画を受信してストリーミングコンテンツを生成し、視聴者端末に前記ストリーミングコンテンツを配信するコンテンツ配信サーバであって、以下の各構成を備える。
複数の配信者動画を受信する配信者動画受信部
複数の配信者動画を一時記憶するバッファ部
バッファ部内の複数の配信者動画を合成し、ネットワークを介して接続された編集者端末からストリーミングコンテンツの編集操作を受け付けるための編集画面を生成する編集画面生成部
編集者端末に編集画面を送信し、編集者端末から編集画面を介して入力された編集操作を編集情報として受信する編集情報送受信部
編集情報に基づいて、バッファ部内に保持された複数の配信者動画からストリーミングコンテンツを生成するストリーミングコンテンツ生成部
ネットワークを介して視聴者端末に前記ストリーミングコンテンツを配信するストリーミングコンテンツ配信部
【発明の効果】
【0013】
前記一実施の形態によって得られる効果を簡単に説明すれば下記のとおりである。
【0014】
本実施形態のコンテンツ配信サーバは、ネットワークで接続された複数の配信者端末からのストリーミングコンテンツ配信時に、ストリーミングコンテンツの編集手段をサーバからソフトウエアとして提供することができる。これにより、従来スイッチャーなどのストリーミングコンテンツ編集機能がハードウエア機器で提供されているために生じていた、配信者や編集者の場所の制限や機器の規模によるセッティングの煩雑さ、コストなどの問題を解消し、誰もが低コストで物理的な制限を受けず、容易に品質の高いストリーミングコンテンツを配信することができるようになる。
【図面の簡単な説明】
【0015】
【
図1】
図1は、実施形態1に係るコンテンツ配信サーバと、それを用いたストリーミングコンテンツ配信方法の機器構成の一例を示す模式図である。
【
図2】
図2は、実施形態1に係るコンテンツ配信サーバの機能構成の一例を示すブロック図である。
【
図3】
図3は、編集画面の一例を示す模式図である。
【
図4】
図4は、編集操作後の編集画面の一例を示す模式図である。
【
図5】
図5は、配信者動画の切替処理のタイムチャートの一例を示す模式図である。
【
図6】
図6は、実施形態2に係るコンテンツ配信サーバの機能構成の一例を示すブロック図である。
【
図7】
図7は、実施形態3に係るコンテンツ配信サーバの機能構成の一例を示すブロック図である。
【発明を実施するための形態】
【0016】
1.実施の形態の概要
先ず、本願において開示される代表的な実施の形態について概要を説明する。代表的な実施の形態についての概要説明で括弧を付して参照する図面中の参照符号はそれが付された構成要素の概念に含まれるものを例示するに過ぎない。
【0017】
〔1〕<動画切替手段を備えたコンテンツ配信サーバ>
本発明の代表的な実施の形態は、ネットワーク(100)を介して接続された複数の配信者端末(2)からの配信者動画を受信してストリーミングコンテンツを生成し、視聴者端末(4)に前記ストリーミングコンテンツを配信するコンテンツ配信サーバ(1)であって、以下の各構成を備える(
図1および
図2)。
複数の配信者動画を受信する配信者動画受信部(11)
前記複数の配信者動画を一時記憶するバッファ部(12)
前記バッファ部内の複数の配信者動画を合成し、前記ネットワークを介して接続された編集者端末(3)からストリーミングコンテンツの編集操作を受け付けるための編集画面を生成する編集画面生成部(13)
編集者端末に前記編集画面を送信し、前記編集者端末から前記編集画面を介して入力された編集操作を編集情報として受信する編集情報送受信部(14)
前記編集情報に基づいて、前記バッファ部内に保持された複数の配信者動画からストリーミングコンテンツを生成するストリーミングコンテンツ生成部(15)
前記ネットワークを介して前記視聴者端末に前記ストリーミングコンテンツを配信するストリーミングコンテンツ配信部(16)
ここで配信者端末(2)とは、撮像装置を有する端末装置を指す。具体的にはスマートフォンや携帯電話、ノートパソコンなどの撮像装置が端末装置と一体となった機器はもちろん、ネットワーク通信機能を備えたデジタルカメラやデジタルカメラが接続されたパソコン端末を含む意味である。また、ネットワーク(100)とは、配信者端末、コンテンツ配信サーバ、編集者端末および視聴者端末とを相互に通信可能に接続するものであり、例えばインターネットあるいは携帯電話網などを指し、その通信は有線通信でも無線通信であってもよい。
【0018】
これにより、ネットワークで接続された複数の配信者動画からストリーミング配信を行う際のコンテンツ編集機能をソフトウエアで提供することができ、配信者および編集者は配信場所の物理的な制限を受けることなく、かつ低コストでストリーミングコンテンツの編集と配信を行うことができる。
【0019】
〔2〕<スイッチャー機能>
〔1〕項のコンテンツ配信サーバ(1)において、前記編集情報は、前記ストリーミングコンテンツにおける画面構成と、前記画面構成に配置される前記複数の配信者動画の切替指示を含む。
【0020】
これにより、コンテンツ配信サーバ(1)は従来ハードウエアで提供されていたスイッチャーの機能をソフトウエアにて提供することができ、配信者および編集者は配信場所の物理的な制限を受けることなく、かつ低コストでストリーミングコンテンツの編集と配信を行うことができる。
【0021】
〔3〕<プレイバック機能>
〔1〕項または〔2〕項のコンテンツ配信サーバは、配信者動画記憶手段(17)をさらに有する。
【0022】
前記配信者動画記憶手段は、前記バッファ部に記憶された前記複数の配信者動画のうちの一部または全部を記憶する。
【0023】
前記編集情報送受信部は、前記編集者端末により前記編集画面を介して入力されたプレイバック指示を前記編集情報に含めて受信する機能をさらに有する。
【0024】
前記プレイバック指示は、プレイバック対象となる前記配信者動画記憶手段内の配信者動画の指定と、前記ストリーミングコンテンツにおける切替挿入対象となる前記プレイバック対象動画の時間の範囲の指示とを含む。
【0025】
前記ストリーミングコンテンツ生成部は、受信した前記編集情報に基づいて前記プレイバック指示で指定された前記配信者動画記憶手段内の指定された配信者動画の範囲を用いて前記ストリーミングコンテンツを生成する。
【0026】
これにより、ストリーミングコンテンツに配信者動画の過去の一部分を配信内容に含めることができる。例えばスポーツなどのオンラインレッスンなどにおいて、配信者であるコーチの動作を即座に振り返り、ストリーミングコンテンツに含まれるよう編集端末から操作でき、ストリーミングコンテンツの内容をより充実させることができる。
【0027】
〔4〕<ジェスチャ機能>
〔1〕項から〔3〕項のうちのいずれか1項のコンテンツ配信サーバはさらに、ジェスチャ認識部(18)を有する。
【0028】
前記ジェスチャ認識部は、前記バッファ部から受信した前記複数の配信者動画からいずれかの配信者が所定のジェスチャを行ったことを識別し、前記ジェスチャがストリーミングコンテンツにおける切替操作を要求するジェスチャである場合、検知したジェスチャに基づいて前記ストリーミングコンテンツ生成部に編集情報を送信する。
【0029】
これにより、配信者は自身の意思で即座に画面の切替操作が可能となる。通常時の画面切替などの編集操作は、コンテンツの番組構成や編集者の裁量で行われるが、配信者の動作によって即座に切り替えられることでより配信者の意思を反映し、かつ視聴者からは臨場感を感じられるストリーミングコンテンツを生成することができる。また、配信者自らが配信者端末あるいは編集端末を操作することなくストリーミングコンテンツの切替編集作業を行うことができ、コンテンツ配信中に配信者の動作が中断されることがない。
【0030】
2.実施の形態の詳細
実施の形態について更に詳述する。
【0031】
〔実施形態1〕
図1は、実施形態1に係るコンテンツ配信サーバを含む、コンテンツ配信システムの構成例を示すブロック図である。
【0032】
図1に示すように、コンテンツ配信サーバ1は、ネットワーク100を介して複数の配信者端末2、編集者端末3に接続され、複数の視聴者端末4にストリーミングコンテンツを配信することができる。
【0033】
配信者端末2は、コンテンツ配信者が動画を撮像し、撮像した動画を、ネットワーク100を介してコンテンツ配信サーバ1に送信するものである。配信者端末2は、撮像機能とネットワーク通信機能を有する端末であり、例えばスマートフォンやカメラ付きの携帯電話、ノートパソコン、通信機能付きのデジタルカメラなどである。また、撮像機能とネットワーク通信機能が別の装置になっていて互いが接続されたものでもよく、デジタルカメラを接続したパソコン等の装置でもよい。
【0034】
編集者端末3は、コンテンツ配信サーバ1から提供される編集画面を表示し、編集者が編集画面を介して入力した編集操作を編集情報としてコンテンツ配信サーバ1に送信するものである。編集者端末3は、ネットワーク100との通信機能を有し、編集画面を表示する表示機能および編集者からの編集操作を受け付ける入力機能を有し、具体的にはタッチ操作可能なタブレットあるいはスマートフォンが好適である。また、表示機能、通信機能、入力機能はそれぞれ別筐体で実現されていてもよく、汎用のパソコンなどの端末でもよい。
【0035】
視聴者端末4は、コンテンツ配信サーバ1から配信されるストリーミングコンテンツを表示、視聴するための端末である。視聴者端末4は、ネットワーク100との通信機能を有し、ストリーミングコンテンツを表示する表示機能を有する。具体的にはスマートフォン、タブレット、ノートパソコン、テレビなどが挙げられる。また、表示機能、通信機能はそれぞれ別筐体で実現されていてもよく、汎用のパソコンなどの端末でもよい。なお、
図1には複数の視聴者端末が例示されているが、1台でもよい。
【0036】
ネットワーク100は、コンテンツ配信サーバ1、配信者端末2、編集者端末3、視聴者端末4を通信可能に接続しており、好適には携帯電話網とインターネットが挙げられるが、LAN(Local Area Network)などの閉じられた通信網でもよい。またその形態は有線、無線に限定されない。
【0037】
<コンテンツ配信サーバの構成>
図2は、コンテンツ配信サーバ1の機能構成の一例を示すブロック図である。コンテンツ配信サーバ1は、配信者動画受信部11と、バッファ部12と、編集画面生成部13と、編集情報送受信部14と、ストリーミングコンテンツ生成部15と、ストリーミングコンテンツ配信部16とを備える。より具体的には、コンテンツ配信サーバ1はインターネットなどのネットワークに接続するためのインターフェースを配信者動画受信部11、編集情報送受信部14、ストリーミングコンテンツ配信部16に備えたデータサーバであればよく、好適にはクラウドサーバーを使って実現される。このとき、配信者動画受信部11、編集情報送受信部14、ストリーミングコンテンツ配信部16等は、クラウドサーバーを構成するコンピュータ上でプログラム(ソフトウェア)を動作させることによって求められる機能が実現されるとよい。
【0038】
配信者動画受信部11は、ネットワーク100を介して複数の配信者端末2から配信者動画を受信する処理を行う。配信者動画受信部11は、複数の配信者端末2から配信者動画を同時にかつ独立して受信することが可能に構成されている。
【0039】
バッファ部12は、配信者動画受信部11にて受信した配信者動画を一時的に所定単位でバッファリングして蓄積する。具体的には、所定時間ごとにバッファ部12内に記録する配信者動画が数秒から数十秒の長さとなるように随時更新しながら蓄積する。
【0040】
編集画面生成部13は、例えば
図3(後述)に示す編集画面5のデータを生成する。編集画面5のデータは、編集画面5の構成を示す編集画面配置情報と、編集画面配置情報で指定された配信者動画をバッファ部12から取得するための撮像者動画取得制御情報とから成る。編集画面情報5は、具体的には、編集画面配置情報がHTML、制御情報がJavaScriptなどのプログラミング言語から構成され、編集者端末3内のブラウザーにて表示、実行される。あるいは、編集者端末3内に編集画面表示用のアプリケーションがインストールされており、所定のプロトコルによる編集画面の情報を生成してもよい。
【0041】
編集情報送受信部14は、編集画面生成部13によって生成された編集画面5を編集者端末3にネットワーク100を介して送信する。また編集画面5に表示する複数の配信者動画を、編集者端末3から撮像者動画取得制御情報に従った要求を受信し、それに基づいて編集者端末3にリアルタイムで送信する。送信される複数の配信者動画は、通信容量を抑制するためにサムネイルサイズに縮小されて送信されるのが好適である。また、編集者端末3において編集者から編集画面を介して入力された前記編集操作を編集者端末3から編集情報として受信する。編集情報とは具体的には、ストリーミングコンテンツにおける配信者動画の画面上の配置情報、表示される配信者動画の切替情報、表示された複数の配信者動画の音声制御情報などである。
【0042】
ストリーミングコンテンツ生成部15は、編集情報送受信部14にて受信した編集情報に基づいてストリーミングコンテンツを作成する。編集情報は、ストリーミングコンテンツにおける配信者動画の画面上の配置情報、表示される配信者動画の切替情報、表示された複数の配信者動画の音声制御情報の情報を含み、ストリーミングコンテンツ生成部15はバッファ部12から配信者動画を取得し、取得した編集情報に基づいて画面上の動画の配置、切替、音声調整を行ってストリーミングコンテンツを作成する。
【0043】
ストリーミングコンテンツ配信部16は、ストリーミングコンテンツ生成部15からストリーミングコンテンツを受信し、ネットワーク100を介して視聴者端末にストリーミングコンテンツを配信する。
【0044】
<編集画面の構成>
図3は、編集者端末3で表示される編集画面5の一例を示す模式図である。編集画面5は前述したように、コンテンツ配信サーバ1の編集画面生成部13によって生成され、編集情報送受信部14からネットワーク100を介して編集者端末3に送信され、編集者端末3の表示画面に表示される。
【0045】
編集者端末3は、複数の配信者動画を編集画面生成部13からリアルタイムで受信して編集画面5として表示する機能を有しており、受信した配信者動画をサムネイル表示部52に一覧表示する。サムネイル表示部52には、リアルタイムに受信した配信者動画のサムネイルが表示され、随時更新される。編集者は、サムネイル表示部52に表示された任意の配信者動画を表示画面へのタッチ操作やマウスカーソルによる選択動作で選択することができ、サムネイル表示部52は入力を受け付ける。選択された配信者動画は
図3に示すように外枠が強調表示され、選択されたことがわかるようになる。なお、配信者動画の選択方法、選択表示方法は一例であり、この構成に限定されるものではない。
【0046】
レイアウト選択部53は、ストリーミングコンテンツの画面構成を選択、指示を受け付ける。本実施形態では、レイアウト選択部53には同時に表示する配信者動画の形式が表示されており、それぞれ1つの撮像者動画を画面のフルサイズで表示するレイアウト、画面を2分割ないし4分割するレイアウトの設定がアイコンにより選択可能となっている。レイアウトはこれに限らず縦2分割、8分割、ワイプインなど他のバリエーションを用意して選択できるようにしてもよい。なお、
図3の例では、1つの配信者動画が1画面での表示が選択され、レイアウト選択部53の該当するアイコンの外枠が強調表示され視認可能となっている。
【0047】
テロップ入力部55は、画面に表示するテロップに対する入力を編集者から受け付ける。本実施形態では図示しないが、テロップの表示個所を指定する入力部やテロップのフォントや色を指定するための入力部がさらに設けられていてもよい。
【0048】
プレビュー表示部51には、サムネイル表示部52、レイアウト選択部53およびテロップ入力部55への編集者の入力結果を反映したストリーミングコンテンツのプレビューが表示される。プレビュー表示には、サムネイル表示部52に表示された複数の配信者動画を適宜配置して合成された動画を表示する。視聴者端末4に配信されるストリーミングコンテンツは、後述する配信サーバでの処理によるものであり、プレビューはストリーミングコンテンツの編集者端末での確認のために生成、表示されるものである。
【0049】
<コンテンツ配信サーバの動作>
次に、コンテンツ配信サーバ1が配信者端末2によって撮像された配信者動画を受け取って、視聴者端末4にストリーミングを配信するまでのコンテンツ配信サーバ1の一連の動作について具体的な例を挙げながら説明する。なお、この具体例は本発明における配信コンテンツの内容、コンテンツ配信サーバ1の動作を説明するための一例であり、配信コンテンツの内容、コンテンツ配信サーバ1の動作を限定するものではない。
【0050】
本実施形態では、配信者らはオンラインでのレッスンをストリーミング配信するものとする。配信者の一人は、レッスンのインストラクターであり、複数の生徒がオンラインでのレッスンを受講している。つまりオンラインレッスンのインストラクターおよび生徒らは配信者であり、オンラインレッスンを配信者端末2にて実施している。配信者端末2はカメラおよび通信機能を備えており、撮像動画を配信者動画としてコンテンツ配信サーバ1に送信する。配信者らのオンラインレッスンによるコミュニケーションは、図示しない既存のビデオ会議システムを利用して行われ、ビデオ会議システムは、コンテンツ配信サーバ1とは別のサーバによって提供されてもよいし、コンテンツ配信サーバ1によって提供されてもよい。
【0051】
オンラインレッスン中の各配信者端末2からの配信者動画は、ビデオ会議システムで利用される撮像動画であり、配信者端末ごとに独立してコンテンツ配信サーバ1に送信される。
【0052】
配信者動画受信部11は、複数の配信者端末2から配信者動画を受信する。配信者動画受信部11は、受信した配信者動画がどの端末から来たかを識別して受信し、識別した情報とともにバッファ部12に記録する。配信者動画の送信元の識別には、配信者端末2に設定されたユーザ情報、ビデオ会議システムで用いられているユーザ名などが好適であるが、配信者端末のIPアドレス、端末名などでもよい。
【0053】
続いて、編集画面生成部13は、
図3に例示する編集画面5のデータを生成する。編集画面5のデータは、あらかじめ編集画面5の構成を示す編集画面配置情報と、編集者端末3から配信者動画をバッファ部12から取得するための撮像者動画取得制御情報とから成る。編集画面5のデータは、具体的には、編集画面配置情報がHTML、撮像者動画制御情報がJavaScriptなどのプログラミング言語から構成され、編集者端末3内のブラウザーにて表示、実行される。あるいは、編集者端末3内に編集画面表示用のアプリケーションがインストールされており、所定のプロトコルによる編集画面の情報を生成してもよい。
【0054】
編集情報送受信部14は、編集画面5のデータを編集者端末3に送信し、編集者端末3は編集画面5のデータを受信し、表示装置に編集画面5を表示する。編集者端末3は編集画面5のデータの撮像者動画取得制御情報に従って、編集情報送受信部14を介してバッファ部12から配信者動画をリアルタイムで受信する。受信した配信者動画は、編集画面5において編集画面配置情報に従って配置し、表示される。また、表示の際には、配信者動画の有する時間情報に従って各動画が同期されるように表示される。また、編集画面配置情報は、初期設定の情報を持つ。例えば本実施形態の場合では、インストラクターの映像が一画面に映っている。
【0055】
編集者は編集画面5により、ストリーミングコンテンツの編集を行う。編集者は、レイアウト選択部53から画面構成を選択する。
図3の例では1画面に1動画のレイアウトが選択されており、レイアウト選択部53から任意の構成を選ぶことにより、プレビュー部51の表示が切替えられる。編集者はレイアウト選択後、各表示個所に表示する動画を選択する。選択は、プレビュー部51の該当箇所を選択し、その個所に表示したい動画をサムネイル表示部52から選択する。また、サムネイル表示部52から表示対象となる動画を選択し、プレビュー部51の該当箇所にドラッグアンドドロップして選択されてもよい。
図4はレイアウトが変更された編集画面5の表示例で、レイアウト選択部53で左右画面分割のレイアウトが選択されハイライト表示され、プレビュー部51の表示が左右2分割されて表示されている。編集者は破線部で示す音量調節部54により表示対象とした動画の音量調節を行う。また、テロップ入力部55によりテロップを編集、挿入することができる。
【0056】
編集者端末3は、編集画面5により編集操作が行われると随時、編集操作の内容を編集情報としてコンテンツ配信サーバ1に送信する。編集情報の内容としては、レイアウト選択部53で選択した画面レイアウト情報、指定した画面レイアウトに表示する配信者動画の指示情報、音量調節指示情報、テロップ情報と、これらの情報のもととなった各編集操作が行われた配信者動画における時間情報とが含まれる。時間情報は、編集者によって編集操作が行われた時刻の情報ではなく、編集画面5のサムネイル表示部52で表示されている配信者動画上の時間軸における編集操作の時間情報である。
【0057】
コンテンツ配信サーバ1は、編集者端末3より送信された編集情報を編集情報送受信部14により受信する。受信された編集情報はストリーミングコンテンツ生成部15に送信される。
【0058】
ストリーミングコンテンツ生成部15は、受信した編集情報に基づいてストリーミングコンテンツを生成する。ストリーミングコンテンツ生成部15は、ストリーミングコンテンツ配信開始時から編集情報の受信の有無によらずリアルタイムにバッファ部12から配信者動画を常時取得し、ストリーミングコンテンツを生成しており、編集情報を受け取ったタイミングで配信者動画の指示情報、音量調節指示情報、テロップ情報およびそれらの操作がなされた時間情報を参照し、バッファ部12から受信する複数の配信者動画に対して編集情報で指示された編集内容を適切なタイミングで適用しながらストリーミングコンテンツを生成する。
【0059】
図5は、編集情報に従ってストリーミングコンテンツが生成される動作のタイムチャートの一例を示す模式図である。横軸の時間は配信開始時からの経過時間であり、各配信者動画が有する時間情報と一致している。換言すると、ストリーミングコンテンツ生成部15は時間情報をもとに各配信者動画を同期処理している。タイムライン503は各配信者動画のストリームを表現しており、配信者端末2の各端末を便宜的に1ないし4の番号で表している。このタイムチャートにおける処理の流れは以下のとおりである。
(1)開始60秒までは初期状態の設定に従い動画1が画面全体に表示される。
(2)編集情報501に基づいて開始60秒の時点で左右2分割の画面にレイアウトが変更され、左側領域に動画1、右側領域に動画3が表示される。
(3)編集情報502に基づいて開始180秒の時点で画面を3分割し、左の領域から順に動画2、動画3、動画4を表示する。
【0060】
なお、このタイムチャートは時間経過と編集操作の関係を示すものであり、バッファ部12に格納された配信者動画が配信時間分保存されていることを示すものではない。バッファ部12には数秒から数十秒程度分の配信者動画が一時記憶され、随時更新される。
【0061】
ストリーミングコンテンツの生成では、バッファ部12への配信者動画の記録の最新時間から2秒程度遅れたタイミングで随時ストリーミングコンテンツの生成を行う。これは編集者端末3への編集画面の送信、編集者端末3での編集画面の表示、編集情報の受信までの一連の処理に時間がかかるため、ストリーミングコンテンツ生成部15での編集情報における時間指定とストリーミングコンテンツ生成のタイミングを同期させるためである。
【0062】
ストリーミングコンテンツ生成部15は、ストリーミングコンテンツを生成し、ストリーミングコンテンツ配信部16へ送信する。ストリーミングコンテンツ配信部16は、ネットワーク100を介して視聴者端末4にストリーミングコンテンツを配信する。
【0063】
本実施形態によれば、ネットワークで接続された複数の配信者動画からストリーミング配信を行う際のコンテンツ編集機能をソフトウエアで提供することができ、配信者および編集者は配信場所の物理的な制限を受けることなく、かつ低コストでストリーミングコンテンツの編集と配信を行うことが可能となる。
【0064】
〔実施形態2〕
本実施形態では、コンテンツ配信サーバ1はさらに動画記憶部(配信者動画記憶手段)17を有し、永続的に配信者動画を保存する。また、編集画面5により、動画記憶部17内の配信者動画の所定の時間範囲を指定することでストリーミングコンテンツに配信者動画の過去動画(プレイバック動画)を含めることができる。
【0065】
図6は本実施形態におけるコンテンツ配信サーバ1の構成例を示すブロック図である。
図2の構成例に動画記憶部17が追加されている。動画記憶部17は、配信者動画を記録し、バッファ部12からリアルタイムに配信者動画を受け取り、追記する形で配信者動画を記録する。バッファ部12は一時的に所定範囲の配信者動画を記録するのに対して、動画記憶部17では配信開始から最新更新分までの配信者動画を継続的に記録し、配信終了後も保持し続ける。動画記憶部17に記憶した配信者動画は、編集画面5内の図示しない指示手段で消去の指示を受け付け、動画記憶部17から消去される。また、ストリーミングコンテンツ配信後所定時間経過後に自動的に消去されてもよい。
【0066】
図3の編集画面5の下部破線で囲まれた領域はプレイバック指示手段550である。編集者端末3は、編集者がプレイバック指示手段550を介して配信者動画の過去の一部分をプレイバック動画としてストリーミングコンテンツに含むよう編集する指示を受け付ける。編集者は、プルダウン552によりプレイバック対象となる配信者撮像撮像動画を選択する。このときプルダウン552には配信者端末におけるユーザ名が表示されて選択可能となっている。プレイバック対象となる動画が選択されると、タイムラインプレビュー領域551に該当する配信者動画が時系列にてサムネイル表示される。時系列の表示は動画の初めから最後まで全体を表示していてもよいし、所定時間前から現在までの範囲や過去の所定の時間範囲で表示してもよい。
【0067】
編集者はタイムラインプレビュー領域551からプレイバック対象となる時間範囲を設定する。設定はタイムラインプレビュー領域551の時間軸範囲をマウスのドラッグアンドドロップやクリック操作などで指定する。
図3の例では7秒から20秒までの範囲が選択されている。時間範囲の選択後、ボタン553を押下することにより、選択した配信者動画の指定範囲がプレイバック対象となったことを表すように、サムネイル画像がストリーミングコンテンツの切替表示候補としてサムネイル表示部52に表示される。本実施形態では時間範囲の最初のフレームの静止画サムネイルが表示されている。プレイバック対象であることを示すためにサムネイルには
図3に示すように「REPLAY」の文字が重畳して表示されている。一方ストリーミングで受信している配信者動画のサムネイルには「LIVE」の文字が重畳されている。このようにストリーミング動画とプレイバック対象の動画が区別できるようにサムネイル部52、プレビュー部51、ストリーミングコンテンツで「LIVE」、「REPLAY」などの文字が重畳して表示されると、視聴者にもどのタイミングでの動画であるのかわかりやすく好適である。
【0068】
編集者は、プレイバック対象の動画を切替え表示したい任意のタイミングで、該当するサムネイル部52内のサムネイル画像をプレビュー部の表示したい箇所にドラッグアンドドロップする。例えば、
図4に示す編集画面において、プレビュー部51の右半分領域に現在Aさんの配信者動画が表示されているが、これに替えてサムネイル部52のBさんのプレイバック動画を表示したい場合は、サムネイル部52のBさんのプレイバック動画のサムネイルをプレビュー部51の右半分領域の所定の位置にドラッグアンドドロップする。これにより、プレビュー部にプレイバック対象の動画がプレビュー部51に表示され、編集情報として、プレイバック対象の動画となる配信者動画の識別情報および時間範囲の指示情報、レイアウト選択部53で選択した画面レイアウト情報、音量調節指示情報、テロップ情報と、これらの情報のもととなった各編集操作が行われた配信者動画における時間情報とが含まれる。
【0069】
ストリーミングコンテンツ生成部15は、受信した編集情報に基づいてストリーミングコンテンツを生成する。生成方法は実施形態1とほぼ同様であるが、プレイバック対象の動画が編集情報内で指定されている場合は、動画記憶部17から指定された配信者動画を取得し、指定された時間範囲の映像を編集情報の切替時間、レイアウトに応じて表示する。
【0070】
ストリーミングコンテンツ生成部15は、配信中は継続的にストリーミングコンテンツを生成し、ストリーミングコンテンツ配信部16へ送信する。ストリーミングコンテンツ配信部16は、ネットワーク100を介して視聴者端末4にストリーミングコンテンツを配信する。
【0071】
本実施形態によれば、リアルタイムのストリーミングコンテンツ配信において、プレイバック用の録画機器や編集機器を別途用意することなく、容易な操作で即時に、配信者動画の過去の場面をさかのぼって切替表示することが可能となる。
【0072】
なお、本実施形態では、動画記憶部(配信者動画記憶手段)17は、永続的に配信者動画を保存する例を示したが、最新の画像から遡って所定の範囲(例えば、時間範囲、または記憶容量によって許容される範囲)にのみを保存するように変更することができる。これにより、記憶容量が抑えられ、また記憶すべき時間の長さ(例えば配信するストリームコンテンツ全体の時間)に依存して使用される記憶容量が変動する問題が解決される。
【0073】
〔実施形態3〕
本実施形態では、コンテンツ配信サーバ1はさらにジェスチャ認識部18を有し、配信者は所定のジェスチャにより動画切替などの編集操作を行うことができる。
【0074】
図7は本実施形態におけるコンテンツ配信サーバ1の構成例を示すブロック図である。本実施形態のコンテンツ配信サーバ1は、ジェスチャ認識部18を有する。
【0075】
ジェスチャ認識部18は、バッファ部12からストリーミングコンテンツ配信中は継続的に配信者動画を受信し、いずれかの配信者動画に写っている配信者が所定のジェスチャを行っているかを検出する。ジェスチャの認識手段は既存の骨格認識モジュールを利用し、所定のジェスチャをあらかじめ学習する。検出したジェスチャがストリーミングコンテンツの編集に関する動作である場合には、検出したジェスチャに基づいて編集情報を生成し、ストリーミングコンテンツ生成部15に送信する。またインタラクティブ性を高めるために、前述の配信者どうしのビデオ会議システム上でもジェスチャ動作に基づいて表示動画切替などの動作をすることが好適である。
【0076】
ジェスチャの例としては、配信者が頭上で両手を交差させて手を振り、自身の配信者動画への切り替えを希望するなどの動作が考えられる。また、画面の四隅のいずれかを手で指し示して手を振るなどのジェスチャを配信者動画の切り替えジェスチャとして、あらかじめ各四隅に対応する切換対象の配信者動画を定義しておき、該当する配信者動画への切り替えを行ってもよい。いずれにしても配信者がストリーミングコンテンツ配信時に行いうる動作とは識別可能なジェスチャを任意に設定することが好適である。
【0077】
編集情報にはジェスチャが行われた時間情報、ジェスチャによって指定された配信者動画の切替情報が含まれ、内容としては編集情報送受信部14から送られる編集情報と共通した内容が含まれる。ストリーミングコンテンツ生成部15は、ジェスチャ認識部18から送信された編集情報に基づいてストリーミングコンテンツを生成する。
【0078】
ストリーミングコンテンツ生成部15には、編集情報が編集情報送受信部14とジェスチャ認識部18の両方から送信されることになるが、特に区別することなく受信した時点で随時編集情報を適用してストリーミングコンテンツを生成してもよいし、いずれかを優先して、例えば数秒の間にジェスチャ認識部18と編集情報送受信部14の両方から編集情報を受信した時には、ジェスチャ認識部18からの編集情報のみを優先して適用するなどとしてもよい。
【0079】
ストリーミングコンテンツ生成部15は、配信中は継続的にストリーミングコンテンツを生成し、ストリーミングコンテンツ配信部16へ送信する。ストリーミングコンテンツ配信部16は、ネットワーク100を介して視聴者端末4にストリーミングコンテンツを配信する。
【0080】
これにより、配信者は自身の意思で即座に画面の切替操作が可能となる。通常時の画面切替などの編集操作は、コンテンツの番組構成や編集者の裁量で行われるが、配信者の動作によって即座に切り替えられることでより配信者の意思を反映し、かつ視聴者からは臨場感を感じられるストリーミングコンテンツを生成することができる。また、配信者自らが配信者端末あるいは編集端末を操作することなくストリーミングコンテンツの切替編集作業を行うことができ、コンテンツ配信中に配信者の動作が中断されることがない。
【0081】
なお、
図7に示した構成例では、コンテンツ配信サーバ1が動画記憶部17を備えるが、動画記憶部17は省略されてもよい。
【0082】
〔実施形態4〕
コンテンツ配信サーバ1は、実施形態3の構成から生成部13および編集情報送受信部14を有さず、編集者端末との接続がない構成となってもよい。ストリーミングコンテンツ配信中の画面切替は配信者のジェスチャのみによって行われる。配信者のジェスチャによる編集操作、ストリーミングコンテンツの生成については実施形態3で述べた方法と同様である。
【0083】
これにより、編集用の端末を用意することなく、より簡易な構成でコンテンツ配信サーバ1を実現することができる。また、配信者自らが配信者端末あるいは編集端末を操作することなくストリーミングコンテンツの切替編集作業を行うことができ、コンテンツ配信中に配信者の動作が中断されることがない。
【0084】
以上本発明者によってなされた発明を実施形態に基づいて具体的に説明したが、本発明はそれに限定されるものではなく、その要旨を逸脱しない範囲において種々変更可能であることは言うまでもない。
【産業上の利用可能性】
【0085】
本発明は、複数台カメラからの動画像を中継して、複数の視聴者端末にライブストリーミング放送を配信する映像配信サーバに利用することができる。
【符号の説明】
【0086】
1 コンテンツ配信サーバ
11 配信者動画受信部
12 バッファ部
13 編集画面生成部
14 編集情報送受信部
15 ストリーミングコンテンツ生成部
16 ストリーミングコンテンツ配信部
17 配信者動画記憶部
18 ジェスチャ認識部
2 配信者端末
3 編集者端末
4 視聴者端末
5 編集画面
501、502 編集情報
503 タイムライン
51 プレビュー部
52 サムネイル表示部
53 レイアウト選択部
54 音量調節部
55 テロップ入力部
550 プレイバック指示手段
551 タイムラインプレビュー領域
552 プルダウン
553 ボタン
100 ネットワーク
【要約】
ストリーミング配信を行う際のコンテンツ編集機能を、物理的な制限を受けることなく、低コストで提供可能なコンテンツ配信サーバを提供する。ネットワークを介して複数の配信者端末からの配信者動画を受信してバッファ部に一時記憶する。バッファ部内の複数の配信者動画を合成して編集画面を生成し、ネットワークを介して接続された編集者端末に送信する。編集者は編集画面により配信者動画の切替選択、画面構成の指示、テロップ入力などの編集操作を行い、編集情報として編集端末からコンテンツ配信サーバへ送信する。コンテンツ配信サーバは、編集情報に基づいて前記バッファ部内の配信者動画からストリーミングコンテンツを生成し、視聴者端末にストリーミングコンテンツを配信する。