特許第6231046号(P6231046)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社ドワンゴの特許一覧

特許6231046動画データ配信管理装置、動画データ配信管理方法、プログラム
<>
  • 特許6231046-動画データ配信管理装置、動画データ配信管理方法、プログラム 図000002
  • 特許6231046-動画データ配信管理装置、動画データ配信管理方法、プログラム 図000003
  • 特許6231046-動画データ配信管理装置、動画データ配信管理方法、プログラム 図000004
  • 特許6231046-動画データ配信管理装置、動画データ配信管理方法、プログラム 図000005
  • 特許6231046-動画データ配信管理装置、動画データ配信管理方法、プログラム 図000006
  • 特許6231046-動画データ配信管理装置、動画データ配信管理方法、プログラム 図000007
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6231046
(24)【登録日】2017年10月27日
(45)【発行日】2017年11月15日
(54)【発明の名称】動画データ配信管理装置、動画データ配信管理方法、プログラム
(51)【国際特許分類】
   H04N 21/2385 20110101AFI20171106BHJP
   H04N 21/2343 20110101ALI20171106BHJP
   H04N 19/40 20140101ALI20171106BHJP
【FI】
   H04N21/2385
   H04N21/2343
   H04N19/40
【請求項の数】7
【全頁数】14
(21)【出願番号】特願2015-126756(P2015-126756)
(22)【出願日】2015年6月24日
(65)【公開番号】特開2017-11574(P2017-11574A)
(43)【公開日】2017年1月12日
【審査請求日】2016年12月27日
【早期審査対象出願】
(73)【特許権者】
【識別番号】598138327
【氏名又は名称】株式会社ドワンゴ
(74)【代理人】
【識別番号】100064908
【弁理士】
【氏名又は名称】志賀 正武
(74)【代理人】
【識別番号】100108578
【弁理士】
【氏名又は名称】高橋 詔男
(74)【代理人】
【識別番号】100108453
【弁理士】
【氏名又は名称】村山 靖彦
(72)【発明者】
【氏名】岩井 二郎
(72)【発明者】
【氏名】小嶋 尚
【審査官】 後藤 嘉宏
(56)【参考文献】
【文献】 特開2013−59048(JP,A)
【文献】 特表2008−533841(JP,A)
【文献】 特表2008−527870(JP,A)
【文献】 国際公開第2014/011720(WO,A1)
【文献】 特表2006−520141(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 21/00−21/858
H04N 19/00−19/98
(57)【特許請求の範囲】
【請求項1】
複数の動画データのそれぞれについて、発生符号量と符号化ひずみとの関係を表す特徴情報を前記動画データがエンコードされた際に得記憶する特徴情報記憶部と、
前記動画データの配信要求を受けた際の要求元の端末装置の視聴環境に応じた動画データを配信するにあたり、前記特徴情報記憶部を参照し、前記動画データの特徴情報が記憶されているか否かを判定するトランスコード制御部と、
前記動画データの特徴情報が記憶されていない場合に、前記動画データを前記視聴環境に応じたデータ形式となるようにエンコードを行ない、その際に得られる特徴情報を前記特徴情報記憶部に記憶するトランスコード部と、
前記動画データのうち複数の配信対象の動画データに対応するそれぞれの前記特徴情報に応じて前記動画データを配信する帯域を割当てる帯域管理部と
を有する動画データ配信管理装置。
【請求項2】
前記特徴情報記憶部は、前記動画データを異なるエンコード条件に従ってエンコードされた際に得られるそれぞれの特徴情報を記憶する
請求項1記載の動画データ配信管理装置。
【請求項3】
前記特徴情報は、前記動画データが複数の区間に分割された当該動画データの各区間のそれぞれをエンコードした際に得られる各特徴情報を基に生成される
請求項1記載の動画データ配信管理装置。
【請求項4】
前記帯域管理部は、配信対象である複数の動画データのそれぞれについて当該動画データの区間毎に対応する特徴情報を参照し、前記動画データを配信する区間が到来する毎に当該区間に対応する特徴情報の組み合わせに応じて前記帯域を割当てる
請求項1記載の動画データ配信管理装置。
【請求項5】
前記動画データ配信管理装置は、さらに、
動画投稿装置から送信される動画データを送信された際のデータ形式のまま記憶する映像信号記憶部を有し、
前記トランスコード部は、前記映像信号記憶部に記憶された動画データを前記視聴環境に応じたデータ形式となるようにエンコードを行ない、その際に得られる特徴情報を前記特徴情報記憶部に記憶する
請求項1から請求項4のうちいずれか1項に記載の動画データ配信管理装置。
【請求項6】
複数の動画データのそれぞれについて、発生符号量と符号化ひずみとの関係を表す特徴情報を前記動画データがエンコードされた際に得記憶する特徴情報記憶部を有する動画データ配信管理装置における動画データ配信管理方法であり、
トランスコード制御部が、動画データの配信要求を受けた際の要求元の端末装置の視聴環境に応じた動画データを配信するにあたり、前記特徴情報記憶部を参照し、前記動画データの特徴情報が記憶されているか否かを判定し、
トランスコード部が、前記動画データの特徴情報が記憶されていない場合に、前記動画データを前記視聴環境に応じたデータ形式となるようにエンコードを行ない、その際に得られる特徴情報を前記特徴情報記憶部に記憶し、
帯域管理部が、前記動画データのうち複数の配信対象の動画データに対応するそれぞれの前記特徴情報に応じて前記動画データを配信する帯域を割当てる
動画データ配信管理方法。
【請求項7】
複数の動画データのそれぞれについて、発生符号量と符号化ひずみとの関係を表す特徴情報を前記動画データがエンコードされた際に得て記憶する特徴情報記憶部を有するコンピュータを、
動画データの配信要求を受けた際の要求元の端末装置の視聴環境に応じた動画データを配信するにあたり、前記特徴情報記憶部を参照し、前記動画データの特徴情報が記憶されているか否かを判定する手段、
前記動画データの特徴情報が記憶されていない場合に、前記動画データを前記視聴環境に応じたデータ形式となるようにエンコードを行ない、その際に得られる特徴情報を前記特徴情報記憶部に記憶する手段、
前記動画データのうち複数の配信対象の動画データに対応するそれぞれの前記特徴情報に応じて前記動画データを配信する帯域を割当てる手段
として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、動画データ配信管理装置、動画データ配信管理方法、プログラムに関する。
【背景技術】
【0002】
動画をストリーミング配信する技術がある(例えば、特許文献1)。このようなストリーミング配信技術を応用したストリーミング配信サービスにおいて、動画提供者からアップロードされた動画を受信側の端末装置の表示画面の大きさや回線状態などの状況に応じて、画像サイズや配信ビットレートの変換を行って配信するサービスもある。このような配信サービスにおいて、個々のビットストリームに、予め決められたビットレートで圧縮される。例えば、ビットストリームAがスタジオで撮影が行われているニュース画像であり、ビットストリームBが動きの激しいアクション映画である場合について考える。この場合、ニュース画像は、時間方向におけるフレームどうしで非常に高い相関があり、MPEG等nの時間方向の相関を用いる圧縮方式の場合、圧縮がしやすいシーケンスであり、比較的低ビットレートで圧縮しても画質の低下が少ない。一方、動きの激しいアクション映画では、動きが大きいため時間方向におけるフレームどうしで相関が高くない。そのため、MPEGの圧縮方式では圧縮がしにくいシーケンスであり、満足な画質を得るためには比較的高いビットレートが必要になる。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2007−215069号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上述の配信システムにおいては、ビットストリーム毎に均一に帯域が割当てられており、そのため、ビットストリームAとビットストリームBについて同じ帯域で配信すると、ストリームAでは必要以上の帯域が確保される一方、ビットストリームBで帯域が不足してしまう問題が生じる。
【0005】
本発明は、このような事情に鑑みてなされたもので、その目的は、動画を配信する帯域の使用効率を向上させることができる動画データ配信管理装置、動画データ配信管理方法、プログラムを提供することにある。
【課題を解決するための手段】
【0006】
上述した課題を解決するために、本発明は、複数の動画データのそれぞれについて、発生符号量と符号化ひずみとの関係を表す特徴情報を前記動画データがエンコードされた際に得記憶する特徴情報記憶部と、前記動画データの配信要求を受けた際の要求元の端末装置の視聴環境に応じた動画データを配信するにあたり、前記特徴情報記憶部を参照し、前記動画データの特徴情報が記憶されているか否かを判定するトランスコード制御部と、前記動画データの特徴情報が記憶されていない場合に、前記動画データを前記視聴環境に応じたデータ形式となるようにエンコードを行ない、その際に得られる特徴情報を前記特徴情報記憶部に記憶するトランスコード部と、前記動画データのうち複数の配信対象の動画データに対応するそれぞれの前記特徴情報に応じて前記動画データを配信する帯域を割当てる帯域管理部とを有する。
また、上述の動画データ配信管理装置において、前記特徴情報記憶部は、前記動画データを異なるエンコード条件に従ってエンコードされた際に得られるそれぞれの特徴情報を記憶する。
【0007】
また、上述の動画データ配信管理装置において、前記特徴情報は、前記動画データが複数の区間に分割された当該動画データの各区間のそれぞれをエンコードした際に得られる各特徴情報を基に生成される。
また、上述の動画データ配信管理装置において、前記帯域管理部は、配信対象である複数の動画データのそれぞれについて当該動画データの区間毎に対応する特徴情報を参照し、前記動画データを配信する区間が到来する毎に当該区間に対応する特徴情報の組み合わせに応じて前記帯域を割当てる。
また、上述の動画データ配信管理装置において、前記動画データ配信管理装置は、さらに、動画投稿装置から送信される動画データを送信された際のデータ形式のまま記憶する映像信号記憶部を有し、前記トランスコード部は、前記映像信号記憶部に記憶された動画データを前記視聴環境に応じたデータ形式となるようにエンコードを行ない、その際に得られる特徴情報を前記特徴情報記憶部に記憶する。
【0008】
また、本発明は、複数の動画データのそれぞれについて、発生符号量と符号化ひずみとの関係を表す特徴情報を前記動画データがエンコードされた際に得記憶する特徴情報記憶部を有する動画データ配信管理装置における動画データ配信管理方法であり、トランスコード制御部が、動画データの配信要求を受けた際の要求元の端末装置の視聴環境に応じた動画データを配信するにあたり、前記特徴情報記憶部を参照し、前記動画データの特徴情報が記憶されているか否かを判定し、トランスコード部が、前記動画データの特徴情報が記憶されていない場合に、前記動画データを前記視聴環境に応じたデータ形式となるようにエンコードを行ない、その際に得られる特徴情報を前記特徴情報記憶部に記憶し、帯域管理部が、前記動画データのうち複数の配信対象の動画データに対応するそれぞれの前記特徴情報に応じて前記動画データを配信する帯域を割当てる動画データ配信管理方法である。
また、本発明は、複数の動画データのそれぞれについて、発生符号量と符号化ひずみとの関係を表す特徴情報を前記動画データがエンコードされた際に得て記憶する特徴情報記憶部を有するコンピュータを、動画データの配信要求を受けた際の要求元の端末装置の視聴環境に応じた動画データを配信するにあたり、前記特徴情報記憶部を参照し、前記動画データの特徴情報が記憶されているか否かを判定する手段、前記動画データの特徴情報が記憶されていない場合に、前記動画データを前記視聴環境に応じたデータ形式となるようにエンコードを行ない、その際に得られる特徴情報を前記特徴情報記憶部に記憶する手段、前記動画データのうち複数の配信対象の動画データに対応するそれぞれの前記特徴情報に応じて前記動画データを配信する帯域を割当てる手段として機能させるためのプログラムである。
【発明の効果】
【0009】
以上説明したように、この発明によれば、動画データをエンコードした際に得られる特徴情報に基づいて、複数の動画データを配信する際の帯域を割り当てるようにした。これにより、動画データの特徴に応じた帯域を割り当てることができるため、データを配信する帯域の使用効率を向上させることができる。
【図面の簡単な説明】
【0010】
図1】本発明の一実施形態による画像配信システム1の構成を示すブロック図である。
図2】動画配信装置5の構成を表す概略ブロック図である。
図3】発生符号量と符号化ひずみとの関係を表す図である。
図4】R−D曲線の生成について説明する図である。
図5】動画配信装置5の動作を説明するフローチャートである。
図6】2つの動画データを配信する場合における使用帯域と配信する経過時間との関係を説明する図である。
【発明を実施するための形態】
【0011】
以下、本発明の一実施形態について図面を参照して説明する。図1は、本発明の一実施形態による画像配信システム1の構成を示すブロック図である。図1に示すように、画像配信システム1は、動画投稿装置3、動画配信装置5、及び端末装置7を備えて構成される。動画配信装置5と複数の端末装置7とは、インターネットなどのネットワーク9により接続される。なお、動画配信装置5と複数の動画投稿装置3の一部または全部が、ネットワーク9により接続されてもよい。
【0012】
動画投稿装置3は、パーソナルコンピュータ、タブレット端末、スマートフォン、通信機能を有する他の機器(例えば、ゲーム機等)などにより実現される。動画投稿装置3は、カメラを内部に備える又は外部に接続することが可能となっており、撮像対象を撮像し、撮像結果に基づく動画データを生成し、動画配信装置5に送信(投稿)する。また、動画投稿装置3は、内部に設けられた記憶領域に記憶された動画データを動画配信装置5に送信(投稿)することもできる。
【0013】
動画配信装置5は、1台以上のサーバコンピュータなどにより実現される。動画配信装置5は、動画投稿装置3から送信された動画データを受信する。動画配信装置5は、動画投稿装置3から受信した動画データを記憶する。また、動画配信装置5は、動画配信要求を端末装置7から受信する。動画配信装置5は、端末装置7から動画配信要求を受信したときは、要求元の端末装置7に要求された動画のビットストリーム(後述)を送信(配信)する。なお、動画配信要求には、要求元の端末装置7を識別する情報(要求元識別情報ともいう)や、要求された動画を識別する情報(動画識別情報ともいう)などが含まれていればよい。
【0014】
端末装置7は、パーソナルコンピュータ、タブレット端末、スマートフォン、通信機能を有する他の機器(例えば、ゲーム機等)などにより実現される。端末装置7は、動画配信要求を動画配信装置5に送信し、動画配信装置5から送信されたビットストリーム(後述)を受信して再生する。なお、動画投稿装置3と端末装置7とは同一の装置であってもよい。即ち、ある装置が、動画投稿装置3、且つ、端末装置7であってもよい。
【0015】
図2は、動画配信装置5の構成を表す概略ブロック図である。
動画データ受信部501は、動画投稿装置3から送信された動画データを受信する。動画データ受信部501は、動画投稿装置3から受信した動画データを、動画データを識別する動画識別情報とともに映像信号記憶部502に記憶する。この動画識別情報は、動画投稿装置3において所定のルールに従って付与されてもよいし、動画配信装置5が、動画投稿装置3の端末を識別する識別情報や受信時刻等を用いて所定のルールに従って付与してもよい。
【0016】
映像信号記憶部502は、動画投稿装置3から送信された動画データを動画識別情報とともに記憶する。ここで記憶される動画データは、動画投稿装置3から送信された動画データのデータ形式(画像サイズ等)のまま記憶される。
配信要求受信部503は、端末装置7から送信される端末装置7を識別する要求元情報と動画識別情報と動画配信要求とを受信する。配信要求受信部503は、端末装置7から動画配信要求を受信したときは、要求元情報と動画識別情報と動画配信要求をトランスコード制御部507に通知する。
【0017】
トランスコード部504は、映像信号記憶部502に記憶された動画データを読み出し、配信要求元の端末装置7が視聴環境に応じたデータ形式にしたビットストリームをビットストリーム配信部505に、要求元情報とともに出力する。トランスコード部504は、配信対象の動画データが最初の配信である場合には、動画投稿装置3から得られた動画データからビットストリームを得るためにエンコードした際に得られる符号化ひずみ(PSNR;Peak signal−to−noise ratio、ピーク信号対雑音比ともいう)と発生符号量との関係を表す情報(以下、RD(Rate−Distorsion)カーブともいう)を特徴情報として取得し、取得した特徴情報を特徴情報記憶部506に記憶する。ここで、最初の配信とは、例えば、動画投稿装置3からライブ配信される場合や、映像信号記憶部502に動画データが記憶された後、端末装置7から配信要求を最初に受信したことに伴う配信である。トランスコード部504は、2回目以降の配信については、特徴情報が既に記憶されている場合、同じ特徴情報について特徴情報記憶部506に記憶しなくてもよい。トランスコード部504は、ライブ配信である場合、ビットストリーム信部505によってビットストリームを配信することができれば、動画データ受信部501が受信した動画データを映像信号記憶部502に記憶した後にエンコードしてもよいし、映像信号記憶部502に記憶することなくエンコードしてもよい。
【0018】
ここで、R−D曲線は、例えば、以下の演算のうち少なくともいずれか1つの演算を行うことで得ることができる。
(1)1つの動画データを異なるビットレートでエンコードした際に、そのビットレートでエンコードされた際における符号化ひずみの平均値と発生符号量の平均値を、エンコードするビットレート毎に得る。この得られた各符号化ひずみの平均値と発生符号量の平均値を、例えばプロットすることで、1つのR−D曲線を得る。ここでは、例えば、1つの動画データを配信サイズHDで異なる3つのビットレートで各端末装置に配信する場合、ビットレートが3種類であるため、3つのサンプルポイントにおいて、符号化ひずみの平均値と発生符号量の平均値とが得られる。この得られた3つのサンプルポイントに対応するようにカーブ(例えば、Logのカーブ)をフィッティングすることで、R−D曲線を得ることができる。
【0019】
(2)1つの動画データには、アクションシーン、出演者の顔のアップ、風景、スポーツを行っているシーン等、複数のシーンが含まれる場合がある。このように、複数のシーンから構成される動画データについては、そのシーン毎に、符号化ひずみの平均値と発生符号量の平均値を求める。これにより、シーンの数の分だけサンプルポイントが得られる。
そして、得られたサンプルポイントに対応するようにカーブをフィッティングすることで、R−D曲線を得る。例えば、動画データが映画等のある程度の長さを持ったシーケンスである場合、一般に多くのシーンチェンジが含まれる。ここでは、シーンチェンジとシーンチェンジの間のシーンは、ある特徴が連続した短いシーケンスとしてとらえることが出来る。このような動画データは、1回目の配信では可変レートでエンコードされるため、シーンごとの量子化値が異なり、多くのサンプルポイントを得ることが出来る。このようにして得られたサンプルポイントに対応するようにカーブをフィッティングすることで、R−D曲線を得ることができる。さらに、得られるサンプルポイントを前記したようなカテゴリー毎のR−D曲線とすることにより、後述するビットレートの決定を柔軟に行える。
【0020】
(3)1つの動画データを異なる画像サイズに変換して配信する場合、例えば、ある動画データについて、第1回目の動画配信をHDで2つのビットレート、SD(Standard definition television)で2つのビットレート、SIF(Source Input Format)で2つのビットレートで行った場合、2つのサンプルポイントを基に生成されるR−D曲線が3つ得られる。この3つのR−D曲線は、サンプルポイントがそれぞれ2つであり、それぞれ1つでは正確さはあまり高くはないが、基本的に同じ動画データから生成されたR−D曲線であるため、同じ傾向を有するR−D曲線となる。そのため、この3つのR−D曲線に、例えば、係数をかける等の処理を行うことで、6つのサンプルポイントに基づく1つのR−D曲線を生成することができる。このように、1つの動画データから異なる画像サイズでのエンコードを行うことで、サンプル数を増やすことができ、R−D曲線の正確さを向上させることができる。
【0021】
上述した(1)〜(3)の演算については、いずれか1つ、あるいは複数を任意に組み合わせることで、R−D曲線を得ることができる。また、このようなR−D曲線を得ることで、符号化ひずみと生符号量との対応関係を把握することができる。
R−D曲線は正確であるほど、量子化値と発生符号量と、画像の歪み(エンコード後の画像がエンコード前の画像に比べてどの程度劣化するか)の関係をより正確に把握することが可能となる。これらの関係は、動画データの内容(動画全体がアニメである、動きの多いスポーツである、全体的に風景が多い等)によって傾向が異なる。
【0022】
図3は、R−D曲線の一例を表す図である。この図において、縦軸は符号化ひずみDであり、横軸は発生符号量Rである。符号化ひずみと発生符号量との関係は、発生符号量が増えると符号化ひずみの値は減る関係にある。また、発生符号量がある程度増大すると、符号化ひずみの減少は緩やかになる。ここで、曲線100、200、300は、1つの動画データを異なるである条件C1、C2、C3でエンコードした場合における関係を表す。条件としては、例えば、変換後の画像サイズである。
【0023】
例えば、条件C1(曲線100)と条件C2(曲線200)とを比較すると、発生符号量が同じ(例えばA1)である場合には、条件C1における符号化ひずみがB1であり、条件C2における符号化ひずみがB2(B1>B2)であり、条件C2の方が、画質の低下が少ない。また、例えば、条件C1の代わりに条件C2を用いる場合、発生符号量をA1からA2まで減らしたとしても、符号化ひずみはB1のままであるため、符号発生量を抑えつつ、画質の低下を抑えることができる。
【0024】
図4は、R−D曲線の生成について説明する図である。図4(a)は、複数のシーンを有する動画データについて発生符号量と時間(経過フレーム)との関係を表す図、図4(b)は、発生符号量と符号化ひずみとの関係を表す図である。1つの動画データについて、発生符号量と符号化ひずみについて、その動画データ全体を対象として平均値を得ることで、R−D曲線を生成することができるが、そうすると、サンプルポイント数が十分でない場合がある。
このような場合には、例えば、動画データが映画等のある程度の長さを持ったシーケンスである場合、一般に、多くのシーンチェンジが含まれる。そして、シーンチェンジとシーンチェンジの間のシーンは、1つの短いシーケンスとしてとらえることが出来る。このような動画データは、1回目の配信では可変レートでエンコードされるため、シーンごとの量子化値が異なり、多くのサンプルポイントを得ることが出来る。また、動画データを5秒毎など、一定時間単位で時間を区切ることによって、多くのサンプル数を得るようにすることも可能である。このようにすることで、図4(b)に示すように、R−D曲線を得るようにしてもよい。
【0025】
ビットストリーム配信部505は、トランスコード部504から供給されたビットストリームを要求元情報に対応する端末装置7に送信する。
【0026】
特徴情報記憶部506は、複数の動画データのそれぞれについて、トランスコード部504によってエンコードされた際に得られるR−D曲線を表す特徴情報を動画識別情報とともに記憶する。特徴情報記憶部506は、動画データを異なるエンコード条件に従ってエンコードされた際に得られるそれぞれの特徴情報を記憶する。エンコード条件としては、例えば、動画の解像度を用いる場合、SD、HD、SIF等の、異なる解像度である。また、エンコード条件としては、例えば、画像サイズを用いることができる。このような特徴情報は、前記動画データが複数の区間に分割された当該動画データの各区間のそれぞれをエンコードした際に得られる各特徴情報を基に生成される。また、特徴情報としては、特徴情報(R−D曲線)を生成した際に得られる量子化値と発生符号量との関係についても記憶する。また、特徴情報としては、動画データがエンコードされる際のシーケンスのフレームと、ピクチャタイプ(Iピクチャ、Pピクチャ、Bピクチャ)も対応づけて記憶することもできる。なお、マクロブロックレイヤー以下の情報(ベクター情報、マクロブロックモードを表すモード情報)については、2回目以降の配信の際には計算し直すため、必ずしも特徴情報として記憶しなくてもよいが、記憶した場合には、2回目以降の配信の際に参照してエンコードすることもできる。
【0027】
トランスコード制御部507は、動画データのうち複数の配信対象の動画データに対応するそれぞれの特徴情報に応じて動画データを配信する帯域を割当てる。
【0028】
次に、動画配信装置5の動作について、図5のフローチャートを用いて説明する。ここでは、動画投稿装置3から動画データが送信されると、その都度、動画データ受信部501が動画データを受信して映像信号記憶部502に記憶に記憶する。
動画配信装置5の配信要求受信部503が端末装置7から動画識別情報、要求元情報、配信要求を受信すると(ステップS101)、トランスコード制御部507は、特徴情報記憶部506を参照し、配信要求された動画の動画識別情報に対応する特徴情報が記憶されているか否かを判定する(ステップS102)。特徴情報が特徴情報記憶部506に記憶されていない場合、トランスコード制御部507は、トランスコード部504に、動画識別情報と要求元情報を出力するとともに動画データのエンコードを指示する。トランスコード部504は、エンコードの指示に基づいて、動画識別情報に対応する動画データをエンコードしてビットストリームを生成する(ステップS103)。このビットストリームを生成する際、例えば、複数種類の画像サイズについてエンコードしたり、異なる画質についてエンコードする等、複数の条件でそれぞれエンコードを行う。このとき、トランスコード部504は、ビットストリームを生成する際に動画の解析をすることによって得られる、R−D曲線を特徴情報として動画識別情報とともに特徴情報記憶部506に記憶する(ステップS104)。ここでは、各種条件に従ったエンコードを行う場合、目的の画像サイズであり目的の画質となるようにエンコードすることもできる。そして、各種条件において、動画データ全体のPSNRの平均値、発生符号量の平均値を算出することで、R−D曲線を生成する。ここでは、例えば、上述の(1)〜(3)のうち少なくともいずれか1つの算出方法を用いてR−D曲線を得る。なお、目的の画像サイズの動画データを生成するためのエンコードを行う際、目的の画像サイズよりも小さな画像サイズである縮小画像も得ることもできるため、この縮小画像に基づくベクター情報とモード情報とを得ることで、互いに異なる画像サイズのそれぞれの特徴情報を得ることができる。
【0029】
そして、トランスコード部504は、トランスコード制御部507は、ステップS103において得られる動画の解析結果に基づいてエンコードし、エンコードされた動画データを所定のビットレートで配信するようにビットストリーム配信部505に指示する。ビットストリーム配信部505は、所定のビットレートで送信する(ステップS105)。
ここでの所定のビットレートは、ビットストリーム信部から他の動画データの配信がされていないため、ビットストリーム信部505が配信可能な全帯域のうち、任意の帯域を割り当てることで、この帯域内で配信可能なビットレートが所定のビットレートとして割り当てられる。例えば、最も高いビットレートを割り当てることもできる。ビットストリーム配信部505は、割り当てられたビットレートに従い、動画データを端末装置7に配信する。
【0030】
一方、ステップS102において、特徴情報が格納されている場合、トランスコード制御部507は、受信している動画の配信要求が複数であるかを判定し(ステップS106)、受信している動画の配信要求が複数である場合には、配信要求されている他の動画データの特徴情報を取得する(ステップS107)。そして、トランスコード制御部507は、配信要求されているそれぞれの動画の特徴情報に基づいて、ビットストリーム配信部505が配信可能な帯域幅に収まるように、動画データ配信の進行に合ったビットレートをそれぞれの動画データに対して決定する(ステップS108)。このビットレートを決定する場合、数理計画法に従って決定することもできる。ここで数理計画法を適用する場合、制約条件を画質向上優先(PSNRが所定値以上となる制約)や、帯域削減優先(トータルのビットレートを削減する)といった制約条件で最適化問題を解くことにより、再エンコードに使う量子化値など具体的なエンコードパラメータを決定することができる。
【0031】
そして、トランスコード制御部507は、それぞれの動画データに対し、決定されたビットレートに応じた量子化値を決定し(ステップS109)、決定された量子化値に従って、映像信号記憶部502に記憶されたそれぞれの動画データを読み出してエンコードし、要求元情報に対応するそれぞれの端末装置7に配信する(ステップS110)。
【0032】
一方、トランスコード制御部507は、ステップS106において、動画の配信要求が一つである場合には、その配信要求されている動画の特徴情報に基づいて、ビットストリーム配信部505が配信可能な帯域幅に収まるように、動画データ配信の進行に合ったビットレートを動画データに対して決定し(ステップS111)、ステップS109に移行する。
【0033】
なお、上述したフローチャートにおいて、配信対象の動画データが複数であって、そのうち少なくとも1つの動画データについて特徴情報が記憶されていない場合には、配信対象である動画データのそれぞれに対し、ビットレートを均等に割り当てて配信しておき、各動画データの特徴情報が記憶されている場合に、ステップS107以降のように、各特徴情報に基づいてビットレートを割り当てるようにしてもよい。
【0034】
例えば、第1回目の動画データの配信において、第1シーケンスから第3シーケンスまでの3つの動画データをそれぞれ目標ビットレート200Kbpsで配信する場合において、画質向上を優先する制約条件に基づいて帯域幅を割り当てる場合について説明する。また、ここでは、第1シーケンスは、比較的動きが少なくコンコードの負荷が比較的軽い内容であり、第2シーケンスは、第1シーケンスに比べて動きが多くエンコードも多少重い内容であり、第3シーケンスは、この3つのシーケンスの中で最も動きが多くエンコードも重い内容であるものとして説明する。そして、第1シーケンスの時刻Tでの情報が量子化値Q=Q1、PSNR=PSNR1、ビットレート=200Kbpsであり、シーケンス2の時刻Tでの情報が量子化値Q=Q2(Q1<Q2)、PSNR=PSNR2(PSNR1>PSNR2)、ビットレート=210Kbpsであり、シーケンス3の時刻Tでの情報が量子化値Q=Q3(Q2<Q3)、PSNR=PSNR3(PSNR2>PSNR3)、ビットレート=230Kbpsであるとする。
【0035】
この場合、第1シーケンスは、エンコードが簡単なわりに配信帯域を200Kbps分利用しており、必要以上に画質を確保するような条件(PSNR=PSNR1であり、第2シーケンス、第3シーケンスのPSNRよりも大きい)にて配信してしまうと、第2シーケンス、第3シーケンスは、第1シーケンスよりもエンコードが難しいので、目標ビットレートの200Kbpsに近づけるためには、量子化値を上げて画質を低減(第2シーケンス及び第3シーケンスのPSNRはいずれも第1シーケンスより小さい)させて配信しなければならない。
【0036】
このような動画データの配信を、上述の特徴情報を用いて使用帯域を割り当てる場合、第1シーケンスを量子化値Q=Q4、PSNR=PSNR4、ビットレート=100Kbps、第2シーケンスを量子化値Q=Q5(例えばQ5≒Q4)、PSNR=PSNR5(PSNR4≒PSNR5)、ビットレート=238Kbps、第3シーケンスを量子化値Q=Q6(例えばQ6≒Q4)、PSNR=PSNR6(PSNR6≒PSNR4)、ビットレート=258Kbpsという結果を、ビットレートの総和が帯域の制限を超えないという制約条件の下でPSNRのばらつきを最小化する問題として定式化し、解を数理計画法に従って導き出し、この条件に従って配信することにより、トータルの発生符号量を抑えつつ、ある程度の画質を保った配信を行うことができる。例えば、ある一定以上の画質である場合、一般に、視聴者は、それ以上画質を高くしたとしても、その画質の差異は認識しにくい。そこで、ある程度の画質を確保できる場合には、それ以上に画質を向上させず、その分、他の画質が低いシーケンスの画質を向上されるように帯域を割り当てることで、動画配信の品質を向上させることができる。
また、制約条件として、「ビットレートの総和が帯域の制限を超えない」という内容を適用したが、これ以外を適用することもできる。また、「PSNRのばらつきを最小化する問題」として定式化したが、制約条件に対応した他の内容であってもよい。
また、この例では第1シーケンス、第2シーケンス、第3シーケンスを配信する場合について説明したが、一度特徴情報が得られたシーケンスであれば、第1回目の送信とは別の組み合わせ(例えば、第1シーケンス1、第4シーケンス、第7シーケンス)であっても、その状況に応じた最適な配信条件を導き出すことができる。
【0037】
なお、制約条件を帯域削減優先として求める場合、例えば、上述した第1シーケンス、第2シーケンス、第3シーケンスのうち、第1シーケンスについては、動画データの内容に対して配信帯域が必要以上に高いため、ビットレートを下げ、第2シーケンス、第3シーケンスについては、例えばビットレートを維持する。第1シーケンスのビットレートをどの程度下げればよいかについては、R−D曲線を用いることで算出することができる。これにより、第2シーケンス、第3シーケンスの画質を維持しつつ、帯域削減をすることができる。
【0038】
図6は、2つの動画データを配信する場合における使用帯域と配信する経過時間との関係を説明する図である。図6(a)は、上述の実施形態における動画配信装置5を用いない場合における、使用帯域と経過時間との関係を表す。この図6(a)では、動画データA1と動画データB1について、経過時間が経過したとしても、使用する帯域は、継続的に均等に割り当てられている。このため、動画データA1と動画データB1については、それぞれ、割り当てられた帯域に収まるようなビットレートで配信される。このため、動画データA1が、例えばニュース番組等の動きが少ない内容の動画データであり、ビットレートがある程度低くても問題ない場合であっても、このビットレートに対して余裕のある帯域幅が割り当てられる。一方、動画データB1がアクション映画等の動きが多い内容の動画データであり、ビットレートがある程度高い方が好ましい場合であっても、このビットレートに対して帯域が不足してしまう。
【0039】
これに対し、上述した動画配信装置5を用いる場合、図6(b)に示すように、動画データA2と動画データB2について、経過時間に応じた使用帯域が割り当てられる。これにより、例えば、経過時間t1において、動画データA2が動きの少ないシーンであり、動画データB2が動きの多いシーンである場合には、動画データA2よりも動画データB2に対して広い帯域が割り当てられる。これにより、動画データB2については、動画データA2よりも広い帯域を利用することで、高いビットレートでの配信を行うことができる。また、経過時間t2において、動画データA2が動きの多いシーンであり、動画データB2が動きの少ないシーンである場合には、動画データB2よりも動画データA2に対して広い帯域が割り当てられる。これにより、動画データA2については、動画データB2よりも広い帯域を利用することで、高いビットレートでの配信を行うことができる。
以上説明した実施形態においては、ビットストリームが2つである場合について説明したが、3つ以上を配信する際に用いることもできる。
【0040】
なお、以上説明した実施形態によれば、ある幅の配信帯域で複数の動画像ビットストリームを配信する場合、ビットストリーム毎に同じ帯域を割り当てたとき、同時刻に配信される動画像ビットストリームは、画像の圧縮難易度が異なることによるビットレートが無駄に使用されてしまうこと防ぐことができ、同時に配信される複数のビットストリーム間で帯域を画像の難易度によって都合することにより、画質や帯域の削減を行うことができる。
【0041】
なお、上述した実施形態において、発生符号量のコントロールを正確に行うためには、量子化値と発生ビット量とを対応付けた情報も特徴情報として記憶するようにしてもよい。この量子化値と発生符号量とを対応づけた情報は、例えば、動画データをエンコードした際に、R−D曲線が得られるが、そのエンコードを行った際に得られる発生符号量に対応した量子化値を用いることで生成することができる。そして得られた量子化値を用いて、量子化値を増加あるいは減少させた場合における符号化ひずみと発生符号量とを得ることで、目的の符号発生量に近づけた符号発生量を決めることができる。
【0042】
上述した実施形態における動画配信装置5をコンピュータで実現するようにしてもよい。その場合、この機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよく、FPGA(Field Programmable Gate Array)等のプログラマブルロジックデバイスを用いて実現されるものであってもよい。
【0043】
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
【符号の説明】
【0044】
1…画像配信システム、3…動画投稿装置、5…動画配信装置、7…端末装置、9…ネットワーク、501…動画データ受信部、502…映像信号記憶部、503…配信要求受信部、504…トランスコード部、505…ビットストリーム配信部、506…特徴情報記憶部、トランスコード制御部
図1
図2
図3
図4
図5
図6