特許6275906 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社　ディー・エヌ・エーの特許一覧

特許6275906動画コンテンツを再生するためのプログラム及び方法、並びに、動画コンテンツを配信及び再生するためのシステム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B1)

(11)【特許番号】6275906

(24)【登録日】2018年1月19日

(45)【発行日】2018年2月7日

(54)【発明の名称】動画コンテンツを再生するためのプログラム及び方法、並びに、動画コンテンツを配信及び再生するためのシステム

(51)【国際特許分類】

H04N 21/439 20110101AFI20180129BHJP

【ＦＩ】

H04N21/439

【請求項の数】7

【全頁数】13

(21)【出願番号】特願2017-142130(P2017-142130)

(22)【出願日】2017年7月21日

【審査請求日】2017年10月14日

【早期審査対象出願】

(73)【特許権者】

【識別番号】599115217

【氏名又は名称】株式会社ディー・エヌ・エー

(74)【代理人】

【識別番号】100125195

【弁理士】

【氏名又は名称】尾畑雄一

(72)【発明者】

【氏名】小原隆郎

【審査官】冨田高史

(56)【参考文献】

【文献】特開２０１６−６３５３４（ＪＰ，Ａ）

【文献】特開２０１１−１３６２０（ＪＰ，Ａ）

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｈ０４Ｎ７／１０

７／１４ − ７／１７３

７／２０ − ７／５６

２１／００ − ２１／８５８

(57)【特許請求の範囲】

【請求項1】

ストリーミング方式で配信される動画コンテンツを再生するためのプログラムであって、
コンピュータ上での実行に応じて、前記コンピュータに、
前記動画コンテンツが分割されたファイルである分割ファイルを順に受信して蓄積する処理と、
蓄積された複数の分割ファイルの各々から映像データ及び音声データを分離する処理と、
分離された複数の映像データを１つの映像データに結合して再生する処理と、
分離された複数の音声データを順に再生する処理と、を実行させ、
前記音声データを再生する処理は、前記分離された複数の音声データの接合部分におけるノイズを除去することを含む、
プログラム。

【請求項2】

前記映像データ及び音声データを分離する処理は、所定の再生時間分の複数の分割ファイルが蓄積されたときに、蓄積された前記所定の再生時間分の複数の分割ファイルの各々から映像データ及び音声データを分離することを含む、
請求項１のプログラム。

【請求項3】

前記分割ファイルは、第１の形式を有するコンテナファイルであり、
前記映像データを再生する処理は、結合後の前記１つの映像データを、前記第１の形式とは異なる第２の形式を有するコンテナファイルに格納して再生することを含む、
請求項１又は２のプログラム。

【請求項4】

前記音声データを再生する処理は、前記分離された複数の音声データの接合部分を基準とした所定の時間的範囲の音声波形を補正することによってノイズを除去することを含む、
請求項１ないし３何れかのプログラム。

【請求項5】

前記音声データを再生する処理は、前記所定の時間的範囲に含まれる音声データの中から設定された始点、終点、及び、１又は複数の制御点に基づく曲線補間によって音声波形を補正することを含む、
請求項４のプログラム。

【請求項6】

コンピュータによって実行され、ストリーミング方式で配信される動画コンテンツを再生するための方法であって、
前記動画コンテンツが分割されたファイルである分割ファイルを順に受信して蓄積するステップと、
蓄積された複数の分割ファイルの各々から映像データ及び音声データを分離するステップと、
分離された複数の映像データを１つの映像データに結合して再生するステップと、
分離された複数の音声データを順に再生するステップと、を備え、
前記音声データを再生するステップは、前記分離された複数の音声データの接合部分におけるノイズを除去することを含む、
方法。

【請求項7】

動画コンテンツをストリーミング方式で配信するサーバと、配信される前記動画コンテンツを再生するクライアントと、を備えるシステムであって、
前記サーバは、
前記クライアントからの要求に応答して、前記動画コンテンツが分割されたファイルである分割ファイルを順に送信する処理を実行し、
前記クライアントは、
前記サーバが送信する分割ファイルを順に受信して蓄積する処理と、
蓄積された複数の分割ファイルの各々から映像データ及び音声データを分離する処理と、
分離された複数の映像データを１つの映像データに結合して再生する処理と、
分離された複数の音声データを順に再生する処理と、を実行し、
前記音声データを再生する処理は、前記分離された複数の音声データの接合部分におけるノイズを除去することを含む、
システム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、ストリーミング方式で配信される動画コンテンツを再生するためのプログラム及び方法、並びに、こうした動画コンテンツを配信及び再生するためのシステムに関するものである。

【背景技術】

【0002】

従来、動画コンテンツの配信方式の１つとして、ＨＴＴＰプロトコルを使用したストリーミング方式であるＨＴＴＰＬｉｖｅＳｔｒｅａｍｉｎｇ（以下、「ＨＬＳ」と言うことが有る。）及びＭＰＥＧ−ＤＡＳＨ等が知られている。これらの方式では、動画コンテンツは、サーバにおいて数秒分の動画ファイルに分割（断片化）され、当該分割された動画ファイルは、クライアントにおいて順にダウンロード及び再生される。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特開２０１１−１７２２００号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

しかしながら、上述した方式では、分割された動画ファイルのデータサイズが大きいと、そのダウンロードの際のネットワークの遅延が生じやすくなる。こうした遅延を低減するために、例えば、１つの動画ファイルの再生時間を短くする（動画コンテンツをより細かく分割する）ことにより、動画ファイルのデータサイズを小さくすることが考えられる。しかしながら、動画ファイルの再生時間を短くすると、クライアントにおける動画ファイルに対する処理の頻度が増加し、当該処理に起因するオーバーヘッドが大きくなり、この結果、クライアント側での遅延が生じてしまう。例えば、ライブ動画の視聴者がコメントを入力できるように構成されたライブ動画の配信サービス等においては、上述したネットワーク及びクライアントにおける遅延が、視聴者及び配信者間での円滑なコミュニケーションを阻害し、ユーザ体験の悪化をもたらし得る。

【0005】

本発明の実施形態は、動画コンテンツの配信における遅延を低減することを目的の一つとする。本発明の実施形態の他の目的は、本明細書全体を参照することにより明らかとなる。

【課題を解決するための手段】

【0006】

本発明の一実施形態に係るプログラムは、ストリーミング方式で配信される動画コンテンツを再生するためのプログラムであって、コンピュータ上での実行に応じて、前記コンピュータに、前記動画コンテンツが分割されたファイルである分割ファイルを順に受信して蓄積する処理と、蓄積された複数の分割ファイルの各々から映像データ及び音声データを分離する処理と、分離された複数の映像データを１つの映像データに結合して再生する処理と、分離された複数の音声データを順に再生する処理と、を実行させ、前記音声データを再生する処理は、前記分離された複数の音声データの接合部分におけるノイズを除去することを含む。

【0007】

本発明の一実施形態に係る方法は、コンピュータによって実行され、ストリーミング方式で配信される動画コンテンツを再生するための方法であって、前記動画コンテンツが分割されたファイルである分割ファイルを順に受信して蓄積するステップと、蓄積された複数の分割ファイルの各々から映像データ及び音声データを分離するステップと、分離された複数の映像データを１つの映像データに結合して再生するステップと、分離された複数の音声データを順に再生するステップと、を備え、前記音声データを再生するステップは、前記分離された複数の音声データの接合部分におけるノイズを除去することを含む。

【0008】

本発明の一実施形態に係るシステムは、動画コンテンツをストリーミング方式で配信するサーバと、配信される前記動画コンテンツを再生するクライアントと、を備えるシステムであって、前記サーバは、前記クライアントからの要求に応答して、前記動画コンテンツが分割されたファイルである分割ファイルを順に送信する処理を実行し、前記クライアントは、前記サーバが送信する分割ファイルを順に受信して蓄積する処理と、蓄積された複数の分割ファイルの各々から映像データ及び音声データを分離する処理と、分離された複数の映像データを１つの映像データに結合して再生する処理と、分離された複数の音声データを順に再生する処理と、を実行し、前記音声データを再生する処理は、前記分離された複数の音声データの接合部分におけるノイズを除去することを含む。

【発明の効果】

【0009】

本発明の様々な実施形態は、動画コンテンツの配信における遅延を低減する。

【図面の簡単な説明】

【0010】

【図1】本発明の一実施形態に係る動画配信システム１のネットワークの構成を概略的に示す構成図。

【図2】動画配信システム１の機能を概略的に示すブロック図。

【図3】動画配信システム１の具体例を説明するための図。

【図4】ユーザ端末３０において実行される処理を例示するフロー図。

【図5】ＴＳファイルが分離される様子を模式的に示す図。

【図6】映像ストリーム及び音声ストリームを個別に処理して再生する方法を模式的に示す図。

【図7】ＰＣＭデータの接合部分におけるノイズを除去する処理を説明するための図。

【発明を実施するための形態】

【0011】

以下、図面を参照しながら、本発明の実施形態について説明する。

【0012】

図１は、本発明の一実施形態に係る動画配信システム１のネットワークの構成を概略的に示す構成図である。動画配信システム１は、図示するように、動画配信サーバ１０と、当該動画配信サーバ１０とインターネット等のネットワーク２０を介して通信可能に接続されたユーザ端末３０（クライアント）とを備える。図１においては、１つのユーザ端末３０のみが図示されているが、動画配信システム１は、複数のユーザ端末３０を備える。動画配信サーバ１０は、ユーザ端末３０に動画コンテンツを配信する動画配信サービスを提供する。

【0013】

動画配信サーバ１０は、一般的なコンピュータとして構成されており、図１に示すように、ＣＰＵ（コンピュータプロセッサ）１１と、メインメモリ１２と、ユーザＩ／Ｆ１３と、通信Ｉ／Ｆ１４と、ストレージ（記憶装置）１５とを備え、これらの各構成要素が図示しないバス等を介して電気的に接続されている。

【0014】

ＣＰＵ１１は、ストレージ１５等に記憶されている様々なプログラムをメインメモリ１２に読み込んで、当該プログラムに含まれる各種の命令を実行する。メインメモリ１２は、例えば、ＤＲＡＭ等によって構成される。

【0015】

ユーザＩ／Ｆ１３は、ユーザとの間で情報をやり取りするための各種の入出力装置を含む。ユーザＩ／Ｆ１３は、例えば、キーボード、ポインティングデバイス（例えば、マウス、タッチパネル等）等の情報入力装置、マイクロフォン（マイク）等の音声入力装置、カメラ等の画像入力装置を含む。また、ユーザＩ／Ｆ１３は、ディスプレイ等の画像出力装置、スピーカー等の音声出力装置を含む。

【0016】

通信Ｉ／Ｆ１４は、ネットワークアダプタ等のハードウェア、各種の通信用ソフトウェア、及びこれらの組み合わせとして実装され、ネットワーク２０等を介した有線又は無線の通信を実現できるように構成されている。

【0017】

ストレージ１５は、例えば磁気ディスク、フラッシュメモリ等によって構成される。ストレージ１５は、オペレーティングシステムを含む様々なプログラム、及び各種データ等を記憶する。

【0018】

本実施形態において、動画配信サーバ１０は、それぞれが上述したハードウェア構成を有する複数のコンピュータを用いて構成され得る。例えば、動画配信サーバ１０は、１又は複数のサーバ装置によって構成され得る。

【0019】

このように構成された動画配信サーバ１０は、ウェブサーバ及びアプリケーションサーバとしての機能を有し、ユーザ端末３０にインストールされているウェブブラウザ及びその他のアプリケーション（例えば、動画配信サービス用のアプリケーション）からの要求に応答して各種の処理を実行し、当該処理の結果に応じた画面データ（例えば、ＨＴＭＬデータ）及び制御データ等をユーザ端末３０に送信する。ユーザ端末３０では、受信したデータに基づくウェブページ又はその他の画面が表示される。

【0020】

ユーザ端末３０は、一般的なコンピュータとして構成されており、図１に示すように、ＣＰＵ（コンピュータプロセッサ）３１と、メインメモリ３２と、ユーザＩ／Ｆ３３と、通信Ｉ／Ｆ３４と、ストレージ（記憶装置）３５とを備え、これらの各構成要素が図示しないバス等を介して電気的に接続されている。

【0021】

ＣＰＵ３１は、ストレージ３５等に記憶されている様々なプログラムをメインメモリ３２に読み込んで、当該プログラムに含まれる各種の命令を実行する。メインメモリ３２は、例えば、ＤＲＡＭ等によって構成される。

【0022】

ユーザＩ／Ｆ３３は、ユーザとの間で情報をやり取りするための各種の入出力装置である。ユーザＩ／Ｆ３３は、例えば、キーボード、ポインティングデバイス（例えば、マウス、タッチパネル等）等の情報入力装置、マイクロフォン（マイク）等の音声入力装置、カメラ等の画像入力装置を含む。また、ユーザＩ／Ｆ３３は、ディスプレイ等の画像出力装置、スピーカー等の音声出力装置を含む。

【0023】

通信Ｉ／Ｆ３４は、ネットワークアダプタ等のハードウェア、各種の通信用ソフトウェア、及びこれらの組み合わせとして実装され、ネットワーク２０等を介した有線又は無線の通信を実現できるように構成されている。

【0024】

ストレージ３５は、例えば磁気ディスク又はフラッシュメモリ等によって構成される。ストレージ３５は、オペレーティングシステムを含む様々なプログラム及び各種データ等を記憶する。ストレージ３５が記憶するプログラムは、アプリケーションマーケット等からダウンロードされてインストールされ得る。

【0025】

本実施形態において、ユーザ端末３０は、スマートフォン、タブレット端末、ウェアラブルデバイス、パーソナルコンピュータ、及びゲーム専用端末等として構成され得る。

【0026】

このように構成されたユーザ端末３０のユーザは、ストレージ３５等にインストールされているウェブブラウザ又は動画配信サービス用のアプリケーションを介した動画配信サーバ１０との通信を実行することによって、動画配信サーバ１０が提供する動画配信サービスを利用することができる。ウェブブラウザによって実行されるプログラム（ＪａｖａＳｃｒｉｐｔ（登録商標）ライブラリを含む。）及び動画配信サービス用のアプリケーションは、本発明のプログラムの一部又は全部を実装するプログラムの一例となり得る。

【0027】

次に、本実施形態の動画配信システム１が有する機能について説明する。図２は、動画配信サーバ１０及びユーザ端末３０がそれぞれ有する機能を概略的に示すブロック図である。動画配信サーバ１０は、図示するように、様々な情報を記憶及び管理する情報記憶管理部５１と、動画の配信を制御する配信制御部５３とを有する。これらの機能は、ＣＰＵ１１及びメインメモリ１２等のハードウェア、並びに、ストレージ１５等に記憶されている各種プログラムやデータ等が協働して動作することによって実現され、例えば、メインメモリ１２に読み込まれたプログラムに含まれる命令をＣＰＵ１１が実行することによって実現される。また、図２に示す動画配信サーバ１０の機能の一部又は全部は、動画配信サーバ１０とユーザ端末３０とが協働することによって実現され、又は、ユーザ端末３０によって実現され得る。

【0028】

ユーザ端末３０は、図２に示すように、様々な情報を記憶及び管理する情報記憶管理部６１と、動画の再生を制御する再生制御部６３とを有する。これらの機能は、ＣＰＵ３１及びメインメモリ３２等のハードウェア、並びに、ストレージ３５等に記憶されている各種プログラムやデータ等が協働して動作することによって実現され、例えば、メインメモリ３２に読み込まれたプログラムに含まれる命令をＣＰＵ３１が実行することによって実現される。また、図２に示すユーザ端末３０の機能の一部又は全部は、サーバ１０とユーザ端末３０とが協働することによって実現され、又は、サーバ１０によって実現され得る。

【0029】

動画配信サーバ１０の情報記憶管理部５１は、ストレージ１５等において様々な情報を記憶及び管理する。例えば、情報記憶管理部５１は、動画コンテンツが分割（断片化）されたファイルである分割ファイル、及び、当該分割ファイルが再生順に記述されたインデックスファイル（プレイリスト）を記憶する。

【0030】

動画配信サーバ１０の配信制御部５３は、動画の配信の制御に関する様々な処理を実行する。例えば、配信制御部５３は、インデックスファイルを参照するユーザ端末３０からの要求に応答して、当該ユーザ端末３０に対して分割ファイルを順に送信する。

【0031】

ユーザ端末３０の情報記憶管理部６１は、ストレージ３５等において様々な情報を記憶及び管理する。ユーザ端末３０の再生制御部６３は、動画コンテンツの再生の制御に関する様々な処理を実行する。本実施形態において、再生制御部６３は、動画配信サーバ１０から送信される分割ファイルを順に受信し、当該受信した分割ファイルをストレージ３５等に蓄積するように構成されている。例えば、再生制御部６３は、ユーザによって特定された動画コンテンツに対応するインデックスファイルをサーバ１０から取得し、当該取得したインデックスファイルに記述されている分割ファイルの送信をその再生順序に従ってサーバ１０に要求し、サーバ１０から送信される分割ファイルを順に受信して蓄積する。

【0032】

また、再生制御部６３は、蓄積された複数の分割ファイルの各々から映像データ及び音声データを分離（ｄｅｍｕｘ）し、分離された複数の映像データを１つの映像データに結合して再生する一方、分離された複数の音声データを順に再生するように構成されている。映像データ及び音声データは、分割ファイルに含まれるタイムスタンプ等に基づいて同期して再生される。また、再生制御部６３は、分離された複数の音声データを順に再生する際に、当該複数の音声データの接合部分におけるノイズを除去するように構成されている。

【0033】

このように、本実施形態における動画配信システム１は、ユーザ端末３０において、映像データについては、複数の分割ファイルから分離した複数の映像データを１つの映像データに結合して再生するから、分割ファイルのデータサイズが小さい場合であっても、映像データを再生する処理の頻度を少なくすることができる。この結果、ネットワーク及びクライアントにおける遅延が低減される。また、分離した複数の音声データを順に再生すると、音声データの接合部分においてノイズが発生しやすくなるが、当該接合部分におけるノイズを除去して音声データが再生されるから、動画コンテンツの再生時における音声ノイズの発生が抑制される。

【0034】

本実施形態において、再生制御部６３は、所定の再生時間分の複数の分割ファイルが蓄積されたときに、蓄積された所定の再生時間分の複数の分割ファイルの各々から映像データ及び音声データを分離するように構成され得る。つまり、再生制御部６３は、２以上の特定の数の分割ファイルが蓄積されてその再生時間の合計が所定の再生時間以上となると、当該特定の数の分割ファイルの各々から映像データ及び音声データを分離し、分離された特定の数の映像データを１つの映像データに結合して再生する一方、分離された特定の数の音声データを順に再生するように構成され得る。また、再生制御部６３は、再生時間の合計にかかわらず、２以上の所定数の分割ファイルが蓄積されたときに、蓄積された所定数の分割ファイルの各々から映像データ及び音声データを分離するように構成され得る。

【0035】

本実施形態において、分割ファイルは、第１の形式（例えば、ＭＰＥＧ−ＴＳ）を有するコンテナファイルとして構成することができ、この場合、再生制御部６３は、結合後の１つの映像データを、第１の形式とは異なる第２の形式（例えば、ＭＰ４）を有するコンテナファイルに格納して再生するように構成され得る。こうした構成は、ユーザ端末３０において、分割ファイルの形式とは異なる形式を有するコンテナファイルを介した映像データの再生を可能とする。

【0036】

本実施形態において、複数の音声データの接合部分におけるノイズの除去は、様々な方法を用いて実現され得る。例えば、再生制御部６３は、分離された複数の音声データの接合部分を基準とした所定の時間的範囲の音声波形を補正することによってノイズを除去するように構成され得る。所定の時間的範囲は、例えば、上記接合部分から所定時間前の時点（所定数前の音声データ（サンプル））から同じく接合部分から所定時間後の時点（所定数後の音声データ（サンプル））までの範囲である。例えば、再生制御部６３は、所定の時間的範囲に含まれる音声データの中から始点、終点、及び、１又は複数の制御点を設定し、設定した始点、終点、及び制御点に基づく曲線補間（ベジェ補間、又は、スプライン補間等が含まれる。）によって音声波形を補正するように構成され得る。なお、音声波形の補正は、線形補間によっても実現され得る。

【0037】

次に、このような機能を有する本実施形態の動画配信システム１の具体例について説明する。この具体例における動画配信サービスでは、動画コンテンツを配信する配信者のユーザ端末３０から送信されるライブ動画が、動画配信サーバ１０を介して、視聴者のユーザ端末３０に配信される。配信者のユーザ端末３０は、ライブ動画を生成して送信するための機能を有する。ライブ動画は、例えば、配信者のユーザ端末３０の表示画面に対応する画像を含む画面動画であり、又は、配信者のユーザ端末３０のカメラを介して入力（撮影）される映像を含む撮影動画である。これらのライブ動画は、ユーザ端末３０のマイクを介して入力される音声が含まれる。

【0038】

図３に示すように、この例では、配信者のユーザ端末３０と動画配信サーバ１０との間のストリーミングのプロトコルとして、ストリーミング専用のプロトコルであるＲＴＭＰが用いられており、動画配信サーバ１０は、配信者のユーザ端末３０から送信されるライブ動画の動画データを受信する。また、この例では、動画配信サーバ１０と視聴者のユーザ端末３０との間のストリーミングのプロトコルとして、ＨＬＳが用いられている。なお、動画配信サーバ１０と視聴者のユーザ端末３０との間にＣＤＮ（コンテンツ・デリバリ・ネットワーク）におけるエッジサーバが介在するようにしても良い。

【0039】

動画配信サーバ１０は、配信者のユーザ端末３０から受信する動画データに基づいてＴＳファイル（分割ファイル）の作成、及び、ｍ３ｕ８ファイル（インデックスファイル）の更新を行う。ＴＳファイルは、ＭＰＥＧ−ＴＳ形式のコンテナファイルである。動画配信サーバ１０は、具体的には、配信者のユーザ端末３０から受信する動画データを、予め設定されているキーフレームの間隔に従ってＴＳファイルに分割及び変換し、蓄積されたＴＳファイルが再生順に記述されるようにｍ３ｕ８ファイルを適宜に更新する。

【0040】

ライブ動画の視聴者のユーザ端末３０は、ウェブブラウザを介して、動画配信サーバ１０に記憶されているｍ３ｕ８ファイルを参照し、当該ｍ３ｕ８ファイルに記述されているＴＳファイルを再生順に取得する。図４は、視聴者のユーザ端末３０において実行される、ＴＳファイルに対する処理を例示するフロー図である。これらの処理は、ＪａｖａＳｃｒｉｐｔ（登録商標）ライブラリとして実装され、ユーザ端末３０のウェブブラウザを介して実行される。

【0041】

ユーザ端末３０は、まず、図４に示すように、サーバ１０から受信して蓄積されているＴＳファイルの再生時間の合計が、３秒以上となるのを待機する（ステップＳ１００）。各ＴＳファイルの再生時間（ｔｓｄｕｒａｔｉｏｎ）は、ｍ３ｕ８ファイルに記述されており、ユーザ端末３０は、ｍ３ｕ８ファイルに記述されている各ＴＳファイルの再生時間に基づいて、蓄積されているＴＳファイルの再生時間の合計が３秒以上となるのを判定することができる。この例において、上述したキーフレームの間隔は１秒に設定されており、１つのＴＳファイルの再生時間は、通常、０．９〜１．４秒となる。従って、再生時間の合計が３秒以上となるＴＳファイルの数は、通常、３〜４個となる。

【0042】

３秒分以上のＴＳファイルが蓄積すると（ステップＳ１００においてＹＥＳ）、ユーザ端末３０は、次に、蓄積された複数のＴＳファイルの各々を映像ストリームと音声ストリームとに分離（ｄｅｍｕｘ）する（ステップＳ１１０）。ＴＳファイルは、上述したように、ＭＰＥＧ−ＴＳファイルとして構成されており、この例では、ＴＳファイルに含まれる映像ストリームのコーデックはＨ．２６４であり、同じくＴＳファイルに含まれる音声ストリームのコーデックはＡＡＣである。例えば、図５に示すように、３秒分以上の３つのＴＳファイルを分離すると、それぞれ３つの映像ストリーム及び音声ストリームが得られる。

【0043】

そして、ユーザ端末３０は、ＴＳファイルの分離によって得られた映像ストリーム及び音声ストリームを個別に処理して再生する（ステップＳ１２０）。このように、蓄積された３秒分以上のＴＳファイルを分離し、得られた映像ストリーム及び音声ストリームを個別に処理して再生する処理が、ライブ動画の配信が終了するまでの間（ステップＳ１３０）、繰り返し行われる。

【0044】

図６は、映像ストリーム及び音声ストリームを個別に処理して再生する方法を模式的に示す図である。映像ストリームに関して、ユーザ端末３０は、ＴＳファイルの分離によって得られた複数の映像ストリームをバイナリ結合し、当該バイナリ結合によって得られた１つの映像ストリームをＭＰ４ファイルに格納（多重化）する。また、音声ストリームに関して、ユーザ端末３０は、複数の音声ストリームの各々を順にＰＣＭデータに変換する。そして、ユーザ端末３０は、１つに結合された映像ストリームを格納するＭＰ４ファイルと、複数の音声ストリームに対応する複数のＰＣＭデータとを同期して再生する。映像ストリームを格納するＭＰ４ファイルは、例えば、ＨＴＭＬ５における＜ｖｉｄｅｏ＞タグ等を用いて再生される。

【0045】

ここで、複数の音声ストリームに対応する複数のＰＣＭデータを再生する際には、ＰＣＭデータの接合部分におけるノイズを除去する処理が行われる。図７は、当該ノイズを除去する処理を説明するための図である。図７（Ａ）は、ＰＣＭデータの接合部分が含まれる音声波形の一例であって、ノイズが除去される前の状態を示している。また、図７（Ｂ）は、図７（Ａ）の音声波形に対してノイズが除去された後の状態を示している。図７（Ａ）に示すように、ＰＣＭデータの接合部分における音声波形は、後側のＰＣＭデータの先頭部分に相当する波形が乱れる傾向にあり、具体的には、その振幅（ゲイン）が０付近となる傾向にある。こうした音声波形を有するＰＣＭデータをそのまま再生すると、各ＰＣＭデータの先頭部分においてノイズが発生してしまう。

【0046】

そこで、この例では、ベジェ補間を用いた音声波形の補正を行うことにより、当該ノイズが除去される。具体的には、図７（Ｂ）に示すように、ＰＣＭデータの接合部分に対応する時点ｔ１から所定時間（所定のサンプル数、例えば、３４サンプル）前の時点である時点ｔ０と、同じく接合部分に対応する時点ｔ１から所定時間後の時点である時点ｔ２との間に含まれる音声波形（時点ｔ０から時点ｔ２までの時間的範囲に含まれる音声波形）を対象に、ベジェ補間を用いた補正を行う。なお、上記所定時間（つまり、音声波形の補正の対象範囲）は、情報量と処理効率とのバランスを考慮して設定される。例えば、サーバ側においてゲイン処理等の処理が施される場合には、こうした処理が施された範囲が含まれるように上記所定時間を設定するのが好ましい。

【0047】

ベジェ補間は、具体的には、上記時間的範囲の先頭の時点ｔ０に対応するＰＣＭデータのサンプルＰ０を始点とし、上記時間的範囲の最後の時点ｔ２に対応するサンプルＰ２を終点とし、ＰＣＭデータの接合部分に対応する時点ｔ１に対応するサンプルＰ１（前側のＰＣＭデータの最後のサンプル）を制御点とするベジェ曲線を生成し、生成したベジェ曲線で音声波形を上書きすることによって行われる。このように補正された音声波形は、ＰＣＭデータの先頭部分における波形が滑らかとなり、当該先頭部分におけるノイズの発生が抑制される。

【0048】

上述した例において、ユーザ端末３０におけるＯＳ及びブラウザの組合せに応じて、ＴＳファイルに対する処理を変更する（言い換えると、レンダラーを変更する）ようにしても良い。

【0049】

以上説明した本実施形態の動画配信システム１は、ユーザ端末３０において、映像データについては、複数の分割ファイル（例えば、ＴＳファイル）から分離した複数の映像データを１つの映像データに結合して再生するから、分割ファイルのデータサイズが小さい場合であっても、映像データを再生する処理の頻度を少なくすることができる。この結果、ネットワーク及びクライアントにおける遅延が低減される。また、分離した複数の音声データを順に再生すると、音声データの接合部分においてノイズが発生しやすくなるが、当該接合部分におけるノイズを除去して音声データが再生されるから、動画コンテンツの再生時における音声ノイズの発生が抑制される。

【0050】

また、本発明の実施形態は、図４のフロー図に例示したような分割ファイルに対する処理を、ブラウザを介して実行可能なＪａｖａＳｃｒｉｐｔ（登録商標）ライブラリ等のソフトウェアとして実装することができるため、ハードウェアデコーダー等のハードウェアに依存して処理する場合（従来、リアルタイム性が要求されるストリーミングサービスでは、多くの場合、ハードウェアデコーダーが用いられている）と比較して、動画コンテンツに対する追加の処理（例えば、人の顔にアバター画像を重ねる処理、ＢＧＭを追加する処理等）を容易に実現することができる。このように、本発明の実施形態は、リアルタイム性（遅延の低減）が要求される動画コンテンツのストリーミング配信サービスにおいて、良好なユーザ体験を担保すると共にサービス性を向上させることができる。

【0051】

本明細書で説明された処理及び手順は、明示的に説明されたもの以外にも、ソフトウェア、ハードウェアまたはこれらの任意の組み合わせによって実現される。例えば、本明細書で説明される処理及び手順は、集積回路、揮発性メモリ、不揮発性メモリ、磁気ディスク等の媒体に、当該処理及び手順に相当するロジックを実装することによって実現される。また、本明細書で説明された処理及び手順は、当該処理・手順に相当するコンピュータプログラムとして実装し、各種のコンピュータに実行させることが可能である。

【0052】

本明細書中で説明された処理及び手順が単一の装置、ソフトウェア、コンポーネント、モジュールによって実行される旨が説明されたとしても、そのような処理または手順は複数の装置、複数のソフトウェア、複数のコンポーネント、及び／又は複数のモジュールによって実行され得る。また、本明細書において説明されたソフトウェアおよびハードウェアの要素は、それらをより少ない構成要素に統合して、またはより多い構成要素に分解することによって実現することも可能である。

【0053】

本明細書において、発明の構成要素が単数もしくは複数のいずれか一方として説明された場合、又は、単数もしくは複数のいずれとも限定せずに説明された場合であっても、文脈上別に解すべき場合を除き、当該構成要素は単数又は複数のいずれであってもよい。

【符号の説明】

【0054】

１動画配信システム
１０動画配信サーバ
２０ネットワーク
３０ユーザ端末（クライアント）
５１情報記憶管理部
５３配信制御部
６１情報記憶管理部
６３再生制御部

【要約】

【課題】動画コンテンツの配信における遅延を低減する。
【解決手段】
本発明の一実施形態に係る動画配信システム１は、ユーザ端末３０と、当該ユーザ端末３０に動画を配信する動画配信サービスを提供する動画配信サーバ１０とを備える。動画配信システム１は、ユーザ端末３０において、映像データについては、複数の分割ファイルから分離した複数の映像データを１つの映像データに結合して再生するから、分割ファイルのデータサイズが小さい場合であっても、映像データを再生する処理の頻度を少なくすることができる。
【選択図】図１

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

【図7】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

特許第6275906号(P6275906)IP Force 特許公報掲載プロジェクト 2022.1.31 β版