(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6239102
(24)【登録日】2017年11月10日
(45)【発行日】2017年11月29日
(54)【発明の名称】アダプティブ・ストリーミングにおいてリプレゼンテーション(Representation)を関連付けるシステムおよび方法
(51)【国際特許分類】
H04N 21/236 20110101AFI20171120BHJP
H04N 21/235 20110101ALI20171120BHJP
H04N 21/434 20110101ALI20171120BHJP
H04N 21/435 20110101ALI20171120BHJP
H04N 21/84 20110101ALI20171120BHJP
H04N 21/6437 20110101ALI20171120BHJP
【FI】
H04N21/236
H04N21/235
H04N21/434
H04N21/435
H04N21/84
H04N21/6437
【請求項の数】18
【全頁数】19
(21)【出願番号】特願2016-519732(P2016-519732)
(86)(22)【出願日】2014年10月27日
(65)【公表番号】特表2016-527756(P2016-527756A)
(43)【公表日】2016年9月8日
(86)【国際出願番号】US2014062457
(87)【国際公開番号】WO2015061794
(87)【国際公開日】20150430
【審査請求日】2015年12月11日
(31)【優先権主張番号】61/895,849
(32)【優先日】2013年10月25日
(33)【優先権主張国】US
(73)【特許権者】
【識別番号】503433420
【氏名又は名称】華為技術有限公司
【氏名又は名称原語表記】HUAWEI TECHNOLOGIES CO.,LTD.
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100091214
【弁理士】
【氏名又は名称】大貫 進介
(72)【発明者】
【氏名】ジャン,シァオボ
(72)【発明者】
【氏名】ワン,シン
【審査官】
富樫 明
(56)【参考文献】
【文献】
米国特許出願公開第2012/0023253(US,A1)
【文献】
国際公開第2012/109520(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 21/00−21/858
(57)【特許請求の範囲】
【請求項1】
アダプティブ・ストリーミングにおいてメタデータリプレゼンテーションをメディアリプレゼンテーションと関連付ける方法であって、
メディアリプレゼンテーションに関する時限メタデータを搬送するメタデータリプレゼンテーションを第1のセットに配置するステップと、
前記メタデータリプレゼンテーションと関連する前記メディアリプレゼンテーションを第2のセットに配置するステップと、
前記メタデータリプレゼンテーションおよびメディアリプレゼンテーションをセットレベルの属性と関連付けるステップと、
を有し、
前記メタデータリプレゼンテーションは、複数のメディアリプレゼンテーションに関するメタデータを搬送する複数のメタデータトラックを含む、
方法。
【請求項2】
アダプティブ・ストリーミングにおいてメタデータリプレゼンテーションをメディアリプレゼンテーションと関連付ける方法であって、
メディアリプレゼンテーションに関する時限メタデータを搬送するメタデータリプレゼンテーションを第1のセットに配置するステップと、
前記メタデータリプレゼンテーションと関連する前記メディアリプレゼンテーションを第2のセットに配置するステップと、
前記メタデータリプレゼンテーションおよびメディアリプレゼンテーションを、リプレゼンテーションレベルの属性と関連付けるステップと、
を有し、
前記メタデータリプレゼンテーションは、複数のメディアリプレゼンテーションに関するメタデータを搬送する複数のメタデータトラックを含む、
方法。
【請求項3】
アダプティブ・ストリーミングにおいてメタデータリプレゼンテーションをメディアリプレゼンテーションと関連付ける方法であって、
メディアリプレゼンテーションに関する時限メタデータを搬送するメタデータリプレゼンテーションを第1のセットに配置するステップと、
前記メタデータリプレゼンテーションと関連する前記メディアリプレゼンテーションを第2のセットに配置するステップと、
前記メタデータリプレゼンテーションおよびメディアリプレゼンテーションを、セットレベルおよびリプレゼンテーションレベルの属性と関連付けるステップと、
を有し、
前記メタデータリプレゼンテーションは、複数のメディアリプレゼンテーションに関するメタデータを搬送する複数のメタデータトラックを含む、
方法。
【請求項4】
メディア・プレゼンテーション・ディスクリプション(MPD)マニフェストと、1以上のリプレゼンテーションとを送信するように動作するサーバーと、
前記マニフェストを受信するように動作するクライアントと、
を備えるアダプティブ・ストリーミング・システムであって、
前記マニフェストは、第2の少なくとも1つのリプレゼンテーションを含む第2のセットと関連する第1の少なくとも1つのリプレゼンテーションを含む第1のセットと、前記第1の少なくとも1つのリプレゼンテーションを含む前記セットが関連する前記第2の少なくとも1つのリプレゼンテーションを含むセットの値の識別子をリストする属性とを有し、
前記第1のリプレゼンテーションは、複数の前記第2のリプレゼンテーションに関するメタデータを搬送する複数のメタデータトラックを含む、
アダプティブ・ストリーミング・システム。
【請求項5】
前記属性はセットレベルである、請求項4に記載のシステム。
【請求項6】
リプレゼンテーションに含まれるデータは、@codecs属性の値によって識別される、請求項4に記載のシステム。
【請求項7】
前記第1の少なくとも1つのリプレゼンテーションは時限メタデータリプレゼンテーションであり、前記第2の少なくとも1つのリプレゼンテーションはメディアリプレゼンテーションである、請求項4に記載のシステム。
【請求項8】
メタデータはメディアセグメントごとに提供される、請求項7に記載のシステム。
【請求項9】
メタデータは、メディアセグメントに含まれるサブセグメントを識別するインデックス情報を含む、請求項7に記載のシステム。
【請求項10】
他のデータを参照することなく対応するメディアサブセグメントがアクセス可能となるように、前記時限メタデータリプレゼンテーションは他の情報を含む、請求項7に記載のシステム。
【請求項11】
メディア・プレゼンテーション・ディスクリプション(MPD)マニフェストを保存する非一時的コンピューター可読媒体であって、前記マニフェストは、符号化された配信可能バージョンのメディアコンテンツの集まりに関するリソース識別子をクライアントデバイスに知らせるためのフォーマットを定義し、前記マニフェストは、
第2の少なくとも1つのリプレゼンテーションを含む第2のセットと関連付けられる第1の少なくとも1つのリプレゼンテーションを含む第1のセットと、
前記第1の少なくとも1つのリプレゼンテーションと関連付けられる前記第2の少なくとも1つのリプレゼンテーションの識別子をリストする属性と、
を備え、
前記第1のリプレゼンテーションは、複数の前記第2のリプレゼンテーションに関するメタデータを搬送する複数のメタデータトラックを含む、
非一時的コンピューター可読媒体。
【請求項12】
前記属性はリプレゼンテーションレベルである、請求項11に記載の非一時的コンピューター可読媒体。
【請求項13】
リプレゼンテーションに含まれるデータは、@codecs属性の値によって識別される、請求項11に記載の非一時的コンピューター可読媒体。
【請求項14】
前記第1の少なくとも1つのリプレゼンテーションは時限メタデータリプレゼンテーションであり、前記第2の少なくとも1つのリプレゼンテーションはメディアリプレゼンテーションである、請求項11に記載の非一時的コンピューター可読媒体。
【請求項15】
前記時限メタデータリプレゼンテーションは、前記メディアリプレゼンテーションに含まれるメディアセグメントに規定される、請求項14に記載の非一時的コンピューター可読媒体。
【請求項16】
前記時限メタデータリプレゼンテーションは、前記メディアリプレゼンテーションのメディアセグメントに含まれるサブセグメントを識別するインデックス情報を含む、請求項14に記載の非一時的コンピューター可読媒体。
【請求項17】
他のデータを参照することなく対応するメディアサブセグメントがアクセス可能となるように、前記時限メタデータリプレゼンテーションは他の情報を含む、請求項14に記載の非一時的コンピューター可読媒体。
【請求項18】
アダプティブ・ストリーミングにおいて第1の少なくとも1つのリプレゼンテーションを第2の少なくとも1つのリプレゼンテーションと関連付ける方法であって、
前記第1の少なくとも1つのリプレゼンテーションを含む第1のセットが、前記第2の少なくとも1つのリプレゼンテーションを含む第2のセットと関連付けられているか否かを判定するステップと、
前記第1の少なくとも1つのリプレゼンテーションと関連付けられる前記第2の少なくとも1つのリプレゼンテーションの識別子をリストする属性を導入するステップと、
前記第2の少なくとも1つのリプレゼンテーションに含まれる前記第1の少なくとも1つのリプレゼンテーションの識別子を用いて、前記第1の少なくとも1つのリプレゼンテーションのうちどれと前記第2の少なくとも1つのリプレゼンテーションが関連付けられているかを表現するステップと、
を有し、
前記第1のリプレゼンテーションは、複数の前記第2のリプレゼンテーションに関するメタデータを搬送する複数のメタデータトラックを含む、
方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は通信システムおよび方法に関し、特に、アダプティブ・ストリーミングにおいてリプレゼンテーション(Representation)を他のリプレゼンテーションに関連付けるシステムおよび方法に関する。
【背景技術】
【0002】
現在、多くのテレビや映画の視聴者が、ビデオその他のメディアコンテンツへのオンデマンドアクセスを望んでいる。第1の例として、テレビ視聴者は、通常の放映時間にテレビで見逃したテレビ番組を見たいと望む場合がある。視聴者は、インターネットを通じてウェブブラウザその他のアプリケーションを用いて、ノートパソコン、タブレットコンピューター、デスクトップコンピューター、携帯電話その他のデバイス上でその番組をオンデマンドでストリーミングし、ブラウザその他のアプリケーションでその番組を視聴するかもしれない。他の例では、視聴者は、オンデマンドで映画をストリーミングしたり、他の視聴者とのテレビ会議に参加したりするかもしれない。
【0003】
DASH(Dynamic Adaptive Streaming over Hypertext Transfer プロトコル)は、そのようなメディアコンテンツを提供するために開発された規格であり、参照により全体として本明細書に援用される国際標準化機構(ISO)/国際電気標準会議(IEC)23009−1、第1版、2012(“23009−1”)に部分的に説明されている。加えて、ISO/IEC23009−1、Technical Corrigendum1、2013が参照により全体として本明細書に援用される。DASHでは、2つの主な装置、すなわちコンテンツを提供するHTTP(Hypertext Transfer プロトコル)サーバーと、コンテンツをリクエストし視聴者(またはユーザー)に関連付けられるDASHクライアントとが存在する。DASHではダウンロード制御はクライアントに任されており、クライアントは自身のストリーミング戦略に従って、HTTPプロトコルを用いてコンテンツをリクエストすることができる。
【0004】
DASHは、各コンテンツコンポーネント(ビデオ、オーディオ、キャプション、品質情報、ロテーティングキー(rotating key)等)を一連のより小さなセグメントに区分するように機能する(各セグメントは短いインターバルの再生時間である)。各セグメントは、考えられる複数の選択肢においてDASHクライアントに利用可能とされ、それぞれビデオセグメントに関して異なる特性(例えば異なるビットレートまたは異なる品質水準)をもつ。コンテンツが再生または購入される際、DASHクライアントは、(もしあれば)その選択肢から次のセグメント(リクエスト/再生/購入される)を自動的に選択する。この選択は、現在のネットワーク状態等の様々な因子に基づく。もたらされる効果として、DASHクライアントは変化するネットワーク状態に適応し、失速や再バッファのイベントを生じることなく、最高の品質でコンテンツを再生することができる。
【0005】
DASHクライアントは、無線および/または有線接続性をもつDASHおよびメディアコンテンツ再生機能をもつ任意の装置であってよい。例えば、DASHクライアントは、デスクトップまたはラップトップのコンピューター、スマートフォン、タブレット、セットトップボックス、インターネットに接続されたテレビ等であってよい。
【0006】
ここで
図1を参照する。
図1は、DASH規格ベースのアダプティブ・メディア・ストリーミングモデルを示す。ここで、DASHクライアントデバイス10a〜10nにより、HTTPを用いて、メディアストリームおよびメディアセグメントの一部がリクエストされ、1以上のDASH(HTTP)サーバー12によりネットワーク11(例えばインターネット)を介して配信される。当然ながら、電気通信ネットワーク11は、HTTPを用いたメディアコンテンツの伝送を可能にする任意の適切なネットワーク(或いはネットワークの組合わせ)であってよい。単なる例示として、示される電気通信ネットワーク11は、ネットワークアドレス変換器および/またはファイアウォール18、キャッシュ14およびコンテンツデリバリネットワーク(CDN)16等の、様々な電気通信リソースおよびインフラストラクチャを含む。このようなリソースは、DASHクライアント10a〜10n等のネットワークに接続された装置に対するオンデマンドのライブストリーミングおよび録画のアプリケーションおよびサービスをサポートする。
【0007】
各DASHクライアント10は、異なるビットレート、品質水準その他の特徴で符号化された同じメディアセグメントを異なるバージョンで切り替えることにより、リクエストされたメディアコンテンツ/ストリームのビットレート、品質水準その他の特徴を、ネットワーク状態および/または他の因子の変化に動的に適合させることができる。
【0008】
図2に示されるように、DASHは、メディア・プレゼンテーション・ディスクリプション(MPD)マニフェスト(すなわちファイル)によって記述される階層データモデルに基づく。MPDマニフェストは、符号化された配信可能バージョンのメディアコンテンツの集まりに関するリソース識別子を知らせるためのフォーマットを定義する。MPDはXMLドキュメントであり、利用可能なメディアコンテンツを通知し、また、DASHクライアントがリプレゼンテーション(すなわち、符号化された配信可能バージョンのメディアコンテンツの集まり)からセグメントを選択し、適合決定を行い、選択されたセグメントをサーバーからネットワークを介して取り込むために必要とする情報を提供する。複数のリプレゼンテーションへと符号化されたメディアコンテンツと、他の必要な情報とは、1以上の連続的なセグメントから構成されてよい。
【0009】
MPDは、HTTP(DASH)サーバーからセグメントをリクエストし、受信されたメディアセグメントを逆多重化(適宜)、復号およびレンダリングすることにより、DASHクライアントがユーザーにストリーミングサービスを提供するのに十分な情報を提供する。MPDはセグメントから完全に独立しており、リプレゼンテーションの再生/購入が成功するか否かを決定するのに必要なプロパティと、そのプロパティのみを識別する(例えば、セグメントがランダムアクセスポイントから開始するか否か)。留意すべきこととして、MPD は、リプレゼンテーションのセグメントに非機能的プロパティ(例えば品質その他の記述メタデータ)を含んでもよい。
【0010】
コンテンツを再生するために、DASHクライアントはまずMPDを取得する。MPDを解析することにより、DASHクライアントは、プログラムタイミング、メディアコンテンツのアベイラビリティ、メディアの種類、解像度、最大帯域幅および最小帯域幅、マルチメディアコンポーネントの様々な符号化選択肢の存在、アクセシビリティ特徴および要求されるデジタル著作権管理(DRM)、ネットワーク上でのメディアコンポーネントの位置その他のコンテンツ特性について知る。この情報を用いて、DASHクライアントは、適切な符号化選択肢を選択し、HTTP GETリクエストを用いてセグメントをフェッチすることによりコンテンツのストリーミングを開始する。
【0011】
ネットワークスループットの変化を考慮するための適切なバッファリングの後、クライアントは後続のセグメントのフェッチを継続し、また、ネットワーク帯域幅の変動をモニタする。その測定値によって、クライアントは、異なる選択肢(ビットレートが低い、或いは高い)のセグメントをフェッチして適正なバッファを維持することにより、利用可能な帯域幅にどのように適合するかを決定する。
【0012】
図2に更に示されるように、メディアセグメントは、コンテンツデータの個別にアドレス可能な最小単位である。これは、MPDによって通知されるURLを用いてダウンロード可能なエンティティである。メディアセグメントの一例は、生放送のプレイアウト時間0:42:38から始まり0:42:42に終わる4秒間であり、3分間の時間窓内で利用可能である。別の例は、コンピューター・オンデマンド映画であってよく、全ピリオドにおいて利用可能である。
【0013】
リプレゼンテーションは、そのコンポーネントの完全なアセットまたはサブセットの単一の符号化バージョンを定義する。例えば、リプレゼンテーションは、多重化されていない2.5Mbps720pAVCビデオを含むISO−BMFF(Base Media File Formation)であってよく、別々のISO−BMFFリプレゼンテーションは、異なる言語の96KbpsMPEG−4AACオーディオに関するものであってよい。逆に、ビデオ、オーディオおよび字幕を含む単一のトランスポートストリームは、単一の多重化されたリプレゼンテーションであってよい。例えば、複数のメディアコンポーネントを有する多重化されたリプレゼンテーションとして、ISO−BMFFファイルは、2.5Mbps720pAVCビデオに関するトラックと、異なる言語の96KbpsMPEG−4AACオーディオに関するいくつかのトラックとを、同じファイルに含む。組み合わせた構造も可能である。ビデオと英語のオーディオが単一の多重化リプレゼンテーションであり、スペイン語と中国語のオーディオトラックが別々の多重化されていないリプレゼンテーションであってよい。
【0014】
次に、
図3には、HTTP(DASH)サーバー202と相互接続された従来のDASHクライアント200の機能的ブロック図が示され、更に、ストリーミングプロセスに関与する様々な機能モジュールが示される。
【0015】
モニタリング機能モジュール204は、クライアント環境情報の収集と、一部の適応パラメータの生成/出力とを担当する。適応論理モジュール206は、これらのパラメータを利用して、リプレゼンテーションの選択および決定を行う。
【0016】
エンドユーザーの関心事は絶対のビットレートではなく、知覚品質、いわゆるQoE(Quality of Experience)である。品質を追求するストリーミングに関するDASHコア実験(CE)(DASH Core Experiment(CE) on Quality Driven Steaming)は、ISO−BMFFのメタデータトラックに保存される符号化メディアコンテンツの品質情報を採用すると、DASHクライアントがより知的な適応決定を行うことができ、よって、ストリームされるコンテンツの品質の変動が低減され、結果としてQoEが改善され、帯域幅の消費が低減されることを立証した。
【0017】
DASH仕様書ISO/IEC23009−1では、品質情報等の時限メタデータがリプレゼンテーションに搬送されることが提案されている。しかしながら、例えば品質情報を搬送するメタデータリプレゼンテーションと、メディアデータを含むリプレゼンテーションとの関連を表現する機構は、今のところ存在しない。現在DASH仕様書によって規定されている@group、@dependencyId等の現存の属性は、リプレゼンテーションの関連関係を表現するには不十分である。
【0018】
一例(リプレゼンテーションの関連関係を表現する必要性の排他的な例ではない)では、クライアントがどのリプレゼンテーションを選択するのかを決定するのを支援するために、MPDは、メタデータリプレゼンテーション(例えば品質情報)とメディアリプレゼンテーションとの関連を識別する必要がある。
【0019】
単純な解決策は、関連するメディアリプレゼンテーションを含むものから、メタデータリプレゼンテーションを異なるAdaptationSetに配置することであろう。しかしながら、別々のAdaptationSetのリプレゼンテーションの関係を表現する機構は、今のところ存在しない。属性@groupおよびエレメントSubsetはAdaptationSetの関係を表現するが、それらが表現する包括性または排他性は、メタデータリプレゼンテーションとメディアリプレゼンテーションとの関係ではない。属性@dependencyIdに関して、これはリプレゼンテーションレベルであり、従属リプレゼンテーションと従属される(補完の)リプレゼンテーションとが同じAdaptationSetにある。また、従属関係において、従属リプレゼンテーションは単独でレンダリングされない。従属されるリプレゼンテーションと一緒の場合のみレンダリングが可能である。メタデータリプレゼンテーションはメディアリプレゼンテーションに従属するが、メディアリプレゼンテーションの回収の前に単独で用いることができる。
【0020】
したがって、リプレゼンテーションと別々のAdaptationSetの他のリプレゼンテーションとの関係を表現することができるシステムおよび方法が必要である。
【発明の概要】
【0021】
リプレゼンテーションの関連関係を提供することによる、時限メタデータリプレゼンテーションとメディアリプレゼンテーションとの関連関係を提供することによる、アダプティブ・ストリーミングにおける時限メタデータのシグナリングのためのシステム、方法および装置。
【0022】
一実施形態において、方法は、アダプティブ・ストリーミングにおいて第1の少なくとも1つのリプレゼンテーション(リプレゼンテーション)を第2の少なくとも1つのリプレゼンテーションと関連付ける。第1の少なくとも1つのリプレゼンテーションを含む第1のセットが第2の少なくとも1つのリプレゼンテーションを含む第2のセットと関連付けられているか否かが判定される。第1の少なくとも1つのリプレゼンテーションと関連付けられる第2の少なくとも1つのリプレゼンテーションの識別子をリストする属性が導入される。
【0023】
一実施形態において、属性はセットレベルである。一実施形態において、属性はリプレゼンテーションレベルである。一実施形態において、リプレゼンテーションに含まれるデータは、@codecs属性の値によって識別される。
【0024】
一実施形態において、アダプティブ・ストリーミング・システムは、メディア・プレゼンテーション・ディスクリプション(MPD)マニフェストと、1以上のリプレゼンテーションとを送信するように動作するサーバーを備える。クライアントは、マニフェストを受信するように動作する。マニフェストは、第2の少なくとも1つのメディアリプレゼンテーションを含む第2のセットと関連付けられる第1の少なくとも1つのリプレゼンテーションを含む第1のセットと、第1の少なくとも1つのリプレゼンテーションと関連付けられる第2の少なくとも1つのリプレゼンテーションの識別子をリストする属性とを備える。
【0025】
一実施形態において、非一時的コンピューター可読媒体は、メディア・プレゼンテーション・ディスクリプション(MPD)マニフェストを保存する。マニフェストは、符号化された配信可能バージョンのメディアコンテンツと時限メタデータとの集まりに関するリソース識別子をクライアントデバイスに知らせるためのフォーマットを定義する。マニフェストは、第2の少なくとも1つのリプレゼンテーションを含む第2のセットと関連付けられる第1の少なくとも1つのメタデータリプレゼンテーションを含む第1のセットと、第1の少なくとも1つのリプレゼンテーションと関連付けられる第2の少なくとも1つのリプレゼンテーションの識別子をリストする属性とを備える。
【0026】
本開示の更なる特徴および利点は、以下の説明に記載され、該説明から明らかになるであろう。或いは、当業者であれば、本明細書に開示される原理を実践することによって知ることができる。
【図面の簡単な説明】
【0027】
本開示の上述または他の利点および特徴が得られる方式を説明するために、添付の図面に示される具体的な実施形態を参照することにより、上記で簡単に説明した原理をより詳細に説明する。当然ながら、これらの図面は本開示の例示的な実施形態を示すものに過ぎず、したがって、その範囲を限定するものではないとみなされる。本明細書では、添付の図面を用いて、原理をより具体的且つ詳細に記載し説明する。
【
図1】DASH規格ベースのダイナミック・アダプティブ・メディア・ストリームミング・システムとそのコンポーネントを示す図である。
【
図2】DASHベースシステムにおけるメディア・プレゼンテーション・ディスクリプション(MPD)の階層データモデルを示す図である。
【
図3】DASH等のクライアント管理型のアダプティブ・ストリーミング・システムにおける1組の従来のクライアントとサーバーの機能的ブロック図である。
【
図4】本開示の原理に係るDASHベースシステムにおける改良MPDの階層データモデルを示す図である。
【
図5】新しい属性@associateSetIdを含むAdaptationSetレベルのシグナリングに関するエレメントおよび属性を示す図である。
【
図6】新しい属性@associateRepIdを含むRepresentationレベルのシグナリングに関するエレメントおよび属性を示す図である。
【
図7】本開示の原理に係る、1つのメタデータリプレゼンテーションにつき1つのメディアリプレゼンテーションの図である。
【
図8】本開示の原理に係る、1つのメタデータリプレゼンテーションにつき1つのメディアリプレゼンテーションの場合の例示的なMPDを示す図である。
【
図9】本開示の原理に係る、1つのメタデータリプレゼンテーションにつき複数のメディアリプレゼンテーションの図である。
【
図10】本開示の原理に係る、1つのメタデータリプレゼンテーションにつき複数のメディアリプレゼンテーションの場合の例示的なMPDを示す図である。
【
図11】本開示の原理を実現可能なアダプティブ・ストリーミング・システムのブロック図である。
【
図12A】クライアント(またはUE)を示す全体ブロック図である。
【
図12B】eNodeBを示す全体ブロック図である。
【発明を実施するための形態】
【0028】
図面および以下の文章ならびに本開示の原理の説明に用いられる様々な実施形態は例示に過ぎず、いかなる形でも特許請求される開示の範囲を限定しないと解釈されるものである。当業者であれば、適切に構成された装置またはシステムであればどんな種類でも本開示の原理を実施できることが、容易に認識されるであろう。具体的には、本開示はセルラー無線環境での利用に関して説明しているが、当業者であれば、本開示の範囲を逸脱することなく、他の種類のネットワーク(例えば無線ネットワーク、有線ネットワーク、または無線ネットワークと有線ネットワークの組合わせ)および他の適用が容易に認識されるであろう。
【0029】
別段の定義がない限り、本明細書で用いられる技術的用語および科学的用語は全て、本開示の属する分野の当業者により一般に理解される意味と同じ意味をもつ。本開示の実施または検証では、本明細書に記載のものと類似または均等の任意の方法および材料を用いることもできるが、本明細書における説明では、例示的な方法および材料の数を限定する。
【0030】
当然ながら、本開示の態様は、方法、システムまたはコンピュータープログラムとして具現化されてよい。したがって、本開示の態様は、全体にハードウェアの実施形態か、全体にソフトウェアの実施形態(例えばファームウェア、常駐ソフトウェア、マイクロコード)、またはソフトウェアとハードウェアの態様を組み合わせる実施形態の形をとってよく、どの場合でもここでは一般に「回路」、「モジュール」または「システム」と称される場合がある。本開示を構成する際、関連するソフトウェア、ファームウェアおよびグル―ロジックと共に、単独または組合わせで、フィールド・プログラマブル・ゲート・アレイ(FPGA)、特定用途向け集積回路(ASIC)、デジタルシグナルプロセッサ(DSP)および汎用プロセッサが採用されてよい。
【0031】
更に、本開示の様々な態様は、コンピューター使用可能プログラムコードが具現化されるコンピューター使用可能記憶媒体に保存されるコンピュータープログラムの形をとってよい。任意の適切なコンピューター使用可能またはコンピューター可読の媒体が利用されてよい。コンピューター使用可能またはコンピューター可読の媒体は、例えば(ただしこれらに限定されない)、ランダムアクセスメモリ(RAM)、リードオンリーメモリ(ROM)、消去可能プログラマブル・リードオンリーメモリ(EPROMまたはフラッシュメモリ)であってよい。本開示の工程を実行するためのコンピュータープログラムコードは、例えば(ただしこれらに限定されない)、Javascript、Extensible Markup Language(XML)その他の同様のプログラミング言語等の、オブジェクト指向プログラミング言語、従来の手続き型プログラミング言語によって書かれてよい。
【0032】
本明細書を通して「一実施形態」、「実施形態」、「具体的な実施形態」または「特定の実施形態」という場合、特定の実施形態に関連して記載される特定の特徴、構造または特性は少なくとも1つの実施形態に含まれ、必ずしも全ての特定の実施形態に含まれるのではないことを意味する。よって、「特定の実施形態において」、「実施形態において」または「具体的な実施形態において」というフレーズが本明細書の様々な箇所に登場するが、必ずしも同じ実施形態を参照しない。更に、任意の具体的な実施形態の特定の特徴、構造または特性は、任意の適切な方式で1以上の他の特定の実施形態と組み合わされてよい。本明細書に記載の教示を考慮すると、本明細書に記載および図示される特定の実施形態の他の変形および変更が可能であり、それらは趣旨および範囲の一部とみなされるものと理解されたい。
【0033】
様々なユニット、回路その他のコンポーネントは、タスクまたは複数のタスクを実行する「ように構成される」と記載される場合がある。かかる文脈では、「ように構成される」は、そのユニット/回路/コンポーネントが動作中に該タスクまたは複数のタスクを実行する構造(例えば回路構成)を有することを示すことにより、構造を含意するために用いられる。そのようなものとして、ユニット/回路/コンポーネントは、その具体的なユニット/回路/コンポーネントが現在動作可能でない(例えばオンでない)場合であっても、タスクを実行するように構成されると言うことができる。「ように構成される」という表現と共に用いられるユニット/回路/コンポーネントの例として、ハードウェア(例えば回路)、該動作を実施するために実行可能なプログラム命令を保存するメモリ等が挙げられる。ユニット/回路/コンポーネントが1以上のタスクを実行する「ように構成される」と記載する場合、明らかに35U.S.C.112(f)を発動する意図はない。
【0034】
本願では、「モジュール」、「ユニット」、「インターフェース」、「プロセッサ」、「エンジン」、「検出部」または「受信部」は、汎用、専用または共有のプロセッサと、一般に、プロセッサによって実行されるファームウェアまたはソフトウェアモジュールとを含む。実施時固有その他の検討事項に応じて、モジュール、ユニット、インターフェース、プロセッサ、エンジン、検出部または受信部は集中されてよく、或いはそれらの機能が分散されてよい。モジュール、ユニット、インターフェース、プロセッサ、エンジン、検出部または受信部の例として、プロセッサによる実行のためにコンピューター可読(記憶)媒体に具現化される汎用または専用のハードウェア、ファームウェアまたはソフトウェアが挙げられる。本明細書では、コンピューター可読媒体またはコンピューター可読記憶媒体は、あらゆる法定の(例えば、米国では35U.S.C.101に従う)媒体を包含するものとし、具体的には、コンピューター可読(記憶)媒体を含む請求項が有効になるために除外が必要である限りは、事実上非法定であるあらゆる媒体を除外するものとする。既知の法定のコンピューター可読媒体の例としてハードウェア(ほんの数例として、レジスタ、ランダムアクセスメモリ(RAM)、不揮発性(NV)記憶装置)が挙げられるが、ハードウェアに限定されてもされなくてもよい。
【0035】
本願で用いられる略称の例として、DASHクライアント等の「ユーザーイクイップメント」を意味するUEと、LTEにおける「Evolved Node B」(別称基地局)を意味するeNodeBが挙げられる。
【0036】
図4は、本開示の原理に係るDASHベースシステムにおいて用いられる修正MPD400の階層データモデルを示す。メディア・プレゼンテーション402は、1以上のPeriodを備える。各Periodは、本開示の原理に従って、時限メタデータを含むAdaptationSetを含む1以上のAdaptationSetを備える。以降、以下で詳述されるように、時限メタデータを含むAdaptationSetをMetadata Set404と称する場合がある。
【0037】
メディアAdaptationSetは、一度に提示されると見込まれるAdaptationSetの中で、ただ1つのリプレゼンテーションを伴う交互のリプレゼンテーションを含む。任意の1つのAdaptationSetに含まれるリプレゼンテーションは、全て同じメディアコンテンツ・コンポーネント(ビデオやオーディオ等)を表す。リプレゼンテーションは、該リプレゼンテーションに存在するメディアコンテンツ・コンポーネントのメディアコンテンツ・コンポーネント・プロパティ、例えば@lang属性によって記述されるような言語、@contentType属性によって記述されるメディアコンポーネントの種類、@par属性によって記述されるような画像アスペクト比、Roleエレメントによって記述されるようなロールプロパティ、Accessibilityエレメントによって記述されるようなアクセシビリティプロパティ、Viewpointエレメントによって記述されるような視点プロパティ、Ratingエレメントによって記述されるような評価プロパティ等に従って、AdaptationSetへと配置される。
【0038】
リプレゼンテーションは、各メディアコンテンツ・コンポーネントのこれらのメディアコンテンツ・コンポーネント・プロパティの全てについて同一の値をもつ場合且つその場合に限り、同じAdaptationSetに現れる。
【0039】
ContentComponentエレメントは、AdaptationSetエレメントとエレメントおよび属性を共有する。初期値または全てのメディアコンテンツ・コンポーネントに適用可能な値は、AdaptationSetエレメントにおいて直接的に提供されてよい。AdaptationSetエレメントは、含まれるリプレゼンテーションに関連する@bandwidth、@width、@heightおよび@frameRateの属性の範囲の記述をサポートし、それらは特定のAdaptationSetの中の全てのリプレゼンテーションに関する全ての値の概要を提供する。AdaptationSetは更に、@group属性を用いてグループへと配置されてよい。
【0040】
次に
図5を参照する。
図5は、DASHベースシステムにおける、新しい属性@associateSetIdを含むAdaptationSetレベルのシグナリングに関するエレメントおよび属性を示す。メタデータリプレゼンテーションとメディアリプレゼンテーションとの関係を表現するために、本開示は、AdaptationSetレベルの属性(@associateSetId)を提供する。この属性は、メタデータリプレゼンテーションを含むAdaptationSetと関連するメディアリプレゼンテーションを含むAdaptationSetの@idの値をリストする。@codecs属性は、AdaptationSetがメタデータリプレゼンテーションまたはメディアリプレゼンテーションを含むか否かを識別する。
【0041】
次に
図6を参照する。
図6は、DASHベースシステムにおける、新しい属性@associateRepIdを含むRepresentationレベルのシグナリングに関するエレメントおよび属性を示す。別の実施形態によれば、属性@associateRepIdは、関連AdaptationSetの中でメタデータリプレゼンテーションが関連するメディアリプレゼンテーションをリストする該メタデータリプレゼンテーションに関して、Representationレベルで開示される。メタデータリプレゼンテーションが複数のリプレゼンテーションに関してメタデータを含む場合(例えば、メタデータリプレゼンテーションが複数のメタデータトラックを含み、各メタデータトラックは、メディアリプレゼンテーションにおけるメディアトラックに関する品質情報を搬送する)、メタデータリプレゼンテーションは全てのメディアリプレゼンテーションに関連し、このとき、AdaptationSetでの関連が存在する場合、@assoicateRepId属性は省略されてよい。
【0042】
図7は、1つのメタデータリプレゼンテーションにつき1つのメディアリプレゼンテーションの図を示す。メタデータリプレゼンテーションは、1つのメディアリプレゼンテーションについてメタデータを搬送するメタデータトラックを1つ含む。品質情報について、具体的には、AdaptationSetの中のリプレゼンテーションに関してセグメントデュレーションが異なる場合、それが生じてよい。
【0043】
図8を参照する。
図8は、1つのメタデータリプレゼンテーションにつき1つのメディアリプレゼンテーションの場合の例示的なMPD800を示す。例示的なMPD800は@idが“video_quality”であるAdaptationSet802を含み、AdaptationSet802は、@idが“video”であるメディアリプレゼンテーションを含むAdaptationSet804と関連するメタデータリプレゼンテーションを含む。AdaptationSet802での属性“codecs”の値は、メタデータの種類が“video quality”であり、メトリックが“psnr”であることを示す。3つのメタデータリプレゼンテーションがある。各メタデータリプレゼンテーションは、その@idの値が属性@associateRepIdにリストされる対応メディアリプレゼンテーションに関する品質情報を搬送する。メタデータリプレゼンテーションのセグメントURLはメディアリプレゼンテーションのテンプレートと同様のテンプレートを用いて与えられるが、パスすなわちBaseURLは異なる。メタデータセグメントファイルの拡張子は“mp4m”である。
【0044】
図9は、1つのメタデータリプレゼンテーションにつき複数のメディアリプレゼンテーションの図を示す。メタデータリプレゼンテーションは、複数のメディアリプレゼンテーションに関するメタデータを搬送する複数のメタデータトラックを含む。品質情報について、具体的には、AdaptationSetの中のメディアリプレゼンテーションのセグメントが時間的に整合される場合、それが生じてよい。この配置は、全てのリプレゼンテーションに関するメタデータの回収を促進するためである。
【0045】
次に、
図10は、1つのメタデータリプレゼンテーションにつき複数のメディアリプレゼンテーションの場合の例示的なMPD1000を示す。メタデータリプレゼンテーションを含む@idが“video_quality”であるAdaptationSet1002があり、AdaptationSet1002は、@idが“video”であるメディアリプレゼンテーションを含むAdaptationSet1004と関連する。AdaptationSet1002での属性“codec”の値は、メタデータが品質タイプであり、メトリックが“psnr”であることを示す。AdaptationSet1004においてメディアリプレゼンテーションは時間的に整合されるので、それらの品質情報は多重化され、3つのメタデータトラックを有する1つのメタデータリプレゼンテーションに含まれる。各メタデータトラックは、メディアリプレゼンテーションのメディアトラックに対応する。メタデータリプレゼンテーションのセグメントURLはメディアリプレゼンテーションのテンプレートと同様のテンプレートを用いて与えられるが、パスすなわちBaseURLは異なる。メタデータセグメントファイルの拡張子は“mp4m”である。
【0046】
メタデータトラックのセグメントは、他のメディアセグメントと同様に、自己完結型の連続的、完全なアクセスユニットのグループを備える。メディアセグメントが2以上のメディアサブセグメントを含む場合、メタデータセグメントおよびその関連メディアセグメントは、セグメント境界またはサブセグメント境界において時間的に整合される。
【0047】
メタデータ(例えば品質情報)は、メディアコンテンツに影響を与えることなく容易に追加または変更することができ、コンテンツ作成の異なる段階でメディアコンテンツおよびメタデータを生成できるようにする。例えば、MPDの品質情報メタデータを更新することにより、生放送サービスがサポートされる。
【0048】
品質情報がMPDの各セグメントに伝えられる場合、MPDのサイズは非常に大きくなり、結果として起動の遅延が生じてしまう。リプレゼンテーションにおいて品質情報を提供することにより、MPDは膨張せず、したがって、起動の遅延は増大しない。
【0049】
本開示は、例えば(ただしこれに限定されない)インターネットTV(IPTVサービス)等の応用のために、モバイル端末だけでなく有線端末(例えばメディアホームゲートウェイ)にも幅広く適用される。
図11は、本開示に係る、シグナリングを用いて改良型無線受信部をサポートする例示的な通信システム100を示す。該して、システム100は、複数の無線ユーザーがデータその他のコンテンツを送受信することを可能にする。システム100は、符号分割多元接続(CDMA)、時間分割多元接続(TDMA)、周波数分割多元接続(FDMA)、直交FDMA(OFDMA)、単一キャリアFDMA(SC−FDMA)等の、1以上のチャネルアクセス方法を実施してよい。
【0050】
この例では、通信システム100は、ユーザーイクイップメント(UE)110a〜110c、無線アクセスネットワーク(RAN)120a,120b、コアネットワーク130、公衆交換電話網(PSTN)140、インターネット150および他のネットワーク160を備える。このようなコンポーネントまたはエレメントのいくつかを
図3に示すが、このようなコンポーネントまたはエレメントはシステム100にいくつ含まれてもよい。
【0051】
UE110a〜110cは、システム100において動作および/または通信するように構成される。例えば、UE110a〜110cは、無線信号を送信および/または受信ように構成される。各UE110a〜110cは任意の適切なエンドユーザー装置を表し、ユーザーイクイップメント/装置(UE)、無線送受信ユニット(WTRU)、移動局、固定またはモバイルの加入者ユニット、ポケットベル、携帯電話、PDA(personal digital assistant)、スマートフォン、ラップトップ、コンピューター、タッチパッド、無線センサー、家庭用電子機器等の装置を含んでよい(或いは称されてよい)。
【0052】
ここで、RAN120a,120bはそれぞれ基地局170a,170bを含む。各基地局170a,170bは、コアネットワーク130、PSTN140、インターネット150および/またはその他のネットワーク160へのアクセスを可能にするために、UE110a〜110cのうち1以上と無線でインターフェースを取るように構成される。例えば、基地局170a,170bは、ベース・トランシーバ・ステーション(BTS)、ノードB(NodeB)、次世代ノードB(eNodeB)、ホームノードB、ホームeNodeB、サイトコントローラ、アクセスポイント(AP)、無線ルーター等の、いくつかの周知の装置の1以上を含んでよい(いくつかの周知の装置であってよい)。
【0053】
図11に示される実施形態では、基地局170aはRAN120a(他の基地局、エレメントおよび/または装置を有してよい)の一部を形成する。また、基地局170bは、RAN120b(他の基地局、エレメントおよび/または装置を有してよい)の一部を形成する。各基地局170a,170bは、特定の地理的地域または領域(「セル」と称されることがある)内で無線信号を送信および/または受信するように動作する。一部の実施形態において、各セルに複数の送受信部を有するMIMO(multiple-input multiple-output)技術が採用されてよい。
【0054】
基地局170a,170bは、無線通信リンクを用いる1以上の無線インターフェース190を介して、UE110a〜110cのうち1以上と通信する。無線インターフェース190は、任意の適切な無線アクセス技術を利用してよい。
【0055】
システム100は、上述のスキームを含む多重チャネルアクセス機能を用いてよいと考えられる。特定の実施形態において、基地局およびUEは、LTE、LTE−Aおよび/またはLTE−Bを実現する。当然ながら、他の多重アクセススキームおよび無線プロトコルが利用されてよい。
【0056】
RAN120a,120bは、UE110a〜110cに音声、データ、アプリケーション、ボイス・オーバー・インターネット・プロトコル(VoIP)その他のサービスを提供するために、コアネットワーク130と通信する。当然ながら、RAN120a〜120bおよび/またはコアネットワーク130は、1以上の他のRAN(図示なし)と直接的または間接的に通信してよい。また、コアネットワーク130は、他のネットワーク(例えばPSTN140、インターネット150その他のネットワーク160)に関してゲートウェイアクセスとして機能してよい。加えて、UE110a〜110cの一部または全部は、異なる無線技術および/またはプロトコルを用いる異なる無線リンクを介して、異なる無線ネットワークと通信する機能を有してよい。
【0057】
図11に通信システムの一例を示したが、
図11に対して様々な変更がなされてよい。例えば、通信システム100は、任意の数のUE、基地局、ネットワークその他のコンポーネントを任意の適切な構成で備えることができ、更に、図面のいずれかに示されるEPCを備えることができる。
図12Aおよび
図12Bは、本開示に係る方法および教示を実施可能な例示的な装置を示す。特に、
図12Aは例示的なUE110を示し、
図12Bは例示的な基地局170を示す。これらのコンポーネントは、システム100その他の任意の適切なシステムにおいて用いられてよい。
【0058】
図12Aに示されるように、UE110は少なくとも1つの処理ユニット200を有する。処理ユニット200は、UE110の様々な処理工程を実施する。例えば、処理ユニット200は、信号符号化、データ処理、電力制御、入出力処理その他の、UE110をシステム100において動作できるようにする任意の機能を実行することができる。また、処理ユニット200は、上記で詳述された方法および教示をサポートすることができる。各処理ユニット200は、1以上の工程を実行するように構成される任意の適切な処理装置またはコンピューター装置を有する。各処理ユニット200は、例えば、マイクロプロセッサ、マイクロコントローラ、デジタル信号プロセッサ、フィールド・プログラマブル・ゲート・アレイまたは特定用途向け集積回路を有することができる。
【0059】
また、UE110は少なくとも1つの送受信部202を有する。送受信部202は、少なくとも1つのアンテナ204による伝送のためにデータまたは他のコンテンツを変調するように構成される。また、送受信部202は、少なくとも1つのアンテナ204によって受信されたデータまたは他のコンテンツを復調するように構成される。各送受信部202は、無線伝送用の信号の生成および/または無線で受信された信号の処理のための、任意の適切な構造を有する。各アンテナ204は、無線信号の送信および/または受信のための任意の適切な構造を有する。1以上の送受信部202がUE110において用いられてよく、1以上のアンテナ204がUE110において用いられてよい。単一の機能的ユニットとして示されているが、送受信部202は、少なくとも1つの送信部と少なくとも1つの別々の受信部とを用いて実現されてもよい。
【0060】
UE110は更に、1以上の入出力装置206を有する。入出力装置206は、ユーザーとのインタラクションを促進する。各入出力装置206は、スピーカー、マイク、キーパッド、キーボード、ディスプレイ、タッチスクリーン等の、ユーザーへの情報提供またはユーザーからの情報受信に適した任意の構造を有する。
【0061】
加えて、UE110は少なくとも1つのメモリ208を有する。メモリ208は、UE110によって使用され、生成され、または収集される命令およびデータを保存する。例えば、メモリ208は、処理ユニット200によって実行されるソフトウェアまたはファームウェア命令と、受信信号における干渉の低減または除去に用いられるデータとを保存することができる。各メモリ208は、任意の適切な揮発性および/または不揮発性の保存検索装置を有する。ランダムアクセスメモリ(RAM)、リードオンリーメモリ(ROM)、ハードディスク、光ディスク、加入者識別モジュール(SIM)カード、メモリスティック、セキュアデジタル(SD)メモリカード等の、任意の適切な種類のメモリが採用されてよい。
【0062】
図12Bに示されるように、基地局170は、少なくとも1つの処理ユニット250と、少なくとも1つの送信部252と、少なくとも1つの受信部254と、1以上のアンテナ256と、少なくとも1つのメモリ258とを有する。処理ユニット250は、信号符号化、データ処理、電力制御、入出力処理その他の機能等の、基地局170の様々な処理工程を実施する。また、処理ユニット250は、上記で詳述された方法および教示をサポートすることができる。各処理ユニット250は、1以上の工程を実行するように構成される任意の適切な処理装置またはコンピューター装置を有する。各処理ユニット250は、例えば、マイクロプロセッサ、マイクロコントローラ、デジタル信号プロセッサ、フィールド・プログラマブル・ゲート・アレイまたは特定用途向け集積回路を有することができる。
【0063】
各送信部252は、1以上のUEその他の装置への無線伝送のための信号生成に適した任意の構造を有する。各受信部254は、1以上のUEその他の装置から無線で受信された信号の処理に適した任意の構造を有する。別々のコンポーネントとして示されているが、少なくとも1つの送信部252と少なくとも1つの受信部254とは、送受信部として組み合わせることができる。各アンテナ256は、無線信号の送信および/または受信に適した任意の構造を有する。ここでは共通のアンテナ256が送信部252と受信部254との両方に結合されるものとして示されているが、1以上のアンテナ256が送信部252に結合されてよく、1以上の別々のアンテナ256が受信部254に結合されてよい。各メモリ258は、任意の適切な揮発性および/または不揮発性の保存検索装置を有する。
【0064】
UE110および基地局170に関する更なる詳細は当業者に既知である。そのようなものとして、明確にするために、ここではそのような詳細を省略する。
【0065】
加えて、EPCおよび/またはEPCコントローラは、
図12Bに示されるような様々な装置またはコンポーネントを有してよく、例えば、プロセッサもしくは処理システム、メモリ、ネットワークインターフェース、I/O装置および/もしくは無線送信部/受信部、またはそれらの組合わせを有してよい。
【0066】
本開示は特定の実施形態と一般に関連する方法を記載したが、当業者には、これらの実施形態および方法の代替および置換が明らかであろう。したがって、上記の例示的な実施形態の説明は、本開示を定義も制限もしない。特許請求の範囲によって定めされる本開示の趣旨および範囲から逸脱することなく、他の変更、置換および代替も可能である。