IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ クアルコム,インコーポレイテッドの特許一覧

特表2025-503414適応ストリーミングのための動的解像度変更ヒント
<>
  • 特表-適応ストリーミングのための動的解像度変更ヒント 図1
  • 特表-適応ストリーミングのための動的解像度変更ヒント 図2
  • 特表-適応ストリーミングのための動的解像度変更ヒント 図3
  • 特表-適応ストリーミングのための動的解像度変更ヒント 図4
  • 特表-適応ストリーミングのための動的解像度変更ヒント 図5
  • 特表-適応ストリーミングのための動的解像度変更ヒント 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2025-02-04
(54)【発明の名称】適応ストリーミングのための動的解像度変更ヒント
(51)【国際特許分類】
   H04N 21/435 20110101AFI20250128BHJP
   H04N 19/70 20140101ALI20250128BHJP
   H04N 19/33 20140101ALI20250128BHJP
【FI】
H04N21/435
H04N19/70
H04N19/33
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024534750
(86)(22)【出願日】2023-01-03
(85)【翻訳文提出日】2024-06-11
(86)【国際出願番号】 US2023060016
(87)【国際公開番号】W WO2023133365
(87)【国際公開日】2023-07-13
(31)【優先権主張番号】17/647,435
(32)【優先日】2022-01-07
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.3GPP
2.Blu-ray
(71)【出願人】
【識別番号】507364838
【氏名又は名称】クアルコム,インコーポレイテッド
(74)【代理人】
【識別番号】100108453
【弁理士】
【氏名又は名称】村山 靖彦
(74)【代理人】
【識別番号】100163522
【弁理士】
【氏名又は名称】黒田 晋平
(72)【発明者】
【氏名】トーマス・ストックハンマー
(72)【発明者】
【氏名】イメド・ブアジジ
【テーマコード(参考)】
5C159
5C164
【Fターム(参考)】
5C159MA32
5C159PP04
5C159RC11
5C159SS06
5C159UA02
5C159UA05
5C164FA06
5C164MA02S
5C164MB41S
5C164SC03S
5C164UB11P
5C164UB23S
5C164UB24S
(57)【要約】
メディアデータを取り出すための例示的なデバイスが、ビデオデータを記憶するように構成されたメモリと、ビデオデータを復号するように構成されたビデオデコーダと、回路機構で実装された1つ又は複数のプロセッサであって、メディアプレゼンテーションが第1の空間解像度での第1のビデオデータと第2の空間解像度での第2のビデオデータとを含むと判定し、第2の空間解像度が第1の空間解像度とは異なり、第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分を受信し、第1の空間解像度での第1のビデオデータの第1の部分をビデオデコーダに送信し、第1の再生時間よりも後の第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分を受信し、第2の空間解像度での第2のビデオデータの第2の部分をビデオデコーダに送信する、ように構成されている、1つ又は複数のプロセッサと、を含む。
【特許請求の範囲】
【請求項1】
メディアデータを受信する方法であって、
メディアプレゼンテーションが第1の空間解像度での第1のビデオデータと第2の空間解像度での第2のビデオデータとを含むと判定することであって、前記第2の空間解像度が前記第1の空間解像度とは異なる、ことと、
第1の再生時間に関する前記第1の空間解像度での前記第1のビデオデータの第1の部分を受信することと、
前記第1の空間解像度での前記第1のビデオデータの前記第1の部分をビデオデコーダに送信することと、
前記第1の再生時間よりも後の第2の再生時間に関する前記第2の空間解像度での前記第2のビデオデータの第2の部分を受信することと、
前記第2の空間解像度での前記第2のビデオデータの前記第2の部分を前記ビデオデコーダに送信することと、
を含む、方法。
【請求項2】
前記メディアプレゼンテーションのためのアドレス指定可能リソースインデックス(ARI)トラックであって、前記ARIトラックが、前記第1の再生時間に関する前記第1の空間解像度での前記第1のビデオデータのための第1の品質と、前記第1の再生時間に関する前記第2の空間解像度での前記第2のビデオデータの第2の品質とを表すデータを含む、ARIトラックを受信することと、
前記第1の品質が前記第2の品質よりも高いと判定することと、を更に含み、
前記第1の再生時間に関する前記第1の空間解像度での前記第1のビデオデータの前記第1の部分を受信することが、前記第1の品質が前記第2の品質よりも高いと判定したことに応答して、前記第1の再生時間に関する前記第2の空間解像度での前記第2のビデオデータの代わりに、前記第1の再生時間に関する前記第1の空間解像度での前記第1のビデオデータの前記第1の部分を取り出すことを含む、請求項1に記載の方法。
【請求項3】
前記第2の空間解像度が前記第1の空間解像度よりも高い、請求項2に記載の方法。
【請求項4】
前記第1の再生時間に関する前記第1の空間解像度での前記第1のビデオデータが、前記第1の再生時間に関する前記第2の空間解像度での前記第2のビデオデータに等しいビットレートを有する、請求項2に記載の方法。
【請求項5】
前記第1の品質及び前記第2の品質が、空間解像度及びビットレート以外の1つ又は複数の品質測定値を表す、請求項2に記載の方法。
【請求項6】
前記ARIトラックが、前記第2の再生時間における前記第1の空間解像度での前記第1のビデオデータについての第3の品質と、前記第2の再生時間における前記第2の空間解像度での前記第2のビデオデータについての第4の品質とを表すデータを更に含み、前記方法が、前記第4の品質が前記第3の品質よりも高いと判定することを更に含み、
前記第2の再生時間に関する前記第2の空間解像度での前記第2のビデオデータの前記第2の部分を受信することが、前記第4の品質が前記第3の品質よりも高いと判定したことに応答して、前記第2の再生時間に関する前記第1の空間解像度での前記第1のビデオデータの代わりに、前記第2の再生時間に関する前記第2の空間解像度での前記第2のビデオデータの前記第2の部分を取り出すことを含む、請求項2に記載の方法。
【請求項7】
前記第1の空間解像度が前記第2の空間解像度よりも高い、請求項6に記載の方法。
【請求項8】
前記第2の再生時間に関する前記第1の空間解像度での前記第1のビデオデータが、前記第2の再生時間に関する前記第2の空間解像度での前記第2のビデオデータに等しいビットレートを有する、請求項6に記載の方法。
【請求項9】
前記第3の品質及び前記第4の品質が、空間解像度及びビットレート以外の1つ又は複数の品質測定値を表す、請求項6に記載の方法。
【請求項10】
前記メディアプレゼンテーションが、前記第1の空間解像度での前記第1のビデオデータを含む第1の表現と、前記第2の空間解像度での前記第2のビデオデータを含む第2の表現とを含み、前記メディアプレゼンテーションが、前記第1の表現と前記第2の表現の両方を含む切り替えセットを含む、請求項1に記載の方法。
【請求項11】
前記第1の再生時間に関する前記第1の空間解像度での前記第1のビデオデータの前記第1の部分を受信することが、ミドルウェアユニットによって、ブロードキャストを介して前記第1の再生時間に関する前記第1の空間解像度での前記第1のビデオデータの前記第1の部分を受信することを含み、前記方法が、
前記ミドルウェアユニットによって、前記第1の再生時間に関する前記第1の空間解像度での前記第1のビデオデータの前記第1の部分をキャッシュすることと、
動的適応ストリーミングオーバーHTTP(DASH)クライアントによって、前記ミドルウェアユニットから、前記第1の再生時間に関する前記第1の空間解像度での前記第1のビデオデータの前記第1の部分を取り出すことと、
を更に含む、請求項1に記載の方法。
【請求項12】
前記第2の再生時間に関する前記第2の空間解像度での前記第2のビデオデータの前記第2の部分を受信することが、ミドルウェアユニットによって、ブロードキャストを介して前記第2の再生時間に関する前記第2の空間解像度での前記第2のビデオデータの前記第2の部分を受信することを含み、前記方法は、
前記ミドルウェアユニットによって、前記第2の再生時間に関する前記第2の空間解像度での前記第2のビデオデータの前記第2の部分をキャッシュすることと、
動的適応ストリーミングオーバーHTTP(DASH)クライアントによって、前記ミドルウェアユニットから、前記第2の再生時間に関する前記第2の空間解像度での前記第2のビデオデータの前記第2の部分を取り出すことと、
を更に含む、請求項1に記載の方法。
【請求項13】
メディアデータを取り出すためのデバイスであって、
ビデオデータを記憶するように構成されたメモリと、
前記ビデオデータを復号するように構成されたビデオデコーダと、
回路機構で実装された1つ又は複数のプロセッサであって、
メディアプレゼンテーションが第1の空間解像度での第1のビデオデータと第2の空間解像度での第2のビデオデータとを含むと判定し、前記第2の空間解像度が前記第1の空間解像度とは異なり、
第1の再生時間に関する前記第1の空間解像度での前記第1のビデオデータの第1の部分を受信し、
前記第1の空間解像度での前記第1のビデオデータの前記第1の部分を前記ビデオデコーダに送信し、
前記第1の再生時間よりも後の第2の再生時間に関する前記第2の空間解像度での前記第2のビデオデータの第2の部分を受信し、
前記第2の空間解像度での前記第2のビデオデータの前記第2の部分を前記ビデオデコーダに送信する、ように構成されている、1つ又は複数のプロセッサと、
を備える、デバイス。
【請求項14】
前記1つ又は複数のプロセッサが、
前記メディアプレゼンテーションのためのアドレス指定可能リソースインデックス(ARI)トラックを受信し、前記ARIトラックが、前記第1の再生時間に関する前記第1の空間解像度での前記第1のビデオデータのための第1の品質と、前記第1の再生時間に関する前記第2の空間解像度での前記第2のビデオデータの第2の品質とを表すデータを含み、
前記第1の品質が前記第2の品質よりも高いと判定する、ように更に構成されており、
前記1つ又は複数のプロセッサが、前記第1の品質が前記第2の品質よりも高いと判定したことに応答して、前記第1の再生時間に関する前記第2の空間解像度での前記第2のビデオデータの代わりに、前記第1の再生時間に関する前記第1の空間解像度での前記第1のビデオデータの前記第1の部分を取り出すように構成されている、
請求項13に記載のデバイス。
【請求項15】
前記第2の空間解像度が前記第1の空間解像度よりも高い、請求項14に記載のデバイス。
【請求項16】
前記第1の再生時間に関する前記第1の空間解像度での前記第1のビデオデータが、前記第1の再生時間に関する前記第2の空間解像度での前記第2のビデオデータに等しいビットレートを有する、請求項14に記載のデバイス。
【請求項17】
前記第1の品質及び前記第2の品質が、空間解像度及びビットレート以外の1つ又は複数の品質測定値を表す、請求項14に記載のデバイス。
【請求項18】
前記ARIトラックが、前記第2の再生時間における前記第1の空間解像度での前記第1のビデオデータについての第3の品質と、前記第2の再生時間における前記第2の空間解像度での前記第2のビデオデータについての第4の品質とを表すデータを更に含み、前記1つ又は複数のプロセッサが、前記第4の品質が前記第3の品質よりも高いと判定するように更に構成されおり、
前記1つ又は複数のプロセッサが、前記第4の品質が前記第3の品質よりも高いと判定したことに応答して、前記第2の再生時間に関する前記第1の空間解像度での前記第1のビデオデータの代わりに、前記第2の再生時間に関する前記第2の空間解像度での前記第2のビデオデータの前記第2の部分を取り出すように構成されている、
請求項14に記載のデバイス。
【請求項19】
前記第1の空間解像度が前記第2の空間解像度よりも高い、請求項18に記載のデバイス。
【請求項20】
前記第2の再生時間に関する前記第1の空間解像度での前記第1のビデオデータが、前記第2の再生時間に関する前記第2の空間解像度での前記第2のビデオデータに等しいビットレートを有する、請求項18に記載のデバイス。
【請求項21】
前記第3の品質及び前記第4の品質が、空間解像度及びビットレート以外の1つ又は複数の品質測定値を表す、請求項18に記載のデバイス。
【請求項22】
前記メディアプレゼンテーションが、前記第1の空間解像度での前記第1のビデオデータを含む第1の表現と、前記第2の空間解像度での前記第2のビデオデータを含む第2の表現とを含み、前記メディアプレゼンテーションが、前記第1の表現と前記第2の表現の両方を含む切り替えセットを含む、請求項13に記載のデバイス。
【請求項23】
ブロードキャストを介して前記第1の再生時間に関する前記第1の空間解像度での前記第1のビデオデータの前記第1の部分を受信し、ブロードキャストを介して前記第1の再生時間に関する前記第1の空間解像度での前記第1のビデオデータの第1の部分をキャッシュするように構成されたミドルウェアユニットを更に備え、前記1つ又は複数のプロセッサが、前記ミドルウェアユニットから前記第1の再生時間に関する前記第1の空間解像度での前記第1のビデオデータの前記第1の部分を取り出すために、動的適応ストリーミングオーバーHTTP(DASH)クライアントを実行するように構成されている、請求項13に記載のデバイス。
【請求項24】
ブロードキャストを介して前記第2の再生時間に関する前記第2の空間解像度での前記第2のビデオデータの前記第2の部分を受信し、ブロードキャストを介して前記第2の再生時間に関する前記第2の空間解像度での前記第2のビデオデータの第2の部分をキャッシュするように構成されたミドルウェアユニットを更に備え、前記1つ又は複数のプロセッサが、前記ミドルウェアユニットから前記第2の再生時間に関する前記第2の空間解像度での前記第2のビデオデータの前記第2の部分を取り出すために、動的適応ストリーミングオーバーHTTP(DASH)クライアントを実行するように構成されている、請求項13に記載のデバイス。
【請求項25】
前記デバイスが、
集積回路、
マイクロプロセッサ、
ワイヤレス通信デバイス
のうちの少なくとも1つを備える、請求項13に記載のデバイス。
【請求項26】
命令を記憶したコンピュータ可読記憶媒体であって、前記命令は、実行されると、プロセッサに、
メディアプレゼンテーションが第1の空間解像度での第1のビデオデータと第2の空間解像度での第2のビデオデータとを含むと判定させ、前記第2の空間解像度が前記第1の空間解像度とは異なり、
第1の再生時間に関する前記第1の空間解像度での前記第1のビデオデータの第1の部分を受信させ、
前記第1の空間解像度での前記第1のビデオデータの前記第1の部分をビデオデコーダに送信させ、
前記第1の再生時間よりも後の第2の再生時間に関する前記第2の空間解像度での前記第2のビデオデータの第2の部分を受信させ、
前記第2の空間解像度での前記第2のビデオデータの前記第2の部分を前記ビデオデコーダに送信させる、
コンピュータ可読記憶媒体。
【請求項27】
前記プロセッサに、
前記メディアプレゼンテーションのためのアドレス指定可能リソースインデックス(ARI)トラックを受信させ、前記ARIトラックが、前記第1の再生時間に関する前記第1の空間解像度での前記第1のビデオデータのための第1の品質と、前記第1の再生時間に関する前記第2の空間解像度での前記第2のビデオデータの第2の品質とを表すデータを含み、
前記第1の品質が前記第2の品質よりも高いと判定させる、命令を更に含み、
前記プロセッサに、前記第1の再生時間に関する前記第1の空間解像度での前記第1のビデオデータの前記第1の部分を受信させる前記命令が、前記第1の品質が前記第2の品質よりも高いと判定したことに応答して、前記プロセッサに、前記第1の再生時間に関する前記第2の空間解像度での前記第2のビデオデータの代わりに、前記第1の再生時間に関する前記第1の空間解像度での前記第1のビデオデータの前記第1の部分を取り出させる命令を含む、
請求項26に記載のコンピュータ可読記憶媒体。
【請求項28】
前記第2の空間解像度が前記第1の空間解像度よりも高い、請求項27に記載のコンピュータ可読記憶媒体。
【請求項29】
前記第1の再生時間に関する前記第1の空間解像度での前記第1のビデオデータが、前記第1の再生時間に関する前記第2の空間解像度での前記第2のビデオデータに等しいビットレートを有する、請求項27に記載のコンピュータ可読記憶媒体。
【請求項30】
前記第1の品質及び前記第2の品質が、空間解像度及びビットレート以外の1つ又は複数の品質測定値を表す、請求項27に記載のコンピュータ可読記憶媒体。
【請求項31】
前記ARIトラックが、前記第2の再生時間における前記第1の空間解像度での前記第1のビデオデータについての第3の品質と、前記第2の再生時間における前記第2の空間解像度での前記第2のビデオデータについての第4の品質とを表すデータを更に含み、前記プロセッサに、前記第4の品質が前記第3の品質よりも高いと判定させる命令を前記更に備え、
前記プロセッサに、前記第2の再生時間に関する前記第2の空間解像度での前記第2のビデオデータの前記第2の部分を受信させる前記命令が、前記第4の品質が前記第3の品質よりも高いと判定したことに応答して、前記プロセッサに、前記第2の再生時間に関する前記第1の空間解像度での前記第1のビデオデータの代わりに、前記第2の再生時間に関する前記第2の空間解像度での前記第2のビデオデータの前記第2の部分を取り出させる命令を含む、
請求項27に記載のコンピュータ可読記憶媒体。
【請求項32】
前記第1の空間解像度が前記第2の空間解像度よりも高い、請求項31に記載のコンピュータ可読記憶媒体。
【請求項33】
前記第2の再生時間に関する前記第1の空間解像度での前記第1のビデオデータが、前記第2の再生時間に関する前記第2の空間解像度での前記第2のビデオデータに等しいビットレートを有する、請求項31に記載のコンピュータ可読記憶媒体。
【請求項34】
前記第3の品質及び前記第4の品質が、空間解像度及びビットレート以外の1つ又は複数の品質測定値を表す、請求項31に記載のコンピュータ可読記憶媒体。
【請求項35】
前記メディアプレゼンテーションが、前記第1の空間解像度での前記第1のビデオデータを含む第1の表現と、前記第2の空間解像度での前記第2のビデオデータを含む第2の表現とを含み、前記メディアプレゼンテーションが、前記第1の表現と前記第2の表現の両方を含む切り替えセットを含む、請求項26に記載のコンピュータ可読記憶媒体。
【請求項36】
前記プロセッサに、前記第1の再生時間に関する前記第1の空間解像度での前記第1のビデオデータの前記第1の部分を受信させる前記命令が、前記プロセッサに、ミドルウェアユニットから、前記第1の再生時間に関する前記第1の空間解像度での前記第1のビデオデータの前記第1の部分を取り出させる命令を含む、請求項26に記載のコンピュータ可読記憶媒体。
【請求項37】
前記プロセッサに、前記第2の再生時間に関する前記第2の空間解像度での前記第2のビデオデータの前記第2の部分を受信させる前記命令が、前記プロセッサに、ミドルウェアユニットから、前記第2の再生時間に関する前記第2の空間解像度での前記第2のビデオデータの前記第2の部分を取り出させる命令を含む、請求項26に記載のコンピュータ可読記憶媒体。
【請求項38】
メディアデータを取り出すためのデバイスであって、
メディアプレゼンテーションが第1の空間解像度での第1のビデオデータと第2の空間解像度での第2のビデオデータとを含むと判定するための手段であって、前記第2の空間解像度が前記第1の空間解像度とは異なる、手段と、
第1の再生時間に関する前記第1の空間解像度での前記第1のビデオデータの第1の部分を受信するための手段と、
前記第1の空間解像度での前記第1のビデオデータの前記第1の部分をビデオデコーダに送信するための手段と、
前記第1の再生時間よりも後の第2の再生時間に関する前記第2の空間解像度での前記第2のビデオデータの第2の部分を受信するための手段と、
前記第2の空間解像度での前記第2のビデオデータの前記第2の部分を前記ビデオデコーダに送信するための手段と、
を備える、デバイス。
【発明の詳細な説明】
【技術分野】
【0001】
本出願は、2022年01月07日に出願された米国特許出願第17/647,435号の優先権を主張し、その内容全体が参照により本明細書に組み込まれる。
【0002】
本開示は、符号化ビデオデータの記憶及び転送に関する。
【背景技術】
【0003】
デジタルビデオ機能は、デジタルテレビジョン、デジタルダイレクトブロードキャストシステム、ワイヤレスブロードキャストシステム、携帯情報端末(PDA)、ラップトップコンピュータ又はデスクトップコンピュータ、デジタルカメラ、デジタル記録デバイス、デジタルメディアプレーヤ、ビデオゲームデバイス、ビデオゲームコンソール、セルラー電話又は衛星無線電話、ビデオ会議デバイスなどを含む、幅広いデバイスに組み込まれ得る。デジタルビデオデバイスは、デジタルビデオ情報をより効率的に送受信するために、MPEG-2、MPEG-4、ITU-T H.263又はITU-T H.264/MPEG-4,Part10、アドバンストビデオコーディング(AVC)、ITU-T H.265(高効率ビデオコーディング(HEVC)とも呼ばれる)によって定められた規格、及び、そのような規格の拡張に記載されているものなどのビデオ圧縮技法を実装する。
【0004】
ビデオ圧縮技法は、空間的予測及び/又は時間的予測を実施し、ビデオシーケンスに固有の冗長性を低減又は除去する。ブロックベースのビデオコーディングの場合、ビデオフレーム又はスライスがマクロブロックに区分され得る。各マクロブロックは更に区分され得る。イントラコーディングされた(I)フレーム又はスライスの中のマクロブロックは近隣のマクロブロックに関する空間的予測を使用して符号化される。インターコーディングされた(P又はB)フレーム又はスライスの中のマクロブロックは、同じフレーム又はスライスの中の近隣のマクロブロックに関する空間的予測又は他の参照フレームに関する時間的予測を使用し得る。
【0005】
ビデオデータが符号化された後、ビデオデータは送信又は記憶のためにパケット化されてもよい。ビデオデータは、AVCなどの国際標準化機構(ISO:International Organization for Standardization)ベースメディアファイルフォーマット及びその拡張のような、様々な規格のうちのいずれかに準拠するビデオファイルにアセンブルされ得る。
【発明の概要】
【課題を解決するための手段】
【0006】
概して、本開示は、様々な空間解像度を有するビデオデータをストリーミングするための技法について説明する。特に、2つ以上の表現が切り替えセットに含まれ得、表現は、異なる符号化された空間解像度を有するセグメントを含み得る。例えば、ある表現は、4K解像度(3840×2160)で符号化されたビデオデータを含み得、別の表現は、1080p解像度(1920×1080)で符号化されたビデオデータを含み得る。クライアントデバイスは、様々な表現の時間整合されたセグメントの品質値を判定し、より高い品質値を有するセグメントを取り出すことができる。
【0007】
一例では、ビデオデータを取り出す方法は、メディアプレゼンテーションが第1の空間解像度での第1のビデオデータと第2の空間解像度での第2のビデオデータとを含むと判定することであって、第2の空間解像度が第1の空間解像度とは異なる、ことと、第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分を受信することと、第1の空間解像度での第1のビデオデータの第1の部分をビデオデコーダに送信することと、第1の再生時間よりも後の第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分を受信することと、第2の空間解像度での第2のビデオデータの第2の部分をビデオデコーダに送信することと、を含む。
【0008】
別の例では、ビデオデータを取り出すためのデバイスが、ビデオデータを記憶するように構成されたメモリと、ビデオデータを復号するように構成されたビデオデコーダと、回路機構で実装された1つ又は複数のプロセッサであって、メディアプレゼンテーションが第1の空間解像度での第1のビデオデータと第2の空間解像度での第2のビデオデータとを含むと判定し、第2の空間解像度が第1の空間解像度とは異なり、第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分を受信し、第1の空間解像度での第1のビデオデータの第1の部分をビデオデコーダに送信し、第1の再生時間よりも後の第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分を受信し、第2の空間解像度での第2のビデオデータの第2の部分をビデオデコーダに送信する、ように構成されている、1つ又は複数のプロセッサと、を含む。
【0009】
別の例では、コンピュータ可読記憶媒体は命令を記憶しており、命令は、実行されると、プロセッサに、メディアプレゼンテーションが第1の空間解像度での第1のビデオデータと第2の空間解像度での第2のビデオデータとを含むと判定させ、第2の空間解像度が第1の空間解像度とは異なり、第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分を受信し、第1の空間解像度での第1のビデオデータの第1の部分をビデオデコーダに送信させ、第1の再生時間よりも後の第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分を受信し、第2の空間解像度での第2のビデオデータの第2の部分をビデオデコーダに送信する、ように構成されている、1つ又は複数のプロセッサと、を含む。
【0010】
別の例では、ビデオデータを取り出すためのデバイスは、メディアプレゼンテーションが第1の空間解像度での第1のビデオデータと第2の空間解像度での第2のビデオデータとを含むと判定するための手段であって、第2の空間解像度が第1の空間解像度とは異なる、手段と、第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分を受信するための手段と、第1の空間解像度での第1のビデオデータの第1の部分をビデオデコーダに送信するための手段と、第1の再生時間よりも後の第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分を受信するための手段と、第2の空間解像度での第2のビデオデータの第2の部分をビデオデコーダに送信するための手段と、を含む。
【0011】
1つ又は複数の例の詳細が、添付図面及び以下の説明に記載されている。他の特徴、目的、及び利点は、説明及び図面から、かつ特許請求の範囲から明らかになろう。
【図面の簡単な説明】
【0012】
図1】ネットワークを介してメディアデータをストリーミングするための技法を実装する例示的なシステムを示すブロック図である。
図2図1の取り出しユニットの構成要素の例示的なセットをより詳細に示すブロック図である。
図3】例示的なマルチメディアコンテンツの要素を示す概念図である。
図4】例示的なビデオファイルの要素を示すブロック図である。
図5】本開示の技法による取り出し技法の例を示す概念図である。
図6】本開示の技法による、メディアデータを取り出す例示的な方法を示すフローチャートである。
【発明を実施するための形態】
【0013】
概して、本開示は、ビデオデータをストリーミングするときにビデオ解像度間で動的に切り替えるための技法について説明する。ストリーミングビデオデータは、ユニキャストプロトコル、ブロードキャストプロトコル、又はマルチキャストプロトコルを介して実行され得る。例えば、ハイパーテキスト転送プロトコル(HTTP)は、例えば、動的適応ストリーミングオーバーHTTP(Dynamic Adaptive Streaming over HTTP:DASH)、HTTPライブストリーミング(HTTP Live Streaming:HLS)、又は他のそのようなプロトコルに従ってビデオデータをストリーミングするために使用され得る。別の例として、拡張マルチメディアブロードキャストマルチキャストサービス(eMBMS)、File Delivery over Unidirectional Transport(FLUTE)、Real-time Object-delivery over Unidirectional Transport(ROUTE)、リアルタイム転送プロトコル(RTP)、リアルタイムストリーミングプロトコル(RTSP)などのブロードキャスト又はマルチキャストプロトコルが、ビデオデータを配信するために使用され得る。ブロードキャストはまた、例えば電波を介してオーバージエア(over-the-air:OTA)で実行されてもよい。いくつかの例では、ブロードキャスト又はマルチキャストプロトコルは、クライアントデバイスのミドルウェアユニットがブロードキャスト又はマルチキャストセッションに関するクライアントとして、及びDASH又はHLSクライアントへのプロキシクライアントとして働き得るように、DASH又はHLSフォーマットビデオデータを配信し得る。
【0014】
デジタルビデオブロードキャスト(DVB)は、デジタルテレビに関する規格のグループである。DVBの規格は、現在、次世代ビデオコーデックのために開発されている。DVBのための文書CM-AVC0620は、「次世代ビデオコーデックのための商業的要件草案」を提供する。作業項目の主な目的は、TS 101 154(MPEG-2ビデオ、H.264/AVC、VC-1、H.265/HEVC)における既存のコーデックを超える新しいコーデックの追加に対処するが、商業的要件は、新しいフォーマット、並びにこれらのフォーマットを符号化及び消費する新しい方法にも対処する。
【0015】
TS 101 154の草案は、ITU-T H.266/Versatile Video Coding(VVC)符号化規格を使用する参照ピクチャリサンプリングの場合にのみ、解像度の動的変更の可能性について言及している。コンテンツの符号化のための動的解像度の使用は、既存のコーデックと共に使用されており、ビデオオンデマンド(VOD)ストリーミングサービスのためのいくつかのストリーミングサービスによって展開されている。本開示は、ビデオデータの動的解像度がライブストリーミング又はブロードキャストサービスのためにも展開され得ることを認識している。
【0016】
本開示は、新しい符号化方式のために使用され得る動的解像度変更に関する技法について説明する。これらの技法はまた、一体型の受信器デコーダ(IRD)のMPEG-2システムレイヤにおいて、又はディスプレイ(例えば、テレビ)のレンダリングエンジンにおいて、復号されるピクチャのシームレスな解像度アップスケーリングを可能にする。解像度は、参照ピクチャリサンプリングがなくても、シーケンスパラメータセット(SPS)境界において、又は参照ピクチャリサンプリングがVVCにおいて使用されるときにシーケンス内で動的に変更し得る。これらの技法は、VVC以外の将来のコーデックにおいても同様に採用され得る。本開示は、いくつかのコンテキストにおける解像度変更を制限するために適用され得るいくつかの制約を更に説明する。
【0017】
ビデオストリーミングアプリケーションでは、オーバーザトップ(OTT)プレーヤは、セグメント境界における動的かつシームレスな解像度変更をサポートすることができる。すなわち、適応ビットレート(ABR)符号化及びストリーミング方式では、1つのセグメントから次のセグメントへのビットレートプロファイルの切り替えは、符号化された解像度の変更を伴うこともある。ビットレートプロファイル内であっても、進化型ビデオオンデマンド(VOD)ストリーミングサービスは、圧縮効率を改善し、帯域幅を節約するために、シーンごとに解像度を動的に変更することができる。
【0018】
動的解像度符号化テストは、様々な規格及び解像度で実行されてきた。例えば、ITU-T H.264/アドバンストビデオ符号化(AVC)HD及びITU-T H.265/高効率ビデオ符号化(HEVC)UHDユースケースに対してヒューリスティックテストが実行されている。H.264/AVC HDの場合、テストされた解像度は、1920×1080p、1280×720p、及び960×540pを含んでいた。H.265/HEVC UHDの場合、テストされた解像度は、3840×2160、250×1440、及び1920×1080を含んでいた。これらのテストは、最も時間的に複雑なシーンに対してより低い解像度を使用することによって20~25%のビットレート節約を示したが、そのようなビットレート低減は知覚できず、必要なときに最高解像度の利点を維持することができる。
【0019】
ライブブロードキャストアプリケーションが事前に記録されたコンテンツのストリーミングと競合するために、ライブブロードキャストされるビデオコンテンツのための動的解像度符号化適応の利点を使用することが重要であり得る。ビデオデコーダ自体は動的解像度符号化ビデオデータの復号をサポートするが、ビデオデコーダバッファ内のピクチャは符号化解像度のままであってもよく、公称解像度への自動アップスケーリングは、MPEG-2システムレイヤにおけるIRD又はディスプレイの責任であってもよい。
【0020】
本開示の技法は、ISOベースメディアファイルフォーマット、スケーラブルビデオコーディング(SVC)ファイルフォーマット、アドバンストビデオコーディング(AVC)ファイルフォーマット、第3世代パートナーシッププロジェクト(3GPP)ファイルフォーマット、及び/若しくはマルチビュービデオコーディング(MVC)ファイルフォーマット、又は他の同様のビデオファイルフォーマットのいずれかに従ってカプセル化されたビデオデータに準拠するビデオファイルに適用され得る。
【0021】
HTTPストリーミングにおいて、頻繁に使用される動作には、HEAD、GET、及び部分GETがある。HEAD動作は、所与のユニフォームリソースロケータ(URL)又はユニフォームリソースネーム(URN)に関連付けられたペイロードを取り出さずに、URL又はURNに関連付けられたファイルのヘッダを取り出す。GET動作は、所与のURL又はURNに関連付けられたファイル全体を取り出す。部分GET動作は、入力パラメータとしてバイト範囲を受信し、ファイルの連続した数のバイトを取り出し、この場合、バイトの数は受信されるバイト範囲に対応する。したがって、部分GET動作は1つ又は複数の個々のムービーフラグメントを取得できるので、ムービーフラグメントがHTTPストリーミングのために提供されてよい。ムービーフラグメントでは、異なるトラックのいくつかのトラックフラグメントが存在してよい。HTTPストリーミングでは、メディアプレゼンテーションは、クライアントにとってアクセス可能なデータの構造化された集合体であり得る。クライアントは、メディアデータ情報を要求及びダウンロードして、ユーザにストリーミングサービスを提示することができる。
【0022】
HTTPストリーミングを使用して3GPPデータをストリーミングする例では、マルチメディアコンテンツのビデオデータ及び/又はオーディオデータに関して複数の表現が存在し得る。以下で説明するように、異なる表現は、異なるコーディング特性(例えば、ビデオコーディング規格の異なるプロファイル又はレベル)、異なるコーディング規格又はコーディング規格の拡張(マルチビュー及び/若しくはスケーラブル拡張など)、あるいは異なるビットレートに対応し得る。そのような表現のマニフェストは、メディアプレゼンテーション記述(MPD)データ構造において定義され得る。メディアプレゼンテーションは、HTTPストリーミングクライアントデバイスにとってアクセス可能なデータの構造化された集合体に対応し得る。HTTPストリーミングクライアントデバイスは、メディアデータ情報を要求及びダウンロードして、クライアントデバイスのユーザにストリーミングサービスを提示することができる。メディアプレゼンテーションは、MPDの更新を含み得るMPDデータ構造で記述され得る。
【0023】
メディアプレゼンテーションは、1つ又は複数の期間のシーケンスを含み得る。各期間は、次の期間の開始まで、又は最後の期間の場合にはメディアプレゼンテーションの終了まで及び得る。各期間は、同じメディアコンテンツのための1つ又は複数の表現を含んでもよい。表現は、オーディオ、ビデオ、時限のテキスト、又は他のそのようなデータのいくつかの代替符号化バージョンのうちの1つであり得る。表現は、符号化のタイプ、例えば、ビデオデータのビットレート、解像度、及び/又はコーデック、並びにオーディオデータのビットレート、言語、及び/又はコーデックによって異なる場合がある。表現という用語は、マルチメディアコンテンツのある特定の期間に対応し、ある特定のやり方で符号化された、符号化オーディオデータ又は符号化ビデオデータのあるセクションを指すために使用される場合がある。
【0024】
ある特定の期間の表現は、表現が属する適応セットを示すMPD内の属性によって示されるグループに割り当てられてもよい。同じ適応セット内の表現は、一般に、クライアントデバイスが、例えば帯域幅適応を実施するためにこれらの表現の間で動的かつシームレスに切り替わることができる点で、互いに対する代替物と見なされる。例えば、ある特定の期間のビデオデータの各表現は、同じ適応セットに割り当てられてもよいので、表現のうちのいずれもが、対応する期間のマルチメディアコンテンツの、ビデオデータ又はオーディオデータなど、メディアデータを提示するように復号するために、選択されてもよい。いくつかの例では、1つの期間内のメディアコンテンツは、グループ0が存在する場合にはグループ0からの1つの表現によって表されてもよく、あるいは各々の非ゼロのグループからの最大でも1つの表現の組み合わせのいずれかによって表されてもよい。ある期間の各表現のタイミングデータは、期間の開始時間に対して表されてもよい。
【0025】
表現は1つ又は複数のセグメントを含み得る。各表現が初期化セグメントを含んでもよく、又は表現の各セグメントが自己初期化するものであってもよい。初期化セグメントは、存在するとき、表現にアクセスするための初期化情報を含んでもよい。概して、初期化セグメントは、メディアデータを含まない。セグメントは、ユニフォームリソースロケータ(URL)、ユニフォームリソースネーム(URN)、又はユニフォームリソース識別子(URI)のような、識別子によって一意に参照されてもよい。MPDは、各セグメントのための識別子を提供し得る。いくつかの例では、MPDはまた、URL、URN、又はURIによってアクセス可能なファイル内のセグメントのためのデータに対応し得るバイト範囲をrange属性の形態で与え得る。
【0026】
異なるタイプのメディアデータに対して実質的に同時に取り出しを行うために異なる表現が選択されてもよい。例えば、クライアントデバイスは、セグメントを取り出すオーディオ表現、ビデオ表現、及び時限のテキスト表現を選択することができる。いくつかの例では、クライアントデバイスは、帯域幅適応を実施するために特定の適応セットを選択することができる。すなわち、クライアントデバイスは、ビデオ表現を含む適応セット、オーディオ表現を含む適応セット、及び/又は時限のテキストを含む適応セットを選択することができる。代替として、クライアントデバイスは、あるタイプのメディア(例えば、ビデオ)に関する適応セットを選択し、他のタイプのメディア(例えば、オーディオ及び/又は時限のテキスト)に関する表現を直接選択することができる。
【0027】
図1は、ネットワークを介してメディアデータをストリーミングするための技法を実装する例示的なシステム10を示すブロック図である。この例では、システム10は、コンテンツ準備デバイス20と、サーバデバイス60と、クライアントデバイス40とを含む。クライアントデバイス40及びサーバデバイス60は、インターネットを含み得るネットワーク74によって通信可能に結合される。いくつかの例では、コンテンツ準備デバイス20及びサーバデバイス60も、ネットワーク74又は別のネットワークによって結合されてもよく、又は直接通信可能に結合されてもよい。いくつかの例では、コンテンツ準備デバイス20及びサーバデバイス60は、同じデバイスを含み得る。
【0028】
図1の例では、コンテンツ準備デバイス20は、オーディオソース22とビデオソース24とを備える。オーディオソース22は、例えば、オーディオエンコーダ26によって符号化されるべきキャプチャされたオーディオデータを表す電気信号を生成するマイクロフォンを含み得る。代替として、オーディオソース22は、以前に記録されたオーディオデータを記憶する記憶媒体、コンピュータ化されたシンセサイザのようなオーディオデータ生成器、又はオーディオデータの任意の他のソースを備えてもよい。ビデオソース24は、ビデオエンコーダ28によって符号化されるべきビデオデータを生成するビデオカメラ、以前に記録されたビデオデータで符号化された記憶媒体、コンピュータグラフィックスソースのようなビデオデータ生成ユニット、又はビデオデータの任意の他のソースを備え得る。コンテンツ準備デバイス20は必ずしも、全ての例において、サーバデバイス60に通信可能に結合されるとは限らないが、サーバデバイス60によって読み取られる別個の媒体にマルチメディアコンテンツを記憶する場合がある。
【0029】
生のオーディオデータ及びビデオデータは、アナログデータ又はデジタルデータを含み得る。アナログデータは、オーディオエンコーダ26及び/又はビデオエンコーダ28によって符号化される前にデジタル化され得る。オーディオソース22は、話している参加者から、その参加者が話している間にオーディオデータを取得する場合があり、ビデオソース24は、話している参加者のビデオデータを同時に取得する場合がある。他の例では、オーディオソース22は、記憶されたオーディオデータを含むコンピュータ可読記憶媒体を備えてもよく、ビデオソース24は、記憶されたビデオデータを含むコンピュータ可読記憶媒体を備えてもよい。このように、本開示で説明される技法は、ライブ、ストリーミング、リアルタイムオーディオ及びリアルタイムビデオデータに適用され得、又は、アーカイブされた事前に記録されたオーディオ及びビデオデータに適用され得る。
【0030】
ビデオフレームに対応するオーディオフレームは、一般に、ビデオフレーム内に含まれるビデオソース24によってキャプチャ(又は、生成)されたビデオデータと同時に、オーディオソース22によってキャプチャ(又は、生成)されたオーディオデータを含むオーディオフレームである。例えば、話している参加者が一般に話すことによってオーディオデータを生成している間、オーディオソース22はオーディオデータをキャプチャし、ビデオソース24は同時に、すなわち、オーディオソース22がオーディオデータをキャプチャしている間に、話している参加者のビデオデータをキャプチャする。したがって、オーディオフレームは、1つ又は複数の特定のビデオフレームに時間的に対応する場合がある。したがって、ビデオフレームに対応するオーディオフレームは、一般に、オーディオデータ及びビデオデータが同時にキャプチャされた状況に対応し、その状況に対して、オーディオフレーム及びビデオフレームがそれぞれ、同時にキャプチャされたオーディオデータ及びビデオデータを含む。
【0031】
いくつかの例では、オーディオエンコーダ26は、符号化オーディオフレームのオーディオデータが記録された時間を表す、各符号化オーディオフレームにおけるタイムスタンプを符号化することができ、同様に、ビデオエンコーダ28は、符号化ビデオフレームのビデオデータが記録された時間を表す、各符号化ビデオフレームにおけるタイムスタンプを符号化することができる。そのような例では、ビデオフレームに対応するオーディオフレームは、タイムスタンプを含むオーディオフレーム及び同じタイムスタンプを含むビデオフレームを含み得る。コンテンツ準備デバイス20は、オーディオエンコーダ26及び/又はビデオエンコーダ28がタイムスタンプを生成する場合がある内部クロック、又はオーディオソース22及びビデオソース24がそれぞれオーディオデータ及びビデオデータをタイムスタンプに関連付けるために使用する場合がある内部クロックを含み得る。
【0032】
いくつかの例では、オーディオソース22は、オーディオデータが記録された時間に対応するデータをオーディオエンコーダ26に送ってもよく、ビデオソース24は、ビデオデータが記録された時間に対応するデータをビデオエンコーダ28に送ることができる。いくつかの例では、オーディオエンコーダ26は、符号化されたオーディオデータにおいて、符号化されたオーディオデータの相対的な時間順序を示すために、オーディオデータが記録された絶対的な時間を必ずしも示すとは限らないが、シーケンス識別子を符号化してもよく、同様に、ビデオエンコーダ28も、符号化されたビデオデータの相対的な時間順序を示すためにシーケンス識別子を使用してもよい。同様に、いくつかの例では、シーケンス識別子がタイムスタンプと共にマップされるか、あるいはタイムスタンプと相関することがある。
【0033】
オーディオエンコーダ26は、一般に、符号化されたオーディオデータのストリームを生成する一方、ビデオエンコーダ28は、符号化されたビデオデータのストリームを生成する。データの個々の各ストリーム(オーディオかビデオかにかかわらず)は、エレメンタリストリームと呼ばれることがある。エレメンタリストリームは、表現の単一のデジタル的にコード化された(場合によっては圧縮された)コンポーネントである。例えば、表現のコード化されたビデオ又はオーディオの部分は、エレメンタリストリームであり得る。エレメンタリストリームは、ビデオファイル内にカプセル化される前に、パケット化エレメンタリストリーム(PES)に変換され得る。同じ表現内で、ストリームIDが、あるエレメンタリストリームに属するPESパケットを他のエレメンタリストリームに属するPESパケットと区別するために使用され得る。エレメンタリストリームのデータの基本単位は、パケット化エレメンタリストリーム(PES)パケットである。したがって、コード化ビデオデータは、一般に、エレメンタリビデオストリームに対応する。同様に、オーディオデータは、1つ又は複数のそれぞれのエレメンタリストリームに対応する。
【0034】
ITU-T H.264/AVC及び今度の高効率ビデオコーディング(HEVC)規格など、多くのビデオコーディング規格は、エラーのないビットストリームのためのシンタックス、意味論、及び復号プロセスを定義し、それらのいずれもが、一定のプロファイル又はレベルに準拠する。ビデオコーディング規格は、典型的にはエンコーダを規定しないが、エンコーダは、生成されたビットストリームがデコーダのための規格に準拠することを保証する役割を課される。ビデオコーディング規格のコンテキストでは、「プロファイル」は、アルゴリズム、特徴、又はツールのサブセット、及びこれらに適用される制約に対応する。H.264規格によって定義されるように、例えば、「プロファイル」は、H.264規格によって指定される全体のビットストリームシンタックスのサブセットである。「レベル」は、例えば、デコーダメモリ及び計算のような、デコーダのリソース消費の制限に対応し、これは、ピクチャの解像度、ビットレート、及びブロック処理速度に関連する。プロファイルは、profile_idc(プロファイルインジケータ)値によってシグナリングされ得るが、レベルは、level_idc(レベルインジケータ)値によってシグナリングされ得る。
【0035】
例えば、所与のプロファイルのシンタックスによって課される範囲内で、復号されるピクチャの指定されたサイズのようなビットストリーム内のシンタックス要素のとる値に応じて、エンコーダ及びデコーダの性能に大きい変動を求めることが依然として可能であることを、H.264規格は認める。多くの適用例において、特定のプロファイル内のシンタックスの全ての仮想的な使用を扱うことが可能なデコーダを実装するのは、現実的でも経済的でもないことを、H.264規格は更に認める。したがって、H.264規格は、ビットストリーム内のシンタックス要素の値に課される制約の指定されたセットとして、「レベル」を定義する。これらの制約は、値に対する単純な制限であってもよい。代替として、これらの制約は、値の算術的な組み合わせの制約の形式(例えば、1秒当たりに復号されるピクチャの数と、ピクチャの高さと、ピクチャの幅との積)をとってもよい。個々の実装形態が、サポートされるプロファイルごとに異なるレベルをサポートしてもよいことを、H.264規格は更に規定する。
【0036】
プロファイルに準拠するデコーダは、普通、プロファイル内で定義される全ての特徴をサポートする。例えば、コーディング特徴として、Bピクチャコーディングは、H.264/AVCのベースラインプロファイルではサポートされないが、H.264/AVCの他のプロファイルではサポートされる。あるレベルに準拠するデコーダは、レベル内で定義された制限を超えるリソースを要求しない、あらゆるビットストリームを復号することが可能であるべきである。プロファイル及びレベルの定義は、説明可能性のために有用であり得る。例えば、ビデオ送信中、プロファイル及びレベルの定義のペアが、送信セッション全体に対して取り決められ合意され得る。より具体的には、H.264/AVCにおいて、レベルは、処理される必要があるマクロブロックの数、復号ピクチャバッファ(DPB)のサイズ、コード化ピクチャバッファ(CPB)のサイズ、垂直方向の運動ベクトルの範囲、2つの連続するMB当たりの運動ベクトルの最大の数に対する制限、及び、Bブロックが8×8ピクセルよりも小さいサブマクロブロック区分を有し得るかどうかを定義することができる。このようにして、デコーダは、デコーダが適切にビットストリームを復号できるかどうかを判定することができる。
【0037】
図1の例では、コンテンツ準備デバイス20のカプセル化ユニット30は、ビデオエンコーダ28からのコード化ビデオデータを含むエレメンタリストリームと、オーディオエンコーダ26からのコード化オーディオデータを含むエレメンタリストリームとを受信する。いくつかの例では、ビデオエンコーダ28及びオーディオエンコーダ26は各々、符号化データからPESパケットを形成するためのパケタイザを含む場合がある。他の例では、ビデオエンコーダ28及びオーディオエンコーダ26は各々、符号化データからPESパケットを形成するためのそれぞれのパケタイザとインターフェースをとる場合がある。更に他の例では、カプセル化ユニット30は、符号化オーディオデータ及び符号化ビデオデータからPESパケットを形成するためのパケタイザを含む場合がある。
【0038】
ビデオエンコーダ28は、種々の方法でマルチメディアコンテンツのビデオデータを符号化して、ピクセル解像度、フレームレート、様々な符号化規格に対する準拠、様々な符号化規格のための様々なプロファイル及び/又はプロファイルのレベルに対する準拠、1つ又は複数の表示を有する表現(例えば、2次元又は3次元の再生のための)、あるいは他のそのような特性のような、様々な特性を有する様々なビットレートのマルチメディアコンテンツの様々な表現を生成することができる。本開示で使用する表現は、オーディオデータ、ビデオデータ、(例えば、クローズドキャプション用の)テキストデータ、又は他のそのようなデータのうちの1つを含み得る。この表現は、オーディオエレメンタリストリーム又はビデオエレメンタリストリームなどのエレメンタリストリームを含み得る。各PESパケットは、PESパケットが属するエレメンタリストリームを識別するstream_idを含み得る。カプセル化ユニット30は、様々な表現のビデオファイル(例えば、セグメント)へとエレメンタリストリームをアセンブルする役割を担う。
【0039】
カプセル化ユニット30は、オーディオエンコーダ26及びビデオエンコーダ28から表現のエレメンタリストリームのためのPESパケットを受信し、PESパケットから対応するネットワークアブストラクション層(NAL)ユニットを形成する。コード化ビデオセグメントはNALユニットへと編成されてもよく、NALユニットは、ビデオ電話、記憶、ブロードキャスト、又はストリーミングのような、「ネットワークフレンドリ」なビデオ表現のアドレッシング適用を実現する。NALユニットは、ビデオコーディングレイヤ(VCL:Video Coding Layer)NALユニット及び非VCL NALユニットに分類されることができる。VCLユニットは、コア圧縮エンジンを含み得、ブロック、マクロブロック、及び/又はスライスレベルのデータを含み得る。他のNALユニットは、非VCL NALユニットであり得る。いくつかの例では、1つの時間インスタンスにおけるコード化ピクチャは、通常は一次コード化ピクチャとして提示され、1つ又は複数のNALユニットを含み得るアクセスユニット内に包含され得る。
【0040】
非VCL NALユニットは、特に、パラメータセットのNALユニット及びSEI NALユニットを含み得る。パラメータセットは、(シーケンスパラメータセット(SPS)内に)シーケンスレベルヘッダ情報を包含し、(ピクチャパラメータセット(PPS)内に)頻繁には変化しないピクチャレベルヘッダ情報を包含し得る。パラメータセット(例えば、PPS及びSPS)がある場合、まれに変化する情報がシーケンスごと又はピクチャごとに繰り返される必要はなく、したがって、コーディング効率が改善され得る。更に、パラメータセットの使用が、重要なヘッダ情報の帯域外送信を有効化することができ、エラーの復元のための冗長な送信の必要がなくなる。帯域外送信の例では、パラメータセットのNALユニットが、SEI NALユニットなどの他のNALユニットとは異なるチャネル上で送信され得る。
【0041】
補足強調情報(SEI)は、VCL NALユニットからコード化ピクチャサンプルを復号するために必要ではない情報を包含し得るが、復号、表示、エラーの復元、及び他の目的に関係するプロセスを支援し得る。SEIメッセージは、非VCL NALユニットに包含され得る。SEIメッセージは、いくつかの標準仕様の規範的部分であり、したがって、規格に準拠するデコーダの実装において常に必須であるとは限らない。SEIメッセージは、シーケンスレベルSEIメッセージ又はピクチャレベルSEIメッセージであり得る。いくつかのシーケンスレベル情報は、SVCの例におけるスケーラビリティ情報SEIメッセージ及びMVCにおけるビュースケーラビリティ情報SEIメッセージなどのSEIメッセージ内に包含され得る。これらの例示的なSEIメッセージは、例えば、動作点の抽出及び動作点の特性に関する情報を伝達することができる。加えて、カプセル化ユニット30は、表現の特性を記述するメディアプレゼンテーション記述(MPD)などのマニフェストファイルを形成することができる。カプセル化ユニット30は、拡張可能マークアップ言語(XML)に従ってMPDをフォーマットすることができる。
【0042】
カプセル化ユニット30は、マニフェストファイル(例えば、MPD)と共に、マルチメディアコンテンツの1つ又は複数の表現のためのデータを出力インターフェース32に提供し得る。出力インターフェース32は、ネットワークインターフェース若しくはユニバーサルシリアルバス(USB)インターフェース、CD若しくはDVDのライター若しくはバーナー、磁気記憶媒体若しくはフラッシュ記憶媒体へのインターフェースのような記憶媒体へ書き込むためのインターフェース、又は、メディアデータを記憶若しくは送信するための他のインターフェースを含み得る。カプセル化ユニット30は、マルチメディアコンテンツの表現のそれぞれの表現のデータを出力インターフェース32に提供することができ、出力インターフェース32は、ネットワーク送信又は記憶媒体を介してデータをサーバデバイス60に送ることができる。図1の例では、サーバデバイス60は、各々が個別のマニフェストファイル66と1つ又は複数の表現68A~68N(表現68)とを含む様々なマルチメディアコンテンツ64を記憶する記憶媒体62を含む。いくつかの例では、出力インターフェース32はネットワーク74にデータを直接送ることもできる。
【0043】
いくつかの例では、表現68は、適応セットへと分割されてもよい。すなわち、表現68の様々なサブセットは、コーデック、プロファイル及びレベル、解像度、ビューの数、セグメントのファイルフォーマット、例えば話者による、復号され提示されるべき表現及び/又はオーディオデータと共に表示されるべきテキストの言語又は他の特性を識別する場合があるテキストタイプ情報、カメラの角度又は適応セット内の表現のシーンの現実世界のカメラの視野を表す場合があるカメラ角度情報、特定の視聴者に対するコンテンツの適合性を表すレーティング情報などのような、特性のそれぞれの共通のセットを含み得る。
【0044】
マニフェストファイル66は、特定の適応セットに対応する表現68のサブセットを示すデータ、並びに適応セットの共通の特性を含み得る。マニフェストファイル66はまた、適応セットの個々の表現のための、ビットレートのような個々の特性を表すデータを含み得る。このようにして、適応セットは、簡略化されたネットワーク帯域幅適応を可能にする場合がある。適応セット内の表現は、マニフェストファイル66の適応セット要素の子要素を使用して示されてもよい。
【0045】
サーバデバイス60は、要求処理ユニット70とネットワークインターフェース72とを含む。いくつかの例では、サーバデバイス60は、複数のネットワークインターフェースを含み得る。更に、サーバデバイス60の機能のうちのいずれか又は全てが、ルータ、ブリッジ、プロキシデバイス、スイッチ、又は他のデバイスのような、コンテンツ配信ネットワークの他のデバイス上で実装され得る。いくつかの例では、コンテンツ配信ネットワークの中間デバイスは、マルチメディアコンテンツ64のデータをキャッシュし、サーバデバイス60の構成要素に実質的に準拠する構成要素を含み得る。概して、ネットワークインターフェース72は、ネットワーク74を介してデータを送受信するように構成される。
【0046】
要求処理ユニット70は、記憶媒体62のデータに対するネットワーク要求をクライアントデバイス40のようなクライアントデバイスから受信するように構成される。例えば、要求処理ユニット70は、R.Fielding他による、RFC 2616、「Hypertext Transfer Protocol-HTTP/1.1」、Network Working Group、IETF、1999年6月に記述されるような、ハイパーテキスト転送プロトコル(HTTP)バージョン1.1を実装する場合がある。すなわち、要求処理ユニット70は、HTTP GET又は部分GET要求を受信して、それらの要求に応答して、マルチメディアコンテンツ64のデータを提供するように構成され得る。要求は、例えば、セグメントのURLを使用して、表現68のうちの1つのセグメントを指定することができる。いくつかの例では、要求はまた、セグメントの1つ又は複数のバイト範囲を指定することができ、したがって、部分GET要求を含む。要求処理ユニット70は更に、表現68のうちの1つのセグメントのヘッダデータを提供するために、HTTP HEAD要求に対応するように構成されてよい。いずれの場合でも、要求処理ユニット70は、クライアントデバイス40のような要求デバイスに、要求されたデータを提供するために、要求を処理するように構成され得る。
【0047】
追加又は代替として、要求処理ユニット70は、eMBMSなどのブロードキャスト又はマルチキャストプロトコルを介してメディアデータを配信するように構成され得る。コンテンツ準備デバイス20は、DASHセグメント及び/又はサブセグメントを、説明したのと実質的に同じ方法で作成することができるが、サーバデバイス60は、これらのセグメント又はサブセグメントを、eMBMS又は別のブロードキャスト若しくはマルチキャストのネットワークトランスポートプロトコルを使用して配信することができる。例えば、要求処理ユニット70は、クライアントデバイス40からマルチキャストグループ参加要求を受信するように構成され得る。すなわち、サーバデバイス60は、マルチキャストグループと関連付けられたインターネットプロトコル(IP)アドレスを、クライアントデバイス40を含む、特定のメディアコンテンツ(例えば、ライブイベントのブロードキャスト)と関連付けられたクライアントデバイスに広告することができる。次に、クライアントデバイス40は、マルチキャストグループに加わるための要求を提出することができる。この要求は、ルータがマルチキャストグループに関連付けられたIPアドレス宛のトラフィックをクライアントデバイス40などの加入クライアントデバイスに向けるように、ネットワーク74中、例えば、ネットワーク74を構成するルータに伝搬され得る。
【0048】
図1の例に示すように、マルチメディアコンテンツ64は、メディアプレゼンテーション記述(MPD)に対応する場合があるマニフェストファイル66を含む。マニフェストファイル66は、様々な代替の表現68(例えば、品質が異なるビデオサービス)の記述を包含してよく、この記述は、例えば、コーデック情報、プロファイル値、レベル値、ビットレート、及び表現68の他の説明のための特性を含み得る。クライアントデバイス40は、メディアプレゼンテーションのMPDを取り出して、表現68のセグメントにどのようにアクセスするかを判定することができる。
【0049】
具体的には、取り出しユニット52は、クライアントデバイス40の構成データ(図示せず)を取り出して、ビデオデコーダ48の復号能力及びビデオ出力部44のレンダリング能力を判定することができる。構成データはまた、クライアントデバイス40のユーザによって選択される言語の選好、クライアントデバイス40のユーザによって設定される深さの選好に対応する1つ又は複数のカメラ視野、及び/あるいは、クライアントデバイス40のユーザによって選択されるレーティングの選好のいずれか又は全てを含み得る。取り出しユニット52は、例えば、HTTP GET及び部分GET要求を提出するように構成されたウェブブラウザ又はメディアクライアントを備え得る。取り出しユニット52は、クライアントデバイス40の1つ又は複数のプロセッサ又は処理ユニット(図示せず)によって実行されるソフトウェア命令に対応し得る。いくつかの例では、取り出しユニット52に関して説明した機能性の全て又は一部は、ハードウェア、又は、ハードウェア、ソフトウェア、及び/若しくはファームウェアの組み合わせで実装されてよく、この場合、必須のハードウェアは、ソフトウェア又はファームウェアのための命令を実行するために提供され得る。
【0050】
取り出しユニット52は、クライアントデバイス40の復号能力及びレンダリング能力を、マニフェストファイル66の情報によって示される表現68の特性と比較することができる。取り出しユニット52は、表現68の特性を判定するために、マニフェストファイル66の少なくとも一部分を最初に取り出し得る。例えば、取り出しユニット52は、1つ又は複数の適応セットの特性について説明する、マニフェストファイル66の一部分を要求する場合がある。取り出しユニット52は、クライアントデバイス40のコーディング能力及びレンダリング能力によって満たされ得る特性を有する、表現68のサブセット(例えば、適応セット)を選択することができる。取り出しユニット52は、次いで、適応セット内の表現に対するビットレートを判定し、ネットワーク帯域幅の現在利用可能な量を判定し、ネットワーク帯域幅によって満たされ得るビットレートを有する表現のうちの1つからセグメントを取り出すことができる。
【0051】
概して、表現のビットレートが高くなると、ビデオ再生の品質が高くなる一方、表現のビットレートが低くなると、利用可能なネットワーク帯域幅が縮小したときに、ビデオ再生の品質が十分なものになる場合がある。したがって、利用可能なネットワーク帯域幅が比較的高いときには、取り出しユニット52は、ビットレートが比較的高い表現からデータを取り出すことができ、利用可能なネットワーク帯域幅が低いときには、取り出しユニット52は、ビットレートが比較的低い表現からデータを取り出すことができる。このようにして、クライアントデバイス40は、ネットワーク74を介してマルチメディアデータをストリーミングすることができる一方、ネットワーク74の変化するネットワーク帯域幅の利用可能性に適応することもできる。
【0052】
追加又は代替として、取り出しユニット52は、ブロードキャスト、又はeMBMS若しくはIPマルチキャストなどのマルチキャストネットワークプロトコルに従ってデータを受信するように構成され得る。そのような例では、取り出しユニット52は、特定のメディアコンテンツに関連付けられたマルチキャストネットワークグループに加わるための要求を提出することができる。取り出しユニット52は、マルチキャストグループに加わった後、サーバデバイス60又はコンテンツ準備デバイス20に更なる要求を発行することなしに、マルチキャストグループのデータを受信することができる。取り出しユニット52は、例えば、再生を停止するために、又は、チャネルを異なるマルチキャストグループに変更するために、マルチキャストグループのデータがもはや必要とされないとき、マルチキャストグループを出るための要求を提出することができる。
【0053】
ネットワークインターフェース54は、選択された表現のセグメントのデータを受信し、取り出しユニット52に提供することができ、次に、取り出しユニット52は、セグメントをカプセル化解除ユニット50に提供することができる。カプセル化解除ユニット50は、ビデオファイルの要素を、構成要素であるPESストリームへとカプセル化解除し、PESストリームをパケット化解除して符号化されたデータを取り出し、例えば、ストリームのPESパケットヘッダによって示されるように、符号化されたデータがオーディオストリームの一部かビデオストリームの一部かに応じて、符号化されたデータをオーディオデコーダ46又はビデオデコーダ48のいずれかに送ることができる。オーディオデコーダ46は、符号化されたオーディオデータを復号し、復号されたオーディオデータをオーディオ出力部42に送る一方、ビデオデコーダ48は、符号化されたビデオデータを復号し、ストリームの複数のビューを含み得る復号されたビデオデータをビデオ出力部44に送る。
【0054】
ビデオエンコーダ28、ビデオデコーダ48、オーディオエンコーダ26、オーディオデコーダ46、カプセル化ユニット30、取り出しユニット52、及びカプセル化解除ユニット50は各々、適用できる場合は、1つ又は複数のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、ディスクリート論理回路機構、ソフトウェア、ハードウェア、ファームウェア、又はそれらの任意の組み合わせなど、様々な適切な処理回路機構のいずれかとして実装され得る。ビデオエンコーダ28及びビデオデコーダ48の各々が、1つ又は複数のエンコーダ又はデコーダに含まれることがあり、これらのいずれもが、複合ビデオエンコーダ/デコーダ(コーデック)の一部として統合されることがある。同様に、オーディオエンコーダ26及びオーディオデコーダ46の各々は、1つ又は複数のエンコーダ又はデコーダ内に含まれてよく、これらのいずれもが、複合コーデックの一部として統合され得る。ビデオエンコーダ28、ビデオデコーダ48、オーディオエンコーダ26、オーディオデコーダ46、カプセル化ユニット30、取り出しユニット52、及び/又はカプセル化解除ユニット50を含む装置は、集積回路、マイクロプロセッサ、及び/又はセルラー電話のようなワイヤレス通信デバイスを含み得る。
【0055】
クライアントデバイス40、サーバデバイス60、及び/又はコンテンツ準備デバイス20は、本開示の技法に従って動作するように構成され得る。例として、本開示は、クライアントデバイス40及びサーバデバイス60に関するこれらの技法について説明する。しかしながら、コンテンツ準備デバイス20は、サーバデバイス60の代わりに(又は、それに加えて)これらの技法を実施するように構成され得ることを理解されたい。
【0056】
カプセル化ユニット30は、NALユニットが属するプログラム、並びにペイロード、例えばオーディオデータ、ビデオデータ、又はNALユニットが対応するトランスポート若しくはプログラムストリームを記述するデータを識別するヘッダを含むNALユニットを形成してもよい。例えば、H.264/AVCにおいて、NALユニットは、1バイトのヘッダ及び可変サイズのペイロードを含む。そのペイロード内にビデオデータを含むNALユニットは、ビデオデータの様々な粒度レベルを含み得る。例えば、NALユニットは、ビデオデータのブロック、複数のブロック、ビデオデータのスライス、又はビデオデータのピクチャ全体を含み得る。カプセル化ユニット30は、ビデオエンコーダ28からの符号化ビデオデータをエレメンタリストリームのPESパケットの形で受信することができる。カプセル化ユニット30は、各エレメンタリストリームを対応するプログラムに関連付けることができる。
【0057】
カプセル化ユニット30はまた、複数のNALユニットからアクセスユニットをアセンブルすることができる。概して、アクセスユニットは、ビデオデータのフレームを表すための1つ又は複数のNALユニットと、そのフレームに対応するオーディオデータが利用可能なとき、そのようなオーディオデータとを備え得る。アクセスユニットは、一般に、1つの出力時間インスタンスに対する全てのNALユニット、例えば、1つの時間インスタンスに対する全てのオーディオデータ及びビデオデータを含む。例えば、各ビューが毎秒20フレーム(fps)のフレームレートを有する場合、各時間インスタンスは、0.05秒の時間間隔に対応する場合がある。この時間間隔中、同じアクセスユニット(同じ時間インスタンス)の全てのビューに対する特定のフレームは、同時にレンダリングされ得る。一例では、アクセスユニットは、コード化された一次ピクチャとして提示される場合がある、1つの時間インスタンス内のコーディングされたピクチャを含み得る。
【0058】
したがって、アクセスユニットは、共通の時間インスタンスの全てのオーディオフレーム及びビデオフレーム、例えば、時間Xに対応する全てのビューを含み得る。本開示はまた、特定のビューの符号化されたピクチャを「ビューコンポーネント(view component)」と呼ぶ。すなわち、ビューコンポーネントは、特定の時間における特定のビューに対する符号化されたピクチャ(又はフレーム)を含み得る。したがって、アクセスユニットは、共通の時間インスタンスの全てのビューコンポーネントを含むものとして定義され得る。アクセスユニットの復号順序は、必ずしも出力又は表示の順序と同じである必要はない。
【0059】
メディアプレゼンテーションは、異なる代替表現(例えば、異なる品質を有するビデオサービス)の記述を含む場合があるメディアプレゼンテーション記述(MPD)を含んでもよく、記述は、例えば、コーデック情報、プロファイル値、及びレベル値を含み得る。MPDは、マニフェストファイル66など、マニフェストファイルの一例である。クライアントデバイス40は、メディアプレゼンテーションのMPDを取り出して、様々なプレゼンテーションのムービーフラグメントにどのようにアクセスするかを判定することができる。ムービーフラグメントは、ビデオファイルのムービーフラグメントボックス(moofボックス)内に配置され得る。
【0060】
マニフェストファイル66(例えば、MPDを含み得る)は、表現68のセグメントの可用性を広告することができる。すなわち、MPDは、表現68のうちの1つの第1のセグメントが利用可能になる壁時計時間を示す情報、並びに表現68内のセグメントの持続時間を示す情報を含み得る。このようにして、クライアントデバイス40の取り出しユニット52は、開始時間並びに特定のセグメントに先行するセグメントの持続時間に基づいて、各セグメントが利用可能であるときを判断することができる。
【0061】
カプセル化ユニット30が、受信されたデータに基づいてNALユニット及び/又はアクセスユニットをビデオファイルにアセンブルした後、カプセル化ユニット30は、ビデオファイルを出力のために出力インターフェース32に渡す。いくつかの例では、カプセル化ユニット30は、ビデオファイルを直接クライアントデバイス40に送る代わりに、ビデオファイルをローカルに記憶するか、又は出力インターフェース32を介してビデオファイルをリモートサーバに送ることができる。出力インターフェース32は、例えば、送信機、トランシーバ、例えば、光学ドライブ、磁気媒体ドライブ(例えば、フロッピードライブ)などのコンピュータ可読媒体にデータを書き込むためのデバイス、ユニバーサルシリアルバス(USB)ポート、ネットワークインターフェース、又は他の出力インターフェースを含み得る。出力インターフェース32は、例えば、送信信号、磁気媒体、光学媒体、メモリ、フラッシュドライブ、又は他のコンピュータ可読媒体など、コンピュータ可読媒体にビデオファイルを出力する。
【0062】
ネットワークインターフェース54は、ネットワーク74を介してNALユニット又はアクセスユニットを受信することができ、NALユニット又はアクセスユニットを取り出しユニット52を介してカプセル化解除ユニット50に提供することができる。カプセル化解除ユニット50は、ビデオファイルの要素を、構成成分であるPESストリームへとカプセル化解除し、それらPESストリームをパケット化解除して符号化されたデータをリトリーブし、及び、例えばストリームのPESパケットヘッダによって示される、その符号化されたデータがオーディオストリームの一部か又はビデオストリームの一部かということに応じて、オーディオデコーダ46あるいはビデオデコーダ48のいずれかに、その符号化されたデータを送り得る。オーディオデコーダ46は、符号化されたオーディオデータを復号し、復号されたオーディオデータをオーディオ出力部42に送る一方、ビデオデコーダ48は、符号化されたビデオデータを復号し、ストリームの複数のビューを含み得る復号されたビデオデータをビデオ出力部44に送る。
【0063】
本開示の技法によれば、コンテンツ準備デバイス20は、異なる空間解像度を有する切り替えセット中の複数の表現を含むメディアプレゼンテーションを準備することができる。例えば、表現68Aは3840×2160の解像度を有することができ、表現68Nは1920×1080の解像度を有することができる。コンテンツ準備デバイス20は、(例えば、アドレス指定可能リソースインデックス(ARI)トラックのquality_identifier値を使用して)表現68のセグメント(又はセグメントのチャンク)のための品質値を広告する、切り替えセットのためのARIトラックを更に構築し得る。ISO/IEC 23009-1:2021/Amd.1は、quality_identifierを含むARIトラックの1つの例示的な定義を含む。2つの解像度のビットレートは実質的に同様又は同一(すなわち、同じ)であり得るので、品質値は、一般に、空間解像度及びビットレート以外の品質のメトリックを表し得る。
【0064】
より低い解像度のビデオデータに対してより高いビットレートを可能にすることは、場合によっては、より高い解像度のビデオデータよりも、より低い解像度のビデオデータに対してより高い品質をもたらし得る。例えば、グローバルカメラの視野における多くの変化を伴う非常に動的なシーンの場合、所与のビットレートにおいてより低い解像度で符号化されたビデオデータは、同じビットレートにおいてより高い解像度で符号化されたビデオデータよりも高い品質を有し得る。すなわち、ビデオシーケンスに対して多くのグローバルカメラの視野変化が発生するとき、より多くのイントラ予測符号化フレーム(Iフレーム)が必要とされ得、これは、シーンに割り振られた比較的大量のビット予算を消費し得る。より高い解像度のIフレームを符号化するためには、更に多数のビットが必要とされる。したがって、同じビット予算に対して、より高い解像度のビデオに対するよりも、より低い解像度のビデオに対する後続のインター予測符号化フレーム(例えば、Pフレーム及びBフレーム)を符号化するために、より多くのビットが利用可能になる。したがって、同じビットレートが使用されると仮定すると、より高い解像度におけるよりもより低い解像度におけるそのようなシーンに対して、より高い全体的な品質が予想され得る。
【0065】
したがって、クライアントデバイス40の取り出しユニット52は、2つの異なる表現から同じ再生時間に対応する2つのセグメント又はチャンクについての品質値を取得し得る。取り出しユニット52はまた、より低い解像度の表現のセグメント又はチャンクについての品質値が、より高い解像度の表現のセグメント又はチャンクについての品質値よりも高いかどうかを判定し得る。より低い解像度の表現のセグメント又はチャンクがより高い品質値を有する場合、取り出しユニット52は、より低い解像度の表現のセグメント又はチャンクを取り出し、そのセグメント又はチャンクをビデオデコーダ48に与え得る。一方、より高い解像度の表現のセグメント又はチャンクがより高い品質値を有する場合、取り出しユニット52は、より低い解像度の表現のセグメント又はチャンクを取り出し、そのセグメント又はチャンクをビデオデコーダ48に与え得る。取り出しユニット52は、同様に、メディアプレゼンテーションの再生全体を通して各セグメント又はチャンクの品質値を分析することができ、したがって、様々な時間に低解像度表現と高解像度表現との間で切り替えることができる。
【0066】
言い換えれば、H.266/VVC符号化されたビデオデータなどのいくつかのシナリオでは、動的解像度符号化の利点は、ビデオオンデマンド(VOD)サービスによって実証されている。本開示は、これらの利点がブロードキャスト配信を使用して実現され得ることを認識する。すなわち、本開示の技法によれば、クライアントデバイス40は、ブロードキャストを介してメディアストリームを受信し、メディアストリーム中に含まれるビデオデータの2つの異なる解像度の間で、例えば、符号化されたビデオデータのための異なる空間解像度を含む表現の間で解像度変更を実行し得る。DVB DASHアプリケーションの場合、そのような解像度変更は、セグメント境界におけるプロファイル内でサポートされ得る。
【0067】
本開示は、動的解像度変更が、VVC符号化ストリームにおける参照ピクチャリサンプリングの使用に限定される必要がないことを更に認識する。同様に、変更を2つの符号化された解像度間に限定する必要はない。いくつかの例では、2を超える複数の解像度がサポートされ得る。例えば、VVC HDR UHDTV-1 IRDは、3840×2160、2560×1440、1920×1080、1280×720という解像度のリスト内の任意の解像度の間で切り替わるように構成され得る。別の例として、VVC HDR UHDTV-2 IRDは、7680×4320、5120×2880、3840×2160、2560×1440、1920×1080、1280×720という解像度のリスト内の任意の解像度間で切り替わるように構成され得る。
【0068】
本開示はまた、解像度変更が比較的頻繁に起こり得ることを認識する。例えば、(例えば、ピクチャパラメータセット(PPS)のシンタックス要素sps_pic_width_in_luma_samples及びsps_pic_height_in_luma_samplesの値によって示されるような)ピクチャ解像度が各DVBランダムアクセスポイント(RAP)において変更される場合、ピクチャ解像度の2つの連続する変更が、2秒分の再生時間よりもはるかに高い頻度で起こり得る。本開示の技法はまた、入力符号化ビデオデータのための解像度変更を正しく処理することができるが、より低い解像度のビデオデータを表示のための所定の最大解像度(例えば、ビデオデータが出力されるディスプレイに一致する解像度)にアップサンプリングすることもできるビデオデコーダを前提とし得る。このようにして、表示されたビデオデータは、たとえ入力符号化ビデオデータの解像度が変化しても同じ解像度を有することになり、それによってユーザが解像度変更を観察することが防止され得る。
【0069】
このようにして、クライアントデバイス40は、メディアデータを取り出すためのデバイスの一例を表し、デバイスは、ビデオデータを記憶するように構成されたメモリと、ビデオデータを復号するように構成されたビデオデコーダと、回路機構で実装された1つ又は複数のプロセッサであって、メディアプレゼンテーションが第1の空間解像度での第1のビデオデータと第2の空間解像度での第2のビデオデータとを含むと判定し、第2の空間解像度が第1の空間解像度とは異なり、第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分を受信し、第1の空間解像度での第1のビデオデータの第1の部分をビデオデコーダに送信し、第1の再生時間よりも後の第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分を受信し、第2の空間解像度での第2のビデオデータの第2の部分をビデオデコーダに送信する、ように構成されている、1つ又は複数のプロセッサと、を含む。
【0070】
図2は、図1の取り出しユニット52の構成要素の例示的なセットをより詳細に示すブロック図である。この例では、取り出しユニット52は、デジタルビデオブロードキャスト(DVB)ミドルウェアユニット100、DASHクライアント110、及びメディアアプリケーション112を含む。
【0071】
この例では、DVBミドルウェアユニット100は、DVB受信ユニット106、キャッシュ104、及びプロキシサーバユニット102を更に含む。この例では、DVB受信ユニット106は、例えば、DVBを介してデータを受信するように構成される。つまり、DVB受信ユニット106は、DVBブロードキャストサーバとして機能し得る、例えばサーバデバイス60から、ブロードキャストを介してファイルを受信し得る。
【0072】
DVBミドルウェアユニット100がファイル(例えば、そのセグメント又はチャンク)に関するデータを受信すると、DVBミドルウェアユニットは、受信されたデータをキャッシュ104中に記憶し得る。キャッシュ104は、フラッシュメモリ、ハードディスク、RAM、又は任意の他の適切な記憶媒体などのコンピュータ可読記憶媒体を含み得る。
【0073】
プロキシサーバユニット102は、DASHクライアント110のためのサーバとして働き得る。例えば、プロキシサーバユニット102は、DASHクライアント110にMPDファイル又は他のマニフェストファイルを提供し得る。プロキシサーバユニット102は、MPDファイル中のセグメントに関する利用可能時間と、セグメントが取り出され得るハイパーリンクとを広告し得る。これらのハイパーリンクは、クライアントデバイス40に対応するローカルホストアドレスプレフィックス(例えば、IPv4に関する127.0.0.1)を含み得る。このようにして、DASHクライアント110は、HTTP GET又は部分GET要求を使用して、プロキシサーバユニット102にセグメントを要求し得る。例えば、リンクhttp//127.0.0.1/rep1/seg3から利用可能なセグメントについてはDASHクライアント110は、http://127.0.0.1/rep1/seg3に対する要求を含むHTTP GET要求を構築してもよく、要求をプロキシサーバユニット102に提出してもよい。プロキシサーバユニット102は、要求されたデータをキャッシュ104から取り出し、そのような要求に応答して、そのデータをDASHクライアント110に提供し得る。
【0074】
本開示の技法によれば、DVB受信ユニット106は、異なる解像度を有する2つ以上の表現を含むメディアプレゼンテーションを受信することができる。DVB受信ユニット106はまた、表現のセグメント又はチャンクの品質値を含むARIトラックを受信することができる。DVB受信ユニット106は、受信されたセグメント又はチャンクをキャッシュ104に記憶することができる。DASHクライアント110は、プロキシサーバユニット102を介してARIトラックのデータを取り出し、所与の再生時間について、どのセグメント又はチャンクがより高い品質値を有するかを判定し、次いで、その再生時間についてより高い品質値を有するセグメント又はチャンクを取り出すことができる。
【0075】
図3は、例示的なマルチメディアコンテンツ120の要素を示す概念図である。マルチメディアコンテンツ120は、マルチメディアコンテンツ64(図1)、又は記憶媒体62に記憶された別のマルチメディアコンテンツに対応し得る。図3の例では、マルチメディアコンテンツ120は、メディアプレゼンテーション記述(MPD)122、複数の表現124A~124N(表現124)、及びアドレス指定可能リソース情報(ARI)トラック134を含む。表現124Aは、任意のヘッダデータ126とセグメント128A~128N(セグメント128)とを含む一方、表現124Nは、任意選択のヘッダデータ130とセグメント132A~132N(セグメント132)とを含む。文字Nが、便宜的に、表現124の各々の最後のムービーフラグメントを指定するために使用される。いくつかの例では、表現124同士の間で異なる数のムービーフラグメントが存在し得る。
【0076】
MPD122は、表現124とは別個のデータ構造を含んでよい。MPD122は、図1のマニフェストファイル66に対応し得る。同様に、表現124は、図1の表現68に対応し得る。概して、MPD122は、コーディング及びレンダリングの特性、適応セット、MPD122が対応するプロファイル、テキストタイプ情報、カメラアングル情報、レーティング情報、トリックモード情報(例えば、時間的サブシーケンスを含む表現を示す情報)、及び/又はリモート期間を取り出すための情報(例えば、再生中のメディアコンテンツへのターゲティング広告の挿入)のような、表現124の特性を一般に表すデータを含んでよい。
【0077】
ヘッダデータ126は、存在するとき、セグメント128の特性、例えば、ランダムアクセスポイント(RAP、ストリームアクセスポイント(SAP)とも呼ばれる)の時間的ロケーション、セグメント128のうちのどれがランダムアクセスポイントを含むのか、セグメント128内のランダムアクセスポイントへのバイトオフセット、セグメント128のユニフォームリソースロケータ(URL)、又はセグメント128の他の態様を記述し得る。ヘッダデータ130は、存在するとき、セグメント132の同様の特性を記述し得る。追加又は代替として、そのような特性はMPD122内に完全に含まれ得る。
【0078】
セグメント128、132は、1つ又は複数のコード化ビデオサンプルを含み、ビデオサンプルの各々が、ビデオデータのフレーム又はスライスを含み得る。セグメント128のコード化されたビデオサンプルの各々は、同様の特性、例えば、高さ、幅、及び帯域幅の要件を有し得る。そのような特性は、MPD122のデータによって記述され得るが、そのようなデータは図3の例には示されていない。MPD122は、本開示で説明するシグナリングされた情報のいずれか又は全てが加えられた、3GPP仕様によって記述されるような特性を含み得る。
【0079】
セグメント128、132の各々は、固有のユニフォームリソースロケータ(URL)と関連付けられてもよい。したがって、セグメント128、132の各々は、DASHのようなストリーミングネットワークプロトコルを使用して、別個に取り出し可能であり得る。このようにして、クライアントデバイス40のような宛先デバイスは、HTTP GET要求を使用して、セグメント128又は132を取り出してもよい。いくつかの例では、クライアントデバイス40は、HTTP部分GET要求を使用して、セグメント128又は132の特定のバイト範囲を取り出す場合がある。
【0080】
ARIトラック134は、とりわけ、品質値136A~136N(品質値136)を含む。一般に、品質値136は、表現124の対応する(すなわち、再生時間整合された)セグメントの品質を表す値を含む。したがって、例えば、品質値136Aは、セグメント128A及び132Aに対する品質値を含み、品質値136Bは、セグメント128B及び132Bに対する品質値を含み、品質値136Aは、セグメント128N及び132Nに対する品質値を含む。
【0081】
本開示の技法によれば、表現124Aは、第1の解像度(例えば、4K)のビデオデータを含み得、表現124Nは、第2の異なる解像度(例えば、1080p)のビデオデータを含み得る。表現124A及び124Nは、同様又は同一のビットレートを有し得る。したがって、整合されたセグメント128及び132は、同様又は同一のビットレートを有し得る。例えば、セグメント128A及びセグメント132Aは、同様又は同一のビットレートを有し得るが、異なる解像度で符号化されたビデオデータを含み得る。
【0082】
セグメント124のうちのいくつかは、品質値136によって示されるように、(より低い空間解像度における)対応するセグメント132よりも高い品質を有し得る。しかしながら、場合によっては、セグメント132のうちの1つ又は複数は、品質値136によって示されるように、対応するセグメント124よりも高い品質値を有し得る。したがって、クライアントデバイス40(図1)は、品質値136を使用して、対応するセグメントの所与のセットのどのセグメントがより高い品質値を有するかを判定し、より高い品質値を有するセグメント124、132のうちの1つを取り出すことができる。例えば、品質値136Aが、セグメント124Aがセグメント132Aよりも高い品質値を有することを示す場合、クライアントデバイス40(又はその取り出しユニット52)はセグメント124Aを取り出し得る。別の例として、品質値136Bが、セグメント132Bがセグメント124Bよりも高い品質を有することを示す場合、クライアントデバイス40又は取り出しユニット52は、セグメント132Bを取り出し得る。
【0083】
図4は、図3のセグメント128、132のうちの1つなどの表現のセグメントに対応し得る例示的なビデオファイル150の要素を示すブロック図である。セグメント128、132の各々は、図4の例で示されるデータの構成に実質的に準拠するデータを含み得る。ビデオファイル150は、セグメントをカプセル化すると言われ得る。上記で説明したように、ISOベースのメディアファイルフォーマット及びその拡張によるビデオファイルは、「ボックス」と呼ばれる一連のオブジェクト内にデータを記憶する。図4の例では、ビデオファイル150は、ファイルタイプ(FTYP)ボックス152、ムービー(MOOV)ボックス154、セグメントインデックス(sidx)ボックス162、ムービーフラグメント(MOOF)ボックス164、及びムービーフラグメントランダムアクセス(MFRA)ボックス166を含む。図4は、ビデオファイルの例を表すが、他のメディアファイルは、ISOベースのメディアファイルフォーマット及びその拡張に従ってビデオファイル150のデータと同様に構成される他のタイプのメディアデータ(例えば、オーディオデータ、時限のテキストデータなど)を含み得ることを理解されたい。
【0084】
ファイルタイプ(FTYP)ボックス152は一般に、ビデオファイル150のファイルタイプを表す。ファイルタイプボックス152は、ビデオファイル150の最良の使用法を表す仕様を識別するデータを含み得る。ファイルタイプボックス152は、代替として、MOOVボックス154、ムービーフラグメントボックス164、及び/又はMFRAボックス166の前に配置され得る。
【0085】
いくつかの例では、ビデオファイル150などのセグメントは、FTYPボックス152の前にMPD更新ボックス(図示せず)を含み得る。MPD更新ボックスは、ビデオファイル150を含む表現に対応するMPDが更新されるべきであることを示す情報を、MPDを更新するための情報と共に、含み得る。例えば、MPD更新ボックスは、MPDを更新するために使用されることになるリソースについてのURI又はURLを提供し得る。別の例として、MPD更新ボックスは、MPDを更新するためのデータを含み得る。いくつかの例では、MPD更新ボックスは、ビデオファイル150のセグメントタイプ(STYP)ボックス(示されていない)の直後に続き得、ここでSTYPボックスは、ビデオファイル150についてのセグメントタイプを定義し得る。
【0086】
図4の例では、MOOVボックス154は、ムービーヘッダ(MVHD)ボックス156と、トラック(TRAK)ボックス158と、1つ又は複数のムービー延長(MVEX)ボックス160とを含む。概して、MVHDボックス156は、ビデオファイル150の一般的な特性を記述することができる。例えば、MVHDボックス156は、ビデオファイル150がいつ最初に作成されたかを表すデータ、ビデオファイル150がいつ最後に修正されたかを表すデータ、ビデオファイル150のタイムスケールを表すデータ、ビデオファイル150の再生の持続時間を表すデータ、又は、ビデオファイル150を全般的に表す他のデータを含み得る。
【0087】
TRAKボックス158は、ビデオファイル150のトラックのデータを含み得る。TRAKボックス158は、TRAKボックス158に対応するトラックの特性を記述する、トラックヘッダ(TKHD)ボックスを含み得る。いくつかの例では、TRAKボックス158は、コード化ビデオピクチャを含み得るが、他の例では、トラックのコード化ビデオピクチャは、TRAKボックス158のデータ及び/又はsidxボックス162のデータによって参照され得るムービーフラグメント164内に含まれ得る。
【0088】
いくつかの例では、ビデオファイル150は、2つ以上のトラックを含み得る。したがって、MOOVボックス154は、ビデオファイル150中のトラックの数(the number of tracks)に等しいいくつかのTRAKボックス(a number of TRAK boxes)を含み得る。TRAKボックス158は、ビデオファイル150の対応するトラックの特性を記述することができる。例えば、TRAKボックス158は、対応するトラックの時間情報及び/又は空間情報を記述することができる。カプセル化ユニット30(図3)がビデオファイル150などのビデオファイル中にパラメータセットトラックを含む場合、MOOVボックス154のTRAKボックス158と同様のTRAKボックスがパラメータセットトラックの特性を記述することができる。カプセル化ユニット30は、パラメータセットトラックを表すTRAKボックス内で、パラメータセットトラックにシーケンスレベルSEIメッセージが存在することをシグナリングすることができる。
【0089】
MVEXボックス160は、例えば、もしあれば、MOOVボックス154内に含まれるビデオデータに加えて、ビデオファイル150がムービーフラグメント164を含むことをシグナリングするように、対応するムービーフラグメント164の特性を記述することができる。ストリーミングビデオデータの状況では、コード化ビデオピクチャは、MOOVボックス154の中ではなくムービーフラグメント164の中に含まれ得る。したがって、全てのコード化ビデオサンプルは、MOOVボックス154の中ではなくムービーフラグメント164の中に含まれ得る。
【0090】
MOOVボックス154は、ビデオファイル150中のムービーフラグメント164の数に等しいいくつかのMVEXボックス160を含み得る。MVEXボックス160の各々は、ムービーフラグメント164の対応する1つの特性を記述することができる。例えば、各MVEXボックスは、ムービーフラグメント164の対応する1つの持続時間を記述するムービー延長ヘッダ(MEHD)ボックスを含み得る。
【0091】
上述したように、カプセル化ユニット30は、実際のコード化ビデオデータを含まないビデオサンプル内にシーケンスデータセットを記憶してもよい。ビデオサンプルは、一般に、アクセスユニットに対応してもよく、アクセスユニットは、特定の時間インスタンスにおけるコード化ピクチャの表現である。AVCのコンテキストでは、コード化ピクチャは、アクセスユニットの全てのピクセルを構成するための情報を含んでいる1つ又は複数のVCL NALユニットと、SEIメッセージなどの他の関連付けられた非VCL NALユニットとを含む。したがって、カプセル化ユニット30は、シーケンスレベルSEIメッセージを含み得るシーケンスデータセットを、ムービーフラグメント164のうちの1つの中に含め得る。カプセル化ユニット30は更に、シーケンスデータセット及び/又はシーケンスレベルSEIメッセージの存在を、ムービーフラグメント164のうちの1つに対応するMVEXボックス160のうちの1つの中のムービーフラグメント164のうちの1つの中に存在するものとして、シグナリングすることができる。
【0092】
SIDXボックス162は、ビデオファイル150の任意選択の要素である。すなわち、3GPPファイルフォーマット又は他のそのようなファイルフォーマットに準拠するビデオファイルは、必ずしもSIDXボックス162を含むとは限らない。3GPPファイルフォーマットの例によると、SIDXボックスは、(例えば、ビデオファイル150内に含まれるセグメント等の)セグメントのサブセグメントを識別するために使用され得る。3GPPファイルフォーマットは、「メディアデータボックスに対応する1つ又は複数の連続するムービーフラグメントボックスの自己完結型セットであって、ムービーフラグメントボックスによって参照されるデータを包含するメディアデータボックスが、そのムービーフラグメントボックスに続き、同じトラックについての情報を包含する次のムービーフラグメントボックスに先行する」としてサブセグメントを定義する。3GPPファイルフォーマットはまた、SIDXボックスが、「ボックスによって文書化された(サブ)セグメントのサブセグメントへの参照のシーケンスを包含する。参照されるサブセグメントは、プレゼンテーション時間において連続する。同様に、セグメントインデックスボックスによって参照されるバイトは、セグメント内で常に連続する。参照されるサイズは、参照される材料におけるバイトの数のカウントを与える」ことを示す。
【0093】
SIDXボックス162は、概して、ビデオファイル150中に含まれるセグメントの1つ又は複数のサブセグメントを表す情報を提供する。例えば、そのような情報は、サブセグメントが開始及び/又は終了する再生時間、サブセグメントに関するバイトオフセット、サブセグメントがストリームアクセスポイント(SAP)を含む(例えば、それによって開始する)かどうか、SAPのタイプ(例えば、SAPが、瞬時デコーダリフレッシュ(IDR)ピクチャ、クリーンランダムアクセス(CRA)ピクチャ、ブロークンリンクアクセス(BLA)ピクチャなどのいずれであるか)、サブセグメント内の(再生時間及び/又はバイトオフセットに関する)SAPの位置、などを含み得る。
【0094】
ムービーフラグメント164は、1つ又は複数のコード化ビデオピクチャを含み得る。いくつかの例では、ムービーフラグメント164は、1つ又は複数のピクチャのグループ(GOP)を含んでよく、GOPの各々は、多数のコード化ビデオピクチャ、例えばフレーム又はピクチャを含み得る。加えて、上記で説明したように、ムービーフラグメント164は、いくつかの例ではシーケンスデータセットを含み得る。ムービーフラグメント164の各々は、ムービーフラグメントヘッダボックス(MFHD、図4には示されない)を含み得る。MFHDボックスは、ムービーフラグメントのシーケンス番号などの、対応するムービーフラグメントの特性を記述することができる。ムービーフラグメント164は、ビデオファイル150にシーケンスナンバの順番で含まれ得る。
【0095】
MFRAボックス166は、ビデオファイル150のムービーフラグメント164内のランダムアクセスポイントを記述することができる。これは、ビデオファイル150によってカプセル化されたセグメント内の特定の時間的ロケーション(すなわち、再生時間)の探索を実施することなど、トリックモードを実施することを支援し得る。MFRAボックス166は、いくつかの例では、一般に任意選択であり、ビデオファイル中に含まれる必要はない。同様に、クライアントデバイス40のようなクライアントデバイスは、ビデオファイル150のビデオデータを正確に復号し表示するために、MFRAボックス166を必ずしも参照する必要はない。MFRAボックス166は、ビデオファイル150のトラックの数と等しい数のトラックフラグメントランダムアクセス(TFRA)ボックス(図示せず)を含んでよく、又はいくつかの例では、ビデオファイル150のメディアトラック(例えば、非ヒントトラック)の数と等しい数のTFRAボックスを含んでよい。
【0096】
いくつかの例では、ムービーフラグメント164は、IDRピクチャなどの1つ又は複数のストリームアクセスポイント(SAP)を含み得る。同様に、MFRAボックス166は、SAPのビデオファイル150内のロケーションの指標を提供し得る。したがって、ビデオファイル150の時間的サブシーケンスは、ビデオファイル150のSAPから形成され得る。時間的サブシーケンスはまた、SAPに従属するPフレーム及び/又はBフレームなどの他のピクチャを含み得る。時間的サブシーケンスのフレーム及び/又はスライスは、サブシーケンスの他のフレーム/スライスに依存する時間的サブシーケンスのフレーム/スライスが適切に復号され得るように、セグメント内に並べられ得る。例えば、データの階層的構成において、他のデータのための予測に使用されるデータはまた、時間的サブシーケンス内に含まれ得る。
【0097】
図5は、本開示の技法による取り出し技法の例を示す概念図である。特に、グラフ170は、時間172A~172D(時間172)においてメディアデータのセグメントを取り出すことができる時間にわたる利用可能なビットレートを示す。図5に示される第1の例では、基本クライアント174は、4K解像度で時間172ごとにセグメントを取り出す。基本クライアント174は、基本クライアント174が本開示の技法を実装しないという意味で「基本」と見なされる。したがって、本開示の技法によるARIトラックにおける品質値のシグナリングは、これらの技法を実行するように構成されていないクライアントデバイスと後方互換性がある。
【0098】
しかしながら、別の例では、アドバンストクライアント176は、本開示の技法を実行するように構成される。この例では、時間172A、172C、及び172Dにおいて、アドバンストクライアント176は、4K解像度のセグメントがより高い品質値を有すると判定する。しかしながら、時間172Bの間、アドバンストクライアント176は、(例えば、セグメントのための品質値をシグナリングするARIトラックを使用して)1080p解像度を有するセグメントがより高い品質であると判定する。したがって、アドバンストクライアント176は、代わりに、1080p解像度を有する解像度からセグメントを取り出す。
【0099】
図6は、本開示の技法による、メディアデータを取り出す例示的な方法を示すフローチャートである。図6の方法は、例示及び説明の目的で、図1のクライアントデバイス40及びサーバデバイス60に関して説明される。
【0100】
最初に、クライアントデバイス40は、メディアプレゼンテーションのマニフェストファイルを要求することができる(200)。クライアントデバイス40は、例えば、マニフェストファイルのためのURLを含むHTTP GET要求をサーバデバイス60に送り得る。それに応答して、サーバデバイス60は、要求されたマニフェストファイルをクライアントデバイス40に送信することができる(202)。
【0101】
次いでクライアントデバイス40は、マニフェストファイルを受信し得る(204)。マニフェストファイルを使用して、クライアントデバイス40は、クライアントデバイス40のディスプレイ(例えば、ビデオ出力44)のための一致するディスプレイ解像度を有する切り替えセットを判定することができる(206)。切り替えセットは、切り替えセットがクライアントデバイス40のためのディスプレイのディスプレイ解像度以下の符号化解像度を有する表現を含むという意味で、一致するディスプレイ解像度を有し得る。
【0102】
クライアントデバイス40は更に、切り替えセットのためのアドレス指定可能リソースインデックス(ARI)トラックを受信し、処理し得る。選択された切り替えセットのためのメディアデータのストリーミング及び再生を通して、クライアントデバイス40は、ARIトラックのデータを使用して、特定のプレゼンテーション時間の時間的に整合されたセグメントの品質値を判定することができる。次いで、クライアントデバイス40は、特定のプレゼンテーション時間に関して、ARIトラックの品質値を使用して、最高品質値を有するセグメント(又はチャンク)を判定することができる(208)。クライアントデバイス40は、判定されたセグメントを要求することができる(210)。例えば、クライアントデバイス40は、判定されたセグメントのURLを指定するHTTP GET要求を構築し、HTTP GET要求をサーバデバイス60に送ることができる。サーバデバイス60は、次に、要求を受信し(212)、要求されたセグメントをクライアントデバイス40に送信することができる(214)。
【0103】
代替的に、クライアントデバイス40は、異なる空間解像度を有するビデオデータの2つ以上の表現又は他のセットを含むブロードキャストメディアストリームを受信し得る。図2に関して説明したように、DVBミドルウェアユニット100は、受信したビデオデータをキャッシュすることができる。上記のサーバデバイス60に起因する動作は、代わりにプロキシサーバユニット102によって実行されてもよい。すなわち、DASHクライアント110は、(ARIトラックによって示される最高品質値を有する)判定されたセグメントをプロキシサーバユニット102から取り出し得る。
【0104】
クライアントデバイス40は、次いで、セグメントを受信し(216)、セグメントのビデオデータをビデオデコーダ48に送り得る(218)。
【0105】
このようにして、図6の方法は、ビデオデータを取り出す方法の例を表し、メディアプレゼンテーションが第1の空間解像度での第1のビデオデータと第2の空間解像度での第2のビデオデータとを含むと判定することであって、第2の空間解像度が第1の空間解像度とは異なる、ことと、第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分を受信することと、第1の空間解像度での第1のビデオデータの第1の部分をビデオデコーダに送信することと、第1の再生時間よりも後の第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分を受信することと、第2の空間解像度での第2のビデオデータの第2の部分をビデオデコーダに送信することと、を含む。
【0106】
本開示の技法の様々な例が、以下の条項において要約される。
【0107】
条項1:メディアデータを受信する方法であって、メディアプレゼンテーションが第1の空間解像度での第1のビデオデータと第2の空間解像度での第2のビデオデータとを含むと判定することであって、第2の空間解像度が第1の空間解像度とは異なる、ことと、第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分を受信することと、第1の空間解像度での第1のビデオデータの第1の部分をビデオデコーダに送信することと、第1の再生時間よりも後の第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分を受信することと、第2の空間解像度での第2のビデオデータの第2の部分をビデオデコーダに送信することと、を含む、方法。
【0108】
条項2:メディアプレゼンテーションのためのアドレス指定可能リソースインデックス(ARI)トラックであって、ARIトラックが、第1の再生時間に関する第1の空間解像度での第1のビデオデータのための第1の品質と、第1の再生時間に関する第2の空間解像度での第2のビデオデータの第2の品質とを表すデータを含む、ARIトラックを受信することと、第1の品質が第2の品質よりも高いと判定することと、を更に含み、第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分を受信することが、第1の品質が第2の品質よりも高いと判定したことに応答して、第1の再生時間に関する第2の空間解像度での第2のビデオデータの代わりに、第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分を取り出すことを含む、条項1に記載の方法。
【0109】
条項3:第2の空間解像度が第1の空間解像度よりも高い、条項2に記載の方法。
【0110】
条項4:第1の再生時間に関する第1の空間解像度での第1のビデオデータが、第1の再生時間に関する第2の空間解像度での第2のビデオデータに等しいビットレートを有する、条項2に記載の方法。
【0111】
条項5:第1の品質及び第2の品質が、空間解像度及びビットレート以外の1つ又は複数の品質測定値を表す、条項2に記載の方法。
【0112】
条項6:ARIトラックが、第2の再生時間における第1の空間解像度での第1のビデオデータについての第3の品質と、第2の再生時間における第2の空間解像度での第2のビデオデータについての第4の品質とを表すデータを更に含み、方法が、第4の品質が第3の品質よりも高いと判定することを更に含み、第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分を受信することが、第4の品質が第3の品質よりも高いと判定したことに応答して、第2の再生時間に関する第1の空間解像度での第1のビデオデータの代わりに、第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分を取り出すことを含む、条項2に記載の方法。
【0113】
条項7:第1の空間解像度が第2の空間解像度よりも高い、条項6に記載の方法。
【0114】
条項8:第2の再生時間に関する第1の空間解像度での第1のビデオデータが、第2の再生時間に関する第2の空間解像度での第2のビデオデータに等しいビットレートを有する、条項6に記載の方法。
【0115】
条項9:第3の品質及び第4の品質が、空間解像度及びビットレート以外の1つ又は複数の品質測定値を表す、条項6に記載の方法。
【0116】
条項10:メディアプレゼンテーションが、第1の空間解像度での第1のビデオデータを含む第1の表現と、第2の空間解像度での第2のビデオデータを含む第2の表現とを含み、メディアプレゼンテーションが、第1の表現と第2の表現の両方を含む切り替えセットを含む、条項1に記載の方法。
【0117】
条項11:第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分を受信することが、ミドルウェアユニットによって、ブロードキャストを介して第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分を受信することを含み、方法が、ミドルウェアユニットによって、第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分をキャッシュすることと、動的適応ストリーミングオーバーHTTP(DASH)クライアントによって、ミドルウェアユニットから、第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分を取り出すことと、を更に含む、条項1に記載の方法。
【0118】
条項12:第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分を受信することが、ミドルウェアユニットによって、ブロードキャストを介して第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分を受信することを含み、方法は、ミドルウェアユニットによって、第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分をキャッシュすることと、動的適応ストリーミングオーバーHTTP(DASH)クライアントによって、ミドルウェアユニットから、第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分を取り出すことと、を更に含む、条項1に記載の方法。
【0119】
条項13:メディアデータを取り出すためのデバイスであって、ビデオデータを記憶するように構成されたメモリと、ビデオデータを復号するように構成されたビデオデコーダと、回路機構で実装された1つ又は複数のプロセッサであって、メディアプレゼンテーションが第1の空間解像度での第1のビデオデータと第2の空間解像度での第2のビデオデータとを含むと判定し、第2の空間解像度が第1の空間解像度とは異なり、第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分を受信し、第1の空間解像度での第1のビデオデータの第1の部分をビデオデコーダに送信し、第1の再生時間よりも後の第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分を受信し、第2の空間解像度での第2のビデオデータの第2の部分をビデオデコーダに送信する、ように構成されている、1つ又は複数のプロセッサと、を含む、デバイス。
【0120】
条項14:1つ又は複数のプロセッサが、メディアプレゼンテーションのためのアドレス指定可能リソースインデックス(ARI)トラックを受信し、ARIトラックが、第1の再生時間に関する第1の空間解像度での第1のビデオデータのための第1の品質と、第1の再生時間に関する第2の空間解像度での第2のビデオデータの第2の品質とを表すデータを含み、第1の品質が第2の品質よりも高いと判定する、ように更に構成されており、1つ又は複数のプロセッサが、第1の品質が第2の品質よりも高いと判定したことに応答して、第1の再生時間の間に第2の空間解像度での第2のビデオデータの代わりに、第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分を取り出すように構成されている、条項13に記載のデバイス。
【0121】
条項15:第2の空間解像度が第1の空間解像度よりも高い、条項14に記載のデバイス。
【0122】
条項16:第1の再生時間に関する第1の空間解像度における第1のビデオデータが、第1の再生時間に関する第2の空間解像度での第2のビデオデータに等しいビットレートを有する、条項14に記載のデバイス。
【0123】
条項17:第1の品質及び第2の品質が、空間解像度及びビットレート以外の1つ又は複数の品質測定値を表す、条項14に記載のデバイス。
【0124】
条項18:ARIトラックが、第2の再生時間における第1の空間解像度での第1のビデオデータについての第3の品質と、第2の再生時間における第2の空間解像度での第2のビデオデータについての第4の品質とを表すデータを更に含み、1つ又は複数のプロセッサが、第4の品質が第3の品質よりも高いと判定するように更に構成されおり、1つ又は複数のプロセッサが、第4の品質が第3の品質よりも高いと判定したことに応答して、第2の再生時間に関する第1の空間解像度で第1のビデオデータを取り出す代わりに、第2の再生時間における第2の空間解像度で第2のビデオデータの第2の部分を取り出すように構成されている、条項14に記載のデバイス。
【0125】
条項19:第1の空間解像度が第2の空間解像度よりも高い、条項18に記載のデバイス。
【0126】
条項20:第2の再生時間に関する第1の空間解像度での第1のビデオデータが、第2の再生時間に関する第2の空間解像度での第2のビデオデータに等しいビットレートを有する、条項18に記載のデバイス。
【0127】
条項21:第3の品質及び第4の品質が、空間解像度及びビットレート以外の1つ又は複数の品質測定値を表す、条項18に記載のデバイス。
【0128】
条項22:メディアプレゼンテーションが、第1の空間解像度での第1のビデオデータを含む第1の表現と、第2の空間解像度での第2のビデオデータを含む第2の表現とを含み、メディアプレゼンテーションが、第1の表現と第2の表現の両方を含む切り替えセットを含む、条項13に記載のデバイス。
【0129】
条項23:ブロードキャストを介して第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分を受信し、ブロードキャストを介して第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分をキャッシュするように構成されたミドルウェアユニットを更に備え、1つ又は複数のプロセッサが、ミドルウェアユニットから第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分を取り出すために、動的適応ストリーミングオーバーHTTP(DASH)クライアントを実行するように構成されている、条項13に記載のデバイス。
【0130】
条項24:ブロードキャストを介して第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分を受信し、ブロードキャストを介して第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分をキャッシュするように構成されたミドルウェアユニットを更に備え、1つ又は複数のプロセッサが、ミドルウェアユニットから第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分を取り出すために、動的適応ストリーミングオーバーHTTP(DASH)クライアントを実行するように構成されている、条項13に記載のデバイス。
【0131】
条項25:装置が、集積回路、マイクロプロセッサ、及びワイヤレス通信デバイスのうちの少なくとも1つを備える、条項13に記載のデバイス。
【0132】
条項26:命令を記憶したコンピュータ可読記憶媒体であって、命令は、実行されると、プロセッサに、メディアプレゼンテーションが第1の空間解像度での第1のビデオデータと第2の空間解像度での第2のビデオデータとを含むと判定させ、第2の空間解像度が第1の空間解像度とは異なり、第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分を受信し、第1の空間解像度での第1のビデオデータの第1の部分をビデオデコーダに送信させ、第1の再生時間よりも後の第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分を受信し、第2の空間解像度での第2のビデオデータの第2の部分をビデオデコーダに送信する、ように構成されている、1つ又は複数のプロセッサと、を含む、条項13に記載のデバイス。
【0133】
条項27:プロセッサに、メディアプレゼンテーションのためのアドレス指定可能リソースインデックス(ARI)トラックを受信させ、ARIトラックが、第1の再生時間に関する第1の空間解像度での第1のビデオデータのための第1の品質と、第1の再生時間に関する第2の空間解像度での第2のビデオデータの第2の品質とを表すデータを含み、第1の品質が第2の品質よりも高いと判定させる、命令を更に含み、プロセッサに、第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分を受信させる命令が、第1の品質が第2の品質よりも高いと判定したことに応答して、プロセッサに、第1の再生時間に関する第2の空間解像度での第2のビデオデータの代わりに、第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分を取り出させる命令を含む、条項26に記載のコンピュータ可読記憶媒体。
【0134】
条項28:第2の空間解像度が第1の空間解像度よりも高い、条項27に記載のコンピュータ可読記憶媒体。
【0135】
条項29:第1の再生時間に関する第1の空間解像度での第1のビデオデータが、第1の再生時間に関する第2の空間解像度での第2のビデオデータに等しいビットレートを有する、条項27に記載のコンピュータ可読記憶媒体。
【0136】
条項30:第1の品質及び第2の品質が、空間解像度及びビットレート以外の1つ又は複数の品質測定値を表す、条項27に記載のコンピュータ可読記憶媒体。
【0137】
条項31:ARIトラックが、第2の再生時間における第1の空間解像度での第1のビデオデータについての第3の品質と、第2の再生時間における第2の空間解像度での第2のビデオデータについての第4の品質とを表すデータを更に含み、プロセッサに、第4の品質が第3の品質よりも高いと判定させる命令を更に備え、プロセッサに、第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分を受信させる命令が、第4の品質が第3の品質よりも高いと判定したことに応答して、プロセッサに、第2の再生時間に関する第1の空間解像度での第1のビデオデータを取り出させる代わりに、第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分を取り出させる命令を含む、条項27に記載のコンピュータ可読記憶媒体。
【0138】
条項32:第1の空間解像度が第2の空間解像度よりも高い、条項31に記載のコンピュータ可読記憶媒体。
【0139】
条項33:第2の再生時間に関する第1の空間解像度での第1のビデオデータが、第2の再生時間に関する第2の空間解像度での第2のビデオデータに等しいビットレートを有する、条項31に記載のコンピュータ可読記憶媒体。
【0140】
条項34:第3の品質及び第4の品質が、空間解像度及びビットレート以外の1つ又は複数の品質測定値を表す、条項31に記載のコンピュータ可読記憶媒体。
【0141】
条項35:メディアプレゼンテーションが、第1の空間解像度での第1のビデオデータを含む第1の表現と、第2の空間解像度での第2のビデオデータを含む第2の表現とを含み、メディアプレゼンテーションが、第1の表現と第2の表現の両方を含む切り替えセットを含む、条項26に記載のコンピュータ可読記憶媒体。
【0142】
条項36:プロセッサに、第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分を受信させる命令が、プロセッサに、ミドルウェアユニットから、第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分を取り出させる命令を含む、条項26に記載のコンピュータ可読記憶媒体。
【0143】
条項37:プロセッサに、第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分を受信させる命令が、プロセッサに、ミドルウェアユニットから、第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分を取り出させる命令を含む、条項26に記載のコンピュータ可読記憶媒体。
【0144】
条項38:メディアデータを取り出すためのデバイスであって、メディアプレゼンテーションが第1の空間解像度での第1のビデオデータと第2の空間解像度での第2のビデオデータとを含むと判定するための手段であって、第2の空間解像度が第1の空間解像度とは異なる、手段と、第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分を受信するための手段と、第1の空間解像度での第1のビデオデータの第1の部分をビデオデコーダに送信するための手段と、第1の再生時間よりも後の第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分を受信するための手段と、第2の空間解像度での第2のビデオデータの第2の部分をビデオデコーダに送信するための手段と、を含む、デバイス。
【0145】
条項39:メディアデータを受信する方法であって、メディアプレゼンテーションが第1の空間解像度での第1のビデオデータと第2の空間解像度での第2のビデオデータとを含むと判定することであって、第2の空間解像度が第1の空間解像度とは異なる、ことと、第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分を受信することと、第1の空間解像度での第1のビデオデータの第1の部分をビデオデコーダに送信することと、第1の再生時間よりも後の第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分を受信することと、第2の空間解像度での第2のビデオデータの第2の部分をビデオデコーダに送信することと、を含む、方法。
【0146】
条項40:メディアプレゼンテーションのためのアドレス指定可能リソースインデックス(ARI)トラックを受信することであって、ARIトラックが、第1の再生時間に関する第1の空間解像度での第1のビデオデータのための第1の品質と、第1の再生時間に関する第2の空間解像度での第2のビデオデータの第2の品質とを表すデータを含む、ことと、第1の品質が第2の品質よりも高いと判定することと、を更に含み、第1の再生時間の間に第1の空間解像度での第1のビデオデータの第1の部分を受信することが、第1の品質が第2の品質よりも高いと判定したことに応答して、第1の再生時間に関する第2の空間解像度での第2のビデオデータの代わりに、第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分を取り出すことを含む、条項39に記載の方法。
【0147】
条項41:第2の空間解像度が第1の空間解像度よりも高い、条項40に記載の方法。
【0148】
条項42:第1の再生時間に関する第1の空間解像度での第1のビデオデータが、第1の再生時間に関する第2の空間解像度での第2のビデオデータに等しいビットレートを有する、条項40又は41に記載の方法。
【0149】
条項43:第1の品質及び第2の品質が、空間解像度及びビットレート以外の1つ又は複数の品質測定値を表す、条項40から42のいずれかに記載の方法。
【0150】
条項44:ARIトラックが、第2の再生時間における第1の空間解像度での第1のビデオデータについての第3の品質と、第2の再生時間における第2の空間解像度での第2のビデオデータについての第4の品質とを表すデータを更に含み、方法が、第4の品質が第3の品質よりも高いと判定することを更に含み、第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分を受信することが、第4の品質が第3の品質よりも高いと判定したことに応答して、第2の再生時間に関する第1の空間解像度での第1のビデオデータの代わりに、第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分を取り出すことを含む、条項40に記載の方法。
【0151】
条項45:第1の空間解像度が第2の空間解像度よりも高い、条項44に記載の方法。
【0152】
条項46:第2の再生時間に関する第1の空間解像度での第1のビデオデータが、第2の再生時間に関する第2の空間解像度での第2のビデオデータに等しいビットレートを有する、条項44又は45に記載の方法。
【0153】
条項47:第3の品質及び第4の品質が、空間解像度及びビットレート以外の1つ又は複数の品質測定値を表す、条項44から46のいずれかに記載の方法。
【0154】
条項48:メディアプレゼンテーションが、第1の空間解像度での第1のビデオデータを含む第1の表現と、第2の空間解像度での第2のビデオデータを含む第2の表現とを含み、メディアプレゼンテーションが、第1の表現と第2の表現の両方を含む切り替えセットを含む、条項39から47のいずれかに記載の方法。
【0155】
条項49:第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分を受信することが、ミドルウェアユニットによって、ブロードキャストを介して第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分を受信することを含み、方法が、ミドルウェアユニットによって、第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分をキャッシュすることと、動的適応ストリーミングオーバーHTTP(DASH)クライアントによって、ミドルウェアユニットから、第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分を取り出すことと、を更に含む、条項39から48のいずれかに記載の方法。
【0156】
条項50:第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分を受信することが、ミドルウェアユニットによって、ブロードキャストを介して第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分を受信することを含み、方法は、ミドルウェアユニットによって、第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分をキャッシュすることと、動的適応ストリーミングオーバーHTTP(DASH)クライアントによって、ミドルウェアユニットから、第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分を取り出すことと、を更に含む、条項39から49のいずれかに記載の方法。
【0157】
条項51:メディアデータを取り出すためのデバイスであって、ビデオデータを記憶するように構成されたメモリと、ビデオデータを復号するように構成されたビデオデコーダと、回路機構で実装された1つ又は複数のプロセッサであって、メディアプレゼンテーションが第1の空間解像度での第1のビデオデータと第2の空間解像度での第2のビデオデータとを含むと判定し、第2の空間解像度が第1の空間解像度とは異なり、第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分を受信し、第1の空間解像度での第1のビデオデータの第1の部分をビデオデコーダに送信し、第1の再生時間よりも後の第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分を受信し、第2の空間解像度での第2のビデオデータの第2の部分をビデオデコーダに送信する、ように構成されている、1つ又は複数のプロセッサと、を含む、デバイス。
【0158】
条項52:1つ又は複数のプロセッサが、メディアプレゼンテーションのためのアドレス指定可能リソースインデックス(ARI)トラックを受信し、ARIトラックが、第1の再生時間に関する第1の空間解像度での第1のビデオデータのための第1の品質と、第1の再生時間に関する第2の空間解像度での第2のビデオデータの第2の品質とを表すデータを含み、第1の品質が第2の品質よりも高いであると判定する、ように更に構成されており、1つ又は複数のプロセッサが、第1の品質が第2の品質よりも高いと判定したことに応答して、第1の再生時間に関する第2の空間解像度での第2のビデオデータの代わりに、第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分を取り出すように構成されている、条項51に記載のデバイス。
【0159】
条項53:第2の空間解像度が第1の空間解像度よりも高い、条項52に記載のデバイス。
【0160】
条項54:第1の再生時間に関する第1の空間解像度での第1のビデオデータが、第1の再生時間に関する第2の空間解像度での第2のビデオデータに等しいビットレートを有する、条項52又は53に記載のデバイス。
【0161】
条項55:第1の品質及び第2の品質が、空間解像度及びビットレート以外の1つ又は複数の品質測定値を表す、条項52から54のいずれかに記載のデバイス。
【0162】
条項56:ARIトラックが、第2の再生時間における第1の空間解像度での第1のビデオデータについての第3の品質と、第2の再生時間における第2の空間解像度での第2のビデオデータについての第4の品質とを表すデータを更に含み、1つ又は複数のプロセッサが、第4の品質が第3の品質よりも高いと判定するように更に構成されおり、1つ又は複数のプロセッサが、第4の品質が第3の品質よりも高いと判定したことに応答して、第2の再生時間に関する第1の空間解像度で第1のビデオデータを取り出す代わりに、第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分を取り出すように構成されている、条項52から55のいずれかに記載のデバイス。
【0163】
条項57:第1の空間解像度が第2の空間解像度よりも高い、条項56に記載のデバイス。
【0164】
条項58:第2の再生時間に関する第1の空間解像度での第1のビデオデータが、第2の再生時間に関する第2の空間解像度での第2のビデオデータに等しいビットレートを有する、条項56又は57に記載のデバイス。
【0165】
条項59:第3の品質及び第4の品質が、空間解像度及びビットレート以外の1つ又は複数の品質測定値を表す、条項56から58のいずれかに記載のデバイス。
【0166】
条項60:メディアプレゼンテーションが、第1の空間解像度での第1のビデオデータを含む第1の表現と、第2の空間解像度での第2のビデオデータを含む第2の表現とを含み、メディアプレゼンテーションが、第1の表現と第2の表現の両方を含む切り替えセットを含む、条項51から59のいずれかに記載のデバイス。
【0167】
条項61:ブロードキャストを介して第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分を受信し、ブロードキャストを介して第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分をキャッシュするように構成されたミドルウェアユニットを更に備え、1つ又は複数のプロセッサが、ミドルウェアユニットから第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分を取り出すために、動的適応ストリーミングオーバーHTTP(DASH)クライアントを実行するように構成されている、条項51から60のいずれかに記載のデバイス。
【0168】
条項62:ブロードキャストを介して第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分を受信し、ブロードキャストを介して第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分をキャッシュするように構成されたミドルウェアユニットを更に備え、1つ又は複数のプロセッサが、ミドルウェアユニットから第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分を取り出すために、動的適応ストリーミングオーバーHTTP(DASH)クライアントを実行するように構成されている、条項51から61のいずれかに記載のデバイス。
【0169】
条項63:デバイスが、集積回路、マイクロプロセッサ、及びワイヤレス通信デバイスのうちの少なくとも1つを備える、条項51から62のいずれかに記載のデバイス。
【0170】
条項64:命令を記憶したコンピュータ可読記憶媒体であって、命令は、実行されると、プロセッサに、メディアプレゼンテーションが第1の空間解像度での第1のビデオデータと第2の空間解像度での第2のビデオデータとを含むと判定させ、第2の空間解像度が第1の空間解像度とは異なり、第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分を受信し、第1の空間解像度での第1のビデオデータの第1の部分をビデオデコーダに送信させ、第1の再生時間よりも後の第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分を受信し、第2の空間解像度での第2のビデオデータの第2の部分をビデオデコーダに送信する、ように構成されている、1つ又は複数のプロセッサと、を含む、コンピュータ可読記憶媒体。
【0171】
条項65:プロセッサに、メディアプレゼンテーションのためのアドレス指定可能リソースインデックス(ARI)トラックを受信させ、ARIトラックが、第1の再生時間に関する第1の空間解像度での第1のビデオデータのための第1の品質と、第1の再生時間に関する第2の空間解像度での第2のビデオデータの第2の品質とを表すデータを含み、第1の品質が第2の品質よりも高いと判定させる、命令を更に含み、プロセッサに、第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分を受信させる命令が、第1の品質が第2の品質よりも高いと判定したことに応答して、プロセッサに、第1の再生時間に関する第2の空間解像度での第2のビデオデータの代わりに、第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分を取り出させる命令を含む、条項64に記載のコンピュータ可読記憶媒体。
【0172】
条項66:第2の空間解像度が第1の空間解像度よりも高い、条項65に記載のコンピュータ可読記憶媒体。
【0173】
条項67:第1の再生時間に関する第1の空間解像度での第1のビデオデータが、第1の再生時間に関する第2の空間解像度での第2のビデオデータに等しいビットレートを有する、条項65又は66に記載のコンピュータ可読記憶媒体。
【0174】
条項68:第1の品質及び第2の品質が、空間解像度及びビットレート以外の1つ又は複数の品質測定値を表す、条項65から67のいずれかに記載のコンピュータ可読記憶媒体。
【0175】
条項69:ARIトラックが、第2の再生時間における第1の空間解像度での第1のビデオデータについての第3の品質と、第2の再生時間における第2の空間解像度での第2のビデオデータについての第4の品質とを表すデータを更に含み、プロセッサに、第4の品質が第3の品質よりも高いと判定させる命令を更に備え、プロセッサに、第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分を受信させる命令が、第4の品質が第3の品質よりも高いと判定したことに応答して、プロセッサに、第2の再生時間に関する第1の空間解像度での第1のビデオデータの代わりに、第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分を取り出させる命令を含む、条項65から68のいずれかに記載のコンピュータ可読記憶媒体。
【0176】
条項70:第1の空間解像度が第2の空間解像度よりも高い、条項69に記載のコンピュータ可読記憶媒体。
【0177】
条項71:第2の再生時間に関する第1の空間解像度での第1のビデオデータが、第2の再生時間に関する第2の空間解像度での第2のビデオデータに等しいビットレートを有する、条項69又は70に記載のコンピュータ可読記憶媒体。
【0178】
条項72:第3の品質及び第4の品質が、空間解像度及びビットレート以外の1つ又は複数の品質測定値を表す、条項69から71のいずれかに記載のコンピュータ可読記憶媒体。
【0179】
条項73:メディアプレゼンテーションが、第1の空間解像度での第1のビデオデータを含む第1の表現と、第2の空間解像度での第2のビデオデータを含む第2の表現とを含み、メディアプレゼンテーションが、第1の表現と第2の表現の両方を含む切り替えセットを含む、条項65から72のいずれかに記載のコンピュータ可読記憶媒体。
【0180】
条項74:プロセッサに、第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分を受信させる命令が、プロセッサに、ミドルウェアユニットから、第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分を取り出させる命令を含む、条項65から73のいずれかに記載のコンピュータ可読記憶媒体。
【0181】
条項75:プロセッサに、第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分を受信させる命令が、プロセッサに、ミドルウェアユニットから、第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分を取り出させる命令を含む、条項65から74のいずれかに記載のコンピュータ可読記憶媒体。
【0182】
条項76:メディアデータを取り出すためのデバイスであって、メディアプレゼンテーションが第1の空間解像度での第1のビデオデータと第2の空間解像度での第2のビデオデータとを含むと判定するための手段であって、第2の空間解像度が第1の空間解像度とは異なる、手段と、第1の再生時間に関する第1の空間解像度での第1のビデオデータの第1の部分を受信するための手段と、第1の空間解像度での第1のビデオデータの第1の部分をビデオデコーダに送信するための手段と、第1の再生時間よりも後の第2の再生時間に関する第2の空間解像度での第2のビデオデータの第2の部分を受信するための手段と、第2の空間解像度での第2のビデオデータの第2の部分をビデオデコーダに送信するための手段と、を含む、デバイス。
【0183】
1つ又は複数の例では、記載の機能は、ハードウェア、ソフトウェア、ファームウェア、又はそれらの任意の組み合わせで実装されてよい。ソフトウェアで実装されている場合、機能は、1つ又は複数の命令又はコードとして、コンピュータ可読媒体上に記憶されてもよく、又はコンピュータ可読媒体を介して送信されてもよく、ハードウェアベースの処理ユニットによって実行されてもよい。コンピュータ可読媒体は、データ記憶媒体などの有形媒体に相当するコンピュータ可読記憶媒体、又は、例えば、通信プロトコルに従って、ある場所から別の場所へのコンピュータプログラムの転送を容易にする任意の媒体を含む通信媒体を含み得る。このように、コンピュータ可読媒体は一般に、(1)非一時的である有形のコンピュータ可読記憶媒体、又は(2)信号若しくは搬送波のような通信媒体に対応し得る。データ記憶媒体は、本開示で説明した技法の実施のための命令、コード、及び/又はデータ構造を取り出すために、1つ又は複数のコンピュータあるいは1つ又は複数のプロセッサによってアクセスされ得る、任意の利用可能な媒体であり得る。コンピュータプログラム製品は、コンピュータ可読媒体を含み得る。
【0184】
限定ではなく例として、このようなコンピュータ可読記憶媒体は、RAM、ROM、EEPROM、CD-ROM若しくは他の光ディスクストレージ、磁気ディスクストレージ若しくは他の磁気ストレージデバイス、フラッシュメモリ、又は、命令若しくはデータ構造の形態で所望のプログラムコードを記憶するために使用でき、コンピュータによってアクセス可能な任意の他の媒体を含むことができる。また、任意の接続がコンピュータ可読媒体と適切に呼ばれる。例えば、命令が、同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者回線(DSL)、又は赤外線、無線、及びマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、又は他のリモートソースから送信される場合、同軸ケーブル、光ファイバケーブル、ツイストペア、DSL、又は赤外線、無線、及びマイクロ波などのワイヤレス技術は、媒体の定義の中に含まれる。しかしながら、コンピュータ可読記憶媒体及びデータ記憶媒体は、接続、搬送波、信号、又は他の一時的な媒体を含まず、代わりに非一時的で有形な記憶媒体を指すことを理解されたい。本明細書で使用するディスク(disk)及びディスク(disc)は、コンパクトディスク(disc)(compact disc:CD)、レーザーディスク(disc)、光ディスク(disc)、デジタル多用途ディスク(digital versatile disc:DVD)、フロッピーディスク(disk)、及びBlu-rayディスク(disc)を含み、ここで、ディスク(disk)は、通常、データを磁気的に再生し、ディスク(disc)は、レーザーを用いてデータを光学的に再生する。上記のものの組み合わせもまた、コンピュータ可読媒体の範囲内に含まれるものとする。
【0185】
命令は、1つ又は複数のデジタル信号プロセッサ(DSPs)、汎用マイクロプロセッサ、特定用途向け集積回路(ASICs)、フィールドプログラマブルロジックアレイ(FPGAs)、又は他の等価な集積論理回路若しくはディスクリート論理回路などの、1つ又は複数のプロセッサによって実行され得る。したがって、本明細書で使用する「プロセッサ」という用語は、上記の構造、又は本明細書で説明する技術の実装に好適な任意の他の構造のいずれかを指すことがある。加えて、いくつかの態様では、本明細書で説明されている機能性は、符号化及び復号のために構成された専用のハードウェアモジュール及び/若しくはソフトウェアモジュール内で提供されてもよく、又は複合コーデックの中に組み込まれてもよい。また、技法は、1つ又は複数の回路あるいは論理要素において完全に実装されてもよい。
【0186】
本開示の技法は、ワイヤレスハンドセット、集積回路(integrated circuit:IC)、又はICのセット(例えば、チップセット)を含む、多種多様なデバイス又は装置で実装されてもよい。開示されている技法を実施するように構成されたデバイスの機能的態様を強調するために、様々な構成要素、モジュール、又はユニットについて本開示で説明しているが、必ずしも異なるハードウェアユニットによる実現を必要とするとは限らない。むしろ、上で説明したように、様々なユニットは、コーデックハードウェアユニットの中で組み合わせられてよく、又は、好適なソフトウェア及び/若しくはファームウェアと併せて、上で説明したような1つ又は複数のプロセッサを含む、相互動作可能なハードウェアユニットの集合によって提供されてよい。
【0187】
様々な例が説明されてきた。これら及び他の例は以下の特許請求の範囲内に含まれる。
図1
図2
図3
図4
図5
図6
【国際調査報告】