IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ クゥアルコム・インコーポレイテッドの特許一覧

特表2024-511948HEIFフォーマットされた画像をリアルタイムトランスポートプロトコル上でトランスポートすること
<>
  • 特表-HEIFフォーマットされた画像をリアルタイムトランスポートプロトコル上でトランスポートすること 図1
  • 特表-HEIFフォーマットされた画像をリアルタイムトランスポートプロトコル上でトランスポートすること 図2
  • 特表-HEIFフォーマットされた画像をリアルタイムトランスポートプロトコル上でトランスポートすること 図3
  • 特表-HEIFフォーマットされた画像をリアルタイムトランスポートプロトコル上でトランスポートすること 図4
  • 特表-HEIFフォーマットされた画像をリアルタイムトランスポートプロトコル上でトランスポートすること 図5
  • 特表-HEIFフォーマットされた画像をリアルタイムトランスポートプロトコル上でトランスポートすること 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-03-18
(54)【発明の名称】HEIFフォーマットされた画像をリアルタイムトランスポートプロトコル上でトランスポートすること
(51)【国際特許分類】
   H04N 21/434 20110101AFI20240311BHJP
   H04N 21/431 20110101ALI20240311BHJP
【FI】
H04N21/434
H04N21/431
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023555648
(86)(22)【出願日】2022-03-24
(85)【翻訳文提出日】2023-09-11
(86)【国際出願番号】 US2022071317
(87)【国際公開番号】W WO2022213034
(87)【国際公開日】2022-10-06
(31)【優先権主張番号】63/168,157
(32)【優先日】2021-03-30
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】17/656,159
(32)【優先日】2022-03-23
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】595020643
【氏名又は名称】クゥアルコム・インコーポレイテッド
【氏名又は名称原語表記】QUALCOMM INCORPORATED
(74)【代理人】
【識別番号】110003708
【氏名又は名称】弁理士法人鈴榮特許綜合事務所
(72)【発明者】
【氏名】ブアジジ、イメド
(72)【発明者】
【氏名】リョン、ニコライ・コンラド
【テーマコード(参考)】
5C164
【Fターム(参考)】
5C164MA04S
5C164MB13S
5C164SB15S
5C164UB11P
5C164UB38S
5C164UB81P
(57)【要約】
メディアデータを取り出すための例示的なデバイスであって、本デバイスは、シーンデータと画像データとを記憶するように構成されたメモリと、回路中に実装された1つまたは複数のプロセッサとを備え、1つまたは複数のプロセッサは、ビットストリームが1つまたは複数のオーバーレイ画像を含むことを示す、ビットストリームのためのデータを受信することと、オーバーレイ画像が、シーンデータのフレームとともにフレームごとに提示される間、不変のままである、シーンデータとともに提示されるべき単一の静的画像、または、シーンデータのフレームとともにフレームごとに提示される間、規則的周期性で繰り返す画像シーケンスのいずれかを備える、ビットストリームから1つまたは複数のオーバーレイ画像を受信することと、1つまたは複数のシーン画像を含むシーンデータを受信することと、シーン画像とオーバーレイ画像とを提示することとを行うように構成された、デバイス。
【特許請求の範囲】
【請求項1】
メディアデータを取り出す方法であって、前記方法は、
ビットストリームが1つまたは複数のオーバーレイ画像を含むことを示す、前記ビットストリームのためのデータを受信することと、前記オーバーレイ画像が、シーンデータのフレームとともにフレームごとに提示される間、不変のままである、前記シーンデータとともに提示されるべき単一の静的画像、または、前記シーンデータの前記フレームとともにフレームごとに提示される間、規則的周期性で繰り返す画像シーケンスのいずれかを備える、
前記ビットストリームから前記1つまたは複数のオーバーレイ画像を受信することと、
1つまたは複数のシーン画像を含む前記シーンデータを受信することと、
前記シーン画像と前記オーバーレイ画像とを提示することと
を備える、方法。
【請求項2】
前記ビットストリームを識別するセッション記述プロトコル(SDP)画像属性を受信することをさらに備える、請求項1に記載の方法。
【請求項3】
前記SDP画像属性は、前記1つまたは複数のオーバーレイ画像が前記単一の静的画像を含むのか前記画像シーケンスを含むのかを示すペイロードタイプを示す画像属性を含む、請求項2に記載の方法。
【請求項4】
前記ペイロードタイプが、前記1つまたは複数の画像が前記単一の静的画像を含むことを示すとき、前記シーン画像と前記オーバーレイ画像とを提示することが、前記シーン画像を画像ごとに提示するときに前記単一の静的画像を繰り返し提示することを備える、請求項3に記載の方法。
【請求項5】
前記ペイロードタイプが、前記1つまたは複数の画像が前記画像シーケンスを含むことを示すとき、前記シーン画像と前記オーバーレイ画像とを提示することが、前記画像シーケンスの画像を、前記シーン画像の対応する画像と一緒に順序通り提示することを備える、請求項3に記載の方法。
【請求項6】
前記SDP画像属性は、前記オーバーレイ画像が前記シーンデータの前記フレームとともに提示されるべきである限り、前記オーバーレイ画像が連続的に再送信されるかどうかを示す送信モード属性を含む、請求項2に記載の方法。
【請求項7】
前記SDP画像属性は、前記オーバーレイ画像がループで繰り返し提示されるべきであるかどうかを示すデータを含む、請求項2に記載の方法。
【請求項8】
前記データが、前記オーバーレイ画像が前記ループで繰り返し提示されるべきであることを示すとき、前記シーン画像と前記オーバーレイ画像とを提示することは、
前記オーバーレイ画像が画像シーケンス中にN個の画像を含むと決定することと、Nが正の整数である、
jが非負整数である、ループ数jについて、時間j*N+iにおいて前記オーバーレイ画像の前記画像シーケンスの画像iを提示することと、iが前記オーバーレイ画像の前記画像シーケンスのi番目の画像に対応する、
を備える、請求項7に記載の方法。
【請求項9】
前記SDP画像属性は、前記オーバーレイ画像が受信の後にローカルに記憶されるべきであるかどうかを示すデータを含む、請求項2に記載の方法。
【請求項10】
前記データが、前記オーバーレイ画像が受信の後にローカルに記憶されるべきであることを示すとき、前記方法が、前記オーバーレイ画像をローカルメモリに記憶することをさらに備え、ここにおいて、前記シーン画像と前記オーバーレイ画像とを提示することが、
前記ローカルメモリから前記オーバーレイ画像を取り出すことと、
前記取り出されたオーバーレイ画像を提示することと
を備える、請求項9に記載の方法。
【請求項11】
前記データが、前記オーバーレイ画像が再送信されることになることを示すとき、前記シーン画像と前記オーバーレイ画像とを提示することが、
前記オーバーレイ画像の再送信されたバージョンを受信することと、
前記オーバーレイ画像の前記再送信されたバージョンを提示することと
を備える、請求項9に記載の方法。
【請求項12】
前記SDP画像属性が、前記オーバーレイ画像中に含まれる画像の数を示すデータを含む、請求項2に記載の方法。
【請求項13】
前記1つまたは複数のオーバーレイ画像が1つまたは複数の画像シーケンスを含むかどうかと、前記1つまたは複数のオーバーレイ画像が1つまたは複数の静止画像を含むかどうかとを示す、前記ビットストリームのためのデータを受信することをさらに備える、請求項1に記載の方法。
【請求項14】
前記データが、前記1つまたは複数のオーバーレイ画像が前記1つまたは複数の画像シーケンスを含むことを示すとき、前記画像シーケンスの各々中の画像の数を示す、前記ビットストリームのためのデータを受信することをさらに備える、請求項13に記載の方法。
【請求項15】
前記データが、前記1つまたは複数のオーバーレイ画像が前記1つまたは複数の静止画像を含むことを示すとき、前記静止画像の数を示す、前記ビットストリームのためのデータを受信することをさらに備える、請求項13に記載の方法。
【請求項16】
前記画像シーケンスと前記静止画像とのための送信モードを表すデータを受信することをさらに備える、請求項13に記載の方法。
【請求項17】
前記送信モードのうちの1つが「結合」であるとき、前記ビットストリームのタイムスタンプデータから前記オーバーレイ画像のための表示時間を決定することをさらに備える、請求項16に記載の方法。
【請求項18】
前記タイムスタンプデータが、リアルタイムトランスポートプロトコル(RTP)タイムスタンプデータを備える、請求項17に記載の方法。
【請求項19】
前記送信モードのうちの1つが「分離」であるとき、
前記オーバーレイ画像のための表示時間を表すデータを別々に受信することと、
前記別々に受信されたデータから前記オーバーレイ画像のための前記表示時間を決定することと
をさらに備える、請求項16に記載の方法。
【請求項20】
前記1つまたは複数のオーバーレイ画像が2つまたはそれ以上のオーバーレイ画像を含むとき、前記オーバーレイ画像の表示順序を表すデータを受信することをさらに備える、請求項1に記載の方法。
【請求項21】
前記ビットストリームから前記オーバーレイ画像の各々のための画像メタデータを受信することをさらに備え、前記メタデータが、画像次元または画像役割のうちの1つまたは複数を示す、請求項1に記載の方法。
【請求項22】
前記画像役割が、カバー画像、サムネイル画像、補助画像、マスタ画像、隠し画像、あらかじめ計算された導出された画像、コード化画像、または導出された画像のうちの少なくとも1つを備える、請求項21に記載の方法。
【請求項23】
前記メタデータは、前記オーバーレイ画像の提示の順序を示す順序要素、または前記オーバーレイ画像のうちの対応する1つが表示されるべきである時間の量を示す持続時間要素のうちの1つまたは複数を含む、請求項21に記載の方法。
【請求項24】
メディアデータを取り出すためのデバイスであって、前記デバイスが、
シーンデータと画像データとを記憶するように構成されたメモリと、
回路中に実装された1つまたは複数のプロセッサとを備え、前記1つまたは複数のプロセッサは、
ビットストリームが1つまたは複数のオーバーレイ画像を含むことを示す、前記ビットストリームのためのデータを受信することと、前記オーバーレイ画像が、シーンデータのフレームとともにフレームごとに提示される間、不変のままである、前記シーンデータとともに提示されるべき単一の静的画像、または、前記シーンデータの前記フレームとともにフレームごとに提示される間、規則的周期性で繰り返す画像シーケンスのいずれかを備える、
前記ビットストリームから前記1つまたは複数のオーバーレイ画像を受信することと、
1つまたは複数のシーン画像を含む前記シーンデータを受信することと、
前記シーン画像と前記オーバーレイ画像とを提示することと
を行うように構成された、デバイス。
【請求項25】
前記1つまたは複数のプロセッサが、前記ビットストリームを識別するセッション記述プロトコル(SDP)画像属性を受信することを行うようにさらに構成された、請求項24に記載のデバイス。
【請求項26】
前記SDP画像属性は、前記1つまたは複数のオーバーレイ画像が前記単一の静的画像を含むのか前記画像シーケンスを含むのかを示すペイロードタイプを示す画像属性を含む、請求項25に記載のデバイス。
【請求項27】
前記シーン画像と前記オーバーレイ画像とを提示するために、前記1つまたは複数のプロセッサは、前記ペイロードタイプが、前記1つまたは複数の画像が前記単一の静的画像を含むことを示すとき、前記シーン画像を画像ごとに提示するときに前記単一の静的画像を繰り返し提示することを行うように構成された、請求項26に記載のデバイス。
【請求項28】
前記シーン画像と前記オーバーレイ画像とを提示するために、前記1つまたは複数のプロセッサは、前記ペイロードタイプが、前記1つまたは複数の画像が前記画像シーケンスを含むことを示すとき、前記画像シーケンスの画像を、前記シーン画像の対応する画像と一緒に順序通り提示することを行うように構成された、請求項26に記載のデバイス。
【請求項29】
前記SDP画像属性は、前記オーバーレイ画像が前記シーンデータの前記フレームとともに提示されるべきである限り、前記オーバーレイ画像が連続的に再送信されるかどうかを示す送信モード属性を含む、請求項25に記載のデバイス。
【請求項30】
前記SDP画像属性は、前記オーバーレイ画像がループで繰り返し提示されるべきであるかどうかを示すデータを含む、請求項25に記載のデバイス。
【請求項31】
前記シーン画像と前記オーバーレイ画像とを提示するために、前記1つまたは複数のプロセッサは、前記データが、前記オーバーレイ画像が前記ループで繰り返し提示されるべきであることを示すとき、
前記オーバーレイ画像が画像シーケンス中にN個の画像を含むと決定することと、Nが正の整数である、
jが非負整数である、ループ数jについて、時間j*N+iにおいて前記オーバーレイ画像の前記画像シーケンスの画像iを提示することと、iが前記オーバーレイ画像の前記画像シーケンスのi番目の画像に対応する、
を行うように構成された、請求項30に記載のデバイス。
【請求項32】
前記SDP画像属性は、前記オーバーレイ画像が受信の後にローカルに記憶されるべきであるかどうかを示すデータを含む、請求項25に記載のデバイス。
【請求項33】
前記1つまたは複数のプロセッサは、前記データが、前記オーバーレイ画像が受信の後にローカルに記憶されるべきであることを示すとき、前記オーバーレイ画像を前記メモリに記憶することを行うようにさらに構成され、ここにおいて、前記シーン画像と前記オーバーレイ画像とを提示するために、前記1つまたは複数のプロセッサが、
前記メモリから前記オーバーレイ画像を取り出すことと、
前記取り出されたオーバーレイ画像を提示することと
を行うように構成された、請求項32に記載のデバイス。
【請求項34】
前記シーン画像と前記オーバーレイ画像とを提示するために、前記1つまたは複数のプロセッサは、前記データが、前記オーバーレイ画像が再送信されることになることを示すとき、
前記オーバーレイ画像の再送信されたバージョンを受信することと、
前記オーバーレイ画像の前記再送信されたバージョンを提示することと
を行うように構成された、請求項32に記載のデバイス。
【請求項35】
命令を記憶したコンピュータ可読記憶媒体であって、前記命令は、実行されたとき、プロセッサに、
ビットストリームが1つまたは複数のオーバーレイ画像を含むことを示す、前記ビットストリームのためのデータを受信することと、前記オーバーレイ画像が、シーンデータのフレームとともにフレームごとに提示される間、不変のままである、前記シーンデータとともに提示されるべき単一の静的画像、または、前記シーンデータの前記フレームとともにフレームごとに提示される間、規則的周期性で繰り返す画像シーケンスのいずれかを備える、
前記ビットストリームから前記1つまたは複数のオーバーレイ画像を受信することと、
1つまたは複数のシーン画像を含む前記シーンデータを受信することと、
前記シーン画像と前記オーバーレイ画像とを提示することと
を行わせる、コンピュータ可読記憶媒体。
【請求項36】
メディアデータを受信するためのデバイスであって、前記デバイスは、
ビットストリームが1つまたは複数のオーバーレイ画像を含むことを示す、前記ビットストリームのためのデータを受信するための手段と、前記オーバーレイ画像が、シーンデータのフレームとともにフレームごとに提示される間、不変のままである、前記シーンデータとともに提示されるべき単一の静的画像、または、前記シーンデータの前記フレームとともにフレームごとに提示される間、規則的周期性で繰り返す画像シーケンスのいずれかを備える、
前記ビットストリームから前記1つまたは複数のオーバーレイ画像を受信するための手段と、
1つまたは複数のシーン画像を含むシーンデータを受信するための手段と、
前記シーン画像と前記オーバーレイ画像とを提示するための手段と
を備える、デバイス。
【発明の詳細な説明】
【技術分野】
【0001】
[0001]本出願は、その各々の内容全体が参照により本明細書に組み込まれる、2022年3月23日に出願された米国特許出願第17/656,159号と、2021年3月30日に出願された米国仮出願63/168,157号との優先権を主張する。2022年3月23日に出願された米国特許出願第17/656,159号は、2021年3月30日に出願された米国仮出願第63/168,157号の利益を主張する。
【0002】
[0002]本開示は、符号化メディアデータの記憶およびトランスポートに関する。
【背景技術】
【0003】
[0003]デジタルビデオ能力は、デジタルテレビジョン、デジタルダイレクトブロードキャストシステム、ワイヤレスブロードキャストシステム、携帯情報端末(PDA)、ラップトップまたはデスクトップコンピュータ、デジタルカメラ、デジタル記録デバイス、デジタルメディアプレーヤ、ビデオゲーミングデバイス、ビデオゲームコンソール、セルラーまたは衛星無線電話、ビデオ遠隔会議デバイスなどを含む、広範囲のデバイスに組み込まれ得る。デジタルビデオデバイスは、デジタルビデオ情報をより効率的に送信および受信するための、MPEG-2、MPEG-4、ITU-T H.263またはITU-T H.264/MPEG-4,Part10,アドバンストビデオコーディング(AVC)、(高効率ビデオコーディング(HEVC)とも呼ばれる)ITU-T H.265によって定義された規格、およびそのような規格の拡張に記載されているビデオ圧縮技法など、ビデオ圧縮技法を実装する。
【0004】
[0004]ビデオデータなど、メディアデータが符号化された後に、メディアデータは送信または記憶のためにパケット化され得る。メディアデータは、国際標準化機構(ISO)ベースメディアファイルフォーマット(ISOBMFF)、およびAVCなどのそれの拡張など、様々な規格のいずれかに準拠するメディアファイルにアセンブルされ得る。
【発明の概要】
【0005】
[0005]概して、本開示は、オーバーレイのためのソースとしての画像のトランスポートおよび提示をサポートするための技法について説明する。オーバーレイ、またはオーバーレイ画像が、概して、動的ビデオコンテンツ上で提示される静的画像(static image)に対応する。すなわち、静的画像オーバーレイは、フレームごとに変化し得る動的ビデオコンテンツ上で提示されるとき、変化なしのままである。代替的に、一連の画像が、たとえば、ループの形態で、オーバーレイとして提示され得る。そのような場合、オーバーレイ画像シーケンスは、たとえば、オーバーレイ画像シーケンス中に含まれる画像の数に従って、規則的周期性で繰り返し得る。オーバーレイがシーン中の多種多様なコンテンツを重畳するために使用され得るので、オーバーレイは没入型遠隔会議の重要な態様である。たとえば、オーバーレイは、スライド、ロゴ、および/または情報スクリーンをシーンに重畳することを可能にし得る。オーバーレイテクスチャは、ビデオストリーム、1つまたは複数の静止画像(still image)、または画像のシーケンスからのものであり得る。リモート端末のための没入型遠隔会議およびテレプレゼンス(ITT4RT:Immersive Teleconferencing and Telepresence for Remote Terminals)グループは、オーバーレイのためのソースとしての画像をサポートすることに取り組んでいる。本開示は、画像オーバーレイを含むためのフォーマットとしての高効率画像ファイル(HEIF)フォーマットの使用について説明する。
【0006】
[0006]一例では、メディアデータを取り出す方法は、ビットストリームが1つまたは複数のオーバーレイ画像を含むことを示す、ビットストリームのためのデータを受信することと、オーバーレイ画像が、シーンデータのフレームとともにフレームごとに提示される間、不変のままである、シーンデータとともに提示されるべき単一の静的画像、または、シーンデータのフレームとともにフレームごとに提示される間、規則的周期性で繰り返す画像シーケンスのいずれかを備える、ビットストリームから1つまたは複数のオーバーレイ画像を受信することと、1つまたは複数のシーン画像を含むシーンデータを受信することと、シーン画像とオーバーレイ画像とを提示することとを含む。
【0007】
[0007]別の例では、メディアデータを取り出すためのデバイスが、シーンデータと画像データとを記憶するように構成されたメモリと、回路中に実装された1つまたは複数のプロセッサとを含み、1つまたは複数のプロセッサは、ビットストリームが1つまたは複数のオーバーレイ画像を含むことを示す、ビットストリームのためのデータを受信することと、オーバーレイ画像が、シーンデータのフレームとともにフレームごとに提示される間、不変のままである、シーンデータとともに提示されるべき単一の静的画像、または、シーンデータのフレームとともにフレームごとに提示される間、規則的周期性で繰り返す画像シーケンスのいずれかを備える、ビットストリームから1つまたは複数のオーバーレイ画像を受信することと、1つまたは複数のシーン画像を含むシーンデータを受信することと、シーン画像とオーバーレイ画像とを提示することとを行うように構成される。
【0008】
[0008]別の例では、命令を記憶したコンピュータ可読記憶媒体であって、命令は、実行されたとき、プロセッサに、ビットストリームが1つまたは複数のオーバーレイ画像を含むことを示す、ビットストリームのためのデータを受信することと、オーバーレイ画像が、シーンデータのフレームとともにフレームごとに提示される間、不変のままである、シーンデータとともに提示されるべき単一の静的画像、または、シーンデータのフレームとともにフレームごとに提示される間、規則的周期性で繰り返す画像シーケンスのいずれかを備える、ビットストリームから1つまたは複数のオーバーレイ画像を受信することと、1つまたは複数のシーン画像を含むシーンデータを受信することと、シーン画像とオーバーレイ画像とを提示することとを行わせる、コンピュータ可読記憶媒体。
【0009】
[0009]別の例では、メディアデータを受信するためのデバイスは、ビットストリームが1つまたは複数のオーバーレイ画像を含むことを示す、ビットストリームのためのデータを受信するための手段と、オーバーレイ画像が、シーンデータのフレームとともにフレームごとに提示される間、不変のままである、シーンデータとともに提示されるべき単一の静的画像、または、シーンデータのフレームとともにフレームごとに提示される間、規則的周期性で繰り返す画像シーケンスのいずれかを備える、ビットストリームから1つまたは複数のオーバーレイ画像を受信するための手段と、1つまたは複数のシーン画像を含むシーンデータを受信するための手段と、シーン画像とオーバーレイ画像とを提示するための手段とを含む。
【0010】
[0010]1つまたは複数の例の詳細が添付の図面および以下の説明に記載される。他の特徴、目的、および利点は、説明および図面から、ならびに特許請求の範囲から明らかになろう。
【図面の簡単な説明】
【0011】
図1】[0011]ネットワークを介してメディアデータをストリーミングするための技法を実装する例示的なシステムを示すブロック図。
図2】[0012]図1の取出しユニット52の構成要素の例示的なセットをより詳細に示すブロック図。
図3】[0013]例示的なマルチメディアコンテンツの要素を示す概念図。
図4】[0014]表現のセグメントに対応し得る、例示的なビデオファイルの要素を示すブロック図。
図5】[0015]画像データを含むための高効率画像ファイル(HEIF)フォーマットの例示的な構造を示す概念図。
図6】[0016]本開示の技法による、メディアデータを取り出す例示的な方法を示すフローチャート。
【発明を実施するための形態】
【0012】
[0017]概して、本開示は、画像オーバーレイを含むために、高効率画像ファイル(HEIF)フォーマットなど、特定のフォーマットを使用するための技法について説明する。オーバーレイ、またはオーバーレイ画像が、概して、動的ビデオコンテンツ上で提示される静的画像に対応する。すなわち、静的画像オーバーレイは、フレームごとに変化し得る動的ビデオコンテンツ上で提示されるとき、変化なしのままである。代替的に、一連の画像が、たとえば、ループの形態で、オーバーレイとして提示され得る。そのような場合、オーバーレイ画像シーケンスは、たとえば、オーバーレイ画像シーケンス中に含まれる画像の数に従って、規則的周期性で繰り返し得る。たとえば、オーバーレイ画像シーケンスがN個の画像を含む場合、画像シーケンス中のi番目の画像は、j*N+i個のフレームごとに提示されることになり、ここで、jは0から無限大にわたることができ、iは0からN-1にわたることができる。HEIFフォーマットは、ISO/IEC23008-12において定義されている。ISO/IEC23008-12は、ISOBMFFベースコンテナファイルへの画像および画像シーケンスならびにそれらのメタデータの記憶を指定する。HEIFは、画像の記憶のための一般的な、コーデックアグノスティック構造を定義し、また、H.265/HEVC(高効率ビデオコーディング)コーデックに基づくインスタンス化を提供する。
【0013】
[0018]ビデオテレフォニーおよびビデオ会議セッションなど、様々なコンテキストでは、参加者間で画像を共有することが望ましいことがある。しかしながら、リアルタイムトランスポートプロトコル(RTP)など、いくつかのビデオストリーミングプロトコルでは、画像の搬送は定義されない。HEIFは、たとえば、HEVCまたは他のビデオコーデックを使用して符号化された、画像集合および画像シーケンスの記憶を可能にする画像フォーマットである。RTP上での画像の搬送は現在指定されていない。本開示は、HEIF画像集合および画像シーケンスをRTP上で搬送および提示するための技法について説明する。これらの技法は、たとえば、HEVCのための、RTPペイロードフォーマットに対する拡張、ならびにセッション記述プロトコル(SDP)における画像のシグナリングについて説明する。このようにして、画像および画像シーケンスが、ビデオ会議セッション中にトランスポートされ得、そのために、データが、RTPまたは他のそのようなプロトコルを使用してトランスポートされ得る。
【0014】
[0019]本開示の技法は、ISOベースメディアファイルフォーマット(ISOBMFF)、スケーラブルビデオコーディング(SVC)ファイルフォーマット、アドバンストビデオコーディング(AVC)ファイルフォーマット、第3世代パートナーシッププロジェクト(3GPP(登録商標))ファイルフォーマット、および/またはマルチビュービデオコーディング(MVC)ファイルフォーマット、あるいは他の同様のビデオファイルフォーマットのいずれかに従ってカプセル化されたメディアデータに準拠する、ビデオファイルなどのメディアファイルに適用され得る。
【0015】
[0020]図1は、ネットワークを介してメディアデータをストリーミングするための技法を実装する例示的なシステム10を示すブロック図である。この例では、システム10は、コンテンツ作成デバイス20と、サーバデバイス60と、クライアントデバイス40とを含む。クライアントデバイス40とサーバデバイス60とは、インターネットを備え得るネットワーク74によって通信可能に結合される。いくつかの例では、コンテンツ作成デバイス20とサーバデバイス60とも、ネットワーク74または別のネットワークによって結合され得るか、あるいは直接通信可能に結合され得る。いくつかの例では、コンテンツ作成デバイス20とサーバデバイス60とは同じデバイスを備え得る。
【0016】
[0021]コンテンツ作成デバイス20は、図1の例では、オーディオソース22とビデオソース24とを備える。オーディオソース22は、たとえば、オーディオエンコーダ26によって符号化されるべき、キャプチャされたオーディオデータを表す電気信号を生成するマイクロフォンを備え得る。代替的に、オーディオソース22は、前に記録されたオーディオデータを記憶する記憶媒体、コンピュータ化シンセサイザなどのオーディオデータ生成器、またはオーディオデータの任意の他のソースを備え得る。ビデオソース24は、ビデオエンコーダ28によって符号化されるべきビデオデータを生成するビデオカメラ、前に記録されたビデオデータで符号化された記憶媒体、コンピュータグラフィックスソースなどのビデオデータ生成ユニット、またはビデオデータの任意の他のソースを備え得る。コンテンツ作成デバイス20は、必ずしもすべての例においてサーバデバイス60に通信可能に結合されるとは限らないが、サーバデバイス60によって読み取られる別個の媒体にマルチメディアコンテンツを記憶し得る。
【0017】
[0022]未加工オーディオおよびビデオデータは、アナログまたはデジタルデータを備え得る。アナログデータは、オーディオエンコーダ26および/またはビデオエンコーダ28によって符号化される前にデジタル化され得る。オーディオソース22は、通話参加者が話している間、通話参加者からオーディオデータを取得し得、同時に、ビデオソース24は、通話参加者のビデオデータを取得し得る。他の例では、オーディオソース22は、記憶されたオーディオデータを備えるコンピュータ可読記憶媒体を備え得、ビデオソース24は、記憶されたビデオデータを備えるコンピュータ可読記憶媒体を備え得る。このようにして、本開示で説明される技法は、ライブ、ストリーミング、リアルタイムオーディオおよびビデオデータ、またはアーカイブされた、あらかじめ記録されたオーディオおよびビデオデータに適用され得る。
【0018】
[0023]ビデオフレームに対応するオーディオフレームは、概して、ビデオフレーム内に含まれているビデオソース24によってキャプチャされた(または生成された)ビデオデータと同時に、オーディオソース22によってキャプチャされた(または生成された)オーディオデータを含んでいるオーディオフレームである。たとえば、通話参加者が概して話すことによってオーディオデータを生成する間、オーディオソース22はオーディオデータをキャプチャし、同時に、すなわちオーディオソース22がオーディオデータをキャプチャしている間、ビデオソース24は通話参加者のビデオデータをキャプチャする。したがって、オーディオフレームは、1つまたは複数の特定のビデオフレームに時間的に対応し得る。したがって、ビデオフレームに対応するオーディオフレームは、概して、オーディオデータとビデオデータとが同時にキャプチャされた状況、およびオーディオフレームとビデオフレームとが、それぞれ、同時にキャプチャされたオーディオデータとビデオデータとを備える状況に対応する。
【0019】
[0024]いくつかの例では、オーディオエンコーダ26は、符号化オーディオフレームについてのオーディオデータが記録された時間を表す、各符号化オーディオフレームにおけるタイムスタンプを符号化し得、同様に、ビデオエンコーダ28は、符号化ビデオフレームについてのビデオデータが記録された時間を表す、各符号化ビデオフレームにおけるタイムスタンプを符号化し得る。そのような例では、ビデオフレームに対応するオーディオフレームは、タイムスタンプを備えるオーディオフレームと、同じタイムスタンプを備えるビデオフレームとを備え得る。コンテンツ作成デバイス20は、オーディオエンコーダ26および/またはビデオエンコーダ28がそこからタイムスタンプを生成し得るか、あるいはオーディオソース22およびビデオソース24がオーディオデータとビデオデータとをそれぞれタイムスタンプに関連付けるために使用し得る、内部クロックを含み得る。
【0020】
[0025]いくつかの例では、オーディオソース22は、オーディオデータが記録された時間に対応するデータをオーディオエンコーダ26に送出し得、ビデオソース24は、ビデオデータが記録された時間に対応するデータをビデオエンコーダ28に送出し得る。いくつかの例では、オーディオエンコーダ26は、必ずしもオーディオデータが記録された絶対時間を示すことなしに、符号化オーディオデータの相対時間的順序を示すために、符号化オーディオデータ中のシーケンス識別子を符号化し得、同様に、ビデオエンコーダ28も、符号化ビデオデータの相対時間的順序を示すためにシーケンス識別子を使用し得る。同様に、いくつかの例では、シーケンス識別子は、タイムスタンプでマッピングされるか、またはさもなければタイムスタンプと相関させられ得る。
【0021】
[0026]オーディオエンコーダ26は概して符号化オーディオデータのストリームを生成し、ビデオエンコーダ28は符号化ビデオデータのストリームを生成する。データの各個々のストリームは(オーディオかビデオかにかかわらず)エレメンタリストリームと呼ばれることがある。エレメンタリストリームは、表現のデジタル的にコード化された(場合によっては圧縮された)単一の成分である。たとえば、表現のコード化ビデオまたはオーディオ部分はエレメンタリストリームであり得る。エレメンタリストリームは、ビデオファイル内にカプセル化される前に、パケット化エレメンタリストリーム(PES)に変換され得る。同じ表現内では、1つのエレメンタリストリームに属するPESパケットを他のものから区別するためにストリームIDが使用され得る。エレメンタリストリームの基本データ単位はパケット化エレメンタリストリーム(PES)パケットである。したがって、コード化ビデオデータは、概して、エレメンタリビデオストリームに対応する。同様に、オーディオデータは、1つまたは複数のそれぞれのエレメンタリストリームに対応する。
【0022】
[0027]ITU-T H.264/AVC、ITU-T H.265/高効率ビデオコーディング(HEVC)、および来るべきITU-T H.266/汎用ビデオコーディング(VVC)規格など、多くのビデオコーディング規格は、シンタックスと、セマンティクスと、エラーのないビットストリームのための復号プロセスとを定義し、これらのいずれも、あるプロファイルまたはレベルに準拠する。ビデオコーディング規格は、一般に、エンコーダを指定しないが、エンコーダは、生成されたビットストリームがデコーダについて規格に準拠することを保証するというタスクを与えられる。ビデオコーディング規格のコンテキストでは、「プロファイル」は、アルゴリズム、特徴、またはツール、およびそれらに適用される制約のサブセットに対応する。たとえば、H.264規格によって定義される「プロファイル」は、H.264規格によって指定されたビットストリームシンタックス全体のサブセットである。「レベル」は、たとえば、ピクチャの解像度、ビットレート、およびブロック処理レートに関係するデコーダメモリおよび計算など、デコーダリソース消費の制限に対応する。プロファイルはprofile_idc(プロファイルインジケータ)値でシグナリングされ得るが、レベルはlevel_idc(レベルインジケータ)値でシグナリングされ得る。
【0023】
[0028]H.264規格は、たとえば、所与のプロファイルのシンタックスによって課される限界内で、復号ピクチャの指定されたサイズなど、ビットストリーム中のシンタックス要素によってとられる値に応じて、エンコーダおよびデコーダのパフォーマンスの大きい変動を必要とする可能性が依然としてあることを認識している。H.264規格は、多くの適用例において、特定のプロファイル内でシンタックスのすべての仮定的使用に対処することが可能なデコーダを実装することが実際的でもなく、経済的でもないことをさらに認識している。したがって、H.264規格は、ビットストリーム中のシンタックス要素の値に課された制約の指定されたセットとして「レベル」を定義する。これらの制約は、値に関する単純な制限であり得る。代替的に、これらの制約は、値の演算の組合せ(たとえば、ピクチャの幅×ピクチャの高さ×毎秒復号されるピクチャの数)に関する制約の形態をとり得る。H.264規格は、個々の実装形態が、サポートされるプロファイルごとに異なるレベルをサポートし得ることをさらに規定する。
【0024】
[0029]プロファイルに準拠するデコーダは、通常、プロファイル中で定義されたすべての特徴をサポートする。たとえば、コーディング特徴として、Bピクチャコーディングは、H.264/AVCのベースラインプロファイルではサポートされないが、H.264/AVCの他のプロファイルではサポートされる。レベルに準拠するデコーダは、レベルにおいて定義された制限を超えてリソースを必要としない任意のビットストリームを復号することが可能であるべきである。プロファイルおよびレベルの定義は、説明可能性のために役立ち得る。たとえば、ビデオ送信中に、プロファイル定義とレベル定義のペアが全送信セッションについてネゴシエートされ、同意され得る。より具体的には、H.264/AVCでは、レベルは、処理される必要があるマクロブロックの数に関する制限と、復号ピクチャバッファ(DPB)サイズと、コード化ピクチャバッファ(CPB)サイズと、垂直動きベクトル範囲と、2つの連続するMBごとの動きベクトルの最大数と、Bブロックが8×8ピクセル未満のサブマクロブロック区分を有することができるかどうかとを定義し得る。このようにして、デコーダは、デコーダがビットストリームを適切に復号することが可能であるかどうかを決定し得る。
【0025】
[0030]図1の例では、コンテンツ作成デバイス20のカプセル化ユニット30は、ビデオエンコーダ28からのコード化ビデオデータを備えるエレメンタリストリームと、オーディオエンコーダ26からのコード化オーディオデータを備えるエレメンタリストリームとを受信する。いくつかの例では、ビデオエンコーダ28およびオーディオエンコーダ26は各々、符号化データからPESパケットを形成するためのパケッタイザを含み得る。他の例では、ビデオエンコーダ28およびオーディオエンコーダ26は各々、符号化データからPESパケットを形成するためのそれぞれのパケッタイザとインターフェースし得る。さらに他の例では、カプセル化ユニット30は、符号化オーディオデータと符号化ビデオデータとからPESパケットを形成するためのパケッタイザを含み得る。
【0026】
[0031]ビデオエンコーダ28は、様々なビットレートにおいて、ならびにピクセル解像度、フレームレート、様々なコーディング規格への準拠、様々なコーディング規格のための様々なプロファイルおよび/またはプロファイルのレベルへの準拠、(たとえば、2次元または3次元再生のための)1つまたは複数のビューを有する表現、あるいは他のそのような特性などの様々な特性を用いてマルチメディアコンテンツの異なる表現を生成するために、様々な方法でマルチメディアコンテンツのビデオデータを符号化し得る。本開示で使用される、表現は、オーディオデータ、ビデオデータ、(たとえば、字幕のための)テキストデータ、または他のそのようなデータのうちの1つを備え得る。表現は、オーディオエレメンタリストリームまたはビデオエレメンタリストリームなど、エレメンタリストリームを含み得る。各PESパケットは、PESパケットが属するエレメンタリストリームを識別するstream_idを含み得る。カプセル化ユニット30は、エレメンタリストリームを様々な表現のビデオファイル(たとえば、セグメント)にアセンブルすることを担う。
【0027】
[0032]カプセル化ユニット30は、オーディオエンコーダ26とビデオエンコーダ28とから表現のエレメンタリストリームのためのPESパケットを受信し、PESパケットから対応するネットワークアブストラクションレイヤ(NAL)ユニットを形成する。コード化ビデオセグメントは、ビデオテレフォニー、記憶、ブロードキャスト、またはストリーミングなどのアプリケーションに対処する「ネットワークフレンドリ」なビデオ表現を与える、NALユニットに編成され得る。NALユニットは、ビデオコーディングレイヤ(VCL)NALユニットと非VCL NALユニットとに分類され得る。VCLユニットは、コア圧縮エンジンを含んでいることがあり、ブロック、マクロブロック、および/またはスライスレベルデータを含み得る。他のNALユニットは非VCL NALユニットであり得る。いくつかの例では、通常は1次コード化ピクチャとして提示される、1つの時間インスタンス中のコード化ピクチャは、1つまたは複数のNALユニットを含み得るアクセスユニット中に含まれていることがある。
【0028】
[0033]非VCL NALユニットは、特に、パラメータセットNALユニットとSEI NALユニットとを含み得る。パラメータセットは、(シーケンスパラメータセット(SPS)中の)シーケンスレベルヘッダ情報と、(ピクチャパラメータセット(PPS)中の)まれに変化するピクチャレベルヘッダ情報とを含んでいることがある。パラメータセット(たとえば、PPSおよびSPS)がある場合、まれに変化する情報がシーケンスごとまたはピクチャごとに繰り返される必要はなく、したがって、コーディング効率が改善され得る。さらに、パラメータセットの使用は、重要なヘッダ情報の帯域外送信を可能にし、エラー耐性のための冗長送信の必要を回避し得る。帯域外送信の例では、SEI NALユニットなど、他のNALユニットとは異なるチャネル上でパラメータセットNALユニットが送信され得る。
【0029】
[0034]補足エンハンスメント情報(SEI)は、VCL NALユニットからのコード化ピクチャサンプルを復号するためには必要でないが、復号、表示、エラー耐性、および他の目的に関係するプロセスを支援し得る情報を含んでいることがある。SEIメッセージは、非VCL NALユニット中に含まれていることがある。SEIメッセージは、一部の規格仕様の規範的部分であり、したがって、規格に準拠するデコーダ実装のために常に必須であるとは限らない。SEIメッセージは、シーケンスレベルSEIメッセージまたはピクチャレベルSEIメッセージであり得る。SVCの例におけるスケーラビリティ情報SEIメッセージ、およびMVCにおけるビュースケーラビリティ情報SEIメッセージなどのSEIメッセージ中に、何らかのシーケンスレベル情報が含まれていることがある。これらの例示的なSEIメッセージは、たとえば、動作点の抽出およびそれらの動作点の特性に関する情報を伝達し得る。さらに、カプセル化ユニット30は、表現の特性を記述するメディアプレゼンテーション記述子(MPD)など、マニフェストファイルを形成し得る。カプセル化ユニット30は、拡張可能マークアップ言語(XML)に従ってMPDをフォーマットし得る。
【0030】
[0035]カプセル化ユニット30は、マニフェストファイル(たとえば、MPD)とともに、マルチメディアコンテンツの1つまたは複数の表現についてのデータを出力インターフェース32に与え得る。出力インターフェース32は、ユニバーサルシリアルバス(USB)インターフェース、CDまたはDVDライターまたはバーナーなど、記憶媒体に書き込むためのネットワークインターフェースまたはインターフェース、磁気またはフラッシュ記憶媒体へのインターフェース、あるいはメディアデータを記憶または送信するための他のインターフェースを備え得る。カプセル化ユニット30は、マルチメディアコンテンツの表現の各々のデータを出力インターフェース32に与え得、出力インターフェース32は、ネットワーク送信または記憶媒体を介してそのデータをサーバデバイス60に送出し得る。図1の例では、サーバデバイス60は、各々がそれぞれのマニフェストファイル66と1つまたは複数の表現68A~68N(表現68)とを含む、様々なマルチメディアコンテンツ64を記憶する記憶媒体62を含む。いくつかの例では、出力インターフェース32はまた、データをネットワーク74に直接送出し得る。
【0031】
[0036]いくつかの例では、表現68は適応セットに分離され得る。すなわち、表現68の様々なサブセットは、コーデック、プロファイルおよびレベル、解像度、ビューの数、セグメントのためのファイルフォーマット、表現を用いて表示されるべきテキストおよび/または復号され、たとえばスピーカーによって提示されるべきオーディオデータの言語または他の特性を識別し得るテキストタイプ情報、適応セット中の表現のためのシーンのカメラアングルまたは現実世界のカメラパースペクティブを記述し得るカメラアングル情報、特定の視聴者についてのコンテンツ適合性を記述するレーティング情報など、特性のそれぞれの共通セットを含み得る。
【0032】
[0037]マニフェストファイル66は、特定の適応セットに対応する表現68のサブセットを示すデータ、ならびに適応セットについての共通の特性を含み得る。マニフェストファイル66はまた、ビットレートなど、適応セットの個々の表現についての個々の特性を表すデータを含み得る。このようにして、適応セットは、簡略化されたネットワーク帯域幅適応を可能にし得る。適応セット中の表現は、マニフェストファイル66の適応セット要素の子要素を使用して示され得る。
【0033】
[0038]サーバデバイス60は、要求処理ユニット70とネットワークインターフェース72とを含む。いくつかの例では、サーバデバイス60は複数のネットワークインターフェースを含み得る。さらに、サーバデバイス60の特徴のうちのいずれかまたはすべてが、ルータ、ブリッジ、プロキシデバイス、スイッチ、または他のデバイスなど、コンテンツ配信ネットワークの他のデバイス上で実装され得る。いくつかの例では、コンテンツ配信ネットワークの中間デバイスは、マルチメディアコンテンツ64のデータをキャッシュし、サーバデバイス60の構成要素に実質的に準拠する構成要素を含み得る。概して、ネットワークインターフェース72は、ネットワーク74を介してデータを送出し、受信するように構成される。
【0034】
[0039]要求処理ユニット70は、クライアントデバイス40などのクライアントデバイスから、記憶媒体62のデータについてのネットワーク要求を受信するように構成される。たとえば、要求処理ユニット70は、R.Fieldingらによる、RFC2616、「Hypertext Transfer Protocol - HTTP/1.1」、ネットワークワーキンググループ、IETF、1999年6月に記載されている、ハイパーテキスト転送プロトコル(HTTP)バージョン1.1を実装し得る。すなわち、要求処理ユニット70は、HTTP GET要求または部分GET要求を受信し、これらの要求に応答してマルチメディアコンテンツ64のデータを与えるように構成され得る。要求は、たとえば、セグメントのURLを使用して、表現68のうちの1つのセグメントを指定し得る。いくつかの例では、要求はまた、セグメントの1つまたは複数のバイト範囲を指定し、したがって部分GET要求を備え得る。要求処理ユニット70は、表現68のうちの1つのセグメントのヘッダデータを与えるためのHTTP HEAD要求をサービスするようにさらに構成され得る。いずれの場合も、要求処理ユニット70は、要求されたデータをクライアントデバイス40などの要求元デバイスに与えるために要求を処理するように構成され得る。
【0035】
[0040]追加または代替として、要求処理ユニット70は、eMBMSなどのブロードキャストまたはマルチキャストプロトコルを介してメディアデータを配信するように構成され得る。コンテンツ作成デバイス20は、説明された方法と実質的に同じ方法でDASHセグメントおよび/またはサブセグメントを作成し得るが、サーバデバイス60は、eMBMSあるいは別のブロードキャストまたはマルチキャストネットワークトランスポートプロトコルを使用して、これらのセグメントまたはサブセグメントを配信し得る。たとえば、要求処理ユニット70は、クライアントデバイス40からマルチキャストグループ加入要求を受信するように構成され得る。すなわち、サーバデバイス60は、マルチキャストグループに関連付けられたインターネットプロトコル(IP)アドレスを、クライアントデバイス40を含む、特定のメディアコンテンツ(たとえば、ライブイベントのブロードキャスト)に関連付けられたクライアントデバイスに広告し得る。クライアントデバイス40は、マルチキャストグループに加入するための要求をサブミットし得る。この要求は、ネットワーク74、たとえば、ネットワーク74を構成するルータ全体にわたって伝搬され得、その結果、ルータは、マルチキャストグループに関連付けられたIPアドレスに宛てられたトラフィックを、クライアントデバイス40など、サブスクライブするクライアントデバイスに向けさせられる。
【0036】
[0041]図1の例に示されているように、マルチメディアコンテンツ64は、メディアプレゼンテーション記述(MPD)に対応し得るマニフェストファイル66を含む。マニフェストファイル66は、異なる代替表現68(たとえば、異なる品質をもつビデオサービス)の記述を含んでいることがあり、その記述は、たとえば、表現68のコーデック情報、プロファイル値、レベル値、ビットレート、および他の記述特性を含み得る。クライアントデバイス40は、表現68のセグメントにどのようにアクセスすべきかを決定するためにメディアプレゼンテーション(media presentation)のMPDを取り出し得る。
【0037】
[0042]特に、取出しユニット52は、ビデオデコーダ48の復号能力とビデオ出力44のレンダリング能力とを決定するために、クライアントデバイス40の構成データ(図示せず)を取り出し得る。構成データはまた、クライアントデバイス40のユーザによって選択された言語の選好、クライアントデバイス40のユーザによって設定された深度の選好に対応する1つまたは複数のカメラパースペクティブ、および/またはクライアントデバイス40のユーザによって選択されたレーティングの選好のうちのいずれかまたはすべてを含み得る。取出しユニット52は、たとえば、HTTP GET要求と部分GET要求とをサブミットするように構成されたウェブブラウザまたはメディアクライアントを備え得る。取出しユニット52は、クライアントデバイス40の1つまたは複数のプロセッサまたは処理ユニット(図示せず)によって実行されるソフトウェア命令に対応し得る。いくつかの例では、取出しユニット52に関して説明される機能のすべてまたは部分が、ハードウェア、あるいはハードウェア、ソフトウェア、および/またはファームウェアの組合せで実装され得、ソフトウェアまたはファームウェアのための命令を実行するために、必須のハードウェアが与えられ得る。
【0038】
[0043]取出しユニット52は、クライアントデバイス40の復号能力およびレンダリング能力を、マニフェストファイル66の情報によって示される表現68の特性と比較し得る。取出しユニット52は、最初に、表現68の特性を決定するためにマニフェストファイル66の少なくとも一部分を取り出し得る。たとえば、取出しユニット52は、1つまたは複数の適応セットの特性を記述するマニフェストファイル66の一部分を要求し得る。取出しユニット52は、クライアントデバイス40のコーディング能力およびレンダリング能力によって満たされ得る特性を有する表現68のサブセット(たとえば、適応セット)を選択し得る。次いで、取出しユニット52は、適応セット中の表現のためのビットレートを決定し、ネットワーク帯域幅の現在利用可能な量を決定し、ネットワーク帯域幅によって満たされ得るビットレートを有する表現のうちの1つからセグメントを取り出し得る。
【0039】
[0044]概して、より高いビットレート表現はより高品質のビデオ再生を生じ得、より低いビットレート表現は、利用可能なネットワーク帯域幅が減少したとき、十分な品質のビデオ再生を与え得る。したがって、利用可能なネットワーク帯域幅が比較的高いとき、取出しユニット52は比較的高いビットレート表現からデータを取り出し得るが、利用可能なネットワーク帯域幅が低いとき、取出しユニット52は比較的低いビットレート表現からデータを取り出し得る。このようにして、クライアントデバイス40は、ネットワーク74を介してマルチメディアデータをストリーミングしながら、ネットワーク74の変化するネットワーク帯域幅利用可能性にも適応し得る。
【0040】
[0045]追加または代替として、取出しユニット52は、eMBMSまたはIPマルチキャストなどのブロードキャストまたはマルチキャストネットワークプロトコルに従ってデータを受信するように構成され得る。そのような例では、取出しユニット52は、特定のメディアコンテンツに関連付けられたマルチキャストネットワークグループに加入するための要求をサブミットし得る。マルチキャストグループに加入した後に、取出しユニット52は、サーバデバイス60またはコンテンツ作成デバイス20に発行されるさらなる要求なしに、マルチキャストグループのデータを受信し得る。取出しユニット52は、マルチキャストグループのデータがもはや必要とされないときに、たとえば、再生を停止するために、またはチャネルを異なるマルチキャストグループに変更するために、マルチキャストグループを離れるための要求をサブミットし得る。
【0041】
[0046]ネットワークインターフェース54は、選択された表現のセグメントのデータを受信し、取出しユニット52に与え得、取出しユニット52は、そのセグメントをカプセル化解除ユニット50に与え得る。カプセル化解除ユニット50は、ビデオファイルの要素を構成PESストリームにカプセル化解除し、符号化データを取り出すためにPESストリームをパケット化解除し、たとえば、ストリームのPESパケットヘッダによって示されるように、符号化データがオーディオストリームの一部であるのかビデオストリームの一部であるのかに応じて、符号化データをオーディオデコーダ46またはビデオデコーダ48のいずれかに送出し得る。オーディオデコーダ46は、符号化オーディオデータを復号し、復号オーディオデータをオーディオ出力42に送出し、ビデオデコーダ48は、符号化ビデオデータを復号し、ストリームの複数のビューを含み得る復号ビデオデータをビデオ出力44に送出する。
【0042】
[0047]ビデオエンコーダ28、ビデオデコーダ48、オーディオエンコーダ26、オーディオデコーダ46、カプセル化ユニット30、取出しユニット52、およびカプセル化解除ユニット50は各々、適用可能なとき、1つまたは複数のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、ディスクリート論理回路、ソフトウェア、ハードウェア、ファームウェア、またはそれらの任意の組合せなど、様々な好適な処理回路のいずれかとして実装され得る。ビデオエンコーダ28およびビデオデコーダ48の各々は、1つまたは複数のエンコーダまたはデコーダ中に含まれ得、そのいずれも複合ビデオエンコーダ/デコーダ(コーデック)の一部として統合され得る。同様に、オーディオエンコーダ26およびオーディオデコーダ46の各々は、1つまたは複数のエンコーダまたはデコーダ中に含まれ得、そのいずれも複合コーデックの一部として統合され得る。ビデオエンコーダ28、ビデオデコーダ48、オーディオエンコーダ26、オーディオデコーダ46、カプセル化ユニット30、取出しユニット52、および/またはカプセル化解除ユニット50を含む装置は、集積回路、マイクロプロセッサ、および/またはセルラー電話などのワイヤレス通信デバイスを備え得る。
【0043】
[0048]クライアントデバイス40、サーバデバイス60、および/またはコンテンツ作成デバイス20は、本開示の技法に従って動作するように構成され得る。例として、本開示は、クライアントデバイス40およびサーバデバイス60に関して、これらの技法について説明する。しかしながら、コンテンツ作成デバイス20は、サーバデバイス60の代わりに(またはそれに加えて)これらの技法を実施するように構成され得ることを理解されたい。
【0044】
[0049]カプセル化ユニット30は、NALユニットが属するプログラムを識別するヘッダ、ならびにペイロード、たとえば、オーディオデータ、ビデオデータ、あるいはNALユニットが対応するトランスポートまたはプログラムストリームを記述するデータを備える、NALユニットを形成し得る。たとえば、H.264/AVCでは、NALユニットは、1バイトのヘッダと、変動するサイズのペイロードとを含む。それのペイロード中にビデオデータを含むNALユニットは、様々なグラニュラリティレベルのビデオデータを備え得る。たとえば、NALユニットは、ビデオデータのブロック、複数のブロック、ビデオデータのスライス、またはビデオデータのピクチャ全体を備え得る。カプセル化ユニット30は、エレメンタリストリームのPESパケットの形態でビデオエンコーダ28から符号化ビデオデータを受信し得る。カプセル化ユニット30は、各エレメンタリストリームを対応するプログラムに関連付け得る。
【0045】
[0050]カプセル化ユニット30はまた、複数のNALユニットからアクセスユニットをアセンブルし得る。概して、アクセスユニットは、ビデオデータのフレーム、ならびにそのフレームに対応するオーディオデータが利用可能であるとき、そのようなオーディオデータを表すための1つまたは複数のNALユニットを備え得る。アクセスユニットは、概して、1つの出力時間インスタンスについてのすべてのNALユニット、たとえば1つの時間インスタンスについてのすべてのオーディオおよびビデオデータを含む。たとえば、各ビューが20フレーム毎秒(fps)のフレームレートを有する場合、各時間インスタンスは0.05秒の時間間隔に対応し得る。この時間間隔中に、同じアクセスユニット(同じ時間インスタンス)のすべてのビューの特定のフレームは同時にレンダリングされ得る。一例では、アクセスユニットは、1次コード化ピクチャとして提示され得る、1つの時間インスタンス中のコード化ピクチャを備え得る。
【0046】
[0051]したがって、アクセスユニットは、共通の時間的インスタンスのすべてのオーディオおよびビデオフレーム、たとえば、時間Xに対応するすべてのビューを備え得る。本開示はまた、特定のビューの符号化ピクチャを「ビュー構成要素」と呼ぶ。すなわち、ビュー構成要素は、特定の時間における特定のビューのための符号化ピクチャ(またはフレーム)を備え得る。したがって、アクセスユニットは、共通の時間的インスタンスのすべてのビュー構成要素を備えるものとして定義され得る。アクセスユニットの復号順序は、必ずしも出力または表示順序と同じである必要があるとは限らない。
【0047】
[0052]メディアプレゼンテーションは、異なる代替表現(たとえば、異なる品質をもつビデオサービス)の記述を含んでいることがあるメディアプレゼンテーション記述(MPD)を含み得、その記述は、たとえば、コーデック情報と、プロファイル値と、レベル値とを含み得る。MPDは、マニフェストファイル66などのマニフェストファイルの一例である。クライアントデバイス40は、様々なプレゼンテーションのムービーフラグメントにどのようにアクセスすべきかを決定するためにメディアプレゼンテーションのMPDを取り出し得る。ムービーフラグメントは、ビデオファイルのムービーフラグメントボックス(moofボックス)中にあり得る。
【0048】
[0053](たとえば、MPDを備え得る)マニフェストファイル66は、表現68のセグメントの利用可能性を広告し得る。すなわち、MPDは、表現68のうちの1つの第1のセグメントが利用可能になる壁時計時間(wall-clock time)を示す情報、ならびに表現68内のセグメントの持続時間を示す情報を含み得る。このようにして、クライアントデバイス40の取出しユニット52は、開始時間、ならびに特定のセグメントに先行するセグメントの持続時間に基づいて、各セグメントがいつ利用可能であるかを決定し得る。
【0049】
[0054]カプセル化ユニット30が、受信されたデータに基づいてNALユニットおよび/またはアクセスユニットをビデオファイルにアセンブルした後に、カプセル化ユニット30は、ビデオファイルを出力のために出力インターフェース32に渡す。いくつかの例では、カプセル化ユニット30は、ビデオファイルをローカルに記憶するか、または、ビデオファイルをクライアントデバイス40に直接送出するのではなく、出力インターフェース32を介してビデオファイルをリモートサーバに送出し得る。出力インターフェース32は、たとえば、送信機、トランシーバ、たとえば、オプティカルドライブ、磁気メディアドライブ(たとえば、フロッピー(登録商標)ドライブ)など、コンピュータ可読媒体にデータを書き込むためのデバイス、ユニバーサルシリアルバス(USB)ポート、ネットワークインターフェース、または他の出力インターフェースを備え得る。出力インターフェース32は、ビデオファイルを、たとえば、送信信号、磁気媒体、光媒体、メモリ、フラッシュドライブ、または他のコンピュータ可読媒体など、コンピュータ可読媒体に出力する。
【0050】
[0055]ネットワークインターフェース54は、ネットワーク74を介してNALユニットまたはアクセスユニットを受信し、取出しユニット52を介してNALユニットまたはアクセスユニットをカプセル化解除ユニット50に与え得る。カプセル化解除ユニット50は、ビデオファイルの要素を構成PESストリームにカプセル化解除し、符号化データを取り出すためにPESストリームをパケット化解除し、たとえば、ストリームのPESパケットヘッダによって示されるように、符号化データがオーディオストリームの一部であるのかビデオストリームの一部であるのかに応じて、符号化データをオーディオデコーダ46またはビデオデコーダ48のいずれかに送出し得る。オーディオデコーダ46は、符号化オーディオデータを復号し、復号オーディオデータをオーディオ出力42に送出し、ビデオデコーダ48は、符号化ビデオデータを復号し、ストリームの複数のビューを含み得る復号ビデオデータをビデオ出力44に送出する。
【0051】
[0056]図1の例は、例としてDASHおよびHTTPベースストリーミングの使用について説明する。しかしながら、他のタイプのプロトコルがメディアデータをトランスポートするために使用され得ることを理解されたい。たとえば、要求処理ユニット70と取出しユニット52とは、リアルタイムトランスポートプロトコル(RTP)、リアルタイムストリーミングプロトコル(RTSP)などに従って動作し、セッション記述プロトコル(SDP)またはセッション開始プロトコル(SIP)など、サポートするプロトコルを使用するように構成され得る。
【0052】
[0057]図2は、図1の取出しユニット52の構成要素の例示的なセットをより詳細に示すブロック図である。この例では、取出しユニット52は、eMBMSミドルウェアユニット100と、DASHクライアント110と、メディアアプリケーション112とを含む。
【0053】
[0058]この例では、eMBMSミドルウェアユニット100は、eMBMS受信ユニット106と、キャッシュ104と、プロキシサーバユニット102とをさらに含む。この例では、eMBMS受信ユニット106は、たとえば、tools.ietf.org/html/rfc6726において入手可能なT.Pailaら、「FLUTE-File Delivery over Unidirectional Transport」、ネットワークワーキンググループ、RFC6726、2012年11月に記載されている、ファイル配信オーバー単方向トランスポート(FLUTE:File Delivery over Unidirectional Transport)に従って、eMBMSを介してデータを受信するように構成される。すなわち、eMBMS受信ユニット106は、たとえば、ブロードキャスト/マルチキャストサービスセンター(BM-SC)として働き得るサーバデバイス60から、ブロードキャストを介してファイルを受信し得る。
【0054】
[0059]eMBMSミドルウェアユニット100がファイルについてのデータを受信したとき、eMBMSミドルウェアユニットは、受信されたデータをキャッシュ104に記憶し得る。キャッシュ104は、フラッシュメモリ、ハードディスク、RAM、または任意の他の好適な記憶媒体など、コンピュータ可読記憶媒体を備え得る。
【0055】
[0060]プロキシサーバユニット102は、DASHクライアント110のためのサーバとして働き得る。たとえば、プロキシサーバユニット102は、DASHクライアント110にMPDファイルまたは他のマニフェストファイルを与え得る。プロキシサーバユニット102は、MPDファイル中のセグメントのための利用可能性時間、ならびにセグメントがそこから取り出され得るハイパーリンクを広告し得る。これらのハイパーリンクは、クライアントデバイス40に対応するローカルホストアドレスプレフィックス(たとえば、IPv4についての127.0.0.1)を含み得る。このようにして、DASHクライアント110は、HTTP GET要求または部分GET要求を使用してプロキシサーバユニット102にセグメントを要求し得る。たとえば、リンクhttp://127.0.0.1/rep1/seg3から入手可能なセグメントの場合、DASHクライアント110は、http://127.0.0.1/rep1/seg3についての要求を含むHTTP GET要求を構築し、その要求をプロキシサーバユニット102にサブミットし得る。プロキシサーバユニット102は、要求されたデータをキャッシュ104から取り出し、そのデータを、そのような要求に応答してDASHクライアント110に与え得る。
【0056】
[0061]クライアントデバイス40は、メディアデータを取り出すためのデバイスであって、デバイスが、シーンデータと画像データとを記憶するように構成されたメモリと、回路中に実装された1つまたは複数のプロセッサとを含み、1つまたは複数のプロセッサは、ビットストリームが1つまたは複数のオーバーレイ画像を含むことを示す、ビットストリームのためのデータを受信することと、オーバーレイ画像が、シーンデータのフレームとともにフレームごとに提示される間、不変のままである、シーンデータとともに提示されるべき単一の静的画像、または、シーンデータのフレームとともにフレームごとに提示される間、規則的周期性で繰り返す画像シーケンスのいずれかを備える、ビットストリームから1つまたは複数のオーバーレイ画像を受信することと、1つまたは複数のシーン画像を含むシーンデータを受信することと、シーン画像とオーバーレイ画像とを提示することとを行うように構成された、デバイスの一例を表す。
【0057】
[0062]図3は、例示的なマルチメディアコンテンツ120の要素を示す概念図である。マルチメディアコンテンツ120は、マルチメディアコンテンツ64(図1)、または記憶媒体62に記憶された別のマルチメディアコンテンツに対応し得る。図3の例では、マルチメディアコンテンツ120は、メディアプレゼンテーション記述(MPD)122と複数の表現124A~124N(表現124)とを含む。表現124Aは、随意のヘッダデータ126とセグメント128A~128N(セグメント128)とを含み、表現124Nは、随意のヘッダデータ130とセグメント132A~132N(セグメント132)とを含む。文字Nは、便宜上、表現124の各々中の最後のムービーフラグメントを指定するために使用される。いくつかの例では、表現124間に異なる数のムービーフラグメントがあり得る。
【0058】
[0063]MPD122は、表現124とは別個のデータ構造を備え得る。MPD122は図1のマニフェストファイル66に対応し得る。同様に、表現124は、図1の表現68に対応し得る。概して、MPD122は、コーディング特性およびレンダリング特性、適応セット、MPD122が対応するプロファイル、テキストタイプ情報、カメラアングル情報、レーティング情報、トリックモード情報(たとえば、時間サブシーケンスを含む表現を示す情報)、ならびに/または(たとえば、再生中のメディアコンテンツへのターゲット広告挿入のための)リモート期間を取り出すための情報など、表現124の特性を概して記述するデータを含み得る。
【0059】
[0064]ヘッダデータ126は、存在するとき、セグメント128の特性、たとえば、ランダムアクセスポイント(RAP、ストリームアクセスポイント(SAP)とも呼ばれる)の時間ロケーションを記述し得、セグメント128のランダムアクセスポイントは、ランダムアクセスポイント、セグメント128内のランダムアクセスポイントへのバイトオフセット、セグメント128のユニフォームリソースロケータ(URL)、またはセグメント128の他の態様を含む。ヘッダデータ130は、存在するとき、セグメント132についての同様の特性を記述し得る。追加または代替として、そのような特性はMPD122内に完全に含まれ得る。
【0060】
[0065]セグメント128、132は1つまたは複数のコード化ビデオサンプルを含み、コード化ビデオサンプルの各々はビデオデータのフレームまたはスライスを含み得る。セグメント128のコード化ビデオサンプルの各々は、同様の特性、たとえば、高さ、幅、および帯域幅の要件を有し得る。そのような特性はMPD122のデータによって記述され得るが、そのようなデータは図3の例に示されていない。MPD122は、本開示で説明されるシグナリングされた情報のいずれかまたはすべての追加を伴う、3GPP仕様によって記述される特性を含み得る。
【0061】
[0066]セグメント128、132の各々は、一意のユニフォームリソースロケータ(URL)に関連付けられ得る。したがって、セグメント128、132の各々は、DASHなどのストリーミングネットワークプロトコルを使用して独立して取出し可能であり得る。このようにして、クライアントデバイス40などの宛先デバイスは、セグメント128または132を取り出すためにHTTP GET要求を使用し得る。いくつかの例では、クライアントデバイス40は、セグメント128または132の特定のバイト範囲を取り出すためにHTTP部分GET要求を使用し得る。
【0062】
[0067]図4は、図3のセグメント128、132のうちの1つなど、表現のセグメントに対応し得る、例示的なビデオファイル150の要素を示すブロック図である。セグメント128、132の各々は、図4の例に示されているデータの構成に実質的に準拠するデータを含み得る。ビデオファイル150は、セグメントをカプセル化すると言われることがある。上記で説明されたように、ISOベースメディアファイルフォーマットおよびそれの拡張によるビデオファイルは、データを「ボックス」と呼ばれる一連のオブジェクトに記憶する。図4の例では、ビデオファイル150は、ファイルタイプ(FTYP)ボックス152と、ムービー(MOOV)ボックス154と、セグメントインデックス(sidx)ボックス162と、ムービーフラグメント(MOOF)ボックス164と、ムービーフラグメントランダムアクセス(MFRA)ボックス166とを含む。図4はビデオファイルの一例を表しているが、他のメディアファイルは、ISOベースメディアファイルフォーマットおよびそれの拡張に従って、ビデオファイル150のデータと同様に構造化された他のタイプのメディアデータ(たとえば、オーディオデータ、タイムドテキストデータなど)を含み得ることを理解されたい。
【0063】
[0068]ファイルタイプ(FTYP)ボックス152は、概して、ビデオファイル150のためのファイルタイプを記述する。ファイルタイプボックス152は、ビデオファイル150の最良の使用を記述する仕様を識別するデータを含み得る。ファイルタイプボックス152は、代替的に、MOOVボックス154、ムービーフラグメントボックス164、および/またはMFRAボックス166の前に配置され得る。
【0064】
[0069]いくつかの例では、ビデオファイル150など、セグメントは、FTYPボックス152の前にMPD更新ボックス(図示せず)を含み得る。MPD更新ボックスは、MPDを更新するための情報とともに、ビデオファイル150を含む表現に対応するMPDが更新されるべきであることを示す情報を含み得る。たとえば、MPD更新ボックスは、MPDを更新するために使用されるべきリソースについてのURIまたはURLを与え得る。別の例として、MPD更新ボックスは、MPDを更新するためのデータを含み得る。いくつかの例では、MPD更新ボックスは、ビデオファイル150のセグメントタイプ(STYP)ボックス(図示せず)の直後にくることがあり、ここで、STYPボックスは、ビデオファイル150のためのセグメントタイプを定義し得る。
【0065】
[0070]MOOVボックス154は、図4の例では、ムービーヘッダ(MVHD)ボックス156と、トラック(TRAK)ボックス158と、1つまたは複数のムービー拡張(MVEX)ボックス160とを含む。概して、MVHDボックス156はビデオファイル150の一般的な特性を記述し得る。たとえば、MVHDボックス156は、ビデオファイル150が最初に作成されたとき、ビデオファイル150が最後に変更されたときを記述するデータ、ビデオファイル150についての時間スケール、ビデオファイル150についての再生の持続時間、またはビデオファイル150を概して記述する他のデータを含み得る。
【0066】
[0071]TRAKボックス158は、ビデオファイル150のトラックについてのデータを含み得る。TRAKボックス158は、TRAKボックス158に対応するトラックの特性を記述するトラックヘッダ(TKHD)ボックスを含み得る。いくつかの例では、TRAKボックス158はコード化ビデオピクチャを含み得、他の例では、トラックのコード化ビデオピクチャは、TRAKボックス158および/またはsidxボックス162のデータによって参照され得るムービーフラグメント164中に含まれ得る。
【0067】
[0072]いくつかの例では、ビデオファイル150は2つ以上のトラックを含み得る。したがって、MOOVボックス154は、ビデオファイル150中のトラックの数に等しいいくつかのTRAKボックスを含み得る。TRAKボックス158は、ビデオファイル150の対応するトラックの特性を記述し得る。たとえば、TRAKボックス158は、対応するトラックについての時間および/または空間情報を記述し得る。カプセル化ユニット30(図1)が、ビデオファイル150などのビデオファイル中にパラメータセットトラックを含むとき、MOOVボックス154のTRAKボックス158と同様のTRAKボックスは、パラメータセットトラックの特性を記述し得る。カプセル化ユニット30は、パラメータセットトラックを記述するTRAKボックス内のパラメータセットトラック中のシーケンスレベルSEIメッセージの存在をシグナリングし得る。
【0068】
[0073]MVEXボックス160は、たとえば、もしあれば、MOOVボックス154内に含まれるビデオデータに加えて、ムービーフラグメント164をビデオファイル150が含むことをシグナリングするように、対応するムービーフラグメント164の特性を記述し得る。ビデオデータをストリーミングするコンテキストでは、コード化ビデオピクチャは、MOOVボックス154中ではなくムービーフラグメント164中に含まれ得る。したがって、すべてのコード化ビデオサンプルは、MOOVボックス154中ではなくムービーフラグメント164中に含まれ得る。
【0069】
[0074]MOOVボックス154は、ビデオファイル150中のムービーフラグメント164の数に等しいいくつかのMVEXボックス160を含み得る。MVEXボックス160の各々は、ムービーフラグメント164のうちの対応する1つの特性を記述し得る。たとえば、各MVEXボックスは、ムービーフラグメント164のうちの対応する1つについての持続時間を記述するムービー拡張ヘッダボックス(MEHD)ボックスを含み得る。
【0070】
[0075]上述のように、カプセル化ユニット30は、シーケンスデータセットを、実際のコード化ビデオデータを含まないビデオサンプルに記憶し得る。ビデオサンプルは、概して、特定の時間インスタンスにおけるコード化ピクチャの表現である、アクセスユニットに対応し得る。AVCのコンテキストでは、コード化ピクチャは、アクセスユニットのすべてのピクセルを構築するための情報を含んでいる1つまたは複数のVCL NALユニットと、SEIメッセージなどの他の関連する非VCL NALユニットとを含む。したがって、カプセル化ユニット30は、ムービーフラグメント164のうちの1つ中に、シーケンスレベルSEIメッセージを含み得る、シーケンスデータセットを含み得る。カプセル化ユニット30はさらに、シーケンスデータセットおよび/またはシーケンスレベルSEIメッセージの存在を、ムービーフラグメント164のうちの1つに対応するMVEXボックス160のうちの1つ内のムービーフラグメント164のうちの1つ中に存在するものとしてシグナリングし得る。
【0071】
[0076]SIDXボックス162は、ビデオファイル150の随意の要素である。すなわち、3GPPファイルフォーマット、または他のそのようなファイルフォーマットに準拠するビデオファイルは、必ずしもSIDXボックス162を含むとは限らない。3GPPファイルフォーマットの例によれば、SIDXボックスは、セグメント(たとえば、ビデオファイル150内に含まれているセグメント)のサブセグメントを識別するために使用され得る。3GPPファイルフォーマットは、サブセグメントを、「対応する(1つまたは複数の)メディアデータボックスと、ムービーフラグメントボックスによって参照されるデータを含んでいるメディアデータボックスとをもつ、1つまたは複数の連続するムービーフラグメントボックスの独立型セットは、そのムービーフラグメントボックスに後続し、同じトラックに関する情報を含んでいる次のムービーフラグメントボックスに先行しなければならない」と定義している。3GPPファイルフォーマットはまた、SIDXボックスが、「ボックスによってドキュメント化される(サブ)セグメントのサブセグメントへの参照のシーケンスを含んでいる。参照されるサブセグメントは提示時間において隣接する。同様に、セグメントインデックスボックスによって参照されるバイトは常にセグメント内で隣接する。参照されるサイズは、参照される材料中のバイト数のカウントを与える」ことを示している。
【0072】
[0077]SIDXボックス162は、概して、ビデオファイル150中に含まれるセグメントの1つまたは複数のサブセグメントを表す情報を与える。たとえば、そのような情報は、サブセグメントが開始および/または終了する再生時間、サブセグメントについてのバイトオフセット、サブセグメントがストリームアクセスポイント(SAP)を含む(たとえば、それで開始する)かどうか、SAPのためのタイプ(たとえば、SAPが瞬時デコーダリフレッシュ(IDR)ピクチャであるのか、クリーンランダムアクセス(CRA)ピクチャであるのか、切断リンクアクセス(BLA)ピクチャであるのかなど)、サブセグメント中の(再生時間および/またはバイトオフセットに関する)SAPの位置などを含み得る。
【0073】
[0078]ムービーフラグメント164は、1つまたは複数のコード化ビデオピクチャを含み得る。いくつかの例では、ムービーフラグメント164は1つまたは複数のピクチャグループ(GOP)を含み得、GOPの各々は、いくつかのコード化ビデオピクチャ、たとえば、フレームまたはピクチャを含み得る。さらに、上記で説明されたように、ムービーフラグメント164は、いくつかの例では、シーケンスデータセットを含み得る。ムービーフラグメント164の各々は、ムービーフラグメントヘッダボックス(MFHD、図4に図示せず)を含み得る。MFHDボックスは、ムービーフラグメントについてのシーケンス番号など、対応するムービーフラグメントの特性を記述し得る。ムービーフラグメント164は、ビデオファイル150中のシーケンス番号の順に含まれ得る。
【0074】
[0079]MFRAボックス166は、ビデオファイル150のムービーフラグメント164内のランダムアクセスポイントを記述し得る。これは、ビデオファイル150によってカプセル化されたセグメント内の特定の時間ロケーション(すなわち、再生時間)へのシークを実施することなど、トリックモードを実施するのを支援し得る。MFRAボックス166は、概して随意であり、いくつかの例では、ビデオファイル中に含まれる必要がない。同様に、クライアントデバイス40などのクライアントデバイスは、ビデオファイル150のビデオデータを正しく復号し、表示するために、必ずしもMFRAボックス166を参照する必要があるとは限らない。MFRAボックス166は、ビデオファイル150のトラックの数に等しいか、またはいくつかの例では、ビデオファイル150のメディアトラック(たとえば、非ヒントトラック)の数に等しい、いくつかのトラックフラグメントランダムアクセス(TFRA)ボックス(図示せず)を含み得る。
【0075】
[0080]いくつかの例では、ムービーフラグメント164は、IDRピクチャなど、1つまたは複数のストリームアクセスポイント(SAP)を含み得る。同様に、MFRAボックス166は、SAPのビデオファイル150内のロケーションの指示を与え得る。したがって、ビデオファイル150のSAPからビデオファイル150の時間サブシーケンスが形成され得る。時間サブシーケンスはまた、SAPに従属するPフレームおよび/またはBフレームなど、他のピクチャを含み得る。時間サブシーケンスのフレームおよび/またはスライスは、サブシーケンスの他のフレーム/スライスに依存する時間サブシーケンスのフレーム/スライスが適切に復号され得るように、セグメント内に構成され得る。たとえば、データの階層構成において、他のデータの予測のために使用されるデータも時間サブシーケンス中に含まれ得る。
【0076】
[0081]図5は、メディアファイル200中に画像データを含むための高効率画像ファイル(HEIF)フォーマットの例示的な構造を示す概念図である。HEIFフォーマットは、ISO/IEC23008-12において定義されている。HEIFは、ISOBMFFベースコンテナファイルへの画像および画像シーケンスならびにそれらのメタデータの記憶を指定する。HEIFは、画像の記憶のための一般的なコーデックアグノスティック構造を定義するだけでなく、H.265/HEVCコーデックに基づくインスタンス化をも提供する。図3のセグメント128、132は、いくつかの例では、図5のHEIFフォーマットに準拠し得る。
【0077】
[0082]HEIFは、メディアの記憶のためにISOBMFF設計ルールに従う。したがって、画像シーケンスがトラックに記憶され、静止画像がメタデータアイテムとして記憶される。前者では、画像は一緒にコード化される。したがって、コード化画像はいくつかの復号依存性を有する。後者では、画像は、互いから独立してコード化される。
【0078】
[0083]図5に示されているように、HEIFフォーマットされたメディアファイル200が、FTYPボックス202と、画像シーケンス208中の0個以上の画像を含むTRAKボックス206を含み得るMOOVボックス204と、0個以上の画像アイテム218およびアイテムプロパティ(IPRP)ボックス220を含む画像ロケーション(ILOC)ボックス216を含むMETAボックス214と、0個以上の画像212を含むMDATボックス210と、0個以上の画像224を含むアイテムデータ(IDAT)ボックス222とを含む。
【0079】
[0084]HEVC符号化を用いた画像を記憶するISOBMFFコンテナファイルが、ISOBMFFボックスの最初のFTYPボックス202において見つけられる、「heic」または「hevc」ブランドによって、対応して識別され得る。これらのファイルのMIMEタイプは、静止画像の場合「image/heic」または画像シーケンスの場合「image/heic-sequence」に設定され得る。
【0080】
[0085]コンテナ中の画像は、異なる役割を割り当てられ得る。以下の役割は、画像212、224などの画像に割り当てられ得る例である。
【0081】
・ カバー画像:表示選好に関する他の情報の不在下で示されるデフォルト画像。1つのカバー画像のみがHEIFにおいて定義されていることがある。
【0082】
・ サムネイル画像:マスタ画像に対応する小さい解像度画像。
【0083】
・ 補助画像:マスタ画像を補完する、たとえば、深度マップを含んでいる画像。
【0084】
・ マスタ画像:フル解像度である、コンテナファイル中の主要な画像。
【0085】
・ 隠し画像:表示されることを意図されない画像。
【0086】
・ あらかじめ計算された導出された画像:他の画像から導出されたコード化画像。
【0087】
・ コード化画像:画像のコード化表現。
【0088】
・ 導出された画像:コンテナファイル中の他の画像に対するいくつかの動作と参照とを使用して導出されなければならい画像である。定義された動作は、クロッピングと、回転と、ミラーリングと、合成とを含む。
【0089】
[0086]画像シーケンスは、マスタ、補助、またはサムネイル画像シーケンス役割を行い得る。
【0090】
[0087]画像212、224は、それら自体のメタデータとともにコンテナファイルに記憶され得る。初期化情報は、画像シーケンスのためにサンプル記述ボックスの一部としてサンプルエントリに記憶され得る。静止画像の場合、初期化情報は、アイテムプロパティとしてIPRPコンテナボックス220の一部として記憶され得る。このメタデータは、画像の次元、コーデック初期化情報などの情報を含んでいることがある。
【0091】
[0088]ピクセルアスペクト比、色情報、およびビット深度など、追加のメタデータが、アイテムプロパティコンテナボックス中に存在し、アイテム参照ボックス中の「cdsc」参照タイプを使用して実際の画像を参照することができる。
【0092】
[0089]画像シーケンス208などの画像シーケンスの場合、仕様は、たとえば、以下のいずれかまたはすべてを記述するために再生制御特徴を定義する。
【0093】
・ 表示されるべきでない画像
・ スライドショー対画像集合
・ スライドショーのための再生タイミング
・ スライドショーのルーピング
・ 画像に対する変換
[0090]画像シーケンス中の特定の画像へのアクセスを容易にするために、サンプルグループ化が、その画像の復号依存性を示すために使用され得る。デコーダは、画像シーケンス208のすべての画像212を復号する必要があるとは限らない。
【0094】
[0091]HEVCのためのリアルタイムトランスポートプロトコル(RTP)ペイロードフォーマットは、IETF RFC7798、高効率ビデオコーディング(HEVC)のためのRTPペイロードフォーマットにおいて定義されている。RFC7798は、現在、ビデオストリームのトランスポートのためにMTSIによってサポートされている。ペイロードフォーマットは、HEVCペイロードを搬送するときのRTPヘッダの使用と、HEVCコード化NALユニットの、RTPパケットへのパケット化と、SDP記述と、ペイロードヘッダ拡張機構とを定義する。
【0095】
[0092]ITT4RTのコンテキストでは、画像と画像シーケンスの両方がオーバーレイとして使用され得る。HEIFフォーマットは、オーバーレイのためのソースとして使用され得る。送信はHEVC準拠であり得、すなわち、画像アイテムおよび画像シーケンスは、HEIFソースから抽出され、HEVCペイロードフォーマットを使用して送信され得る。
【0096】
[0093]ITT4RT-txクライアントは、以下の情報を受信機に示し得る。
【0097】
・ ストリームが画像オーバーレイストリームであること。
【0098】
・ ストリームが、画像シーケンスを搬送するのか静止画像を搬送するのかその両方を搬送するのか。
【0099】
・ 静止画像アイテムの数。
【0100】
・ 画像シーケンス中の画像の数。
【0101】
・ 静止画像または画像シーケンスのための送信モード。送信モードは、送信と表示との結合を示すために「結合(coupled)」に設定され得、その場合、表示時間は常に、RTPタイムスタンプによって決定される。代替的に、送信モードは、送信が提示から独立していることを示すために「分離(decoupled)」であり得、その結果、提示タイミングは、記憶およびルーピングなどの使用事例をサポートするために別々に与えられる。
【0102】
・ 送信モードが「分離」に設定された場合の、静止画像集合または画像シーケンス中の画像の表示順序。
【0103】
・ 画像次元、画像役割などを含む、画像アイテムまたはサンプルの各々のための画像メタデータ。
【0104】
[0094]このシグナリングをサポートするために、「画像」SDP属性は、ストリームが、静止画像および/または画像シーケンスを含む1つまたは複数のオーバーレイ画像を搬送することを識別するために使用され得る。「画像」属性は、以下の拡張バッカス-ナウア記法(ABNF)シンタックスを有し得る。
【0105】
・ image_attribute=“a=image:” pt SP transmission_mode SP item_count
・ transmission_mode=“tmode=” (”結合” / “分離” [“;” store] [“;” loop])
・ item_count=“count=” 1*DIGIT
・ metadata_index=“meta=” 1*DIGIT
・ store=“store=” (“0”/”1”)
・ loop=“loop=” (“0”/”1”)
[0095]上記のシンタックス要素についてのセマンティクスは以下のように定義され得る。
【0106】
[0096]pt:この画像集合または画像シーケンスの搬送のために使用されるペイロードタイプ。複数の画像シーケンスまたは画像集合と画像シーケンスとの混合の存在下で、異なるペイロードタイプが、異なるシーケンスまたは画像集合のために使用されるものとする。
【0107】
[0097]transmission_mode:送信モード、結合は、オーバーレイがレンダリングされるべきである限り、オーバーレイ画像が連続的にストリーミングされる(再送信される)ことになることを示す。RTPタイムスタンプは、オーバーレイ画像の提示時間を決定するために使用され得る。画像は記憶されることを必要とされず、ルーピングは実施される必要がない。画像は、この場合マスタ画像であり得る。「分離」送信モードの場合、画像の提示は、画像メタデータによって上書きされ得る。RTPタイムスタンプは、画像のインデックスを決定するために使用され得る。
【0108】
[0098]item_count:対応する画像集合または画像シーケンス中の画像の数を与える。
【0109】
[0099]store:分離送信モードの場合、storeフラグは、連続提示のために画像を記憶すべきか否かを受信機に伝える。これは、送信セッションが実際の提示よりもはるかに短くなることを可能にする。特に、静止画像オーバーレイは、一般に、オーバーレイの存続期間全体にわたって提示のために記憶される。
【0110】
[0100]loop:分離送信モードの場合、loopフラグは、画像集合または画像シーケンスがループされるものとするかどうか、あるいはその集合または画像シーケンス中の最後の画像アイテムが表示中のままであるべきかどうかを示す。
【0111】
[0101]画像集合または画像シーケンス中の画像アイテムのためのメタデータの搬送は、以下のように定義され得る、「image-metadata」属性を使用して実施される。
image-metadata=”a=image-metadata:” pt SP coded-metadata
[0102]上記の例では、coded-metadataは、対応する画像集合または画像シーケンスのためのbase64コード化画像メタデータである。
【0112】
[0103]画像メタデータは、以下のフォーマットを有し得る。
【0113】
【表1】
【0114】
[0104]すべての画像プロパティは、たとえば、ISO/IEC23008-12,MPEG systems Technologies-Part12:画像ファイルフォーマットにおいて定義されている、それらのそれぞれの定義に従ってフォーマットされ得る。
【0115】
[0105]display_info要素は、画像集合またはシーケンス中の各画像の表示順序に関する情報を与え得る。0の順序は、画像がレンダリングされるべきでないことを意味する。このことは、補助画像または隠し画像の場合、起こり得る。持続時間は、画像が90kHzクロックの単位でどのくらい長い間レンダリングされるべきであるかを示す。
【0116】
[0106]メタデータ情報は、base64符号化され、各画像集合または画像シーケンスについて独立してimage-metadata属性の一部として与えられ得る。
【0117】
[0107]結合送信モードは、ライブオーバーレイストリーム、たとえば、ライブスライドプレゼンテーションに好適であり得る。分離送信モードは、タイムドスライドショーなど、プリセットコンテンツに好適であり得る。
【0118】
[0108]以下の表は、画像集合および画像シーケンスの搬送のためのSDPデータの例示的なセットを与える。



m=video 49170 RTP/AVP 98,99
a=rtpmap:98 H265/90000
a=fmtp:98 profile-id=1;sprop-vps=<ビデオパラメータセットデータ>
a=image:98 tmode=結合 count=14
a=image-metadata:98 coded-metadata=<base64コード化メタデータ>
a=rtpmap:99 H265/90000
a=fmtp:99 profile-id=1;sprop-vps=<ビデオパラメータセットデータ>
a=image:99 tmode=分離;store=1;loop=1 count=6
a=image-metadata:99 coded-metadata=<base64コード化メタデータ>



[0109]図6は、本開示の技法による、メディアデータを取り出す例示的な方法を示すフローチャートである。図6の方法は、図1および図2のクライアントデバイス40および取出しユニット52に関して説明される。他のデバイスが、この方法または同様の方法を実施するように構成され得る。
【0119】
[0110]上記で説明されたように、ビットストリームは、ビットストリームが1つまたは複数のオーバーレイ画像を含むことを示すデータを含み得る。特に、オーバーレイ画像は、静的画像または画像シーケンスのいずれかまたはその両方を含み得る。静的画像は、シーンデータのフレームとともにフレームごとに提示される間、不変のままである、シーンデータ(たとえば、ビデオデータ、エクステンデッドリアリティ(XR)コンテンツ、拡張現実(AR)コンテンツ、仮想現実(VR)コンテンツなど)とともに提示されるべきである画像であり得る。追加または代替として、画像シーケンスは、シーンデータのフレームとともにフレームごとに提示される間、規則的周期性で繰り返す画像のシーケンスであり得る。
【0120】
[0111]オーバーレイ画像は、全体としてのシーンデータよりも、完全なビューポート提示のより小さい領域を占有し得る。すなわち、シーンデータは、概して、ビューポートの全体(すなわち、スクリーン、レンズ、または他の表示デバイスの全体)を占有し得るが、オーバーレイ画像は、ビューポートの比較的小さい部分を占有し、シーンデータ上で(その前に)提示され得、したがって、オーバーレイ画像はシーンデータの小さい部分を遮る。
【0121】
[0112]ビットストリームのデータは、SDP画像属性、または、たとえば、オーバーレイ画像が、静的画像を含むのか、画像シーケンスを含むのか、その両方を含むのかを示すペイロードタイプを示す他のデータを含み得る。データは、送信モード、たとえば、「結合」または「分離」をも示し得る。「結合」の送信モードは、オーバーレイ画像がビットストリーム中で連続的に送信されることを示す。「分離」の送信モードは、オーバーレイ画像が再送信されないことを示す。いくつかの例では、データは、オーバーレイ画像が記憶される(バッファされる)べきであるかどうか、および/または、オーバーレイ画像がループでプレイされるべきであるかどうかをさらに示し得る。
【0122】
[0113]したがって、図1のクライアントデバイス40の取出しユニット52は、たとえば、1つまたは複数のオーバーレイ画像がビットストリーム中に含まれることを示す、ビットストリームのデータを受信し得る(250)。取出しユニット52は、次いで、このデータを使用して、オーバーレイ画像タイプを決定し得る(252)。たとえば、取出しユニット52は、オーバーレイ画像が静的画像および/または画像シーケンスを含むかどうかを決定し得る。
【0123】
[0114]取出しユニット52は、オーバーレイ画像のための送信モードをも決定し得る(254)。たとえば、取出しユニット52は、オーバーレイ画像が、連続的に再送信されるのか、1回(あるいは、たとえば、ブロードキャストまたはマルチキャストの代わりにユニキャストを介してオンデマンドで)送出されるのかを決定し得る。したがって、取出しユニット52は、オーバーレイ画像をいつおよびどのように抽出すべきか、オーバーレイ画像をバッファすべきかどうか、オーバーレイ画像をどのように提示すべきか(たとえば、ループにわたって、または単一の提示として)などを決定し得る。取出しユニット52は、オーバーレイ画像の抽出を表すデータをカプセル化解除ユニット50に与え、オーバーレイ画像の提示を、たとえば、ビデオ出力44に与え得る。
【0124】
[0115]取出しユニット52は、シーンのためのシーンデータを受信し(256)、ならびにオーバーレイ画像自体を受信し得る(258)。オーバーレイ画像は、図5のメディアファイル200などのメディアファイル中に含まれ得る。取出しユニット52は、受信されたデータが、オーバーレイ画像がバッファされるべきであることを示すと仮定して、オーバーレイ画像を、たとえば、キャッシュ104(図2)中にバッファし得る。
【0125】
[0116]取出しユニット52のメディアアプリケーション112(図2)は、次いで、シーンデータとともにオーバーレイ画像を提示し得る(260)。たとえば、メディアアプリケーション112は、ビデオ出力44を介してフレームごとにシーンデータを提示しながら、シーンデータ上でオーバーレイ画像を提示するように構成され得る。たとえば、メディアアプリケーション112は、フレームごとに提示されるシーンデータ上で単一の、静的オーバーレイ画像を提示するように構成され得る。代替的に、オーバーレイ画像が、ループされるべきである画像シーケンスを含む場合、メディアアプリケーション112は、オーバーレイ画像を順序通り繰り返し提示し得る。すなわち、ビデオシーケンスがN個の画像を含み、ここで、Nが正の整数である場合、jが非負整数である、ループjについて、メディアアプリケーション112は、時間j*N+iにおいて画像iを提示し得る。受信されたデータは、オーバーレイ画像のための提示時間を示し得、メディアアプリケーション112は、それに応じて、示された提示時間においてオーバーレイ画像を提示し得る。
【0126】
[0117]DASHクライアント110は、ユニキャストを使用して別個のサーバデバイスから、またはプロキシサーバ102からのいずれかでオーバーレイ画像を取り出すように構成され得る。特に、画像がキャッシュ104にローカルに記憶されるべきである場合、DASHクライアント110は、プロキシサーバ102を介して、キャッシュ104(すなわち、ローカルメモリ)からオーバーレイ画像を繰り返し取り出し得る。代替的に、メディアアプリケーション112は、キャッシュ104とは別個のストレージデバイス中のメモリを割り振られ、割り振られたメモリ中にオーバーレイ画像をバッファし得る。
【0127】
[0118]このようにして、図6の方法は、ビットストリームが1つまたは複数のオーバーレイ画像を含むことを示す、ビットストリームのためのデータを受信することと、オーバーレイ画像が、シーンデータのフレームとともにフレームごとに提示される間、不変のままである、シーンデータとともに提示されるべき単一の静的画像、または、シーンデータのフレームとともにフレームごとに提示される間、規則的周期性で繰り返す画像シーケンスのいずれかを備える、ビットストリームから1つまたは複数のオーバーレイ画像を受信することと、1つまたは複数のシーン画像を含むシーンデータを受信することと、シーン画像とオーバーレイ画像とを提示することとを含む、方法の一例を表す。
【0128】
[0119]本開示の技法の様々な例は、以下の条項において要約される。
【0129】
[0120]条項1:メディアデータを取り出す方法であって、方法は、ビットストリームが1つまたは複数のオーバーレイ画像を含むことを示す、ビットストリームのためのデータを受信することと、ビットストリームから1つまたは複数のオーバーレイ画像を受信することと、1つまたは複数のシーン画像を含むシーンデータを受信することと、シーン画像とオーバーレイ画像とを提示することとを備える、方法。
【0130】
[0121]条項2:1つまたは複数のオーバーレイ画像が1つまたは複数の画像シーケンスを含むかどうかと、1つまたは複数のオーバーレイ画像が1つまたは複数の静止画像を含むかどうかとを示す、ビットストリームのためのデータを受信することをさらに備える、条項1に記載の方法。
【0131】
[0122]条項3:データが、1つまたは複数のオーバーレイ画像が1つまたは複数の画像シーケンスを含むことを示すとき、画像シーケンスの各々中の画像の数をさらに備える、条項2に記載の方法。
【0132】
[0123]条項4:データが、1つまたは複数のオーバーレイ画像が1つまたは複数の静止画像を含むことを示すとき、静止画像の数をさらに備える、条項2および3のいずれかに記載の方法。
【0133】
[0124]条項5:画像シーケンスと静止画像とのための送信モードを表すデータを受信することをさらに備える、条項2から4のいずれかに記載の方法。
【0134】
[0125]条項6:送信モードのうちの1つが「結合」であるとき、ビットストリームのタイムスタンプデータからオーバーレイ画像のための表示時間を決定することをさらに備える、条項5に記載の方法。
【0135】
[0126]条項7:タイムスタンプデータが、リアルタイムトランスポートプロトコル(RTP)タイムスタンプデータを備える、条項6に記載の方法。
【0136】
[0127]条項8:送信モードのうちの1つが「分離」であるとき、オーバーレイ画像のための表示時間を表すデータを別々に受信することと、別々に受信されたデータからオーバーレイ画像のための表示時間を決定することとをさらに備える、条項5から7のいずれかに記載の方法。
【0137】
[0128]条項9:1つまたは複数のオーバーレイ画像が2つまたはそれ以上のオーバーレイ画像を含むとき、オーバーレイ画像の表示順序を表すデータを受信することをさらに備える、条項1から8のいずれかに記載の方法。
【0138】
[0129]条項10:ビットストリームからオーバーレイ画像の各々のための画像メタデータを受信することをさらに備え、メタデータが、画像次元または画像役割のうちの1つまたは複数を示す、条項1から9のいずれかに記載の方法。
【0139】
[0130]条項11:画像役割が、カバー画像、サムネイル画像、補助画像、マスタ画像、隠し画像、あらかじめ計算された導出された画像、コード化画像、または導出された画像のうちの少なくとも1つを備える、条項10に記載の方法。
【0140】
[0131]条項12:メタデータが、image_properties()要素、display_info()要素、またはextension_info()要素のうちの1つまたは複数を含む、条項10および11のいずれかに記載の方法。
【0141】
[0132]条項13:image_properties()要素が、ispe_present_flag、pasp_present_flag、colr_present_flag、pixi_present_flag、clap_present_flag、irot_present_flag、imir_present_flag、other_properties()要素、ImageSpatialExtentsProperty()要素、PixelAspectRatioBox()要素、ColourInformationBox()要素、PixelInformationProperty()要素、CleanApertureBox()要素、またはImageRotation()要素のうちの1つまたは複数を含む、条項12に記載の方法。
【0142】
[0133]条項14:display_info()要素は、オーバーレイ画像の提示の順序を示す順序要素、またはオーバーレイ画像のうちの対応する1つが表示されるべきである時間の量を示す持続時間要素のうちの1つまたは複数を含む、条項12および13のいずれかに記載の方法。
【0143】
[0134]条項15:ビットストリームを識別するセッション記述プロトコル(SDP)画像属性を受信することをさらに備える、条項1から14のいずれかに記載の方法。
【0144】
[0135]条項16:SDP画像属性が、image_attribute、transmission_mode、item_count、metadata_index、store、またはloopを含む1つまたは複数のシンタックス要素を含む、条項15に記載の方法。
【0145】
[0136]条項17:1つまたは複数のオーバーレイ画像が1つまたは複数の画像シーケンスを含むかどうかと、1つまたは複数のオーバーレイ画像が1つまたは複数の静止画像を含むかどうかとを示す、ビットストリームのためのデータを受信することをさらに備える、条項1に記載の方法。
【0146】
[0137]条項18:データが、1つまたは複数のオーバーレイ画像が1つまたは複数の画像シーケンスを含むことを示すとき、画像シーケンスの各々中の画像の数をさらに備える、条項17に記載の方法。
【0147】
[0138]条項19:データが、1つまたは複数のオーバーレイ画像が1つまたは複数の静止画像を含むことを示すとき、静止画像の数をさらに備える、条項18に記載の方法。
【0148】
[0139]条項20:画像シーケンスと静止画像とのための送信モードを表すデータを受信することをさらに備える、条項18に記載の方法。
【0149】
[0140]条項21:送信モードのうちの1つが「結合」であるとき、ビットストリームのタイムスタンプデータからオーバーレイ画像のための表示時間を決定することをさらに備える、条項20に記載の方法。
【0150】
[0141]条項22:タイムスタンプデータが、リアルタイムトランスポートプロトコル(RTP)タイムスタンプデータを備える、条項21に記載の方法。
【0151】
[0142]条項23:送信モードのうちの1つが「分離」であるとき、オーバーレイ画像のための表示時間を表すデータを別々に受信することと、別々に受信されたデータからオーバーレイ画像のための表示時間を決定することとをさらに備える、条項20に記載の方法。
【0152】
[0143]条項24:1つまたは複数のオーバーレイ画像が2つまたはそれ以上のオーバーレイ画像を含むとき、オーバーレイ画像の表示順序を表すデータを受信することをさらに備える、条項1に記載の方法。
【0153】
[0144]条項25:ビットストリームからオーバーレイ画像の各々のための画像メタデータを受信することをさらに備え、メタデータが、画像次元または画像役割のうちの1つまたは複数を示す、条項1に記載の方法。
【0154】
[0145]条項26:画像役割が、カバー画像、サムネイル画像、補助画像、マスタ画像、隠し画像、あらかじめ計算された導出された画像、コード化画像、または導出された画像のうちの少なくとも1つを備える、条項25に記載の方法。
【0155】
[0146]条項27:メタデータが、image_properties()要素、display_info()要素、またはextension_info()要素のうちの1つまたは複数を含む、条項26に記載の方法。
【0156】
[0147]条項28:image_properties()要素が、ispe_present_flag、pasp_present_flag、colr_present_flag、pixi_present_flag、clap_present_flag、irot_present_flag、imir_present_flag、other_properties()要素、ImageSpatialExtentsProperty()要素、PixelAspectRatioBox()要素、ColourInformationBox()要素、PixelInformationProperty()要素、CleanApertureBox()要素、またはImageRotation()要素のうちの1つまたは複数を含む、条項27に記載の方法。
【0157】
[0148]条項29:display_info()要素は、オーバーレイ画像の提示の順序を示す順序要素、またはオーバーレイ画像のうちの対応する1つが表示されるべきである時間の量を示す持続時間要素のうちの1つまたは複数を含む、条項27に記載の方法。
【0158】
[0149]条項30:ビットストリームを識別するセッション記述プロトコル(SDP)画像属性を受信することをさらに備える、条項1に記載の方法。
【0159】
[0150]条項31:SDP画像属性が、image_attribute、transmission_mode、item_count、metadata_index、store、またはloopを含む1つまたは複数のシンタックス要素を含む、条項30に記載の方法。
【0160】
[0151]条項32:メディアデータを取り出すためのデバイスであって、デバイスが、条項1から31のいずれかの方法を実施するための1つまたは複数の手段を備える、デバイス。
【0161】
[0152]条項33:1つまたは複数の手段が、回路中に実装された1つまたは複数のプロセッサを備える、条項32に記載のデバイス。
【0162】
[0153]条項34:デバイスが、集積回路、マイクロプロセッサ、またはワイヤレス通信デバイスのうちの少なくとも1つを備える、条項32に記載のデバイス。
【0163】
[0154]条項35:命令を記憶したコンピュータ可読記憶媒体であって、命令が、実行されたとき、プロセッサに、条項1から31のいずれかに記載の方法を実施させる、コンピュータ可読記憶媒体。
【0164】
[0155]条項36:メディアデータを受信するためのデバイスであって、デバイスは、ビットストリームが1つまたは複数のオーバーレイ画像を含むことを示す、ビットストリームのためのデータを受信するための手段と、ビットストリームから1つまたは複数のオーバーレイ画像を受信するための手段と、1つまたは複数のシーン画像を含むシーンデータを受信するための手段と、シーン画像とオーバーレイ画像とを提示するための手段とを備える、デバイス。
【0165】
[0156]条項37:メディアデータを取り出す方法であって、方法は、ビットストリームが1つまたは複数のオーバーレイ画像を含むことを示す、ビットストリームのためのデータを受信することと、オーバーレイ画像が、シーンデータのフレームとともにフレームごとに提示される間、不変のままである、シーンデータとともに提示されるべき単一の静的画像、または、シーンデータのフレームとともにフレームごとに提示される間、規則的周期性で繰り返す画像シーケンスのいずれかを備える、ビットストリームから1つまたは複数のオーバーレイ画像を受信することと、1つまたは複数のシーン画像を含むシーンデータを受信することと、シーン画像とオーバーレイ画像とを提示することとを備える、方法。
【0166】
[0157]条項38:ビットストリームを識別するセッション記述プロトコル(SDP)画像属性を受信することをさらに備える、条項37に記載の方法。
【0167】
[0158]条項39:SDP画像属性は、1つまたは複数のオーバーレイ画像が単一の静的画像を含むのか画像シーケンスを含むのかを示すペイロードタイプを示す画像属性を含む、条項38に記載の方法。
【0168】
[0159]条項40:ペイロードタイプが、1つまたは複数の画像が単一の静的画像を含むことを示すとき、シーン画像とオーバーレイ画像とを提示することが、シーン画像を画像ごとに提示するときに単一の静的画像を繰り返し提示することを備える、条項39に記載の方法。
【0169】
[0160]条項41:ペイロードタイプが、1つまたは複数の画像が画像シーケンスを含むことを示すとき、シーン画像とオーバーレイ画像とを提示することが、画像シーケンスの画像を、シーン画像の対応する画像と一緒に順序通り提示することを備える、条項39に記載の方法。
【0170】
[0161]条項42:SDP画像属性は、オーバーレイ画像がシーンデータのフレームとともに提示されるべきである限り、オーバーレイ画像が連続的に再送信されるかどうかを示す送信モード属性を含む、条項38に記載の方法。
【0171】
[0162]条項43:SDP画像属性は、オーバーレイ画像がループで繰り返し提示されるべきであるかどうかを示すデータを含む、条項38に記載の方法。
【0172】
[0163]条項44:データが、オーバーレイ画像がループで繰り返し提示されるべきであることを示すとき、シーン画像とオーバーレイ画像とを提示することは、オーバーレイ画像が画像シーケンス中にN個の画像を含むと決定することと、Nが正の整数である、jが非負整数である、ループ数jについて、時間j*N+iにおいてオーバーレイ画像の画像シーケンスの画像iを提示することと、iがオーバーレイ画像の画像シーケンスのi番目の画像に対応する、を備える、条項43に記載の方法。
【0173】
[0164]条項45:SDP画像属性は、オーバーレイ画像が受信の後にローカルに記憶されるべきであるかどうかを示すデータを含む、条項38に記載の方法。
【0174】
[0165]条項46:データが、オーバーレイ画像が受信の後にローカルに記憶されるべきであることを示すとき、方法が、オーバーレイ画像をローカルメモリに記憶することをさらに備え、ここにおいて、シーン画像とオーバーレイ画像とを提示することが、ローカルメモリからオーバーレイ画像を取り出すことと、取り出されたオーバーレイ画像を提示することとを備える、条項45に記載の方法。
【0175】
[0166]条項47:データが、オーバーレイ画像が再送信されることになることを示すとき、シーン画像とオーバーレイ画像とを提示することが、オーバーレイ画像の再送信されたバージョンを受信することと、オーバーレイ画像の再送信されたバージョンを提示することとを備える、条項45に記載の方法。
【0176】
[0167]条項48:SDP画像属性が、オーバーレイ画像中に含まれる画像の数を示すデータを含む、条項38に記載の方法。
【0177】
[0168]条項49:1つまたは複数のオーバーレイ画像が1つまたは複数の画像シーケンスを含むかどうかと、1つまたは複数のオーバーレイ画像が1つまたは複数の静止画像を含むかどうかとを示す、ビットストリームのためのデータを受信することをさらに備える、条項37に記載の方法。
【0178】
[0169]条項50:データが、1つまたは複数のオーバーレイ画像が1つまたは複数の画像シーケンスを含むことを示すとき、画像シーケンスの各々中の画像の数を示す、ビットストリームのためのデータを受信することをさらに備える、条項49に記載の方法。
【0179】
[0170]条項51:データが、1つまたは複数のオーバーレイ画像が1つまたは複数の静止画像を含むことを示すとき、静止画像の数を示す、ビットストリームのためのデータを受信することをさらに備える、条項49に記載の方法。
【0180】
[0171]条項52:画像シーケンスと静止画像とのための送信モードを表すデータを受信することをさらに備える、条項49に記載の方法。
【0181】
[0172]条項53:送信モードのうちの1つが「結合」であるとき、ビットストリームのタイムスタンプデータからオーバーレイ画像のための表示時間を決定することをさらに備える、条項52に記載の方法。
【0182】
[0173]条項54:タイムスタンプデータが、リアルタイムトランスポートプロトコル(RTP)タイムスタンプデータを備える、条項53に記載の方法。
【0183】
[0174]条項55:送信モードのうちの1つが「分離」であるとき、オーバーレイ画像のための表示時間を表すデータを別々に受信することと、別々に受信されたデータからオーバーレイ画像のための表示時間を決定することとをさらに備える、条項52に記載の方法。
【0184】
[0175]条項56:1つまたは複数のオーバーレイ画像が2つまたはそれ以上のオーバーレイ画像を含むとき、オーバーレイ画像の表示順序を表すデータを受信することをさらに備える、条項37に記載の方法。
【0185】
[0176]条項57:ビットストリームからオーバーレイ画像の各々のための画像メタデータを受信することをさらに備え、メタデータが、画像次元または画像役割のうちの1つまたは複数を示す、条項37に記載の方法。
【0186】
[0177]条項58:画像役割が、カバー画像、サムネイル画像、補助画像、マスタ画像、隠し画像、あらかじめ計算された導出された画像、コード化画像、または導出された画像のうちの少なくとも1つを備える、条項57に記載の方法。
【0187】
[0178]条項59:メタデータは、オーバーレイ画像の提示の順序を示す順序要素、またはオーバーレイ画像のうちの対応する1つが表示されるべきである時間の量を示す持続時間要素のうちの1つまたは複数を含む、条項57に記載の方法。
【0188】
[0179]条項60:メディアデータを取り出すためのデバイスであって、デバイスが、シーンデータと画像データとを記憶するように構成されたメモリと、回路中に実装された1つまたは複数のプロセッサとを備え、1つまたは複数のプロセッサは、ビットストリームが1つまたは複数のオーバーレイ画像を含むことを示す、ビットストリームのためのデータを受信することと、オーバーレイ画像が、シーンデータのフレームとともにフレームごとに提示される間、不変のままである、シーンデータとともに提示されるべき単一の静的画像、または、シーンデータのフレームとともにフレームごとに提示される間、規則的周期性で繰り返す画像シーケンスのいずれかを備える、ビットストリームから1つまたは複数のオーバーレイ画像を受信することと、1つまたは複数のシーン画像を含むシーンデータを受信することと、シーン画像とオーバーレイ画像とを提示することとを行うように構成された、デバイス。
【0189】
[0180]条項61:1つまたは複数のプロセッサが、ビットストリームを識別するセッション記述プロトコル(SDP)画像属性を受信することを行うようにさらに構成された、条項60に記載のデバイス。
【0190】
[0181]条項62:SDP画像属性は、1つまたは複数のオーバーレイ画像が単一の静的画像を含むのか画像シーケンスを含むのかを示すペイロードタイプを示す画像属性を含む、条項61に記載のデバイス。
【0191】
[0182]条項63:シーン画像とオーバーレイ画像とを提示するために、1つまたは複数のプロセッサは、ペイロードタイプが、1つまたは複数の画像が単一の静的画像を含むことを示すとき、シーン画像を画像ごとに提示するときに単一の静的画像を繰り返し提示することを行うように構成された、条項62に記載のデバイス。
【0192】
[0183]条項64:シーン画像とオーバーレイ画像とを提示するために、1つまたは複数のプロセッサは、ペイロードタイプが、1つまたは複数の画像が画像シーケンスを含むことを示すとき、画像シーケンスの画像を、シーン画像の対応する画像と一緒に順序通り提示することを行うように構成された、条項62に記載のデバイス。
【0193】
[0184]条項65:SDP画像属性は、オーバーレイ画像がシーンデータのフレームとともに提示されるべきである限り、オーバーレイ画像が連続的に再送信されるかどうかを示す送信モード属性を含む、条項61に記載のデバイス。
【0194】
[0185]条項66:SDP画像属性は、オーバーレイ画像がループで繰り返し提示されるべきであるかどうかを示すデータを含む、条項61に記載のデバイス。
【0195】
[0186]条項67:シーン画像とオーバーレイ画像とを提示するために、1つまたは複数のプロセッサは、データが、オーバーレイ画像がループで繰り返し提示されるべきであることを示すとき、オーバーレイ画像が画像シーケンス中にN個の画像を含むと決定することと、Nが正の整数である、jが非負整数である、ループ数jについて、時間j*N+iにおいてオーバーレイ画像の画像シーケンスの画像iを提示することと、iがオーバーレイ画像の画像シーケンスのi番目の画像に対応する、を行うように構成された、条項66に記載のデバイス。
【0196】
[0187]条項68:SDP画像属性は、オーバーレイ画像が受信の後にローカルに記憶されるべきであるかどうかを示すデータを含む、条項61に記載のデバイス。
【0197】
[0188]条項69:1つまたは複数のプロセッサは、データが、オーバーレイ画像が受信の後にローカルに記憶されるべきであることを示すとき、オーバーレイ画像をメモリに記憶することを行うようにさらに構成され、ここにおいて、シーン画像とオーバーレイ画像とを提示するために、1つまたは複数のプロセッサが、メモリからオーバーレイ画像を取り出すことと、取り出されたオーバーレイ画像を提示することとを行うように構成された、条項68に記載のデバイス。
【0198】
[0189]条項70:シーン画像とオーバーレイ画像とを提示するために、1つまたは複数のプロセッサは、データが、オーバーレイ画像が再送信されることになることを示すとき、オーバーレイ画像の再送信されたバージョンを受信することと、オーバーレイ画像の再送信されたバージョンを提示することとを行うように構成された、条項68に記載のデバイス。
【0199】
[0190]条項71:命令を記憶したコンピュータ可読記憶媒体であって、命令は、実行されたとき、プロセッサに、ビットストリームが1つまたは複数のオーバーレイ画像を含むことを示す、ビットストリームのためのデータを受信することと、オーバーレイ画像が、シーンデータのフレームとともにフレームごとに提示される間、不変のままである、シーンデータとともに提示されるべき単一の静的画像、または、シーンデータのフレームとともにフレームごとに提示される間、規則的周期性で繰り返す画像シーケンスのいずれかを備える、ビットストリームから1つまたは複数のオーバーレイ画像を受信することと、1つまたは複数のシーン画像を含むシーンデータを受信することと、シーン画像とオーバーレイ画像とを提示することとを行わせる、コンピュータ可読記憶媒体。
【0200】
[0191]条項72:メディアデータを受信するためのデバイスであって、デバイスは、ビットストリームが1つまたは複数のオーバーレイ画像を含むことを示す、ビットストリームのためのデータを受信するための手段と、オーバーレイ画像が、シーンデータのフレームとともにフレームごとに提示される間、不変のままである、シーンデータとともに提示されるべき単一の静的画像、または、シーンデータのフレームとともにフレームごとに提示される間、規則的周期性で繰り返す画像シーケンスのいずれかを備える、ビットストリームから1つまたは複数のオーバーレイ画像を受信するための手段と、1つまたは複数のシーン画像を含むシーンデータを受信するための手段と、シーン画像とオーバーレイ画像とを提示するための手段とを備える、デバイス。
【0201】
[0192]条項73:メディアデータを取り出す方法であって、方法は、ビットストリームが1つまたは複数のオーバーレイ画像を含むことを示す、ビットストリームのためのデータを受信することと、オーバーレイ画像が、シーンデータのフレームとともにフレームごとに提示される間、不変のままである、シーンデータとともに提示されるべき単一の静的画像、または、シーンデータのフレームとともにフレームごとに提示される間、規則的周期性で繰り返す画像シーケンスのいずれかを備える、ビットストリームから1つまたは複数のオーバーレイ画像を受信することと、1つまたは複数のシーン画像を含むシーンデータを受信することと、シーン画像とオーバーレイ画像とを提示することとを備える、方法。
【0202】
[0193]条項74:ビットストリームを識別するセッション記述プロトコル(SDP)画像属性を受信することをさらに備える、条項73に記載の方法。
【0203】
[0194]条項75:SDP画像属性は、1つまたは複数のオーバーレイ画像が単一の静的画像を含むのか画像シーケンスを含むのかを示すペイロードタイプを示す画像属性を含む、条項74に記載の方法。
【0204】
[0195]条項76:ペイロードタイプが、1つまたは複数の画像が単一の静的画像を含むことを示すとき、シーン画像とオーバーレイ画像とを提示することが、シーン画像を画像ごとに提示するときに単一の静的画像を繰り返し提示することを備える、条項75に記載の方法。
【0205】
[0196]条項77:ペイロードタイプが、1つまたは複数の画像が画像シーケンスを含むことを示すとき、シーン画像とオーバーレイ画像とを提示することが、画像シーケンスの画像を、シーン画像の対応する画像と一緒に順序通り提示することを備える、条項75に記載の方法。
【0206】
[0197]条項78:SDP画像属性は、オーバーレイ画像がシーンデータのフレームとともに提示されるべきである限り、オーバーレイ画像が連続的に再送信されるかどうかを示す送信モード属性を含む、条項74から77のいずれかに記載の方法。
【0207】
[0198]条項79:SDP画像属性は、オーバーレイ画像がループで繰り返し提示されるべきであるかどうかを示すデータを含む、条項74から78のいずれかに記載の方法。
【0208】
[0199]条項80:データが、オーバーレイ画像がループで繰り返し提示されるべきであることを示すとき、シーン画像とオーバーレイ画像とを提示することは、オーバーレイ画像が画像シーケンス中にN個の画像を含むと決定することと、Nが正の整数である、jが非負整数である、ループ数jについて、時間j*N+iにおいてオーバーレイ画像の画像シーケンスの画像iを提示することと、iがオーバーレイ画像の画像シーケンスのi番目の画像に対応する、を備える、条項79に記載の方法。
【0209】
[0200]条項81:SDP画像属性は、オーバーレイ画像が受信の後にローカルに記憶されるべきであるかどうかを示すデータを含む、条項74から80のいずれかに記載の方法。
【0210】
[0201]条項82:データが、オーバーレイ画像が受信の後にローカルに記憶されるべきであることを示すとき、方法が、オーバーレイ画像をローカルメモリに記憶することをさらに備え、ここにおいて、シーン画像とオーバーレイ画像とを提示することが、ローカルメモリからオーバーレイ画像を取り出すことと、取り出されたオーバーレイ画像を提示することとを備える、条項81に記載の方法。
【0211】
[0202]条項83:データが、オーバーレイ画像が再送信されることになることを示すとき、シーン画像とオーバーレイ画像とを提示することが、オーバーレイ画像の再送信されたバージョンを受信することと、オーバーレイ画像の再送信されたバージョンを提示することとを備える、条項81に記載の方法。
【0212】
[0203]条項84:SDP画像属性が、オーバーレイ画像中に含まれる画像の数を示すデータを含む、条項74から83のいずれかに記載の方法。
【0213】
[0204]条項85:1つまたは複数のオーバーレイ画像が1つまたは複数の画像シーケンスを含むかどうかと、1つまたは複数のオーバーレイ画像が1つまたは複数の静止画像を含むかどうかとを示す、ビットストリームのためのデータを受信することをさらに備える、条項73から84のいずれかに記載の方法。
【0214】
[0205]条項86:データが、1つまたは複数のオーバーレイ画像が1つまたは複数の画像シーケンスを含むことを示すとき、画像シーケンスの各々中の画像の数を示す、ビットストリームのためのデータを受信することをさらに備える、条項85に記載の方法。
【0215】
[0206]条項87:データが、1つまたは複数のオーバーレイ画像が1つまたは複数の静止画像を含むことを示すとき、静止画像の数を示す、ビットストリームのためのデータを受信することをさらに備える、条項85および86のいずれかに記載の方法。
【0216】
[0207]条項88:画像シーケンスと静止画像とのための送信モードを表すデータを受信することをさらに備える、条項85から87のいずれかに記載の方法。
【0217】
[0208]条項89:送信モードのうちの1つが「結合」であるとき、ビットストリームのタイムスタンプデータからオーバーレイ画像のための表示時間を決定することをさらに備える、条項88に記載の方法。
【0218】
[0209]条項90:タイムスタンプデータが、リアルタイムトランスポートプロトコル(RTP)タイムスタンプデータを備える、条項89に記載の方法。
【0219】
[0210]条項91:送信モードのうちの1つが「分離」であるとき、オーバーレイ画像のための表示時間を表すデータを別々に受信することと、別々に受信されたデータからオーバーレイ画像のための表示時間を決定することとをさらに備える、条項88に記載の方法。
【0220】
[0211]条項92:1つまたは複数のオーバーレイ画像が2つまたはそれ以上のオーバーレイ画像を含むとき、オーバーレイ画像の表示順序を表すデータを受信することをさらに備える、条項73から91のいずれかに記載の方法。
【0221】
[0212]条項93:ビットストリームからオーバーレイ画像の各々のための画像メタデータを受信することをさらに備え、メタデータが、画像次元または画像役割のうちの1つまたは複数を示す、条項73から92のいずれかに記載の方法。
【0222】
[0213]条項94:画像役割が、カバー画像、サムネイル画像、補助画像、マスタ画像、隠し画像、あらかじめ計算された導出された画像、コード化画像、または導出された画像のうちの少なくとも1つを備える、条項93に記載の方法。
【0223】
[0214]条項95:メタデータは、オーバーレイ画像の提示の順序を示す順序要素、またはオーバーレイ画像のうちの対応する1つが表示されるべきである時間の量を示す持続時間要素のうちの1つまたは複数を含む、条項93および94のいずれかに記載の方法。
【0224】
[0215]条項96:メディアデータを取り出すためのデバイスであって、デバイスが、シーンデータと画像データとを記憶するように構成されたメモリと、回路中に実装された1つまたは複数のプロセッサとを備え、1つまたは複数のプロセッサは、ビットストリームが1つまたは複数のオーバーレイ画像を含むことを示す、ビットストリームのためのデータを受信することと、オーバーレイ画像が、シーンデータのフレームとともにフレームごとに提示される間、不変のままである、シーンデータとともに提示されるべき単一の静的画像、または、シーンデータのフレームとともにフレームごとに提示される間、規則的周期性で繰り返す画像シーケンスのいずれかを備える、ビットストリームから1つまたは複数のオーバーレイ画像を受信することと、1つまたは複数のシーン画像を含むシーンデータを受信することと、シーン画像とオーバーレイ画像とを提示することとを行うように構成された、デバイス。
【0225】
[0216]条項97:1つまたは複数のプロセッサが、ビットストリームを識別するセッション記述プロトコル(SDP)画像属性を受信することを行うようにさらに構成された、条項96に記載のデバイス。
【0226】
[0217]条項98:SDP画像属性は、1つまたは複数のオーバーレイ画像が単一の静的画像を含むのか画像シーケンスを含むのかを示すペイロードタイプを示す画像属性を含む、条項97に記載のデバイス。
【0227】
[0218]条項99:シーン画像とオーバーレイ画像とを提示するために、1つまたは複数のプロセッサは、ペイロードタイプが、1つまたは複数の画像が単一の静的画像を含むことを示すとき、シーン画像を画像ごとに提示するときに単一の静的画像を繰り返し提示することを行うように構成された、条項98に記載のデバイス。
【0228】
[0219]条項100:シーン画像とオーバーレイ画像とを提示するために、1つまたは複数のプロセッサは、ペイロードタイプが、1つまたは複数の画像が画像シーケンスを含むことを示すとき、画像シーケンスの画像を、シーン画像の対応する画像と一緒に順序通り提示することを行うように構成された、条項98に記載のデバイス。
【0229】
[0220]条項101:SDP画像属性は、オーバーレイ画像がシーンデータのフレームとともに提示されるべきである限り、オーバーレイ画像が連続的に再送信されるかどうかを示す送信モード属性を含む、条項97から100のいずれかに記載のデバイス。
【0230】
[0221]条項102:SDP画像属性は、オーバーレイ画像がループで繰り返し提示されるべきであるかどうかを示すデータを含む、条項101に記載のデバイス。
【0231】
[0222]条項103:シーン画像とオーバーレイ画像とを提示するために、1つまたは複数のプロセッサは、データが、オーバーレイ画像がループで繰り返し提示されるべきであることを示すとき、オーバーレイ画像が画像シーケンス中にN個の画像を含むと決定することと、Nが正の整数である、jが非負整数である、ループ数jについて、時間j*N+iにおいてオーバーレイ画像の画像シーケンスの画像iを提示することと、iがオーバーレイ画像の画像シーケンスのi番目の画像に対応する、を行うように構成された、条項102に記載のデバイス。
【0232】
[0223]条項104:SDP画像属性は、オーバーレイ画像が受信の後にローカルに記憶されるべきであるかどうかを示すデータを含む、条項97から103のいずれかに記載のデバイス。
【0233】
[0224]条項105:1つまたは複数のプロセッサは、データが、オーバーレイ画像が受信の後にローカルに記憶されるべきであることを示すとき、オーバーレイ画像をメモリに記憶することを行うようにさらに構成され、ここにおいて、シーン画像とオーバーレイ画像とを提示するために、1つまたは複数のプロセッサが、メモリからオーバーレイ画像を取り出すことと、取り出されたオーバーレイ画像を提示することとを行うように構成された、条項104に記載のデバイス。
【0234】
[0225]条項106:シーン画像とオーバーレイ画像とを提示するために、1つまたは複数のプロセッサは、データが、オーバーレイ画像が再送信されることになることを示すとき、オーバーレイ画像の再送信されたバージョンを受信することと、オーバーレイ画像の再送信されたバージョンを提示することとを行うように構成された、条項104および105のいずれかに記載のデバイス。
【0235】
[0226]1つまたは複数の例では、説明された機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実装され得る。ソフトウェアで実装される場合、機能は、1つまたは複数の命令またはコードとして、コンピュータ可読媒体上に記憶されるか、あるいはコンピュータ可読媒体を介して送信され、ハードウェアベース処理ユニットによって実行され得る。コンピュータ可読媒体は、データ記憶媒体などの有形媒体に対応する、コンピュータ可読記憶媒体を含み得るか、または、たとえば、通信プロトコルに従って、ある場所から別の場所へのコンピュータプログラムの転送を容易にする任意の媒体を含む通信媒体を含み得る。このようにして、コンピュータ可読媒体は、概して、(1)非一時的である有形コンピュータ可読記憶媒体、あるいは(2)信号または搬送波などの通信媒体に対応し得る。データ記憶媒体は、本開示で説明される技法の実装のための命令、コード、および/またはデータ構造を取り出すために1つまたは複数のコンピュータまたは1つまたは複数のプロセッサによってアクセスされ得る任意の利用可能な媒体であり得る。コンピュータプログラム製品はコンピュータ可読媒体を含み得る。
【0236】
[0227]限定ではなく例として、そのようなコンピュータ可読記憶媒体は、RAM、ROM、EEPROM(登録商標)、CD-ROMまたは他の光ディスクストレージ、磁気ディスクストレージ、または他の磁気ストレージデバイス、フラッシュメモリ、あるいは、命令またはデータ構造の形態の所望のプログラムコードを記憶するために使用され得、コンピュータによってアクセスされ得る、任意の他の媒体を備えることができる。また、いかなる接続もコンピュータ可読媒体と適切に呼ばれる。たとえば、命令が、同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者回線(DSL)、または赤外線、無線、およびマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、または他のリモートソースから送信される場合、同軸ケーブル、光ファイバーケーブル、ツイストペア、DSL、または赤外線、無線、およびマイクロ波などのワイヤレス技術は媒体の定義に含まれる。ただし、コンピュータ可読記憶媒体およびデータ記憶媒体は、接続、搬送波、信号、または他の一時的媒体を含まないが、代わりに非一時的有形記憶媒体を対象とすることを理解されたい。本明細書で使用されるディスク(disk)およびディスク(disc)は、コンパクトディスク(disc)(CD)、レーザーディスク(登録商標)(disc)、光ディスク(disc)、デジタル多用途ディスク(disc)(DVD)、フロッピーディスク(disk)およびBlu-ray(登録商標)ディスク(disc)を含み、ここで、ディスク(disk)は、通常、データを磁気的に再生し、ディスク(disc)は、データをレーザーで光学的に再生する。上記の組合せも、コンピュータ可読媒体の範囲内に含まれるべきである。
【0237】
[0228]命令は、1つまたは複数のデジタル信号プロセッサ(DSP)などの1つまたは複数のプロセッサ、汎用マイクロプロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラマブル論理アレイ(FPGA)、あるいは他の等価な集積回路またはディスクリート論理回路によって実行され得る。したがって、本明細書で使用される「プロセッサ」という用語は、上記の構造、または本明細書で説明された技法の実装に好適な任意の他の構造のいずれかを指すことがある。さらに、いくつかの態様では、本明細書で説明された機能は、符号化および復号のために構成された専用ハードウェアおよび/またはソフトウェアモジュール内に与えられるか、あるいは複合コーデックに組み込まれ得る。また、本技法は、1つまたは複数の回路または論理要素で十分に実装され得る。
【0238】
[0229]本開示の技法は、ワイヤレスハンドセット、集積回路(IC)またはICのセット(たとえば、チップセット)を含む、多種多様なデバイスまたは装置で実装され得る。本開示では、開示される技法を実施するように構成されたデバイスの機能的態様を強調するために、様々な構成要素、モジュール、またはユニットが説明されたが、それらの構成要素、モジュール、またはユニットは、必ずしも異なるハードウェアユニットによる実現を必要とするとは限らない。むしろ、上記で説明されたように、様々なユニットが、好適なソフトウェアおよび/またはファームウェアとともに、上記で説明された1つまたは複数のプロセッサを含めて、コーデックハードウェアユニットにおいて組み合わされ得るか、または相互動作可能なハードウェアユニットの集合によって与えられ得る。
【0239】
[0230]様々な例が説明された。これらおよび他の例は以下の特許請求の範囲内に入る。
図1
図2
図3
図4
図5
図6
【国際調査報告】