IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ バイトダンス インコーポレイテッドの特許一覧

<>
  • 特表-ビデオ処理の方法、装置及び媒体 図1
  • 特表-ビデオ処理の方法、装置及び媒体 図2
  • 特表-ビデオ処理の方法、装置及び媒体 図3
  • 特表-ビデオ処理の方法、装置及び媒体 図4
  • 特表-ビデオ処理の方法、装置及び媒体 図5
  • 特表-ビデオ処理の方法、装置及び媒体 図6
  • 特表-ビデオ処理の方法、装置及び媒体 図7
  • 特表-ビデオ処理の方法、装置及び媒体 図8
  • 特表-ビデオ処理の方法、装置及び媒体 図9
  • 特表-ビデオ処理の方法、装置及び媒体 図10
  • 特表-ビデオ処理の方法、装置及び媒体 図11
  • 特表-ビデオ処理の方法、装置及び媒体 図12
  • 特表-ビデオ処理の方法、装置及び媒体 図13
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2025-01-24
(54)【発明の名称】ビデオ処理の方法、装置及び媒体
(51)【国際特許分類】
   H04N 21/236 20110101AFI20250117BHJP
   H04N 21/2665 20110101ALI20250117BHJP
【FI】
H04N21/236
H04N21/2665
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024541640
(86)(22)【出願日】2023-01-11
(85)【翻訳文提出日】2024-08-02
(86)【国際出願番号】 US2023060470
(87)【国際公開番号】W WO2023137321
(87)【国際公開日】2023-07-20
(31)【優先権主張番号】63/298,461
(32)【優先日】2022-01-11
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】520477474
【氏名又は名称】バイトダンス インコーポレイテッド
【氏名又は名称原語表記】BYTEDANCE INC.
【住所又は居所原語表記】12655 West Jefferson Boulevard, Sixth Floor, Suite No. 137 Los Angeles, California 90066 United States of America
(74)【代理人】
【識別番号】110004381
【氏名又は名称】弁理士法人ITOH
(72)【発明者】
【氏名】ワン,イエ-クォイ
【テーマコード(参考)】
5C164
【Fターム(参考)】
5C164FA06
5C164MB13S
5C164SB11P
5C164SC04P
(57)【要約】
本開示の実施形態は、ビデオ処理のためのソリューションを提供する。ビデオ処理方法が提案される。前記方法は、ビデオのビットストリームと前記ビデオのメディアファイルとの間の転換を実行するステップを含み、ここで、前記メディアファイルは、サンプルのセットを含む外部ストリームトラックを含み、前記サンプルのセットについてのサンプルエントリのサンプルエントリタイプは、制限付きスキームに基づいてカプセル化され、前記サンプルエントリは、前記制限付きスキームに関連付けられた指示を含み、前記指示の値は、前記サンプルのセット内のサンプルが前記外部ストリームトラックの複数のコード化画像を含むことが許可されることを示す。
【特許請求の範囲】
【請求項1】
ビデオ処理方法であって、
ビデオのビットストリームと前記ビデオのメディアファイルとの間の転換を実行するステップを含み、
ここで、前記メディアファイルは、サンプルのセットを含む外部ストリームトラックを含み、前記サンプルのセットについてのサンプルエントリのサンプルエントリタイプは、制限付きスキームに基づいてカプセル化され、前記サンプルエントリは、前記制限付きスキームに関連付けられた指示を含み、前記指示の値は、前記サンプルのセット内のサンプルが前記外部ストリームトラックの複数のコード化画像を含むことが許可されることを示す、方法。
【請求項2】
前記サンプルエントリタイプは、オリジナルサンプルエントリタイプである、請求項1に記載の方法。
【請求項3】
前記サンプルエントリは、前記制限付きスキームに関する情報を含む第1のデータ構造を含み、前記第1のデータ構造は、前記制限付きスキームを識別する第2のデータ構造を含み、前記指示は、前記第2のデータ構造内の第1のフィールドを含む、請求項1又は2のいずれか一項に記載の方法。
【請求項4】
前記第1のデータ構造は、制限付きスキーム情報ボックスであり、前記第2のデータ構造は、スキームタイプボックスであり、前記第1のフィールドは、スキームタイプフィールドである、請求項3に記載の方法。
【請求項5】
前記第1のフィールドの値は所定のコードに等しい、請求項3又は4のいずれか一項に記載の方法。
【請求項6】
前記制限付きスキームの統一資源識別子(URI)は、前記メディアファイルに存在しない、請求項1から5のいずれか一項に記載の方法。
【請求項7】
前記サンプルエントリは、前記制限付きスキームに関する情報を含む第1のデータ構造を含み、前記第1のデータ構造は、前記制限付きスキームを識別する第2のデータ構造を含み、前記第2のデータ構造内のフラグフィールドの最下位ビットの値は0に等しい、請求項1から6のいずれか一項に記載の方法。
【請求項8】
前記第1のデータ構造は、制限付きスキーム情報ボックスであり、前記第2のデータ構造は、スキームタイプボックスである、請求項7に記載の方法。
【請求項9】
前記サンプルエントリタイプは、所定のサンプルエントリコードでカプセル化される、請求項1から8のいずれか一項に記載の方法。
【請求項10】
前記サンプルエントリは、前記制限付きスキームに関する情報を含む第1のデータ構造を含み、前記第1のデータ構造は、前記サンプルエントリタイプを記憶する第3のデータ構造を含む、請求項1から9のいずれか一項に記載の方法。
【請求項11】
前記第1のデータ構造は、制限付きスキーム情報ボックスであり、前記第3のデータ構造は、オリジナルフォーマットボックスである、請求項10に記載の方法。
【請求項12】
前記メディアファイルは、前記外部ストリームトラックに関連付けられた情報を含む第4のデータ構造を含む、請求項1から11のいずれか一項に記載の方法。
【請求項13】
前記第4のデータ構造は、
前記外部ストリームトラックに関連付けられたメインストリームトラックのトラックアイデンティティ(ID)を示すフィールド、
前記外部ストリームトラックにおけるサンプル内のコード化画像の最大許容数を示すフィールド、
前記外部ストリームトラックにおける各サンプル内の最初のコード化画像がイントラランダムアクセスポイント(IRAP)画像であるか否かを示すフィールドであって、前記最初のコード化画像がそれぞれのサンプル内の最初の位置にある、フィールド、
前記外部ストリームトラックにおける各サンプルがそれぞれのサンプル内のコード化画像のデコーディングに必要な全てのパラメータセットを含むか否かを示すフィールド、又は、
前記外部ストリームトラックにおける各サンプルついて、デコーディングプロセスが前記EDRAP画像から開始されるときに、前記外部ストリームトラックに関連付けられたメインストリームトラックにおける対応する拡張従属ランダムアクセスポイント(EDRAP)画像の先頭画像がデコード可能か否かを示すフィールド、
のうちの少なくとも1つを含む、請求項12に記載の方法。
【請求項14】
前記第4のデータ構造は、外部ストリーム情報ボックスである、請求項1から13のいずれか一項に記載の方法。
【請求項15】
前記メディアファイルは、国際標準化機構(ISO)ベースのメディアファイルフォーマットである、請求項1から14のいずれか一項に記載の方法。
【請求項16】
前記転換は、前記メディアファイルを生成し、前記ビットストリームを前記メディアファイルに記憶することを含む、請求項1から15のいずれか一項に記載の方法。
【請求項17】
前記転換は、前記メディアファイルを解析して前記ビットストリームを再構築することを含む、請求項1から15のいずれか一項に記載の方法。
【請求項18】
プロセッサと命令が記録された非一時的メモリとを含む、ビデオデータを処理する装置であって、前記命令は前記プロセッサによって実行されると、前記プロセッサに請求項1から17のいずれか一項に記載の方法を実行させる、装置。
【請求項19】
プロセッサに請求項1から17のいずれか一項に記載の方法を実行させる命令を記憶する非一時的なコンピュータ読み取り可能な記憶媒体。
【請求項20】
ビデオ処理装置によって実行される方法によって生成されたビデオのビットストリームを格納する非一時的なコンピュータ読み取り可能な記録媒体であって、
前記方法は、前記ビットストリームと前記ビデオのメディアファイルとの間の転換を実行するステップを含み、
ここで、前記メディアファイルは、サンプルのセットを含む外部ストリームトラックを含み、前記サンプルのセットについてのサンプルエントリのサンプルエントリタイプは、制限付きスキームに基づいてカプセル化され、前記サンプルエントリは、前記制限付きスキームに関連付けられた指示を含み、前記指示の値は、前記サンプルのセット内のサンプルが前記外部ストリームトラックの複数のコード化画像を含むことが許可されることを示す、方法。
【請求項21】
ビデオのビットストリームを記憶する方法であって、
前記ビットストリームと前記ビデオのメディアファイルとの間の転換を実行するステップと、
前記ビットストリームを非一時的なコンピュータ読み取り可能な記録媒体に記憶するステップと、を含み、
ここで、前記メディアファイルは、サンプルのセットを含む外部ストリームトラックを含み、前記サンプルのセットについてのサンプルエントリのサンプルエントリタイプは、制限付きスキームに基づいてカプセル化され、前記サンプルエントリは、前記制限付きスキームに関連付けられた指示を含み、前記指示の値は、前記サンプルのセット内のサンプルが前記外部ストリームトラックの複数のコード化画像を含むことが許可されることを示す、方法。
【請求項22】
ビデオ処理装置によって実行される方法によって生成されたビデオのメディアファイルを記憶する非一時的な非一時的なコンピュータ読み取り可能な記録媒体であって、
前記方法は、前記ビデオのビットストリームと前記メディアファイルとの間の転換を実行するステップを含み、
ここで、前記メディアファイルは、サンプルのセットを含む外部ストリームトラックを含み、前記サンプルのセットについてのサンプルエントリのサンプルエントリタイプは、制限付きスキームに基づいてカプセル化され、前記サンプルエントリは、前記制限付きスキームに関連付けられた指示を含み、前記指示の値は、前記サンプルのセット内のサンプルが前記外部ストリームトラックの複数のコード化画像を含むことが許可されることを示す、非一時的なコンピュータ読み取り可能な記録媒体。
【請求項23】
ビデオのメディアファイルを記憶する方法であって、
前記ビデオのビットストリームと前記メディアファイルとの間の転換を実行するステップと、
前記メディアファイルを非一時的なコンピュータ読み取り可能な記録媒体に記憶するステップと、を含み、
ここで、前記メディアファイルは、サンプルのセットを含む外部ストリームトラックを含み、前記サンプルのセットについてのサンプルエントリのサンプルエントリタイプは、制限付きスキームに基づいてカプセル化され、前記サンプルエントリは、前記制限付きスキームに関連付けられた指示を含み、前記指示の値は、前記サンプルのセット内のサンプルが前記外部ストリームトラックの複数のコード化画像を含むことが許可されることを示す、方法。
【発明の詳細な説明】
【技術分野】
【0001】
本出願は、2022年1月11日に出願された米国仮出願第63/298,461号の優先権の利益を主張し、その全内容は、参照により本明細書に明示的に組み込まれる。
【0002】
本開示の実施形態は、一般的にはビデオ処理技術に関し、より具体的には、メディアファイル内の外部ストリームトラックのシグナリングに関する。
【背景技術】
【0003】
メディアストリーミングアプリケーションは、通常、インターネットプロトコル(IP)、伝送制御プロトコル(TCP)、及びハイパーテキスト転送プロトコル(HTTP)トランスポートメソッドに基づいており、通常はISOベースメディアファイルルフォーマット(ISOBMFF)などのファイルフォーマットに依存している。このようなストリーミングシステムの1つが、HTTP経由の動的アダプティブストリーミング(DASH)である。DASHでは、マルチメディアコンテンツのビデオ及び/又はオーディオデータに対して複数の表現が存在し得、異なる表現は異なるコーディング特性(例:ビデオコーディング規格の異なるプロファイル又はレベル、異なるビットレート、異なる空間解像度など)に対応し得る。さらに、拡張従属ランダムアクセスポイント(EDRAP)画像ベースのビデオコーディング及びストリーミングが提案されている。したがって、外部ストリームトラックのシグナリングについて研究する価値がある。
【発明の概要】
【0004】
本開示の実施形態、ビデオ処理のためのソリューションを提供する。
【0005】
第1の態様では、ビデオ処理方法が提案される。前記方法は、ビデオのビットストリームと前記ビデオのメディアファイルとの間の転換を実行するステップを含み、ここで、前記メディアファイルは、サンプルのセットを含む外部ストリームトラックを含み、前記サンプルのセットについてのサンプルエントリのサンプルエントリタイプは、制限付きスキームに基づいてカプセル化され、前記サンプルエントリは、前記制限付きスキームに関連付けられた指示を含み、前記指示の値は、前記サンプルのセット内のサンプルが前記外部ストリームトラックの複数のコード化画像を含むことが許可されることを示す。
【0006】
本開示の第1の態様による方法によれば、新しい制限スキームが、外部ストリームトラックにおけるサンプルが複数のコード化画像を含むことが許可されることを示すために採用される。従来のソリューションと比較して、提案された方法は、EDRAPベースの技術をより効率的にサポートできるという利点がある。
【0007】
第2の態様では、ビデオデータを処理する装置が提案される。前記ビデオデータを処理する装置は、プロセッサと、命令が記録された非一時的メモリとを含む。前記命令は前記プロセッサによって実行されると、前記プロセッサに本開示の第1の態様による方法を実行させる。
【0008】
第3の態様では、非一時的なコンピュータ読み取り可能な記憶媒体が提案される。前記非一時的なコンピュータ読み取り可能な記憶媒体は、プロセッサに本開示の第1の態様による方法を実行させる命令を記憶する。
【0009】
第4の態様では、別の非一時的なコンピュータ読み取り可能な記録媒体が提案される。前記非一時的なコンピュータ読み取り可能な記録媒体は、ビデオ処理装置によって実行される方法によって生成されたビデオのビットストリームを記憶する。前記方法は、前記ビットストリームと前記ビデオのメディアファイルとの間の転換を実行するステップを含み、ここで、前記メディアファイルは、サンプルのセットを含む外部ストリームトラックを含み、前記サンプルのセットについてのサンプルエントリのサンプルエントリタイプは、制限付きスキームに基づいてカプセル化され、前記サンプルエントリは、前記制限付きスキームに関連付けられた指示を含み、前記指示の値は、前記サンプルのセット内のサンプルが前記外部ストリームトラックの複数のコード化画像を含むことが許可されることを示す。
【0010】
第5の態様では、ビデオのビットストリームを記憶する方法が提案される。前記方法は、前記ビットストリームと前記ビデオのメディアファイルとの間の転換を実行するステップと、前記ビットストリームを非一時的なコンピュータ読み取り可能な記録媒体に記憶するステップとを含み、ここで、前記メディアファイルは、サンプルのセットを含む外部ストリームトラックを含み、前記サンプルのセットについてのサンプルエントリのサンプルエントリタイプは、制限付きスキームに基づいてカプセル化され、前記サンプルエントリは、前記制限付きスキームに関連付けられた指示を含み、前記指示の値は、前記サンプルのセット内のサンプルが前記外部ストリームトラックの複数のコード化画像を含むことが許可されることを示す。
【0011】
第6の態様では、別の非一時的なコンピュータ読み取り可能な記録媒体が提案される。前記非一時的なコンピュータ読み取り可能な記録媒体は、ビデオ処理装置によって実行される方法によって生成されたビデオのメディアファイルを記憶する。前記方法は、前記ビデオのビットストリームと前記メディアファイルとの間の転換を実行するステップを含み、ここで、前記メディアファイルは、サンプルのセットを含む外部ストリームトラックを含み、前記サンプルのセットについてのサンプルエントリのサンプルエントリタイプは、制限付きスキームに基づいてカプセル化され、前記サンプルエントリは、前記制限付きスキームに関連付けられた指示を含み、前記指示の値は、前記サンプルのセット内のサンプルが前記外部ストリームトラックの複数のコード化画像を含むことが許可されることを示す。
【0012】
第7の態様では、ビデオのメディアファイルを記憶する方法が提案される。前記方法は、前記ビデオのビットストリームと前記メディアファイルとの間の転換を実行するステップと、前記メディアファイルを非一時的なコンピュータ読み取り可能な記録媒体に記憶するステップとを含み、ここで、前記メディアファイルは、サンプルのセットを含む外部ストリームトラックを含み、前記サンプルのセットについてのサンプルエントリのサンプルエントリタイプは、制限付きスキームに基づいてカプセル化され、前記サンプルエントリは、前記制限付きスキームに関連付けられた指示を含み、前記指示の値は、前記サンプルのセット内のサンプルが前記外部ストリームトラックの複数のコード化画像を含むことが許可されることを示す。
【0013】
この発明の内容は、詳細な説明でさらに詳しく説明する概念の選択を簡略化した形で紹介するために提供される。この発明の内容は、請求された主題の主要な特徴又は本質的な特徴を特定することを意図したものではなく、請求された主題の範囲を制限するために使用されることも意図されていない。
【図面の簡単な説明】
【0014】
添付の図面を参照した以下の詳細な説明により、本開示の実施形態の上記及びその他の目的、特徴、及び利点がより明らかになる。本開示の例示的な実施形態において、同じ参照番号は通常、同じ構成要素を指す。
【0015】
図1】本開示のいくつかの実施形態による例示的なビデオコーディングシステムのブロック図を示す。
【0016】
図2】本開示のいくつかの実施形態による例示的なビデオエンコーダのブロック図を示す。
【0017】
図3】本開示のいくつかの実施形態による例示的なビデオデコーダのブロック図を示す。
【0018】
図4】ランダムアクセスポイント(RAP)の概念を示すための図である。
【0019】
図5】RAPの概念を示す別の図である。
【0020】
図6】従属ランダムアクセスポイント(DRAP)概念を示す図である。
【0021】
図7】DRAPの概念を示す別の図である。
【0022】
図8】拡張従属ランダムアクセスポイント(EDRAP)の概念を示す図である。
【0023】
図9】EDRAPの概念を示すための別の図である。
【0024】
図10】EDRAPベースのビデオストリーミングを示す図である。
【0025】
図11】EDRAPベースのビデオストリーミングを示すための別の図である。
【0026】
図12】本開示のいくつかの実施形態によるビデオ処理方法のフローチャートを示す。
【0027】
図13】本開示の様々な実施形態を具現できるコンピューティングデバイスのブロック図を示す。
【0028】
図面全体を通じて、同一又は類似の参照番号は通常、同一又は類似の要素を指す。
【発明を実施するための形態】
【0029】
次に、いくつかの実施形態を参照して、本開示の原理を説明する。これらの実施形態は、説明のみを目的として記載されており、当業者が本開示を理解し具現するのを助けるものであり、本開示の範囲に関していかなる限定も示唆するものではないことを理解すべきである。本明細書に記載の開示は、以下に記載する方法以外にも様々な方式で具現されることができる。
【0030】
以下の説明及び特許請求の範囲において、別段の定義がない限り、本明細書で使用される全ての技術用語及び科学用語は、本開示が属する技術分野の当業者によって一般に理解されるのと同じ意味を有する。
【0031】
本開示における「一つの実施形態」、「一実施形態」、「例示的な実施形態」などへの言及は、記載される実施形態が特定の特徴、構造、又は特性を含み得ることを示すが、必ずしも全ての実施形態が特定の特徴、構造、又は特性を含むとは限らない。また、そのような語句は必ずしも同じ実施形態を指しているわけではない。さらに、特定の特徴、構造、又は特性が例示的な実施形態に関連して説明される場合、明示的に記載されているか否かにかかわらず、他の実施形態に関連してそのような特徴、構造、又は特性に影響を与えることは当業者の知識の範囲内であることが指摘される。
【0032】
「第1の」及び「第2の」などの用語は、本明細書では様々な要素を説明するために使用され得るが、これらの要素はこれらの用語によって限定されるべきではないことを理解すべきである。これらの用語は、ある要素を別の要素と区別するためにのみ使用される。例えば、例示的な実施形態の範囲から逸脱することなく、第1の要素が第2の要素と呼ばれ得、同様に、第2の要素が第1の要素と呼ばれ得る。本明細書で使用されるように、「及び/又は」という用語には、列挙された用語の1つ又は複数のあらゆる組み合わせが含まれる。
【0033】
本明細書で使用される用語は、特定の実施形態を説明することのみを目的としており、例示的な実施形態を限定することを意図したものではない。本明細書で使用されるように、単数形「a(一つの)」、「an(一つの)」、及び「the(その)」は、文脈上明らかに別段の指示がない限り、複数形も含むものとする。「含む」、「備える」、「有する」、「持つ」、「含有する」及び/又は「包含する」という用語は、本明細書で使用される場合、記載された特徴、要素、及び/又は構成要素などの存在を指定するが、1つ又は複数の他の特徴、要素、構成要素及び/又はそれらの組み合わせの存在又は追加を排除するものではないことがさらに理解されるであろう。
【0034】
例示的な環境
図1は、本開示の技術を利用し得る例示的なビデオコーディングシステム100を示すブロック図である。図示されるように、ビデオコーディングシステム100は、ソースデバイス110と、宛先デバイス120とを含み得る。ソースデバイス110は、ビデオエンコーディングデバイスとも呼ばれ得、宛先デバイス120は、ビデオデコーディングデバイスとも呼ばれ得る。動作中、ソースデバイス110は、エンコードされたビデオデータを生成するように構成することができ、宛先デバイス120は、ソースデバイス110によって生成されたエンコードされたビデオデータをデコードするように構成することができる。ソースデバイス110は、ビデオソース112と、ビデオエンコーダ114と、入力/出力(I/O)インターフェース116とを含み得る。
【0035】
ビデオソース112は、ビデオキャプチャデバイスなどのソースを含み得る。ビデオキャプチャデバイスの例には、ビデオコンテンツプロバイダからビデオデータを受信するインターフェース、ビデオデータを生成するコンピュータグラフィックスシステム、及び/又はそれらの組み合わせが含まれるが、これらに限定されない。
【0036】
ビデオデータは、1つ又は複数の画像を含み得る。ビデオエンコーダ114は、ビデオソース112からのビデオデータをエンコードしてビットストリームを生成する。ビットストリームには、ビデオデータのコード化表現を形成する一連のビットが含まれ得る。ビットストリームには、コード化画像及び関連データが含まれ得る。コード化画像は、画像のコード化表現である。関連データには、シーケンスパラメータセット、画像パラメータセット、及び他の構文構造が含まれ得る。I/Oインターフェース116は、変調器/復調器及び/又は送信機を含み得る。エンコードされたビデオデータは、I/Oインターフェース116を介してネットワーク130Aを通して宛先デバイス120に直接送信され得る。エンコードされたビデオデータは、宛先デバイス120によるアクセスのために記憶媒体/サーバ130Bに記憶されても良い。
【0037】
宛先デバイス120は、I/Oインターフェース126と、ビデオデコーダ124と、表示デバイス122とを含み得る。I/Oインターフェース126は、受信機及び/又はモデムを含み得る。I/Oインターフェース126は、ソースデバイス110又は記憶媒体/サーバ130Bからエンコードされたビデオデータを取得し得る。ビデオデコーダ124は、エンコードされたビデオデータをデコードし得る。表示デバイス122は、デコードされたビデオデータをユーザに表示し得る。表示デバイス122は、宛先デバイス120と一体化されて得、或いは外部表示デバイスとインターフェースするように構成された宛先デバイス120の外部にあり得る。
【0038】
ビデオエンコーダ114及びビデオデコーダ124は、High Efficiency Video Coding(高効率ビデオコーディング、HEVC)規格、Versatile Video Coding(多用途ビデオコーディング、VVC)規格及び他の現在の及び/又はさらなる規格などのビデオ圧縮規格に従って動作し得る。
【0039】
図2は、本開示のいくつかの実施形態による、図1に示されるシステム100内のビデオエンコーダ114の一例であり得るビデオエンコーダ200の一例を示すブロック図である。
【0040】
ビデオエンコーダ200は、本開示の技術のいずれか又は全てを具現するように構成され得る。図2の例では、ビデオエンコーダ200は複数の機能コンポーネントを含む。本開示で説明される技術は、ビデオエンコーダ200の様々なコンポーネント間で共有され得る。いくつかの例では、プロセッサは、本開示で説明された技術のいずれか又は全てを実行するように構成され得る。
【0041】
いくつかの実施形態では、ビデオエンコーダ200は、分割ユニット201と、モード選択ユニット203、動き推定ユニット204、動き補償ユニット205及びイントラ予測ユニット206を含み得る予測ユニット202と、残差生成ユニット207と、変換ユニット208と、量子化ユニット209と、逆量子化ユニット210と、逆変換ユニット211と、再構築ユニット212と、バッファ213と、エントロピーエンコーディングユニット214とを含み得る。
【0042】
他の例では、ビデオエンコーダ200は、より多くの、より少ない、又は異なる機能コンポーネントを含み得る。一例では、予測ユニット202は、イントラブロックコピー(IBC)ユニットを含み得る。IBCユニットは、少なくとも1つの参照画像が現在のビデオブロックが位置する画像であるIBCモードで予測を実行し得る。
【0043】
さらに、動き推定ユニット204及び動き補償ユニット205などのいくつかの構成要素は統合され得るが、図2の例では説明の目的で別々に表されている。
【0044】
分割ユニット201は、画像を1つ又は複数のビデオブロックに分割し得る。ビデオエンコーダ200及びビデオデコーダ300は、多様なビデオブロックサイズをサポートし得る。
【0045】
モード選択ユニット203は、例えば、エラー結果に基づいて、イントラ又はインターのコーディングモードのうちの1つを選択し、その結果から得られるイントラコード化又はインターコード化されたブロックを、残差ブロックデータを生成するように残差生成ユニット207に提供し、エンコードされたブロックを再構築して参照画像として使用するように再構築ユニット212に提供し得る。いくつかの例では、モード選択ユニット203は、予測がインター予測信号及びイントラ予測信号に基づくイントラ及びインター予測の組み合わせ(CIIP)モードを選択し得る。モード選択ユニット203は、インター予測の場合、ブロックの動きベクトルの解像度(例:サブピクセル又は整数ピクセル精度)を選択してもよい。
【0046】
現在のビデオブロックに対してインター予測を実行するために、動き推定ユニット204は、バッファ213からの1つ又は複数の参照フレームを現在のビデオブロックと比較することで現在のビデオブロックの動き情報を生成し得る。動き補償ユニット205は、現在のビデオブロックに関連付けられた画像以外のバッファ213からの画像の動き情報及びデコードされたサンプルに基づいて、現在のビデオブロックの予測ビデオブロックを決定し得る。
【0047】
動き推定ユニット204及び動き補償ユニット205は、例えば、現在のビデオブロックがIスライス、Pスライス、又はBスライスのいずれにあるかに応じて、現在のビデオブロックに対して異なる演算を実行し得る。本明細書で使用されるように、「Iスライス」は、マクロブロックから構成される画像の一部を指し得、その全てが同じ画像内のマクロブロックに基づいている。さらに、本明細書で使用されるように、いくつかの態様では、「Pスライス」及び「Bスライス」は、同じ画像内のマクロブロックに依存しないマクロブロックから構成される画像の部分を指し得る。
【0048】
いくつかの例では、動き推定ユニット204は、現在のビデオブロックに対して単方向予測を実行し得、動き推定ユニット204は、現在のビデオブロックの参照ビデオブロックについてのリスト0又はリスト1の参照画像を探し得る。次に、動き推定ユニット204は、参照ビデオブロックを含むリスト0又はリスト1内の参照画像を示す参照インデックスと、現在のビデオブロックと参照ビデオブロックとの間の空間的変位を示す動きベクトルとを生成し得る。動き推定ユニット204は、参照インデックス、予測方向指示子、及び動きベクトルを現在のビデオブロックの動き情報として出力し得る。動き補償ユニット205は、現在のビデオブロックの動き情報によって示される参照ビデオブロックに基づいて、現在のビデオブロックの予測ビデオブロックを生成し得る。
【0049】
代替的に、他の例では、動き推定ユニット204は、現在のビデオブロックに対して双方向予測を実行し得る。動き推定ユニット204は、現在のビデオブロックの参照ビデオブロックについてのリスト0内の参照画像を探してもよいし、現在のビデオブロックの別の参照ビデオブロックについてのリスト1内の参照画像を探してもよい。次に、動き推定ユニット204は、参照ビデオブロックを含むリスト0及びリスト1内の参照画像を示す参照インデックスと、参照ビデオブロックと現在のビデオブロックとの間の空間的変位を示す動きベクトルとを生成し得る。動き推定ユニット204は、現在のビデオブロックの参照インデックス及び動きベクトルを現在のビデオブロックの動き情報として出力し得る。動き補償ユニット205は、現在のビデオブロックの動き情報によって示される参照ビデオブロックに基づいて、現在のビデオブロックの予測ビデオブロックを生成し得る。
【0050】
いくつかの例では、動き推定ユニット204は、デコーダのデコーディング処理のためのフルセットの動き情報を出力し得る。代替的に、いくつかの実施形態では、動き推定ユニット204は、別のビデオブロックの動き情報を参照して現在のビデオブロックの動き情報をシグナリングし得る。例えば、動き推定ユニット204は、現在のビデオブロックの動き情報が隣接するビデオブロックの動き情報と十分に類似していると決定し得る。
【0051】
一例では、動き推定ユニット204は、現在のビデオブロックに関連付けられた構文構造において、現在のビデオブロックが別のビデオブロックと同じ動き情報を有することをビデオデコーダ300に示す値を示し得る。
【0052】
別の例では、動き推定ユニット204は、現在のビデオブロックに関連付けられた構文構造において、別のビデオブロック及び動きベクトル差分(MVD)を識別し得る。動きベクトル差分は、現在のビデオブロックの動きベクトルと、指示されたビデオブロックの動きベクトルとの間の差分を示す。ビデオデコーダ300は、指示されたビデオブロックの動きベクトル及び動きベクトル差分を使用して現在のビデオブロックの動きベクトルを決定し得る。
【0053】
上で論じたように、ビデオエンコーダ200は、動きベクトルを予測的にシグナリングし得る。ビデオエンコーダ200によって具現され得る予測シグナリング技術の2つの例には、アドバンスト動きベクトル予測(AMVP)とマージモードシグナリングとが含まれる。
【0054】
イントラ予測ユニット206は、現在のビデオブロックに対してイントラ予測を実行し得る。イントラ予測ユニット206が現在のビデオブロックに対してイントラ予測を実行するとき、イントラ予測ユニット206は、同じ画像内の他のビデオブロックのデコードされたサンプルに基づいて、現在のビデオブロックについての予測データを生成し得る。現在のビデオブロックについての予測データには、予測されたビデオブロック及び様々な構文要素が含まれ得る。
【0055】
残差生成ユニット207は、現在のビデオブロックから現在のビデオブロックの予測ビデオブロックを減算する(例:マイナス記号によって示される)ことで、現在のビデオブロックについての残差データを生成し得る。現在のビデオブロックの残差データは、現在のビデオブロック内のサンプルの異なるサンプル成分に対応する残差ビデオブロックを含み得る。
【0056】
他の例では、例えばスキップモードにおいて、現在のビデオブロックについての残差データが存在しなくてもよいし、残差生成ユニット207は減算演算を実行しなくてもよい。
【0057】
変換処理ユニット208は、現在のビデオブロックに関連付けられた残差ビデオブロックに1つ又は複数の変換を適用することによって、現在のビデオブロックについての1つ又は複数の変換係数ビデオブロックを生成し得る。
【0058】
変換処理ユニット208が現在のビデオブロックに関連付けられた変換係数ビデオブロックを生成した後、量子化ユニット209は、現在のビデオブロックに関連付けられた1つ又は複数の量子化パラメータ(QP)値に基づいて、現在のビデオブロックに関連付けられた変換係数ビデオブロックを量子化し得る。
【0059】
逆量子化ユニット210及び逆変換ユニット211は、それぞれ、変換係数ビデオブロックに逆量子化及び逆変換を適用して、変換係数ビデオブロックから残差ビデオブロックを再構築し得る。再構築ユニット212は、再構築された残差ビデオブロックを、予測ユニット202によって生成された1つ又は複数の予測ビデオブロックからの対応するサンプルに追加して、バッファ213に記憶するために現在のビデオブロックに関連付けられた再構築ビデオブロックを生成し得る。
【0060】
再構築ユニット212がビデオブロックを再構築した後、ループフィルタリング動作が実行されて、ビデオブロック内のビデオブロッキングアーティファクトを低減し得る。
【0061】
エントロピーエンコーディングユニット214は、ビデオエンコーダ200の他の機能コンポーネントからデータを受信し得る。エントロピーエンコーディングユニット214がデータを受信すると、エントロピーエンコーディングユニット214は、1つ又は複数のエントロピーエンコーディング動作を実行して、エントロピーエンコード化データを生成し、エントロピーエンコード化データを含むビットストリームを出力し得る。
【0062】
図3は、本開示のいくつかの実施形態による、図1に示されるシステム100内のビデオデコーダ124の一例であり得るビデオデコーダ300の一例を示すブロック図である。
【0063】
ビデオデコーダ300は、本開示の技術のいずれか又は全てを実行するように構成され得る。図3の例では、ビデオデコーダ300は複数の機能コンポーネントを含む。本開示で説明される技術は、ビデオデコーダ300の様々なコンポーネント間で共有され得る。いくつかの例では、プロセッサは、本開示で説明された技術のいずれか又は全てを実行するように構成され得る。
【0064】
図3の例では、ビデオデコーダ300は、エントロピーデコーディングユニット301と、動き補償ユニット302と、イントラ予測ユニット303と、逆量子化ユニット304と、逆変換ユニット305と、再構築ユニット306と、バッファ307とを含む。ビデオデコーダ300は、いくつかの例では、ビデオエンコーダ200に関して説明したエンコーディングパスと一般に逆のデコーディングパスを実行し得る。
【0065】
エントロピーデコーディングユニット301は、エンコードされたビットストリームを取り戻し得る。エンコードされたビットストリームは、エントロピーコード化されたビデオデータ(例:ビデオデータのエンコードされたブロック)を含み得る。エントロピーデコーディングユニット301は、エントロピーコード化されたビデオデータをデコードし得、エントロピーデコードされたビデオデータから、動き補償ユニット302は、動きベクトル、動きベクトル精度、参照画像リストインデックス及び他の動き情報を含む動き情報を決定し得る。動き補償ユニット302は、例えば、AMVP及びマージモードを実行することによってそのような情報を決定し得る。AMVPが使用され、隣接するPB及び参照画像からのデータに基づいた最もあり得るいくつかの候補の導出を含む。動き情報には、通常、水平及び垂直動きベクトル変位値、1つ又は2つの参照画像インデックス、及びBスライス内の予測領域の場合は、どの参照画像リストが各インデックスに関連付けられているかの識別が含まれる。本明細書で使用されるように、いくつかの態様では、「マージモード」は、空間的又は時間的に隣接するブロックから動き情報を導出することを指し得る。
【0066】
動き補償ユニット302は、おそらく補間フィルタに基づいて補間を実行しながら、動き補償されたブロックを生成し得る。サブピクセル精度で使用される補間フィルタの識別子が構文要素に含まれ得る。
【0067】
動き補償ユニット302は、ビデオブロックのエンコーディング中にビデオエンコーダ200によって使用される補間フィルタを使用して、参照ブロックのサブ整数ピクセルについての補間値を計算し得る。動き補償ユニット302は、受信した構文情報に従ってビデオエンコーダ200によって使用される補間フィルタを決定し、その補間フィルタを使用して予測ブロックを生成し得る。
【0068】
動き補償ユニット302は、構文情報の少なくとも一部を使用して、エンコードされたビデオシーケンスのフレーム及び/又はスライスをエンコードするために使用されるブロックのサイズ、エンコードされたビデオシーケンスの画像の各マクロブロックがどのように分割されるかを説明するパーティション情報、各パーティションがどのようにエンコードされるかを示すモード、各インターエンコードされたブロックの1つ又は複数の参照フレーム(及び参照フレームリスト)、及びエンコードされたビデオシーケンスをデコードするその他の情報を決定し得る。本明細書で使用されるように、いくつかの態様では、「スライス」は、エントロピーコーディング、信号予測、及び残差信号再構築に関して、同じ画像の他のスライスから独立してデコードできるデータ構造を指し得る。スライスは、画像全体又は画像の領域のいずれかになり得る。
【0069】
イントラ予測ユニット303は、例えばビットストリームで受信されたイントラ予測モードを使用して、空間的に隣接するブロックから予測ブロックを形成し得る。逆量子化ユニット304は、ビットストリームで提供され、エントロピーデコーディングユニット301によってデコードされた量子化ビデオブロック係数を逆量子化、即ち量子化解除する。逆変換ユニット305は、逆変換を適用する。
【0070】
再構築ユニット306は、例えば、残差ブロックと、動き補償ユニット302又はイントラ予測ユニット303によって生成された対応する予測ブロックとを加算することで、デコードされたブロックを取得し得る。必要に応じて、デブロッキングフィルタが適用されて、ブロックアーティファクトを除去するよう、デコードされたブロックをフィルタリングしてもよい。次に、デコードされたビデオブロックはバッファ307に記憶され、バッファ307は、後続の動き補償/イントラ予測のための参照ブロックを提供し、また、表示デバイス上にプレゼンテーションするためのデコードされたビデオも生成する。
【0071】
本開示のいくつかの例示的な実施形態について以下に詳細に説明することにする。本明細書では理解を容易にするためにセクション見出しが使用されているが、セクションで開示される実施形態をそのセクションのみに限定するものではないことを理解すべきである。さらに、特定の実施形態が多用途ビデオコーディング又は他の特定のビデオコーデックを参照して説明されるが、開示された技術は他のビデオコーディング技術にも適用可能である。さらに、いくつかの実施形態はビデオコーディングステップを詳細に説明するが、コーディングを元に戻す対応するデコーディングステップはデコーダによって実施されることが理解されるであろう。さらに、ビデオ処理という用語には、ビデオコーディング又は圧縮、ビデオデコーディング又は解凍、及びビデオピクセルを1つの圧縮フォーマットから別の圧縮フォーマット又は異なる圧縮ビットレートで表現するビデオトランスコーディングが包含される。
1. 概要
この開示は、メディアファイルフォーマットに関する。具体的には、適切なサンプルエントリタイプを持つ外部ストリームトラック(EST)のシグナリングに関するものであって、EST内の1つのサンプルに複数のコード化画像を含めることが可能になる。ESTは、メインストリームトラック(MST)内の拡張従属ランダムアクセスポイント(EDRAP)画像からのランダムアクセスに必要な外部画像を提供する。これらのアイデアは、ISOベースメディアファイルフォーマット(ISOBMFF)及びISOBMFFから派生したファイルフォーマットなど、任意のメディアファイルフォーマットに従ってメディアファイルに個別に、又は様々な組み合わせで適用され得る。
2. 背景
2.1 ビデオコーディング規格
ビデオコーディング規格は、主によく知られているITU-T及びISO/IEC規格の開発を通じて進化している。ITU-TはH.261とH.263を策定し、ISO/IECはMPEG-1とMPEG-4 Visualを策定し、この2つの組織は共同でH.262/MPEG-2 Video、H.264/MPEG-4 Advanced Video Coding(AVC)、及びH.265/HEVC規格を策定した。H.262以降、ビデオコーディング規格は、時間予測及び変換コーディングが利用されるハイブリッドビデオコーディング構造に基づいている。HEVCを超える将来のビデオコーディング技術を探求するために、2015年にVCEGとMPEGによって共同ビデオ探索チーム(Joint Video Exploration Team、JVET)が設立された。それ以来、多くの新しい方法がJVETに採用され、共同探索モデル(Joint Exploration Model、JEM)と呼ばれる参照ソフトウェアに取り入れられている。JVETは、Versatile Video Coding(VVC)プロジェクトが正式に開始されたときに、共同ビデオ専門家チーム(Joint Video Experts Team、JVET)に改名された。VVCは、HEVCと比較して50%のビットレート削減を目標とし、2020年7月1日に終了したJVETの第19回会議で最終決定された新しいコーディング規格である。
多用途ビデオコーディング(Versatile Video Coding、VVC)規格(ITU-T H.266 | ISO/IEC 23090-3)と関連する多用途補足拡張情報(VSEI)規格(ITU-T H.274 | ISO/IEC 23002-7)は、テレビ放送、ビデオ会議、ストレージメディアからの再生などの従来の用途だけでなく、アダプティブビットレートストリーミング、ビデオ領域の抽、複数のコード化ビデオビットストリームからのコンテンツの合成及びマージング、マルチビュービデオ、スケーラブルな階層化コーディング、ビューポート適応型360°イマーシブメディアなどの新しい高度な用途も含め、最大限に幅広いアプリケーションで使用されるように設計されている。
2.2 ファイルフォーマット規格
メディアストリーミングアプリケーションは、通常、IP、TCP、及びHTTPトランスポートメソッドに基づいており、通常はISOベースメディアファイルフォーマット(ISOBMFF)などのファイルフォーマットに依存する。このようなストリーミングシステムの1つが、HTTP経由の動的アダプティブストリーミング(DASH)である。ISOBMFF及びDASHでビデオフォーマットを使用する場合、AVCファイルフォーマット及びHEVCファイルフォーマットなどのビデオフォーマットに特有のファイルフォーマット仕様が、ISOBMFFトラック及びDASH表現とセグメントでのビデオコンテンツのカプセル化に必要になり得る。ビデオビットストリームに関する重要な情報、例えばプロファイル、階層、レベル、その他多くの情報は、コンテンツ選択の目的で、例えばストリーミングセッションの開始時の初期化及びストリーミングセッション中のストリーム適応の両方での適切なメディアセグメントの選択のために、ファイルフォーマットレベルのメタデータ及び/又はDASHメディアプレゼンテーション記述(MPD)として公開されるべきである場合がある。同様に、ISOBMFFでイメージフォーマットを使用する場合は、AVCイメージファイルフォーマット及びHEVCイメージファイルフォーマットなど、イメージフォーマットに特有のファイルフォーマット仕様が必要になり得る。
2.3 ランダムアクセスとHEVC及びVVCにおけるそのサポート
ランダムアクセスとは、デコード順でビットストリームの最初の画像ではない画像からビットストリームのアクセスとデコーディングを開始することを指す。ブロードキャスト/マルチキャスト及びマルチパーティビデオ会議でのチューニングとチャンネル切り替え、ローカル再生とストリーミングでのシーキング、及びストリーミングでのストリーム適応をサポートするには、ビットストリームに頻繁なランダムアクセスポイントを含める必要があり、これは通常、イントラコーディング画像であるが、インターコード化画像である場合もある(例:段階的なデコーディング更新の場合)。
HEVCには、NALユニットタイプを通じたNALユニットヘッダー内のイントラランダムアクセスポイント(IRAP)画像のシグナリングが含まれる。3種類のIRAP画像、つまり、瞬時デコーダリフレッシュ(IDR)、クリーンランダムアクセス(CRA)、及び切れたリンクアクセス(BLA)画像がサポートされている。IDR画像は、現在のグループオブピクチャ(GOP)より前の画像を参照しないように画像間予測構造を制約しており、従来はクローズドGOPランダムアクセスポイントと呼ばれている。CRA画像は、特定の画像が、ランダムアクセスの場合には全て破棄される現在のGOPより前の画像を参照可能にすることでより制限的でない。CRA画像は従来、オープンGOPランダムアクセスポイントと呼ばれている。BLA画像は通常、ストリーム切り替え中など、CRA画像での2つのビットストリーム又はその一部のスプライシングから生じる。IRAP画像のより良いシステム使用を可能にするために、合計6つの異なるNALユニットが、IRAP画像の特性をシグナリングするために定義されており、これは、HTTP経由の動的アダプティブ ストリーミング(DASH)でのランダムアクセスサポートに利用される、ISOベースメディアファイルフォーマット(ISOBMFF)で定義されているストリームアクセスポイントタイプとよりよくマッチさせるために使用され得る。
VVCは、3種類のIRAP画像、2種類のIDR画像(1種類はRADL画像が関連付けられ、又はもう1種類はRADL画像が関連付けられていない)、及び1種類のCRA画像をサポートしている。これらは基本的にHEVCと同じである。HEVCにおけるBLA画像タイプは、主に次の2つの理由によりVVCには含まれていない。i)BLA画像の基本機能は、CRA画像及びシーケンス終了NALユニットによって実現でき、シーケンス終了NALユニットの存在は、後続の画像がシングルレイヤービットストリームで新しいCVSを開始することを示す。ii)VVCの開発中、NALユニットヘッダーでNALユニットタイプフィールドに6ビットではなく5ビットを使用して示されているように、HEVCよりも少ないNALユニットタイプを指定することが望まれる。
VVCとHEVCのランダムアクセスサポートにおけるもう1つの重要な違いは、VVCではより規範的な方式でGDRがサポートされていることである。GDRでは、ビットストリームのデコーディングはインターコード化画像から開始でき、最初は画像領域全体を正しくデコードできる、いくつかの画像の後には画像領域全体が正しくなる。AVCとHEVCもGDRをサポートしており、GDRランダムアクセスポイント及びリカバリポイントのシグナリングにリカバリポイントSEIメッセージを使用している。VVCでは、GDR画像を示すために新しいNALユニットタイプが指定され、リカバリポイントは画像ヘッダー構文構造でシグナリングされる。CVSとビットストリームはGDR画像から開始することが許可される。これは、ビットストリーム全体に、単一のイントラコード化画像がなく、インターコード化画像のみが含まれることが許可されることを意味する。このようにGDRサポートを指定することの主な利点は、GDRに適合した行動を提供することである。GDRは、エンコーダが、画像全体のイントラコーディングとは対照的に、複数の画像にイントラコード化スライス又はブロックを分散させることでビットストリームのビットレートを平滑化するのを可能にし、これにより、エンドツーエンド遅延を大幅に削減可能になり、ワイヤレスディスプレイ、オンラインゲーム、ドローンベースのアプリケーションなどの超低遅延アプリケーションが普及するにつれて、これは以前よりも重要視されるようになった。
VVCにおける別のGDR関連特徴は、仮想境界シグナリングである。GDR画像とそのリカバリポイント間の画像におけるリフレッシュされた領域(即ち、正しくデコードされた領域)とリフレッシュされていない領域との境界は、仮想境界としてシグナリングされ得、通知されると、境界を越えるループ内フィルタリングは適用されないため、境界又はその近くの一部のサンプルのデコーディングミスマッチは発生しない。これは、アプリケーションがGDRプロセス中に正しくデコードされた領域を表示することを決定した場合に役立つ。
IRAP画像とGDR画像は、まとめてランダムアクセスポイント(RAP)画像と呼ばれる。
2.4 拡張従属ランダムアクセスポイント(EDRAP)ベースのビデオコーディング、ストレージ及びストリーミング
2.4.1 概念及び規格サポート
EDRAPベースのビデオコーディング、ストレージ及びストリーミングの概念を以下の図4~11を参照して説明する。
図4及び図5は、ランダムアクセスポイント(RAP)の既存の概念を示す図である。アプリケーション(例:アダプティブストリーミング)は、例えば、RAP期間1秒又は2秒など、ランダムアクセスポイント(RAP)の頻度を決定する。従来、RAPは、図4に示すように、IRAP画像のコーディングによって提供される。RAP画像間の非キー画像についてのインター予測参照は示されておらず、出力順序は左から右であることに注意されたい。CRA6からランダムアクセスする場合、デコーダは、図5に示すように、画像を受信し、正しくデコードする。
図6及び図7は、従属ランダムアクセスポイント(DRAP)の概念を示す図である。DRAPアプローチは、図6に示すように、DRAP画像(及び後続の画像)がインター予測のために前のIRAP画像を参照するのを許可することで向上されたコーディング効率を提供する。RAP画像間の非キー画像についてのインター予測は示されておらず、出力順序は左から右であることに注意されたい。DRAP6からランダムアクセスする場合、デコーダは図7に示すように画像を受信し、正しくデコードする。
図8及び図9は、拡張従属ランダムアクセスポイント(EDRAP)の概念を示す図である。EDRAPアプローチは、図8に示すように、EDRAP画像(及び後続の画像)が以前のRAP画像(IRAP又はEDRAP)のいくつかを参照するのを許可することでもう少し柔軟性を提供する。RAP画像間の非キー画像についてのインター予測は示されておらず、出力順序は左から右であることに注意されたい。EDRAP6からランダムアクセスする場合、デコーダは図9に示すように画像を受信し、正しくデコードする。
図10及び図11は、EDRAPベースのビデオストリーミングを示す図である。EDRAP6から始まるセグメントからランダムアクセス、又は該セグメントに切り替えると、デコーダは図11に示すようにセグメントを受信してデコードする。
EDRAPベースのビデオコーディングは、VSEI規格の開発中の修正に含まれるEDRAP指示SEIメッセージによってサポートされ、ストレージ部分は、ISOBMFF規格の開発中の修正に含まれるEDRAPサンプルグループ及び関連する外部ストリームトラック参照によってサポートされ、ストリーミング部分は、DASH規格の開発中の修正に含まれるメインストリーム表現(MSR)記述子及び外部ストリーム表現(ESR)記述子によってサポートされる。
2.4.2 EDRAP指示SEIメッセージ
VSEI規格についての修正は開発中である。この修正の最新ドラフト仕様には、EDRAP指示SEIメッセージの仕様が含まれている。
EDRAP指示SEIメッセージの構文とセマンティクスは次のとおりである。
【表1】
拡張DRAP(EDRAP)指示SEIメッセージに関連付けられた画像は、EDRAP画像と呼ばれる。
EDRAP指示SEIメッセージが存在する場合、このサブ条項で指定されている画像順序及び画像参照に関する制約が適用されることを示す。これらの制約により、デコーダは、同じCLVS内にあり、かつedrap_ref_rap_id[ i ]構文要素によって識別されるデコード順のIRAP又はEDRAP画像のリストで構成されるreferenceablePicturesのリストを除いて、同じレイヤー内の他の任意の画像をデコードする必要なく、同じレイヤーにあるEDRAP画像及びデコード順と出力順の両方でそれの後に続く画像を適切にデコードできる。
全て適用されるものとする、EDRAP指示SEIメッセージの存在によって示される制約は、次のとおりである。
- EDRAP画像は、トレーリング画像である。
- EDRAP画像は、0に等しい時間的サブレイヤー識別子を有する。
- EDRAP画像は、referenceablePicturesを除き、参照画像リストのアクティブエントリにおける同じレイヤー内の画像を含まない。
- 同じレイヤーにあり、かつデコード順と出力順の両方でEDRAP画像の後に続く任意の画像は、referenceablePicturesを除き、その参照画像リストのアクティブエントリに、同じレイヤーにあり、かつデコード順又は出力順でEDRAP画像に先行する画像を含まない。
- リストreferenceablePictures内の任意の画像は、その参照画像リストのアクティブエントリに、同じレイヤーにあり、かつリストreferenceablePictures内の前の位置にある画像ではない画像を含まない。
注 - その結果、referenceablePictures内の最初の画像は、IRAP画像ではなくEDRAP画像であっても、その参照画像リストのアクティブエントリに同じレイヤーからの任意の画像を含まない。
edrap_rap_id_minus1プラス1は、EDRAP画像のRAP画像識別子(RapPicIdとして表記)を指定する。
各IRAP又はEDRAP画像には、RapPicId値が関連付けられている。IRAP画像のRapPicId値は0に等しいと推論される。同じIRAP画像に関連付けられている任意の2つのEDRAP画像についてのRapPicId値は異なるものとする。
edrap_leading_pictures_decodable_flagが1に等しい場合、次の制約の両方が適用されることを指定する。
- 同じレイヤーにあり、かつデコード順でEDRAP画像の後に続く任意の画像は、出力順で、同じレイヤーにあり、かつデコード順でEDRAP画像に先行する画像の後に続くものとする。
- 同じレイヤーにあり、かつデコード順でEDRAP画像の後に続き、出力順でEDRAP画像に先行する任意の画像は、その参照画像リストのアクティブエントリに、referenceablePicturesを除き、同じレイヤーにあり、かつデコード順でEDRAPに先行する任意の画像を含まないものとする。
edrap_leading_pictures_decodable_flagが0に等しい場合、このような制約は課されない。
edrap_reserved_zero_12bitsは、この仕様のこのバージョンに準拠するビットストリームでは0に等しいものとする。edrap_reserved_zero_12bitsの他の値は、ITU-T | ISO/IECによる将来の使用のために予備されている。デコーダは、edrap_reserved_zero_12bitsの値を無視するものとする。
edrap_num_ref_rap_pics_minus1プラス1は、EDRAP画像と同じCLVS内にあり、かつEDRAP画像の参照画像リストのアクティブエントリに含まれ得るIRAP又はEDRAP画像の数を示す。
edrap_ref_rap_id[ i ]は、EDRAP画像の参照画像リストのアクティブエントリに含まれ得るi番目のRAP画像のRapPicIdを示す。i番目のRAP画像は、現在のEDRAP画像に関連付けられたIRAP画像、又は現在のEDRAP画像と同じIRAP画像に関連付けられたEDRAP画像のいずれかであるものとする。
2.4.3 EDRAPサンプルグループ及び関連する外部ストリームトラック参照
ISOBMFF規格の修正が開発中である。この修正の最新ドラフト仕様には、EDRAPサンプルグループ及び関連する外部ストリームトラック参照の仕様が含まれている。
これら2つのISOBMFF特徴の仕様は次のとおりである。
3.1 定義
外部基本ストリーム
外部画像を備えるアクセスユニットを含むエレメンタリーストリーム
外部画像
ESTにおける外部エレメンタリーストリームにある画像で、MSTにおける特定のEDRAP画像からランダムアクセスするときに、MSTにおけるエレメンタリーストリームのデコーディングにおいてインター予測参照に必要な画像
外部ストリームトラック(EST)
外部エレメンタリーストリームを含むトラック
メインストリームトラック(MST)ビデオエレメンタリーストリームを含むトラック
3.2 略語
EDRAP 拡張従属ランダムアクセスポイント
EST 外部ストリームトラック
MST メインストリームトラック
8.3.3.4 関連する外部ストリームトラック参照
タイプ「aest」(「関連付けられた外部ストリームトラック」を意味する)のトラック参照が、ESTを参照するMSTに含まれ得る。
MSTにタイプ「aest」のトラック参照がある場合、以下が適用される。
- MSTには、EDRAP画像を含む少なくとも1つのサンプルがあるものとする。
- EDRAP画像を含むMSTにおける各サンプルsampleAに対して、sampleAと同じデコード時間を持つ関連ESTにおける1つのサンプルsampleBのみが存在するものとし、sampleBから開始して、関連付けられたESTにおける連続したサンプルには、sampleAに含まれるEDRAP画像からランダムアクセスするときに必要な全ての外部画像が排他的に含まれているものとする。
EST内の全てのサンプルは、同期(sync)サンプルとして識別されるものとする。ESTトラックヘッダーフラグでは、track_in_movieとtrack_in_previewの両方が0に設定されるものとする。
10.11 拡張DRAP(EDRAP)サンプルグループ
10.11.1 定義
このサンプルグループは、サブ条項10.8で指定されているDRAPサンプルグループに似ているが、より柔軟なクロスRAP参照を可能にする。
EDRAPサンプルは、EDRAPサンプルに先行する最も近い初期サンプルと、EDRAPサンプルよりもデコード順序が早い1つ以上の他の識別されたEDRAPサンプルが参照に利用可能な場合、その後デコード順と出力順の全てのサンプルが正しくデコードされ得るサンプルである。
初期サンプルは、同期サンプル又はSAPサンプルグループによってそのようにマークされたSAPタイプ1、2又は3のSAPサンプルである。例えば、ファイル内の32番目のサンプルがIピクチャで構成される初期サンプルである場合、48番目のサンプルはPピクチャで構成され、EDRAPサンプルグループのメンバーとしてマークされ得、これにより、最初に32番目のサンプルをデコードし(サンプル33~47は無視)、次に48番目のサンプルからデコードを続けることで、48番目のサンプルでランダムアクセスを実行できることを示す。
注:EDRAPサンプルは、タイプ1、2及び3のSAPサンプルと組み合わせてのみ使用できる。これは、先行するSAPサンプルと、EDRAPサンプルよりもデコード順序が早い0個以上の他の識別されたEDRAPサンプルを、EDRAPサンプル及びデコード順と出力順でEDRAPサンプルの後に続くサンプルと連結(concatenating)することにより、デコード可能なサンプルシーケンスを作成する機能を有効にするためである。
サンプルは、次の条件が満たされる場合にのみ、EDRAPサンプルグループのメンバーになることができる。
- EDRAPサンプルは、最も近い先行する初期サンプルと、EDRAPサンプルよりもデコード順序が早い1つ以上の他の識別されたEDRAPサンプルのみを参照する。
- EDRAPサンプルと、デコード順及び出力順でEDRAPサンプルに続く全てのサンプルは、Syncサンプル又はSAPサンプルグループとしてマークされたタイプ1、2又は3の最も近い先行SAPサンプルをデコードした後、及びデコード順でEDRAPサンプルより前の0個以上の他の識別されたEDRAPサンプルをデコードした後に、EDRAPサンプルでデコードを開始すると、正しくデコードされ得る。
10.11.2 構文
【数1】
10.11.3 セマンティクス
edrap_typeは非負整数である。edrap_typeが1から3の範囲にある場合、最も近い先行SAP又は他のEDRAPサンプルに依存していなかったら、EDRAPサンプルが対応したであろうSAP_type(付録Iで指定)を示す。その他のタイプの値は予備されている。
num_ref_edrap_picsは、EDRAPサンプルよりもデコード順序が早く、EDRAPサンプルからデコードを開始するときに、EDRAPサンプル及びデコード順と出力順の両方でEDRAPサンプルの後に続く全てのサンプルを正しくデコードできるようにするための参照に必要である、他のEDRAPサンプルの数を示す。
reservedは0に等しいものとする。このサブ条項のセマンティクスは、予備済みのものが0に等しいサンプルグループ記述エントリにのみ適用される。パーサーは、このサンプルグループを解析するときに、予備済みのものが0より大きいサンプルグループ記述エントリを許可し、無視するものとする。
ref_edrap_idx_delta[i]は、このEDRAPサンプルのサンプルグループインデックス(即ち、デコード順でこのサンプルグループ内の全てのサンプルのリストへのインデックス)と、EDRAPサンプルよりもデコード順が早く、このEDRAPサンプルからデコードを開始するときに、EDRAPサンプル及びデコード順と出力順の両方でEDRAPサンプルの後に続く全てのサンプルを正しくデコードできるようにするための参照に必要である、i番目のRAPサンプルのサンプルグループインデックスとの差を示す。
ISOBMFFでのサンプルエントリタイプ変換
ISOBMFFには、保護されるコンテンツ又はレンダリング前に特別なポストデコーダ処理要件を必要とするタイプのコンテンツのサンプルエントリの変換を可能にする特徴が含まれている。このようなポストデコーダ処理要件の例には、立体視ビデオサポートのフレームパッキング及び全方向又は360度ビデオサポートについての投影が含まれる。
ファイル作成者がプレーヤー又はレンダラーで特定のアクションを必要とする状況に対処するために、ISOBMFFには、プレーヤーが単にファイルを検査するだけでビットストリームのレンダリングの要件を見つけることを可能にし、さらなる処理が必要なファイルをレガシープレイヤー(legacy players)がデコードしてレンダリングするのを阻止するメカニズムが含まれている。このメカニズムは、任意のタイプのビデオコーデックに適用される。
このメカニズムは、サンプルエントリが汎用サンプルエントリ「encv」、「enca」などの背後に隠され、暗号化又はカプセル化されたメディアを示すコンテンツ保護変換に似ている。制限されたビデオの類似メカニズムでは、汎用サンプルエントリ「resv」による変換を使用する。この方法は、コンテンツを正しく表示するプレーヤーのみがデコードすべきである場合に適用され得る。
制限されたサンプルエントリ変換と関連するシグナリングは、次のように指定される。
2.5.1 制限されたサンプルエントリ変換
制限されたサンプルエントリは、次の変換手順が適用されたサンプルエントリとして定義される。
1) サンプルエントリの4文字コードが、制限されたビデオを意味するサンプルエントリコード「resv」に置き換えられる。
2) サンプル記述にRestrictedSchemeInfoBoxが追加され、他の全てのボックスは変更されない。
3) オリジナルサンプルエントリタイプは、RestrictedSchemeInfoBoxに含まれるOriginalFormatBox内に保存される。
RestrictedSchemeInfoBoxは、識別子「sinf」の代わりに「rinf」を使用する点を除いて、ProtectionSchemeInfoBoxとまったく同じ形式でフォーマットされる(下記参照)。
オリジナルサンプルエントリタイプは、(暗号化されたメディアについてのProtectionSchemeInfoBoxと同じ方式で)RestrictedSchemeInfoBoxに位置するOriginalFormatBoxに含まれている。
制限の正確な性質はSchemeTypeBoxで定義され、そのスキームに必要なデータは、また 、保護情報と類似的にSchemeInformationBoxに保存される。
制限及び保護は同時に適用され得る。変換の順序は、サンプルエントリの4文字コードに従う。例えば、サンプルエントリタイプが「resv」の場合、上記の変換を元に戻すと、サンプルエントリタイプが「encv」になり、メディアが保護されていることを示す。
ファイル作成者が、レガシープレイヤーによるファイルの再生を妨げずにアドバイス情報のみを提供したい場合、4文字コードを変換せずに、RestrictedSchemeInfoBoxがサンプルエントリ内に配置され得る。この場合、OriginalFormatBoxを含める必要はない。
2.5.2 制限付きスキーム情報ボックス
2.5.2.1 定義
ボックスタイプ: 「rinf」
コンテナー: 制限されたサンプルエントリ又はサンプルエントリ
必須: 制限されたサンプルエントリの場合ははい、それ以外の場合はいいえ
数量: 0又は1
RestrictedSchemeInfoBoxには、適用される制限スキームとそのパラメータの両方を理解するために必要な全ての情報が含まれている。また、メディアのオリジナル(変換されていない)サンプルエントリタイプも記録される。RestrictedSchemeInfoBoxはコンテナボックスである。制限されたストリームを示すコード(即ち、「resv」)を使用するサンプルエントリでは必須である。
制限されたサンプルエントリで使用する場合、このボックスには、オリジナルサンプルエントリタイプを記録するOriginalFormatBoxとSchemeTypeBoxが含まれるものとする。制限スキームによっては、SchemeInformationBoxが必要になり得る。
2.5.2.2 構文
【数2】
2.5.3 スキームタイプボックス
2.5.3.1 定義
ボックスタイプ: 「schm」
コンテナー: ProtectionSchemeInfoBox、RestrictedSchemeInfoBox、又はSRTPProcessBox
必須: いいえ
数量: 「sinf」では保護構造に応じて0又は1。「rinf」及び「srpp」ででは正確に1。
SchemeTypeBoxは、保護又は制限スキームを識別する。
2.5.3.2 構文
【数3】
2.5.3.3 セマンティクス
scheme_typeは、保護又は制限スキームを定義するコードで、通常は4文字コードとして表される。
scheme_versionは、スキームのバージョンである(コンテンツの作成に使用される)。
scheme_URIは、システムにスキームがインストールされていない場合にユーザをWebページに案内するオプションを許す絶対URIである。
2.5.4 スキーム情報ボックス
2.5.4.1 定義
ボックスタイプ: 「schi」
コンテナー: ProtectionSchemeInfoBox、RestrictedSchemeInfoBox、又はSRTPProcessBox
必須: いいえ
数量: 0又は1
SchemeInformationBoxは、使用されているスキームによってのみ解釈されるコンテナボックスである。暗号化又は制限システムに必要な任意の情報はここに保存される。このボックスのコンテンツは、SchemeTypeBoxで宣言されたスキームによってタイプ及びフォーマットが定義される一連のボックスである。
2.5.4.2 構文
【数4】
2.5.5 オリジナルフォーマットボックス
2.5.5.1 定義
ボックスタイプ: 「frma」
コンテナー: ProtectionSchemeInfoBox、RestrictedSchemeInfoBox、又はCompleteTrackInfoBox
必須: 保護されたサンプルエントリ、制限されたサンプルエントリ、又は不完全なトラックについてのサンプルエントリで使用される場合、はい。
数量: 正確に1。
OriginalFormatBoxには、変換されていないオリジナルサンプル記述の4文字コードが含まれる。
2.5.5.2 構文
【数5】
2.5.5.3 セマンティクス
data_フォーマットは、変換されていないオリジナルサンプルエントリの4文字コードである(例:ストリームに保護又は制限されたMPEG-4ビジュアルマテリアルが含まれている場合は、「mp4v」)。
3. 問題点
EDRAPベースのビデオコーディング、ストレージ、ストリーミングのストレージ部分についての既存の設計に関係する問題が1つある。外部ストリームトラック(EST)のサンプルには、複数のコード化画像があり得る。したがって、通常のビデオサンプルエントリタイプ(例:VCCサンプルエントリタイプ又はHEVCサンプルエントリタイプ)をESTに使用すると、各サンプルにコード化画像が1つだけ含まれるものとするという通常の要件に違反することになる。
4. 詳細なソリューション
上記の問題を解決するために、以下に要約するような方法が開示される。これらのソリューションは、一般的な概念を説明するための例として考慮されるべきであり、狭義に解釈されるべきではない。さらに、これらのソリューションは、個別に適用されるか、又は任意の方式で組み合わせて適用され得る。
1) 一例では、通常のビデオサンプルエントリタイプを隠すために、新しい制限付きスキームタイプ(例:「aest」)を使用するサンプルエントリタイプ変換。次の1つ以上が適用される。
a. サンプルエントリの4文字コードは、サンプルエントリコード「resv」である。
b. 通常のビデオサンプルエントリタイプは、RestrictedSchemeInfoBoxに含まれるOriginalFormatBox内に保存される。
c. RestrictedSchemeInfoBoxにあるSchemeTypeBox内のscheme_typeフィールドは、トラックにおけるサンプルに複数のコード化画像が含まれ得ることを示す値に等しい。
i. 一例では、scheme_typeフィールドの値は「aest」に等しい。
d. SchemeTypeBoxのフラグフィールドのBit 0は0に等しく、(flags & 0x000001)の値が0に等しくなる。
e. 一例では、さらに、ESTに関連する情報を含むために、例えば、EsternalStreamInfoBoxという新しいボックスが指定される。新しいボックスには、次のフィールドが1つ以上含まれ得る。
i. ESTに関連付けられたメインストリームトラック(MST)のトラックIDを示すフィールド。
ii. ESTにおける任意のサンプル内のコード化画像の最大数を示すフィールド。
iii. ESTにおける各サンプルの最初のコード化画像がIRAP画像であるか否かを示すフィールド。
iv. ESTにおける各サンプルに、サンプル内のコード化画像のデコーディングに必要な全てのパラメータセットが含まれているか否かを示すフィールド。
v. EST内の各サンプルに対して、EDRAP指示SEIメッセージ内の対応するedrap_leading_pictures_decodable_flagが1に等しい場合に、関連付けられたMST内の対応するEDRAP画像が制約を満たすか否かを示すフィールド。
5. 実施形態
(外1)
5.1 第1の実施形態
この実施形態は、項目1.e及びその全てのサブ項目を除く項目1及びその全てのサブ項目を対象とする。
8.3.3.4 関連する外部ストリームトラック参照
タイプ「aest」(「関連する外部ストリームトラック」を意味する)のトラック参照は、ESTを参照するMSTに含まれ得る。
MSTにタイプ「aest」のトラック参照がある場合、以下が適用される。
- MSTは、EDRAP画像を含むサンプルを少なくとも1つ有するべきである。
- EDRAP画像を含むMST内の各サンプルsampleAに対して、関連するEST内にsampleAと同じデコード時間を持つサンプルsampleBが1つだけ存在するものとし、sampleBから開始して、関連するEST内の多数の連続したサンプルには、sampleAに含まれるEDRAP画像からランダムアクセスするときに必要な全ての外部画像が排他的に含まれるものとする。
EST内の全てのサンプルは、同期サンプルとして識別されるものとする。ESTトラックヘッダーフラグでは、track_in_movieとtrack_in_previewの両方が0に設定されるものとする。
ESTごとに、次のように制限付きスキームが使用されるものとする。
1) サンプルエントリの4文字コードは、サンプルエントリコード「resv」である。
2) 通常のビデオサンプルエントリタイプは、RestrictedSchemeInfoBoxに含まれるOriginalFormatBox内に保存される。
3) RestrictedSchemeInfoBoxにあるSchemeTypeBoxのスキームタイプフィールドは「aest」に等しく、トラック内のサンプルに複数のコード化画像が含まれ得ることを示す。
4) SchemeTypeBoxのフラグフィールドのBit 0は0に等しく、(flags & 0x000001)の値が0に等しくなる。
【0072】
メディアファイル内の外部ストリームトラックのシグナリングに関連する本開示の実施形態のさらなる詳細を以下で説明する。本開示の実施形態は、一般的な概念を説明するための例として考えるべきであり、狭義に解釈されるべきではない。さらに、これらの実施形態は、個別にか、又は任意の方式で組み合わせて適用され得る。
【0073】
本明細書で使用されるように、「サンプル」という用語は、単一の時間に関連付けられた全てのデータを指し得る。「サンプルエントリ」という用語は、トラックにおけるいくつかのサンプルのフォーマットを定義及び記述する構造を指し得る。「トラック」という用語は、関連するサンプルのタイミングシーケンスを指し得る。「ボックス」という用語は、一意のタイプ識別子及び長さによって定義されるオブジェクト指向のビルディングブロックを指し得る。
【0074】
図12は、本開示のいくつかの実施形態によるビデオ処理の方法1200のフローチャートを示す。方法1200は、クライアント又はサーバで具現され得る。ここで使用される「クライアント」という用語は、コンピュータネットワークのクライアントサーバモデルの一部としてサーバによって提供されるサービスにアクセスするコンピューターハードウェア又はソフトウェアを指し得る。例として、クライアントはスマートフォン又はタブレットである。ここで使用される「サーバ」という用語は、コンピューティングの能力があるデバイスを指し得、その場合、クライアントはネットワークを通ってサービスにアクセスする。サーバは、物理的なコンピューティングデバイス又は仮想的なコンピューティングデバイスであり得る。
【0075】
図12に示すように、1202では、ビデオのビットストリームと前記ビデオのメディアファイルとの間の転換が実行される。メディアファイルは、ファイルフォーマット(例:国際標準化機構(ISO)ベースのメディアファイルフォーマット)のコンテキストでメディアコンテンツの有界又は無界のプレゼンテーションを確立するデータの収集である。いくつかの実施形態では、転換は、メディアファイルを生成し、ビットストリームをメディアファイルに記憶することを含み得る。追加的に又は代替的に、転換は、メディアファイルを解析してビットストリームを再構築することを含み得る。
【0076】
いくつかの実施形態では、メディアファイルは、外部ストリームトラックを含む。例えば、EDRAPベースのビデオ処理のコンテキストでは、外部ストリームトラックは対応するメインストリームトラックによって参照され得る。外部ストリームトラックはサンプルのセットを含む。サンプルのセットについてのサンプルエントリのサンプルエントリタイプは、制限付きスキームに基づいてカプセル化される。限定ではなく例として、制限付きスキームを使用したサンプルエントリ変換を適用してサンプルエントリタイプを非表示にし得る。サンプルエントリタイプは、サンプルエントリのオリジナルサンプルエントリタイプであり得る。サンプルエントリタイプは、サンプルエントリの現在のサンプルエントリタイプなど、他の任意のサンプルエントリタイプであり得ることを理解すべきである。本開示の範囲は、この点に限定されない。
【0077】
その上、前記サンプルエントリは、前記制限付きスキームに関連付けられた指示を含み、前記指示の値は、前記サンプルのセット内のサンプルが前記外部ストリームトラックの複数のコード化画像を含むことが許可されることを示す。限定ではなく例として、前記サンプルエントリは、制限付きスキームに関する情報を含む第1のデータ構造(例:制限付きスキーム情報ボックス、RestrictedSchemeInfoBoxとも表記)を含み得る。前記第1のデータ構造は、前記制限付きスキームを識別する第2のデータ構造(例:スキームタイプボックス、SchemeTypeBoxとも表記)を含み得る。
【0078】
さらに、前記指示は、第2のデータ構造内の第1のフィールド(例:スキームタイプフィールド、scheme_type fieldとも表記)を含み得る。一例では、第1のフィールドの値は、「aest」などの所定のコードに等しくてよい。トラックに対して、所定の値に等しいスキームタイプフィールドを持つ制限付きスキームが使用されている場合、サンプルエントリに関連付けられたサンプルには、オリジナルトラックの複数のサンプルが含まれ得る。所定のコードは、例えば「spkt」など、他の任意の適切なコードであり得ることを理解すべきてある。また、上記の解説及び/又は例は、説明の目的でのみ記載されていることを理解すべきである。本開示の範囲は、この点に限定されない。
【0079】
上記を考慮して、新しい制限付きスキームが、外部ストリームトラックにおけるサンプルに複数のコード化画像を含めることが許されることを示すために採用される。従来のソリューションと比較して、提案された方法は、EDRAPベースの技術をより効率的にサポートできるという利点がある。
【0080】
いくつかの実施形態では、制限付きスキームの統一資源識別子(URI)がメディアファイルに存在しなくてよい。例えば、サンプルエントリは、制限付きスキームに関する情報を含む第1のデータ構造(例:制限付きスキーム情報ボックス)を含み得、第1のデータ構造は、制限付きスキームを識別する第2のデータ構造(例:スキームタイプボックス)を含み得る。第2のデータ構造内のフラグフィールドの最下位ビット(即ち、Bit 0)の値は0に等しくてよい。
【0081】
いくつかの実施形態では、サンプルエントリタイプは、「resv」などの所定のサンプルエントリコードでカプセル化され得る。追加的に、前記サンプルエントリは、制限付きスキームに関する情報を含む第1のデータ構造(例:制限付きスキーム情報ボックス)を含み得る。前記第1のデータ構造は、前記サンプルエントリタイプを記憶する第3のデータ構造(例:オリジナルフォーマットボックス、OriginalFormatBoxとも表記)を含み得る。
【0082】
いくつかの追加的又は代替的の実施形態では、メディアファイルは、外部ストリームトラックに関連付けられた情報を含む第4のデータ構造(例:外部ストリーム情報ボックス、EsternalStreamInfoBoxとも表記)を含み得る。限定ではなく例として、第4のデータ構造は、(1)前記外部ストリームトラックに関連付けられたメインストリームトラックのトラックアイデンティティ(ID)を示すフィールド、(2)前記外部ストリームトラックにおけるサンプル内のコード化画像の最大許容数を示すフィールド、(3)前記外部ストリームトラックにおける各サンプル内の最初のコード化画像がイントラランダムアクセスポイント(IRAP)画像であり得るか否かを示すフィールドであって、前記最初のコード化画像がそれぞれのサンプル内の最初の位置にある、フィールド、(4)前記外部ストリームトラックにおける各サンプルがそれぞれのサンプル内のコード化画像のデコーディングに必要な全てのパラメータセットを含むか否かを示すフィールド、又は、(5)前記外部ストリームトラックについて、デコーディングプロセスがEDRAP画像から開始されるときに、前記外部ストリームトラックに関連付けられたメインストリームトラックにおける対応するEDRAP画像の先頭画像がデコード可能か否かを示すフィールドとのうちの少なくとも1つを含み得る。
【0083】
いくつかの実施形態では、以下の2つの制約が満たされる場合、外部ストリームトラックに関連付けられたメインストリームトラックにおける対応するEDRAP画像の先頭画像は、デコーディングプロセスがEDRAP画像から開始されるときにデコード可能である。(1)同じレイヤーにあり、かつデコード順でEDRAP画像の後に続く任意の画像は、出力順で、同じレイヤーにあり、かつデコード順でEDRAP画像に先行する画像の後に続くものとする。(2)同じレイヤーにあり、かつデコード順でEDRAP画像の後に続き、出力順でEDRAP画像に先行する任意の画像は、その参照画像リストのアクティブエントリに、referenceablePicturesを除き、同じレイヤーにあり、デコード順でEDRAP画像に先行する任意の画像を含まないものとする。
【0084】
本開示の実施形態によれば、非一時的なコンピュータ読み取り可能な記録媒体が提案される。ビデオのビットストリームは、前記非一時的なコンピュータ読み取り可能な記録媒体に記憶される。前記ビットストリームは、ビデオ処理装置によって実行される方法によって生成され得る。前記方法によれば、ビットストリームとビデオのメディアファイルとの間の転換が実行される。前記メディアファイルは、サンプルのセットを含む外部ストリームトラックを含む。前記サンプルのセットについてのサンプルエントリのサンプルエントリタイプは、制限付きスキームに基づいてカプセル化される。前記サンプルエントリは、前記制限付きスキームに関連付けられた指示を含み、前記指示の値は、前記サンプルのセット内のサンプルが前記外部ストリームトラックの複数のコード化画像を含むことが許可されることを示す。
【0085】
本開示の実施形態によれば、ビデオのビットストリームを記憶する方法が提案される。前記方法では、ビデオのビットストリームとメディアファイルとの間の転換が実行される。前記メディアファイルは、サンプルのセットを含む外部ストリームトラックを含む。前記サンプルのセットについてのサンプルエントリのサンプルエントリタイプは、制限付きスキームに基づいてカプセル化される。前記サンプルエントリは、前記制限付きスキームに関連付けられた指示を含み、前記指示の値は、前記サンプルのセット内のサンプルが前記外部ストリームトラックの複数のコード化画像を含むことが許可されることを示す。さらに、前記ビットストリームは、非一時的なコンピュータ読み取り可能な記録媒体に記憶される。
【0086】
本開示の実施形態によれば、別の非一時的なコンピュータ読み取り可能な記録媒体が提案される。ビデオのメディアファイルは、前記非一時的なコンピュータ読み取り可能な記録媒体に記憶される。前記ビットストリームは、ビデオ処理装置によって実行される方法によって生成され得る。前記方法によれば、ビデオのビットストリームとメディアファイルとの間の転換が実行される。前記メディアファイルは、サンプルのセットを含む外部ストリームトラックを含む。サンプルのセットについてのサンプルエントリのサンプルエントリタイプは、制限付きスキームに基づいてカプセル化される。前記サンプルエントリは、前記制限付きスキームに関連付けられた指示を含み、前記指示の値は、前記サンプルのセット内のサンプルが前記外部ストリームトラックの複数のコード化画像を含むことが許可されることを示す。
【0087】
本開示の実施形態によれば、ビデオのメディアファイルを記憶する方法が提案される。前記方法では、ビデオのビットストリームとメディアファイルとの間の転換が実行される。前記メディアファイルは、サンプルのセットを含む外部ストリームトラックを含む。前記サンプルのセットについてのサンプルエントリのサンプルエントリタイプは、制限付きスキームに基づいてカプセル化される。前記サンプルエントリは、前記制限付きスキームに関連付けられた指示を含み、前記指示の値は、前記サンプルのセット内のサンプルが前記外部ストリームトラックの複数のコード化画像を含むことが許可されることを示す。さらに、前記メディアファイルは、非一時的なコンピュータ読み取り可能な記録媒体に記憶される。
【0088】
本開示の具現は、以下の条項を考慮して説明され得、その特徴は任意の合理的な方式で組み合わされ得る。
【0089】
条項1.ビデオ処理方法であって、ビデオのビットストリームと前記ビデオのメディアファイルとの間の転換を実行するステップを含み、ここで、前記メディアファイルは、サンプルのセットを含む外部ストリームトラックを含み、前記サンプルのセットについてのサンプルエントリのサンプルエントリタイプは、制限付きスキームに基づいてカプセル化され、前記サンプルエントリは、前記制限付きスキームに関連付けられた指示を含み、前記指示の値は、前記サンプルのセット内のサンプルが前記外部ストリームトラックの複数のコード化画像を含むことが許可されることを示す、方法。
【0090】
条項2.前記サンプルエントリタイプは、オリジナルサンプルエントリタイプである、条項1に記載の方法。
【0091】
条項3.前記サンプルエントリは、前記制限付きスキームに関する情報を含む第1のデータ構造を含み、前記第1のデータ構造は、前記制限付きスキームを識別する第2のデータ構造を含み、前記指示は、前記第2のデータ構造内の第1のフィールドを含む、条項1又は2のいずれか一項に記載の方法。
【0092】
条項4.前記第1のデータ構造は、制限付きスキーム情報ボックスであり、前記第2のデータ構造は、スキームタイプボックスであり、前記第1のフィールドは、スキームタイプフィールドである、条項3に記載の方法。
【0093】
条項5.前記第1のフィールドの値は所定のコードに等しい、条項3又は4のいずれか一項に記載の方法。
【0094】
条項6.前記制限付きスキームの統一資源識別子(URI)は、前記メディアファイルに存在しない、条項1から5のいずれか一項に記載の方法。
【0095】
条項7.前記サンプルエントリは、前記制限付きスキームに関する情報を含む第1のデータ構造を含み、前記第1のデータ構造は、前記制限付きスキームを識別する第2のデータ構造を含み、前記第2のデータ構造内のフラグフィールドの最下位ビットの値は0に等しい、条項1から6のいずれか一項に記載の方法。
【0096】
条項8.前記第1のデータ構造は、制限付きスキーム情報ボックスであり、前記第2のデータ構造は、スキームタイプボックスである、条項7に記載の方法。
【0097】
条項9.前記サンプルエントリタイプは、所定のサンプルエントリコードでカプセル化される、条項1から8のいずれか一項に記載の方法。
【0098】
条項10.前記サンプルエントリは、前記制限付きスキームに関する情報を含む第1のデータ構造を含み、前記第1のデータ構造は、前記サンプルエントリタイプを記憶する第3のデータ構造を含む、条項1から9のいずれか一項に記載の方法。
【0099】
条項11.前記第1のデータ構造は、制限付きスキーム情報ボックスであり、前記第3のデータ構造は、オリジナルフォーマットボックスである、条項10に記載の方法。
【0100】
条項12.前記メディアファイルは、前記外部ストリームトラックに関連付けられた情報を含む第4のデータ構造を含む、条項1から11のいずれか一項に記載の方法。
【0101】
条項13.前記第4のデータ構造は、前記外部ストリームトラックに関連付けられたメインストリームトラックのトラックアイデンティティ(ID)を示すフィールド、前記外部ストリームトラックにおけるサンプル内のコード化画像の最大許容数を示すフィールド、前記外部ストリームトラックにおける各サンプル内の最初のコード化画像がイントラランダムアクセスポイント(IRAP)画像であるか否かを示すフィールドであって、前記最初のコード化画像がそれぞれのサンプル内の最初の位置にある、フィールド、前記外部ストリームトラックにおける各サンプルがそれぞれのサンプル内のコード化画像のデコーディングに必要な全てのパラメータセットを含むか否かを示すフィールド、又は、前記外部ストリームトラックにおける各サンプルについて、デコーディングプロセスが前記EDRAP画像から開始されるときに、前記外部ストリームトラックに関連付けられたメインストリームトラックにおける対応する拡張従属ランダムアクセスポイント(EDRAP)画像の先頭画像がデコード可能か否かを示すフィールド、のうちの少なくとも1つを含む、条項12に記載の方法。
【0102】
条項14.前記第4のデータ構造は、外部ストリーム情報ボックスである、条項1から13のいずれか一項に記載の方法。
【0103】
条項15.前記メディアファイルは、国際標準化機構(ISO)ベースのメディアファイルフォーマットである、条項1から14のいずれか一項に記載の方法。
【0104】
条項16.前記転換は、前記メディアファイルを生成し、前記ビットストリームを前記メディアファイルに記憶することを含む、条項1から15のいずれか一項に記載の方法。
【0105】
条項17.前記転換は、前記メディアファイルを解析して前記ビットストリームを再構築することを含む、条項1から15のいずれか一項に記載の方法。
【0106】
条項18.プロセッサと命令が記録された非一時的メモリとを含む、ビデオデータを処理する装置であって、前記命令は前記プロセッサによって実行されると、前記プロセッサに条項1から17のいずれか一項に記載の方法を実行させる、装置。
【0107】
条項19.プロセッサに条項1から17のいずれか一項に記載の方法を実行させる命令を記憶する非一時的なコンピュータ読み取り可能な記憶媒体。
【0108】
条項20.ビデオ処理装置によって実行される方法によって生成されたビデオのビットストリームを格納する非一時的なコンピュータ読み取り可能な記録媒体であって、前記方法は、前記ビットストリームと前記ビデオのメディアファイルとの間の転換を実行するステップを含み、ここで、前記メディアファイルは、サンプルのセットを含む外部ストリームトラックを含み、前記サンプルのセットについてのサンプルエントリのサンプルエントリタイプは、制限付きスキームに基づいてカプセル化され、前記サンプルエントリは、前記制限付きスキームに関連付けられた指示を含み、前記指示の値は、前記サンプルのセット内のサンプルが前記外部ストリームトラックの複数のコード化画像を含むことが許可されることを示す、方法。
【0109】
条項21.ビデオのビットストリームを記憶する方法であって、前記ビットストリームと前記ビデオのメディアファイルとの間の転換を実行するステップと、前記ビットストリームを非一時的なコンピュータ読み取り可能な記録媒体に記憶するステップと、を含み、ここで、前記メディアファイルは、サンプルのセットを含む外部ストリームトラックを含み、前記サンプルのセットについてのサンプルエントリのサンプルエントリタイプは、制限付きスキームに基づいてカプセル化され、前記サンプルエントリは、前記制限付きスキームに関連付けられた指示を含み、前記指示の値は、前記サンプルのセット内のサンプルが前記外部ストリームトラックの複数のコード化画像を含むことが許可されることを示す、方法。
【0110】
条項22.ビデオ処理装置によって実行される方法によって生成されたビデオのメディアファイルを記憶する非一時的な非一時的なコンピュータ読み取り可能な記録媒体であって、前記方法は、前記ビデオのビットストリームと前記メディアファイルとの間の転換を実行するステップを含み、ここで、前記メディアファイルは、サンプルのセットを含む外部ストリームトラックを含み、前記サンプルのセットについてのサンプルエントリのサンプルエントリタイプは、制限付きスキームに基づいてカプセル化され、前記サンプルエントリは、前記制限付きスキームに関連付けられた指示を含み、前記指示の値は、前記サンプルのセット内のサンプルが前記外部ストリームトラックの複数のコード化画像を含むことが許可されることを示す、非一時的なコンピュータ読み取り可能な記録媒体。
【0111】
条項23.ビデオのメディアファイルを記憶する方法であって、前記ビデオのビットストリームと前記メディアファイルとの間の転換を実行するステップと、前記メディアファイルを非一時的なコンピュータ読み取り可能な記録媒体に記憶するステップと、を含み、ここで、前記メディアファイルは、サンプルのセットを含む外部ストリームトラックを含み、前記サンプルのセットについてのサンプルエントリのサンプルエントリタイプは、制限付きスキームに基づいてカプセル化され、前記サンプルエントリは、前記制限付きスキームに関連付けられた指示を含み、前記指示の値は、前記サンプルのセット内のサンプルが前記外部ストリームトラックの複数のコード化画像を含むことが許可されることを示す、方法。
【0112】
例示的なデバイス
図13は、本開示の様々な実施形態を具現できるコンピューティングデバイス1300のブロック図を示す。コンピューティングデバイス1300は、ソースデバイス110(或いは、ビデオエンコーダ114又は200)又は宛先デバイス120(或いは、ビデオデコーダ124又は300)として具現されるか、又はそれに含まれ得る。
【0113】
図13に示されるコンピューティングデバイス1300は、単に解説を目的としたものであり、本開示の実施形態の機能及び範囲をいかなる形でも制限することを示唆するものではないことが理解されるだろう。
【0114】
図13に示すように、コンピューティングデバイス1300は、汎用コンピューティングデバイス1300を含む。コンピューティングデバイス1300は、少なくとも1つ又は複数のプロセッサ又は処理ユニット1310と、メモリ1320と、記憶ユニット1330と、1つ又は複数の通信ユニット1340と、1つ又は複数の入力デバイス1350と、1つ又は複数の出力デバイス1360とを含み得る。
【0115】
いくつかの実施形態では、コンピューティングデバイス1300は、コンピューティング能力を有する任意のユーザ端末又はサーバ端末として具現され得る。前記サーバ端末は、サービスプロバイダが提供するサーバや大規模コンピューティングデバイスなどであり得る。前記ユーザ端末は、例えば、携帯電話、ステーション、ユニット、デバイス、マルチメディアコンピュータ、マルチメディアタブレット、インターネットノード、コミュニケータ、デスクトップコンピュータ、ラップトップコンピュータ、ノートブックコンピュータ、ネットブックコンピュータ、タブレットコンピュータ、パーソナルコミュニケーションシステム(PCS)デバイス、パーソナルナビゲーションデバイス、携帯情報端末(PDA)、オーディオ/ビデオプレーヤー、デジタルカメラ/ビデオカメラ、測位デバイス、テレビ受信機、ラジオ放送受信機、電子ブックデバイス、ゲームデバイス、又はそれらの任意の組み合わせ(これらのデバイスのアクセサリ及び周辺機器、又はそれらの任意の組み合わせを含む)を含む、任意のタイプの移動端末、固定端末、又は携帯端末であり得る。コンピューティングデバイス1300は、ユーザに対する任意のタイプのインターフェース(「ウェアラブル」回路など)をサポートできることが考えられる。
【0116】
処理ユニット1310は、物理又は仮想プロセッサであり得、メモリ1320に記憶されたプログラムに基づいて様々なプロセスを具現することができる。マルチプロセッサシステムでは、コンピューティングデバイス1300の並列処理能力を向上させるために、複数の処理ユニットがコンピュータ実行可能命令を並列に実行する。処理ユニット1310は、中央処理ユニット(CPU)、マイクロプロセッサ、コントローラ又はマイクロコントローラと呼ばれても良い。
【0117】
コンピューティングデバイス1300は、通常、様々なコンピュータ記憶媒体を含む。このような媒体は、揮発性及び不揮発性媒体、又は取り外し可能及び取り外し不可能な媒体を含むがこれらに限定されない、コンピューティングデバイス1300によってアクセス可能な任意の媒体であり得る。メモリ1320は、揮発性メモリ(例えば、レジスタ、キャッシュ、ランダムアクセスメモリ(RAM))、不揮発性メモリ(例えば、読み取り専用メモリ(ROM)、電気的に消去可能なプログラム可能な読み取り専用メモリ(EEPROM)、フラッシュメモリ)、又はそれらの任意の組み合わせであり得る。記憶ユニット1330は、任意の取り外し可能又は取り外し不可能な媒体であり得、情報及び/又はデータを記憶するために使用でき、コンピューティングデバイス1300でアクセスできる、メモリ、フラッシュメモリドライブ、磁気ディスク又は別の他の媒体などの機械読み取り可能な媒体を含み得る。
【0118】
コンピューティングデバイス1300は、追加の取り外し可能/取り外し不可能、揮発性/不揮発性メモリ媒体をさらに含み得る。なお、図13には示していないが、着脱可能な不揮発性磁気ディスクの読み書きを行う磁気ディスクドライブや、着脱可能な不揮発性光ディスクの読み書きを行う光ディスクドライブを提供することが可能である。このような場合、各ドライブは、1つ又は複数のデータ媒体インターフェースを介してバス(図示せず)に接続され得る。
【0119】
通信ユニット1340は、通信媒体を介してさらなるコンピューティングデバイスと通信する。その上、コンピューティングデバイス1300内のコンポーネントの機能は、通信接続を介して通信できる単一のコンピューティングクラスタ又は複数のコンピューティングマシンによって具現され得る。したがって、コンピューティングデバイス1300は、1つ又は複数の他のサーバ、ネットワーク化されたパーソナルコンピュータ(PC)、又はさらなる一般的なネットワークノードとの論理接続を使用して、ネットワーク化された環境で動作することができる。
【0120】
入力デバイス1350は、マウス、キーボード、トラッキングボール、音声入力デバイスなどの様々な入力デバイスのうちの1つ又は複数であり得る。出力デバイス1360は、ディスプレイ、ラウドスピーカ、プリンタなどの様々な出力デバイスのうちの1つ又は複数であり得る。通信ユニット1340によって、コンピューティングデバイス1300は、記憶デバイス及び表示デバイスなどの1つ又は複数の外部デバイス(図示せず)とさらに通信することができ、1つ又は複数のデバイスにより、ユーザがコンピューティングデバイス1300と対話可能にするか、又は、必要に応じて、任意のデバイス(ネットワークカード、モデムなど)により、コンピューティングデバイス1300が1つ又は複数の他のコンピューティングデバイスと通信可能にする。このような通信は、入力/出力(I/O)インターフェース(図示せず)を介して実行され得る。
【0121】
いくつかの実施形態では、単一のデバイスに統合される代わりに、コンピューティングデバイス1300のいくつかの又は全てのコンポーネントがクラウドコンピューティングアーキテクチャに配置され得る。クラウドコンピューティングアーキテクチャでは、コンポーネントは遠隔的に提供され、連携して本開示で説明される機能を実施し得る。いくつかの実施形態では、クラウドコンピューティングは、コンピューティング、ソフトウェア、データアクセス及びストレージサービスを提供し、これらのサービスを提供するシステム又はハードウェアの物理的な位置又は構成をエンドユーザが認識する必要はない。様々な実施形態において、クラウドコンピューティングは、適切なプロトコルを使用して広域ネットワーク(インターネットなど)を介してサービスを提供する。例えば、クラウドコンピューティングプロバイダーは、Webブラウザ又はその他のコンピューティングコンポーネントを通じてアクセスできる広域ネットワーク経由でアプリケーションを提供する。クラウドコンピューティングアーキテクチャのソフトウェア又はコンポーネント及び対応するデータは、遠隔地にあるサーバに保存され得る。クラウドコンピューティング環境におけるコンピューティングリソースは、リモートデータセンターの場所に併合又は分散され得る。クラウドコンピューティングインフラストラクチャは、ユーザにとって単一のアクセスポイントとして動作するが、共有データセンターを通じてサービスを提供し得る。したがって、クラウドコンピューティングアーキテクチャを使用して、本明細書で説明されるコンポーネント及び機能を遠隔地にあるサービスプロバイダから提供し得る。代替的に、それらは従来のサーバから提供されるか、又はクライアントデバイスに直接又はその他の方法でインストールされ得る。
【0122】
コンピューティングデバイス1300は、本開示の実施形態においてビデオエンコーディング/デコーディングを具現するために使用され得る。メモリ1320は、1つ又は複数のプログラム命令を有する1つ又は複数のビデオ処理モジュール1325を含み得る。これらのモジュールは、本明細書で説明される様々な実施形態の機能を実行するように、処理ユニット1310によってアクセス可能かつ実行可能である。
【0123】
ビデオエンコーディングを実行する例示的な実施形態では、入力デバイス1350は、エンコードされるビデオデータを入力1370として受信し得る。ビデオデータは、例えば、ビデオ処理モジュール1325によって処理されて、エンコードされたビットストリームを生成し得る。エンコードされたビットストリームは、出力デバイス1360を介して出力1380として提供され得る。
【0124】
ビデオデコーディングを実行する例示的な実施形態では、入力デバイス1350は、エンコードされたビットストリームを入力1370として受信し得る。エンコードされたビットストリームは、例えば、ビデオ処理モジュール1325によって処理されて、デコードされたビデオデータを生成し得る。デコードされたビデオデータは、出力デバイス1360を介して出力1380として提供され得る。
【0125】
本開示は、その好ましい実施形態を参照して特に図示及び説明されたが、添付の特許請求の範囲によって定義される本出願の精神及び範囲から逸脱することなく、形態及び詳細における様々な変更を行うことができることが当業者には理解されるであろう。このような変形は、本出願の範囲に含まれるものとする。したがって、本出願の実施形態に関する前述の説明は限定することを意図したものではない。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
【手続補正書】
【提出日】2024-09-11
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
ビデオ処理方法であって、
ビデオのビットストリームと前記ビデオのメディアファイルとの間の転換を実行するステップを含み、
前記メディアファイルは、サンプルのセットを含む外部ストリームトラックを含み、前記サンプルのセットについてのサンプルエントリのサンプルエントリタイプは、制限付きスキームに基づいてカプセル化され、前記サンプルエントリは、前記制限付きスキームに関連付けられた指示を含み、前記指示の値は、前記サンプルのセット内のサンプルが前記外部ストリームトラックの複数のコード化画像を含むことが許可されることを示す、方法。
【請求項2】
前記サンプルエントリタイプは、オリジナルサンプルエントリタイプである、請求項1に記載の方法。
【請求項3】
前記サンプルエントリは、前記制限付きスキームに関する情報を含む第1のデータ構造を含み、前記第1のデータ構造は、前記制限付きスキームを識別する第2のデータ構造を含み、前記指示は、前記第2のデータ構造内の第1のフィールドを含む、請求項に記載の方法。
【請求項4】
前記第1のデータ構造は、制限付きスキーム情報ボックスであり、前記第2のデータ構造は、スキームタイプボックスであり、前記第1のフィールドは、スキームタイプフィールドである、請求項3に記載の方法。
【請求項5】
前記第1のフィールドの値は所定のコードに等しい、請求項に記載の方法。
【請求項6】
前記制限付きスキームの統一資源識別子(URI)は、前記メディアファイルに存在しない、請求項に記載の方法。
【請求項7】
前記サンプルエントリは、前記制限付きスキームに関する情報を含む第1のデータ構造を含み、前記第1のデータ構造は、前記制限付きスキームを識別する第2のデータ構造を含み、前記第2のデータ構造内のフラグフィールドの最下位ビットの値は0に等しい、請求項に記載の方法。
【請求項8】
前記第1のデータ構造は、制限付きスキーム情報ボックスであり、前記第2のデータ構造は、スキームタイプボックスである、請求項7に記載の方法。
【請求項9】
前記サンプルエントリタイプは、所定のサンプルエントリコードでカプセル化される、請求項に記載の方法。
【請求項10】
前記サンプルエントリは、前記制限付きスキームに関する情報を含む第1のデータ構造を含み、前記第1のデータ構造は、前記サンプルエントリタイプを記憶する第3のデータ構造を含む、請求項に記載の方法。
【請求項11】
記メディアファイルは、前記外部ストリームトラックに関連付けられた情報を含む第4のデータ構造を含む、請求項に記載の方法。
【請求項12】
前記メディアファイルは、国際標準化機構(ISO)ベースのメディアファイルフォーマットである、請求項に記載の方法。
【請求項13】
前記転換は、前記メディアファイルを生成し、前記ビットストリームを前記メディアファイルに記憶することを含む、請求項に記載の方法。
【請求項14】
前記転換は、前記メディアファイルを解析して前記ビットストリームを再構築することを含む、請求項に記載の方法。
【請求項15】
プロセッサと命令が記録された非一時的メモリとを含む、ビデオデータを処理する装置であって、前記命令は前記プロセッサによって実行されると、前記プロセッサに請求項1から14のいずれか一項に記載の方法を実行させる、装置。
【請求項16】
プロセッサに請求項1から14のいずれか一項に記載の方法を実行させる命令を記憶する非一時的なコンピュータ読み取り可能な記憶媒体。
【請求項17】
ビデオのメディアファイルを記憶する方法であって、
前記ビデオのビットストリームと前記メディアファイルとの間の転換を実行するステップと、
前記メディアファイルを非一時的なコンピュータ読み取り可能な記録媒体に記憶するステップと、を含み、
前記メディアファイルは、サンプルのセットを含む外部ストリームトラックを含み、前記サンプルのセットについてのサンプルエントリのサンプルエントリタイプは、制限付きスキームに基づいてカプセル化され、前記サンプルエントリは、前記制限付きスキームに関連付けられた指示を含み、前記指示の値は、前記サンプルのセット内のサンプルが前記外部ストリームトラックの複数のコード化画像を含むことが許可されることを示す、方法。
【国際調査報告】