(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2025-01-24
(54)【発明の名称】ビデオ処理方法、装置、及び、媒体
(51)【国際特許分類】
H04N 21/236 20110101AFI20250117BHJP
H04N 19/70 20140101ALI20250117BHJP
【FI】
H04N21/236
H04N19/70
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2024541830
(86)(22)【出願日】2023-01-10
(85)【翻訳文提出日】2024-08-05
(86)【国際出願番号】 US2023060417
(87)【国際公開番号】W WO2023137284
(87)【国際公開日】2023-07-20
(32)【優先日】2022-01-11
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】520477474
【氏名又は名称】バイトダンス インコーポレイテッド
【氏名又は名称原語表記】BYTEDANCE INC.
【住所又は居所原語表記】12655 West Jefferson Boulevard, Sixth Floor, Suite No. 137 Los Angeles, California 90066 United States of America
(74)【代理人】
【識別番号】110004381
【氏名又は名称】弁理士法人ITOH
(72)【発明者】
【氏名】ワン,イェ-クイ
【テーマコード(参考)】
5C159
5C164
【Fターム(参考)】
5C159MA04
5C159MA05
5C159MA21
5C159MC11
5C159ME01
5C159PP04
5C159RB00
5C159RC11
5C159SS06
5C159UA02
5C159UA05
5C164MB13S
5C164SB11P
(57)【要約】
本開示の実施形態は、ビデオ処理のための方案を提供する。ビデオ処理方法を提案する。前記方法は、ビデオのビットストリームと前記ビデオのメディアファイルとの間の変換を実行するステップを含み、前記メディアファイルは、第1ラベルを有するラベルグループを含み、前記第1ラベルに対する、第1データ構造内の第1指示は、単一のビットでコード化され、前記第1指示は、前記第1ラベルが前記ラベルグループのためのサマリーラベルを含むか否かを示す。
【選択図】
図4
【特許請求の範囲】
【請求項1】
ビデオ処理方法であって、
ビデオのビットストリームと前記ビデオのメディアファイルとの間の変換を実行するステップ、を含み、
前記メディアファイルは、第1ラベルを有するラベルグループを含み、
前記第1ラベルに対する、第1データ構造内の第1指示は、単一のビットでコード化され、
前記第1指示は、前記第1ラベルが前記ラベルグループのためのサマリーラベルを含むか否かを示す、
方法。
【請求項2】
前記第1データ構造は、ラベルボックスであり、
前記第1指示は、is_group_labelフィールドである、
請求項2に記載の方法。
【請求項3】
前記ラベルグループは、同じ識別子を有し、
前記サマリーラベルは、全ての前記ラベルグループのサマリー又はタイトルを含む、
請求項1又は2に記載の方法。
【請求項4】
前記単一のビットの直後の所定数のビットは、保留される、
請求項1~3のいずれか1項に記載の方法。
【請求項5】
前記単一のビットの直前の所定数のビットは、保留される、
請求項1~3のいずれか1項に記載の方法。
【請求項6】
前記所定数は、7である、
請求項4又は5に記載の方法。
【請求項7】
トラックにおける第2データ構造内の第2指示が所定値を有することを特定する要件は、
前記メディアファイル内の少なくとも1つのトラックに対して課されず、
前記第2指示は、前記対応するトラックが前記メディアファイルのプレゼンテーションの直接部分を表すかどうかを示し、かつ、
前記第2データ構造は、前記対応するトラックの特性を特定し、前記少なくとも1つのトラックは、前記メディアファイルのための事前選択に寄与しない、
ことである、
請求項1~6のいずれか1項に記載の方法。
【請求項8】
前記第2指示は、track_in_movieフラグであり、
前記第2データ構造は、トラックヘッダボックスであり、かつ、
前記所定値は、0である、
請求項7に記載の方法。
【請求項9】
前記少なくとも1つのトラックは、トラックグループタイプフィールドが「pres」に等しいトラックグループタイプボックスを含まない、
請求項7又は8に記載の方法。
【請求項10】
トラックグループタイプフィールドが「pres」に等しいトラックグループタイプボックスは、事前選択グループボックスである、
請求項7~9のいずれか1項に記載の方法。
【請求項11】
前記メディアファイルは、ターゲットトラックのセットを含み、
前記ターゲットトラックのセットのそれぞれには、前記事前選択グループボックスが含まれ、一方で、前記メディアファイルの少なくとも1つの事前選択のために必要な1つ以上のメディアコンポーネントが欠け、
前記ターゲットトラックのセットのそれぞれにおける前記第2データ構造内の前記第2指示は、前記所定値を有する、
請求項10に記載の方法。
【請求項12】
前記メディアファイルは、国際標準化機構(ISO)ベースのメディアファイルフォーマットである、
請求項1~11のいずれか1項に記載の方法。
【請求項13】
前記変換は、
前記メディアファイルを生成すること、及び、
前記ビットストリームを前記メディアファイルに記憶すること、
を含む、請求項1~12のいずれか1項に記載の方法。
【請求項14】
前記変換は、前記ビットストリームを再構成するために、前記メディアファイルを解析することを含む、
請求項1~12のいずれか1項に記載の方法。
【請求項15】
プロセッサと、命令を備える非一時的なメモリとを含む、ビデオデータを処理するための装置であって、
前記命令は、前記プロセッサによって実行されると、前記プロセッサに、請求項1~14のいずれか1項に記載の方法を実行させる、
装置。
【請求項16】
プロセッサに請求項1~14に記載の方法を実行させる命令を記憶する、
非一時的なコンピュータ可読記憶媒体。
【請求項17】
ビデオ処理装置によって実行される方法で生成される、ビデオのビットストリームを記憶する非一時的なコンピュータ可読記録媒体であって、
前記方法は、
前記ビットストリームと前記ビデオのメディアファイルとの間の変換を実行するステップ、を含み、
前記メディアファイルは、第1ラベルを有するラベルグループを含み、
前記第1ラベルに対する、第1データ構造内の第1指示は、単一のビットでコード化され、
前記第1指示は、前記第1ラベルが前記ラベルグループのためのサマリーラベルを含むか否かを示す、
非一時的なコンピュータ可読記録媒体。
【請求項18】
ビデオのビットストリームを記憶する方法であって、
前記ビットストリームと前記ビデオのメディアファイルとの間の変換を実行するステップと、
前記ビットストリームを非一時的なコンピュータ可読記録媒体内に記憶するステップと、を含み、
前記メディアファイルは、第1ラベルを有するラベルグループを含み、
前記第1ラベルに対する、第1データ構造内の第1指示は、単一のビットでコード化され、
前記第1指示は、前記第1ラベルが前記ラベルグループのためのサマリーラベルを含むか否かを示す、
方法。
【請求項19】
ビデオ処理装置によって実行される方法で生成される、ビデオのメディアファイルを記憶する非一時的なコンピュータ可読記録媒体であって、
前記方法は、
前記ビデオのビットストリームと前記メディアファイルとの間の変換を実行するステップ、を含み、
前記メディアファイルは、第1ラベルを有するラベルグループを含み、
前記第1ラベルに対する、第1データ構造内の第1指示は、単一のビットでコード化され、前記第1指示は、前記第1ラベルが前記ラベルグループのためのサマリーラベルを含むか否かを示す、
非一時的なコンピュータ可読記録媒体。
【請求項20】
ビデオのメディアファイルを記憶する方法であって、
前記ビデオのビットストリームと前記メディアファイルとの間の変換を実行するステップと、
前記メディアファイルを非一時的なコンピュータ可読記録媒体内に記憶するステップと、を含み、
前記メディアファイルは、第1ラベルを有するラベルグループを含み、
前記第1ラベルに対する、第1データ構造内の第1指示は、単一のビットでコード化され、
前記第1指示は、前記第1ラベルが前記ラベルグループのためのサマリーラベルを含むか否かを示す、
方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示の実施形態は、概して、ビデオ処理技術に関し、より具体的には、メディアファイル内の事前選択のシグナリングに関する。
【0002】
関連出願の相互参照
本出願は、2022年1月11日に出願された米国仮出願第63/298,502号について優先権を主張するものであり、その内容全体が、ここにおいて明示的に参照として取り込まれている。
【背景技術】
【0003】
メディアストリーミングアプリケーションは、通常、インターネットプロトコル(IP)、伝送制御プロトコル(TCP)、及び、ハイパーテキスト転送プロトコル(HTTP)の転送方法に基づくものであり、通常は、ISOベースのビットストリームフォーマット(ISOBMFF)などのファイルフォーマットに依存する。このようなストリーミングシステムの1つは、HTTPベースの動的適応型ストリーミング(dynamic adaptive streaming over HTTP、略して、DASH)である。DASHでは、マルチメディアコンテンツのビデオ及び/又はオーディオデータの多重表現が存在し得るが、異なる表現は、異なるコーディング特性(例えば、ビデオコーディング規格の異なるプロファイル又はレベル、異なるビットレート、異なる空間解像度、など)に対応し得る。また、事前選択とは、同時にデコーディング及びプレゼンテーションの実行のためにユーザにより選択され得る、メディアプレゼンテーションの1つのバージョンを表す、1つ以上のメディアコンポーネントのセットである。従って、メディアファイル内の事前選択のシグナリングについて研究する価値が存在する。
【発明の概要】
【0004】
本開示の実施形態は、ビデオ処理のための方案を提供する。
【0005】
第1態様では、ビデオ処理方法を提案する。前記方法は、ビデオのビットストリームと前記ビデオのメディアファイルとの間の変換を実行するステップを含み、前記メディアファイルは、第1ラベルを有するラベルグループを含み、前記第1ラベルに対する、第1データ構造内の第1指示は、単一のビットでコード化され、前記第1指示は、前記第1ラベルが前記ラベルグループのためのサマリーラベルを含むか否かを示す。
【0006】
本開示の第1態様による方法によれば、ラベルが前記ラベルグループのためのサマリーラベルが前記ラベルグループのためのサマリーラベルを含むか否かを示す指示は、単一のビットでコード化される。指示が8ビットでコード化される従来の方案に比べて、提案した方法は、指示をシグナリングするためのビット数を有利に減少するため、コーディング効率を向上させることができる。
【0007】
第2態様では、ビデオデータを処理するための装置を提案する。前記ビデオデータを処理するための装置は、プロセッサと、命令を備える非一時的なメモリとを含む。前記命令は、前記プロセッサによって実行されると、前記プロセッサに、本開示の第1態様による方法を実行させる。
【0008】
第3態様では、非一時的なコンピュータ可読記憶媒体を提案する。非一時的なコンピュータ可読記憶媒体は、プロセッサに、本開示の第1態様による方法を実行させる命令を記憶する。
【0009】
第4態様では、他の非一時的なコンピュータ可読記録媒体を提案する。前記非一時的なコンピュータ可読記録媒体は、ビデオ処理装置によって実行される方法で生成される、ビデオのビットストリームを記憶する。前記方法は、前記ビットストリームと前記ビデオのメディアファイルとの間の変換を実行するステップを含み、前記メディアファイルは、第1ラベルを有するラベルグループを含み、前記第1ラベルに対する、第1データ構造内の第1指示は、単一のビットでコード化され、前記第1指示は、前記第1ラベルが前記ラベルグループのためのサマリーラベルを含むか否かを示す。
【0010】
第5態様では、ビデオのビットストリームを記憶するための方法を提案する。前記方法は、前記ビットストリームと前記ビデオのメディアファイルとの間の変換を実行するステップと、前記ビットストリームを非一時的なコンピュータ可読記録媒体内に記憶するステップと、を含み、前記メディアファイルは、第1ラベルを有するラベルグループを含み、前記第1ラベルに対する、第1データ構造内の第1指示は、単一のビットでコード化され、前記第1指示は、前記第1ラベルが前記ラベルグループのためのサマリーラベルを含むか否かを示す。
【0011】
第6態様では、他の非一時的なコンピュータ可読記録媒体を提案する。前記非一時的なコンピュータ可読記録媒体は、ビデオ処理装置によって実行される方法で生成される、ビデオのメディアファイルを記憶する。前記方法は、前記ビデオのビットストリームと前記メディアファイルとの間の変換を実行するステップを含み、前記メディアファイルは、第1ラベルを有するラベルグループを含み、前記第1ラベルに対する、第1データ構造内の第1指示は、単一のビットでコード化され、前記第1指示は、前記第1ラベルが前記ラベルグループのためのサマリーラベルを含むか否かを示す。
【0012】
第7態様では、ビデオのメディアファイルを記憶する方法を提案する。前記方法は、前記ビデオのビットストリームと前記メディアファイルとの間の変換を実行するステップと、前記メディアファイルを非一時的なコンピュータ可読記録媒体内に記憶するステップと、を含み、前記メディアファイルは、第1ラベルを有するラベルグループを含み、前記第1ラベルに対する、第1データ構造内の第1指示は、単一のビットでコード化され、前記第1指示は、前記第1ラベルが前記ラベルグループのためのサマリーラベルを含むか否かを示す。
【0013】
本発明の概要は、以下の詳細な説明でさらに記述される概念の選択を、簡略化した形で紹介するために提供される。この発明の概要は、請求される技術的事項の主な特徴又は本質的な特徴を特定することを意図したものではなく、また、請求される技術的事項の範囲を制限するために使用されることを意図したものでもない。
【図面の簡単な説明】
【0014】
添付の図面を参照した以下の詳細な説明を通じて、本開示の例示的な実施形態の上記及び他の目的、特徴、及び、利点がより明らかになるであろう。本開示の例示的な実施形態では、同じ参照番号は、通常、同じ構成要素を指す。
【
図1】本開示のいくつかの実施形態に係る例示的なビデオコーディングシステムのブロック図を示す。
【
図2】本開示のいくつかの実施形態に係る第1の例示的なビデオエンコーダのブロック図を示す。
【
図3】本開示のいくつかの実施形態に係る例示的なビデオデコーダのブロック図を示す。
【
図4】本開示のいくつかの実施形態に係るビデオ処理方法のフローチャートを示す。
【
図5】本開示の様々な実施形態を実施できるコンピューティングデバイスに係るブロック図を示す。
【0015】
図面の全体にわたって、同一又は類似の参照番号は、通常、同一又は類似の要素を指す。
【発明を実施するための形態】
【0016】
以下に、いくつかの実施形態を参照しながら本開示の原理を説明する。これらの実施形態は、例示の目的で、かつ、当業者が本開示を理解して実施することに寄与するために記載されるにすぎず、本開示の範囲に関していかなる限定も示唆しないものと理解すべきである。本明細書に記載の開示は、以下に記載する方法以外にも、様々な方法で実施することができる。
【0017】
以下の説明及び特許請求の範囲において、別段の定義がない限り、本明細書で使用されるすべての技術用語及び科学用語は、本開示が属する技術分野の当業者によって一般に理解されるものと同じ意味を有する。
【0018】
本開示における「一つの実施形態」、「一実施形態」、「例示的な実施形態」などへの言及は、記載される実施形態が、特定の特徴、構造、又は、特性を含み得ることを示すが、必ずしもすべての実施形態が、特定の特徴、構造、又は、特性を含むとは限らない。また、そのような語句は、必ずしも同じ実施形態を指しているわけではない。さらに、特定の特徴、構造、又は、特性が、例示的な実施形態に関連して説明される場合には、明示的に記載されているかどうかにかかわらず、他の実施形態に関連して、そのような特徴、構造、又は、特性に影響を与えることは、当業者の知識の範囲内であることが指摘される。
【0019】
「第1」及び「第2」などの用語は、本明細書では、様々な要素を説明するために使用され得るが、これらの要素は、これらの用語によって限定されるべきではないことを理解すべきである。これらの用語は、ある要素を別の要素と区別するためにのみ使用されている。例えば、例示的な実施形態の範囲から逸脱することなく、第1の要素は、第2の要素と呼ばれ得る。同様に、第2の要素は、第1の要素と呼ばれ得る。本明細書で使用される「及び/又は」という用語には、列挙された用語の1つ以上のあらゆる組み合わせが含まれる。
【0020】
本明細書で使用される用語は、特定の実施形態を説明することのみを目的としており、例示的な実施形態について限定することを意図したものではない。本明細書で使用されるように、単数形「a(一つの)」、「an(一つの)」、及び、「the(その)」は、文脈上明らかに別段の指示がない限り、複数形も含むものとする。「含む」、「備える」、「有する」、「持つ」、「含む」、及び/又は、「包含する」という用語は、本明細書で使用される場合には、記載された特徴、要素、及び/又は、コンポーネントなど、の存在を特定するが、1つ以上の他の特徴、要素、コンポーネント、及び/又は、それらの組み合わせの存在又は追加を排除するものではないことが、さらに理解されるであろう。
【0021】
例示的な環境
図1は、本開示の技術を利用し得る例示的なビデオコーディングシステム100を示すブロック図である。図示されるように、ビデオコーディングシステム100は、ソースデバイス110、及び、宛先デバイス120を含み得る。ソースデバイス110は、ビデオエンコーディング装置とも呼ばれ得る。宛先デバイス120は、ビデオデコーディング装置とも呼ばれ得る。動作中、ソースデバイス110は、エンコーディングされたビデオデータを生成するように構成され、宛先デバイス120は、ソースデバイス110によって生成されたエンコーディングされたビデオデータをデコーディングするように構成され得る。ソースデバイス110は、ビデオソース112と、ビデオエンコーダ114と、入出力(I/O)インターフェース116と、を含み得る。
【0022】
ビデオソース112は、ビデオキャプチャデバイスなどのソースを含み得る。ビデオキャプチャデバイスの例には、ビデオコンテンツプロバイダからビデオデータを受信するインターフェース、ビデオデータを生成するコンピュータグラフィックスシステム、及び/又は、それらの組み合わせが含まれるが、これらに限定されない。
【0023】
ビデオデータは、1つ以上のピクチャを含み得る。ビデオエンコーダ114は、ビデオソース112からのビデオデータをエンコーディングして、ビットストリームを生成する。ビットストリームには、ビデオデータのコード化表現を形成する一連のビットが含まれ得る。ビットストリームには、コード化ピクチャ及び関連データが含まれ得る。コード化ピクチャは、ピクチャのコード化表現である。関連データには、シーケンスパラメータセット、ピクチャパラメータセット、及び、他の構文構造が含まれ得る。I/Oインターフェース116は、変調器/復調器、及び/又は、送信機を含み得る。エンコーディングされたビデオデータは、I/Oインターフェース116を介して、ネットワーク130Aを通じて、宛先デバイス120に直接送信され得る。エンコーディングされたビデオデータは、宛先デバイス120によるアクセスのために、記憶媒体/サーバ130Bに記憶され得る。
【0024】
宛先デバイス120は、I/Oインターフェース126と、ビデオデコーダ124と、表示デバイス122と、を含み得る。I/Oインターフェース126は、受信機、及び/又は、モデムを含み得る。I/Oインターフェース126は、ソースデバイス110、又は、記憶媒体/サーバ130Bから、エンコーディングされたビデオデータを取得し得る。ビデオデコーダ124は、エンコーディングされたビデオデータをデコーディングし得る。表示デバイス122は、デコーディングされたビデオデータを、ユーザに表示し得る。表示デバイス122は、宛先デバイス120と一体化されてもよいし、或いは、外部表示デバイスとインターフェースするように構成された、宛先デバイス120の外部にあってもよい。
【0025】
ビデオエンコーダ114及びビデオデコーダ124は、HEVC(High Efficiency Video Coding)規格、VVC(Versatile Video Coding)規格、及び、他の現在及び/又はさらなる規格、などのビデオ圧縮規格に従って、動作し得る。
【0026】
図2は、本開示のいくつかの実施形態に係る、
図1に示すシステム100内のビデオエンコーダ114の一例である、ビデオエンコーダ200の一例を示すブロック図である。
【0027】
ビデオエンコーダ200は、本開示の技術のいずれか、又は、すべてを実施するように構成され得る。
図2の例において、ビデオエンコーダ200は、複数の機能コンポーネントを含む。本開示で説明される技術は、ビデオエンコーダ200の様々なコンポーネント間で共有され得る。いくつかの例において、プロセッサは、本開示で説明された技術のいずれか、又は、すべてを実行するように構成され得る。
【0028】
いくつかの実施形態において、ビデオエンコーダ200は、分割ユニット201と、モード選択ユニット203、動き推定ユニット204、動き補償ユニット205、及びイントラ予測ユニット206を含み得る、予測ユニット202と、残差生成ユニット207と、変換ユニット208と、量子化ユニット209と、逆量子化ユニット210と、逆変換ユニット211と、再構成ユニット212と、バッファ213と、エントロピー符号化ユニット214と、を含み得る。
【0029】
他の例において、ビデオエンコーダ200は、より多くの機能コンポーネント、より少ない機能コンポーネント、又は、異なる機能コンポーネントを含み得る。一例において、予測ユニット202は、イントラブロックコピー(IBC)ユニットを含み得る。IBCユニットは、少なくとも1つの参照ピクチャが現在ビデオブロックの位置するピクチャである、IBCモードで予測を実行し得る。
【0030】
さらに、動き推定ユニット204、及び、動き補償ユニット205などのいくつかの構成要素は統合され得るが、
図2の例では、説明の目的で別々に表されている。
【0031】
分割ユニット201は、ピクチャを1つ以上のビデオブロックに分割し得る。ビデオエンコーダ200、及び、ビデオデコーダ300は、多様なビデオブロックサイズをサポートし得る。
【0032】
モード選択ユニット203は、例えば、エラー結果に基づいて、イントラコーディングモード又はインターコーディングモードのうちの1つを選択し、その結果から得られるイントラコーディング又はインターコーディングされたブロックを、残差ブロックデータを生成するように残差生成ユニット207に提供し、エンコーディングされたブロックを再構成して、参照ピクチャとして使用するように、再構成ユニット212に提供し得る。いくつかの例では、モード選択ユニット203は、予測がインター予測信号及びイントラ予測信号に基づく、イントラ予測及びインター予測の組み合わせ(CIIP)モードを選択し得る。モード選択ユニット203は、インター予測の場合、ブロックの動きベクトルの解像度(例えば、サブピクセル、又は、整数ピクセル精度)を選択し得る。
【0033】
現在ビデオブロックに対してインター予測を実行するために、動き推定ユニット204は、バッファ213からの1つ以上の参照フレームを現在ビデオブロックと比較することによって、現在ビデオブロックの動き情報を生成し得る。動き補償ユニット205は、現在ビデオブロックに関連するピクチャ以外の、バッファ213からのピクチャの動き情報、及び、デコーディングサンプルに基づいて、現在ビデオブロックの予測ビデオブロックを決定し得る。
【0034】
動き推定ユニット204、及び、動き補償ユニット205は、例えば、現在ビデオブロックがIスライス、Pスライス、又は、Bスライスのいずれにあるかに応じて、現在ビデオブロックに対して異なる演算を実行し得る。本明細書で使用されるように、「Iスライス」は、マクロブロックから構成されるピクチャの一部を指すことができ、そのすべてが、同じピクチャ内のマクロブロックに基づいている。さらに、本明細書で使用されるように、いくつかの態様では、「Pスライス」及び「Bスライス」は、同じピクチャ内のマクロブロックに依存しない、マクロブロックから構成されるピクチャの部分を指し得る。
【0035】
いくつかの例では、動き推定ユニット204は、現在ビデオブロックに対して単方向予測を実行することができ、動き推定ユニット204は、現在ビデオブロックの参照ビデオブロックに対するリスト0又はリスト1の参照ピクチャを探し得る。次に、動き推定ユニット204は、参照ビデオブロックを含むリスト0又はリスト1内の参照ピクチャを示す参照インデックス、及び、現在ビデオブロックと参照ビデオブロックとの間の空間変位を示す動きベクトルを生成し得る。動き推定ユニット204は、参照インデックス、予測方向指示子、及び、動きベクトルを、現在ビデオブロックの動き情報として出力し得る。動き補償ユニット205は、現在ビデオブロックの動き情報によって示される参照ビデオブロックに基づいて、現在ビデオブロックの予測ビデオブロックを生成し得る。
【0036】
代替形態として、他の例では、動き推定ユニット204は、現在ビデオブロックに対して双方向予測を実行し得る。動き推定ユニット204は、現在ビデオブロックの参照ビデオブロックに対するリスト0内の参照ピクチャをサーチしてもよいし、現在ビデオブロックの別の参照ビデオブロックに対するリスト1内の参照ピクチャをサーチしてもよい。次に、動き推定ユニット204は、参照ビデオブロックを含む、リスト0及びリスト1内の参照ピクチャを示す参照インデックス、及び、参照ビデオブロックと現在ビデオブロックとの間の空間変位を示す動きベクトルを生成し得る。動き推定ユニット204は、現在ビデオブロックの参照インデックス及び動きベクトルを、現在ビデオブロックの動き情報として出力し得る。動き補償ユニット205は、現在ビデオブロックの動き情報によって示される参照ビデオブロックに基づいて、現在ビデオブロックの予測ビデオブロックを生成し得る。
【0037】
いくつかの例では、動き推定ユニット204は、デコーダのデコーディング処理のためのフルセットの動き情報を出力し得る。代替形態として、いくつかの実施形態では、動き推定ユニット204は、別のビデオブロックの動き情報を参照して、現在ビデオブロックの動き情報をシグナリングし得る。例えば、動き推定ユニット204は、現在ビデオブロックの動き情報が、隣接するビデオブロックの動き情報と十分に類似していると判定し得る。
【0038】
一例では、動き推定ユニット204は、現在ビデオブロックに関連付けられた構文構造において、現在ビデオブロックが別のビデオブロックと同じ動き情報を有することを、ビデオデコーダ300へ示す値を示し得る。
【0039】
別の例では、動き推定ユニット204は、現在ビデオブロックに関連付けられた構文構造において、別のビデオブロック及び動きベクトル差分(MVD)を識別し得る。動きベクトル差分は、現在ビデオブロックの動きベクトルと、指示されたビデオブロックの動きベクトルとの間の差分を示す。ビデオデコーダ300は、指示されたビデオブロックの動きベクトル及び動きベクトル差分を使用して、現在ビデオブロックの動きベクトルを決定し得る。
【0040】
上記のように、ビデオエンコーダ200は、動きベクトルを予測的にシグナリングし得る。ビデオエンコーダ200によって実施され得る予測シグナリング技術の2つの例には、アドバンスト動きベクトル予測(AMVP)、及び、マージモードシグナリングが含まれる。
【0041】
イントラ予測ユニット206は、現在ビデオブロックに対してイントラ予測を実行し得る。イントラ予測ユニット206が現在ビデオブロックに対してイントラ予測を実行するとき、イントラ予測ユニット206は、同じピクチャ内の他のビデオブロックのデコーディングされたサンプルに基づいて、現在ビデオブロックに対する予測データを生成し得る。現在ビデオブロックに対する予測データには、予測されたビデオブロック及び様々な構文要素が含まれ得る。
【0042】
残差生成ユニット207は、現在ビデオブロックから現在ビデオブロックの予測ビデオブロックを減算する(例えば、マイナス記号によって示される)ことによって、現在ビデオブロックに対する残差データを生成し得る。現在ビデオブロックの残差データは、現在ビデオブロック内のサンプルの異なるサンプル成分に対応する残差ビデオブロックを含み得る。
【0043】
他の例では、現在ビデオブロックに対する残差データは、例えば、スキップモードにおいて存在しなくてもよく、残差生成ユニット207は、減算演算を実行しなくてもよい。
【0044】
変換処理ユニット208は、現在ビデオブロックに関連付けられた残差ビデオブロックに1つ以上の変換を適用することによって、現在ビデオブロックに対する1つ以上の変換係数ビデオブロックを生成し得る。
【0045】
変換処理ユニット208が現在ビデオブロックに関連付けられた変換係数ビデオブロックを生成した後で、量子化ユニット209は、現在ビデオブロックに関連付けられた1つ以上の量子化パラメータ(QP)値に基づいて、現在ビデオブロックに関連付けられた変換係数ビデオブロックを量子化し得る。
【0046】
逆量子化ユニット210、及び、逆変換ユニット211は、それぞれ、変換係数ビデオブロックに逆量子化及び逆変換を適用して、変換係数ビデオブロックから、残差ビデオブロックを再構成し得る。再構成ユニット212は、再構成された残差ビデオブロックを、予測ユニット202によって生成された1つ以上の予測ビデオブロックからの対応するサンプルに追加して、バッファ213に記憶するために、現在ビデオブロックに関連付けられた再構成ビデオブロックを生成し得る。
【0047】
再構成ユニット212がビデオブロックを再構成した後で、ビデオブロック内のビデオブロッキングアーティファクトを低減するために、ループフィルタリング動作が実行され得る。
【0048】
エントロピー符号化ユニット214は、ビデオエンコーダ200の他の機能コンポーネントからデータを受信し得る。エントロピー符号化ユニット214がデータを受信すると、エントロピー符号化ユニット214は、1つ以上のエントロピー符号化動作を実行することで、エントロピー符号化データを生成し、そして、エントロピー符号化データを含む、ビットストリームを出力し得る。
【0049】
図3は、本開示のいくつかの実施形態に係る、
図1に示すシステム100内のビデオデコーダ124の一例である、ビデオデコーダ300の一例を示すブロック図である。
【0050】
ビデオデコーダ300は、本開示の技術のいずれか又はすべてを実行するように構成され得る。
図3の例では、ビデオデコーダ300は、複数の機能コンポーネントを含んでいる。本開示で説明される技術は、ビデオデコーダ300の様々なコンポーネント間で共有され得る。いくつかの例では、プロセッサは、本開示で説明された技術のいずれか又はすべてを実行するように構成され得る。
【0051】
図3の例では、ビデオデコーダ300は、エントロピー復号ユニット301と、動き補償ユニット302と、イントラ予測ユニット303と、逆量子化ユニット304と、逆変換ユニット305と、再構成ユニット306と、バッファ307と、を含む。ビデオデコーダ300は、いくつかの例では、一般的に、ビデオエンコーダ200に関して説明したエンコーディングパスとは逆のデコーディングパスを実行し得る。
【0052】
エントロピー復号ユニット301は、エンコーディングされたビットストリームを検索し得る。エンコーディングされたビットストリームは、エントロピー符号化されたビデオデータ(例えば、ビデオデータのエンコーディングされたブロック)を含み得る。エントロピー復号ユニット301は、エントロピー符号化されたビデオデータをデコーディングし得る。そして、動き補償ユニット302は、エントロピー復号されたビデオデータから、動きベクトル、動きベクトル精度、参照ピクチャリストインデックス、及び、他の動き情報を含む、動き情報を決定し得る。動き補償ユニット302は、例えば、AMVP及びマージモードを実行することによって、そのような情報を決定し得る。AMVPが使用され、隣接するPB及び参照ピクチャからのデータに基づいた、最も可能性の高い、いくつかの候補の導出を含む。動き情報には、通常、水平及び垂直動きベクトル変位値、1つ又は2つの参照ピクチャインデックス、及び、Bスライス内の予測領域の場合は、どの参照ピクチャリストが各インデックスに関連付けられているかの識別が含まれる。本明細書で使用されるように、いくつかの態様では、「マージモード」は、空間的又は時間的に隣接するブロックから動き情報を導出することを指し得る。
【0053】
動き補償ユニット302は、動き補償されたブロックを生成し、当該ブロックは、補間フィルタに基づいて、補間を実行することができる。サブピクセル精度で使用される補間フィルタの識別子は、構文要素に含まれ得る。
【0054】
動き補償ユニット302は、ビデオブロックのエンコーディング中にビデオエンコーダ200によって使用される補間フィルタを使用して、参照ブロックのサブ整数ピクセルに対する補間値を計算し得る。動き補償ユニット302は、受信した構文情報に従って、ビデオエンコーダ200によって使用される補間フィルタを決定し、その補間フィルタを使用して、予測ブロックを生成し得る。
【0055】
動き補償ユニット302は、構文情報の少なくとも一部を使用して、エンコーディングされたビデオシーケンスのフレーム及び/又はスライスをエンコーディングするために使用されるブロックのサイズ、エンコーディングされたビデオシーケンスのピクチャの各マクロブロックがどのように分割されるかを説明するパーティション情報、各パーティションがどのようにエンコーディングされるかを示すモード、各インターエンコードされたブロックの1つ以上の参照フレーム(及び、参照フレームリスト)、及び、エンコーディングされたビデオシーケンスをデコーディングするその他の情報、を決定し得る。本明細書で使用されるように、いくつかの態様では、「スライス」は、エントロピー符号、信号予測、及び、残差信号再構成に関して、同じピクチャの他のスライスとは別個にデコーディングできるデータ構造を指し得る。スライスは、ピクチャ全体又はピクチャの領域のいずれかになり得る。
【0056】
イントラ予測ユニット303は、例えば、ビットストリーム内で受信されたイントラ予測モードを使用して、空間的に隣接するブロックから、予測ブロックを形成し得る。逆量子化ユニット304は、ビットストリームで提供され、エントロピー復号ユニット301によってデコーディングされた量子化ビデオブロック係数を、逆量子化、即ち、量子化解除する。逆変換ユニット305は、逆変換を適用する。
【0057】
再構成ユニット306は、例えば、残差ブロック、及び、動き補償ユニット302又はイントラ予測ユニット303によって生成された、対応する予測ブロックを加算することによって、デコーディングされたブロックを取得し得る。必要に応じて、デブロッキングフィルタが適用されて、ブロックノイズアーティファクトを除去するように、デコーディングされたブロックをフィルタリングしてもよい。次に、デコーディングされたビデオブロックは、バッファ307に記憶され、バッファ307は、後続の動き補償/イントラ予測のための参照ブロックを提供し、また、表示デバイス上にプレゼンテーションするためのデコーディングされたビデオも生成する。
【0058】
本開示のいくつかの例示的な実施形態について、以下に、詳細に説明することにする。本明細書では、理解を容易にするためにセクション見出しが使用されているが、セクションで開示される実施形態をそのセクションのみに限定するものではないことを理解すべきである。さらに、特定の実施形態がバーサタイルビデオコーディング、又は、他の特定のビデオコーデックを参照して説明されているが、開示された技術は、他のビデオコーディング技術にも適用可能である。さらに、いくつかの実施形態は、ビデオコーディングステップを詳細に説明するが、コーディングを元に戻す、対応するデコーディングステップは、デコーダによって実施されることが理解されるであろう。さらに、ビデオ処理という用語には、ビデオのエンコーディング又は圧縮、ビデオのデコーディング又は解凍、及び、ビデオピクセルを1つの圧縮フォーマットから別の圧縮フォーマット又は異なる圧縮ビットレートで表現するビデオトランスエンコーディングが包含される。
【表1】
【0059】
以下、メディアファイル内の事前選択のシグナリングに関する本開示の実施形態の更なる詳細について説明する。本開示の実施形態は、一般的な概念を説明するための例として考慮されるべきであり、狭く解釈されるべきではない。さらに、これらの実施形態は、任意の態様で、組み合わせて適用することもできる。
【0060】
本明細書で使用される場合、「事前選択」という用語は、同時にデコーディング及びプレゼンテーションの実行のためのメディアプレゼンテーションの1つのバージョンを表す1つ以上のトラックのセットを指し得る。「トラック」という用語は、関連するサンプルのタイムドシーケンスを指し得る。「ボックス」という用語は、一義のタイプ識別子及び長さで定義されるオブジェクト指向の構築ブロックを指し得る。
【0061】
図4は、本開示のいくつかの実施形態に係るビデオ処理方法400のフローチャートを示す。当該方法400は、クライアント又はサーバで実施され得る。本明細書で使用される「クライアント」という用語は、コンピュータネットワークのクライアントサーバモデルの一部としてサーバによって利用可能であるサービスにアクセスするコンピューターハードウェア又はソフトウェアを指し得る。一例として、クライアントは、スマートフォン又はタブレットであり得る。本明細書で使用される「サーバ」という用語は、コンピューティング可能なデバイスを指し得る。この場合、クライアントは、ネットワークを介してサービスにアクセスする。サーバは、物理コンピューティングデバイス又は仮想コンピューティングデバイスであり得る。
【0062】
図4に示されるように、1202では、ビデオのビットストリームとビデオのメディアファイルとの間の変換が実行される。メディアファイルは、国際標準化機構(ISO)ベースのメディアファイルフォーマットなどのファイルフォーマットのコンテキスト内でメディアコンテンツの制限付き又は制限なしのプレゼンテーションを確立するデータのコレクションである。いくつかの実施形態では、変換は、メディアファイルを生成すること、及び、ビットストリームをメディアファイルに記憶することを含み得る。追加的に、又は、代替的に、変換は、ビットストリームを再構成するために、メディアファイルを解析することを含み得る。
【0063】
いくつかの実施形態では、メディアファイルは、第1ラベルを有するラベルグループを含む。ラベルは、当該ラベルが割り当てられるエンティティのコンテキストの記述を提供するために、メディアファイル内のデータ構造に注釈を付ける機能を提供し得る。さらに、第1ラベルに対する、第1データ構造内の第1指示は、単一のビットでコード化される。第1指示は、第1ラベルがラベルグループのサマリーラベルを含むか否かを示す。例えば、第1データ構造は、ラベルボックス(LabelBoxとも呼ばれる)であり得る、第1指示は、is_group_labelフィールドである。一例において、ラベルグループは、同じ識別子を含み得る。サマリーラベルは、全てのラベルグループのサマリー又はタイトルを含み得る。
【0064】
上記を考慮すると、ラベルがラベルグループのサマリーラベルを含むか否かを示す指示は、単一のビットでコード化される。指示が8ビットでコード化される従来の方案に比べて、提案した方法は、指示をシグナリングするためのビット数を有利に減少するため、コーディング効率を向上させることができる。
【0065】
いくつかの実施形態では、単一のビットの直後の所定数のビットは、保留される。代替的に、単一のビットの直前の所定数のビットは、保留され得る。限定ではなく例として、所定数は、7であり得る。これらのビットは、将来の使用のために、又は、その他の適切な目的のために保留され得る。本開示の範囲は、これに限定されない。
【0066】
いくつかの実施形態では、トラックにおける第2データ構造内の第2指示が所定値を有することを特定する要件は、メディアファイル内の少なくとも1つのトラックに対して強制に要求されなくてもよい。第2指示は、対応するトラックがメディアファイルのプレゼンテーションの直接の部分を表すかどうかを示し得る。第2データ構造は、対応するトラックの特性を特定し得る。少なくとも1つのトラックは、メディアファイルの事前選択に寄与しない。一例において、少なくとも1つのトラックは、トラックグループタイプフィールド(track_group_typeフィールドとも呼ばれる)が「pres」に等しいトラックグループタイプボックス(TrackGroupTypeBoxとも呼ばれる)を含まない。第2指示は、track_in_movieフラグであり得る。第2データ構造は、トラックヘッダボックス(TrackHeaderBoxとも呼ばれる)であり得る。限定ではなく例として、所定値は、0であり得る。上記の図面及び/又は例は、単に説明を目的として記載されたものであることを理解すべきである。本開示の範囲は、これに限定されない。
【0067】
いくつかの実施形態では、トラックグループタイプフィールドが「pres」に等しいトラックグループタイプボックスは、事前選択グループボックス(PreselectionGroupBoxとも呼ばれる)であり得る。いくつかの実施形態では、メディアファイルは、ターゲットトラックのセットを含み得る。ターゲットトラックのセットのそれぞれには、事前選択グループボックスが含まれ、一方で、メディアファイルの少なくとも1つの事前選択のために必要な1つ以上のメディアコンポーネントが欠ける。つまり、ターゲットトラックのセットのそれぞれは、少なくとも1つ事前選択に必要なすべてのメディアコンポーネントを含んでいない。さらに、ターゲットトラックのセットのそれぞれにおける第2データ構造内の第2指示は、所定値を有する。一例において、PreselectionGroupBoxを含み、かつ、少なくとも1つ事前選択に必要なすべてのメディアコンポーネントを含んでいないトラックは、それらのトラックヘッダボックス内で「0」に設定されるtrack_in_movieフラグを有すべきである。
【0068】
本開示の実施形態に従って、非一時的なコンピュータ可読記録媒体を提案する。ビデオのビットストリームは、非一時的なコンピュータ可読記録媒体内に記憶される。ビットストリームは、ビデオ処理装置によって実行される方法で生成され得る。当該方法に従って、ビットストリームとビデオのメディアファイルとの間の変換が実行される。メディアファイルは、第1ラベルを有するラベルグループを含み、前記第1ラベルに対する、第1データ構造内の第1指示は、単一のビットでコード化され、第1指示は、第1ラベルがラベルグループのサマリーラベルを含むか否かを示す、
【0069】
本開示の実施形態に従って、ビデオのビットストリームを記憶する方法を提案する。当該方法では、ビットストリームとビデオのメディアファイルとの間の変換が実行される。メディアファイルは、第1ラベルを有するラベルグループを含み、前記第1ラベルに対する、第1データ構造内の第1指示は、単一のビットでコード化され、第1指示は、第1ラベルがラベルグループのサマリーラベルを含むか否かを示す。さらに、ビットストリームは、非一時的なコンピュータ可読記録媒体内に記憶される。
【0070】
本開示の実施形態に従って、もう1つの非一時的なコンピュータ可読記録媒体を提案する。ビデオのメディアファイルは、非一時的なコンピュータ可読記録媒体内に記憶される。ビットストリームは、ビデオ処理装置によって実行される方法で生成され得る。当該方法に従って、ビデオのビットストリームとメディアファイルとの間の変換が実行される。メディアファイルは、第1ラベルを有するラベルグループを含み、前記第1ラベルに対する、第1データ構造内の第1指示は、単一のビットでコード化され、第1指示は、第1ラベルがラベルグループのサマリーラベルを含むか否かを示す、
【0071】
本開示の実施形態に従って、ビデオのメディアファイルを記憶する方法を提案する。当該方法では、ビデオのビットストリームとメディアファイルとの間の変換が実行される。メディアファイルは、第1ラベルを有するラベルグループを含み、前記第1ラベルに対する、第1データ構造内の第1指示は、単一のビットでコード化され、第1指示は、第1ラベルがラベルグループのサマリーラベルを含むか否かを示す。さらに、メディアファイルは、非一時的なコンピュータ可読記録媒体内に記憶される。
【0072】
本開示の実施形態は、以下の条項を考慮して説明することができ、その特徴は、任意の合理的な態様で組み合わせることができる。
【0073】
条項1.ビデオ処理方法であって、ビデオのビットストリームと前記ビデオのメディアファイルとの間の変換を実行するステップを含み、前記メディアファイルは、第1ラベルを有するラベルグループを含み、前記第1ラベルに対する、第1データ構造内の第1指示は、単一のビットでコード化され、前記第1指示は、前記第1ラベルが前記ラベルグループのためのサマリーラベルを含むか否かを示す、方法。
【0074】
条項2.前記第1データ構造は、ラベルボックスであり、前記第1指示は、is_group_labelフィールドである、条項2に記載の方法。
【0075】
条項3.前記ラベルグループは、同じ識別子を有し、前記サマリーラベルは、全ての前記ラベルグループのサマリー又はタイトルを含む、条項1又は2に記載の方法。
【0076】
条項4.前記単一のビットの直後の所定数のビットは、保留される、条項1~3のいずれか1項に記載の方法。
【0077】
条項5.前記単一のビットの直前の所定数のビットは、保留される、条項1~3のいずれか1項に記載の方法。
【0078】
条項6.前記所定数は、7である、条項4又は5に記載の方法。
【0079】
条項7.トラックにおける第2データ構造内の第2指示が所定値を有することを特定する要件は、前記メディアファイル内の少なくとも1つのトラックに対して強制に要求されず、前記第2指示は、対応するトラックが前記メディアファイルのプレゼンテーションの直接の部分を表すかどうかを示し、かつ、前記第2データ構造は、対応するトラックの特性を特定し、前記少なくとも1つのトラックは、前記メディアファイルの事前選択に寄与しない、ことである、条項1~6のいずれか1項に記載の方法。
【0080】
条項8.前記第2指示は、track_in_movieフラグであり、前記第2データ構造は、トラックヘッダボックスであり、かつ、前記所定値は0である、条項7に記載の方法。
【0081】
条項9.前記少なくとも1つのトラックは、トラックグループタイプフィールドが「pres」に等しいトラックグループタイプボックスを含まない、条項7又は8に記載の方法。
【0082】
条項10.トラックグループタイプフィールドが「pres」に等しいトラックグループタイプボックスは、事前選択グループボックスである、条項7-9に記載の方法。
【0083】
条項11.前記メディアファイルは、ターゲットトラックのセットを含み、前記ターゲットトラックのセットのそれぞれには、前記事前選択グループボックスが含まれ、一方で、前記メディアファイルの少なくとも1つの事前選択のために必要な1つ以上のメディアコンポーネントが欠け、前記ターゲットトラックのセットのそれぞれにおける前記第2データ構造内の前記第2指示は、前記所定値を有する、条項10に記載の方法。
【0084】
条項12.前記メディアファイルは、国際標準化機構(ISO)ベースのメディアファイルフォーマットである、条項1~11のいずれか1項に記載の方法。
【0085】
条項13.前記変換は、前記メディアファイルを生成すること、及び、前記ビットストリームを前記メディアファイルに記憶すること、を含む、条項1~12のいずれか1項に記載の方法。
【0086】
条項14.前記変換は、前記ビットストリームを再構成するために、前記メディアファイルを解析することを含む、条項1~12のいずれか1項に記載の方法。
【0087】
条項15.プロセッサと命令を備える非一時的なメモリとを含む、ビデオデータを処理するための装置であって、前記命令は、前記プロセッサによって実行されると、前記プロセッサに条項1~14のいずれか1項に記載の方法を実行させる、装置。
【0088】
条項16.プロセッサに条項1~14のいずれか1項に記載の方法を実行させる命令を記憶する、 非一時的なコンピュータ可読記憶媒体。
【0089】
条項17.ビデオ処理装置によって実行される方法で生成される、ビデオのビットストリームを記憶する非一時的なコンピュータ可読記録媒体であって、前記方法は、前記ビットストリームと前記ビデオのメディアファイルとの間の変換を実行するステップを含み、前記メディアファイルは、第1ラベルを有するラベルグループを含み、前記第1ラベルに対する、第1データ構造内の第1指示は、単一のビットでコード化され、前記第1指示は、前記第1ラベルが前記ラベルグループのためのサマリーラベルを含むか否かを示す、非一時的なコンピュータ可読記録媒体。
【0090】
条項18.ビデオのビットストリームを記憶する方法であって、前記ビットストリームと前記ビデオのメディアファイルとの間の変換を実行するステップと、前記ビットストリームを非一時的なコンピュータ可読記録媒体内に記憶するステップと、を含み、前記メディアファイルは、第1ラベルを有するラベルグループを含み、前記第1ラベルに対する、第1データ構造内の第1指示は、単一のビットでコード化され、前記第1指示は、前記第1ラベルが前記ラベルグループのためのサマリーラベルを含むか否かを示す、方法。
【0091】
条項19.ビデオ処理装置によって実行される方法で生成される、ビデオのメディアファイルを記憶する非一時的なコンピュータ可読記録媒体であって、前記方法は、前記ビデオのビットストリームと前記メディアファイルとの間の変換を実行するステップを含み、前記メディアファイルは、第1ラベルを有するラベルグループを含み、前記第1ラベルに対する、第1データ構造内の第1指示は、単一のビットでコード化され、前記第1指示は、前記第1ラベルが前記ラベルグループのためのサマリーラベルを含むか否かを示す、非一時的なコンピュータ可読記録媒体。
【0092】
条項20.ビデオのメディアファイルを記憶する方法であって、前記ビデオのビットストリームと前記メディアファイルとの間の変換を実行するステップと、前記メディアファイルを非一時的なコンピュータ可読記録媒体内に記憶するステップと、を含み、前記メディアファイルは、第1ラベルを有するラベルグループを含み、前記第1ラベルに対する、第1データ構造内の第1指示は、単一のビットでコード化され、前記第1指示は、前記第1ラベルが前記ラベルグループのためのサマリーラベルを含むか否かを示す、方法。
【0093】
例示的なデバイス
図5は、本開示の様々な実施形態を実施できるコンピューティングデバイス500のブロック図を示す。コンピューティングデバイス500は、ソースデバイス110(或いは、ビデオエンコーダ114又は200)、又は、宛先デバイス120(或いは、ビデオデコーダ124又は300)として実施されるか、又は、それに含まれ得る。
【0094】
図5に示されるコンピューティングデバイス500は、単に説明を目的としたものであり、本開示の実施形態の機能及び範囲をいかなる形でも制限することを示唆するものではないことが理解されるだろう。
【0095】
図5に示すように、コンピューティングデバイス500は、汎用コンピューティングデバイス500を含む。コンピューティングデバイス500は、少なくとも1つ以上のプロセッサ又は処理ユニット510と、メモリ520と、記憶ユニット530と、1つ以上の通信ユニット540と、1つ以上の入力デバイス550と、1つ以上の出力デバイス560と、を含み得る。
【0096】
いくつかの実施形態では、コンピューティングデバイス500は、コンピューティング能力を有する任意のユーザ端末、又は、サーバ端末として実施され得る。前記サーバ端末は、サービスプロバイダが提供するサーバや大規模コンピューティングデバイスなどであり得る。前記ユーザ端末は、例えば、携帯電話、ステーション、ユニット、デバイス、マルチメディアコンピュータ、マルチメディアタブレット、インターネットノード、コミュニケータ、デスクトップコンピュータ、ラップトップコンピュータ、ノートブックコンピュータ、ネットブックコンピュータ、タブレットコンピュータ、パーソナルコミュニケーションシステム(PCS)デバイス、パーソナルナビゲーションデバイス、携帯情報端末(PDA)、オーディオ/ビデオプレーヤー、デジタルカメラ/ビデオカメラ、測位デバイス、テレビ受信機、ラジオ放送受信機、電子ブックデバイス、ゲームデバイス、又は、それらの任意の組み合わせ(これらのデバイスのアクセサリ及び周辺機器、又は、それらの任意の組み合わせを含む)を含む、任意のタイプの移動端末、固定端末、又は、携帯端末であり得る。コンピューティングデバイス500は、ユーザに対する任意のタイプのインターフェース(「ウェアラブル」回路など)をサポートすることができるものと考えられる。
【0097】
処理ユニット510は、物理又は仮想プロセッサであり、メモリ520に格納されたプログラムに基づいて、様々なプロセスを実施し得る。マルチプロセッサシステムでは、コンピューティングデバイス500の並列処理能力を向上させるために、複数の処理ユニットが、コンピュータ実行可能命令を並列に実行する。処理ユニット510は、中央処理ユニット(CPU)、マイクロプロセッサ、コントローラ、又は、マイクロコントローラと呼ばれ得る。
【0098】
コンピューティングデバイス500は、通常、様々なコンピュータ記憶媒体を含む。このような媒体は、揮発性及び不揮発性媒体、又は、取り外し可能及び取り外し不可能な媒体を含むが、これらに限定されない、コンピューティングデバイス500によってアクセス可能な任意の媒体であり得る。メモリ520は、揮発性メモリ(例えば、レジスタ、キャッシュ、ランダムアクセスメモリ(RAM))、不揮発性メモリ(例えば、読み取り専用メモリ(ROM)、電気的に消去可能なプログラム可能な読み取り専用メモリ(EEPROM)、フラッシュメモリ)、又は、それらの任意の組み合わせであり得る。記憶ユニット530は、任意の取り外し可能又は取り外し不可能な媒体であり、情報及び/又はデータを記憶するために使用でき、コンピューティングデバイス500でアクセスできる、メモリ、フラッシュメモリドライブ、磁気ディスク、又は、別の他の媒体などの機械可読媒体を含み得る。
【0099】
コンピューティングデバイス500は、追加の取り外し可能/取り外し不可能、揮発性/不揮発性メモリ媒体を、さらに含み得る。なお、
図5には示していないが、着脱可能な不揮発性磁気ディスクの読み書きを行う磁気ディスクドライブや、着脱可能な不揮発性光ディスクの読み書きを行う光ディスクドライブを提供することが可能である。このような場合、各ドライブは、1つ以上のデータ媒体インターフェースを介して、バス(図示せず)に接続され得る。
【0100】
通信ユニット540は、通信媒体を介して、さらなるコンピューティングデバイスと通信する。さらに、コンピューティングデバイス500内のコンポーネントの機能は、通信接続を介して通信できる単一のコンピューティングクラスタ又は複数のコンピューティングマシンによって実施することができる。したがって、コンピューティングデバイス500は、1つ以上の他のサーバ、ネットワーク化されたパーソナルコンピュータ(PC)、又は、さらなる一般的なネットワークノードとの論理接続を使用して、ネットワーク化された環境で動作することができる。
【0101】
入力デバイス550は、マウス、キーボード、トラッキングボール、音声入力デバイスなどの様々な入力デバイスのうちの1つ以上であり得る。出力デバイス560は、ディスプレイ、スピーカ、プリンタなどの様々な出力デバイスのうちの1つ以上であり得る。通信ユニット540によって、コンピューティングデバイス500は、記憶デバイス及び表示デバイスなどの1つ以上の外部デバイス(図示せず)と、さらに通信することができ、1つ以上のデバイスにより、ユーザがコンピューティングデバイス500と対話可能にするか、又は、必要に応じて、任意のデバイス(ネットワークカード、モデムなど)により、コンピューティングデバイス500が1つ以上の他のコンピューティングデバイスと通信可能にする。このような通信は、入出力(I/O)インターフェース(図示せず)を介して、実行できる。
【0102】
いくつかの実施形態では、単一のデバイスに統合される代わりに、コンピューティングデバイス500のいくつか又はすべてのコンポーネントが、クラウドコンピューティングアーキテクチャに配置され得る。クラウドコンピューティングアーキテクチャにおいて、コンポーネントは、遠隔的に提供され、連携して、本開示で説明される機能を実施し得る。いくつかの実施形態では、クラウドコンピューティングは、コンピューティング、ソフトウェア、データアクセス及びストレージサービスを提供し、エンドユーザは、これらのサービスを提供するシステム又はハードウェアの物理的な位置又は構成を認識する必要はない。様々な実施形態において、クラウドコンピューティングは、適切なプロトコルを使用して、広域ネットワーク(インターネットなど)を介して、サービスを提供する。例えば、クラウドコンピューティングプロバイダーは、Webブラウザ又はその他のコンピューティングコンポーネントを通じてアクセスできる、広域ネットワーク経由で、アプリケーションを提供する。クラウドコンピューティングアーキテクチャのソフトウェア又はコンポーネント及び対応するデータは、遠隔地にあるサーバに保存され得る。クラウドコンピューティング環境におけるコンピューティングリソースは、リモートデータセンターの場所に併合又は分散され得る。クラウドコンピューティングインフラストラクチャは、ユーザにとって単一のアクセスポイントとして動作するが、共有データセンターを通じて、サービスを提供し得る。したがって、クラウドコンピューティングアーキテクチャを使用して、本明細書で説明されるコンポーネント及び機能を、遠隔地にあるサービスプロバイダから提供し得る。代替形態として、それらは、従来のサーバから提供されるか、又は、クライアントデバイスに、直接又はその他の方法で、インストールされ得る。
【0103】
コンピューティングデバイス500は、本開示の実施形態において、ビデオコーディング/デコーディングを実施するために使用され得る。メモリ520は、1つ以上のプログラム命令を有する1つ以上のビデオコーディングモジュール525を含み得る。これらのモジュールは、本明細書で説明される様々な実施形態の機能を実行するように、処理ユニット510によって、アクセス可能かつ実行可能である。
【0104】
ビデオコーディングを実行する例示的な実施形態では、入力デバイス550は、エンコーディングされるビデオデータを、入力570として受信し得る。ビデオデータは、例えば、ビデオコーディングモジュール525によって処理されて、エンコーディングされたビットストリームを生成し得る。エンコーディングされたビットストリームは、出力デバイス560を介して、出力580として提供され得る。
【0105】
ビデオデコーディングを実行する例示的な実施形態では、入力デバイス550は、エンコーディングされたビットストリームを、入力570として受信し得る。エンコーディングされたビットストリームは、例えば、ビデオコーディングモジュール525によって処理されて、デコーディングされたビデオデータを生成し得る。デコーディングされたビデオデータは、出力デバイス560を介して、出力580として提供され得る。
【0106】
本開示は、その好ましい実施形態を参照して、特に、図示及び説明されたが、添付の特許請求の範囲によって定義される本出願の精神及び範囲から逸脱することなく、形態及び詳細における様々な変更を行うことができることが当業者には理解されるであろう。このような変形は、本出願の範囲に含まれるものとする。したがって、本出願の実施形態に関する前述の説明は、限定するように意図されたものではない。
【手続補正書】
【提出日】2024-08-05
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
ビデオ処理方法であって、
ビデオのビットストリームと前記ビデオのメディアファイルとの間の変換を実行するステップ、を含み、
前記メディアファイルは、第1ラベルを有するラベルグループを含み、
前記第1ラベルに対する、第1データ構造内の第1指示は、単一のビットでコード化され、
前記第1指示は、前記第1ラベルが前記ラベルグループのためのサマリーラベルを含むか否かを示す、
方法。
【請求項2】
前記第1データ構造は、ラベルボックスであり、
前記第1指示は、is_group_labelフィールドである、
請求項
1に記載の方法。
【請求項3】
前記ラベルグループは、同じ識別子を有し、
前記サマリーラベルは、全ての前記ラベルグループのサマリー又はタイトルを含む、
請求項
1に記載の方法。
【請求項4】
前記単一のビットの直後の所定数のビットは、保留される、
請求項
1に記載の方法。
【請求項5】
前記単一のビットの直前の所定数のビットは、保留される、
請求項
1に記載の方法。
【請求項6】
前記所定数は、7である、
請求項
4に記載の方法。
【請求項7】
トラックにおける第2データ構造内の第2指示が所定値を有することを特定する要件は、
前記メディアファイル内の少なくとも1つのトラックに対して課されず、
前記第2指示は、対応するトラックが前記メディアファイルのプレゼンテーションの直接部分を表すかどうかを示し、かつ、
前記第2データ構造は、前記対応するトラックの特性を特定し、前記少なくとも1つのトラックは、前記メディアファイルのための事前選択に寄与しない、
ことである、
請求項
1に記載の方法。
【請求項8】
前記第2指示は、track_in_movieフラグであり、
前記第2データ構造は、トラックヘッダボックスであり、かつ、
前記所定値は、0である、
請求項7に記載の方法。
【請求項9】
前記少なくとも1つのトラックは、トラックグループタイプフィールドが「pres」に等しいトラックグループタイプボックスを含まない、
請求項
7に記載の方法。
【請求項10】
トラックグループタイプフィールドが「pres」に等しいトラックグループタイプボックスは、事前選択グループボックスである、
請求項
7に記載の方法。
【請求項11】
前記メディアファイルは、ターゲットトラックのセットを含み、
前記ターゲットトラックのセットのそれぞれには、前記事前選択グループボックスが含まれ、一方で、前記メディアファイルの少なくとも1つの事前選択のために必要な1つ以上のメディアコンポーネントが欠け、
前記ターゲットトラックのセットのそれぞれにおける前記第2データ構造内の前記第2指示は、前記所定値を有する、
請求項10に記載の方法。
【請求項12】
前記メディアファイルは、国際標準化機構(ISO)ベースのメディアファイルフォーマットである、
請求項
1に記載の方法。
【請求項13】
前記変換は、
前記メディアファイルを生成すること、及び、
前記ビットストリームを前記メディアファイルに記憶すること、
を含む、請求項
1に記載の方法。
【請求項14】
前記変換は、前記ビットストリームを再構成するために、前記メディアファイルを解析することを含む、
請求項
1に記載の方法。
【請求項15】
プロセッサと、命令を備える非一時的なメモリとを含む、ビデオデータを処理するための装置であって、
前記命令は、前記プロセッサによって実行されると、前記プロセッサに、請求項1~14のいずれか1項に記載の方法を実行させる、
装置。
【請求項16】
プロセッサに請求項1~14
のいずれか1項に記載の方法を実行させる命令を記憶する、
非一時的なコンピュータ可読記憶媒体。
【請求項17】
ビデオのメディアファイルを記憶する方法であって、
前記ビデオのビットストリームと前記メディアファイルとの間の変換を実行するステップと、
前記メディアファイルを非一時的なコンピュータ可読記録媒体内に記憶するステップと、を含み、
前記メディアファイルは、第1ラベルを有するラベルグループを含み、
前記第1ラベルに対する、第1データ構造内の第1指示は、単一のビットでコード化され、
前記第1指示は、前記第1ラベルが前記ラベルグループのためのサマリーラベルを含むか否かを示す、
方法。
【国際調査報告】