特表2024-538232 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 中興通訊股▲ふん▼有限公司の特許一覧

特表2024-538232データ処理方法、記憶媒体、及びプログラム製品

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】

(43)【公表日】2024-10-18

(54)【発明の名称】データ処理方法、記憶媒体、及びプログラム製品

(51)【国際特許分類】

H04N 21/231 20110101AFI20241010BHJP

H04N 5/92 20060101ALI20241010BHJP

【ＦＩ】

H04N21/231

H04N5/92 010

【審査請求】有

【予備審査請求】未請求

(21)【出願番号】P 2024524448

(86)(22)【出願日】2023-03-01

(85)【翻訳文提出日】2024-04-23

(86)【国際出願番号】 CN2023079080

(87)【国際公開番号】W WO2023174059

(87)【国際公開日】2023-09-21

(31)【優先権主張番号】202210249027.9

(32)【優先日】2022-03-14

(33)【優先権主張国・地域又は機関】CN

(81)【指定国・地域】

(71)【出願人】

【識別番号】511151662

【氏名又は名称】中興通訊股▲ふん▼有限公司

【氏名又は名称原語表記】ＺＴＥＣＯＲＰＯＲＡＴＩＯＮ

【住所又は居所原語表記】ＺＴＥＰｌａｚａ，ＫｅｊｉＲｏａｄＳｏｕｔｈ，Ｈｉ－ＴｅｃｈＩｎｄｕｓｔｒｉａｌＰａｒｋ，ＮａｎｓｈａｎＳｈｅｎｚｈｅｎ，Ｇｕａｎｇｄｏｎｇ５１８０５７Ｃｈｉｎａ

(74)【代理人】

【識別番号】110001195

【氏名又は名称】弁理士法人深見特許事務所

(72)【発明者】

【氏名】李秋 ▲ティン▼

(72)【発明者】

【氏名】黄成

(72)【発明者】

【氏名】白雅賢

(72)【発明者】

【氏名】謝紹偉

【テーマコード（参考）】

5C164

【Ｆターム（参考）】

5C164SA26S

5C164SB11S

5C164SB36P

(57)【要約】

本願の実施例は、少なくとも１つのテクスチャマップ及び／又は深さマップを含むフリービュービデオデータを取得するステップと、前記少なくとも１つのテクスチャマップ及び／又は深さマップを少なくとも１つのメディアトラックにカプセル化するステップと、ターゲットビュー情報に基づいて前記フリービュービデオデータを処理するステップと、を含む、データ処理方法、装置、機器、コンピュータ読み取り可能な記憶媒体、及びコンピュータプログラム製品を提供する。

【特許請求の範囲】

【請求項1】

データ処理方法であって、
少なくとも１つのテクスチャマップ及び／又は深さマップを含むフリービュービデオデータを取得するステップと、
前記少なくとも１つのテクスチャマップ及び／又は深さマップを少なくとも１つのメディアトラックにカプセル化するステップと、
ターゲットビュー情報に基づいて前記フリービュービデオデータを処理するステップと、を含む、方法。

【請求項2】

前記少なくとも１つのテクスチャマップ及び／又は深さマップを少なくとも１つのメディアトラックにカプセル化する前記ステップは、
収集装置によって収集された前記少なくとも１つのテクスチャマップ及び／又は深さマップを少なくとも１つのメディアトラックにカプセル化するステップを含む、請求項１に記載の方法。

【請求項3】

収集装置によって収集された前記少なくとも１つのテクスチャマップ及び／又は深さマップを少なくとも１つのメディアトラックにカプセル化する前記ステップは、
前記少なくとも１つの収集装置によって収集されたテクスチャマップ及び／又は深さマップを第１メディアトラックにカプセル化するステップを含む、請求項２に記載の方法。

【請求項4】

前記第１メディアトラックのサンプルは、少なくとも１つのサブサンプルを含み、
前記サブサンプルは、前記テクスチャマップ及び／又は深さマップを含む、請求項３に記載の方法。

【請求項5】

前記サブサンプルは、前記テクスチャマップ及び／又は深さマップを含み、
前記サブサンプルは、複数の前記収集装置によって収集されたテクスチャマップ及び深さマップを含む場合、
前記サブサンプルは、１つの前記収集装置によって収集されたテクスチャマップ及び／又は深さマップを含む場合のうちの少なくとも１つを含む、請求項４に記載の方法。

【請求項6】

収集装置によって収集された前記少なくとも１つのテクスチャマップ及び／又は深さマップを少なくとも１つのメディアトラックにカプセル化する前記ステップは、
前記少なくとも１つの収集装置によって収集されたテクスチャマップを少なくとも１つのテクスチャマップメディアトラックにカプセル化するステップと、
前記少なくとも１つの収集装置によって収集された深さマップを少なくとも１つの深さマップメディアトラックにカプセル化するステップと、を含む、請求項２に記載の方法。

【請求項7】

前記第１メディアトラックのサンプルエントリは、第１ボックス及び／又は第２ボックスを含み、
前記第１ボックスは、前記収集装置の装置情報を含み、
前記第２ボックスは、前記テクスチャマップ及び／又は深さマップの属性情報を含む、請求項３に記載の方法。

【請求項8】

前記テクスチャマップメディアトラックのサンプルエントリは、第１テクスチャマップボックスを含み、
前記深さマップメディアトラックのサンプルエントリは、第１深さマップボックスを含み、
前記第１テクスチャマップボックスは、前記テクスチャマップメディアトラックに対応する収集装置の装置情報又はテクスチャマップの属性情報を含み、
前記第１深さマップボックスは、前記深さマップメディアトラックに対応する収集装置の装置情報又は深さマップの属性情報を含む、請求項６に記載の方法。

【請求項9】

前記テクスチャマップメディアトラックのサンプルエントリは、第２テクスチャマップボックスをさらに含み、
前記深さマップメディアトラックのサンプルエントリは、第２深さマップボックスをさらに含み、
前記第２テクスチャマップボックスは、前記テクスチャマップメディアトラックに対応する収集装置の装置情報又はテクスチャマップの属性情報を含み、
前記第２深さマップボックスは、前記深さマップメディアトラックに対応する収集装置の装置情報又は深さマップの属性情報を含み、
前記第１テクスチャマップボックスと前記第２テクスチャマップボックスは異なる情報を含み、前記第１深さマップボックスと前記第２深さマップボックスは異なる情報を含む、請求項８に記載の方法。

【請求項10】

前記第１ボックスは、トラック情報をさらに含み、
前記トラック情報は、テクスチャマップが存在するトラックの識別子、深さマップが存在するトラックの識別子のうちの少なくとも１つを含む、請求項７に記載の方法。

【請求項11】

前記第１テクスチャマップボックスは、テクスチャマップが存在するトラックの識別子をさらに含み、
前記第１深さマップボックスは、深さマップが存在するトラックの識別子をさらに含む、請求項８に記載の方法。

【請求項12】

前記収集装置の装置情報は、収集装置の数、収集装置の識別子、及び収集装置のパラメータ情報のうちの少なくとも１つを含み、
前記テクスチャマップの属性情報は、テクスチャマップ情報識別子、テクスチャマップ画像情報のうちの少なくとも１つを含み、
前記深さマップの属性情報は、深さマップ情報識別子、深さマップ画像情報のうちの少なくとも１つを含む、請求項７～１１のいずれか１項に記載の方法。

【請求項13】

ターゲットビュー情報を取得するステップをさらに含み、
フリービュービデオデータを取得する前記ステップは、
ターゲットビュー情報に基づいて、ターゲットビューに対応するフリービュービデオデータを取得するステップを含む、請求項１に記載の方法。

【請求項14】

前記ターゲットビュー情報に基づいて、ターゲットビューに対応するフリービュービデオデータを取得するステップは、
前記ターゲットビュー情報に基づいて、前記ターゲットビューに対応するテクスチャマップ及び／又は深さマップを取得するステップを含む、請求項１３に記載の方法。

【請求項15】

ターゲットビュー情報を取得する前記ステップは、タイミングメタデータトラックに応じてターゲットビュー情報を取得するステップを含み、前記ターゲットビューは、前記タイミングメタデータトラックの指示に従って動的に変化する、請求項１３又は１４に記載の方法。

【請求項16】

前記ターゲットビュー情報は、収集装置の識別子、収集装置のパラメータ情報、ターゲットビューの位置情報、ターゲットビューの回転情報、ターゲットビューの識別子のうちの少なくとも１つを含む、請求項１又は１３に記載の方法。

【請求項17】

前記タイミングメタデータトラックは、前記ターゲットビューに対応する前記フリービュービデオデータが存在するメディアトラックに関連付けられる、請求項１５に記載の方法。

【請求項18】

前記ターゲットビュー情報に基づいて前記フリービュービデオデータを処理する前記ステップは、
前記フリービュービデオデータ及び前記ターゲットビュー情報に基づいて、前記ターゲットビューに対応する収集装置によって収集されたテクスチャマップ及び深さマップを選択し、前記ターゲットビューに対応するテクスチャマップを合成する、
又は、
前記フリービュービデオデータ及び前記ターゲットビュー情報に基づいて、前記ターゲットビューに対応する収集装置によって収集されたテクスチャマップを選択するステップを含む、請求項１に記載の方法。

【請求項19】

第３ボックスによって前記テクスチャマップメディアトラックと前記深さマップメディアトラックとを関連付けるステップと、
第４ボックスによって前記深さマップメディアトラックと前記テクスチャマップメディアトラックとを関連付けるステップと、
第５ボックスによって前記深さマップメディアトラックと前記テクスチャマップメディアトラックとをトラックグループのように関連付けるステップとのうちの少なくともの１つをさらに含む、請求項５に記載の方法。

【請求項20】

予め設定された情報に基づいて、前記メディアトラックをメディアトラックグループとしてカプセル化するステップをさらに含み、
前記予め設定された情報は、収集装置の位置、収集装置の識別子、画像収集頻度、符号化方式のうちの少なくとも１つを含む、請求項１９に記載の方法。

【請求項21】

予め設定された情報に基づいて、前記メディアトラックをメディアトラックグループとしてカプセル化する前記ステップは、
前記予め設定された情報に基づいて、前記少なくとも２つのテクスチャマップメディアトラックを第１メディアトラックグループとしてカプセル化するステップと、
前記予め設定された情報に基づいて、前記少なくとも２つの深さマップメディアトラックを第２メディアトラックグループとしてカプセル化するステップと、
前記予め設定された情報に基づいて、前記少なくとも１つのテクスチャマップメディアトラック及び前記少なくとも１つの深さマップメディアトラックを第３メディアトラックグループとしてカプセル化するステップと、のうちの少なくとも１つを含む、請求項２０に記載の方法。

【請求項22】

画像表示装置であって、
少なくとも１つの収集装置によって収集されたテクスチャマップ及び／又は深さマップを含むフリービュービデオデータ、及びターゲットビュー情報を取得するように構成された取得モジュールと、
前記少なくとも１つのテクスチャマップ及び／又は深さマップを少なくとも１つのメディアトラックにカプセル化するように構成されたカプセル化モジュールと、
前記ターゲットビュー情報に基づいて、前記フリービュービデオデータを処理するように構成された処理モジュールと、を含む、装置。

【請求項23】

前記少なくとも１つのテクスチャマップ及び／又は深さマップを少なくとも１つのメディアトラックにカプセル化する前記ステップは、
収集装置によって収集された前記少なくとも１つのテクスチャマップ及び／又は深さマップを少なくとも１つのメディアトラックにカプセル化するステップを含む、請求項２２に記載の装置。

【請求項24】

【請求項25】

画像表示装置であって、
少なくとも１つのテクスチャマップ及び／又は深さマップを含むフリービュービデオデータ、及びターゲットビュー情報を取得するように構成された取得モジュールと、
カプセル化されたフリービュービデオデータを記憶するように構成された記憶モジュールと、
前記ターゲットビュー情報に基づいて、前記フリービュービデオデータを処理するように構成された処理モジュールと、を含む、装置。

【請求項26】

請求項１～２１のいずれか１項に記載のデータ処理方法を実行するためのコンピュータ実行可能命令を記憶しているコンピュータ読み取り可能な記憶媒体。

【請求項27】

コンピュータプログラム又はコンピュータ命令を含むコンピュータプログラム製品であって、
前記コンピュータプログラム又はコンピュータ命令は、コンピュータ読み取り可能な記憶媒体に記憶されており、コンピュータ機器のプロセッサは、前記コンピュータ読み取り可能な記憶媒体から前記コンピュータプログラム又はコンピュータ命令を読み取り、前記コンピュータプログラム又はコンピュータ命令を実行することにより、請求項１～２１のいずれか１項に記載のデータ処理方法を前記コンピュータ機器に実行させる、コンピュータプログラム製品。

【発明の詳細な説明】

【技術分野】

【0001】

本願は、出願番号が２０２２１０２４９０２７．９、出願日が２０２２年３月１４日の中国特許出願に基づいて提出され、当該中国特許出願の優先権を主張しており、当該中国特許出願の全ての内容はここで参考として本願に組み込まれている。

【0002】

本願の実施例は、コンピュータの技術分野、特にデータ処理方法、装置、機器、記憶媒体、及びプログラム製品に関する。

【背景技術】

【0003】

コンピュータ技術の発展に伴い、ユーザは自由な視点の切り替えにより、ビデオ再生やバーチャルゲームなどのシーンでより強いライブ感を得られることを望んでいる。

【0004】

関連技術では、メディアデータ処理や伝送の効率が低いため、ユーザによる柔軟な視点切り替えやシーン表示が困難である。いかにデータ処理効率を向上させ、ユーザの使用感を向上させるかは、現在、検討および解決の急務となっている。

【発明の概要】

【発明が解決しようとする課題】

【0005】

本願の実施例は、データ処理効率を向上させることを目的とするデータ処理方法、装置、機器、コンピュータ読み取り可能な記憶媒体、及びコンピュータプログラム製品を提供する。

【課題を解決するための手段】

【0006】

第１態様では、本願の実施例は、
少なくとも１つの収集されたテクスチャマップ及び／又は深さマップを含むフリービュービデオデータを取得するステップと、
前記少なくとも１つのテクスチャマップ及び／又は深さマップを少なくとも１つのメディアトラックにカプセル化するステップと、
ターゲットビュー情報に基づいて前記フリービュービデオデータを処理するステップと、を含む、データ処理方法を提供する。

【0007】

第２態様では、本願の実施例は
少なくとも１つのテクスチャマップ及び／又は深さマップを含むフリービュービデオデータ、及びターゲットビュー情報を取得するように構成された取得モジュールと、
前記少なくとも１つのテクスチャマップ及び／又は深さマップを少なくとも１つのメディアトラックにカプセル化するように構成されたカプセル化モジュールと、
前記ターゲットビュー情報に基づいて、前記フリービュービデオデータを処理するように構成された処理モジュールと、を含む、画像表示装置を提供する。

【0008】

第３態様では、本願の実施例は、
第１態様に記載のデータ処理方法を実行するためのコンピュータ実行可能命令を記憶しているコンピュータ読み取り可能な記憶媒体を提供する。

【0009】

第４態様では、本願の実施例は、
コンピュータプログラム又はコンピュータ命令を含むコンピュータプログラム製品であって、
前記コンピュータプログラム又はコンピュータ命令は、コンピュータ読み取り可能な記憶媒体に記憶されており、コンピュータ機器のプロセッサは、前記コンピュータ読み取り可能な記憶媒体から前記コンピュータプログラム又はコンピュータ命令を読み取り、前記コンピュータプログラム又はコンピュータ命令を実行することにより、第１態様に記載のデータ処理方法を前記コンピュータ機器に実行させる、コンピュータプログラム製品を提供する。

【図面の簡単な説明】

【0010】

【図1】ユーザが表示装置を介してライブビデオを視聴するときの模式図である。

【図2】ユーザが他の表示装置を介してビデオを視聴するときの模式図である。

【図3】本願の一実施例によるデータ処理方法の適用シーンのシステムアーキテクチャの模式図である。

【図4】本願の一実施例によるデータ処理方法のフローチャートである。

【図5】本願の一実施例によるデータ処理方法のフローチャートである。

【図6】本願の一実施例によるデータ処理方法のフローチャートである。

【図7】本願の一実施例によるシングルトラックカプセル化フリービュービデオデータのファイルの構造図である。

【図8】本願の一実施例によるシングルトラックカプセル化モード拡張に基づくフリービュービデオのメディアファイルの構造図である。

【図9】本願の一実施例によるシングルトラックカプセル化に基づくフリービュービデオデータの処理のフローチャートである。

【図10】本願の一実施例によるマルチトラックカプセル化フリービュービデオデータのファイルの構造図である。

【図11】本願の一実施例によるマルチトラックカプセル化モード拡張に基づくフリービュービデオのメディアファイルの構造図である。

【図12】本願の一実施例によるマルチトラックカプセル化に基づくフリービュービデオデータの処理のフローチャートである。

【図13】本願の一実施例によるメディアトラックのグループ化の模式図である。

【図14】本願の一実施例によるデータ処理装置の構造模式図である。

【図15】本願の一実施例によるデータ処理装置の構造模式図である。

【図16】本願の一実施例によるデータ処理装置の構造模式図である。

【図17】本願の一実施例によるデータ処理装置の構造模式図である。

【図18】本願の一実施例によるデータ処理機器の構造模式図である。

【図19】本願の一実施例によるデータ処理機器の構造模式図である。

【発明を実施するための形態】

【0011】

本願の目的、技術案及び利点をより明確にするために、以下では、図面及び実施例を参照して、本願をさらに詳細に説明する。本明細書に記載された具体的な実施例は、本願を説明するためにのみ使用され、本願を限定するために使用されないことを理解されたい。

【0012】

なお、機能モジュール分割は装置の模式図に示され、論理的順序はフローチャートに示されているが、場合によっては、装置のモジュール分割とは異なってもよく、又は示されたもくしは説明されたステップは、フローチャートに示された順序とは異なるもので実行されてもよい。明細書及び特許請求の範囲、並びに前述の図面における「第１」、「第２」などの用語は、特定の順序又は優先順位を説明するために使用されるのではなく、類似の対象を区別するために使用される。

【0013】

本願の実施例の説明において、別途明確な限定がない限り、「設ける」、「取り付ける」、「接続」などの用語は広義に理解すべきであり、当業者は技術案の具体的な内容と合わせて、本願の実施例における上記の用語の具体的な意味を合理的に決定することができる。本願の実施例では、「さらに」、「例示的に」、又は「任意選択で」などの語は、例、例証、又は例示を示すもので、他の実施例又は設計案よりも好ましい又は有利であると解釈されるべきではない。「さらに」、「例示的に」、又は「任意選択で」のような語の使用は、関連する概念を具体的な方法で提示することを意図している。

【0014】

本願の実施例は、携帯電話、タブレット、コンピュータ、ノートパソコン、ウェアラブルデバイス、車載デバイス、液晶ディスプレイ、ブラウン管モニタ、ホログラフィックディスプレイ、又はプロジェクタなどの端末機器など、画像及びビデオの表示に関連する様々な機器に適用することができ、また、携帯電話、タブレット、コンピュータ、ノートパソコン、ウェアラブルデバイス、車載機器などのサーバ機器など、画像及びビデオデータを処理する様々な機器に適用することができる。本願の実施例は、これらに限定されるものではない。

【0015】

没入型メディアは、ビデオやオーディオなどの技術により、ユーザに視覚や聴覚などの面で高度にリアルな仮想空間環境を体験させ、その場にいるような感覚を生み出す。関連技術では、ユーザがヘッドマウントディスプレイデバイスを装着した後、頭部を自由に回転させることで３６０度のビデオを視聴することができる、３自由度（３ＤＯＦ：３ＤｅｇｒｅｅｓｏｆＦｒｅｅｄｏｍ）の没入体験ができる。また、より良い視覚体験を得るために、関連技術は、強化された３自由度（３ＤＯＦ＋：３ＤｅｇｒｅｅｓｏｆＦｒｅｅｄｏｍＰｌｕｓ）と６自由度（６ＤＯＦ：６ＤｅｇｒｅｅｓｏｆＦｒｅｅｄｏｍ）のビデオをサポートすることができ、つまり、ユーザの頭部や体は空間の中で限られた又は自由に移動することができ、ビューの自由な切り替えを実現し、よりリアルな没入感を実現することができる。

【0016】

６ＤＯＦビデオを例にすると、６ＤＯＦビデオの収集と再生には多くの実現方式が存在し、フリービュービデオはその中の１つである。フリービュービデオは、通常、同じ３次元シーンを向いて撮影されたマルチカメラマトリックスアレイから収集された異なるビューのビデオの集合である。ユーザは、フリービュービデオの視聴中に、対応するビデオ画像を現実視点又は合成された仮想視点で視聴しながら、自由にビューを切り替えることができる。フリービュービデオデータには、マルチビューのテクスチャマップと深さマップが含まれており、ユーザが現実視点に切り替えた場合、カメラで収集された現実のビデオを直接表示することができ、ユーザが仮想視点に切り替えた場合、仮想視点に対応する仮想視点テクスチャマップをリアルタイムに合成することができる。フリービュービデオデータの収集過程におけるカメラ配置の位置と数、リアルタイムで仮想視点画像を合成する過程におけるカメラに対応するビデオデータの選択、伝送及び処理は、データ合成の時間消費、品質などにそれぞれ異なる程度の影響を与え、これはユーザの使用体験に直接影響する。

【0017】

フリービュービデオとは、一般的に複数のカメラを用いて対象シーンの周囲を撮影し、仮想ビュー合成技術を利用して仮想ビューの画像を取得する新しい仮想現実（ＶＲ：ＶｉｒｔｕａｌＲｅａｌｉｔｙ）ビデオ技術である。フリービュービデオ技術を利用することで、ユーザはその対象シーンを任意のビューで見ることができ、パノラマビデオよりも優れた視聴体験を得ることができる。ただし、現在、対象シーンをライブ配信している中に、対象シーンのフリービュービデオをユーザに提供することはできない。したがって、ビデオをライブ配信している中に、どのようにしてユーザが自分の必要なビューでビデオライブ配信の中のいくつかの素晴らしいビデオを視聴することができるかは、当業者が早急に解決すべき技術的課題である。

【0018】

本技術案を詳しく述べるために、図１、図２の例として、関連技術についてさらに説明する。

【0019】

図１は、ユーザが表示装置を介してライブビデオを視聴するときの模式図である。図１に示すように、ユーザ２００は、第１表示装置１００を介してライブコンテンツを視聴する。しかし、ユーザ２００は、表示装置が現在再生しているビューからしかライブのシーンコンテンツを見ることができず、自分の希望に応じて視聴ビューを調整することは困難である。

【0020】

図２は、ユーザが他の表示装置を介してビデオを視聴するときの模式図である。図２に示すように、ユーザ２００は、第２表示装置３００を介してビデオコンテンツを視聴する。ユーザ２００は、第２表示装置３００により、頭部を回転させることにより、また、第２表示装置３００のリモコン３１０により、視聴ビューを切り替えることができる。この方式は、３次元画像を提供し、ユーザの所望に応じて、視聴角度を調整することができるが、画像選択が制限され、伝送及び処理効率が低く、３ＤＯＦ＋及び６ＤＯＦの適用シーンを完全に満足することが困難であると同時に、リアルタイムに画像を表示又は合成する場合にも、この技術を応用することが困難である。

【0021】

本願の実施例は、テクスチャマップ、深さマップをメディアトラックにカプセル化することにより、データ処理効率を向上させ、データカプセル化、伝送をより柔軟にし、さらに、フリービュービデオの処理効率を向上させるデータ処理方法、装置、機器、コンピュータ読み取り可能な記憶媒体、及びコンピュータプログラム製品を提供する。

【0022】

以下、図面を参照して、本願の実施例についてさらに説明する。

【0023】

図３は、本願の一実施例によるデータ処理方法の適用シーンのシステムアーキテクチャの模式図である。図３に示すように、このシステムアーキテクチャは、データ処理装置４００及びデータ収集装置を含む。

【0024】

本実施例では、第１画像収集装置５１０、第２画像収集装置５２０、２台のデータ収集装置を例に挙げる。第１画像収集装置５１０は、第１領域Ａの画像データを収集し、第２画像収集装置５２０は、第２領域Ｂの画像データを収集する。

【0025】

本実施例のフリービュービデオデータは、第１画像収集装置５１０及び第２画像収集装置５２０によって収集される。

【0026】

データ処理装置４００は、フリービュービデオデータを取得する。

【0027】

一実施形態では、フリービュービデオデータは、第１画像収集装置５１０によって収集された第１テクスチャマップと、第２画像収集装置５２０によって収集された第２テクスチャマップとを含む。

【0028】

一実施形態では、フリービュービデオデータは、第１画像収集装置５１０によって収集された第１深さマップと、第２画像収集装置５２０によって収集された第２深さマップとを含む。

【0029】

別の実施形態では、フリービュービデオデータは、第１画像収集装置５１０の第１テクスチャマップ、第１深さマップ、及び第２画像収集装置５２０の第２テクスチャマップ、第２深さマップを含む。

【0030】

なお、テクスチャマップ、深さマップは、収集装置によって収集されてもよく、コンピュータ生成などの他の方法によって取得されてもよい。

【0031】

第１ビュー６１０は、第１領域Ａを見るビューであり、第２ビュー６２０は、第２領域Ｂを見るビューである。

【0032】

一実施形態では、データ処理装置４００は、第１領域Ａを見ているときに、第１画像収集装置５１０によって収集された第１テクスチャマップを取得し、カプセル化モジュール、処理モジュールによってカプセル化して処理し、現在のフリービュービデオデータを取得する。第２領域Ｂを見たい場合、データ処理装置４００は、第２画像収集装置５２０によって収集された第２テクスチャマップを取得し、カプセル化モジュール、処理モジュールによってカプセル化して処理し、現在のフリービュービデオデータを取得する。本実施例の技術案を使用すると、所望のビューにリアルタイムで迅速かつ自由に切り替えることでビューに関する体験を向上させることができる。

【0033】

別の実施形態では、第３領域Ｃを第３ビュー６３０（すなわち、仮想視点）で見ることが望ましい場合、データ処理装置４００は、まず、第３領域Ｃに隣接する第１領域Ａ及び／又は第２領域Ｂを決定し、すなわち、第３ビュー６３０に隣接する第１ビュー６１０又は第２ビュー６２０を決定し、次に、第１ビュー６１０に対応する収集装置５１０によって収集された第１深さマップ及び／又は第２ビュー６２０に対応する収集装置５２０によって収集された第２深さマップを合成処理することによって、第３ビュー６３０に対応する第３深さマップを得、最後に、第１ビュー６１０に対応する収集装置５１０によって収集された第１テクスチャマップ及び／又は第２ビュー６２０に対応する収集装置５２０によって収集された第２テクスチャマップと、合成処理によって得られた第３深さマップとを組み合わせて、第３ビュー６３０（すなわち、仮想視点）に対応する第３テクスチャマップを合成して、現在のフリービュービデオデータを取得する。本実施例の技術案を使用すると、収集装置の使用量を削減するだけでなく、リアルタイムにビューを自由に切り替えて見ることができ、よりリアルな没入体験を得ることができる。

【0034】

別の実施例では、テクスチャマップ及び深さマップは、他の方法で得ることもできる。例えば、深さマップはテクスチャマップ計算により得られ、テクスチャマップ及び深さマップはコンピュータ合成によりシミュレーションデータを得ることもできる。

【0035】

図４は、本願の一実施例によるデータ処理方法のフローチャートである。図４に示すように、このデータ処理方法は、端末用としてもサーバ用としてもよい。図４の実施例において、このデータ処理方法は、ステップＳ１０００、ステップＳ２０００、及びステップＳ３０００を含んでもよいが、これらに限定されない。

【0036】

ステップＳ１０００：フリービュービデオデータを取得する。

【0037】

一実施例では、フリービュービデオデータは、テクスチャマップを含む。

【0038】

一実施例では、フリービュービデオデータは、深さマップを含む。

【0039】

一実施例では、フリービュービデオデータは、テクスチャマップ及び深さマップを含む。

【0040】

なお、テクスチャマップ、深さマップは、収集装置によって収集されてもよく、コンピュータ生成などの他の方法によって取得されてもよい。以下、収集装置による収集を例に説明する。

【0041】

フリービュービデオは、同一の３次元シーンに向けて撮影されたマルチカメラマトリックスアレイから収集された異なるビューのビデオの集合である。フリービュービデオデータは、通常、複数の収集装置によって収集されるが、異なる角度と異なる位置に配置された収集装置により、撮影したいシーンや対象について画像を収集する。収集装置は、カメラなど、画像収集を行うことができる任意の装置であってもよい。なお、収集装置は１つ又は複数であってもよく、収集装置の数は本願の実施例において限定されない。

【0042】

フリービュービデオは、フリービューでのビデオ画像の合成をサポートすることができ、そのビデオデータには、通常、テクスチャマップと深さマップが含まれる。テクスチャマップは、被写体の表面の性質に関するデータを記載したものである。テクスチャマップをレンダリングすることにより、リアルなビデオ画像を得ることができる。深さマップは距離画像とも呼ばれ、物体の可視表面の幾何学的形状を直接反映し、深さマップはグレースケール画像に似ているが、深さマップ内の各画素値は物体からカメラまでの実際の距離である。なお、端末の記憶能力及び計算能力が制限されている場合、又はビュー切り替えの自由度が制限されている場合など、いくつかの適用シーンでは、フリービュービデオデータは、テクスチャマップ又は深さマップのいずれかのみを含んでもよい。

【0043】

一実施例では、切り替え後のビューに対応する収集装置がない場合、仮想視点合成が行われる。仮想視点合成再構成過程では、ビュー切り替え後のビュー近傍の複数のカメラを決定した後、カメラの深さマップを処理し、処理した深さマップに基づいてカメラのテクスチャマップを結合して仮想視点に対応するテクスチャマップを合成する。したがって、本実施例に対応する適用シーンでは、フリービュービデオは、テクスチャマップデータ及び深さマップデータを含む。

【0044】

一実施例では、視点切り替えの自由度は制限され、すなわち、仮想視点を合成せずにカメラが対応する現実視点間を切り替える場合、又は収集装置が深さマップ収集能力を有していない場合に限り、本実施例に対応する適用シーンでは、フリービュービデオはテクスチャマップデータのみを含み、深さマップデータは含まない。あるいは、切り替え後のビューに対応する収集装置がある場合には、深さマップを用いて仮想視点を合成することなく、収集装置に対応するテクスチャマップを用いる。

【0045】

ステップＳ２０００：少なくとも１つのテクスチャマップ及び／又は深さマップを少なくとも１つのメディアトラックにカプセル化する。

【0046】

メディアシステムにおけるフリービュービデオデータのカプセル化記憶、伝送、及び処理をサポートするために、フリービュービデオデータの合理的なフォーマット構造をメディアファイルに定義する必要がある。

【0047】

なお、本願の実施例では、１つの実施形態は、国際標準化機構の基本メディアファイルフォーマット（ＩＳＯＢＭＦＦ：ＩｎｔｅｒｎａｔｉｏｎａｌＯｒｇａｎｉｚａｔｉｏｎｆｏｒＳｔａｎｄａｒｄｉｚａｔｉｏｎＢａｓｅＭｅｄｉａＦｉｌｅＦｏｒｍａｔ）に基づいて、フリービュービデオデータをファイルに記憶することである。なお、制限されたスキーム、すなわち仮想視点を合成する必要がある場合の適用シーンでは、情報ボックス、トラック参照ボックス、トラックグループボックスなどのＩＳＯ基本メディアファイルフォーマットは、ＩＳＯ／ＩＥＣＪＴＣ１／ＳＣ２９／ＷＧ１１ビデオ像専門家グループ（ＭＰＥＧ：ＭｏｖｉｎｇＰｉｃｔｕｒｅＥｘｐｅｒｔｓＧｒｏｕｐ，）が策定したＭＰＥＧ－４Ｐａｒｔ１２ＩＳＯＢａｓｅＭｅｄｉａＦｉｌｅＦｏｒｍａｔを参照することができる。

【0048】

ＩＳＯ基本メディアファイルフォーマットに基づいて、すべてのデータはボックス（Ｂｏｘ）にカプセル化されており、ＩＳＯ基本メディアファイルフォーマットは、いくつかのボックスで構成され、それぞれのボックスは、タイプと長さを持ち、１つのデータオブジェクトと見なすことができ、他のボックスを収容することができるボックスは、コンテナボックスと呼ばれる。ＭＰ４ファイルを例にとると、ＭＰ４ファイルは「ｆｔｙｐ」型のボックスを１つ持っており、ｆｔｙｐボックスはファイルフォーマットの識別子であり、ファイルに関するいくつかの情報を含んでいる。ＭＰ４ファイルには、「ＭＯＯＶ」型のボックス（ＭｏｖｉｅＢｏｘ）も１つあり、これはコンテナボックスであり、ＭＯＯＶボックスのサブボックスには、メディアのコンテンツを記述するための情報であるメディアのメタデータ情報が含まれている。ＭＰ４ファイルのメディアデータは「ｍｄａｔ」型のボックス（ＭｅｄｉａＤａｔａＢｏｘ）に含まれており、ｍｄａｔボックスもコンテナボックスであり、複数あってもよい。メディアデータがすべて他のファイルを参照している場合、ｍｄａｔボックスがないこともある。メディアデータの構造はメタデータによって記述され、「ｍｅｔａ」型のボックス（Ｍｅｔａｂｏｘ）を使用して、いくつかの一般的又は追加的な非タイミングメタデータを記述することができ、ｍｅｔａボックスもコンテナボックスである。

【0049】

タイミングメタデータトラックは、特定のサンプルに関連付けられたタイミングメタデータを確立するＩＳＯＢＭＦＦのメカニズムである。タイミングメタデータは、メディアデータとの結合が少なく、一般に「記述的」である。

【0050】

一般的な適用シーンでは、フリービュービデオデータにはテクスチャマップデータと深さマップデータが含まれており、処理中に自由に切り替えられるビューに基づいて仮想視点の合成が行われることが多いため、フリービュービデオメディアトラックは制限されたビデオとしてメディアファイルに表現されるべきである。本願の実施例では、ＩＳＯ／ＩＥＣ１４４９６－１２標準規格で定義されたＲｅｓｔｒｉｃｔｅｄＳｃｈｅｍｅＩｎｆｏＢｏｘのＳｃｈｅｍｅＴｙｐｅＢｏｘを使用してフリービュービデオメディアトラックが記述され、ＳｃｈｅｍｅＴｙｐｅＢｏｘのｓｃｈｅｍｅ＿ｔｙｐｅは「ａｓ３ｆ」に設定されている。

【0051】

フリービュービデオトラックは、ＶｉｓｕａｌＳａｍｐｌｅＥｎｔｒｙを使用して、ＩＳＯ／ＩＥＣ１９９４６－１２で定義されている。フリービュービデオメディアトラックがテクスチャマップのみを含む場合、テクスチャマップメディアトラックである。深さマップメディアトラックは、ＭｅｄｉａＢｏｘにおけるＨａｎｄｌｅｒＢｏｘの処理タイプ（ｈａｎｄｌｅｒｔｙｐｅ）を用いて「ａｕｘｖ」タイプであることは、深さマップ情報が深さマップトラックに含まれていることを意味する。

【0052】

なお、フリービュービデオがテクスチャマップデータのみを含む場合、仮想視点合成の処理過程は存在せず、フリービュービデオメディアトラックは制限されたビデオとしてメディアファイルに表現されない、すなわち、上記ＳｃｈｅｍｅＴｙｐｅＢｏｘを用いてフリービュービデオメディアトラックを記述することはしない。

【0053】

一実施例では、収集装置によって収集されたテクスチャマップ及び深さマップは、１つのメディアトラックにカプセル化され、すなわち、１つのメディアトラックには、テクスチャマップ及び深さマップが含まれている。

【0054】

一実施例では、収集装置によって収集されたテクスチャマップは、１つのメディアトラックにカプセル化され、すなわち、１つのメディアトラックには、テクスチャマップが含まれている。

【0055】

一実施例では、収集装置によって収集された深さマップは、１つのメディアトラックにカプセル化され、すなわち、１つのメディアトラックには、深さマップが含まれている。

【0056】

上記の実施例では、１つのメディアトラックを使用してビデオデータをカプセル化する方式は、総称してシングルトラックカプセル化と呼ばれてもよい。シングルトラックカプセル化が適するフリービュービデオデータは、通常、収集装置の数が多くなく、単一フレームのテクスチャマップの画素数が大きくない場合に適用され、この場合、端末が、対応する収集装置のテクスチャマップ及び／又は深さマップの取得を要求すると、サーバは、メディアファイル内のすべてのカメラのテクスチャマップ及び／又は深さマップを端末に伝送し、端末は、すべての収集装置のテクスチャマップ及び／又は深さマップを事前にダウンロードすることができる。端末は、カプセル化を解除し、復号するときに、ビューが自由に切り替えられた後のビューに関する収集装置、すなわち、仮想視点合成が可能な収集装置のテクスチャマップ及び／又は深さマップを選択し、このようにして、必要な収集装置に対応するテクスチャマップおよび／または深さマップを端末上でローカルに直接検索でき、すべて又は必要な関連収集装置に対応するテクスチャマップおよび深さマップを復号できる。

【0057】

一実施例では、収集装置によって収集されたテクスチャマップ及び深さマップは、複数のメディアトラックにカプセル化され、すなわち、１つ又は複数のメディアトラックには、テクスチャマップが含まれ、他の１つ又は複数のメディアトラックには、深さマップが含まれる。

【0058】

一実施例では、収集装置によって収集されたテクスチャマップは、複数のメディアトラックにカプセル化され、すなわち、複数のメディアトラックには、テクスチャマップが含まれる。

【0059】

一実施例では、収集装置によって収集された深さマップは、複数のメディアトラックにカプセル化され、すなわち、複数のメディアトラックには、深さマップが含まれる。

【0060】

上記の実施例では、複数のメディアトラックを使用してビデオデータをカプセル化する方式は、総称してマルチトラックカプセル化と呼ばれてもよい。シングルトラックカプセル化とは異なり、マルチトラックカプセル化は、通常、収集装置の数が多く、単一フレームのテクスチャマップの画素数が大きく、データ量が多くなる場合に適用され、収集装置によって収集されたテクスチャマップ及び深さマップをそれぞれ異なるメディアトラックにカプセル化することにより、異なる符号化方式、アクセス要求、伝送能力に応じて、各メディアトラックに１つ又は複数の収集装置のテクスチャマップデータ及び深さマップデータをカプセル化する。テクスチャマップデータをカプセル化するメディアトラックはテクスチャマップメディアトラックであり、深さマップデータをカプセル化するメディアトラックは深さマップメディアトラックである。

【0061】

なお、テクスチャマップ及び／又は深さマップを１つ又は複数のメディアトラックにカプセル化する実行主体は、カプセル化能力を有する任意の処理装置であってもよい。

【0062】

ステップＳ３０００：ターゲットビュー情報に基づいて、フリービュービデオデータを処理する。

【0063】

ユーザがビュー切り替えを行った後、端末は、ユーザが希望するフリービューやディレクタが希望する再生ビューを反映した、通常は視聴位置や視聴方向などの情報を含むターゲットビュー情報を取得することができ、このターゲットビュー情報に基づいて、仮想視点の合成の要否や合成に必要な元の収集装置のビデオデータを判断することができる。

【0064】

一実施例では、ターゲットビュー情報は、収集装置の識別子、収集装置のパラメータ情報、ターゲットビューの位置情報、ターゲットビューの回転情報、ターゲットビューの識別子などを含む。

【0065】

一実施例では、端末はデータ処理能力が高いので、端末自身がターゲットビュー情報に基づいてフリービュービデオデータを処理し、処理されたフリービュービデオデータを表示する。

【0066】

図５は、本願の一実施例によるデータ処理方法のフローチャートである。図５に示すように、端末のデータ処理プロセスを具体的に説明すると、ステップＳ１１００、ステップＳ３１１０、及びステップＳ３１２０を含んでもよいが、これらに限定されない。

【0067】

ステップＳ１１００：端末は、メディアファイルの取得をサーバに要求する。

【0068】

ステップＳ３１１０：端末は、取得したメディアファイルを復号／デカプセル化し、メディアファイル内のフリービュービデオデータ、対応するメタデータ情報、及びターゲットビュー情報に基づいて、仮想視点のテクスチャマップを合成する。

【0069】

ステップＳ３１２０：端末は、合成した仮想視点テクスチャマップを表示する。

【0070】

一実施例では、端末は強いデータ処理能力を有していないので、サーバは、仮想視点のテクスチャマップを合成するなど、ターゲットビュー情報に基づいてフリービュービデオデータを処理し、処理したビデオデータを表示のために端末に送信してもよい。

【0071】

図６は、本願の一実施例によるデータ処理方法のフローチャートである。図５に示すように、端末及びサーバのデータ処理プロセスを具体的に説明すると、ステップＳ４０００、ステップＳ３２１０及びステップＳ３２２０を含んでもよいが、これらに限定されない。

【0072】

ステップＳ４０００：端末は、ターゲットビュー情報をサーバに送信する。

【0073】

ステップＳ３１１０：サーバ側は、ターゲットビュー情報に基づいて記憶されているメディアファイルを取得し、フリービュービデオデータ及び対応するメタデータ情報を抽出し、仮想視点のテクスチャマップを合成する。

【0074】

ステップＳ３１２０：端末は、サーバで処理された自由視点ビデオデータを受信し、合成された仮想視点のテクスチャマップを表示する。

【0075】

なお、図５と図６に対応する実施例では、端末が仮想視点テクスチャマップの合成を行うか、サーバが仮想視点テクスチャマップの合成を行うかにかかわらず、本願によるデータ処理方法が使用され、処理されたテクスチャマップ及び／又は深さマップが少なくとも１つのメディアトラックにカプセル化される。

【0076】

図７は、シングルトラック（ｓｉｎｇｌｅｔｒａｃｋ）カプセル化フリービュービデオデータのファイルの構造図である。図７に示すように、ＩＳＯ基本メディアファイルフォーマットに基づくメディアファイルは、１つのメディアトラックを有し、このトラックには、ＭＯＯＶボックス及びｍａｄｔボックスが含まれ、ＭＯＯＶボックスには、ＦｒｅｅＶｉｅｗＥｘｔＩｎｆｏＢｏｘサブボックス及びＴｒａｃｋＢｏｘサブボックスが含まれ、メディアのメタデータ情報がカプセル化され、ｍａｄｔボックスには、サンプル（Ｓａｍｐｌｅ）の形でフリービュービデオデータがカプセル化されている。

【0077】

別の実施例では、ＭＯＯＶボックスには、ＴｒａｃｋＢｏｘサブボックス、ＴｒａｃｋＢｏｘサブボックスに含まれるＦｒｅｅＶｉｅｗＥｘｔＩｎｆｏＢｏｘサブボックスが含まれる。

【0078】

シングルトラックカプセル化フリービュービデオデータは、複数の元の収集装置によって収集されたテクスチャマップ及び深さマップデータを含み、これらのテクスチャマップ及び深さマップデータは、すべて１つのメディアトラックに記憶され、すなわち、メディアトラック内の各フレーム画像は、ある時点におけるすべての元の収集装置のテクスチャマップ（Ｔｅｘｔｕｒｅ）及び／又は深さマップ（Ｄｅｐｔｈ）を含み、各元の収集装置に対応するテクスチャマップ及び深さマップは個別にコーデックされ、すなわち、収集装置間のテクスチャマップ及び深さマップデータのコーデックに依存関係がない。端末は、シングルトラックカプセル化フリービュービデオを取得する際に、全ての元の収集装置のテクスチャマップ及び深さマップデータが送信される。

【0079】

端末は、フリービュービデオデータを有するメディアファイルを取得した後、各フレーム画像において、仮想視点を合成するために必要なビュー近傍のいくつかの元の収集装置のテクスチャマップ及び深さマップを選択して復号する。シングルトラックカプセル化メディアトラック内の各サンプルは、ある時点にすべての元の収集装置によって収集されたテクスチャマップ及び／又は深さマップを含み、サンプルを複数のサブサンプル（ＳｕｂＳａｍｐｌｅ）に分割することによって、各サブサンプルが、１つの収集装置に対応するテクスチャマップ又は／及び深さマップを含むようにする。より具体的には、サブサンプルの情報は、ＳａｍｐｌｅＴａｂｌｅＢｏｘ又はＴｒａｃｋＦｒａｇｍｅｎｔＢｏｘのＳｕｂＳａｍｐｌｅＩｎｆｏｒｍａｔｉｏｎＢｏｘボックスによって記述され、サブサンプルの使用は、サブサンプルの情報ボックス内のｆｌａｇｓフィールド（ｆｌａｇｓフィールドによれば、サブサンプルに記憶されているデータタイプ、すなわちテクスチャマップ及び／又は深さマップの３つを識別することができる）に従って行われる必要があり、特に、フリービュービデオデータに対応する各サンプルの特定の構成構造はｃｏｄｅｃ＿ｓｐｅｃｉｆｉｃ＿ｐａｒａｍｅｔｅｒｓによって記述され、以下は２つの具体例を示す。

【0080】

例１：
ｆｌａｇｓは、サブサンプルにカプセル化されている情報のタイプを示し、具体的なタイプは次のとおりである。
ｆｌａｇｓ値は０であり、元の収集装置に対応するテクスチャマップ及び深さマップのサブサンプルに基づいており、１つのサブサンプルには、１つの元の収集装置に対応するテクスチャマップ又は深さマップが含まれている。
ｆｌａｇｓ値は１であり、元の収集装置のサブサンプルに基づいており、１つのサブサンプルには、１つの元の収集装置に対応するテクスチャマップ及び深さマップが含まれている。
if (flags==0）{
unsigned int(8) camera_id;
unsigned int(1) payload_type;
unsigned int(1) All_data;// 任意選択で
bit(21) reserved = 0;
}
else if (flags==1）{
unsigned int(8) camera_id;
bit(21) reserved = 0;
}

【0081】

例２：
ｆｌａｇｓは、サブサンプルにカプセル化されている情報のタイプを示し、具体的なタイプは次のとおりである。
ｆｌａｇｓ値は０であり、データタイプ（元のマップ、深さマップ）のサブサンプルに基づいており、１つのサブサンプルには、１つの元の収集装置に対応するテクスチャマップ又は深さマップが含まれている。
ｆｌａｇｓ値は１であり、元の収集装置のサブサンプルに基づいており、１つのサブサンプルは、１つの元の収集装置に対応するテクスチャマップ及び深さマップが含まれている。
if (flags==0）{
unsigned int(16) camera_id;
bit(16) reserved = 0;
}
else if (flags==1）{
unsigned int(8) payload_type;
bit(24) reserved = 0;
}
ここで、ｃａｍｅｒａ＿ｉｄは、現在のサブサンプルにおけるテクスチャマップ又は深さマップに対応する収集装置（カメラ）識別子を示し、
ｐａｙｌｏａｄ＿ｔｙｐｅは、サブサンプルに含まれるデータタイプを示し、値が０の場合、テクスチャマップを含み、値が１の場合、深さマップを含み、値が２の場合、ＳＥＩ情報などのパラメータ情報を含む。
Ａｌｌ＿ｄａｔａは、サブサンプルがすべての元の収集装置に対応するテクスチャマップ又は深さマップを含むことを示す。

【0082】

なお、仮想視点の合成プロセスは、好ましくは選択された元の収集装置の深さマップを処理することであり、カプセル化の構造及び復号プロセスをさらに単純化するために、メディアトラック内の各サンプルは、複数の元の収集装置のテクスチャマップを含むテクスチャマップサブサンプルと、複数の元の収集装置の深さマップ、さらにすべての元の収集装置の深さマップを含む深さマップサブサンプルとを含む。具体的なサブサンプル構造は、本実施例で定義されたｃｏｄｅｃ＿ｓｐｅｃｉｆｉｃ＿ｐａｒａｍｅｔｅｒｓを使用して記述してもよい。

【0083】

なお、例１のように定義する場合、サブサンプル構造情報は１つのＳｕｂＳａｍｐｌｅＩｎｆｏｒｍａｔｉｏｎＢｏｘを使用して記述され、ｆｌａｇｓが０の場合、ｃａｍｅｒａ＿ｉｄは０に設定され、当該サブサンプルがすべての元の収集装置のテクスチャマップ又は深さマップを含むことを意味する。例２のように定義する場合、サブサンプル構造情報は、２つのＳｕｂＳａｍｐｌｅＩｎｆｏｒｍａｔｉｏｎＢｏｘを使用して記述されてもよく、そのうちの１つのＳｕｂＳａｍｐｌｅＩｎｆｏｒｍａｔｉｏｎＢｏｘ内のｆｌａｇｓ値は０であり、ｃａｍｅｒａ＿ｉｄは０に設定されており、すべての元の収集装置の深さマップ又はテクスチャマップが１つのサブサンプル内にあることを示しており、別のＳｕｂＳａｍｐｌｅＩｎｆｏｒｍａｔｉｏｎＢｏｘのｆｌａｇｓ値は１であり、ｆｌａｇｓ値が１の場合、サブサンプルがテクスチャマップ又は深さマップを含むことを示す。

【0084】

ＳｕｂＳａｍｐｌｅＩｎｆｏｒｍａｔｉｏｎＢｏｘは、サンプル中の各サブサンプルのサイズ、対応する元の収集装置、画像データのタイプ（テクスチャマップ又は深さマップ）に対して、仮想視点を合成するために必要な元のカメラのテクスチャマップ及び深さマップを選択的に部分復号することができ、それによって、データ処理効率を向上させ、フリービュービデオの適用シーンを拡張することができる。

【0085】

一実施例では、ユーザのビューは、自由な切り替え過程において、元の収集装置に対応する現実視点の間で切り替えられるだけであり、その場合、仮想視点を合成するプロセスは存在しない。この場合、通常、シングルトラックカプセル化フリービュービデオデータは、元の収集装置のテクスチャマップデータであり、サブサンプルには深さマップは存在しない、すなわち、ｐａｙｌｏａｄ＿ｔｙｐｅの値は常に０である。

【0086】

いくつかの実施例では、フリービュービデオデータの量が非常に大きい、すなわち、元の収集装置の配置数が多い、収集されるテクスチャマップの画素数が大きい、又は元の収集装置間にグループ化関係が存在する場合には、フリービュービデオデータのカプセル化は、拡張シングルトラックカプセル化方式によって行われてもよい。

【0087】

図８は、シングルトラックカプセル化モード拡張に基づくフリービュービデオのメディアファイルの構造図である。図８に示すように、ＩＳＯ基本メディアファイルフォーマットに基づくメディアファイルは、複数のメディアトラックを有し、トラックには、ＭＯＯＶボックス及びｍａｄｔボックスが含まれ、ＭＯＯＶボックスには、ＦｒｅｅＶｉｅｗＥｘｔＩｎｆｏＢｏｘサブボックス及びＳｕｂＳａｍｐｌｅＩｎｆｏＢｏｘサブボックスが収容され、メディアのメタデータ情報がカプセル化され、ｍａｄｔボックスには、サンプル（Ｓａｍｐｌｅ）の形でフリービュービデオデータがカプセル化されている。

【0088】

拡張されたシングルトラックカプセル化メディアファイル構造では、テクスチャマップ及び深さマップは１対１で対応し、トラック内の各サンプルは、ある時点における複数の元の収集装置に対応するテクスチャマップ及び深さマップを含み、サブサンプルの情報は、ＳａｍｐｌｅＴａｂｌｅＢｏｘ又はＴｒａｃｋＦｒａｇｍｅｎｔＢｏｘ内のＳｕｂＳａｍｐｌｅＩｎｆｏｒｍａｔｉｏｎＢｏｘのボックスによって記述され、上記の実施例で定義されたｃｏｄｅｃ＿ｓｐｅｃｉｆｉｃ＿ｐａｒａｍｅｔｅｒｓ構文要素を使用して記述され、各サブサンプルは、１つ又は複数の元の収集装置のテクスチャマップ及び／又は深さマップを含む。

【0089】

一実施例では、メディアトラックにカプセル化されたテクスチャマップ及び深さマップがＡＶＳ２、ＡＶＣ、ＨＥＶＣなどのビデオ符号化方式を使用する場合、フリービュービデオの符号化情報の拡張又は補完が存在する場合、そのような拡張／補完の符号化情報は、メディアトラックのサンプルに直接記憶されてもよく、特定の拡張／補完の符号化情報又は他のパラメータ情報は、（ＩＳＯ／ＩＥＣ１４４９６－１２において）ＭｅｄｉａＩｎｆｏｒｍａｔｉｏｎＢｏｘ又はＶｉｓｕａｌＳａｍｐｌｅＥｎｔｒｙに含まれるフリービュー拡張のボックスを定義することによって、記述してもよく、以下は２つの具体例を示す。

【0090】

例１：
シングルトラックカプセル化フリービュービデオのメディアトラックは、フリービュー情報ボックスＦｒｅｅＶｉｅｗＥｘｔＩｎｆｏＢｏｘとペイロード情報ボックスＰａｙｌｏａｄＩｎｆｏＢｏｘの２つのボックスを含むサンプルエントリＶｉｓｕａｌＳａｍｐｌｅＥｎｔｒｙを使用する。
フリービュー情報ボックスＦｒｅｅＶｉｅｗＥｘｔＩｎｆｏＢｏｘは、メディアトラック中のフリービュービデオデータに対応する元の収集装置情報を記述し、ビューと収集装置を対応させることで、カメラ情報をビューの情報と見なすことができる。具体的な構文セマンティクスは次のとおりである。
Box Type: 'fvei'
Container: MediaInformationBox or VisualSampleEntry
Mandatory: No
Quantity: Zero or one.
aligned(8) class FreeViewInfoBox extends FullBox(' fvin', 0, 0){
unsigned int(1) texture_in_track;
unsigned int(1) depth_in_track;
unsigned int(16) num_cameras;
for (i=0; i<num_cameras; i++) {
unsigned int(16) camera_id;
unsigned int(1) int_camera_flag;
unsigned int(1) ext_camera_flag;
if(int_camera _flag)
IntCameraInfoStruct();
if(Ext_camera _flag)
ExtCameraInfoStruct();}}
ペイロード情報ボックスＰａｙｌｏａｄＩｎｆｏＢｏｘは、メディアトラック内のフリービュービデオの元のカメラ／ビューに対応するテクスチャマップ情報ＴｅｘｔｕｒｅＩｎｆｏｓｔｒｕｃｔ（）と深さマップ情報ＤｅｐｔｈＩｎｆｏｓｔｒｕｃｔ（）を記述する。具体的な構文セマンティクスは次のとおりである。
aligned(8) class PayloadInfoBox extends FullBox(' plin', 0, 0){
unsigned int(1) texture_info_flag;
unsigned int(1) depth_info_flag;
unsigned int(16) num_cameras;
for (i=0; i<num_cameras; i++) {
unsigned int(16) camera_id;
if(texture_info_flag)
TextureInfostruct();
if(depth_info_flag)
DepthInfostruct();}}aligned(8) TextureInfostruct(){
unsigned int(8) texture_padding_size；
unsigned int(16) texture_top_left_x；
unsigned int(16) texture_top_left_y；
unsigned int(16) texture_bottom_right_x；
unsigned int(16) texture_bottom_right_y;}
aligned(8) DepthInfostruct(){
unsigned int(8) depth_padding_size；
unsigned int(16) depth_top_left_x；
unsigned int(16) depth_top_left_y；
unsigned int(16) depth_bottom_right_x；
unsigned int(16) depth_bottom_right_y;
unsigned int(8) depth_range_near;
unsigned int(8) depth_range_far;
unsigned int(8) depth_scale_type;}

【0091】

例２：
シングルトラックカプセル化フリービュービデオのメディアトラックは、フリービュー情報拡張ボックスＦｒｅｅＶｉｅｗＥｘｔＩｎｆｏＢｏｘを含むサンプルエントリＶｉｓｕａｌＳａｍｐｌｅＥｎｔｒｙを使用する。フリービュー情報拡張ボックスは、メディアトラック内のフリービュービデオデータに対応する元の収集装置情報と、元の収集装置に対応するテクスチャマップ及び深さマップ情報とを記述する。
aligned(8) class FreeViewExtInfoBox extends FullBox(' fvei', 0, 0){
unsigned int(1) texture_in_track;
unsigned int(1) depth_in_track;
unsigned int(16) num_cameras;
for (i=0; i<num_cameras; i++) {
unsigned int(16) camera_id;
unsigned int(1) int_camera_flag;
unsigned int(1) ext_camera_flag;
unsigned int(1) decoding_info_flag;
if(int_camera _flag)
IntCameraInfoStruct();
if(Ext_camera _flag)
ExtCameraInfoStruct();
unsigned int(1) texture_info_flag;
unsigned int(1) depth_info_flag;
if(texture_info_flag){
unsigned int(8) texture_padding_size；
unsigned int(16) texture_top_left_x[i]；
unsigned int(16) texture_top_left_y[i]；
unsigned int(16) texture_bottom_right_x[i]；
unsigned int(16) texture_bottom_right_y[i];
}
if(depth_info_flag){
unsigned int(8) depth_padding_size；
unsigned int(16) depth_top_left_x[i]；
unsigned int(16) depth_top_left_y[i]；
unsigned int(16) depth_bottom_right_x[i]；
unsigned int(16) depth_bottom_right_y[i];
unsigned int(8) depth_range_near;
unsigned int(8) depth_range_far;
unsigned int(8) depth_scale_type;}}}
ここで、ｔｅｘｔｕｒｅ＿ｉｎ＿ｔｒａｃｋは、メディアトラックにテクスチャマップが含まれているか否かを示し、値が１の場合、テクスチャマップが含まれ、値が０の場合、テクスチャマップが含まれない。
ｄｅｐｔｈ＿ｉｎ＿ｔｒａｃｋは、メディアトラックに深さマップが含まれているか否かを示し、値が１の場合、深さマップが含まれ、値が０の場合、深さマップが含まれない。
ｎｕｍ＿ｃａｍｅｒａｓは、深さマップ又はテクスチャマップに対応するメディアトラック内の元のカメラの数を示す。
ｃａｍｅｒａ＿ｉｄは、元のカメラの識別子を示す。
ｉｎｔ＿ｃａｍｅｒａ＿ｆｌａｇは、元のカメラの内部パラメータが表示されるか否かを示し、値が１の場合、内部パラメータが表示され、値が０の場合、内部パラメータが表示されない。内部パラメータの構文は、ＡＶＳ３－Ｐ１のＩｎｔＣａｍｅｒａＩｎｆｏＳｔｒｕｃｔ（）構文セマンティクスを参照する。
ｅｘｔ＿ｃａｍｅｒａ＿ｆｌａｇは、元のカメラの外部パラメータが表示されるか否かを示し、値が１の場合、外部パラメータが表示され、値が０の場合、外部パラメータが表示されない。外部パラメータの構文は、ＡＶＳ３－Ｐ１のＥｘｔＣａｍｅｒａＩｎｆｏＳｔｒｕｃｔ（）構文セマンティクスを参照する。
元のカメラ情報は、元のカメラの内部パラメータ、外部パラメータによって記述することができる。同一の元のカメラのパラメータ情報は、１つのボックスにのみ記述されている。
ｔｅｘｔｕｒｅ＿ｉｎｆｏ＿ｆｌａｇは、テクスチャマップに関する記述メタデータ情報が含まれているか否かを示し、値が１の場合、メタデータ情報が含まれ、値が０の場合、メタデータ情報が含まれない。
ｄｅｐｔｈ＿ｉｎｆｏ＿ｆｌａｇは、深さマップに関する記述メタデータ情報が含まれているか否かを示し、値が１の場合、メタデータ情報が含まれ、値が０の場合、メタデータ情報が含まれない。
ｔｅｘｔｕｒｅ＿ｐａｄｄｉｎｇ＿ｓｉｚｅは、テクスチャマップの拡張エッジの画素数を示す。
ｔｅｘｔｕｒｅ＿ｔｏｐ＿ｌｅｆｔ＿ｘは、ビデオフレームプレーン内の対応する元のカメラに対応するテクスチャマップの左上隅のx座標を表す。
ｔｅｘｔｕｒｅ＿ｔｏｐ＿ｌｅｆｔ＿ｙは、ビデオフレームプレーン内の対応する元のカメラに対応するテクスチャマップの左上隅のy座標を示す。
ｔｅｘｔｕｒｅ＿ｂｏｔｔｏｍ＿ｒｉｇｈｔ＿ｘは、ビデオフレームプレーン内の対応する元のカメラに対応するテクスチャマップの右下隅のx座標を示す。
ｔｅｘｔｕｒｅ＿ｂｏｔｔｏｍ＿ｒｉｇｈｔ＿ｙは、ビデオフレームプレーン内の対応する元のカメラに対応するテクスチャマップの右下隅のｙ座標を示す。
ｄｅｐｔｈ＿ｐａｄｄｉｎｇ＿ｓｉｚｅは、深さマップを拡張する画素数を示す。
ｄｅｐｔｈ＿ｔｏｐ＿ｌｅｆｔ＿ｘは、ビデオフレームプレーン内の対応する元のカメラに対応する深さマップの左上隅のx座標を示す。
ｄｅｐｔｈ＿ｔｏｐ＿ｌｅｆｔ＿ｙは、ビデオフレームプレーン内の対応する元のカメラに対応する深さマップの左上隅のy座標を示す。
ｄｅｐｔｈ＿ｂｏｔｔｏｍ＿ｒｉｇｈｔ＿ｘは、ビデオフレームプレーン内の対応する元のカメラに対応する深さマップの右下隅のx座標を示す。
ｄｅｐｔｈ＿ｂｏｔｔｏｍ＿ｒｉｇｈｔ＿ｙは、ビデオフレームプレーン内の対応する元のカメラに対応する深さマップの右下隅のｙ座標を示す。
ｄｅｐｔｈ＿ｒａｎｇｅ＿ｎｅａｒは、深さマップによって定量化された光学中心からの最小深さ距離を示す。
ｄｅｐｔｈ＿ｒａｎｇｅ＿ｆａｒは、深さマップによって定量化された光学中心からの最大深さ距離を示す。
ｄｅｐｔｈ＿ｓｃａｌｅ＿ｔｙｐｅは、深さマップを表すダウンサンプリングのタイプを示す。
なお、このサンプルエントリＶｉｓｕａｌＳａｍｐｌｅＥｎｔｒｙには、フリービュー情報ボックスＦｒｅｅＶｉｅｗＥｘｔＩｎｆｏＢｏｘとペイロード情報ボックスＰａｙｌｏａｄＩｎｆｏＢｏｘが含まれる。

【0092】

一実施例では、フリービュー情報ボックスＦｒｅｅＶｉｅｗＥｘｔＩｎｆｏＢｏｘには、トラック情報が含まれ、トラック情報は、テクスチャマップが存在するトラックの識別子及び／又は深さマップが存在するトラックの識別子を含んでもよい。

【0093】

一実施例では、フリービュー情報ボックスＦｒｅｅＶｉｅｗＥｘｔＩｎｆｏＢｏｘには、収集装置の装置情報が含まれ、装置情報は、収集装置の数、収集装置の識別子、収集装置のパラメータ情報を含んでもよい。収集装置の設置方法及び属性に関する情報であれば、装置情報としてフリービュー情報ボックスＦｒｅｅＶｉｅｗＥｘｔＩｎｆｏＢｏｘにカプセル化されてもよい。

【0094】

一実施例では、ペイロード情報ボックスＰａｙｌｏａｄＩｎｆｏＢｏｘには、テクスチャマップの属性情報及び／又は深さマップの属性情報が含まれ、テクスチャマップの属性情報はテクスチャマップ情報識別子、テクスチャマップ画像情報などを含んでもよく、深さマップの属性情報は深さマップ情報識別子、深さマップ画像情報などを含んでもよい。
図９は、シングルトラックカプセル化に基づくフリービュービデオデータの処理のフローチャートであり、少なくともステップＳ１３００及びステップＳ３３００を含む。

【0095】

ステップＳ１３００：端末は、すべての元の収集装置によって収集されたテクスチャマップ及び深さマップを取得する。

【0096】

ステップＳ３３００：端末は、ターゲットビュー情報に基づいて、選択されたいくつかの元の収集装置のテクスチャマップ及び深さマップを部分的に復号し、仮想視点テクスチャマップを合成する。

【0097】

図１０は、マルチトラック（ｍｕｌｔｉｔｒａｃｋ）カプセル化フリービュービデオデータのファイルの構造図である。図１０に示すように、ＩＳＯ基本メディアファイルフォーマットに基づくメディアファイルは、複数のメディアトラックを有する。各トラックは、１つの元の収集装置によって収集されたテクスチャマップ（すなわち、テクスチャマップメディアトラック）又は深さマップ（すなわち、深さマップメディアトラック）をカプセル化することができる。マルチトラックカプセル化構造により、任意の１つの収集されたテクスチャマップ又は深さマップを柔軟に取得することができる。

【0098】

深さマップは、符号化効率が高く、復号複雑度が低いグレースケールマップを用いて表現してもよく、複数の元の収集装置の複数の深さマップを１つ又は複数の深さマップメディアトラックにカプセル化してもよい。また、複数の元のカメラのテクスチャマップも、１つ又は複数のテクスチャマップメディアトラックにカプセル化してもよい。

【0099】

一実施形態では、テクスチャマップメディアトラック及び深さマップメディアトラックに対応する元の収集装置の数は、元の収集装置のテクスチャマップ又は深さマップの画像サイズ、符号化方法などの違いに応じて、同じであっても異なっていてもよい。具体的には、テクスチャマップメディアトラック及び深さマップメディアトラックに対応する元の収集装置の数が異なる場合、ｍ個の元の収集装置のテクスチャマップはｉ個のテクスチャマップメディアトラックにカプセル化され、対応する深さマップはｊ個の深さマップメディアトラックにカプセル化され、ここで、ｉはｊになどしくなく、ｉはｍ以下であり、ｊはｍより小さい。別の実施形態では、複数の元の収集装置の深さマップを１つのメディアトラックに記憶し、対応するテクスチャマップを複数のメディアトラックに記憶してもよい。

【0100】

一実施形態では、元の収集装置は、カメラ配置の位置属性、カメラの内部パラメータ属性、カメラに対応するテクスチャマップ又は深さマップの符号化依存関係などのカメラ属性に応じてグループ化され、同じグループの元の収集装置のテクスチャマップ又は深さマップは、１つのメディアトラックにカプセル化される。図１１は、マルチトラックカプセル化モード拡張に基づくフリービュービデオのメディアファイルの構造図である。図１１に示すように、同種のマルチグラフに基づくマルチトラックカプセル化フリービュービデオデータのファイル構造の１つである。

【0101】

マルチトラックカプセル化には、ＭＯＯＶボックス及びｍａｄｔボックスが含まれ、ＭＯＯＶボックスには、ＦｒｅｅＶｉｅｗＥｘｔＩｎｆｏＢｏｘサブボックスが収容され、メディアのメタデータ情報がカプセル化され、ｍａｄｔボックスには、サンプル（Ｓａｍｐｌｅ）の形でフリービュービデオデータがカプセル化されている。

【0102】

マルチトラックカプセル化フリービュービデオデータは、複数の元の収集装置によって収集されたテクスチャマップ及び深さマップデータを含み、テクスチャマップ及び深さマップデータは、それぞれ異なるメディアトラックに記憶される。さらに、テクスチャマップはテクスチャマップメディアトラックに記憶され、深さマップは深さマップメディアトラックに記憶される。すなわち、テクスチャマップメディアトラック内の各フレーム画像は、ある時点におけるすべての元の収集装置のテクスチャマップ（Ｔｅｘｔｕｒｅ）を含み、深さマップメディアトラック内の各フレーム画像は、ある時点におけるすべての元の収集装置の深さマップ（Ｄｅｐｔｈ）を含み、各元の収集装置に対応するテクスチャマップ及び深さマップは関連付けられてコーデックされ、すなわち、１つの収集装置のテクスチャマップと深さマップデータのコーデックに依存／マッピング関係が存在する。端末は、マルチトラックカプセル化フリービュービデオを取得する際に、ユーザの現在のビューであるターゲットビュー情報に基づいて、対応する収集装置によって収集されたテクスチャマップ及び深さマップデータを伝送する。

【0103】

端末は、ターゲットビュー情報に対応するフリービュービデオデータのメディアファイルを取得した後、各フレーム画像において、仮想視点を合成するために必要なビュー近傍のいくつかの元の収集装置のテクスチャマップ及び深さマップを選択して復号する。マルチトラックカプセル化されたテクスチャマップメディアトラック内の各サンプルは、ある時点において元の収集装置によって収集されたテクスチャマップを含み、マルチトラックカプセル化された深さマップメディアトラック内の各サンプルは、ある時点において元の収集装置によって収集された深さマップを含む。さらに、サンプルを複数のサブサンプル（ＳｕｂＳａｍｐｌｅ）に分割することによって、各サブサンプルが、１つの収集装置に対応するテクスチャマップ又は深さマップを含むようにしてもよい。より具体的には、サブサンプルの情報は、ＳａｍｐｌｅＴａｂｌｅＢｏｘ又はＴｒａｃｋＦｒａｇｍｅｎｔＢｏｘのＳｕｂＳａｍｐｌｅＩｎｆｏｒｍａｔｉｏｎＢｏｘボックスによって記述され、サブサンプルの使用は、サブサンプル情報ボックス内のｆｌａｇｓフィールド（ｆｌａｇｓフィールドは、サブサンプルに記憶されているデータタイプを識別することができる）に従って行われる必要があり、ｆｌａｇｓフィールドの値が０の場合、テクスチャマップ及び深さマップはメディアトラック内にあり、特に、フリービュービデオデータに対応する各サンプルの特定の構成構造は、ｃｏｄｅｃ＿ｓｐｅｃｉｆｉｃ＿ｐａｒａｍｅｔｅｒｓによって記述される。

【0104】

テクスチャマップ及び深さマップはそれぞれ異なるメディアトラックにカプセル化され、すなわち、テクスチャマップはテクスチャマップメディアトラックにカプセル化され、深さマップは深さマップメディアトラックにカプセル化される。仮想視点を合成するプロセスは次の通りである。まず、ビューが切り替えられた後にビューの近傍のいくつかの元の収集を特定し、元々収集された深さマップを処理し、更に元々収集されたテクスチャマップ及び処理された後の深さマップに基づいて仮想視点に対応するテクスチャマップを合成する。
同じ元の収集装置のテクスチャマップ及び深さマップをカプセル化するテクスチャマップメディアトラックと深さマップメディアトラックとの間に、関連付け／参照／マッピング関係が設定されている。以下に３つの具体的な例を示す。
例１：

【0105】

ＩＳＯ／ＩＥＣ１４４９４－１２で定義されているＴｒａｃｋＲｅｆｅｒｅｎｃｅＢｏｘ（参照トラックボックス）は、メディアトラック間の参照関係に使用でき、定義されている参照タイプｒｅｆｅｒｅｎｃｅ＿ｔｙｐｅが「ａｕｘｌ」又は「ｖｄｅｐ」の場合に、関連付け／参照／マッピングされたメディアトラックの補助メディア（深さマップなど）を記述する。本実施例では、ＩＳＯ／ＩＥＣ１４４９４－１２で定義されている方法を直接使用して、ＴｒａｃｋＲｅｆｅｒｅｎｃｅＢｏｘを深さマップメディアトラックに含み、同じ元の収集装置に対応するテクスチャマップメディアトラックに関連付け／参照／マッピングし、ここでｒｅｆｅｒｅｎｃｅ＿ｔｙｐｅは「ａｕｘｌ」又は「ｖｄｅｐ」である。通常、「ａｕｘｌ」は、復号依存性のある参照又は関連付け関係に使用される。
例２：

【0106】

ＩＳＯ／ＩＥＣ１４４９４－１２で定義されているＴｒａｃｋＲｅｆｅｒｅｎｃｅＢｏｘは、トラック間の参照関係のために使用でき、新しい参照タイプｒｅｆｅｒｅｎｃｅ＿ｔｙｐｅを定義することによって、テクスチャマップメディアトラックの深さマップメディアトラックへの関連付け／参照／マッピングを記述する。本実施例では、ｒｅｆｅｒｅｎｃｅ＿ｔｙｐｅは「ｔｄｒｆ」に設定され、この参照タイプを含むＴｒａｃｋＲｅｆｅｒｅｎｃｅＢｏｘのテクスチャマップメディアトラックは、ＴｒａｃｋＲｅｆｅｒｅｎｃｅＢｏｘで示される深さマップメディアトラックを参照または関連付けられる。
例３：

【0107】

トラックグループの方式でテクスチャマップメディアトラック及び深さマップメディアトラックをグループ化することは、深さマップメディアトラックに対応する元の収集装置とテクスチャマップメディアトラックに対応する収集装置とが完全に対応していない場合に特に適している。例えば、複数の元の収集装置の深さマップは１つのメディアトラックに記憶され、対応するテクスチャマップは複数のメディアトラックに記憶される。
トラックグループは、同じ元の収集装置に対応するテクスチャマップメディアトラックと深さマップメディアトラックを１つのグループとすることによってグループ化される。同じ元の収集装置のテクスチャマップメディアトラック及び深さマップメディアトラックに対応するトラックグループはＡｔｔｒＡｎｄＤｅｐＧｒｏｕｐＢｏｘによって示され、このボックスは、ＩＳＯ／ＩＥＣ１４４９４－１２で定義されているＴｒａｃｋＧｒｏｕｐＴｙｐｅＢｏｘ（トラックタイプボックス）を拡張することにより、ｔｒａｃｋ＿ｇｒｏｕｐ＿ｔｙｐｅが「ｔａｄｇ」に設定されており、具体的な構文構造は次のとおりである。
aligned(8) class AttrAndDepGroupBox extends TrackGroupTypeBox(' tadg ') {
unsigned int(8) num_camera;
unsigned int(1) unequal_flag;
for(int i=0; i< num_camera; i++)
unsigned int(8) camera_id;
}
ここで、ｎｕｍ＿ｃａｍｅｒａは、メディアトラックグループ内のテクスチャマップに対応する元の収集装置の数を示す。
ｕｎｅｑｕａｌ＿ｆｌａｇは、メディアトラックグループにおいて、深さマップメディアトラックに対応する元の収集装置の数が、テクスチャマップメディアトラックに対応する元の収集装置の数と同じであるか否かを示し、１の場合、対応する元の収集装置の数が異なることを示し、通常、深さマップメディアトラックにおける対応する元の収集装置の数がテクスチャマップメディアトラックにおける対応する元の収集装置の数より多く、０の場合、対応する元の収集装置の数が同じであることを示す。
ｃａｍｅｒａ＿ｉｄは、メディアトラックグループにおいて、テクスチャマップ及び深さマップに対応する同じ元の収集装置の識別子を示す。

【0108】

一実施形態では、ｕｎｅｑｕａｌ＿ｆｌａｇが１の場合、１つの深さマップメディアトラックには、同じタイプのＡｔｔｒＡｎｄＤｅｐＧｒｏｕｐＢｏｘが複数存在する可能性があるが、ｔｒａｃｋ＿ｇｒｏｕｐ＿ｉｄが異なる。
一実施形態では、フリービュービデオがＡＶＣのＭＶＤ方式で符号化される場合、ＩＳＯ／ＩＥＣ１４４９４－１５で定義されているボックスタイプ「ｖｗｉｄ」の視点識別子ボックス（ＶｉｅｗＩｄｅｎｔｉｆｉｅｒＢｏｘ）を使用して、各メディアトラックに含まれる元の収集装置に対応する視点を記述することができ、視点の識別子、ビューに対応する他の参照視点などの情報を含むことができ、このボックスは、メディアトラックにテクスチャマップ、深度マップ、またはその両方が含まれるかどうかを記述するために使用することもできる。

【0109】

一実施形態では、深さマップ及びテクスチャマップが異なるメディアトラックにある場合、深さマップメディアトラック及びテクスチャマップメディアトラックは、参照タイプｒｅｆｅｒｅｎｃｅ＿ｔｙｐｅが「ｄｅｐｓ」であるＴｒａｃｋＲｅｆｅｒｅｎｃｅＢｏｘ（このボックスは深さマップメディアトラックに含まれる。）ボックスによって、同じ元の収集装置に対応するテクスチャマップメディアトラックに関連付け／参照／マッピングされる。

【0110】

なお、このサンプルエントリＶｉｓｕａｌＳａｍｐｌｅＥｎｔｒｙには、フリービュー情報ボックスＡｖｓＦｒｅｅＶｉｅｗＩｎｆｏＢｏｘ及びペイロード情報ボックスＰａｙｌｏａｄＩｎｆｏＢｏｘが含まれる。

【0111】

一実施例では、フリービュー情報ボックスＡｖｓＦｒｅｅＶｉｅｗＩｎｆｏＢｏｘには、トラック情報が含まれ、トラック情報は、テクスチャマップが存在するトラックの識別子又は深さマップが存在するトラックの識別子を含んでもよい。

【0112】

一実施例では、フリービュー情報ボックスＡｖｓＦｒｅｅＶｉｅｗＩｎｆｏＢｏｘには、収集装置の装置情報が含まれ、装置情報は、収集装置の数、収集装置の識別子、収集装置のパラメータ情報を含んでもよい。収集装置の設置方法及び属性に関する情報であれば、装置情報としてフリービュー情報ボックスＡｖｓＦｒｅｅＶｉｅｗＩｎｆｏＢｏｘにカプセル化されてもよい。

【0113】

【0114】

なお、マルチトラックカプセル化は、少なくともテクスチャマップメディアトラック及び深さマップメディアトラックを有する。各テクスチャマップメディアトラック及び深さマップメディアトラックのサンプルエントリＶｉｓｕａｌＳａｍｐｌｅＥｎｔｒｙには、それぞれフリービュー情報ボックスＡｖｓＦｒｅｅＶｉｅｗＩｎｆｏＢｏｘ及びペイロード情報ボックスＰａｙｌｏａｄＩｎｆｏＢｏｘが含まれる。
図１２は、マルチトラックカプセル化に基づくフリービュービデオデータの処理のフローチャートであり、少なくともステップＳ１４００及びステップＳ３４００を含む。

【0115】

ステップＳ１４００：端末は、ターゲットビュー情報に基づいて、ビュー近傍の元の収集装置によって収集されたテクスチャマップ及び深さマップを取得する。

【0116】

ステップＳ３４００：端末は、必要ないくつかの元の収集装置のテクスチャマップ及び深さマップが存在する１つ又は複数のテクスチャマップメディアトラック及び深さマップメディアトラックを取得し、メディアトラック内の必要ないくつかの元の収集装置のテクスチャマップ及び深さマップデータを抽出し、仮想視点のテクスチャマップを合成する。

【0117】

シングルトラックカプセル化では、端末はすべての収集装置によって収集されたフリービュービデオデータを取得する必要があり、これに対し、マルチトラックカプセル化構造では、端末は、ターゲットビュー情報に基づいて、それぞれテクスチャマップメディアトラック及び深さマップメディアトラックでターゲットビュー情報に対応するテクスチャマップ及び／又は深さマップを選択的に取得し、それによって、データ伝送及び処理効率を向上させることができる。

【0118】

いくつかの適用シーンでは、ユーザはフリービュービデオを視聴する時に、自分の必要に応じて自主的にビューを切り替えることができ、ディレクタによる推薦などの方式によってビューを切り替え、すなわち、受動的にビューを切り替えることもでき、この場合、動的ビューのタイミングメタデータを定義することによって、動的に変化するビュー情報及びそれに対応する元の収集装置の情報を記述する必要があり、すなわち、ビューとビデオ再生時間とを関連付ける必要があるため、フリービュービデオを再生する過程で、ある時刻の推薦ビュー及びその近傍の元の収集装置の情報に基づいて、提示する必要がある対応するビューのコンテンツを合成する必要がある。タイミングメタデータは、ターゲットビューに対応する前記フリービュービデオデータが存在するメディアトラックと相互に関連付けられたタイミングメタデータトラックにカプセル化される。

【0119】

具体的には、動的ビューのタイミングメタデータトラックのサンプルエントリタイプは「ｄｙｆｖ」であり、構文は以下のように定義される。
DynamicFreeViewSampleEntry extends MetaDataSampleEntry ('dyfv'){
string freeview_description;
unsigned int(8) play_camera_id;
}
ここで、ｆｒｅｅｖｉｅｗ＿ｄｅｓｃｒｉｐｔｉｏｎは、空白文字で終わる文字列であり、フリービューでのテキスト記述情報を提供する。
ｐｌａｙ＿ｃａｍｅｒａ＿ｉｄは、最初の再生時にビューが対応する元のカメラの識別子を示し、通常は仮想視点合成を必要としない。
動的ビューのタイミングメタデータトラック内の各サンプルは、フリービューサンプルフォーマットによって、特定のビューの動的状況を記述する。
aligned(8) FreeviewSample(){
unsigned int(1) dynamic_switch_flag;
if(dynamic_switch_flag)
unsigned int(1) virtual_view_flag;
if(virtual_view_flag){
unsigned int(8) original_camera_num;
for(int i=0; i< original_camera_num; i++){
unsigned int(8) original_camera_id[i];
unsigned int(1) int_camera _flag;
unsigned int(1) ext_camera _flag;
if(int_camera_flag)
IntCameraInfoStruct()；
if(ext_camera_flag)
ExtCameraInfoStruct();
FreeViewStruct();
}
else
unsigned int(8) play_camera_id;}}
aligned(8) class FreeViewStruct(){
signed int(32) freeview_x;
signed int(32) freeview_y;
signed int(32) freeview_ｚ;
unsigned int(1) rotation_flag;
bit(7) reserved = 0;
if(rotation_flag) {
signed int(32) freeview_yaw;
signed int(32) freeview_pitch;
signed int(32) freeview_roll;}}
ここで、ｄｙｎａｍｉｃ＿ｓｗｉｔｃｈ＿ｆｌａｇは、サンプル中のビューが切り替わるか否かを示し、値が１の場合、ビューが切り替わることを示し、値が０の場合、ビューの切り替えは行われず、前のサンプルのビューが使用されることを示す。
ｖｉｒｔｕａｌ＿ｃａｍｅｒａ＿ｆｌａｇは、仮想視点を合成する必要があるか否かを示し、値が１の場合、合成する必要があることを示し、値が０の場合、合成は不要で、ビューを切り替えて元のカメラに直接対応することを示す。
ｏｒｉｇｉｎａｌ＿ｃａｍｅｒａ＿ｎｕｍは、仮想視点を合成する元のカメラの数を示す。
ｏｒｉｇｉｎａｌ＿ｃａｍｅｒａ＿ｉｄは、仮想視点を合成する元のカメラの識別子を示す。
ｐｌａｙ＿ｃａｍｅｒａ＿ｉｄは、仮想視点を合成することを必要とせずに直接再生される元のカメラの識別子を示す。
ＦｒｅｅＶｉｅｗＳｔｒｕｃｔ（）は、フリービューのパラメータ構造を示す。
Ｆｒｅｅｖｉｅｗ＿ｘ、Ｆｒｅｅｖｉｅｗ＿ｙ、Ｆｒｅｅｖｉｅｗ＿ｚは、それぞれ、共通の基準座標系に対するフリービューのｘ、ｙ、ｚ軸の座標値を示す。
ｇｒｏｔａｔｉｏｎ＿ｆｌａｇは、フリービューの回転を表現するか否かを示し、値が１の場合、表現し、値が０の場合、表現しない。
ｆｒｅｅｖｉｅｗ＿ｙａｗ、ｆｒｅｅｖｉｅｗ＿ｐｉｔｃｈ、ｆｒｅｅｖｉｅｗ＿ｒｏｌｌは、それぞれ共通の参照座標系に対するフリービューの回転角度を示す。

【0120】

元のカメラのパラメータ情報がＭｅｄｉａＩｎｆｏｒｍａｔｉｏｎＢｏｘ又はＳａｍｐｌｅＥｎｔｒｙに存在する場合、サンプルフォーマットで繰り返し記述する必要はなく、ｉｎｔ＿ｃａｍｅｒａ＿ｆｌａｇ、ｅｘｔ＿ｃａｍｅｒａ＿ｆｌａｇの値は０である。

【0121】

前記動的ビューメタデータトラックは、「ｃｄｓｃ」タイプのトラック参照ボックス（ＴｒａｃｋＲｅｆｅｒｅｎｃｅＢｏｘ）を参照することによって、元の収集装置の深さマップ及び／又はテクスチャマップを含む１つ又は複数のメディアトラックに関連付け又は参照することができる。

【0122】

上記の実施例におけるディレクタ推奨ビュー切り替え方式を採用することにより、推奨ビューとその近傍の元のカメラ情報に基づいて推奨ビューに対応するコンテンツを事前に合成することができ、それによって、端末などの装置に対するデータ処理の要求を低減し、ビデオ処理効率をさらに向上させ、ユーザの視聴体験を向上させ、フリービュービデオの適用シーンを拡大することができる。

【0123】

一部の適用シーンでは、元の収集装置の配置位置、元の収集装置の画像収集頻度、元の収集装置によって収集された画像の圧縮方式などの属性が異なるため、ユーザが自由にビューを切り替える過程において、メディア処理時にしばしば差異が存在し、例えば、同一領域にある元の収集装置によって収集されたテクスチャマップ及び深さマップは仮想視点を合成することができるが、２つの部屋など、非同一領域にある元の収集装置によって収集されたテクスチャマップ及び深さマップは、共同で仮想視点を合成することができない。したがって、本実施例では、元の収集装置のテクスチャマップメディアトラック及び深さマップメディアトラックを、元の収集装置の属性に応じてグループ化し、同じ属性（例えば、位置属性）の元の収集装置のテクスチャマップメディアトラック及び深さマップメディアトラックを１つのトラックグループとしてグループ化することを提案している。図１３は、元のカメラの属性に基づいてグループ化されたテクスチャマップメディアトラック及び深さマップメディアトラックのトラックグループの例を示す、メディアトラックグループ化の模式図である。

【0124】

図に示すように、トラック（Ｔｒａｃｋ）１～４は、テクスチャマップメディアトラックであり、トラック（Ｔｒａｃｋ）５～７は、深さマップメディアトラックであり、トラック３、４、７は予め設定されたトラックグループ化の条件に合致し、トラック１、２、５、６はトラックグループ化の予め設定された条件に合致するので、トラック３、４、７は１つのメディアトラックグループとされ、トラック１、２、５、６は１つのメディアトラックグループとされる。端末がフリービュービデオデータを要求すると、１つのメディアトラックグループのデータが統一的に伝送されるので、端末はターゲットビューに対応する画像データを的確に取得し、データグループを的確に処理することができる。

【0125】

一実施例では、元の収集装置の属性に基づくテクスチャマップメディアトラック及び深さマップメディアトラックのトラックグループは、ＣａｍＡｔｔｒＧｒｏｕｐＢｏｘによって表され、このボックスは、ＩＳＯ／ＩＥＣ１４４９４－１２で定義されているＴｒａｃｋＧｒｏｕｐＴｙｐｅＢｏｘを拡張することによって、ｔｒａｃｋ＿ｇｒｏｕｐ＿ｔｙｐｅは「ｃａａｇ」に設定され、具体的な構文構造は次のとおりである。
aligned(8) class CamAttrGroupBox extends TrackGroupTypeBox(' caag ',0,0) {
string group_description;
unsigned int(8) num_camera;
for(int i=0; i< num_camera; i++)
unsigned int(8) camera_id;
}
ここで、ｇｒｏｕｐ＿ｄｅｓｃｒｉｐｔｉｏｎは、空白文字で終わる文字列であり、元の収集装置の属性に基づいてグループ化されたテキスト記述情報を提供する。
ｎｕｍ＿ｃａｍｅｒａは、メディアトラックグループ内のテクスチャマップに対応する元の収集装置の数を示す。
ｃａｍｅｒａ＿ｉｄは、トラックグループ内の対応する元の収集装置の識別子を示す。
一実施例では、元の収集装置の属性に基づくテクスチャマップメディアトラック及び深さマップメディアトラックのトラックグループは、ＩＳＯ／ＩＥＣ１４４９４－１２で定義されているＥｎｔｉｔｙＴｏＧｒｏｕｐＢｏｘを拡張することによって記述される。グループ化タイプｇｒｏｕｐｉｎｇ＿ｔｙｐｅは「ｃａｅｇ」に設定され、構文構造は次のとおりである。
aligned(8) class CamAttrEntityGroupBox extends EntityToGroupBox(' caeg ',0,0) {
string group_description;
unsigned int(8) num_camera;
for(int i=0; i< num_camera; i++)
unsigned int(8) camera_id;
}

【0126】

一実施例では、元のカメラ属性などの要素に基づくグループ化は、深さマップメディアトラックのみのグループ化であってもよいし、テクスチャマップメディアトラックのみのグループ化であってもよいし、テクスチャマップ及び対応する深さマップメディアトラックの両方のグループ化であってもよい。
別の実施例では、深さマップメディアトラック又はテクスチャマップメディアトラックのみがグループ化された場合にも、深さマップメディアトラックとテクスチャマップメディアトラックとの間の関連付け関係によって、同様の効果が得られる。

【0127】

図１４は、本願の一実施例によるデータ処理装置の構造模式図である。図１４に示すように、本願の実施例によるデータ処理装置は、端末に適用され、本願の実施例によるデータ処理方法を実行することができ、この端末は、方法の実行に対応する機能モジュール及び技術的効果を有する。この装置は、ソフトウェア、ハードウェア、又はソフトウェアとハードウェアの組み合わせとして実装されてもよく、取得モジュール７００、カプセル化モジュール８００、及び処理モジュール９００を含む。

【0128】

取得モジュール７００は、フリービュービデオデータを取得するように構成される。

【0129】

一実施形態では、取得モジュール７００はまた、ターゲットビュー情報を取得するように構成される。

【0130】

カプセル化モジュール８００は、テクスチャマップをメディアトラックにカプセル化するように構成される。
一実施形態では、カプセル化モジュール８００は、収集装置によって収集されたテクスチャマップを１つのメディアトラックにカプセル化するように構成される。
一実施形態では、カプセル化モジュール８００は、収集装置によって収集されたテクスチャマップを複数のメディアトラックにカプセル化するように構成される。
一実施形態では、カプセル化モジュール８００は、収集装置によって収集された深さマップを１つのメディアトラックにカプセル化するように構成される。
一実施形態では、カプセル化モジュール８００は、収集装置によって収集された深さマップを複数のメディアトラックにカプセル化するように構成される。
一実施形態では、カプセル化モジュール８００は、収集装置によって収集されたテクスチャマップ及び深さマップを１つのメディアトラックにカプセル化するように構成される。
一実施形態では、カプセル化モジュール８００は、収集装置によって収集されたテクスチャマップ及び深さマップを複数のメディアトラックにカプセル化するように構成される。

【0131】

処理モジュール９００は、ターゲットビュー情報に基づいて、フリービュービデオデータを処理するように構成される。

【0132】

一実施形態では、処理モジュール９００は、要求されたフリービュービデオデータを復号／デカプセル化し、ターゲットビュー情報に基づいて対応する自由ビデオビューデータを取得し、現実視点に対応するテクスチャマップ又は合成された仮想視点に対応するテクスチャマップを抽出するなどの処理を行うように構成される。さらに、要求されたフリービュービデオのメディアファイル又は処理されたメディアデータを復号／デカプセル化し、要求されたメディアファイル及びユーザがビューを切り替えた後の視聴の位置、視聴方向に基づいて、対応するフリービュービデオデータを抽出し、メディア処理を行う。

【0133】

図１５は、本願の一実施例によるデータ処理装置の構造模式図である。図１５に示すように、データ処理装置は、処理モジュールによって処理されたフリービュービデオデータに応じて画像を表示するように構成された表示モジュール１０００をさらに含む。すなわち、処理モジュール９００による処理結果に応じて、現在のビューに対応する現実視点のテクスチャマップがユーザに表示され、又は現在のビューに対応する仮想視点のテクスチャマップがユーザに表示される。

【0134】

図１６は、本願の一実施例によるデータ処理装置の構造模式図である。図１６に示すように、データ処理装置は、データ要求をサーバに送信するように構成された送信モジュール１１００をさらに含む。

【0135】

一実施形態では、送信モジュール１１００はまた、ターゲットビュー情報をサーバに送信するように構成される。

【0136】

なお、データ処理装置は、カプセル化モジュール８００ではなく、記憶モジュール１２００を備えていてもよい。図＊＊は、本願の一実施例によるデータ処理装置の構造模式図である。図＊＊に示すように、取得モジュール７００と、処理モジュール９００と、記憶モジュール１２００と、を含む。取得モジュール７００、処理モジュール９００は、前述の実施例と同じように動作するので、ここでは説明を省略する。記憶モジュール１２００は、カプセル化されたフリービュービデオデータのメディアファイルを記憶するように構成される。

【0137】

図１７は、本願の一実施例によるデータ処理装置の構造模式図である。図１７に示すように、本願の実施例によるデータ処理装置は、メディアサーバに適用され、本願の実施例によるデータ処理方法を実行することができ、サーバは、方法の実行に対応する機能モジュール及び技術的効果を有する。この装置は、ソフトウェア、ハードウェア、又はソフトウェアとハードウェアの組み合わせとして実現されてもよく、伝送モジュール１３００、演算モジュール１４００、記憶モジュール１５００を含む。

【0138】

伝送モジュール１３００は、端末の要求メッセージを受信し、要求情報に応じてターゲットビュー情報を送信して、フリービュービデオデータを処理するように構成される。具体的には、記憶モジュール１５００によって記憶されたメディアファイル、又は、演算モジュール１４００によって処理されたメディアデータを送信する。上記の受信又は送信は、通信ベンダーによって提供される無線ネットワーク、ローカルに構成される無線ローカルネットワーク、又は有線方式によって実現され得る。

【0139】

演算モジュール１４００は、要求メッセージに従って、記憶モジュール１５００から必要なメディアファイルを取得し、メディアファイルから対応するフリービュービデオデータを抽出して演算処理するように構成される。
記憶モジュール１５００は、カプセル化されたフリービュービデオデータのメディアファイルを記憶するように構成される。

【0140】

図１８は、本願の一実施例によるデータ処理機器の構造模式図である。図１８に示すように、この機器は、メモリ１６００、プロセッサ１７００、通信装置１８００を含む。メモリ１６００、プロセッサ１７００の数は１つ又は複数としてもよく、図１６では、１つのメモリ１６００及び１つのプロセッサ１７００が例示されている。機器のメモリ１６００及びプロセッサ１７００はバス又は他の方式で接続されてもよく、図１６には、バスを介した接続が例示されている。

【0141】

メモリ１６００は、コンピュータ読み取り可能な記憶媒体として、本願のいずれかの実施例によるデータ処理方法に対応するプログラム命令／モジュールのような、ソフトウェアプログラム、コンピュータ実行可能プログラム、及びモジュールを記憶するために使用されてもよい。プロセッサ１７００は、メモリ１６００に記憶されたソフトウェアプログラム、命令、及びモジュールを実行することによって、上記のデータ処理方法を実現する。

【0142】

メモリ１６００は、主に、オペレーティングシステム、少なくとも１つの機能に必要なアプリケーションプログラムを記憶することができるプログラム記憶領域と、データ記憶領域と、を含んでもよい。また、メモリ１６００は、高速ランダムアクセスメモリを含んでもよく、さらに、少なくとも１つの磁気ディスク記憶デバイス、フラッシュメモリデバイス、又は他の不揮発性ソリッドステートメモリデバイスなどの不揮発性メモリを含んでもよい。いくつかの例では、メモリ１６００は、プロセッサ１７００に対してリモートに配置されたメモリをさらに含んでもよく、これらのリモートに配置されたメモリはネットワークを介して機器に接続されてもよい。上記のネットワークの例には、インターネット、企業イントラネット、ローカルエリアネットワーク、移動通信ネットワーク、及びこれらの組み合わせが含まれるが、これらに限定されない。

【0143】

通信装置１８００は、プロセッサ１７００の制御に従って情報の送受信通信を行うように構成される。
一実施例では、通信装置１８００は、受信機１８１０、送信機１８２０を含む。受信機１８１０は、電子機器内のデータ受信を行うモジュール又はデバイスの組み合わせである。送信機１８２０は、電子機器内のデータ送信を行うモジュール又はデバイスの組み合わせである。

【0144】

図１９は、本願の一実施例によるデータ処理機器の構造模式図である。図１９に示すように、一実施例では、データ処理機器は、入力装置１４００、出力装置１５００をさらに含んでもよい。

【0145】

入力装置１４００は、入力された数字又は文字情報を受け取り、機器のユーザ設定及び機能制御に関連するキー信号入力を生成するために使用されることができる。出力装置１５００は、表示画面などの表示機器を含んでもよい。
本願の一実施例はまた、本願のいずれかの実施例によるデータ処理方法を実行するためのコンピュータ実行可能命令を記憶しているコンピュータ読み取り可能な記憶媒体を提供する。

【0146】

本願の一実施例はまた、コンピュータ読み取り可能な記憶媒体に記憶されたコンピュータプログラム又はコンピュータ命令を含むコンピュータプログラム製品であって、コンピュータ機器のプロセッサは、コンピュータ読み取り可能な記憶媒体からコンピュータプログラム又はコンピュータ命令を読み取り、プロセッサは、コンピュータプログラム又はコンピュータ命令を実行することにより、本願のいずれかの実施例によるデータ処理方法をコンピュータ機器に実行させる、コンピュータプログラム製品を提供する。

【0147】

本願の実施例に記載されたシステムアーキテクチャ及び適用シーンは、本願の実施例の技術案をより明確に説明するためのものであり、本願の実施例による技術案を限定するものではなく、システムアーキテクチャの進化及び新たな適用シーンの出現に伴い、本願の実施例による技術案は類似の技術的課題に対しても同様に適用されることが当業者には分かる。

【0148】

当業者であれば、上記で開示された方法におけるステップの全部又は一部、システム、機器における機能モジュール／ユニットが、ソフトウェア、ファームウェア、ハードウェア、及びそれらの適切な組み合わせとして実装されてもよいことを理解する。

【0149】

ハードウェアの実施形態では、上記の説明に記載された機能モジュール／ユニット間の区分は、必ずしも物理的な構成要素の区分に対応するものではなく、例えば、１つの物理コンポーネントが複数の機能を有していてもよいし、複数の物理コンポーネントが協働して１つの機能又はステップを実行していてもよい。物理コンポーネントの一部又はすべては、中央処理装置、デジタル信号処理装置、マイクロプロセッサなどのプロセッサによって実行されるソフトウェアとして、又はハードウェアとして、又は特定用途向け集積回路などの集積回路として実装されてもよい。このようなソフトウェアは、コンピュータ記憶媒体（又は非一時的媒体）及び通信媒体（又は一時的媒体）を含んでもよいコンピュータ読み取り可能な媒体上に配布してもよい。当業者に周知のように、コンピュータ記憶媒体という用語は、情報（コンピュータ読み取り可能な命令、データ構造、プログラムモジュール、又は他のデータ）を記憶するための任意の方法又は技術において実施される、揮発性及び不揮発性の、取り外し可能な、及び取り外し不可能な媒体を含む。コンピュータ記憶媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ、フラッシュメモリもしくは他のメモリ技術、ＣＤ－ＲＯＭ、デジタル多用途ディスク（ＤＶＤ）もしくは他の光ディスク記憶装置、磁気ボックス、磁気テープ、磁気ディスク記憶装置もしくは他の磁気記憶装置、又は所望の情報を記憶するために使用することができ、コンピュータによってアクセスすることができる他の任意の媒体を含むが、これらに限定されない。さらに、通信媒体は、通常、コンピュータ読み取り可能な命令、データ構造、プログラムモジュール、又は搬送波や他の送信機構のような変調データ信号中の他のデータを含み、任意の情報配信媒体を含み得ることが当業者には周知である。

【0150】

本明細書で使用される用語「構成要素」、「モジュール」、「システム」などは、コンピュータ関連エンティティ、ハードウェア、ファームウェア、ハードウェアとソフトウェアの組み合わせ、ソフトウェア、又は実行中のソフトウェアを意味するために使用される。例えば、構成要素は、プロセッサ上で実行されるプロセス、プロセッサ、オブジェクト、実行可能ファイル、実行スレッド、プログラム、又はコンピュータであってもよいが、これらに限定されるものではない。図示により、計算機器上で動作するアプリケーション及び計算機器は、いずれも構成要素であってもよい。１つ又は複数の構成要素は、プロセス又は実行スレッド内に常駐してもよいし、構成要素は１つのコンピュータ上に配置しても、２つ以上のコンピュータ間に分散してもよい。さらに、これらの構成要素は、様々なデータ構造を記憶する様々なコンピュータ読み取り可能な媒体から実行することができる。構成要素は、例えば、１つ又は複数のデータパケット（例えば、ローカルシステム、分散システム、又はネットワーク間の他の構成要素と相互作用する２つの構成要素からのデータ、例えば、信号を介して他のシステムと相互作用するインターネットからのデータ）を有する信号に従って、ローカルプロセス又はリモートプロセスを介して通信することができる。

【0151】

本願のいくつかの実施例は、添付の図面を参照して説明されているが、本願の権利の範囲を限定するものではない。当業者が本願の範囲及び本質から逸脱せずに行う補正、均等置換及び改良は、いずれも本願の権利の範囲内にあるものとする。

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

【図7】

【図8】

【図9】

【図10】

【図11】

【図12】

【図13】

【図14】

【図15】

【図16】

【図17】

【図18】

【図19】

【手続補正書】

【提出日】2024-04-23

【手続補正1】

【補正対象書類名】特許請求の範囲

【補正対象項目名】全文

【補正方法】変更

【補正の内容】

【特許請求の範囲】

【請求項1】

【請求項2】

【請求項3】

【請求項4】

【請求項5】

【請求項6】

【請求項7】

【請求項8】

【請求項9】

【請求項10】

【請求項11】

【請求項12】

【請求項13】

前記ターゲットビュー情報に基づいて、ターゲットビューに対応するフリービュービデオデータを取得するステップは、
前記ターゲットビュー情報に基づいて、前記ターゲットビューに対応するテクスチャマップ及び／又は深さマップを取得するステップを含む、請求項１２に記載の方法。

【請求項14】

ターゲットビュー情報を取得する前記ステップは、タイミングメタデータトラックに応じてターゲットビュー情報を取得するステップを含み、前記ターゲットビューは、前記タイミングメタデータトラックの指示に従って動的に変化し、
前記タイミングメタデータトラックは、前記ターゲットビューに対応する前記フリービュービデオデータが存在するメディアトラックに関連付けられる、請求項１２に記載の方法。

【請求項15】

前記ターゲットビュー情報は、収集装置の識別子、収集装置のパラメータ情報、ターゲットビューの位置情報、ターゲットビューの回転情報、ターゲットビューの識別子のうちの少なくとも１つを含み、
前記ターゲットビュー情報に基づいて前記フリービュービデオデータを処理する前記ステップは、
前記フリービュービデオデータ及び前記ターゲットビュー情報に基づいて、前記ターゲットビューに対応する収集装置によって収集されたテクスチャマップ及び深さマップを選択し、前記ターゲットビューに対応するテクスチャマップを合成する、
又は、
前記フリービュービデオデータ及び前記ターゲットビュー情報に基づいて、前記ターゲットビューに対応する収集装置によって収集されたテクスチャマップを選択するステップを含む、請求項１に記載の方法。

【請求項16】

【請求項17】

予め設定された情報に基づいて、前記メディアトラックをメディアトラックグループとしてカプセル化するステップをさらに含み、
前記予め設定された情報は、収集装置の位置、収集装置の識別子、画像収集頻度、符号化方式のうちの少なくとも１つを含む、請求項１６に記載の方法。

【請求項18】

【請求項19】

プロセッサによって実行されると、請求項１～１８のいずれか１項に記載のデータ処理方法を実現するコンピュータ実行可能命令を記憶しているコンピュータ読み取り可能な記憶媒体。

【請求項20】

コンピュータプログラム又はコンピュータ命令を含むコンピュータプログラム製品であって、
前記コンピュータプログラム又はコンピュータ命令は、コンピュータ読み取り可能な記憶媒体に記憶されており、コンピュータ機器のプロセッサは、前記コンピュータ読み取り可能な記憶媒体から前記コンピュータプログラム又はコンピュータ命令を読み取り、前記コンピュータプログラム又はコンピュータ命令を実行することにより、請求項１～１８のいずれか１項に記載のデータ処理方法を前記コンピュータ機器に実行させる、コンピュータプログラム製品。

【国際調査報告】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版