IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ソニー株式会社の特許一覧

特許7563385情報処理装置、情報処理方法、再生処理装置及び再生処理方法
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-09-30
(45)【発行日】2024-10-08
(54)【発明の名称】情報処理装置、情報処理方法、再生処理装置及び再生処理方法
(51)【国際特許分類】
   G06T 9/40 20060101AFI20241001BHJP
   H04N 19/46 20140101ALI20241001BHJP
【FI】
G06T9/40
H04N19/46
【請求項の数】 15
(21)【出願番号】P 2021545219
(86)(22)【出願日】2020-08-28
(86)【国際出願番号】 JP2020032733
(87)【国際公開番号】W WO2021049333
(87)【国際公開日】2021-03-18
【審査請求日】2023-07-27
(31)【優先権主張番号】62/898,882
(32)【優先日】2019-09-11
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】000002185
【氏名又は名称】ソニーグループ株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】高橋 遼平
(72)【発明者】
【氏名】平林 光浩
(72)【発明者】
【氏名】中神 央二
【審査官】佐田 宏史
(56)【参考文献】
【文献】国際公開第2019/159956(WO,A1)
【文献】特開2004-185628(JP,A)
【文献】国際公開第2019/012975(WO,A1)
【文献】井口 恒志、外2名,“グラフィックスハードウェアを用いた境界表現モデルからOctreeモデルへの変換”,FIT2007 第6回情報科学技術フォーラム 一般講演論文集 第3分冊,日本,社団法人情報処理学会、社団法人電子情報通信学会,2007年08月22日,pp.227-228
(58)【調査した分野】(Int.Cl.,DB名)
G06T 9/00-9/40,19/00
H04N 13/161,13/194,19/46,19/96,21/854
H03M 7/30
(57)【特許請求の範囲】
【請求項1】
ポイントクラウドデータを、品質レベルであるLoD(Level of Detail)に対応する段階的な階層構造を有するように符号化して1以上のジオメトリースライスを含むデータ領域から構成されるビットストリームを生成する符号化部と、
前記LoDと前記ジオメトリースライスにおける前記LoDに対応する部分領域である部分スライスとの対応を特定するための部分スライス特定情報を生成し、前記ビットストリームから前記LoDを構成する階層の前記階層構造における深度を表す深度情報を抽出し、前記ジオメトリースライスの前記深度に対応する部分をsub-sampleとして設定し、前記LoDを構成する各前記階層へのアクセスを表すアクセス情報をさらに生成し、前記アクセス情報は、前記sub-sampleのデータサイズの情報を含むメタデータ生成部と、
前記部分スライス特定情報を含むISOBMFF(International Organization for Standardization Base Media File Format)ファイルを生成し、前記部分スライス特定情報および前記アクセス情報をsub-sample information boxに格納するファイル生成部と、
を備えたことを特徴とする情報処理装置。
【請求項2】
前記メタデータ生成部は、3次元コンテンツを再生する再生処理装置の処理能力に応じて前記深度を選択する指標として、前記階層毎の復号対象となるデコード点数の情報を情報量として抽出し、
前記ファイル生成部は、前記情報量を前記ISOBMFFファイルに格納する、
請求項に記載の情報処理装置。
【請求項3】
前記部分スライス特定情報は、前記アクセス情報を含み、
前記メタデータ生成部は、前記部分スライス特定情報を時間対応メタデータに格納する、
請求項に記載の情報処理装置。
【請求項4】
前記データサイズの情報には、前記ビットストリームの識別情報及び前記ビットストリームの先頭からのデータ長の情報が含まれる、
請求項に記載の情報処理装置。
【請求項5】
前記メタデータ生成部は、前記3次元コンテンツを再生する再生処理装置の処理能力に応じて前記LoDを選択する指標として、前記階層毎の復号対象となるデコード点数の情報を情報量として抽出し、
前記ファイル生成部は、前記情報量を前記ISOBMFFファイルに格納する、
請求項に記載の情報処理装置。
【請求項6】
前記ビットストリームは、さらに付加属性を示すアトリビュートスライスを含み、
前記アクセス情報には、前記ジオメトリースライスまたは前記アトリビュートスライスに対応する前記sub-sampleであるであることを示すタイプ情報が含まれる、
請求項に記載の情報処理装置。
【請求項7】
前記ポイントクラウドデータは、複数のタイルから構成されるデータであって、
前記ビットストリームは、さらに付加属性を示すアトリビュートスライスを含み、
前記メタデータ生成部は、前記ビットストリームの1フレームに含まれる前記タイル毎に、前記タイルに対応する複数のスライスのうち、前記LoDに対応する前記部分スライス特定情報を生成する、
請求項に記載の情報処理装置。
【請求項8】
前記ファイル生成部は、前記タイル毎の前記部分スライス特定情報を、前記部分スライス特定情報を含むsub-sample information boxに紐づける、
請求項に記載の情報処理装置。
【請求項9】
ファイル生成部は、前記タイル毎の部分スライス特定情報を、前記LoDおよび前記LoDに対応する前記部分スライスを示す階層情報である前記品質レベルを示すLoD情報毎に時間対応メタデータに格納する、
請求項に記載の情報処理装置。
【請求項10】
前記符号化部は、前記階層毎に分割された階層単位を有する前記ビットストリームを生成し、
前記メタデータ生成部は、各前記階層単位に含まれる前記スライスに対応させて前記部分スライス特定情報を生成する、
請求項に記載の情報処理装置。
【請求項11】
前記ファイル生成部は、時間情報を持たないビットストリーム及び部分スライス特定情報を前記ISOBMFFファイルに格納する、
請求項1に記載の情報処理装置。
【請求項12】
ポイントクラウドデータを、品質レベルであるLoDに対応する段階的な階層構造を有するように符号化して1以上のジオメトリースライスおよび1以上のアトリビュートスライスを含むデータ領域から構成されるビットストリーム、および、前記LoDを構成する階層の前記階層構造における深度を表す深度情報を生成する符号化部と、
前記LoDと前記ジオメトリースライスにおける前記LoDに対応する部分領域である部分スライスとの対応を特定するための部分スライス特定情報を生成し、前記ビットストリームから前記LoDを構成する階層の前記階層構造における深度を表す深度情報を抽出し、前記ジオメトリースライスの前記深度に対応する部分をsub-sampleとして設定し、前記LoDを構成する各前記階層へのアクセスを表すアクセス情報をさらに生成し、前記アクセス情報は、前記sub-sampleのデータサイズの情報を含むメタデータ生成部と、
前記部分スライス特定情報を含むISOBMFFファイルを生成し、前記部分スライス特定情報および前記アクセス情報をsub-sample information boxに格納するファイル生成部と、
を備えた情報処理装置。
【請求項13】
ポイントクラウドデータを、品質レベルであるLoDに対応する段階的な階層構造を有するように符号化して1以上のジオメトリースライスを含むデータ領域から構成されるビットストリームを生成し、
前記LoDと前記ジオメトリースライスにおける前記LoDに対応する部分領域である部分スライスとの対応を特定するための部分スライス特定情報を生成し、前記ビットストリームから前記LoDを構成する階層の前記階層構造における深度を表す深度情報を抽出し、前記ジオメトリースライスの前記深度に対応する部分をsub-sampleとして設定し、前記LoDを構成する各前記階層へのアクセスを表すアクセス情報をさらに生成し、前記アクセス情報は、前記sub-sampleのデータサイズの情報を含み、
前記部分スライス特定情報を含むISOBMFFファイルを生成し、前記部分スライス特定情報および前記アクセス情報をsub-sample information boxに格納する、
処理をコンピュータに実行させる情報処理方法。
【請求項14】
ポイントクラウドデータを品質レベルであるLoDに対応する段階的な階層構造を有するように符号化して1以上のジオメトリースライスを含むデータ領域から構成されるビットストリーム及び前記LoDと前記ジオメトリースライスにおける前記LoDに対応する部分領域である部分スライスとの対応を特定するための部分スライス特定情報を含むISOBMFFファイルを受信するファイル取得部と、
前記ファイル取得部により取得された前記ISOBMFFファイルから前記部分スライス特定情報を抽出するデータ抽出部と、
前記データ抽出部により抽出された前記部分スライス特定情報を基に、前記ビットストリームを所望の前記品質レベルで復号し、前記部分スライス特定情報および前記LoDを構成する各階層へのアクセスを表すアクセス情報がsub-sample information boxに格納され、前記アクセス情報は、前記sub-sampleのデータサイズの情報を含む復号部と、
を備えた再生処理装置。
【請求項15】
ポイントクラウドデータを品質レベルであるLoDに対応する段階的な階層構造を有するように符号化して1以上のジオメトリースライスを含むデータ領域から構成されるビットストリーム及び前記LoDと前記ジオメトリースライスにおける前記LoDに対応する部分領域である部分スライスとの対応を特定するための部分スライス特定情報を含むISOBMFFファイルを受信し、
取得した前記ISOBMFFファイルから前記部分スライス特定情報を抽出し、
抽出した前記部分スライス特定情報を基に、前記ビットストリームを所望の前記品質レベルで復号し、前記部分スライス特定情報および前記LoDを構成する各階層へのアクセスを表すアクセス情報がsub-sample information boxに格納され、前記アクセス情報は、前記sub-sampleのデータサイズの情報を含む
処理をコンピュータに実行させる再生処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法、再生処理装置及び再生処理方法に関する。
【背景技術】
【0002】
動画圧縮の国際標準化技術としてMPEG(Moving Picture Experts Group)-4が知られている。また、ISOBMFF(International Organization for Standardization Base Media File Format)は、このMPEG-4のファイルコンテナ仕様である。すなわち、MPEG-4により圧縮された動画データや音声データをISOBMFFファイルに格納して配信することが可能である。
【0003】
また、3次元空間を表現する方法として、3次元空間上に位置情報と色や反射などの属性情報とを同時に持った点の集合であるポイントクラウド(Point Cloud)を用いる方法がある。このポイントクラウドに関して、3次元形状を示すジオメトリー(geometry)と属性情報を示すアトリビュート(attribute)とに分けて符号化するGeometry based Point Cloud Compression(G-PCC)という符号化技術が存在する。このG-PCCは、MPEG-I Geometry-based Point Cloud Compression Part 9(ISO/IEC 23090-9)において規定されている。符号化が行われたジオメトリーのデータはジオメトリービットストリームと呼ばれ、圧縮が行われたアトリビュートのデータはアトリビュートビットストリームと呼ばれる。アトリビュートビットストリームのデコードには、復号化されたジオメトリーのデータが必要である。
【0004】
また、G-PCCで符号化されたビットストリームであるG-PCCビットストリームのローカルストレージからの再生処理やネットワーク配信の効率化を目的として、G-PCCビットストリームをISOBMFFファイルに格納する方法の検討がなされている。
【0005】
さらに、画像粒度の階層別符号化であるLoD(Level of Detail)スケーラブル符号化が、ジオメトリーについてはOctreeとして、アトリビュートについては、エンコードオプション(Scalable Fix Weight Lifting)としてコーデックレイヤでサポートされている。これにより、ジオメトリービットストリーム及びアトリビュートビットストリームの復号化を所望のLoDで中断して、G-PCCビットストリームのフルデコード時のLoDよりも低いLoDでポイントクラウドを再構成し、レンダリングできる。
【先行技術文献】
【非特許文献】
【0006】
【文献】ISO/IEC CD 23090-9:2019 Information technology. MPEG-I (Coded Representation of Immersive Media). Part 9: Geometry-based Point Cloud Compression, 2019-07-01
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、提案されているLoDスケーラブル復号化の技術では、LoDスケーラブル復号化の機能をデコーダ毎に個別に追加実装する必要がある。このようにLoDスケーラブル復号化がデコーダの実装依存である場合、再生処理装置間でLoDスケーラブル復号化が行える装置と行えない装置が存在するおそれがある。そのため、視聴者の要望に沿った視聴体験を提供することが困難となる。
【0008】
そこで、本開示では、視聴者の要望に沿った視聴体験を提供することができる情報処理装置、情報処理方法、再生処理装置及び再生処理方法を提供する。
【課題を解決するための手段】
【0009】
本開示によれば、符号化部は、ポイントクラウドデータを、品質レベルであるLoD(Level of Detail)に対応する段階的な階層構造を有するように符号化して1以上のジオメトリースライスを含むデータ領域から構成されるビットストリームを生成する。メタデータ生成部は、前記LoDと前記ジオメトリースライスにおける前記LoDに対応する部分領域である部分スライスとの対応を特定するための部分スライス特定情報を生成する。ファイル生成部は、前記部分スライス特定情報を含むファイルを生成する。
【図面の簡単な説明】
【0010】
図1】G-PCCビットストリームの構造を示す図である。
図2】G-PCCビットストリームの1つのポイントクラウドフレームのイメージ図である。
図3】ジオメトリーのoctree符号化を表す図である。
図4】LoDスケーラブル符号化を説明するための図である。
図5】LoDスケーラブル復号の第1の方法による処理例を示す図である。
図6】LoDスケーラブル復号の第2の方法による処理例を示す図である。
図7】配信システムの一例のシステム構成図である。
図8】ファイル生成装置のブロック図である。
図9】第1の実施形態に係るアクセス情報及び階層情報を説明するための図である。
図10】第1の実施形態に係るSubSampleInformationBoxを示す図である。
図11】第1の実施形態係るSubSampleInformationBoxの格納例を示す図である。
図12】クライアント装置のブロック図である。
図13】復号処理部の詳細を表すブロック図である。
図14】第1の実施形態に係るファイル生成装置によるファイル生成処理のフローチャートである。
図15】第1の実施形態に係るクライアント装置により実行される再生処理のフローチャートである。
図16】第1の実施形態の変形例(1)に係るcodec_specific_parametersの一例を表す図である。
図17】第1の実施形態の変形例(2-1)に係るアクセス情報及び階層情報を説明するための図である。
図18】第1の実施形態の変形例(2-1)に係る時間対応メタデータの一例を表す図である。
図19】第1の実施形態の変形例(2-1)に係る時間対応メタデータの格納例を示す図である。
図20】第1の実施形態の変形例(2-1)に係るcodec specific parametersの一例を表す図である。
図21】第1の実施形態の変形例(2-2)に係る時間対応メタデータの一例を表す図である。
図22】レイヤ構造スライスを有するG-PCCビットストリームを示す図である。
図23】第1の実施形態の変形例(3-2)に係る時間対応メタデータの一例を表す図である。
図24】第1の実施形態の変形例(3-2)に係る部分スライスの抽出を示す図である。
図25】第1の実施形態の変形例(3-3)に係る時間対応メタデータの一例を表す図である。
図26】サンプルグループの構成の一例を示す図である。
図27】第2の実施形態に係るUnitMapEntryの一例を示す図である。
図28】第2の実施形態に係るサンプルグループの一例を示す図である。
図29】タイル毎にLoDを異ならせたポイントクラウドの3次元画像の一例を示す図である。
図30】第2の実施形態の変形例(1)に係る時間対応メタデータの一例を示す図である。
図31】第2の実施形態の変形例(2-1)に係るサンプルグループとsub-sampleの対応関係を示す図である。
図32】第2の実施形態の変形例(2-1)においてサンプルグループにdepth値を格納する場合のUnitMapEntryを示す図である。
図33】第2の実施形態の変形例(2-1)に係るdepth値を格納したサンプルグループの状態を示す図である。
図34】第2の実施形態の変形例(2-2)においてサンプルグループを用いた場合の時間対応メタデータを示す図である。
図35】第2の実施形態の変形例(2-2)に係る各レイヤとLoDとの対応付けを示す図である。
図36】G-PCC静止画のISOBMFFファイルへの格納方法を示す図である。
図37】第3の実施形態に係るSubSampleItemPropertyの一例を示す図である。
図38】G-PCC静止画の時間対応メタデータを用いた格納方法を示す図である。
図39】第3の実施形態の変形例(1)に係る時間対応メタデータの一例を示す図である。
図40】G-PCC静止画をタイル毎にLoDを異ならせる場合の部分スライス特定情報の格納方法を示す図である。
図41】第3の実施形態の変形例(2)に係るTileLoDDecodeIntemPropertyの一例を示す図である。
図42】Matroska Media Containerのフォーマットを表す図である。
図43】コンピュータのハードウェア構成図である。
【発明を実施するための形態】
【0011】
以下に、本願の開示する情報処理装置、再生処理装置及び情報処理方法の実施形態を図面に基づいて詳細に説明する。なお、本技術で開示される範囲は、実施形態に記載されている内容だけではなく、出願当時において公知となっている以下の非特許文献に記載されている内容も含まれる。
【0012】
非特許文献1:(上述)
非特許文献2:ISO/IEC 14496-12:2015 Information technology. Coding of audio-visual object. Part 12: ISO base media file format, 2015-12
非特許文献3:ISO/IEC M49043, [G-PCC] CE12.15 report on LoD generation for spatial scalability version 2, 2019-07-06
非特許文献4:ISO/IEC N18607, Technologies Under Consideration for Carriage of Point Cloud Data, 2019-08-26
非特許文献5:”Matroska Media Container”, [令和2年6月15日検索], インターネット <URL : https://www.matroscka.org/>
非特許文献6:”WebP Container Specification”, [令和2年6月15日検索], インターネット <URL : https://developers.google.com/speed/webp/docs/riff_container>
【0013】
つまり、上述の非特許文献に記載されている内容もサポート要件を判断する際の根拠となる。例えば、非特許文献2及び4-6記載されているFile Structure、非特許文献1及び3に記載されているG-PCCビットストリーム構造で用いられている用語が実施形態において直接的に定義されていない場合でも、本技術の開示範囲内であり、特許請求の範囲のサポート要件を満たすものとする。また、例えば、パース(Parsing)、シンタックス(Syntax)、セマンティクス(Semantics)等の技術用語についても同様に、実施形態において直接的な記載がない場合でも、本技術の開示範囲内であり、特許請求の範囲のサポート要件を満たすものとする。
【0014】
また、以下に示す項目順序に従って本開示を説明する。
1.第1の実施形態
1.1 第1の実施形態の変形例(1)
1.2 第1の実施形態の変形例(2-1)
1.3 第1の実施形態の変形例(2-2)
1.4 第1の実施形態の変形例(2-3)
1.5 第1の実施形態の変形例(3-1)
1.6 第1の実施形態の変形例(3-2)
1.7 第1の実施形態の変形例(3-3)
2.第2の実施形態
2.1 第2の実施形態の変形例(1)
2.2 第2の実施形態の変形例(2-1)
2.3 第2の実施形態の変形例(2-2)
3.第3の実施形態
3.1 第3の実施形態の変形例(1)
3.2 第3の実施形態の変形例(2)
4.第4の実施形態
【0015】
[1.第1の実施形態]
(第1の実施形態に係るシステムの構成)
図1は、G-PCCビットストリームの構造を示す図である。また、図2は、G-PCCビットストリームの1つのポイントクラウドフレームのイメージ図である。図1に示すG-PCCビットストリーム1は、図2に示すポイントクラウドフレーム10をまとめた一連の映像のビットストリームである。
【0016】
図2に示すように、ポイントクラウドフレーム10は、複数のポイント15により形成されるボリュメトリックデータを表す。また、ポイントクラウドフレーム10は、複数のタイル11を含む。タイル11とは、1つのポイントクラウドフレーム10を囲む立体であるBounding boxを同形状の直方体に分割した場合の1つの直方体を指す。タイル11は、ポイントクラウドフレーム10に含まれるポイント15の点群の外枠である。そして、1つのタイル11は、複数のスライス12を含む。スライス12は、タイル11に含まれるポイント15の集合である。そして、1つのスライス12は、1つのジオメトリースライス13、及び、0またはそれ以上のアトリビュートスライス14を含む。なお、図2においては、アトリビュートスライスを有する場合の例を記載する。アトリビュートスライス14は属性毎に1つずつ存在する。スライス12が位置情報だけであり属性が存在しない点の集合の場合、アトリビュートスライス14は存在しない。これに対して、スライス12が色や反射が付加された点の集合の場合、色や反射といった属性ごとにアトリビュートスライス14が設定される。
【0017】
ポイントクラウドフレーム10におけるジオメトリーの圧縮には、図3に示すoctree符号化が用いられる。図3は、ジオメトリーのoctree符号化を表す図である。octree符号化とは、Voxel表現されたデータにおいて、各ブロック内のポイントの有無を、8分木によって表現する手法である。octree符号化では、樹形図6に示すように、ポイント15が存在するブロックの値を1とし、ポイント15が存在しないブロックの値を0として表現される。樹形図6における、8分木毎の階層が深度(depth)と呼ばれる。depthが深くなるほどポイント15の存在を示す空間領域が小さく制限されていくため、ジオメトリーはdepthが深くなるほど、段階的に画像粒度が細かくなり精彩になる。そして、一番浅いdepthからあるdepthに達するまでの深度を表す範囲が、LoDにあたる。すなわち、例えば、図3に示すdepth=0~3の階層が存在する場合、depth=0の領域がLoD=0の領域に対応し、depth=0とdepth=1の階層をまとめた領域がLoD=1の領域に対応し、depth=0~2の領域をまとめた領域がLoD=2の領域に対応し、depth=0~3の領域をまとめた領域がLoD=3の領域に対応する。すなわち、LoDが高くなるにしたがって段階的に画像粒度が細かくなり精彩になるともいえる。
【0018】
また、アトリビュートの圧縮には、Predicting Weight Lifting符号化、Region Adaptive Hierarchical Transform(RAHT)符号化またはFix Weight Lifting符号化が用いられる。そして、アトリビュートは、点の属性の情報であり、ジオメトリーと対応して設定されるため、octree符号が行われるジオメトリーに対して設定されたアトリビュートは、ジオメトリーと同様に階層構造を有し、LoDが高くなるにしたがって段階的に画像粒度が細かくなり精彩になる。
【0019】
図1に戻って説明を続ける。G-PCCビットストリーム1は、図1に示す構造を有する。G-PCCビットストリーム1は、SPS(Sequence Parameter Set)、GPS(Geometry Parameter Set)及びAPS(Attribute Parameter Set)を有する。SPSには、各ビットストリームの復号に用いる基本的な情報が格納される。GPSには、ジオメトリーの復号に用いるパラメータが格納される。APSには、アトリビュートの復号に用いる基本的な情報が格納される。GPS及びAPSには、対応するSPSの識別子(Id:Identifier)が格納され、そのSPSに関連付けられる。GPS及びAPSは、ジオメトリースライス13単位で異なってもよいし、アトリビュートスライス14単位で異なってもよい。
【0020】
また、G-PCCビットストリーム1は、タイルインベントリ(tile inventory)、ジオメトリースライス(geometry slice)13及びアトリビュートスライス(attribute slice)14を有する。タイルインベントリは、タイル20の数やタイル20の構造を含む。タイルインベントリは、ポイントクラウドフレーム10毎に異なってもよい。
【0021】
また、上述したように、ジオメトリースライス13とアトリビュートスライス14との組み合わせによりスライス12となる。スライス12は、独立デコード可能であり、異なるスライス12の間で重複するポイント15があってもよい。また、タイル11は、複数のスライス12を含む外枠となる。タイル11は、異なるタイル11の間で重複する領域が存在してもよい。
【0022】
ジオメトリースライス13は、保持するGPSの識別子であるgps_idによりGPSに対応づけられる。また、ジオメトリースライス13は、自己が形成するスライス12が属するタイル11の識別子であるtile_idを保持し、保持するtile_idによりタイルインベントリに対応付けられる。さらにジオメトリースライス13は、自己が形成するスライス12の識別子であるslice_idを保持する。一連のジオメトリースライス13により、ジオメトリービットストリームが形成される。
【0023】
アトリビュートスライス14は、保持するAPSの識別子であるaps_idによりAPSに対応づけられる。また、アトリビュートスライス14は、自己が形成するスライス12の識別子であるslice_idを保持し、保持するslice_idによりジオメトリースライス13に対応付けられる。一連のアトリビュートスライス14により、アトリビュートビットストリームが形成される。
【0024】
また、octree符号化されたジオメトリービットストリームは、所定の階層までの画像粒度で復号を行うことが可能である。さらに、同様に所定の階層までの画像粒度で復号を行うことが可能であるLoDスケーラブル符号化が、アトリビュートについても、エンコードオプションとしてコーデックレイヤでサポートされた。図4は、LoDスケーラブル符号化を説明するための図である。
【0025】
図4に示すジオメトリービットストリーム21及びアトリビュートビットストリーム22は、LoDスケーラブル符号化により、画像粒度に応じて階層化された構造を有する。ジオメトリービットストリーム21及びアトリビュートビットストリーム22は、紙面に向かって、上から下に向けてLoDが高くなり、表示する画像におけるデータの密度が上昇して画像粒度が上がる。
【0026】
LoDスケーラブル符号化を用いて、ジオメトリースライス13及びアトリビュートスライス14のデコードをデータの途中、すなわち階層の途中で停止することにより、所望の階層に対応するLoDでポイントクラウドフレーム10を構成し、レンダリングできる。以下では、画像粒度が細かく精細度が高い画像を表現する復号を高LoDでの復号と呼び、画像粒度が粗く精細度が低い画像を表現する復号を低LoDでの復号と呼ぶ。そして、アトリビュートビットストリームがLoDスケーラブル符号化を用いて符号化されたG-PCCビットストリームに対する復号化をLoDスケーラブル復号化と呼ぶ。
【0027】
すなわち、ジオメトリービットストリーム21は、低LoDでの復号により、低LoD部分に対応する部分ジオメトリービットストリーム23が復号されて画像粒度の低い画像が生成される。部分ジオメトリービットストリーム23は、各ジオメトリースライス13の一部分である部分スライス(partial slice)により形成される。また高LoDでの復号により、例えばフルデコード時にはジオメトリービットストリーム21の全体が復号されて画像粒度の高い画像が生成される。
【0028】
同様に、アトリビュートビットストリーム22は、低LoDでの復号により、低LoD部分に対応する部分アトリビュートビットストリーム24が復号されて画像粒度の低い画像が生成される。部分アトリビュートビットストリーム24は、各アトリビュートスライス14の一部分である部分スライスにより形成される。また高LoDでの復号により、例えばG-PCCビットストリーム1に含まれるすべてのスライス12をデコードする時にはアトリビュートビットストリーム22の全体が復号されて画像粒度の高い画像が生成される。
【0029】
ここで、LoDスケーラブル復号化の処理方法としては、各スライス12について所望のLoDまで復号化を行う第1の方法、及び、第1の方法の後に残りの高LoDの位置のデータを追加で復号化する第2の方法がある。
【0030】
図5は、LoDスケーラブル復号の第1の方法による処理例を示す図である。第1の方法の場合、デコーダは、G-PCCビットストリーム1におけるSPSからタイルインベントリまでを無条件でデコードする。その後、デコーダは、処理P1に示すように所望のLoDに応じたジオメトリースライス13の部分スライスをデコードする。その後、デコーダは、処理P2に示すように残りをスキップして次のアトリビュートスライス14の先頭から次の部分スライスの復号を行う。
【0031】
図6は、LoDスケーラブル復号の第2の方法による処理例を示す図である。第2の方法の場合、デコーダは、第1の方法で行った復号と同様の復号を行った後に、処理P3に示すように残りのデータの先頭へスキップして、処理P4に示すように残りのデータの復号を行う。例えば、第1の方法の処理P1が終わった後、処理P2を行うとの同じタイミングで、第2の方法の処理P3を行うように並列処理をすることが可能である。また、第1の方法の処理P1およびP2が終わった後に、アトリビュートスライス14に対する処理P1を行うと同タイミングで第2の方法の処理P3を行うように並列処理することも可能である。さらには、全てのスライスを処理し終えた後、処理P3を行う、といったことも可能である。なお、第2の方法は、再生処理装置側にリソースや時間に余裕がある場合に用いられる方法である。
【0032】
しかしながら、現在提案されているLoDスケーラブル復号の技術では、LoDスケーラブル復号化の機能をデコーダ毎に個別に追加実装する必要がある。換言すれば、LoDスケーラブル復号についての第1の方法では、デコーダが所望のLoDで復号を中断する機能を備えることが求められる。また、LoDスケーラブル復号についての第2の方法では、高LoDでの復号を行うために、デコーダは、先に完了した低LoDでの復号の完了位置を記憶し、その完了位置から高LoDでの復号を再開する機能を備えることが求められる。
【0033】
このようにLoDスケーラブル復号を実現するためにデコーダ毎に追加機能を実装する場合、LoDスケーラブル復号はデコーダの実装依存となり、再生処理装置間でLoDスケーラブル復号が行える装置と行えない装置が発生する。このようなことから、視聴者の要望に沿った視聴体験を提供することが困難となる。
【0034】
例えば、G-PCCビットストリーム1のユースケースとして、ポイントクラウド地図データで、視点位置に近い領域は高LoDでの復号を行い表示し、遠い領域は低LoDでの復号を行い表示することが期待される。この場合の復号及び表示には、再生可能となった画像を順次表示するプログレッシブデコーディングも含まれてもよい。また、他のユースケースとして、映画製作において、実物の映画セットをデジタルデータ化したバーチャルアセット利用時に、プレビューは低LoDで復号を行い、実際のシーンレンダリングには高LoDでの復号を行うことが期待される。
【0035】
これらのユースケースを実現するためには、G-PCCビットストリーム1全体のLoDスケーラブル復号や、G-PCCビットストリーム1のタイル11の3次元空間位置の識別及びタイル11毎のLoDスケーラブル復号を、デコーダに非依存で行うことが好ましい。そこで、以下に示す情報処理装置及び再生処理装置を用いて、デコーダに非依存なLoDスケーラブル復号を実現する。
【0036】
図7は、配信システムの一例のシステム構成図である。配信システム500は、情報処理装置であるファイル生成装置100、再生処理装置であるクライアント装置200及びWebサーバ300を含む。ファイル生成装置100、クライアント装置200及びWebサーバ300は、ネットワーク400に接続される。そして、ファイル生成装置100、クライアント装置200及びWebサーバ300は、ネットワーク400を介して相互に通信可能である。ここで、図7においては、各装置を1台ずつ示しているが、配信システム500は、ファイル生成装置100及びクライアント装置200をそれぞれ複数台含んでもよい。
【0037】
ファイル生成装置100は、ポイントクラウドによる3次元画像を提供するデータであるポイントクラウドコンテンツを生成する。ポイントクラウドコンテンツには、G-PCCビットストリーム1やメタデータが含まれる。ファイル生成装置100は、生成したポイントクラウドコンテンツをWebサーバ300にアップロードする。ここで、本実施形態では、Webサーバ300がポイントクラウドコンテンツをクライアント装置200に提供する構成について説明するが、配信システム500は他の構成を採ることも可能である。例えば、ファイル生成装置100が、Webサーバ300の機能を含み、生成したポイントクラウドコンテンツを自装置内に格納し、クライアント装置200に提供する構成であってもよい。
【0038】
Webサーバ300は、ファイル生成装置100からアップロードされたポイントクラウドコンテンツを保持する。そして、Webサーバ300は、クライアント装置200からの要求にしたがい指定されたポイントクラウドコンテンツを提供する。
【0039】
クライアント装置200は、ポイントクラウドコンテンツの送信要求をWebサーバ300へ送信する。その後、クライアント装置200は、送信要求で指定したポイントクラウドコンテンツをWebサーバ300から取得する。そして、クライアント装置200は、ポイントクラウドコンテンツに含まれるG-PCCビットストリーム1を復号して映像を生成して、その映像をモニタなどの表示装置に表示させる。
【0040】
(第1の実施形態に係るファイル生成装置の構成)
次に、ファイル生成装置100の詳細について説明する。図8は、ファイル生成装置のブロック図である。情報処理装置であるファイル生成装置100は、図8に示すように、抽出部101、ファイル生成処理部102、送信部103及び制御部104を有する。制御部104は、ファイル生成処理部102の制御に関する処理を実行する。例えば、制御部104は、ファイル生成処理部102の各部の動作タイミングなどの統括制御を行う。
【0041】
抽出部101は、対象となるポイントクラウドコンテンツの元データの入力を受け付ける。ポイントクラウドコンテンツの元データには、ポイントクラウドデータ及びメタデータを生成するための制御情報が含まれる。制御情報は、例えば、ポイントクラウドデータの時間制御情報、ジオメトリーのデータとアトリビュートのデータとの対応関係情報及び必要なパラメータなどが含まれる。抽出部101は、取得したポイントクラウドコンテンツの元データに含まれるポイントクラウドデータからジオメトリーのデータとアトリビュートのデータとを抽出する。そして、抽出部101は、ジオメトリー及びアトリビュートのデータ、並びに、制御情報をファイル生成処理部102へ出力する。
【0042】
ファイル生成処理部102は、符号化部121及びファイル生成部126を有する。さらに、符号化部121は、ジオメトリーエンコーダ122、アトリビュートエンコーダ123及びビットストリーム生成部124を有する。
【0043】
ジオメトリーエンコーダ122は、抽出部101により出力されたジオメトリーのデータ及びジオメトリーに関する制御情報を取得する。そして、ジオメトリーエンコーダ122は、ジオメトリーのデータに対して符号化処理を施し、制御情報を用いてポイントクラウドコンテンツにおけるジオメトリースライスを生成する。ここでは、ジオメトリーエンコーダ122は、octree符号化を行い、LoDを有するジオメトリースライスライスを生成する。また、ジオメトリーエンコーダ122は、各ジオメトリースライス及び各符号化パラメータ情報をアトリビュートエンコーダ123へ出力する。そして、ジオメトリーエンコーダ122は、ジオメトリービットストリームを形成する各ジオメトリースライス、各符号化パラメータ情報及び制御情報をビットストリーム生成部124へ出力する。
【0044】
アトリビュートエンコーダ123は、抽出部101により出力されたアトリビュートのデータ及びアトリビュートに関する制御情報を取得する。そして、アトリビュートエンコーダ123は、制御情報及びジオメトリーエンコーダ122から入力された情報を用いて、アトリビュートのデータに対して符号化処理を施し、ポイントクラウドコンテンツにおけるアトリビュートスライス14を生成する。ここでは、アトリビュートエンコーダ123は、octree符号化が施されたジオメトリースライスに対応するLoDを有するアトリビュートスライスと、アトリビュートデータとの対応関係を示すアトリビュートスライスの情報とを生成する。そして、アトリビュートエンコーダ123は、アトリビュートビットストリームを形成する複数のアトリビュートスライス、各アトリビュートスライスの情報及び制御情報をビットストリーム生成部124へ出力する。
【0045】
ビットストリーム生成部124は、ジオメトリービットストリームを形成する複数のジオメトリースライス、各ジオメトリースライスの情報及び制御情報の入力をジオメトリーエンコーダ122から受ける。また、ビットストリーム生成部124は、アトリビュートビットストリームを形成する複数のアトリビュートスライス及び制御情報の入力をアトリビュートエンコーダ123から受ける。
【0046】
そして、ビットストリーム生成部124は、スライスを形成する組となるジオメトリースライスとアトリビュートスライスとを組み合わせて時系列で並べる。さらに、ビットストリーム生成部124は、並べた各スライスに合わせて、制御情報を用いてSPS、GPS、APS及びタイルインベントリを生成する。次に、ビットストリーム生成部124は、ジオメトリースライスとアトリビュートスライスとを並べたデータに、SPS、GPS、APS及びタイルインベントリを付加して、図1に示すフォーマットを有するG-PCCビットストリームを生成する。その後、ビットストリーム生成部124は、生成したG-PCCビットストリーム及び制御情報をメタデータ生成部125へ出力する。
【0047】
メタデータ生成部125は、G-PCCビットストリーム及び制御情報の入力をビットストリーム生成部124から受ける。そして、メタデータ生成部125は、G-PCCビットストリームを形成する各ジオメトリースライス及びアトリビュートスライスに対し、LoD及びLoDに対応する部分スライスを示す階層情報であるdepth情報をそれぞれ生成する。
【0048】
そして、メタデータ生成部125は、各LoDに対応するジオメトリースライスの部分スライス及びアトリビュートスライスの部分スライスへのアクセス情報を生成する。さらに、メタデータ生成部125は、階層情報とアクセス情報とを関連付ける部分スライス特定情報を生成する。以下に、メタデータ生成部125によるアクセス情報、階層情報及び部分スライス特定情報の生成の詳細について説明する。
【0049】
メタデータ生成部125は、SPS、GPS、APS及びタイルインベントリをGPCCDecoderConfigurationRecordに格納すると決定する。ただし、メタデータ生成部125は、GPS、APS及びタイルインベントリを含ませるか否かは、sample entry typeに応じて決定する。
【0050】
図9は、第1の実施形態に係るアクセス情報及び階層情報を説明するための図である。図8のメタデータ生成部125は、ポイントクラウドコンテンツにおける1フレームを構成する1以上のジオメトリースライス及び0以上のアトリビュートスライスを1つのsampleとして設定し、trackに格納する。例えば、メタデータ生成部125は、図9に示すように、1つのポイントクラウドフレームに含まれる各ジオメトリースライス及び各アトリビュートスライスを1つのsample31に格納する。
【0051】
次に、図8のメタデータ生成部125は、各ジオメトリースライス及びアトリビュートスライスに対し、LoDに対応するdepth情報に基づいてsub-sampleを設定し、LoDとの対応を示す部分スライス特定情報を生成する。具体的には、メタデータ生成部125は、図9のように、ジオメトリースライス及びアトリビュートスライスの各スライスを、depth毎に分割して分割スライスとして設定し、各分割スライスをsub-sampleとして設定する。そして、メタデータ生成部125は、LoDに対応するdepth情報から、必要なdepthに対応する分割スライスを組み合わせることで形成される部分スライスと、LoDとの対応関係を示す部分スライス特定情報を生成する。
【0052】
すなわち、各depthに対応する分割スライスは、LoDが高くなりdepthが深くなるにしたがって階層毎に増加する差分の領域である。図9におけるsub-sample#1,#2,#3・・・が、個々の分割スライスに対応する。例えば、sub-sample#1は、ジオメトリースライスにおける最も浅いdepthにあたる分割スライスに対応する。また、sub-sample#2は、ジオメトリースライスにおける2番目に浅いdepthにあたる分割スライスに対応する。すなわち、sub-sample#2は、最も低いLoDと次に低いLoDの差分にあたる分割スライスに対応する。また、sub-sample#3は、ジオメトリースライスにおける最も深いdepthに対応する分割スライスに対応する。すなわち、sub-sample#3は、最も深いLoDと次に深いLoDの差分にあたる分割スライスに対応する。また、sub-sample#4は、アトリビュートスライスにおける最も浅いdepthにあたる分割スライスに対応する。また、sub-sample#5は、アトリビュートスライスにおける2番目に浅いdepthにあたる分割スライスに対応する。また、sub-sample#6は、アトリビュートスライスにおける最も深いdepthに対応する分割スライスに対応する。
【0053】
次に、図8のメタデータ生成部125は、各LoDに対応する部分スライスへのアクセス情報として、各分割スライスのサイズ情報を設定する。これにより、クライアント装置200は、分割スライスのサイズ情報を用いて、指定されたLoDに対応する分割スライスへアクセスすることや、それ以外の分割スライスをスキップすることができる。具体的には、部分スライスは分割スライスから形成されていることから、設定された部分スライス特定情報と、分割スライスのサイズ情報を組み合わせることにより、指定されたLoDに対応する部分スライスへアクセスすることが可能である。
【0054】
また、メタデータ生成部125は、スライスを分割するに際し、各分割スライスが対応するdepthを表す情報であるdepth値を設定する。例えば、メタデータ生成部125は、図9におけるsub-sample#1のdepth値を0とし、sub-sameple#2のdepth値を1とし、sub-sameple#3のdepth値を2とする。また、メタデータ生成部125は、sub-sample#4のdepth値を0とし、sub-sameple#5のdepth値を1とし、sub-sameple#6のdepth値を2とする。LoDは、ジオメトリースライス毎及びアトリビュートスライス毎に存在するので、本実施形態では、depth値は、ジオメトリースライス毎及びアトリビュートスライス毎に先頭から0から始まる割り当てが行われる。
【0055】
そして、メタデータ生成部125は、図10に示すシンタックス32で表されるSubSampleInformationBoxに格納するデータを生成する。図10は、第1の実施形態に係るSubSampleInformationBoxを示す図である。図10におけるiを変数とするforループのそれぞれが1つ1つのsub-sampleに対応する。そして、メタデータ生成部125は、subsample_sizeで各sub-sampleのサイズを表す。また、メタデータ生成部125は、各sub-sampleで表される分割スライスのdepth値をcodec_specific_parametersで表す。codec_specific_parametersは、符号化コーデック毎に決まるsab-sampleの情報であり、シンタックス33で表される。これにより、メタデータ生成部125は、分割スライスへのアクセス情報である分割スライスのサイズと階層情報であるdepth値とを関連付ける部分スライス特定情報をSubSampleInformationBoxに格納する。すなわち、メタデータ生成部125は、部分スライス特定情報をsub-sample Informationに格納する。その後、メタデータ生成部125は、G-PCCビットストリーム1をファイル生成部126へ出力する。また、メタデータ生成部125は、SPS、GPS、APS及びタイルインベントリ、ジオメトリースライス13及びアトリビュートスライス14のそれぞれの格納先の情報、並びに、SubSampleInformationBoxを含むメタデータをファイル生成部126へ出力する。
【0056】
ここで、本実施形態では、メタデータ生成部125は、SPS、GPS、APS及びタイルインベントリをGPCCDecoderConfigurationRecordに格納するとし、ジオメトリースライス13及びアトリビュートスライス14を1つのtrackのsampleに格納するとした。ただし、格納方法はこれに限らず、例えば、メタデータ生成部125は、SPS、GPS、APS及びタイルインベントリの一部又は全部をsampleに格納するように構成してもよい。GPS、APS及びタイルインベントリが、GPCCDecoderConfigurationRecordに格納されるか、sampleに格納されるかは、sample entry typeに応じて決定される。また、メタデータ生成部125は、ジオメトリースライス13とアトリビュートスライス14とを、それぞれ個別のtrackのsampleに格納するように構成してもよい。
【0057】
ファイル生成部126は、G-PCCビットストリーム1、各データの格納先の情報、並びに、SubSampleInformationBoxに格納するデータの入力をメタデータ生成部125から受ける。そして、ファイル生成部126は、取得したメタデータをISOMBFFファイルに格納する。例えば、ファイル生成部125は、ISOBMFFのsub-sample informationにLoD毎の部分スライス対応情報を格納する。次に、ファイル生成部126は、G-PCCビットストリーム1を図11に示すようにISOBMFFファイルの実データ領域であるmdatに格納したG-PCCファイルを生成する。図11は、第1の実施形態に係るSubSampleInformationBoxの格納例を示す図である。具体的には、ファイル生成部126は、ジオメトリースライス13及びアトリビュートスライス14を1つのtrackのsampleに格納する。また、ファイル生成部126は、SPS、GPS、APS及びタイルインベントリをGPCCDecoderConfigurationRecordに格納する。さらに、ファイル生成部126は、図11のボックス34で示すように、movie box配下の、tack box配下の、media box配下の、sample table boxの下にSubSampleInformationBoxを格納する。図11では、movie boxはmoovと表され、tack boxはtrakと表され、media boxはmediaと表され、sample table boxはstblと表される。他にも、ファイル生成部126は、movie fragment box配下のtrack fragment boxの下にSubSampleInformationBoxを格納してもよい。その後、ファイル生成部126は、生成したG-PCCファイルを送信部103へ出力する。
【0058】
送信部103は、G-PCCビットストリーム1のG-PCCファイルをファイル生成部126から受ける。そして、送信部103は、取得したG-PCCビットストリーム1のG-PCCファイルをWebサーバ3へ送信してポイントクラウドコンテンツをアップロードする。
【0059】
[第1の実施形態に係るクライアント装置の構成]
図12は、クライアント装置のブロック図である。図12に示すように、再生処理装置であるクライアント装置200は、再生処理部201、表示部202及び制御部203を有する。制御部203は、再生処理部201の各部の動作を制御する。例えば、制御部203は、再生処理部201の各部の動作のタイミングを統括制御する。再生処理部201は、ファイル取得部211及び復号処理部212を有する。
【0060】
ファイル取得部211は、ポイントクラウドコンテンツのデータの取得要求をWebサーバ300に送信する。そして、ファイル取得部211は、ポイントクラウドコンテンツのG-PCCビットストリーム1のG-PCCファイルが格納されたISOBMFFファイルをWebサーバ300から取得する。その後、ファイル取得部211は、取得したISOBMFFファイルを復号処理部212へ出力する。
【0061】
復号処理部212は、ファイル処理部221、復号部222及び表示情報生成部223を有する。図13は、復号処理部の詳細を表すブロック図である。
【0062】
ファイル処理部221は、データ抽出部231を有する。データ抽出部231は、ファイル取得部211から出力されたG-PCCビットストリーム1が格納されたG-PCCファイルを取得する。次に、データ抽出部231は、取得したG-PCCファイルをパースしてメタデータを抽出する。次に、データ抽出部231は、メタデータに含まれるSubSampleInformationBoxから分割スライス毎の部分スライス特定情報を取得する。そして、データ抽出部231は、再生が指定されたLoDにあたる分割スライスに対応するsub-sampleの情報を部分スライス特定情報から取得し、図9の処理P3で示すようにG-PCCファイルのsampleから指定されたLoDの領域に含まれる分割スライスを抽出する。この後、データ抽出部231は、指定されたLoD以上の領域に含まれる分割スライスのサイズを部分スライス特定情報から取得する。そして、データ抽出部231は、図9の処理P4のように、指定されたLoD以上の領域の分割スライスをスキップして次の指定されたLoDの領域に含まれる部分スライスの先頭に移動する。ファイル処理部221は、以上の処理P3及びP4を繰り返して、指定されたLoDにあたる部分スライスをジオメトリースライス13及びアトリビュートスライス14から抽出する。これにより、ファイル処理部221は、ジオメトリービットストリーム及びアトリビュートビットストリームにおける指定されたLoDに対応する部分スライス群を取得する。
【0063】
その後、ファイル処理部221は、指定されたLoDに対応するジオメトリービットストリームに含まれる部分スライス群及びジオメトリーの復号に関するパラメータを復号部222のジオメトリーデコーダ232へ出力する。また、ファイル処理部221は、指定されたLoDに対応するアトリビュートビットストリームに含まれる部分スライス群及びアトリビュートの復号に関するパラメータを復号部222のアトリビュートデコーダ233へ出力する。
【0064】
復号部222は、ジオメトリーデコーダ232及びアトリビュートデコーダ233を有する。
【0065】
ジオメトリーデコーダ232は、指定されたLoDに対応するジオメトリービットストリームに含まれる部分スライス群及びジオメトリーの復号に関するパラメータの入力をファイル処理部221から受ける。そして、ジオメトリーデコーダ232は、ジオメトリーの復号に関するパラメータを用いて、取得した部分スライス群を復号する。これにより、ジオメトリーデコーダ232は、指定されたLoDに対応するジオメトリーのデータを取得する。この際、ジオメトリーデコーダ232は、復号を行った部分スライスの位置情報をアトリビュートデコーダ233へ出力する。その後、ジオメトリーデコーダ232は、復号した部分スライス群を表示情報生成部223のポイントクラウド生成部234へ出力する。
【0066】
アトリビュートデコーダ233は、指定されたLoDに対応するアトリビュートビットストリームに含まれる部分スライス群及びアトリビュートの復号に関するパラメータの入力をファイル処理部221から受ける。そして、アトリビュートデコーダ233は、アトリビュートの復号に関するパラメータ及びジオメトリーデコーダ232から取得した部分スライスの位置情報を用いて、取得した部分スライス群を復号する。これにより、アトリビュートデコーダ233は、指定されたLoDに対応するアトリビュートのデータを取得する。その後、アトリビュートデコーダ233は、復号した部分スライス群を表示情報生成部223のポイントクラウド生成部234へ出力する。
【0067】
このように、ジオメトリーデコーダ232及びアトリビュートデコーダ233は、指定されたLoDに対応する部分スライス群をファイル処理部221から取得することで、通常のデコードを行うことで指定されたLoDに対応するポイントクラウドを生成できる。すなわち、ジオメトリーデコーダ232及びアトリビュートデコーダ233は、指定されたLoDに対応する部分スライスの抽出や使用しない部分スライスのスキップなどの処理を行わなくてもよい。
【0068】
表示情報生成部223は、ポイントクラウド生成部234及び画像処理部235を有する。
【0069】
ポイントクラウド生成部234は、復号処理が施されたジオメトリービットストリームの部分スライス群の入力をジオメトリーデコーダ232から受ける。また、ポイントクラウド生成部234は、復号処理が施されたアトリビュートビットストリームの部分スライス群の入力をアトリビュートデコーダ233から受ける。そして、ポイントクラウド生成部234は、指定されたLoDに対応するジオメトリーデータと指定されたLoDに対応するアトリビュートのデータとを組み合わせて、指定されたLoDに対応するポイントクラウドを生成する。その後、ポイントクラウド生成部234は、生成したポイントクラウドを画像処理部235へ出力する。
【0070】
画像処理部235は、指定されたLoDに対応するポイントクラウドのデータの入力をポイントクラウド生成部234から受ける。そして、画像処理部235は、取得したポイントクラウドのデータを用いてレンダリングを行って表示画像を生成する。その後、画像処理部235は、表示画像を表示部202へ出力する。
【0071】
表示部202は、モニタなどの表示装置を有する。表示部202は、画像処理部235により生成された表示画像の入力を受ける。そして、表示部202は、取得した表示画像を表示装置に表示させる。これにより、表示部202は、指定されたLoDに対応する表示画像を表示装置に表示させることができる。
【0072】
[第1の実施形態に係るファイル生成手順]
次に、図14を参照して、本実施形態に係るファイル生成装置100によるファイル生成処理の流れについて説明する。図14は、第1の実施形態に係るファイル生成装置によるファイル生成処理のフローチャートである。
【0073】
抽出部101は、ポイントクラウドを用いた3次元映像を表示させるポイントクラウドコンテンツの元データの入力を受け付ける。次に、抽出部101は、取得したポイントクラウドコンテンツの元データに含まれるポイントクラウドのデータからジオメトリーのデータとアトリビュートのデータとを抽出する。ジオメトリーエンコーダ122は、ジオメトリーのデータに対して符号化処理を施し、LoDを有するジオメトリースライス13を生成する。アトリビュートエンコーダ123は、制御情報及びジオメトリーエンコーダ122から入力された位置情報を用いて、アトリビュートのデータに対して符号化処理を施しLoDを有するアトリビュートスライス14を生成する。これにより、ジオメトリーエンコーダ122及びアトリビュートエンコーダ123は、ポイントクラウドのデータを符号化する(ステップS101)。
【0074】
ビットストリーム生成部124は、符号化されたジオメトリースライス13及びアトリビュートスライス14を組み合わせて、G-PCCビットストリーム1を生成する(ステップS102)。
【0075】
メタデータ生成部125は、G-PCCビットストリーム1をビットストリーム生成部124から取得する。次に、メタデータ生成部125は、ジオメトリースライス13及びアトリビュートスライス14を単一のtrackの1つのsampleに格納すると決定する。さらに、メタデータ生成部125は、ジオメトリースライス13及びアトリビュートスライス14における各階層に対応する分割スライスをそれぞれsub-sampleと定義する。次に、メタデータ生成部125は、各分割スライスに対応するdepthを表すdepth値をそれぞれの分割スライスに設定する。そして、ファイル生成部126は、各分割スライスのdepth値を部分スライス特定情報としてSubSampleInfomarionBoxに格納する(ステップS103)。
【0076】
また、メタデータ生成部125は、各LoDに対応するジオメトリースライスの部分スライス及びアトリビュートスライスの部分スライスへのアクセス情報などのメタデータをファイル生成部126へ出力する。ファイル生成部126は、G-PCCビットストリーム1及び部分スライス特定情報を含むSubSampleInfomarionBox及びメタデータを、ISOBMFFファイルのメタデータ領域に格納したG-PCCファイルを生成する(ステップS104)。その後、ファイル生成部126は、生成したG-PCCファイルを送信部106へ出力する。
【0077】
送信部106は、ポイントクラウドコンテンツのG-PCCファイルの入力をファイル生成部126から受ける。そして、送信部106は、取得したG-PCCファイルをWebサーバ3へ送信して、ポイントクラウドコンテンツをアップロードする(ステップS105)。
【0078】
[第1の実施形態に係る再生処理手順]
次に、図15を参照して、本実施形態に係るクライアント装置200により実行される再生処理の流れを説明する。図15は、第1の実施形態に係るクライアント装置により実行される再生処理のフローチャートである。
【0079】
ファイル取得部211は、ポイントクラウドコンテンツの取得要求をWebサーバ300へ送信し、指定しポイントクラウドコンテンツのG-PCCファイルをWebサーバ300から取得する。次に、ファイル処理部221のデータ抽出部231は、G-PCCファイルであるISOBMFFファイルをパースしてメタデータを抽出する。そして、データ抽出部231は、メタデータに含まれるSubSampleInformationBoxから部分スライス特定情報を取得する(ステップS201)。
【0080】
次に、データ抽出部231は、部分スライス特定報に基づき、指定されたLoDのポイントクラウドの生成に用いるジオメトリービットストリーム及びアトリビュートビットストリームの部分スライス群を抽出する(ステップS202)。そして、データ抽出部231は、ジオメトリービットストリームの部分スライス群を復号部222のジオメトリーデコーダ232へ出力する。また、データ抽出部231は、アトリビュートビットストリームの部分スライス群を復号部222のアトリビュートデコーダ233へ出力する。
【0081】
ジオメトリーデコーダ232及びアトリビュートデコーダ233は、それぞれが抽出されたジオメトリービットストリームの部分スライス群及び抽出されたアトリビュートビットストリームの部分スライス群を復号する(ステップS203)。これにより、ジオメトリーデコーダ232及びアトリビュートデコーダ233は、指定されたLoDに対応するジオメトリーのデータ及びアトリビュートのデータを取得する。
【0082】
表示情報生成部223のポイントクラウド生成部234は、復号されたジオメトリービットストリームの部分スライス群及びアトリビュートビットストリームの部分スライス群を組み合わせてポイントクラウドを生成する(ステップS204)。その後、ポイントクラウド生成部234は、ポイントクラウドのデータを画像処理部235へ出力する。
【0083】
画像処理部235は、ポイントクラウドのデータをポイントクラウド生成部234から取得する。次に、画像処理部235は、レンダリングを実行して表示画像を生成する。そして、画像処理部235は、生成した表示画像を表示部202へ送信してポイントクラウドによる3次元映像を表示させる(ステップS205)。
【0084】
ここで、本実施形態では、メタデータ生成部125は、ジオメトリースライス及びアトリビュートスライスの分割スライスをsub-sampleとして設定したが、他にも、ジオメトリースライス及びアトリビュートスライスをsub-sampleとして設定してもよい。その場合、メタデータ生成部125は、例えば、codec_specific_parametersのbyte length(32bit)を拡張して、各LoDにおける分割スライスのサイズをsub-sample毎に格納することで分割スライスをsub-sampleと定義した場合と同様の効果を得ることができる。
【0085】
以上に説明したように、本実施形態に係るファイル生成装置は、ジオメトリースライス及びアトリビュートスライスのLoDに対応する階層毎の分割スライスをsub-sampleとして設定する。そして、ファイル生成装置は、分割スライスへのアクセス情報として分割スライスのサイズを取得する。さらに、ファイル生成装置は、各分割スライスが対応するdepthを表す情報であるdepth値を設定する。そして、ファイル生成装置は、必要なdepthに対応する分割スライスを組み合わせることで形成される部分スライスと、LoDとの対応関係を示す部分スライス特定情報を含むSubSampleInformationBoxを生成する。クライアント装置は、G-PCCビットストリームのISOBMFFファイルからSubSampleInformationBoxに含まれる部分スライス特定情報を取得して、ジオメトリースライス及びアトリビュートスライスの中から指定されたLoDに対応する部分スライス群を取得する。そして、クライアント装置のデコーダは、LoDに対応する部分スライス群を復号することで、指定されたLoDに対応するジオメトリーのデータ及びアトリビュートのデータを取得することができる。
【0086】
このように、クライアント装置は、G-PCCビットストリームのISOBMFFファイルに含まれる部分スライス特定情報を基に、所望のLoDに対応するデータを得るために用いる部分スライスの位置を識別して抽出しデコーダに入力することができる。これにより、デコーダにLoDスケーラブル復号のための追加機能を実装せずに、LoDスケーラブル復号を行うことが可能となる。したがって、デコーダに非依存のLoDスケーラブル復号を行うことができ、クライアント装置の種類に依らずに視聴者の要望に沿った視聴体験を提供することができる
【0087】
[1.1 第1の実施形態の変形例(1)]
次に、第1の実施形態の変形例(1)について説明する。本変形例に係るファイル生成装置100は、クライアント装置200の処理能力に応じてLoDを選択可能にするための指標をクライアント装置200に提供する。
【0088】
本変形例に係るファイル生成装置100のメタデータ生成部125は、SubSumpleInformationBoxにおけるcodec_specific_parametersにLoD毎の復号の対象となるポイントの数であるデコード点数を格納する。例えば、メタデータ生成部125は、図16に示すシンタックス35で示されるcodec_specific_parametersを生成する。図16は、第1の実施形態の変形例(1)に係るcodec_specific_parametersの一例を表す図である。シンタックス35におけるtotal_pointがデコード点数を表す。
【0089】
ここで、本変形例では、メタデータ生成部125は、デコード点数を指標として用いたが、指標はこれに限らず、LoD毎のデコード処理における負荷を表す情報であれば他の情報であってもよい。また、本変形例では、メタデータ生成部125は、codec_specific_parametersに指標を格納したが、他にも、ISOBMFFファイルではなく、G-PCCビットストリーム1のHigh Level Syntax(HLS)に指標を格納してもよい。HLSとしては、例えば、SPS、APS、GPS、タイルインベントリ、ジオメトリースライス13又はアトリビュートスライス14などを用いることができる。
【0090】
クライアント装置200のファイル処理部221は、ポイントクラウドコンテンツのISOBMFFファイルをパースしてメタデータを取得する。そして、ファイル処理部221は、メタデータに含まれるSubSumpleInformationBoxにおけるcodec_specific_parametersを確認して、LoD毎のデコード点数を取得する。次に、ファイル処理部221は、LoD毎のデコード点数を用いて、自装置の処理能力に応じた適切なLoDを選択する。その後、ファイル処理部221は、選択したLoDに対応する部分スライスをジオメトリースライス及びアトリビュートスライスから抽出して、復号部222へ出力する。
【0091】
以上に説明したように、本実施形態に係るファイル生成装置は、LoD毎のデコード処理の負荷を表す指標をクライアント装置へ送信する。クライアント装置は、提供された指標を基に復号対象とするLoDを選択する。これにより、クライアント装置は、低LoDによる復号を行う場合に、より詳細な基準を用いて復号対象とするLoDを判定することができる。したがって、クライアント装置はより適切なLoDの3次元映像を利用者に提供することができ、視聴者の要望に沿った視聴体験を提供することができる。
【0092】
[1.2 第1の実施形態の変形例(2-1)]
次に、第1の実施形態の変形例(2-1)について説明する。本変形例に係るファイル生成装置100は、所望のLoDを得るための部分スライス特定情報を時間対応メタデータ(timed metadata)に格納することが第1の実施形態と異なる。
【0093】
図17は、第1の実施形態の変形例(2-1)に係るアクセス情報及び階層情報を説明するための図である。実施形態に係るファイル生成装置100のメタデータ生成部125は、部分スライス特定情報を時間対応メタデータ36に格納することを決定する。この際、メタデータ生成部125は、時間対応メタデータ36のsample entry typeをLoDDecodeSampleと設定する。さらに、メタデータ生成部125は、timed metadata trackとG-PCCビットストリーム1を格納するtrackとを、track referenceで紐づける。また、メタデータ生成部125は、DTS(Decoding Time Stamp)アラインするG-PCCビットストリーム1のsampleについてLoD毎のデコード位置情報を時間対応メタデータに格納する。すなわち、G-PCCビットストリーム1のジオメトリースライス及びアトリビュートスライスを格納するsampleと時間対応メタデータとは、図17で示されるように時間同期される。
【0094】
図18は、第1の実施形態の変形例(2-1)に係る時間対応メタデータの一例を表す図である。例えば、メタデータ生成部125は、図18に示すシンタックスを有する時間対応メタデータ36を生成する。図18のシンタックスにおけるunit_indexは、G-PCCビットストリーム1の中のジオメトリースライス及びアトリビュートスライスの識別情報となるインデックスを表す。また、data_length_byteは、各LoDに対応する部分スライスのサイズにおけるバイト単位の部分の数値を表す。また、data_length_bitsは、各LoDに対応する部分スライスのサイズにおけるビット単位の部分の数値を表す。すなわち、data_length_byteとdata_length_bitsとを加算した値が、各LoDに対応する部分スライスのサイズにあたる。ここで、各LoDに対応する部分スライスのサイズとは、そのLoDに対応する画像を得るための全てのデータのサイズ、すなわちそのLoDに含まれる各階層に対応する分割スライスのデータの合計にあたる。例えば、図17に示すように、1つのジオメトリースライスにおいて分割スライスに対応する階層D1~D2が存在し、LoD=1に対応する部分スライスが階層D2までのデータを含む場合、そのdata_length_byteとdata_length_bitsとを加算した値は、サイズZ1を表す値となる。この場合、ジオメトリースライス及びアトリビュートスライスのそれぞれのunit_indexと、data_length_byteとdata_length_bitsとを加算した値に対応する各ジオメトリースライス13及びアトリビュートスライス14の先頭からのデータ長とがアクセス情報にあたる。
【0095】
図19は、第1の実施形態の変形例(2-1)に係る時間対応メタデータの格納例を示す図である。ファイル生成部126は、G-PCCビットストリーム1とともに、時間対応メタデータ36を含むメタデータの入力をメタデータ生成部125から受ける。
【0096】
そして、ファイル生成部126は、G-PCCビットストリーム1をsampleに格納する。また、ファイル生成部126は、ボックス37に示すtimed metadata trackの中に時間対応メタデータ36を格納する。さらに、ファイル生成部126は、ボックス38で示す場所にRef Doc#4で規定されたSubSampleInformationBoxを格納する。この場合、sub-sampleは、1つのパラメータセット、ジオメトリースライス又はアトリビュートスライスと設定される。また、codec specific parametersは、図20で示すシンタックス39のように規定される。図20は、第1の実施形態の変形例(2-1)に係るcodec specific parametersの一例を表す図である。図20に示すシンタックス39で示す情報により、スライス12の境界及びそのslice12のタイプ、すなわち、パラメータセット、ジオメトリースライス又はアトリビュートスライスのいずれであるかが識別可能となる。また、ボックス37に格納された時間対応メタデータ36とボックス38に格納されたsub-sampleの情報とは、track referenceで紐づけられる
【0097】
クライアント装置200のファイル処理部221は、ポイントクラウドコンテンツのISOBMFFファイルをパースして時間対応メタデータ36を取得する。そして、ファイル処理部221は、指定されたLoDに対応する部分スライスのデコード位置を時間対応メタデータ36から取得する。そして、ファイル処理部221は、取得したデコード位置に対応するデコード時刻のデータをジオメトリースライス及びアトリビュートスライスから取得することで、指定されたLoDに対応する部分スライスを抽出する。その後、ファイル処理部221は、抽出した部分スライス群を復号部222へ出力する。
【0098】
以上に説明したように、本変形例に係るファイル生成装置は、部分スライス特定情報を時間対応メタデータに格納する。そして、クライアント装置は、時間対応メタデータから指定されたLoDに対応する部分スライスのデコード位置を特定して部分スライスをジオメトリースライス及びアトリビュートスライスから抽出する。第1の実施形態では、所望のLoDのポイントクラウドをデコードする場合、クライアント装置は、デコード前にSubSampleInformationをすべて読み取り、デコードする部分スライスの位置の算出処理を行った。これに対して、本変形例に係るクライアント装置は、G-PCCビットストリームのsampleのデコード時刻を基準に、sample毎に所望のLoDに対応する部分スライスのデコード位置を同時刻のtimed metadata sampleから取得することができ、部分スライスを抽出する処理が簡略化される。また、クライアント装置は、時間対応メタデータを参照することで、Webサーバからの配信時に、指定されたLoDに対応する画像を表示するために用いる部分スライスに限定してデータを取得することも可能である。
【0099】
[1.3 第1の実施形態の変形例(2-2)]
次に、第1の実施形態の変形例(2-2)について説明する。本変形例に係るファイル生成装置は、第1の実施形態の変形例(1)と同様に、クライアントの処理能力に応じてLoDを選択するための指標を時間対応メタデータに格納する。
【0100】
図21は、第1の実施形態の変形例(2-2)に係る時間対応メタデータの一例を表す図である。本変形例に係るメタデータ生成部125は、行40で示すLoD毎のデコード点数を表すtotal_pointsの情報が格納された時間対応メタデータ36を生成する。
【0101】
ここで、本変形例では、メタデータ生成部125は、デコード点数を指標として用いたが、指標はこれに限らず、LoD毎のデコード処理における負荷を表す情報であれば他の情報であってもよい。また、本変形例では、メタデータ生成部125は、ISOBMFFファイルに格納する情報を生成したが、これに限らず、G-PCCビットストリーム1のHLSに格納する指標を生成してもよい。HLSとしては、例えば、SPS、APS、GPS、タイルインベントリ、ジオメトリースライス13又はアトリビュートスライス14などを用いることができる。
【0102】
クライアント装置200のファイル処理部221は、ポイントクラウドコンテンツのISOBMFFファイルをパースしてメタデータを取得する。そして、ファイル処理部221は、時間対応メタデータ36に含まれる各sub-sampleに対応するLoD毎のデコード点数を取得する。次に、ファイル処理部221は、LoD毎のデコード点数を用いて、自装置の処理能力に応じた適切なLoDを選択する。その後、ファイル処理部221は、選択したLoDに対応する部分スライスをジオメトリースライス及びアトリビュートスライスから抽出して、復号部222へ出力する。
【0103】
以上に説明したように、本実施形態に係るファイル生成装置は、時間対応メタデータを用いてLoD毎のデコード処理の負荷を表す指標をクライアント装置へ送信する。クライアント装置は、時間対応メタデータを用いて提供された指標を基に復号対象とするLoDを選択する。これにより、クライアント装置は、低LoDによる復号を行う場合に、より詳細な基準を用いて復号対象とするLoDを判定することができる。したがって、時間対応メタデータにより部分スライス毎のLoDを通知する場合にも、クライアント装置はより適切なLoDの3次元映像を利用者に提供することができ、視聴者の要望に沿った視聴体験を提供することができる。
【0104】
[1.4 第1の実施形態の変形例(2-3)]
次に、第1の実施形態の変形例(2-3)について説明する。メタデータ生成部125は、部分スライス特定情報をさらに拡張して、各部分スライスがジオメトリースライス13またはアトリビュートスライス14のいずれであるかを表す部分スライスのユニットタイプを格納してもよい。加えて、アトリビュートスライス14の場合には、メタデータ生成部125は、アトリビュートタイプ(attribute_type)を部分スライス特定情報に格納して、クライアント装置2側で属性に応じて各アトリビュートスライス14の復号を行うか否かを決定できるようにしてもよい。
【0105】
また、メタデータ生成部125は、時間対応メタデータ36に格納したunit_index、data_length_byte及びdata_length_bitsの代わりに、Ref Doc#4で規定のSubSampleInformationBoxのentryと紐づけてそれらの情報を格納してもよい。さらに、メタデータ生成部125は、unit_indexの代わりにbyte positionを時間対応メタデータ36に格納してもよい。
【0106】
また、メタデータ生成部1125は、全てのdecode entryを新規定義したLodDecodeBoxに部分スライス特定情報を格納し、それらのLodDecodeBoxをSammpleEntryに格納してもよい。
【0107】
[1.5 第1の実施形態の変形例(3-1)]
次に、第1の実施形態の変形例(3-1)について説明する。本変形例に係るファイル生成装置100は、レイヤ構造スライスを有するG-PCCビットストリーム1を用いることが第1の実施形態と異なる。
【0108】
図22は、レイヤ構造スライスを有するG-PCCビットストリームを示す図である。レイヤ構造スライスとは、図22に示すように、LoDの階層毎にスライス12を分割してレイヤ化した構造である。すなわち、第1の実施形態におけるジオメトリースライス及びアトリビュートスライスの分割スライスがレイヤと呼ばれる単位で予め定義され、ジオメトリースライス及びアトリビュートスライスは、レイヤによる階層単位構造を有する。各スライス12は、各depthに対応する階層毎にジオメトリーレイヤ41及びアトリビュートレイヤ42を含む。
【0109】
第1の実施形態でもジオメトリースライス及びアトリビュートスライスは部分スライスを形成する階層構造を有したが、各分割スライスは予め決められた単位として定義されてはいなかった。これに対して、本変形例に係るジオメトリースライス及びアトリビュートスライスは、その中に予め決められた単位であるレイヤを有する。特定のレイヤまでのジオメトリーレイヤ41及びアトリビュートレイヤ42をまとめることで、各LoDに対応する1つのジオメトリースライスビットストリーム又は1つのアトリビュートビットストリームが形成される。
【0110】
G-PCCビットストリーム1がレイヤ構造スライスを有する場合、所望のLoDまでの復号は、レイヤ単位の復号により実現できる。そのため、ジオメトリースライス及びアトリビュートスライスそれぞれの内部でのスキップは行われない。ただし、レイヤ構造スライスにおいても、sample中に複数のスライス12が存在することにより依然としてデータスキップ処理が行われる。この場合のデータスキップは、レイヤ単位でのスキップとなる。
【0111】
メタデータ生成部125は、ジオメトリーレイヤ及びアトリビュートレイヤをそれぞれsub-sampleとして設定する。また、メタデータ生成部125は、各レイヤが対応するdepthを表す情報であるdepth値を設定する。そして、メタデータ生成部125は、レイヤに対応するdepth情報から、部分スライスとLoDとの対応関係を示す部分スライス特定情報を生成する。
【0112】
クライアント装置2のデータ抽出部231は、ポイントクラウドコンテンツのISOBMFFファイルをパースしてメタデータを取得する。そして、データ抽出部231は、メタデータに含まれるSubSampleInformationBoxに格納された部分スライス特定情報から指定されたLoDに対応するジオメトリーレイヤ及びアトリビュートレイヤを特定する。そして、データ抽出部213は、処理P5に示すように特定したジオメトリーレイヤ及びアトリビュートレイヤを抽出し、SubSampleInformationBoxから取得した各レイヤの境界を使用して、処理P6に示すようにインターリーブされた次のレイヤにスキップする。データ抽出部231は、この処理P5お及びP6を繰り返して、指定されたLoDに対応するポイントクラウドの3次元映像を生成するための部分スライス群を抽出する。
【0113】
以上に説明したように、本変形例に係るファイル生成装置は、レイヤ構造スライスを有するG-PCCビットストリームを用いて所望のLoDを抽出するための部分スライス特定情報を含むSubSampleInformationBoxを生成する。クライアント装置は、SubSampleInformationBoxに含まれる部分スライス特定情報を用いてレイヤ構造スライスを有するG-PCCビットストリームから所望のLoDに対応する部分スライスを抽出して、デコーダに復号させる。これにより、レイヤ構造スライスを用いた場合にも、デコーダに依存しないLoDスケーラブル復号を実現することができ、視聴者の要望に沿った視聴体験を提供することができる。
【0114】
[1.6 第1の実施形態の変形例(3-2)]
次に、第1の実施形態の変形例(3-2)について説明する。本変形例に係るファイル生成装置100は、レイヤ構造スライスを有するG-PCCビットストリーム1を用いて第1の実施形態の変形例(2-1)と同様の処理を行う。
【0115】
メタデータ生成部125は、ジオメトリーレイヤ及びアトリビュートレイヤを特定するための各部分スライス特定情報を時間対応メタデータ36に格納することを決定する。この際、メタデータ生成部125は、時間対応メタデータ36のsample entry typeをLoDDecodeSampleとする。さらに、メタデータ生成部125は、timed metadata trackとG-PCCビットストリーム1を格納するtrackとを、track referenceで紐づける。また、メタデータ生成部125は、DTS(Decoding Time Stamp)アラインするG-PCCビットストリーム1のsampleについてLoD毎のデコード位置情報を時間対応メタデータに格納する。すなわち、G-PCCビットストリーム1のジオメトリーレイヤ及びアトリビュートレイヤを格納するsampleと時間対応メタデータとは、時間同期される。
【0116】
図23は、第1の実施形態の変形例(3-2)に係る時間対応メタデータの一例を表す図である。例えば、メタデータ生成部125は、図23に示すシンタックスを有する時間対応メタデータ43を生成する。メタデータ生成部125は、図18の時間対応メタデータ36におけるdata_length_byte及びdata_length_bitsの代わりに、unit_indexの定義を各ジオメトリーレイヤ41及びアトリビュートレイヤ42の識別情報であるlayer_indexに置き換えた時間対応メタデータ43を生成する。ジオメトリーレイヤ41またはアトリビュートレイヤ42をsub-sampleと定義することで、Ref Doc#4で既定のSubSampleInformationBoxにより各レイヤの境界が識別可能である。なお、Run-length符号化のような会式で、デコード必要な先頭layerのlayer_indexと後続のlayer数とを格納してもよい。layer_indexが連続する場合においてビット数削減の効果がある。
【0117】
クライアント装置200のファイル処理部221は、ポイントクラウドコンテンツのISOBMFFファイルをパースして時間対応メタデータ43を取得する。そして、ファイル処理部221は、時間対応メタデータ43に含まれるlayer_indexを用いて指定されたLoDに対応するジオメトリーレイヤ及びアトリビュートレイヤのデコード位置を時間対応メタデータ36から取得する。そして、ファイル処理部221は、図24に示すように取得したデコード位置に対応するデコード時刻のデータをジオメトリースライス及びアトリビュートスライスから抽出する。図24は、第1の実施形態の変形例(3-2)に係る部分スライスの抽出を示す図である。
【0118】
例えば、図24では、各レイヤのLayer_indexがL0~L7を有し、depth=0のレイヤがLayer_index=L0及びL1を有する。また、depth=1のレイヤがLayer_index=L2及びL3を有し、epth=2のレイヤがLayer_index=L4及びL5を有する。depth=0及び1の階層を含むLoD=1が指定された場合、ファイル処理部221は、時間対応メタデータ43からLayer_index=L0~L3を有するレイヤのデコード位置を特定する。そして、ファイル処理部221は、Layer_index=L0~L3を有するレイヤのデコード位置にあたるデコード時刻のデータをジオメトリースライス及びアトリビュートスライスから抽出する。次に、ファイル処理部221は、Layer_index=L4及びL5を有するレイヤをスキップして、次のLayer_index=L6を有するレイヤのデコード位置から抽出を行う。
【0119】
以上に説明したように、本変形例に係るファイル生成装置は、レイヤ構造スライスを有するG-PCCビットストリームを用いた場合に、部分スライス特定情報を時間対応メタデータに格納する。そして、クライアント装置は、時間対応メタデータから指定されたLoDに対応するレイヤのデコード位置を特定して部分スライスをジオメトリースライス及びアトリビュートスライスから抽出する。これにより、本変形例に係るクライアント装置は、G-PCCビットストリームのsampleのデコード時刻を基準に、sample毎に所望のLoDに対応する部分スライスのデコード位置を同時刻のtimed metadata sampleから取得することができ、部分スライスを抽出する処理が簡略化される。さらに、data_length_byte及びdata_length_bitsの代わりにlayer_indexを用いることで、データビット数をさらに削減することができる。
【0120】
[1.7 第1の実施形態の変形例(3-3)]
次に、第1の実施形態の変形例(3-3)について説明する。本変形例に係るファイル生成装置100は、レイヤ構造スライスと通常構造のスライス12とが混在したG-PCCビットストリーム1を取り扱う。図25は、第1の実施形態の変形例(3-3)に係る時間対応メタデータの一例を表す図である。
【0121】
本変形例に係るメタデータ生成部125は、図25に示す時間対応メタデータ44を生成する。時間対応メタデータ44は、行45のlayer_flagによりスライスの構造を指定する。例えば、layer_flagの値が0であれば通常構造のスライスであり、値が1であればレイヤ構造スライスである。そして、通常構造のスライスであれば、data_length_bytes及びdata_length_bitsが用いられ、レイヤ構造スライスであれば、units_indexが用いられる。このように、メタデータ生成部125は、レイヤ構造スライスと通常構造のスライスとが混在したG-PCCビットストリーム1に対応する部分スライス特定情報を定義する。
【0122】
クライアント装置200のファイル処理部221は、時間対応メタデータ44を取得して、スライスの構造に応じて部分スライスの抽出を実行する。
【0123】
以上に説明したように、レイヤ構造スライスと通常構造のスライスとが混在した場合にも、デコーダに非依存のLoDスケーラブル復号を実現することができる。
【0124】
[2.第2の実施形態]
次に、第2の実施形態について説明する。本実施形態に係るファイル生成装置は、サンプルグループを用いてタイル毎の処理を可能にし、タイル単位でLoDスケーラブル復号を行うことが第1の実施形態と異なる。本実施形態に係るファイル生成装置も図8のブロック図で表される。また、本実施形態に係るクライアント装置も図12及び13のブロック図で表される。以下の説明では、第1の実施形態と同様の各部の機能については説明を省略する。
【0125】
本実施形態に係るファイル生成装置100のメタデータ生成部125は、図26に示す構成を用いてタイル11毎にジオメトリースライス及びアトリビュートスライスをまとめてサンプルグループを生成する。図26は、サンプルグループの構成の一例を示す図である。サンプルグループとは、複数の復号対象をまとめてグループ化し1つの対象として取り扱うことを可能にするISOBMFFにおけるグループ化構造である。
【0126】
例えば、メタデータ生成部125は、第1の実施形態と同様に、ジオメトリースライス及びアトリビュートスライスの各スライスを、depth毎に分割して分割スライスとして設定し、各分割スライスをそれぞれsub-sampleとして設定する。また、メタデータ生成部125は、各分割スライスが対応するdepthを表す情報であるdepth値を設定する。そしてメタデータ生成部125は、部分スライスとLoDとの対応関係を示す部分スライスアクセス情報をSubSmapleInformationBoxに格納する。
【0127】
さらに、メタデータ生成部125は、sample group(‘unim’)を拡張して、図27に示すシンタックス50を有するUnitMapEntryを用いて、部分スライスのsub-sample entryを、その部分スライスが属するsampleグループに紐づける。図27は、第2の実施形態に係るUnitMapEntryの一例を示す図である。これにより、メタデータ生成部125は、タイル11毎にジオメトリースライス及びアトリビュートスライスがまとめられたサンプルグループを生成する。シンタックス50における行51により、そのサンプルグループに含まれるsub-sampleのSubSampleInformationBoxにおけるアクセス情報が示される。
【0128】
図28は、第2の実施形態に係るサンプルグループの一例を示す図である。例えば、図28に示すように、unit_index=1及び2のジオメトリースライス及びアトリビュートスライスが1つのタイル11に含まれる。メタデータ生成部125は、このタイル11を識別情報であるgroupIDが1のサンプルグループとする。そして、メタデータ生成部125は、SubSampleInformationBoxにおいて、そのタイル11に対応するジオメトリースライス及びアトリビュースライスの分割スライスに対応するsub-sampleを#1~#8とする。さらに、メタデータ生成部125は、UnitMapEntryのsubs_entryにより、各groupIDが1のサンプルグループで、どのsub-sampleが使用されるかを示す。
【0129】
クライアント装置200は、サンプルグループ毎に使用するLoDを変えることができる。例えば、クライアント装置200は、あるサンプルグループについては高LoDで復号し、あるサンプルグループについては低LoDで復号するといった指示を受ける。
【0130】
データ抽出部231は、高LoDでの復号が指定されたサンプルグループに含まれるジオメトリースライス及びアトリビュースライスについては、指定された高LoDに対応する分割スライスを抽出する。また、データ抽出部231は、低LoDでの復号が指定されたサンプルグループに含まれるジオメトリースライス及びアトリビュースライスについては、指定された低LoDに対応する分割スライスを抽出する。そして、データ抽出部231は、それぞれのサンプルグループに関する抽出した高LoDに対応する部分スライス群及び低LoDに対応する部分スライス群を復号部222へ出力して復号を行わせる。
【0131】
これにより、ファイル生成装置100は、図29に示すような、タイル11毎にLoDを異ならせたポイントクラウドの3次元画像を生成することができる。図29は、タイル11毎にLoDを異ならせたポイントクラウドの3次元画像の一例を示す図である。図29においてタイル11A及び11Bはdepth=10まで含む高LoDでの復号が行われたデータが密の精細な画像として表示される。また、タイル11A及び11B以外の部分のタイル11は、depth=5まで含む低LoDでの復号が行われたデータが疎の粗い画像として表示される。
【0132】
ここで、本実施形態では、タイルアクセス用のメタデータとしてUnitMapEntryを用い、LoDアクセス用のメタデータとしてSubSampleInformationBoxを用いたが、SubSampleInformationBoxに両方の情報をまとめて格納してもよい。
【0133】
以上に説明したように、本実施形態に係るファイル生成装置は、タイル毎にそのタイルに含まれるジオメトリースライス及びアトリビュートスライスをサンプルグループとしてまとめる。クライアント装置は、サンプルグループ毎のLoDの指定を受けて、タイル毎に異なるLoDで復号したポイントクラウドの3次元画像を表示する。これにより、例えば、視点位置に近いタイルは高LoDで復号し、遠いタイルは低LoDで復号したポイントクラウドの3次元画像を表示することができ、コンテンツ製作者や視聴者の要望に沿った視聴体験を提供することができる。
【0134】
[2.1 第2の実施形態の変形例(1)]
次に、第2の実施形態の変形例(1)について説明する。本変形例に係るファイル生成装置100は、部分スライス特定情報を時間対応メタデータに格納することが第2の実施形態と異なる。図30は、第2の実施形態の変形例(1)に係る時間対応メタデータの一例を示す図である。
【0135】
本変形例に係るメタデータ生成部125は、タイル11の情報と部分スライスの情報を含む図30に示す時間対応メタデータ52を生成する。時間対応メタデータ52における行53が、タイル11の情報を表す。また、時間対応メタデータ52における行54が、第1の実施形態の変形例(2-1)と同様に部分スライスの情報を表す。すなわち、行53で示される各タイル11に対応する部分スライスが、行54により表される。
【0136】
クライアント装置200のデータ抽出部231は、高LoDでの復号が指定されたサンプルグループに含まれるジオメトリースライス及びアトリビュースライスについては、時間対応メタデータを用いて指定された高LoDに対応する部分スライスのデコード位置を特定する。また、データ抽出部231は、低LoDでの復号が指定されたサンプルグループに含まれるジオメトリースライス及びアトリビュースライスについては、時間対応メタデータを用いて指定された低LoDに対応する部分スライスのデコード位置を特定する。そして、データ抽出部231は、特定したデコード位置に対応する部分スライス群を抽出する。その後、データ抽出部231は、それぞれのサンプルグループに関する抽出した高LoDに対応する部分スライス群及び低LoDに対応する部分スライス群を復号部222へ出力して復号を行わせる。
【0137】
なお、本変形例では、タイル単位でLoDを変更したが、メタデータ生成部125は、スライス単位の空間情報に対してLoD毎のデコード位置を格納してもよい。
【0138】
以上に説明したように、本変形例に係るファイル生成装置は、タイル毎にサンプルグループとしてまとめられたジオメトリースライス及びアトリビュートスライスの部分スライス特定情報を時間対応メタデータに格納する。そして、クライアント装置は、指定されたサブサンプル毎のLoDにしたがい時間対応メタデータから指定されたLoDに対応する部分スライスのデコード位置を特定して部分スライスをジオメトリースライス及びアトリビュートスライスから抽出する。本変形例に係るクライアント装置は、G-PCCビットストリームのsampleのデコード時刻を基準に、sample毎に所望のLoDに対応する部分スライスのデコード位置を同時刻のtimed metadata sampleから取得することがでる。したがって、本変形例に係るクライアント装置は、部分スライスを抽出する処理が簡略化しつつタイル毎にLoDを変更した表示を行うことができる。
【0139】
[2.2 第2の実施形態の変形例(2-1)]
次に、第2の実施形態の変形例(2-1)について説明する。本変形例に係るファイル生成装置100は、レイヤ構造スライスを有するG-PCCビットストリーム1を用いる。図31は、第2の実施形態の変形例(2-1)に係るサンプルグループとsub-sampleの対応関係を示す図である。
【0140】
本変形例に係るメタデータ生成部125は、ジオメトリーレイヤ及びアトリビュートレイヤをそれぞれsub-sampleと定義する。また、メタデータ生成部125は、各レイヤが対応するdepthを表す情報であるdepth値を設定する。そして、メタデータ生成部125は、各レイヤとLoDとの対応関係を表す部分スライス特定情報を含むSubSampleInformationBoxを生成する。さらに、メタデータ生成部125は、図27のシンタックス50で表されるUnitMapEntryを用いて、タイル11毎に部分スライス特定情報を有するSubSmapleInfomarionBoxと紐づけを行う。これにより、図31に示すように、各サンプルグループとジオメトリーレイヤ41及びアトリビュートレイヤ42に対応するsub-sampleとが紐づけられる。
【0141】
クライアント装置2のデータ抽出部231は、ポイントクラウドコンテンツのISOBMFFファイルをパースしてメタデータを取得する。そして、データ抽出部231は、メタデータに含まれるSubSampleInformationBoxに格納された部分スライス特定情報から、タイル11毎に異なるLoDに対応するジオメトリーレイヤ及びアトリビュートレイヤを特定する。そして、データ抽出部213は、特定したジオメトリーレイヤ及びアトリビュートレイヤを抽出する。
【0142】
また、以上では、SubSampleInformationBoxにdepth値を格納する場合について説明したが、メタデータ生成部125は、図32のシンタックス55に示すように、SubSampleInformationBoxを使わずに、サンプルグループにdepth値を格納してもよい。図32は、第2の実施形態の変形例(2-1)においてサンプルグループにdepth値を格納する場合のUnitMapEntryを示す図である。また、図33は、第2の実施形態の変形例(2-1)に係るdepth値を格納したサンプルグループの状態を示す図である。この場合、図33に示すように、特定のタイル11に対応する識別情報であるgroupIDが1であるサブサンプルグループにより、各レイヤのデプス値が示される。
【0143】
以上に説明したように、本変形例に係るファイル生成装置は、レイヤ構造スライスを有するG-PCCビットストリームを用いてレイヤ毎に異なるLoDを抽出するための部分スライス特定情報を含むSubSampleInformationBoxを生成する。クライアント装置は、SubSampleInformationBoxに含まれる部分スライス特定情報を用いてレイヤ構造スライスを有するG-PCCビットストリームからレイヤ毎に異なるLoDに対応する部分スライスを抽出して、デコーダに復号させる。これにより、レイヤ構造スライスを用いた場合にも、レイヤ毎に異なるLoDを用いたポイントクラウドの3次元画像を表示することができ、視聴者の要望に沿った視聴体験を提供することができる。
【0144】
[2.3 第2の実施形態の変形例(2-2)]
次に、第2の実施形態の変形例(2-2)について説明する。本変形例に係るファイル生成装置100は、レイヤ構造スライスを有するG-PCCビットストリーム1を用いて、且つ、部分スライス特定情報を時間対応メタデータに格納する。
【0145】
本変形例に係るメタデータ生成部125は、タイル11の情報とジオメトリーレイヤ及びアトリビュートレイヤの情報を含む時間対応メタデータを生成する。この場合の時間対応メタデータは、第2の実施形態の変形例(1)で用いた図30における時間対応メタデータ52における行54の部分が、data_length_byte及びdata_length_bitsの代わりに、unit_indexの定義を各ジオメトリーレイヤ及びアトリビュートレイヤの識別情報であるlayer_indexに置き換えられる。
【0146】
クライアント装置2のデータ抽出部231は、ポイントクラウドコンテンツのISOBMFFファイルをパースしてメタデータを取得する。そして、データ抽出部231は、時間対応メタデータに格納された部分スライス特定情報から、タイル11毎に異なるLoDに対応するジオメトリーレイヤ及びアトリビュートレイヤを特定する。そして、データ抽出部213は、特定したジオメトリーレイヤ及びアトリビュートレイヤを抽出する。
【0147】
また、本変形例では、図30の時間対応メタデータ52と同等の時間対応メタデータを使用したが、他にも、メタデータ生成部125は、サンプルグループを利用した時間対応メタデータを使用することも可能である。図34は、第2の実施形態の変形例(2-2)においてサンプルグループを用いた場合の時間対応メタデータを示す図である。
【0148】
例えば、メタデータ生成部125は、図23のシンタックスで示される時間対応メタデータ56及び57を生成する。この時間対応メタデータ56及び57により、メタデータ生成部125は、LoD毎にタイル11のサンプルグループを設定する。例えば、メタデータ生成部125は、BrickGroupEntryを拡張して以下のように規定する。メタデータ生成部125は、時間対応メタデータ56に格納するlodの値が0であれば対応するレイヤはLoD=0のレイヤであるとし、lodの値が1であればLoD=0とLoD=1のいずれにも含まれるレイヤであるとする。
【0149】
図35は、第2の実施形態の変形例(2-2)に係る各レイヤとLoDとの対応付けを示す図である。時間対応メタデータ56及び57により、例えば、図35に示すように、unit_indexfが1及び2のジオメトリーレイヤ及びアトリビュートレイヤは、LoD=0及び1のレイヤであり、それらはタイル11Cに含まれることが示される。また、unit_indexが3及び4のジオメトリーレイヤ及びアトリビュートレイヤは、LoD=1のレイヤであり、それらはタイル11Dに含まれることが示される。
【0150】
以上に説明したように、本変形例に係るファイル生成装置は、レイヤ構造スライスを有するG-PCCビットストリームを用いてレイヤ毎に異なるLoDを抽出するための部分スライス特定情報を含む時間対応メタデータを生成する。クライアント装置は、時間対応メタデータに含まれる部分スライス特定情報を用いてレイヤ構造スライスを有するG-PCCビットストリームからレイヤ毎に異なるLoDに対応する部分スライスを抽出して、デコーダに復号させる。これにより、時間対応メタデータを用いて、レイヤ構造スライスを有するG-PCCビットストリームからレイヤ毎に異なるLoDを用いたポイントクラウドの3次元画像を表示することができ、視聴者の要望に沿った視聴体験を提供することができる。
【0151】
[3.第3の実施形態]
次に、第3の実施形態について説明する。本実施形態に係るファイル生成装置は、G-PCC静止画についてLoDスケーラブル符号化を行うことが第1の実施形態と異なる。本実施形態に係るファイル生成装置も図8のブロック図で表される。また、本実施形態に係るクライアント装置も図12及び13のブロック図で表される。以下の説明では、第1の実施形態と同様の各部の機能については説明を省略する。以下に説明する本実施形態に係る構成は、レイヤ構造スライスについても適用することが可能である。
【0152】
図36は、G-PCC静止画のISOBMFFファイルへの格納方法を示す図である。本実施形態に係るファイル生成装置100のメタデータ生成部125は、図36に示すように、Ref Doc#4で規定されたV-PCC静止画をISOBMFFファイルに格納する場合と同様に、MetaBoxを利用して、G-PCC静止画をISOBMFFファイルに格納する。この場合、メタデータ生成部125は、SPS、GPS、APS、タイルインベントリなどのパラメータセットをボックス61に配置されたItemProperty(‘gpcC’)に含ませる。
【0153】
さらに、メタデータ生成部125は、部分スライス特定情報をボックス61に配置されたSubSampleItemPropertyに格納する。図37は、第3の実施形態に係るSubSampleItemPropertyの一例を示す図である。メタデータ生成部125は、図37に示すシンタックス62を有するSubSampleItemPropertyを生成する。この場合、メタデータ生成部125は、Codec_specific_parametersを図37のシンタックス63のように規定する。ここでの、SubSampleItemPropertyは、第1の実施形態におけるSubSampleInformationBoxと同様の情報を含む。
【0154】
クライアント装置200のデータ抽出部231は、取得したISOBMFFファイルをパースしてメタデータを抽出する。そして、データ抽出部231は、メタデータに含まれるSubSampleItemPropertyを用いて、指定されたLoDに対応する部分スライスをG-CC静止画のビットストリームから抽出して復号部222へ出力する。
【0155】
復号部222は、ジオメトリーデコーダ232でG-CC静止画におけるジオメトリースライス13の部分スライスを復号する。また、復号部222は、アトリビュートデコーダ233でG-CC静止画におけるアトリビュートスライス14の部分スライスを復号する。
【0156】
表示情報生成部223のポイントクラウド生成部234は、復号されたジオメトリーのデータ及びアトリビュートのデータを用いてポイントクラウドを生成する。画像処理部235は、レンダリングを行いポイントクラウドの3次元静止画像を生成して、表示部202に表示させる。
【0157】
以上に説明したように、本実施形態に係るファイル生成装置は、G-PCC静止画のジオメトリースライス及びアトリビュートスライスの部分スライス特定情報をSubSamapleItemPropertyに格納する。クライアント装置は、ISOBMFFファイルから取得したメタデータに格納されたSubSamapleItemPropertyを用いて、所望のLoDに対応する3次元静止画の部分スライスを抽出して、抽出された部分スライスをデコーダで復号しポイントクラウドの3次元静止画像を表示する。これにより、デコーダに依存せずにG-PCC静止画のビットストリームに含まれる所望のLoDに対応する部分スライスの復号を行うことができ、G-PCC静止画についても視聴者の要望に沿った視聴体験を提供することができる。
【0158】
[3.1 第3の実施形態の変形例(1)]
本変形例に係るファイル生成装置100は、第1の実施形態の変形例(2-1)と同様に、所望のLoDを得るための部分スライス特定情報を時間対応メタデータに格納することが第3の実施形態と異なる。以下に説明する本変形例に係る構成は、レイヤ構造スライスについても適用することが可能である。図38は、G-PCC静止画の時間対応メタデータを用いた格納方法を示す図である。
【0159】
本変形例に係るメタデータ生成部125は、図38に示すボックス64の中に部分スライス特定情報を含むLoDDecodeItemPropertyを新規定義して格納する。例えば、メタデータ生成部125は、図39のシンタックスで示される時間対応メタデータ65としてLoDDecodeItemPropertyを生成する。図39は、第3の実施形態の変形例(1)に係る時間対応メタデータの一例を示す図である。このLoDDecodeItemPropertyは、図18に示す第1の実施形態の変形例(2-1)におけるシンタックスを有する時間対応メタデータ36と同様の情報を含む。
【0160】
クライアント装置200のデータ抽出部231は、取得したISOBMFFファイルをパースしてメタデータを抽出する。そして、データ抽出部231は、LoDDecodeItemPropertyを用いて指定されたLoDに対応するデコード時刻を特定する。そして、データ抽出部231は、特定したデコード時刻に対応する部分スライスをG-PCC静止画のビットストリームから抽出する。
【0161】
以上に説明したように、本実施形態に係るファイル生成装置は、時間対応メタデータに部分スライス特定情報を格納する。クライアント装置は、時間対応メタデータに格納された部分スライス特定情報を用いて所望のLoDに対応する部分スライスを抽出する。これにより、クライアント装置は、G-PCC静止画のビットストリームのデコード時刻を基準に、所望のLoDに対応する部分スライスのデコード位置を同時刻のtimed metadata sampleから取得することができ、部分スライスを抽出する処理が簡略化される。
【0162】
[3.2 第3の実施形態の変形例(2)]
本変形例に係るファイル生成装置は、タイル毎にLoDを異ならせることが第3の実施形態と異なる。以下に説明する本変形例に係る構成は、レイヤ構造スライスについても適用することが可能である。図40は、G-PCC静止画をタイル毎にLoDを異ならせる場合の部分スライス特定情報の格納方法を示す図である。
【0163】
本変形例に係るメタデータ生成部125は、図40に示すボックス66の中に部分スライス特定情報を含むTileLoDDocodeItemPropertyを新規定義して格納する。例えば、メタデータ生成部125は、図41のシンタックス67で示されるTileLoDDecodeItemPropertyを生成する。図41は、第3の実施形態の変形例(2)に係るTileLoDDecodeItemPropertyの一例を示す図である。このTileLoDDecodeItemPropertyは、図30に示す第2の実施形態の変形例(1)における時間対応メタデータ52と同様の情報を含む。
【0164】
クライアント装置200のデータ抽出部231は、G-PCC静止画における高LoDでの復号が指定されたサンプルグループに含まれるジオメトリースライス13及びアトリビュースライス14については、時間対応メタデータを用いて指定された高LoDに対応する部分スライスのデコード位置を特定する。また、データ抽出部231は、G-PCC静止画における低LoDでの復号が指定されたサンプルグループに含まれるジオメトリースライス13及びアトリビュースライス14については、時間対応メタデータを用いて指定された低LoDに対応する部分スライスのデコード位置を特定する。そして、データ抽出部231は、特定したデコード位置に対応する部分スライス群を抽出する。その後、データ抽出部231は、それぞれのサンプルグループに関する抽出した高LoDに対応する部分スライス群及び低LoSに対応する部分スライス群を復号部222へ出力して復号を行わせる。
【0165】
なお、メタデータ生成部125は、ItemProperty(‘gpcC’)に含ませたタイルインベントリを参照してタイル情報を取得する構成にすることも可能である。
【0166】
以上に説明したように、本変形例に係るファイル生成装置は、G-PCC静止画のタイル毎にサンプルグループとしてまとめられたジオメトリースライス及びアトリビュートスライスの部分スライス特定情報を時間対応メタデータに格納する。そして、クライアント装置は、指定されたサブサンプル毎のLoDにしたがい時間対応メタデータから指定されたLoDに対応するG-PCC静止画のビットストリームにおける部分スライスのデコード位置を特定して部分スライスをジオメトリースライス及びアトリビュートスライスから抽出する。本変形例に係るクライアント装置は、G-PCC静止画のビットストリームのsampleのデコード時刻を基準に、sample毎に所望のLoDに対応する部分スライスのデコード位置を同時刻のtimed metadata sampleから取得することがでる。したがって、本変形例に係るクライアント装置は、G-PCC静止画のビットストリームから部分スライスを抽出する処理が簡略化しつつタイル毎にLoDを変更した表示を行うことができる。
【0167】
[4.第4の実施形態]
以上ではISOBMFFに格納する場合を説明した。ただし、図42に示すMatroska Media Container(http://www.matroska.org/)を用いて伝送する場合でもG-PCCビットストリーム1及び部分スライス特定情報を含むメタデータを送信することが可能である。図42は、Matroska Media Containerのフォーマットを表す図である。
【0168】
この場合、ファイル生成部126は、各depthに対応する部分スライスを示す情報やタイル11毎に部分スライスの情報と紐づけるための情報を、Track Entry elementに、新しく定義したelementに格納する。また、ファイル生成部126は、所望のLoDを得るためのデコード位置が格納された時間対応メタデータや、タイル11毎に所望のLoDを得るためのデコード位置が格納された時間対応メタデータを、G-PCCビットストリーム1が格納されるTrack entryとは別のTrack entryに格納する。また、G-PCC静止画のビットストリームの場合、ファイル生成部126は、WebPのExtended File Formatを用いて新規のChunkを定義して、第3の実施形態及びその変形例で示した情報と同様の情報を格納する。
【0169】
この際、ファイル生成部126は、Element Typeをbinaryとし、且つ、EBMLデータとしてSceneDescriptionObjectMetadata()をバイナリデータとして格納する。
【0170】
[ハードウェア構成]
図43は、コンピュータのハードウェア構成図である。ファイル生成装置100及びクライアント装置200は、図43に示すコンピュータ900によって実現可能である。コンピュータ900において、プロセッサ901、ROM(Read Only Memory)902、RAM(Random Access Memory)903、ハードディスク904及び入出力インタフェース905は、バス910を介して相互に接続される。
【0171】
入出力インタフェース905には、例えば、出力装置906、入力装置907、通信装置908及びドライブ909が接続される。出力装置906は、例えば、ディスプレイ、スピーカ、出力端子などである。入力装置907は、例えば、キーボード、マウス、マイクロホン、タッチパネル、入力端子などである。ドライブ909は、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリなどのリムーバブル記録媒体911を駆動する。
【0172】
通信装置908は、外部のネットワークに接続される。ファイル生成装置100及びクライアント装置200は、通信装置908を介して相互に接続される。また、ファイル生成装置100及びクライアント装置200は、通信装置908を介してWebサーバ300に接続する。ハードディスク904は、不揮発性ストレージであり、補助記憶装置である。
【0173】
以上のように構成されるコンピュータ900では、プロセッサ901が、例えば、ハードディスク904に記憶されているプログラムを、バス910を介して、RAM903にロードして実行することにより、上記各実施形態及びその変形例で説明した一連の処理が行われる。RAM903にはまた、プロセッサ901が各種の処理を実行する上において必要なデータなども適宜記憶される。
【0174】
プロセッサ901が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブル記録媒体911に記録して適用することができる。その場合、プログラムは、リムーバブル記録媒体911をドライブ909に装着することにより、入出力インタフェース905を介して、ハードディスク904にインストールすることができる。
【0175】
また、このプログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することもできる。その場合、プログラムは、通信装置908で受信し、ハードディスク904にインストールすることができる。
【0176】
その他、このプログラムは、ハードディスク904に、予めインストールしておくこともできる。
【0177】
以上、本開示の実施形態について説明したが、本開示の技術的範囲は、上述の実施形態そのままに限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。また、異なる実施形態及び変形例にわたる構成要素を適宜組み合わせてもよい。
【0178】
なお、本明細書に記載された効果はあくまで例示であって限定されるものではなく、また他の効果があってもよい。
【0179】
なお、本技術は以下のような構成を取ることもできる。
【0180】
(1)ポイントクラウドデータを、品質レベルであるLoD(Level of Detail)に対応する段階的な階層構造を有するように符号化して1以上のジオメトリースライスを含むデータ領域から構成されるビットストリームを生成する符号化部と、
前記LoDと前記ジオメトリースライスにおける前記LoDに対応する部分領域である部分スライスとの対応を特定するための部分スライス特定情報を生成するメタデータ生成部と、
前記部分スライス特定情報を含むファイルを生成するファイル生成部と、
を備えたことを特徴とする情報処理装置。
(2)前記メタデータ生成部は、前記ビットストリームから前記LoDを構成する階層の前記階層構造における深度を表す深度情報を抽出し、
前記メタデータ生成部は、前記ジオメトリースライスの前記深度に対応する部分をsub-sampleとして設定する、
付記(1)に記載の情報処理装置。
(3)前記メタデータ生成部は、前記LoDを構成する各前記階層へのアクセスを表すアクセス情報をさらに生成する、
付記(2)に記載の情報処理装置。
(4)前記アクセス情報は、前記sub-sampleのデータサイズの情報を含む、
付記(3)に記載の情報処理装置。
(5)前記ファイル生成部は、前記部分スライス特定情報および前記アクセス情報をsub-sample information boxに格納する、
付記(4)に記載の情報処理装置。
(6)前記メタデータ生成部は、3次元コンテンツを再生する再生処理装置の処理能力に応じて前記深度を選択する指標として、前記階層毎の復号対象となるデコード点数の情報を情報量として抽出し、
前記ファイル生成部は、前記情報量を前記ファイルに格納する、
付記(5)に記載の情報処理装置。
(7)前記部分スライス特定情報は、前記アクセス情報を含み、
前記メタデータ生成部は、前記部分スライス特定情報を時間対応メタデータに格納する、
付記(6)に記載の情報処理装置。
(8)前記データサイズの情報には、前記ビットストリームの識別情報及び前記ビットストリームの先頭からのデータ長の情報が含まれる、
付記(7)に記載の情報処理装置。
(9)前記メタデータ生成部は、前記3次元コンテンツを再生する再生処理装置の処理能力に応じて前記LoDを選択する指標として、前記階層毎の復号対象となるデコード点数の情報を情報量として抽出し、
前記ファイル生成部は、前記情報量を前記ファイルに格納する、
付記(8)に記載の情報処理装置。
(10)前記ビットストリームは、さらに色およびテクスチャなどの付加属性を示すアトリビュートスライスを含み、
前記アクセス情報には、前記ジオメトリースライスまたは前記アトリビュートスライスに対応する前記sub-sampleであるであることを示すタイプ情報が含まれる、
付記(3)に記載の情報処理装置。
(11)前記ポイントクラウドデータは、複数のタイルから構成されるデータであって、
前記ビットストリームは、さらに色およびテクスチャなどの付加属性を示すアトリビュートスライスを含み、
前記メタデータ生成部は、前記ビットストリームの1フレームに含まれる前記タイル毎に、前記タイルに対応する複数のスライスのうち、前記LoDに対応する前記部分スライス特定情報を生成する、
付記(3)に記載の情報処理装置。
(12)前記ファイル生成部は、前記タイル毎の前記部分スライス特定情報を、前記部分スライス特定情報を含むsub-sample information boxに紐づける、
付記(11)に記載の情報処理装置。
(13)ファイル生成部は、前記タイル毎の部分スライス特定情報を、前記階層情報である前記品質レベルを示すLoD情報毎に時間対応メタデータに格納する、
付記(11)に記載の情報処理装置。
(14)前記符号化部は、前記階層毎に分割された階層単位を有する前記ビットストリームを生成し、
前記メタデータ生成部は、各前記階層単位に含まれる前記スライスに対応させて前記部分スライス特定情報を生成する、
付記(11)に記載の情報処理装置。
(15)前記ファイル生成部は、時間情報を持たないビットストリーム及び部分スライス特定情報を前記ファイルに格納する、
付記(1)に記載の情報処理装置。
(16)ポイントクラウドデータを、品質レベルであるLoDに対応する段階的な階層構造を有するように符号化して1以上のジオメトリースライスおよび1以上のアトリビュートスライスを含むデータ領域から構成されるビットストリーム、および、前記LoDを構成する階層の前記階層構造における深度を表す深度情報を生成する符号化部と、
前記LoDと前記ジオメトリースライスにおける前記LoDに対応する部分領域である部分スライスとの対応を特定するための部分スライス特定情報を生成し、前記ジオメトリースライスの前記深度に対応する部分をsubsampleとして設定するメタデータ生成部と、
前記部分スライス特定情報を含むファイルを生成するファイル生成部と、
を備えた情報処理装置。
(17)ポイントクラウドデータを、品質レベルであるLoDに対応する段階的な階層構造を有するように符号化して1以上のジオメトリースライスを含むデータ領域から構成されるビットストリームを生成し、
前記LoDと前記ジオメトリースライスにおける前記LoDに対応する部分領域である部分スライスとの対応を特定するための部分スライス特定情報を生成し、
前記部分スライス特定情報を含むファイルを生成する、
処理をコンピュータに実行させる情報処理方法。
(18)ポイントクラウドデータを品質レベルであるLoDに対応する段階的な階層構造を有するように符号化して1以上のジオメトリースライスを含むデータ領域から構成されるビットストリーム及び前記LoDと前記ジオメトリースライスにおける前記LoDに対応する部分領域である部分スライスとの対応を特定するための部分スライス特定情報を含むファイルを受信するファイル取得部と、
前記ファイル取得部により取得された前記ファイルから前記部分スライス特定情報を抽出するデータ抽出部と、
前記データ抽出部により抽出された前記部分スライス特定情報を基に、前記ビットストリームを所望の前記品質レベルで復号する復号部と、
を備えた再生処理装置。
(19)ポイントクラウドデータを品質レベルであるLoDに対応する段階的な階層構造を有するように符号化して1以上のジオメトリースライスを含むデータ領域から構成されるビットストリーム及び前記LoDと前記ジオメトリースライスにおける前記LoDに対応する部分領域である部分スライスとの対応を特定するための部分スライス特定情報を含むファイルを受信し、
取得した前記ファイルから前記部分スライス特定情報を抽出し、
抽出した前記部分スライス特定情報を基に、前記ビットストリームを所望の前記品質レベルで復号する、
処理をコンピュータに実行させる再生処理方法。
【符号の説明】
【0181】
1 G-PCCビットストリーム
10 ポイントクラウドフレーム
11 タイル
12 スライス
13 ジオメトリースライス
14 アトリビュートスライス
15 ポイント
100 ファイル生成装置
101 抽出部
102 ファイル生成処理部
103 送信部
104 制御部
121 符号化部
122 ジオメトリーエンコーダ
123 アトリビュートエンコーダ
124 ビットストリーム生成部
125 メタデータ生成部
126 ファイル生成部
200 クライアント装置
201 再生処理部
202 表示部
203 制御部
211 ファイル取得部
212 復号処理部
221 ファイル処理部
222 復号部
223 表示情報生成部
231 データ抽出部
232 ジオメトリーデコーダ
233 アトリビュートデコーダ
234 ポイントクラウド生成部
235 画像処理部
300 Webサーバ
400 ネットワーク
500 配信システム
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22
図23
図24
図25
図26
図27
図28
図29
図30
図31
図32
図33
図34
図35
図36
図37
図38
図39
図40
図41
図42
図43