IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 北京小米移動軟件有限公司の特許一覧

特許7585515方位角符号化モードを使用して点群ジオメトリデータを符号化/復号化する方法と装置
<>
  • 特許-方位角符号化モードを使用して点群ジオメトリデータを符号化/復号化する方法と装置 図1
  • 特許-方位角符号化モードを使用して点群ジオメトリデータを符号化/復号化する方法と装置 図2
  • 特許-方位角符号化モードを使用して点群ジオメトリデータを符号化/復号化する方法と装置 図3
  • 特許-方位角符号化モードを使用して点群ジオメトリデータを符号化/復号化する方法と装置 図4
  • 特許-方位角符号化モードを使用して点群ジオメトリデータを符号化/復号化する方法と装置 図5
  • 特許-方位角符号化モードを使用して点群ジオメトリデータを符号化/復号化する方法と装置 図6
  • 特許-方位角符号化モードを使用して点群ジオメトリデータを符号化/復号化する方法と装置 図7
  • 特許-方位角符号化モードを使用して点群ジオメトリデータを符号化/復号化する方法と装置 図8
  • 特許-方位角符号化モードを使用して点群ジオメトリデータを符号化/復号化する方法と装置 図9
  • 特許-方位角符号化モードを使用して点群ジオメトリデータを符号化/復号化する方法と装置 図10
  • 特許-方位角符号化モードを使用して点群ジオメトリデータを符号化/復号化する方法と装置 図11
  • 特許-方位角符号化モードを使用して点群ジオメトリデータを符号化/復号化する方法と装置 図12
  • 特許-方位角符号化モードを使用して点群ジオメトリデータを符号化/復号化する方法と装置 図13
  • 特許-方位角符号化モードを使用して点群ジオメトリデータを符号化/復号化する方法と装置 図14
  • 特許-方位角符号化モードを使用して点群ジオメトリデータを符号化/復号化する方法と装置 図15
  • 特許-方位角符号化モードを使用して点群ジオメトリデータを符号化/復号化する方法と装置 図16
  • 特許-方位角符号化モードを使用して点群ジオメトリデータを符号化/復号化する方法と装置 図17
  • 特許-方位角符号化モードを使用して点群ジオメトリデータを符号化/復号化する方法と装置 図18
  • 特許-方位角符号化モードを使用して点群ジオメトリデータを符号化/復号化する方法と装置 図19
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-11-08
(45)【発行日】2024-11-18
(54)【発明の名称】方位角符号化モードを使用して点群ジオメトリデータを符号化/復号化する方法と装置
(51)【国際特許分類】
   G06T 9/00 20060101AFI20241111BHJP
【FI】
G06T9/00
【請求項の数】 18
(21)【出願番号】P 2023560078
(86)(22)【出願日】2021-04-09
(65)【公表番号】
(43)【公表日】2024-04-02
(86)【国際出願番号】 CN2021086263
(87)【国際公開番号】W WO2022213388
(87)【国際公開日】2022-10-13
【審査請求日】2023-10-31
(73)【特許権者】
【識別番号】516180667
【氏名又は名称】北京小米移動軟件有限公司
【氏名又は名称原語表記】Beijing Xiaomi Mobile Software Co.,Ltd.
【住所又は居所原語表記】No.018, Floor 8, Building 6, Yard 33, Middle Xierqi Road, Haidian District, Beijing 100085, China
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【弁理士】
【氏名又は名称】内藤 和彦
(74)【代理人】
【識別番号】100108213
【弁理士】
【氏名又は名称】阿部 豊隆
(72)【発明者】
【氏名】ガオ,シュオ
【審査官】岩井 健二
(56)【参考文献】
【文献】米国特許出願公開第2021/0326734(US,A1)
【文献】米国特許出願公開第2020/0394822(US,A1)
【文献】米国特許出願公開第2020/0302237(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 9/00 ー 9/40
(57)【特許請求の範囲】
【請求項1】
点群を物理オブジェクトを表す符号化点群データのビットストリームに符号化する方法であって、
前記方法は、方位角符号化モードを含み、前記方位角符号化モードは、前記点群の点の座標を符号化するためのビットシーケンスを提供し、前記方法は、
点座標が属する区間を左半分区間と右半分区間とに分割するステップ(202)と、
前記点を取得したセンサによって見られた区間角を表す視点(AA)に基づいて、コンテキストを選択するステップ(106)と、
選択されたコンテキストに基づいて、ビットシーケンス中のビット(b)を前記ビットストリームにコンテキスト適応バイナリエントロピー符号化するステップであって、符号化されたビット(b)は、前記点座標が2つの半区間のどちらに属するかを指示するステップ(107)と、を含む、
点群を物理オブジェクトを表す符号化点群データのビットストリームに符号化する方法。
【請求項2】
物理オブジェクトを表す符号化点群データのビットストリームから点群を復号化する方法であって、
前記方法は、方位角符号化モードを含み、前記方位角符号化モードは、前記点群の点の座標を復号化するためのビットシーケンスを提供し、前記方法は、
点座標が属する区間を左半分区間と右半分区間とに分割するステップ(202)と、
前記点を取得したセンサによって見られた区間角を表す視点(AA)に基づいて、コンテキストを選択するステップ(106)と、
選択されたコンテキストに基づいて、前記ビットストリームから、ビット(b)をコンテキスト適応バイナリエントロピー復号化するステップであって、復号化されたビット(b)は、前記点座標が2つの半区間のどちらに属するかを指示するステップ(302)と、を含む、
ことを特徴とする物理オブジェクトを表す符号化点群データのビットストリームから点群を復号化する方法。
【請求項3】
前記視点(AA)は、前記区間の下界に関連する第1の角度(φnode,d)、前記区間の上界に関連する第2の角度(φtop,d)、および前記区間の中点に関連する第3の角度(φmiddle,d)のうちの少なくとも1つに基づいて推定される、
ことを特徴とする請求項1又は2に記載の方法。
【請求項4】
前記視点(AA)は、前記第1の角度(φnode,d)と前記第2の角度(φtop,d)とに基づいて推定される、
ことを特徴とする請求項3に記載の方法。
【請求項5】
前記視点(AA)は、前記第1の角度(φnode,d)と前記第3の角度(φmiddle,d)とに基づいて推定される、
ことを特徴とする請求項3に記載の方法。
【請求項6】
前記視点(AA)は、前記第2の角度(φtop,d)と第3の角度(φmiddle,d)とに基づいて推定される、
ことを特徴とする請求項3に記載の方法。
【請求項7】
前記視点(AA)は、区間サイズ(s)、および前記点と前記点を取得する前記センサとの間の距離(r)に基づいて推定される、
ことを特徴とする請求項1に記載の方法。
【請求項8】
基本方位角(Δφ)と前記視点(AA)の相対的なサイズとに基づいて、前記コンテキストを選択する、
ことを特徴とする請求項1又は2に記載の方法。
【請求項9】
前記基本方位角(Δφ)と前記視点(AA)との比率に基づいてコンテキストを選択する、
ことを特徴とする請求項8に記載の方法。
【請求項10】
前記比率の特定の値の範囲に基づいて、コンテキストを少なくとも2つのコンテキストサブセットにグループ化し、前記コンテキストを選択することには、特定の値の範囲と前記比率とに基づいて、コンテキストサブセットを選択するステップ(421)と、選択されたコンテキストサブセットのコンテキストから、コンテキストを選択するステップ(422)とを含む、
ことを特徴とする請求項9に記載の方法。
【請求項11】
選択されたコンテキストサブセットのコンテキストから、コンテキストを選択するステップ(422)は、前記点に関連する予測方位角(φpred)、前記左半分区間に関連する左角(φleft,d)、および前記右半分区間に関連する右角(φright,d)によって決まる、
ことを特徴とする請求項10に記載の方法。
【請求項12】
コンテキストテーブル(ctxTable_T)から前記コンテキストを選択し、前記コンテキストテーブルは、第1のエントリとして選択されたコンテキストサブセットを指示するコンテキストサブセットインデックス(ctxSetIdx)、及び第2のエントリとして前記選択されたコンテキストサブセットの選択されたコンテキストを指示するコンテキストインデックス(cxtIdx)を有する、
ことを特徴とする請求項10に記載の方法。
【請求項13】
点群を物理オブジェクトを表す符号化点群データのビットストリームに符号化する装置であって、
前記装置は1つ又は複数のプロセッサを含み、前記1つ又は複数のプロセッサは、方位角符号化モードを実現するために構成され、前記方位角符号化モードは、前記点群の点の座標を符号化するためのビットシーケンスを提供し、前記方位角符号化モードは
座標が属する区間を左半分区間と右半分区間とに分割するステップと、
前記点を取得したセンサによって見られた区間角を表す視点に基づいて、コンテキストを選択するステップと、
選択されたコンテキストに基づいて、ビットシーケンス中のビット(b)を前記ビットストリームにコンテキスト適応バイナリエントロピー符号化するステップであって、符号化されたビット(b)は、前記点座標が2つの半区間のどちらに属するかを指示するステップと、を含む、
ことを特徴とする点群を物理オブジェクトを表す符号化点群データのビットストリームに符号化する装置。
【請求項14】
物理オブジェクトを表す符号化点群データのビットストリームから点群を復号化する装置であって、
前記装置は1つ又は複数のプロセッサを含み、前記1つ又は複数のプロセッサは、方位角符号化モードを実現するために構成され、前記方位角符号化モードは、前記点群の点の座標を復号化するためのビットシーケンスを提供し、前記方位角符号化モードは、
点座標が属する区間を左半分区間と右半分区間とに分割するステップと、
前記点を取得したセンサによって見られた区間角を表す視点に基づいて、コンテキストを選択するステップと、
選択されたコンテキストに基づいて、前記ビットストリームから、ビットをコンテキスト適応バイナリエントロピー復号化するステップであって、復号化されたビットは、前記点座標が2つの半区間のどちらに属するかを指示するステップと、を含む、
ことを特徴とする物理オブジェクトを表す符号化点群データのビットストリームから点群を復号化する装置。
【請求項15】
命令を含むコンピュータープログラムであって、
プログラムが1つ又は複数のプロセッサによって実行される場合、前記命令は、物理オブジェクトを表す符号化点群データのビットストリームから点群を符号化する方法を前記1つ又は複数のプロセッサに実行させ、前記方法は、方位角符号化モードを含み、前記方位角符号化モードは、前記点群の点の座標を符号化するためのビットシーケンスを提供し、前記方法は、
点座標が属する区間を左半分区間と右半分区間とに分割するステップと、
前記点を取得したセンサによって見られた区間角を表す視点に基づいて、コンテキストを選択するステップと、
選択されたコンテキストに基づいて、ビットシーケンス中のビット(b)を前記ビットストリームにコンテキスト適応バイナリエントロピー符号化するステップであって、符号化されたビット(b)は、前記点座標が2つの半区間のどちらに属するかを指示するステップと、を含む、
ことを特徴とするコンピュータープログラム。
【請求項16】
非一時的記憶媒体であって、
前記非一時的記憶媒体はプログラムコード命令を運び、前記命令は、物理オブジェクトを表す符号化点群データのビットストリームから点群を符号化する方法を実行するために使用され、前記方法は、方位角符号化モードを含み、前記方位角符号化モードは、前記点群の点の座標を符号化するためのビットシーケンスを提供し、前記方法は、
点座標が属する区間を左半分区間と右半分区間とに分割するステップと、
前記点を取得したセンサによって見られた区間角を表す視点に基づいて、コンテキストを選択するステップと、
選択されたコンテキストに基づいて、ビットシーケンス中のビット(b)を前記ビットストリームにコンテキスト適応バイナリエントロピー符号化するステップであって、符号化されたビット(b)は、前記点座標が2つの半区間のどちらに属するかを指示するステップと、を含む、
ことを特徴とする非一時的記憶媒体。
【請求項17】
命令を含むコンピュータープログラムであって、
プログラムが1つ又は複数のプロセッサによって実行される場合、前記命令は、物理オブジェクトを表す符号化点群データのビットストリームから点群を復号化する方法を前記1つ又は複数のプロセッサに実行させ、前記方法は、方位角符号化モードを含み、前記方位角符号化モードは、前記点群の点の座標を復号化するためのビットシーケンスを提供し、前記方法は、
点座標が属する区間を左半分区間と右半分区間とに分割するステップと、
前記点を取得したセンサによって見られた区間角を表す視点に基づいて、コンテキストを選択するステップと、
選択されたコンテキストに基づいて、前記ビットストリームから、ビットをコンテキスト適応バイナリエントロピー復号化するステップであって、復号化されたビットは、前記点座標が2つの半区間のどちらに属するかを指示するステップと、を含む、
ことを特徴とするコンピュータープログラム。
【請求項18】
非一時的記憶媒体であって、
前記非一時的記憶媒体はプログラムコード命令を運ぶ、前記命令は、物理オブジェクトを表す符号化点群データのビットストリームから点群を復号化する方法を実行するために使用され、前記方法は、方位角符号化モードを含み、前記方位角符号化モードは、前記点群の点の座標を復号化するためのビットシーケンスを提供し、前記方法は、
点座標が属する区間を左半分区間と右半分区間とに分割するステップと、
前記点を取得したセンサによって見られた区間角を表す視点に基づいて、コンテキストを選択するステップと、
選択されたコンテキストに基づいて、前記ビットストリームから、ビットをコンテキスト適応バイナリエントロピー復号化するステップであって、復号化されたビットは、前記点座標が2つの半区間のどちらに属するかを指示するステップと、を含む、
ことを特徴とする非一時的記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本出願は、全体的に点群圧縮に関し、具体に、方位角符号化モードを使用して点群ジオメトリデータを符号化/復号化する方法と装置に関する。
【背景技術】
【0002】
このセクションは、本分野のさまざまな態様を読者に紹介することを目的としており、これらの態様は、以下に記載および/または保護請求される本願の少なくとも1つの例示的な実施形態のさまざまな態様と関連している可能性がある。この議論は、本出願のあらゆる側面をよりよく理解するために、読者に背景情報を提供するのに役立つと考えられる。
【0003】
3Dデータ表現のフォーマットの1つとして、点群はすべてのタイプの物理オブジェクトまたはシーンを表現する上で共通性があるため、最近注目されている。点群は、文化遺産/建物など、さまざまな目的で使用できる。ここでは、像や建物などのオブジェクトを3Dでスキャンして、オブジェクトを送信したりアクセスしたりすることなく、オブジェクトの空間配置を共有する。また、オブジェクトが破壊される可能性がある場合に、オブジェクト(例えば地震によるお寺)の知識を確実に保存する方法である。このような点群は、通常、静的、カラー、巨大である。
【0004】
もう1つのユースケースは地形と製図で、3D表現を使用すると地図は平面に限らず、地形を含むことができる。Googleマップは現在3Dマップの良い例ですが、点群ではなくメッシュを使用している。しかし、点群は3Dマップの適切なデータフォーマットである可能性があり、そのような点群は通常、静的、カラー、巨大である。
【0005】
バーチャルリアリティと没入型の世界は最近話題になり、多くの人に2Dフラットビデオの未来として予見されている。その中で視聴者が目の前の仮想世界しか見えない標準テレビに比べて、基本的な思想は視聴者を取り巻く環境に浸らせることである。見る人の環境における自由度によって、没入感にはいくつかのレベルがある。点群は仮想現実(VR)世界を配信するための良い候補フォーマットである。
【0006】
自動車業界や自動運転車も点群を使える分野である。自動運転車は、近隣の現実に基づいて正しい運転決定を下すために、その環境を「検知」できるはずである。
【0007】
点群とは、3次元(3D)空間内にある点のグループで、必要に応じて各点に付加価値がある。これらの付加価値は通常、属性と呼ばれる。たとえば、属性は、3成分カラー、材料特性(例えば反射率)、および/または点に関連付けられた表面の2成分法線ベクトルにすることができる。
【0008】
したがって、点群はジオメトリ(3Dデカルト座標x、y、zで表される3D空間における点の3D位置)と属性の組み合わせである。
【0009】
点群は、カメラアレイ、深さセンサアレイ、レーザ(光検出および測距)アレイ、スキャナアレイなどの様々なタイプの装置によって取得することができ、またはコンピュータによって(例えば、映画のポストプロダクションで)生成することができる。使用例によっては、点群には数千点から数十億点が製図用途に使用される可能性がある。点群の元の表現では、デカルト座標x、y、zあたり少なくとも12ビットの各点に非常に多くのビットが必要であり、オプションとして、属性に対してより多くのビット、例えば色に対して3×10ビットが必要である。
【0010】
多くのアプリケーションでは、許容可能(または好ましくは非常に良い)体験品質を維持しながら、合理的なビットレート(またはアプリケーションの記憶領域)のみを消費することによって、エンドユーザに動的ポイントクラウドを割り当てることができる(またはサーバに記憶する)ことが重要である。これらの動的点群の効果的な圧縮は、多くの没入型世界のディストリビューションチェーンを実用化するための鍵である。
【0011】
圧縮は、端末ユーザに(例えば、AR/VRメガネまたはその他の3D機能を有するデバイス上で)配信され、それによって可視化されるのには損失がある(例えば、ビデオ圧縮中に)可能性がある。他のユースケースでは、圧縮と伝送されたポイントクラウドの分析から得られる意思決定結果を変更しないために、医療アプリケーションや自動運転などの非破壊圧縮が必要である。
【0012】
最近まで、大衆市場は点群圧縮(別名PCC)の問題を解決しておらず、標準化された点群コーデックも使用できなかった。2017年、標準化ワークグループISO/JCT1/SC29/WG11は、動画専門家グループまたはMPEGとも呼ばれ、点群圧縮の作業プロジェクトを開始しました。その結果、次の2つの基準が生まれ、即ち、
MPEG-I第5の部分(ISO/IEC23090-5)又はビデオベスの点群圧縮(V-PCC)
MPEG-I第9の部分(ISO/IEC23090-9)又はジオメトリベスの点群圧縮(G-PCC)
【0013】
V-PCC符号化方式では、3Dオブジェクトに複数回の投影を実行して、画像(または移動点群を処理するときのビデオ)にパッケージ化された2Dパッチを取得することで、点群を圧縮する。その後、既存の画像/ビデオコーデックを使用して圧縮した画像またはビデオを使用して、導入済みの画像およびビデオソリューションを活用できる。本質的に、V-PCCは密集した連続した点群でのみ有効である。これは、画像/ビデオコーデックでは、レーザーレーダーから取得した疎なジオメトリデータの投影から得られたパッチなど、非平滑なパッチを圧縮することができないためである。
【0014】
G-PCC符号化方法には、取得された疎なジオメトリデータを圧縮する2つの方法がある。
【0015】
第1の方法は、点群ジオメトリに基づく占有ツリー(八分木)表示である。占有するノードは一定のサイズに達するまで分割され、占有するリーフノードは点の3D位置を提供する。リーフノードは通常体積で表され、通常は既知の3D位置に所定のサイズを持つ立方体である。この体積の中心は1点の3D位置を規定することができる。又は、推定ダイレクトエンコーディングモード(inferred direct coding mode、IDCM)を使用して、占有ツリーのリーフノード内のポイントに属する3D位置を直接符号化することもできる。疎な点群は、非最小サイズのノード内の1つまたは複数の点の3D位置を直接符号化し、ノード内に孤立点しか存在しない場合に木の構築を停止することで、推定直接符号化モード(IDCM)からメリットを得ることができる。
【0016】
第2の方法は、予測ツリーに基づいており、各ノードは1つの点の3D位置を表し、ノード間の関係は親から子への空間予測である。この方法では、疎な点群しか解決できず、占有ツリーよりも遅延が少なく、復号が簡単であるという利点がある。しかし、圧縮性能は少しだけ良く、最初の占有ベースの方法に比べて符号化が複雑で、予測ツリーを構築する際に最適な予測器(長い列の潜在予測器)を集中的に探す。
【0017】
第1の方法では、現在のリーフノードに適用されるIDMを改善するために方位角符号化モードを導入した。基本的に、方位角符号化モードは、符号化された点(符号化されたリーフノードに属する)の方位角を使用して、点群の点のx座標またはy座標を符号化するためのビットシーケンスを提供する。これにより、現在のリーフノードの位置に対する点の圧縮が大幅に改善される。まず、現在の点pのx軸とy軸を基準としたx座標とy座標に基づいて、(現在のリーフノード内で)方位角符号化方向(水平面に沿ったx軸またはy軸)を選択し、この方位角符号化方向では、現在の点pの座標はコンテキスト適応バイナリエントロピー符号化される。例えば、|x_node |≦|y_node |、ここでx_node とy_nodeは、現在のリーフノードの位置を表すxとy座標である場合、方位角符号化方向はx軸に沿っており、そうでない場合はy軸に沿っている。例えば、x_node とy_nodeは、現在のリーフノードの中心のxとy座標にすることができる。(xP、yP、zP)を現在の点Pの座標として表す。選択された方位角符号化方向がx(又はy)軸に沿っている場合、次の座標符号化が処理される。
【0018】
まず、yP(又はxP)座標ビットが符号化され、
そして、xP(又はyP)座標ビットがコンテキスト適応バイナリエントロピー符号化され、最後に、現在の点PのzP座標をエントロピー符号化する。
【0019】
バイパスエントロピー符号化を使用して、第1の符号化yP(又はxP)を実行することができ、即ち、yP(又はxP)を表すビットは簡単にビットストリームにプッシュされる。又は、コンテキスト適応バイナリエントロピー符号化を使用して第1の符号化yP(又はxP)を実行することができる。
【0020】
図では、角度は区間を支える線分上の点として明確に描かれている。角度については、線分上の唯一の点に対応し、いずれの点についても、唯一の方位角に対応する。コンテキストにおいて、点に関連する方位角は、一方の2D(xy)水平面の原点とその点を結ぶ線と、他方の面のx軸との間に限定される。これは方位角φの古典的な定義に対応し、ここで、
φ=atan2(yP、xP)=atan(yP/xP).
【0021】
本発明は、方位角のこの定義に限定されるものではなく、例えば、角度の原点(φ=0)として代替軸を用いることができる。
【0022】
図1は、従来技術における方位角符号化方向がx軸に沿っている場合に方位角符号化モードを用いて点のx座標を符号化する方法100のステップを示すブロック図である。
【0023】
方位角符号化方向がx軸に沿っている場合、方法100について詳述する。方位角符号化方向がy軸に沿っている場合、x座標とx軸をそれぞれy座標とy軸に置き換え、逆にすることで等価な方法を導くことができる。
【0024】
ステップ101において、現在(リーフ)ノードから(xP、yP、zP)座標を有する現在の点Pを選択して、方位角符号化方向(ここではx軸に沿って)を選択し、この方位角符号化方向に沿って、点座標(ここではxP)は、ビットストリームBでコンテキスト適応バイナリエントロピー符号化される。
【0025】
ステップ102において、反対方向(ここではy軸)の別の点座標(ここではyP)は、ビットストリームBでエントロピー符号化をバイパスされる。
【0026】
ステップ103において、現在の点Pに対して予測される方位角φpredを決定する。この予測される方位角φpredは、(最も近い)符号化された点の方位角φalと、センサの回転サンプリングを表す基本方位角のオフセットΔφの倍数nから得られ、整数nを選択すると、次のようになり、
φpred=φal+nΔφ (1)
【0027】
現在リーフノードの中心に関連する方位角φcenterの最も近い可能性のある角度(nの可能性のあるすべての選択肢の中で)として、
したがって、構造によって、以下のように示され、
φcenter-Δφ/2≦φpred≦φcenter+Δφ/2 (2)
【0028】
ステップ104において、方位角符号化方向(ここではx軸)に沿ったx区間が初期化される。
【0029】
図から見ると、図2に示すように、2D xy平面において、この区間は、方位角符号化方向(ここではx軸)に平行な線に属し、その相対座標(ここではyP)が符号化されている。x区間は、この線(y=yP)と2D xy平面での現在のリーフノード投影との交点である。
【0030】
ステップ105において、x区間を2つの半区間に分け、左半分区間と右半分区間に分ける。2つの角度φleft,d とφright,dが決まる。角度φleft,dは左半分区間に関連する角度であり、角度φright,dは右半分区間に関連する角度である。
【0031】
ステップ106において、予測される方位角φpred及びφleft,d とφright,dの2つの角度に基づいてコンテキストを選択する。
【0032】
例えば、図3を考えて、図3は、x軸(選択された方位角符号化方向)に沿った区間内の位置が、その位置を表す8つの可能性のある3ビットb(d=1、2、3)によって表される例示的な点を示す。符号化点が左側の4つの点のうちの1つである場合、1番目のビット(b1)は0になり、符号化ポイントが右側の4つの点のうちの1つである場合、1番目のビット(b1)は1になる。予測される方位角φpredは、点の位置についての予測情報を提供し、予測される方位角φpredは左半分区間を指しているため、符号化点は統計的に右半分区間(即ちbd=1)ではなく、左半分の区間(即ちb=0)に属している可能性が高くなる。角度差|φpred-φleft,d |と|φpred-φright,d |を比較することで、予測される方位角φpredが持っている情報から利益を得て、それに応じてコンテキストを簡単に選択でき、たとえば、|φpred-φleft,d |<|φpred-φright,d |の場合、最初のコンテキストを選択してbをエントロピー符号化し、そうでなければ2番目のコンテキストを選択してbをエントロピー符号化する。
【0033】
ステップ107において、xPの最上位ランクの残りのビットbは、選択されたコンテキストによってビットストリームBにコンテキスト適応バイナリエントロピー符号化される。このビットbは、xPが左半分区間(b=0)または右半分区間(bd=1)に位置することを示す。
【0034】
ステップ108において、x区間をxPが属する半区間(符号化ビットbで示す)に更新する。符号化ビットbが0である場合、xPは左半分区間にあり、x区間は左半分区間に更新されていることを示す。符号化ビットbが1である場合、xPが右半分の区間にあり、その区間が右半分区間に更新することを示す。
【0035】
そして、この方法は、xPの符号化が完了したか否かをチェックする。例えば、この方法は、更新された区間サイズが最小x区間サイズ以下であるか否かをチェックしたり、すべてのビットbが符号化されているか否かを等価的にチェックしたりする。
【0036】
xPの符号化が完了した場合(即ち、例えば、x区間サイズが最小x区間サイズ以下の場合)、ステップ109において、残りの座標zPがビットストリームBに符号化される。
【0037】
xPの符号化が完了しなかった場合、ステップ105にループして、xPを表す次のビットb+1を符号化する。
【0038】
図4は、ビットbがxPが右半分区間にあることを示す場合にx区間を更新することを示している。そして、ステップ108において、現在の反復(深さd-1)の右半分区間を次の反復(深さd)で2つの半区間に分割する。
【0039】
G-PCC標準の現在のテストモデルでは、ステップ105において、2つの半区間の中間の位置を表す位置xleft、dとxright、dから2つの角度φleft,d とφright,dを決定することができる。この2つの角度を計算する直接の方法は、図5に示すように、逆正接の式を使用することである。
φleft,d=iatan2(y_P 、xleft,d
φright,d=iatan2(y_P 、xright,d
【0040】
いくつかのプラットフォームでは、2つの逆正接関数の計算コストを計算することが問題になる可能性がある。
【0041】
方位角符号化方向に沿った点座標の各ビットbの符号化の2つの逆正接を計算しないように、G_PCCテストモデルの実現方式は図6に示すようにxleft、dとxright、dの特定の位置を使用する。すなわち、xleft、dはx区間の下(最左)境界であり、xright、dはx区間の中間である。このようにすると、更新された(半)区間は、そのx区間の一つの角度から継承され、更新された角度φleft,dを得ることができる。
d-1=0、角度φleft,d=φleft,d-1
bd-1=1、角度φleft,d=φright,d-1
【0042】
このようにすると反復ごとに(深さdごとに)1つの逆正接関数のみが実行されて、φright,dを計算する。
【0043】
方法100のステップ106において、予測される方位角φpredと2つの角度φleft,d とφright,dに基づいてコンテキストを選択して、x区間(又はy区間)座標ビットをエントロピー符号化する。予測される方位角φpredは、点の位置についての予測情報を提供し、予測される方位角φpredは左半分区間を指している場合、符号化点は統計的に右半分区間(即ちbd=1)ではなく、左半分の区間(即ちb=0)に属している可能性が高くなる。
【0044】
G-PCCでは、8つのコンテキストが限定され、2つのコンテキストは、m=(φleft,d-φpred)とM=(φright,d-φpred)の符号が同じであるか否かによって決まり、2つのコンテキストは、m>Mによって決まり、2つのコンテキストは、M>2m又はm>2M(M>2mでもm>2Mでもないか否か)によって決まる。
【0045】
図7は、G-PCCコンテキストの選択プロセスを示す。
【0046】
x区間はここでは深さdとして表され、角度φleft,d とφright,dはそれぞれ左半分x区間と右半分x区間の中間に関連している。合計8つのコンテキストがあるため、各コンテキストは3つのビットb2b1b0で表され、各ビットbiは上記3つの条件のいずれかを満たすかどうかを表す。図7に示すように、各コンテキストは予測される方位角φpredが現在の区間に属する可能な位置範囲を表す。予測される方位角φpredが最初の位置範囲を指している場合、コンテキストは010になり、現在の深さdで現在の点が左半分x区間にある可能性が高くなる。言い換えると、bd=1の確率(prob(bd=1)と表される))は非常に低いことを意味する。予測される方位角φpredが一番右の8番目の位置範囲を指している場合、コンテキストは011に等しく、現在の深さdで現在の点が右半分x区間にある可能性が高くなる。これはprob(bd=1)が非常に高いことを意味する。
【0047】
コンテキスト適応バイナリエントロピーエンコーダー(例えばCABAC)は、ビットbを符号化するために使用される。8つのコンテキストのそれぞれに関連付けられた符号化確率は、「010」コンテキストではprob(bd=1)<0.5、「011」コンテキストではprob(bd=1)>0.5となるように自然に進化する。
【0048】
一般的な規則として、pがビットb_dが1である確率であると仮定すると、符号化1のコストは-log2(p)であり、符号化0のコストは-log2(1-p)であり、ビットbdの良好な適応符号化確率はエントロピー符号化のコストをバイナリチャネルのシャノンエントロピーのコストに節約できる。予測される方位角φpredが、現在の点が属する区間(bd=1又はbd=0)をうまく予測できれば、ビットbをエントロピー符号化するコストは低くなる。
【0049】
G-PCCでは、予測される方位角φpredは、角度φleft,d とφright,dとともにビットbをエントロピー符号化するためのコンテキストを選択するために用いられる。したがって、コンテキストを選択することには、予測される方位角φpredの予測「質量」によって決まる。質量は予測される方位角φpredが現在の点がどの半区間に属するかを正確に予測する能力と理解される。ビットbのエントロピー符号化効率は予測される方位角φpredの品質によって決まる。
【0050】
予測される方位角φpredの質量は、区間のサイズや、センサヘッドを回転させるセンサと現在のノード(現在の点)との距離rなど、いくつかの要因の影響を受ける。いくつかの予測される方位角φpredは、図8および図9について説明したように、リーフノードの位置とリーフノードのサイズに応じて、良いものも悪いものもある。
【0051】
図8は、距離rが大きすぎたり小さすぎたりすることで、予測される方位角φpredの品質が低下する例を示しており、2つのノードは、ノード(区間)のサイズが同じであるが、センサヘッドを回転させるセンサとの距離rが異なる。
【0052】
最も近いノード(灰色の矩形)では、センサーとノードの間の距離rはノードのサイズに対して非常に小さい。したがって、x区間に関連する視点φは大きく、φ≫Δφが得られる。この場合、ノード内の点はいくつかの(さらには多くの)センサ位置によって検出されている可能性があり、式(1)のnの任意の選択は、センサのどの位置が実際に現在の点を検知したかを正確に表すことができない。また、現在の点のx位置のわずかな変化Δxpoint=±1は、Δφpoint=Δxpoint/rの半径rが小さいため、その点に関連する方位角φが大きく変化する。これは、現在の点の方位角φがノイズに非常に敏感であることを意味する。これは予測される方位角φpredの不安定な予測挙動を引き起こす。
【0053】
図8において、最も遠いノード(黒い矩形)に対して、センサとノード間の距離rはφ≪Δφと非常に大きく、ここでφはx区間に関連する視点である。
【0054】
したがって、ビットbは、+/-Δφ/2までの予測が確定する方位角φpredではうまく予測できない正確な精度(Δφ未満)を提供する。
【0055】
予測される方位角φpredの良し悪し予測能力は、図9に示すように、センサとノード間の距離だけでなく、ノードサイズにも依存する。
【0056】
図9は、Δφに対して、x区間に関連する視点が大きすぎたり小さすぎたりすることによる予測される方位角φpredの品質が低い例を示している。図9に示す2つのノードは、異なるノードサイズ(異なるx区間サイズ)を持つ。大きなノード(灰色の矩形)の場合、視点φがφ≫Δφまで大きくなると、小さな距離rと同じ問題が発生する。小さなノード(黒い矩形)に対して、視点φがφ≪Δφと小さくなると、大きな距離rと同じ問題が発生する。
【0057】
したがって、方位角符号化モードで使用されるコンテキストベースのエントロピー符号化を改善するために、ビットbをエントロピー符号化するためのコンテキストの選択を改善することが解決すべき問題である。
【0058】
本願の少なくとも1つの例示的な実施形態は、前述のことを考慮して設計される。
【発明の概要】
【0059】
以下のセクションは、本願のいくつかの態様の基本的な理解を提供するために、少なくとも1つの例示的な実施形態の簡略化された概要を提供する。この概要は、例示的な実施形態の広範な概要ではない。実施形態の重要な要素または重要な要素を識別することは意図されていない。以下の概要は、ファイル内の他の場所で提供されるより詳細な説明の前奏として、例示的な実施形態のうちの少なくとも1つの態様のみを簡略化した形で提示する。
【0060】
簡単に言えば、提供される方法は、方位角符号化モードを含み、方位角符号化モードは、方位角符号化方向に点群を符号化/復号化する点座標のビットシーケンスを提供する。コンテキストベスのエントロピー符号化/復号化のコンテキストを選択して、ビットシーケンスのビットを符号化/復号化する。コンテキストの選択は、点座標を表す方位角符号化方向に沿った区間に関連する視点(AA)に基づく。視点(AA)は、特定の深さで点を取得するセンサによって見られた区間角を推定する。選択されたコンテキストは、ビットbが0又は1である確率に対してより正確な統計データを示し、点群の点座標のコンテキストベースのエントロピー符号化が改善される。
【0061】
本発明の第1の態様によれば、点群を物理オブジェクトを表す符号化点群データのビットストリームに符号化する方法を提供し、この方法は、方位角符号化モードを含み、方位角符号化モードは、点群の点の座標を符号化するためのビットシーケンスを提供する。この方法は、点座標が属する区間を左半分区間と右半分区間とに分割するステップと、前記点を取得したセンサによって見られた区間角を表す視点に基づいて、コンテキストを選択するステップと、選択されたコンテキストに基づいて、ビットシーケンス中のビットをビットストリームにコンテキスト適応バイナリエントロピー符号化するステップであって、符号化されたビットは、点座標が2つの半区間のどちらに属するかを指示するステップと、を含む、
【0062】
本発明の第2の態様によれば、物理オブジェクトを表す符号化点群データのビットストリームから点群を復号化する方法を提供し、前記方法は、方位角符号化モードを含み、前記方位角符号化モードは、前記点群の点の座標を復号化するためのビットシーケンスを提供する。前記方法は、点座標が属する区間を左半分区間と右半分区間とに分割するステップと、前記点を取得したセンサによって見られた区間角を表す視点に基づいて、コンテキストを選択するステップと、選択されたコンテキストに基づいて、前記ビットストリームから、ビットをコンテキスト適応バイナリエントロピー復号化するステップであって、復号化されたビットは、前記点座標が2つの半区間のどちらに属するかを指示するステップと、を含む、
【0063】
1つ例示的な実施例では、視点は、区間の下界に関連する第1の角度、区間の上界に関連する第2の角度、および区間の中点に関連する第3の角度のうちの少なくとも1つに基づいて推定される、
【0064】
1つ例示的な実施例では、視点は、第1の角度と第2の角度に基づいて推定される。
【0065】
1つ例示的な実施例では、視点は、第1の角度と第3の角度に基づいて推定される。
【0066】
1つ例示的な実施例では、視点は、第2の角度と第3の角度に基づいて推定される。
【0067】
1つ例示的な実施例では、視点は、区間サイズ、および点とこの点を取得したセンサとの距離に基づいて推定される。
【0068】
1つ例示的な実施例では、コンテキストは、基本方位角と視点の相対的なサイズに基づいて選択される。
【0069】
1つ例示的な実施例では、コンテキストは基本方位角と視点との比率に基づいて選択される。
【0070】
1つ例示的な実施例では、この比率の特定の値の範囲に基づいてコンテキストを少なくとも2つのコンテキストサブセットにグループ化し、且つコンテキストを選択することには、特定の値の範囲と比率とに基づいてコンテキストサブセットを選択することと、選択されたコンテキストサブセットのコンテキストからコンテキストを選択する。
【0071】
1つ例示的な実施例では、選択されたコンテキストサブセットのコンテキストからコンテキストを選択することは、この点に関連する予測される方位角、左半分区間に関連する左角および右半分区間に関連する右角によって決まる。
【0072】
1つ例示的な実施例では、コンテキストテーブルからコンテキストを選択し、このコンテキストテーブルは、第1のエントリとして選択されたコンテキストサブセットを指示するコンテキストサブセットインデックス、及び第2のエントリとして選択されたコンテキストサブセットの選択されたコンテキストを指示するコンテキストインデックスを有する。
【0073】
本出願の第3の態様によれば、点群を物理オブジェクトを表す符号化点群データのビットストリームに符号化する装置を提供する。この装置は1つ又は複数のプロセッサを含み、この1つ又は複数のプロセッサは本出願の第1の態様による方法を実行するように構成される。
【0074】
本出願の第4の態様によれば、物理オブジェクトを表す符号化点群データのビットストリームから点群を復号化する装置を提供する。この装置は1つ又は複数のプロセッサを含み、この1つ又は複数のプロセッサは、本出願の第2の態様による方法を実行するように構成される。
【0075】
本出願の第5の態様によれば、命令を含むコンピュータープログラム製品を提供し、プログラムが1つ又は複数のプロセッサによって実行される場合、このコンピュータープログラム製品は、本出願の第1の態様による点群を物理オブジェクトを表す符号化点群データのビットストリームに符号化する方法を当該1つ又は複数のプロセッサに実行させる。
【0076】
本出願の第6の態様によれば、プログラムコード命令を運ぶ非一時的記憶媒体を提供し、本出願の第1の態様による点群を物理オブジェクトを表す符号化点群データのビットストリームに符号化する方法を実行するために使用される。
【0077】
本出願の第7の態様によれば、命令を含むコンピュータープログラム製品を提供し、プログラムが1つ又は複数のプロセッサによって実行される場合、このコンピュータープログラム製品は、本出願の第2の態様による物理オブジェクトを表す符号化点群データのビットストリームから点群を復号化する方法を当該1つ又は複数のプロセッサに実行させる。
【0078】
本出願の第8の態様によれば、プログラムコード命令を運ぶ非一時的記憶媒体を提供し、本出願の第2の態様による物理オブジェクトを表す符号化点群データのビットストリームから点群を復号化する方法を実行するために使用され、この方法は、方位角符号化モードを含み、方位角符号化モードは、点群の点座標を復号化するためのビットシーケンスを提供する。
【0079】
例示的な実施形態のうちの少なくとも1つの例示的な実施形態の特定の性質、および例示的な実施形態のうちの少なくとも1つの例示的な実施形態のその他の目的、利点、特徴、および用途は、図面と関連して例示的な以下の説明から明らかになるであろう。
【図面の簡単な説明】
【0080】
ここで、本願の例示的な実施形態の図面が例示的な参照によって表示され、
図1】従来技術における方位角符号化方向がx軸に沿っている場合に方位角符号化モードを用いて点のx座標を符号化する方法100のステップを示すブロック図である。
図2】従来技術による方位角符号化方向に沿った区間の定義を示す。
図3】従来技術による点座標が左半分区間に属すると予測される場合に図1の方位角符号化モードを更新する区間を示す。
図4】従来技術によるビットbがxPが右半分区間にあることを指示する場合にx区間を更新することを示す。
図5】従来技術における2つの角度φleft,d とφright,dを決定するための例示的な実施例を示す。
図6】従来技術における2つの角度φleft,d とφright,dを計算するための例示的な実施例を示す。
図7】従来技術によるG-PCCコンテキストの選択プロセスを示す。
図8】距離rが大きすぎたり小さすぎたりすることで、予測される方位角の品質が低下する例を示しており、2つのノードは、ノード(区間)のサイズが同じであるが、センサヘッドを回転させるセンサとの距離rが異なる。
図9】Δφに対して、x区間に関連する視点が大きすぎたり小さすぎたりすることによる予測される方位角の品質が低い例を示す。
図10】方位角符号化方向がx軸に沿っている場合に方位角符号化モードを用いて現在の点のx座標を符号化する方法200のステップを示すブロック図である
図11】少なくとも1つ例示的な実施例による2つの角度φleft,d とφright,dを補間するための例示的な実施例を示す。
図12】少なくとも1つ例示的な実施例による2つの角度φleft,d とφright,dを補間するための例示的な実施例を示す。
図13】少なくとも1つ例示的な実施例による2つの角度φleft,d とφright,dを補間するために使用される図10の例示的な実施例の変形を示す。
図14】区間の中間を計算するための例示的な実施例を示す。
図15】少なくとも1つ例示的な実施例による少なくとも1つ例示的な実施例による方位角符号化方向がx軸に沿っている場合に方位角符号化モードを用いて点のx座標を復号化する方法300のステップを示すブロック図である。
図16】本発明の例示的な実施例によるコンテキストを選択する方法400のステップのブロック図である
図17】区間に関連する視点を推定する例を示す。
図18】比率Δφ/AAの3つの値の例を示す。
図19】こ各態様と例示的な実施例が実現されるシステムの例を示す概略ブロック図である。異なる図では、類似する符号を使用して類似する部品を表す。
【発明を実施するための形態】
【0081】
以下、図面を参照して、例示的な実施形態のうちの少なくとも1つについてより詳細に説明する。ここでは、例示的な実施形態のうちの少なくとも1つの例が示されている。しかしながら、例示的な実施形態は、様々な代替形態で具現化されてもよく、本明細書に記載された例に限定されると解釈されるべきではない。したがって、例示的な実施形態を開示された特定の形態に限定することは意図されていないことを理解されたい。対照的に、本開示は、本願の精神および範囲内に含まれるすべての修正、同等物および代替物を包含することを目的とする。
【0082】
図面がフローチャートフォーマットで示される場合、図面はまた、対応する装置のブロック図を提供することを理解されたい。同様に、図がブロック図として示される場合、それはまた、それぞれの方法/プロセスのフローチャートを提供することも理解されるべきである。
【0083】
これらの態様のうちの少なくとも1つの態様は、一般に点群符号化および復号化に関し、少なくとも1つの他の態様は、一般に、生成または符号化されたビットストリームを伝送することに関する。
【0084】
さらに、本態様は、MPEG-Iの第5の部分または第9の部分のような点群圧縮に関連するMPEG規格に限定されるものではなく、例えば、他の規格および提案(事前に存在するものであれ未来に開発されるものであれ)、ならびにそのような規格および提案のいずれかの拡張(MPEG-Iの第5の部分および第9の部分を含む)に適用することができる。本明細書に記載された態様は、特に記載がない限り、または技術的に除外されている限り、単独でまたは組み合わせて使用することができる。
【0085】
図10は、方位角符号化方向がx軸に沿っている場合に方位角符号化モードを用いて現在の点のx座標を符号化する方法200のステップを示すブロック図である。
【0086】
方法200は、図1の方法100の改善である。占有ツリーの現在(リーフ)ノードにおいて、例示的な現在の点pを選択する(ステップ101)。選定された方位角符号化方向に沿った点位置はビットbで表され、各ビットはx軸に沿ったx区間におけるxPの位置を表す。コンテキストにおいて、選択された方位角符号化方向は、x軸に沿っており、しかし、方位角符号化方向がy軸に沿っている場合、x座標とx軸をそれぞれy座標とy軸に置き換え、逆にすることで等価な方法200を導くことができる。別の点座標(ここではyP)は、反対方向(ここではy軸)に沿って符号化される(ステップ102)。点Pの予測される方位角φpredを決定する(ステップ103)。x軸に沿っているx区間が初期化される(ステップ104)。
【0087】
ステップ201において、現在ノードφnodeの角度を取得する。角度φnodeは既知であり、メモリから取得するか、以下の式で計算することができ、
φnode=iatan2(y_P 、nodepos_x) (3)
【0088】
ここで、nodepos_xは、IDCMの所定のパラメーターである。例えば、パラメーターnodepos_xは、現在ノードに関連付けられた立方体に関連付けられた最低のx座標値にすることができる。そして、角度φnodeは初期x区間の下界と関連付ける。
【0089】
ステップ202において、x区間を2つの半区間に分け、左半分区間と右半分区間に分ける。x区間は、ステップ104で得られた初期x区間又は前のビットbd-1を符号化するためのx区間である。
【0090】
ステップ203において、x区間に関連する少なくとも1つ継承角度から、左半分区間に関連する左角φleft,dと与右半分区間に関連する右角φright,dを補間する。
【0091】
ステップ106において、図16の方法400に関して説明したようにコンテキストを選択する。
【0092】
ステップ107において、xPの最上位ランクの残りのビットbは、選択されたコンテキストによってビットストリームBにコンテキスト適応バイナリエントロピー符号化される。このビットbは、xPが左半分区間(b=0)または右半分区間(bd=1)に位置することを示す。
【0093】
1つ例示的な実施例では、コンテキスト適応バイナリエントロピー符号化はコンテキスト適応バイナリ算術符号化(CABAC)である。
【0094】
ステップ108において、x区間をxPが属する半区間(符号化ビットで示す)に更新する。符号化ビットbが0である場合、xPは左半分区間にあり、x区間は左半分区間に更新されていることを示す。符号化ビットbが1である場合、xPが右半分の区間にあり、その区間が右半分区間に更新することを示す。
【0095】
そして、方法は、xPの符号化が完了したか否かをチェックする。
【0096】
xPの符号化が完了した場合、ステップ109において、残りの座標zPがビットストリームBに符号化される。
【0097】
xPの符号化が完了しなかった場合、ステップ202にループして、xPを表す次のビットb+1を符号化する。
【0098】
ステップ203の1つ例示的な実施例では、左角φleft,dは、第1の角(φ1,d)、および第2の角(φ2,d)と第3の角(φ3,d)の重み付け差を加算することにより補間され、右角(φright,d)は、第4の角(φ4,d)、および第5の角(φ5,d)と第6の角(φ6,d)の重み付け差を加算することにより補間される。
【0099】
このような補間は、以下の式により与えることができ、
【0100】
【数1】
【0101】
ここでsize_dは、角度φ2,d とφ3,d (φ5,d とφ6,d)によって規定される区間のサイズを示し、Offleft とOffrightは、方法のパラメーターであり、角度φ1,d 、φ2,d 、φ3,d 、φ4,d 、φ5,d 、φ6,dのうちの少なくとも1つは、前のつビットbd-1(前の反復、深さd-1)を符号化するためのx区間に関連する継承角度である。深さdにおいて符号化ビットbに使用されるx区間は親区間に含まれる。
【0102】
角度φleft,d とφright,dは左右半区間の中間を系統的に指していない可能性がある。これは、パラメータOffleft とOffrightの値を自由に設定することで、角度φleft,d とφright,dを選択する柔軟性を提供する。
【0103】
ステップ203の1つ例示的な実施例では、図11に示すように、式(4)の角度φ1,d 、φ2,d 、φ3,d 、φ4,d 、φ5,d 、φ6,dはいずれも親区間に関連する継承角度:φ1,d=φ3,d=φ6,d=φ1,d-1、とφ2,d=φ4,d=φ5,d=φmiddle,d-1 である。角度φleft,d とφright,dは以下の式で補間され、
【0104】
【数2】
【0105】
ここで角度φ1,d-1 とφmiddle,d-1は、親区間に関連する継承角度である。
【0106】
第1のビットbd=1を符号化する(一回目の反復)ことについて、継承角度φ1,d-1はステップ201から得られた角度φnodeであり、且つ、継承角度φmiddle,d-1は初期x区間の中点と関連付ける(ステップ104)。
【0107】
後のビットbを符号化する(後の反復)ために、継承角度φ1,d-1 とφmiddle,d-1は親区間と関連付けられる。図11の点線は継承リンクを示している。
【0108】
各深さdについて、逆正接関数を実行することで角度φmiddle,dを計算することができる。
【0109】
第1のビットbd=1を符号化する(一回目の反復)ことについて、親角度φmiddle、0は、次の式で計算され、
Φmiddle,0=iatan2(y ,xlb+s′ ) (6)
ここでs′=s/2は初期x区間サイズであり、s (ステップ104)の半分であり、且つ、xlbは初期x区間の下界の値である(ステップ104)。
【0110】
後のビットbを符号化する(後の反復)ために、逆正接関数を実行することで親角度φmiddle,d-1を計算し、
Φmiddle,d-1=iatan2(y 、xlb+s′d-1) (7)
ここでs′d-1=sd-1/2は親区間サイズsd-1の半分であり、xlbは親区間の下界の値である。
【0111】
この例示的な実施例では、各ビットbを符号化するために単一の逆正接関数(式6または7)を実行する必要がある。従来技術と同じ数の逆正接関数を実行するとともに、高い符号化性能と角度φleft,d とφright,dの選択された柔軟性を維持するため、メリットがある。
【0112】
ステップ203の別の例示的な実施例では、図12に示すように、方程式(2)の角度φ1,d 、φ2,d 、φ3,d 、φ4,d 、φ5,d 、φ6,dはいずれも親区間に関連する継承角度:φ1,d=φ3,d=φ5,d=φ1、d-1、とφ2,d=φ4,d=φ6,d=φtop,d-1である。角度φleft,d とφright,dは以下の式によって補間され、
【0113】
【数3】
【0114】
ここで角度φ1,d-1とφtop,d-1は親区間に関連する継承角度である。
【0115】
符号化第1のビットbd=1を符号化する(一回目の反復)ことについて、継承角度φ1,d-1はステップ201から得られる角度φnodeであり、継承角度φtop,d-1は初期x区間の上界に関連する角度である。
【0116】
後のビットビットbを符号化する(後の反復)ために、継承角度φ1,d-1 とφtop,d-1は親区間と関連付けられる。図12の点線は継承リンクを示している。
【0117】
所定の深さdにおいて、逆正接関数を実行することで左半分区間の上界に関連する角度φtop,d又は右半分区間の下界に関連する角度φlow,dを計算する。
【0118】
第1のビットbd=1を符号化する(一回目の反復)ことについて、角度φtop,0は、次の式で計算され、
Φtop,0=iatan2(y 、xlb+s ) (9)
ここでsは初期x区間のサイズであり(ステップ104)、xlbは初期x区間の下界の値である(ステップ104)。
【0119】
d-1=0の場合、左半分区間は次の深さd(次の反復)のx区間であり、そして、逆正接関数を実行することで角度φtop,dを計算する。
【0120】
後のビットbを符号化する(後の反復)ために、逆正接関数を実行することで角度φtop,d-1を計算し、
Φtop,d-1=iatan2(y ,xlb+sd-1) (10)
ここでsd-1は深さd-1におけるx区間サイズのサイズであり、xlb
深さd-1におけるx区間の下界の値である。
【0121】
d-1=1の場合、右半分区間は次の深さdのx区間であり、そして、逆正接関数を実行することで角度φlow,dを計算する。
【0122】
後のビットbを符号化する(後の反復)ために、角度φ(low、d-1)は次の式で計算され、
Φlow,d-1=iatan2(y_ 、xlb+sd-1 ) (11)
ここでsd-1は深さd-1におけるx区間のサイズであり、xlbは深さd-1におけるx区間の下界の値である。
【0123】
この例示的な実施例は、各ビットbを符号化するために単一の逆正接関数(方程式6または7)を実行する必要がある。従来技術と同じ数の逆正接関数を実行するとともに、高い符号化性能と角度φleft,d とφright,dの選択された柔軟性を維持するため、メリットがある。
【0124】
図12の例示的な実施例の第1の変形では、図13に示すように、角度φtop,d又は角度φlow,dは親区間の中点に関連する継承角度φmiddle,d-1と等しい。
【0125】
第1の変形は、各ビットbを符号化するために逆正接関数を実行する必要がないので、複雑性が低く、φmiddle,d-1がすでに逆正接関数を呼び出すことなく決定されていると仮定する。また、高い符号化性能と角度φleft,d とφright,dの選択された柔軟性を維持している。
【0126】
図12の例示的な実施例の第2の変形では、方程式10又は11によって角度φtop,dと角度φlow,dを計算し、第1のビットbd=1を符号化するために使用され、且つ、後のビットbを符号化するために使用される角度φlow,d又は角度φtop,dは、親区間の中点に関連する継承角度φmiddle,d-1と等しい。
【0127】
この変形はビットシーケンスを符号化するために2回の逆正接関数を実行するだけでよく、方法の複雑さを低減し、方位角符号化モードを実現する計算資源を低減するとともに、高符号化性能(高補間精度)と角度φleft,d とφright,dの選択された柔軟性を維持する。
【0128】
前記第1の変形又は第2の変形の変形では、親区間に関連する2つの継承角度φ1,d-1 とφtop,d-1を補間することにより継承角度φmiddle,d-1を取得し、
φmiddle,d-1=(φ1,d-1+φtop,d-1)/2 (12)
ここで角度φ1,d-1 とφtop,d-1は、
図11図12および図13について上述したように、x区間に関連する継承角度である。
【0129】
この変形は再帰的に逆正接関数を呼び出してビットシーケンスの符号化を実行する必要がなく、方法の複雑さを低減し、方位角符号化モードを実現する計算資源を低減するとともに、高符号化性能と角度φleft,d とφright,d、の選択された柔軟性を維持する。
【0130】
前記第1の変形又は第2の変形の別の変形では、x区間のサイズが所定の閾値よりも大きい場合、逆正接関数(方程式6または7)を実行することで継承角度φmiddle,d-1を取得し、そうでなければ、x区間のサイズが所定の閾値より小さい場合、方程式(12)に基づいて2つの継承角度φ1,d-1 とφtop,d-1から継承角度φmiddle,d-1を補間する。
【0131】
この変形は、重要なサイズを持つノードで高い精度を維持するために提供され、この重要なサイズでは、方程式(12)の補間はあまりにも不正確な結果を提供し、圧縮性能を損なう。
【0132】
又は、角度φ1,d-1 とφtop,d-1の間の差の絶対値が所定の閾値よりも大きい場合、逆正接関数(方程式6又は7)を実行することで継承角度φmiddle,d-1を取得し、そうでなければ、方程式(12)によって2つの継承角度φ1,d-1 とφtop,d-1 から継承角度φmiddle,d-1を補間する。
【0133】
この変形は、補間精度を維持し、圧縮性能を維持するとともに、区間サイズが十分に小さくなるとφmiddle,d-1の補間により、低い複雑さを確保するため、有利である。
【0134】
ステップ203の1つ例示的な実施例では、パラメーターOffleftは左半分区間の中心の平均位置offsetleft,midとオフセット量Offset2との差として定義され、パラメーターOffrightは、右半分区間の中心の平均位置offsetright,midとオフセット量Offset2の和として定義され、
Offleft=offsetleft,mid-offset2
Offright=offsetright,mid+offset2
【0135】
良いコンテキスト選択を得るための基本的な考え方は、それぞれの半区間の中心に近い角度φleft,d とφright,d点を得ることである。しかし、角度φleft,d とφright,dがその半区間の中心を正確に指していない場合に最適な圧縮性能が得られることが観察された。
【0136】
たとえば、左半分区間の中間は、この左半分区間の点の離散的な位置であるため、単純なφmiddle,d-1-φ1,d-1)/2ではない。逆に、左半分区間の中間は、図14に示すように、左半分区間に属するすべての潜在点の平均位置として定義される。
【0137】
長さs′の半区間を考慮すると、潜在点は左半区間の下界から0、1、……s′-1の位置にある。左区間の中心の平均位置offsetright,midは次式で与えられ、
offsetright,mid =(0+1+…+s′-2+s′d-1)/s′
【0138】
現在、等差級数の公式を使用すると、次のことが得られ、
offsetright,mid =(s′-1)s′/2s′=(s′-1)/2=s/4-1/2
【0139】
より良い圧縮効率を実現するために、左半分区間の中心の平均位置offsetleft,midとして第2のオフセットoffset2を導入する細分化は、より効果的なコンテキスト選択をもたらし、小さな付加的な圧縮利得を得ることが観察されている。第2のオフセット量Offset2の基本的な効果は、左角φleft,dを左半分区間の下界に少し押し込み、右角φright,dを右半分区間の上界に少し押し込むことである。
【0140】
右半分区間に関するパラメータOffrightの推論と同じである。
【0141】
offset2の例示的な値はoffset2=2である。なお、offset2は、最後の深さ(即ち、最後の一ビットbの符号化)に対してはoffset2は2、最後から2番目の深さに対してはoffset2は1、他の深さに対してはoffset2は0になるように、深さdに依存してもよい。
【0142】
方法200と300でいくつかの除算を実行する。例えば、
・ offsetleft,mid=s/4-1/2
・ 補間自体はs′ 又はsで除算さる。
・ sd+1=s/2
【0143】
これらの除算は実際の実装では問題が発生する可能性があるが、実際には特に現在のG_PCCTMC13ソフトウェアのフレームワークでシフト>>演算に置き換えることができる。ノードのサイズが2の累乗で、区間の長さも2の累乗になるので、この置き換えは可能である。
d+1=s≫1
方程式(4)は、
【0144】
【数4】
【0145】
ここでLdは区間長さsのlog2であるため、Ldは以下の再帰で得られる。
d+1=L-1
値2Offleftは、次の式で計算され、
2Offleft=2offsetleft,mid-2offset2=s/2-1-2offset2=(s≫1)-1-
2offset2。
【0146】
図15は、少なくとも1つ例示的な実施例による少なくとも1つ例示的な実施例による方位角符号化方向がx軸に沿っている場合に方位角符号化モードを用いて点のx座標を復号化する方法300のステップを示すブロック図である。
【0147】
コンテキストにおいて、選択された方位角符号化方向は、x軸に沿っており、しかし、方位角符号化方向がy軸に沿っている場合、x座標とx軸をそれぞれy座標とy軸に置き換え、逆にすることで等価な方法300を導くことができる。
【0148】
方位角符号化方向は、IDCMが適用される現在の(リーフ)ノードを表すx座標とy座標x_node 、y_nodeによって決定される。あるいは、方位角符号化方向はビットストリームBから復号化できる。
【0149】
ステップ301において、反対方向(ここではy軸)に沿ってビットストリームBから、点座標(ここではyP)を復号化する。
【0150】
ステップ103において、点Pの方位角の予測角φpredを決定する。x軸に沿ったx区間が初期化される(ステップ104)。(最も近い)復号化された点の方位角φalを使用し、且つ、デコーダによって基本方位角オフセットの倍数nが決定される。または、ビットストリームBから倍数nを復号化する。
【0151】
ステップ104において、方位角符号化方向(ここではx軸)に沿った区間(ここではx区間)が初期化される。
【0152】
ステップ201において、方程式(1)によって現在ノードφnodeの角度を取得する。座標yPは、ビットストリームから復号化され、且つnodepos_xはIDCMの既知のパラメーターである。
【0153】
ステップ202において、x区間を2つの半区間に分け、左半分区間と右半分区間に分ける。x区間はステップ104において初期化されたx区間又は前のビットbd-1を復号化するためのx区間である。
【0154】
ステップ203において、親区間に関連する少なくとも1つ継承角度から、左半分区間に関連する左角φleft,dと右半分区間に関連する右角φright,dを補間する。
【0155】
ステップ106において、図16の方法400に関して説明したように、コンテキストを選択する。
【0156】
ステップ302において、選択されたコンテキストによって、ビットストリームBから、xPの最上位ランクの残りのビットbをコンテキスト適応バイナリエントロピー復号化する。このビットbは、xPが左半分区間(b=0)または右半分区間(bd=1)に位置することを示す。
【0157】
1つ例示的な実施例では、コンテキスト適応バイナリエントロピー復号化はコンテキスト適応バイナリ算術符号(CABAC)である。
【0158】
ステップ108において、x区間をxPが属する半区間(復号化ビットで示す)に更新する。
【0159】
そして、方法は、座標xPの復号化が完了したか否かをチェックする。
【0160】
xPの復号化が完了した場合、ステップ303において、残りの座標zPがビットストリームBに復号化される。
【0161】
xPの復号化が完了しなかった場合、ステップ202にループして、xPの次のビットb+1を復号化する。
【0162】
方法200の例示的な実施例および変形は方法300に適用される。
【0163】
図16は、本発明例示的な実施例によるコンテキストを選択する方法400のステップのブロック図である。
【0164】
ステップ410において、x区間に関連する視点AAを推定する。視点AAは特定の深さdで現在の点(現在リーフノード)を取得するセンサによって見られたx区間角の表示である。従って、視点AAは、深さdから深さd+1までのx区間が更新されるにつれて小さくなる(ステップ108)。
【0165】
図17に示すステップ410の1つ例示的な実施例では、x区間の下界に関連する角度φnode,d、x区間の上界に関連する角度φtop,d、および区間の中点に関連する角度φmiddle,dのうちの少なくとも1つに基づいてx区間に関連する視点AAを推定する。
【0166】
例えば、角度φnode,dは方程式(3)により与えることができ、角度φtop,dは次の式で得られ、
φtop,d=iatan2(y 、xlb+s
ここでsは深さdにおけるx区間サイズであり、xlbは深さdにおけるx区間の下界の値であり、角度φmiddle,dは次の式により与え、
φmiddle,d=(φnode,d+φtop,d)/2
【0167】
ステップ410の前記例示的な実施例の変形において、視点AAは角度φnode,d とφtop,dに基づいて推定される。
【0168】
例えば、AA=α*|φtop,d-φnode,d |、ここでαは使視点AAと角度φnode,d およびφtop,dとの角度差に比例するパラメーターである。例えば、αの値は1又は2であり得る。
【0169】
ステップ410の前記例示的な実施例の別の変形において、視点AAは角度φnode,d とφmiddle,dとに基づいて推定される。
【0170】
例えば、AA=α*|φnode,d-φmiddle,d |、ここで、αは視点と角度AAと角度φnode,d およびφmiddle,dとの角度差に比例するパラメーターである。例えば、αの値は1又は2であり得る。
【0171】
ステップ410の前記例示的な実施例の別の変形において、視点AAは角度φtop,d とφmiddle,dとに基づいて推定される。
【0172】
例えば、AA=α*|φtop,d-φmiddle,d |。例えば、αの値は1又は2であり得る。
【0173】
ステップ410の1つ例示的な実施例では、深さdにおけるx区間サイズs及び現在の点(現在リーフノード)と現在の点を取得したセンサとの距離rに基づいて視点AAを推定する。例えば、AA=s/r。
【0174】
ステップ420において、基本方位角Δφと視点AAの相対的なサイズに基づいてコンテキストを選択する。
【0175】
ステップ420の1つ例示的な実施例では、比率Δφ/AAに基づいてΔφとAAの相対的なサイズを推定することができる。
【0176】
この例示的な実施例は、比率Δφ/AAが現在の点に関連する予測される方位角の予測品質を評価するため、有利である。
【0177】
基本的に、比率Δφ/AAは、x区間サイズ、現在ノード(現在の点)とこの点を取得したセンサとの距離及び基本方位角Δφの値によって決まる。現在のリーフノードがセンサから遠く離れている場合、または区間サイズが小さい場合、視点AAは小さすぎて比率Δφ/AAが1よりはるかに大きくなり、現在の点に関連する予測される方位角は予測品質が悪い。一方、現在リーフノードがセンサに近い場合や区間サイズが大きい場合には、視点AAが大きく、比率Δφ/AAが1よりもかなり小さくなり、現時の点に関連する予測される方位角は予測品質が悪い。この間、比率Δφ/AAが1に近い場合、現在の点に関連する予測される方位角の予測品質が最高となる。
【0178】
ステップ420の前記例示的な実施例の変形において、比率Δφ/AAの特定の値の範囲に基づいてコンテキストを少なくとも2つのコンテキストサブセットにグループ化し、且つコンテキストを選択することには、特定の値の範囲と比率Δφ/AAとに基づいてコンテキストサブセットを選択し(サブステップ421)、選択されたコンテキストサブセットのコンテキストから、コンテキストを選択する(サブステップ422)。
【0179】
各コンテキストサブセットは予測される方位角φpredの予測品質の特定のレベルに対応する。
【0180】
各コンテキストサブセットはいずれも8つのコンテキストを含んでもよいが、図7に示した従来技術のように、本発明は、任意の数のコンテキストを含むコンテキストのサブセットに拡張される。
【0181】
1つ変形において、コンテキストは、図7に関連して説明したように、選択されたコンテキストのサブセットのコンテキストから、予測される方位角φpredと2つの角度φleft,d およびφright,dから選択される。
【0182】
コンテキストサブセットの数は、前記特定の値の数によって決まる。比率Δφ/AAの任意の特定の値を使用することができる。
【0183】
例えば、3つのコンテキストサブセットC0、C1およびC2は比率Δφ/D_dの2つの特定の値TH1とTH2によって規定される。
【0184】
例えば、Δφ/AA<TH1、の場合、コンテキストサブセットC0を選択し、(Δφ/AA≧TH1)と(Δφ/AA<TH2)の場合、コンテキストサブセットC1を選択し、Δφ/AA≧1の場合、コンテキストサブセットC2を選択する。
【0185】
例では、図18に示すように、TH1=2/3とTH2=1。ケース(a)では、基本方位角Δφは視点AA に対してかなり小さく、即ち比率Δφ/AA<2/3である。その場合、第1のコンテキストサブセットを選択し、予測される方位角φpredが現在ノード内の狭い範囲内にあることを示すことができる。ケース(b)では、基本方位角Δφは視点AA に対してやや小さく、比率2/3<Δφ/AA<1である。この場合、予測される方位角φpredの予測品質は3つのケースで最も良い。ケース(c)では、基本方位角Δφがそれより大きく、比率Δφ/AA>1が大きくなるほど、視点AAが小さい可能性がある。この場合、予測される方位角φpred(基本方位角Δφから得られる)は現在ノードの現在の点の位置に関する情報を提供しない。
【0186】
別の例では、単一の特定の値TH1を使用できる。例えば、TH1=2/3。
【0187】
別の例では、3つの特定の値TH1、TH2とTH3を使用できる。例えば、TH1=1/3、TH2=2/3とTH3=1。
【0188】
サブステップ421と422の1つ例示的な実施例では、コンテキストテーブルctxTable_Tからコンテキストを選択し、このコンテキストテーブルは第1のエントリとして選択されたコンテキストサブセットを指示するコンテキストサブセットインデックスctxSetIdx及び第2のエントリとして選択されたコンテキストサブセットの選択されたコンテキストを指示するコンテキストインデックスcxtIdxを有する。
【0189】
そして、特定の値の範囲と比率Δφ/AAに基づいて第1のコンテキストサブセットインデックスctxSetIdxを選択し(サブステップ421)、そして、選択されたコンテキストサブセットの選択されたコンテキストを指示するコンテキストインデックスcxtIdxを選択することで、コンテキストを選択する。
【0190】
例えば、コンテキストインデックスcxtIdxは、図7について説明したように、予測される方位角φpredと2つの角度φleft,d とφright,dから選択される。
【0191】
図19は各態様と例示的な実施例が実現されるシステムの例を示す概略ブロック図である。
【0192】
システム500は、以下に説明する様々な構成要素を含む一つまたは複数のデバイスとして具現化することができる。様々な実施形態では、システム500は、本明細書に記載された1つまたは複数の態様を実現するように構成されうる。
【0193】
システム500の全部または一部を形成し得る機器の例としては、パーソナルコンピュータ、ラップトップ、スマートフォン、タブレットコンピュータ、デジタルマルチメディアセットトップボックス、デジタルテレビ受信機、パーソナルビデオレコーディングシステム、接続された家電機器、接続された車両およびそれに関連する処理システム、ヘッドマウントディスプレイ(HMD、シースルー眼鏡)、プロジェクタ(プロジェクタ)、洞窟(複数のディスプレイを含むシステム)、サーバ、ビデオエンコーダ、ビデオデコーダ、ビデオデコーダの出力を処理するポストプロセッサ、ビデオエンコーダに入力を提供するプリプロセッサ、ネットワークサーバ、セットトップボックス、および点群、ビデオ、または画像を処理するその他のデバイスまたはその他の通信デバイスを含む。システム500の構成要素は、単一の集積回路(IC)、複数のIC、および/または個別の部品に個別にまたは組み合わせて実装されてもよい。例えば、少なくとも1つの実施形態では、システム500の処理およびエンコーダ/デコーダ要素は、複数のICおよび/または個別の構成要素に分散されてもよい。種々の実施例において、システム500は、例えば、通信バスを介して、又は専用の入力ポート及び/又は出力ポートを介して、他の同様のシステム又は他の電子機器に通信可能に結合されることができる。
【0194】
システム500は、例えば本明細書で説明されるさまざまな態様を実装するためにロードされた命令を実行するように構成された少なくとも1つのプロセッサ510を含むことができる。プロセッサ510は、組み込みメモリ、入出力インタフェース、および当技術分野で知られている様々な他の回路を含むことができる。システム500は、少なくとも1つのメモリ520(例えば、揮発性記憶装置および/または不揮発性記憶装置)を含むことができる。システム500は、電気的消去可能プログラマブル読取専用メモリ(EEPROM)、読取専用メモリ(ROM)、プログラマブル読取専用メモリ(PROM)、ランダムアクセスメモリ(RAM)、動的ランダムアクセスメモリ(DRAM)、静的ランダムアクセスメモリ(SRAM)、フラッシュメモリ、ディスクドライブまたはCDドライブ。非限定的な例として、記憶装置540は、内部記憶装置、アタッチされた記憶装置、および/またはネットワークアクセス可能な記憶装置を含むことができる。
【0195】
システム500は、例えば、符号化/復号化された点群ジオメトリデータを提供するためにデータを処理するように構成されたエンコーダ/デコーダモジュール530を含み、エンコーダ/デコーダモジュール530は、自身のプロセッサおよびメモリを含むことができる。エンコーダ/デコーダモジュール530は、符号化機能および/または復号機能を実行するための装置に含まれることができるモジュールを表すことができる。周知のように、デバイスは、符号化モジュールおよび復号モジュールのうちの1つまたは2つを含むことができる。さらに、エンコーダ/デコーダモジュール530は、システム500の別個の要素として実装することができ、または当業者に知られているハードウェアとソフトウェアの組み合わせとしてプロセッサ510内に組み込むことができる。
【0196】
プロセッサ510またはエンコーダ/デコーダ530にロードされて、本願で説明されたさまざまな態様を実行するためのプログラムコードは、記憶装置540に記憶されてもよく、その後、プロセッサ510が実行するためにメモリ520にロードされてもよい。様々な実施形態によれば、プロセッサ510、メモリ520、記憶装置540、およびエンコーダ/デコーダモジュール530のうちの1つまたは複数は、本明細書に記載のプロセスの実行中に様々な項目のうちの1つまたは複数を記憶することができる。そのような記憶項目は、点群フレーム、符号化/復号化されたジオメトリ/属性ビデオ/画像、または符号化/復号化されたジオメトリ/属性ビデオ/画像の部分、ビットストリーム、行列、変数、および処理方程式、式、演算および演算ロジックの中間結果または最終結果を含むことができるが、これらに限定されない。
【0197】
いくつかの実施形態では、プロセッサ510および/またはエンコーダ/デコーダモジュール530内のメモリを使用して命令を記憶し、符号化または復号中に実行可能な処理のためのワークメモリを提供することができる。
【0198】
しかしながら、他の実施形態では、処理装置外部のメモリ(例えば、処理装置はプロセッサ510またはエンコーダ/デコーダモジュール530であってもよい)は、これらの機能のうちの1つ以上に使用されてもよい。外部メモリは、動的揮発性メモリおよび/または不揮発性フラッシュメモリなどのメモリ520および/または記憶装置540であってもよい。いくつかの実施形態では、テレビのオペレーティングシステムを記憶するために外部不揮発性フラッシュメモリを使用することができる。少なくとも1つの実施形態では、RAMなどの高速外部動的揮発性メモリは、MPEG-2の第2部分(ITU-T勧告H.262およびISO/IEC 13818-2とも呼ばれ、MPEG-2ビデオとも呼ばれる)、HEVC(高効率ビデオ符号化)、VVC(汎用ビデオ符号化)、またはMPEG-Iの第5部分または第9部分などのビデオ符号化および復号動作のためのワークメモリとして使用することができる。
【0199】
ブロック590に示すように、システム500の要素への入力は、様々な入力デバイスを介して提供することができる。そのような入力装置は、(i)放送局によって空中送信されたRF信号を受信することができるRF部分、(ii)複合入力端子、(iii)USB入力端子、および/または(iv)HDMI入力端子を含むが、これらに限定されない。
【0200】
様々な例示的な実施形態では、ブロック590の入力デバイスは、当技術分野で既知の関連する対応する入力処理要素を有することができる。例えば、RF部分は、(i)所望の周波数(選択信号とも呼ばれる、または信号帯域を帯域に制限する)を選択し、(ii)選択された信号をダウンコンバートし、(iii)再び帯域をより狭い帯域に制限して、例えば、いくつかの実施形態ではチャネルと呼ばれる信号帯域を選択し、(iv)ダウンコンバートされた信号と帯域制限された信号を復調し、(v)誤り訂正を実行し、および(vi)多重化を解除して、必要なパケットフローを選択する。様々な実施形態のRF部分は、周波数セレクタ、信号セレクタ、帯域制限器、チャネルセレクタ、フィルタ、ダウンコンバータ、復調器、誤り訂正器およびデマルチプレクサなど、これらの機能を実行する1つまたは複数の要素を含むことができる。RF部分は、例えば、受信した信号を低周波(例えば、中間周波数または近ベースバンド周波数)またはベースバンドにダウンコンバートすることを含む、これらの機能の様々な機能を実行するチューナを含むことができる。
【0201】
セットトップボックスの一実施形態では、RF部分及びそれに関連する入力処理要素は、有線(例えば、ケーブル)媒体を介して送信されるRF信号を受信することができる。そして、RF部分は、フィルタリング、ダウンコンバート、および再フィルタリングされた期待周波数帯域によって周波数選択を実行することができる。
【0202】
様々な実施形態は、上述の(および他の)要素の順序を再配置し、これらの要素のいくつかを除去し、および/または同様の機能または異なる機能を実行する他の要素を追加する。
【0203】
追加要素は、挿入増幅器やアナログデジタル変換器などの既存の要素間に要素を挿入することを含むことができる。様々な実施形態では、RF部分はアンテナを含むことができる。
【0204】
さらに、USBおよび/またはHDMI端子は、USBおよび/またはHDMIコネクタを介してシステム500を他の電子デバイスに接続するための対応するインタフェースプロセッサを含むことができる。入力処理の様々な態様、例えばリードソロモン誤り訂正は、必要に応じて、例えば、個別の入力処理IC内、またはプロセッサ510内で実装されてもよいことを理解されたい。同様に、USBまたはHDMIインタフェース処理の態様は、必要に応じて個別のインタフェースIC内またはプロセッサ510内で実装することができる。復調、誤り訂正、および多重化されたストリームは、出力デバイス上に提示するために必要に応じてデータストリームを処理するためにメモリおよび記憶要素と結合して動作するプロセッサ510およびエンコーダ/デコーダ530を含む様々な処理要素に提供することができる。
【0205】
システム500の様々な要素は、集積ハウジング内に配置することができる。集積ハウジング内では、様々な要素は、I 2 Cバス、配線、およびプリント基板を含む当技術分野で知られている内部バスなどの適切な接続デバイス590を使用して、データを相互に接続し、その間で送信することができる。
【0206】
システム500は、通信チャネル500を介して他のデバイスと通信することができる通信インターフェース550を含むことができる。通信インタフェース550は、通信チャネル600を介してデータを送受信するように構成されたトランシーバを含むことができるが、これらに限定されない。通信インタフェース550は、モデムまたはネットワークカードを含むことができるが、これらに限定されず、通信チャネル600は、例えば、有線媒体および/または無線媒体内で実装することができる。
【0207】
さまざまな実施形態では、IEEE 802.11などのWi-Fiネットワークを使用して、システム500にデータをストリーミングすることができる。これらの実施形態のWi-Fi信号は、Wi-Fi通信に適した通信チャネル600及び通信インターフェース550を介して受信することができる。これらの実施形態の通信チャネル500は、一般に、ストリームアプリケーションおよび他のクラウド上の通信を可能にするためのインターネットを含む外部ネットワークへのアクセスを提供するアクセスポイントまたはルータに接続することができる。
【0208】
他の実施形態は、入力ブロック590のHDMIコネクタを介してデータを伝送するセットトップボックスを用いてシステム500にストリームデータを提供することができる。
【0209】
他の実施形態は、入力ブロック590のRF接続部を使用してシステム500にストリームデータを提供することができる。
【0210】
ストリームデータは、システム500が使用するシグナリング情報の方法として使用することができる。シグナリング情報は、点群の点数、点座標が2つの半区間のいずれに属するかを指示する符号化ビット(b)、方位角符号化方向、点座標、基本方位角変位方位角の倍数n、基本方位角変位方位角、パラメータnodepos_xである。
【0211】
シグナリングは、様々な方法で実装されうることを理解すべきである。例えば、様々な実施形態では、1つまたは複数のシンタックス要素、フラグなどを使用して、対応するデコーダに情報を信号で送ることができる。
【0212】
システム500は、ディスプレイ700、スピーカ800、および他の周辺デバイス900を含む様々な出力デバイスに出力信号を提供することができる。実施形態の様々な例では、他の周辺デバイス900は、独立したDVR、ディスクプレーヤ、ステレオシステム、照明システム、およびシステム500の出力に基づいて機能を提供する他のデバイスのうちの1つまたは複数を含むことができる。
【0213】
様々な実施形態では、システム500とディスプレイ700、スピーカ800、または他の周辺装置900との間の通信制御信号、例えばAV.Link(オーディオ/ビデオリンク)、CEC(消費電子制御)、またはユーザ介入の有無にかかわらず装置間制御を可能にする他の通信プロトコルを使用することができる。
【0214】
出力デバイスは、それぞれのインターフェース560、570
、580を介して専用コネクタを介してシステム500に通信可能に結合され得る。
【0215】
あるいは、出力デバイスは、通信インタフェース550を介して通信チャネル600を使用してシステム500に接続することができる。ディスプレイ700およびスピーカ800は、テレビなどの電子デバイス内のシステム500の他のコンポーネントとともに単一のユニットに統合することができる。
【0216】
様々な実施形態では、表示インタフェース560は、タイミングコントローラ(TCon)チップなどの表示ドライバを含むことができる。
【0217】
例えば、入力590のRF部分が個別のセットトップボックスの一部である場合、ディスプレイ700およびスピーカ800は、代替的に1つまたは複数の他のコンポーネントから分離することができる。ディスプレイ700およびスピーカ800が外部構成要素であることができる様々な実施形態では、出力信号は、HDMIポート、USBポート、またはCOMP出力などの専用出力コネクタを介して提供することができる。
【0218】
図1図19では、様々な方法が説明され、各方法は、説明された方法を実装するための1つまたは複数のステップまたは動作を含む。この方法の適切な動作に特定のステップまたは動作の順序が必要でない限り、特定のステップおよび/または動作の順序および/または使用を修正または組み合わせてもよい。
【0219】
ブロック図および/または動作フロー図についていくつかの例を説明する。各ボックスは、指定された論理機能を実現するための1つ以上の実行可能な命令を含む回路要素、モジュール、またはコード部分を表す。さらに、他の実施形態では、ボックスに表示される機能は、指示された順序ではなくてもよいことに留意すべきである。例えば、関連する機能に応じて、連続して示される2つのボックスは、実際には実質的に同時に実行されてもよいし、関連する機能に応じて、逆の順序で実行されてもよい場合がある。
【0220】
本明細書で説明される実施形態および態様は、例えば、方法またはプロセス、装置、コンピュータプログラム、データストリーム、ビットストリーム、または信号において実装することができる。単一の実施形態のコンテキストでのみ議論されていても(例えば、方法としてのみ議論されている)、議論された特徴の実施形態は、他のフォーマット(例えば、デバイスまたはコンピュータプログラム)で実装されてもよい。
【0221】
方法は、例えば、コンピュータ、マイクロプロセッサ、集積回路、またはプログラマブル論理デバイスを含む処理デバイスを指すプロセッサに実装することができる。プロセッサはまた、通信デバイスを含む。
【0222】
さらに、方法はプロセッサが実行する命令によって実装することができ、そのような命令(および/または、実施形態によって生成されたデータ値)はコンピュータ可読記憶媒体に記憶することができる。コンピュータ可読記憶媒体は、コンピュータ可読プログラム製品の形態を採用することができ、コンピュータ可読プログラム製品は1つ以上のコンピュータ可読媒体に具現され、コンピュータによって実行可能なコンピュータ可読プログラムコードを具備する。本明細書で使用するコンピュータ可読記憶媒体は、情報を記憶する固有の能力と、それから情報を提供する検索の固有の能力とを考慮して、非一時的記憶媒体とみなすことができる。コンピュータ可読記憶媒体は、例えば、限定されないが、電子、磁気、光、電磁、赤外線または半導体のシステム、装置または装置、または前述の任意の適切な組み合わせであり得る。本実施形態を適用可能なコンピュータ可読記憶媒体のより具体的な例を提供するが、当業者には容易に理解されるように、以下は単に例示的であり、詳細ではないリストである:ポータブルコンピュータフロッピーディスク、ハードディスク、読み取り専用メモリ(ROM)、消去可能プログラマブル読み取り専用メモリ(EPROMまたはフラッシュメモリ)、ポータブルディスク読み取り専用メモリ(CD-ROM)、光記憶装置、磁気記憶装置または上記の任意の適切な組み合わせ。
【0223】
命令は、プロセッサ可読媒体上に有形に具現化されたアプリケーションを形成することができる。
【0224】
例えば、命令は、ハードウェア、ファームウェア、ソフトウェア、または組合せ内にあることができる。たとえば、命令はオペレーティングシステム、個別のアプリケーション、またはその両方の組み合わせで見つけることができる。したがって、プロセッサは、例えば、プロセスを実行するように構成された装置と、プロセスを実行するための命令を有するプロセッサ可読媒体(例えば、記憶装置)とを含む装置として特徴付けることができる。さらに、プロセッサ可読媒体は、命令に加えて、または命令の代わりに、実施形態によって生成されたデータ値を記憶することができる。
【0225】
デバイスは、例えば、適切なハードウェア、ソフトウェア、およびファームウェアに実装することができる。このような装置の例としては、パーソナルコンピュータ、ラップトップコンピュータ、スマートフォン、タブレットコンピュータ、デジタルマルチメディアセットトップボックス、デジタルテレビ受像機、パーソナルビデオ記録システム、接続された家電製品、ヘッドマウント表示装置(HMD、透視眼鏡)、プロジェクタ(プロジェクタ)、洞窟(複数のディスプレイを含むシステム)、サーバ、ビデオエンコーダ、ビデオデコーダ、ビデオデコーダの出力を処理するポストプロセッサ、ビデオエンコーダに入力を提供するプリプロセッサ、ネットワークサーバ、セットトップボックス、および点群、ビデオまたは画像を処理するためのその他のデバイス、またはその他の通信デバイス。装置は移動体であってもよく、移動車両に取り付けてもよいことは明らかである。
【0226】
コンピュータソフトウェアは、プロセッサ510によって、またはハードウェアによって、またはハードウェアとソフトウェアの組み合わせによって実装することができる。非限定的な例として、1つ以上の集積回路によって実施形態を実現することもできる。非限定的な例として、メモリ520は、技術環境に適した任意のタイプを有することができ、光記憶装置、磁気記憶装置、半導体ベースの記憶装置、固定メモリ、可動メモリなどの適切なデータ記憶技術を使用して実装することができる。非限定的な例として、プロセッサ510は、技術環境に適した任意のタイプを有することができ、マイクロプロセッサ、汎用コンピュータ、専用コンピュータ、およびマルチコアアーキテクチャに基づくプロセッサのうちの1つまたは複数を含むことができる。
【0227】
当業者であれば明らかなように、実施形態は、例えば記憶または送信されうる情報を搬送するようにフォーマットされた様々な信号を生成することができる。この情報は、例えば、方法を実行するための命令または実施形態の1つによって生成されたデータを含むことができる。例えば、信号は、本実施形態のビットストリームを搬送するようにフォーマットすることができる。そのような信号は、例えば、電磁波(例えば、スペクトルの無線周波数部分を使用する)またはベースバンド信号にフォーマットすることができる。フォーマットは、例えば、データストリームを符号化し、符号化されたデータストリームを用いてキャリアを変調することを含むことができる。信号が搬送する情報は、例えばアナログ情報やデジタル情報であってもよい。周知のように、信号は様々な異なる有線または無線リンクを介して送信することができる。信号はコンピュータ可読媒体上に記憶することができる。
【0228】
本明細書で使用される用語は、特定の実施形態を記述するためだけの目的であり、限定することは意図されていない。本明細書で使用されるように、単数形「1つ」、「1つ」、および「記載」は、文脈が特に明示的に示されない限り、複数形を含むことも意図される。さらに理解されるように、本明細書で使用される場合、用語「含む/含む」および/または「含む/含む」は、例えば、特徴、整数、ステップ、動作、構成要素および/または構成要素を指定することができるが、1つ以上の他の特徴、整数、ステップ、動作、構成要素、構成要素、および/またはそれらのグループの存在または追加を排除しない。さらに、要素が「応答」または「接続」と呼ばれている場合、要素は直接応答してもよく、別の要素に接続してもよく、または中間要素が存在してもよい。逆に、構成部品が「直接応答」または「直接接続」と呼ばれている場合、中間要素は存在しない。
【0229】
例えば、「A/B」、「A及び/又はB」及び「A及びBのうちの少なくとも1つ」の場合、任意の記号/用語「/」、「及び/又は」及び「少なくとも1つ」の使用は、第1のリストのみのオプション(A)の選択、又は第2のリストのみのオプション(B)の選択、又は2つのオプション(A及びB)の選択を含むことを意図することができることを理解されたい。さらなる例として、「A、B、および/またはC」および「A、B、およびCのうちの少なくとも1つ」の場合、このような言い回しは、最初にリストされたオプション(A)のみの選択、または2番目にリストされたオプション(B)のみの選択、または3番目にリストされたオプション(C)のみの選択、または1番目にリストされたオプションと2番目にリストされたオプション(AおよびB)のみの選択を含むことを意図しており、または、最初にリストされたオプションと3番目にリストされたオプション(AとC)のみを選択するか、2番目にリストされたオプションと3番目にリストされたオプション(BとC)だけを選択するか、3つのすべてのオプション(AとBとC)を選択する。これは、当業者や関連分野の一般技術者が明らかにしているように、リストされているものと同じくらい多くのプロジェクトに拡張できる。
【0230】
本願では、様々な数値を使用することができる。特定の値は例示的な目的のために使用することができ、説明される態様はこれらの特定の値に限定されない。
【0231】
用語「第1」、「第2」などは本明細書で様々な要素を記述するために使用されてもよいが、これらの要素はこれらの用語によって限定されるべきではないことを理解するであろう。これらの用語は、1つの要素を別の要素から分離するために使用することができる。例えば、本願の教示から逸脱することなく、第1の要素を第2の要素と呼ぶことができ、同様に、第2の要素を第1の要素と呼ぶことができる。第1の要素と第2の要素の間にソートは暗示されない。
【0232】
「1つの例示的な実施例」または「例示的な実施例」または「1つの実施例」または「実施例」およびその他の変形例への参照は、特定の特徴、構造、特性などを伝達するためにしばしば使用される(実施例/実施例に関連して説明される)、少なくとも1つの実施例/実施例に含まれる。したがって、本願の様々な場所に出現するフレーズ「1つの例示的な実施例において」または「例示的な実施例において」または「1つの実施例において」または「実施例において」およびその他の変形は、必ずしもすべて同じ実施例を参照するものではない。
【0233】
同様に、本明細書における「例示的な実施例/例示的な実施例による」または「例示的な実施例/例示的な実施例における」およびその他の変形例への参照は、特定の特徴、構造、または特性(例示的な実施例/例示的な実施例に関連して説明される)を伝えるためにしばしば使用され、少なくとも1つの例示的な実施例/例示的な実施例に含めることができる。したがって、明細書において異なる箇所に登場する表現「例示的な実施例による」または「例示的な実施例による」は、必ずしも同じ例示的な実施例/例示的な実施例を指すわけではなく、単独または代替的な例示的な実施例/例示的な実施例/実装も、必ずしも他の例示的な実施例/例示的な実施例/実装とは排他的ではない。
【0234】
特許請求の範囲に表示される添付のアイコンは説明のためだけであり、特許請求の範囲に制限的な役割はない。特に説明されていないが、本実施形態/例および変形は、任意の組合せまたはサブ組合せで採用することができる。
【0235】
図面がフローチャートで示される場合、それはまた、対応する装置のブロック図を提供することが理解されるべきである。同様に、図面がブロック図で示される場合、それはまた、対応する方法/プロセスのフローチャートを提供することも理解されるべきである。
【0236】
いくつかの図は、通信の主要な方向を表示するための通信経路上の矢印を含むが、通信は図示された矢印とは反対の方向に発生することができることを理解すべきである。
【0237】
様々な実装形態は復号に関する。本明細書で使用される「復号化」は、例えば、再構築された点群領域における表示またはさらなる処理に適した最終的な出力を生成するために、受信された点群フレーム(1つまたは複数の点群フレームを符号化する受信されたビットストリームを含むことができる)に対して実行されるすべてまたは一部のプロセスを含むことができる。様々な実施形態では、そのようなプロセスは、通常デコーダによって実行されるプロセスのうちの1つ以上を含む。様々な実施形態において、そのようなプロセスは、例えば、本明細書で説明された様々な実施形態のデコーダによって実行されるプロセスも含むか、または代替的に含まれる。
【0238】
さらなる例として、一実施形態では、「復号化」は逆量子化のみを指すことができ、一実施形態では、「復号化」はエントロピー復号を指すことができ、他の実施形態では、「復号化」は差分復号のみを指すことができ、他の実施形態では、「復号化」は逆量子化、エントロピー復号、および差分復号の組み合わせを指すことができる。具体的に記述された文脈に基づいて、語句「復号プロセス」が動作のサブセットを具体的に指すことを意図しているのか、一般的により広範な復号プロセスを指すことが明らかになり、当業者によってよく理解されていると考えられる。
【0239】
様々な実施形態は、符号化に関する。「復号」に関する上記の議論と同様に、本明細書で使用される「符号化」は、例えば、入力点群フレーム上でプロセスの全部または一部を実行することを含むことができる。を使用して符号化ビットストリームを生成する。様々な実施形態では、そのようなプロセスは、一般にエンコーダによって実行されるプロセスのうちの1つ以上を含む。様々な実施形態において、そのようなプロセスは、本明細書で説明される様々な実施形態のエンコーダによって実行されるプロセスをさらに含むか、または任意に含む。
【0240】
さらなる例として、一実施形態では、「符号化」は量子化のみを指すことができ、一実施形態では、「符号化」はエントロピー符号化のみを指すことができ、他の実施形態では、「符号化」は差分符号化のみを指すことができ、他の実施形態では、「符号化」は量子化、差分符号化、エントロピー符号化の組み合わせを指すことができる。具体的に記述された文脈に基づいて、語句「符号化プロセス」が動作のサブセットを具体的に指すことを意図しているのか、一般的により広範な符号化プロセスを指すことが明らかになり、当業者にはよく理解されていると考えられる。
【0241】
さらに、本願は、様々な情報を「決定」することを意味することがある。決定情報は、例えば、推定情報、計算情報、予測情報、またはメモリから情報を取得する1つ以上を含むことができる。
【0242】
さらに、本願は、様々な情報に「アクセスする」ことを指すことができる。アクセス情報は、例えば、受信情報、検索情報(例えば、メモリから)、記憶情報、移動情報、複製情報、計算情報、決定情報、予測情報、または推定情報のうちの1つまたは複数を含むことができる。
【0243】
さらに、アプリケーションは、様々な情報を「受信」することを指すことができる。受信は「アクセス」と同様に、広義の用語を意図している。受信情報は、例えば、アクセス情報または検索情報(例えば、メモリから)のうちの1つまたは複数を含むことができる。さらに、「受信」は、記憶情報、処理情報、送信情報、移動情報、複製情報、消去情報、計算情報、決定情報、予測情報または推定情報などの動作中に、一般に1つの態様または別の態様に関連する。
【0244】
さらに、本明細書で使用されるように、「信号」という用語は、対応するデコーダが何かを指示することを指す。例えば、ある実施形態では、エンコーダは、点群の点数、点座標が2つの半区間のいずれに属するかを指示する符号化ビット(b)、方位角符号化方向、点座標、基本方位角変位方位角の倍数n、基本方位角変位方位角、パラメータnodepos_xである。このように、実施形態では、エンコーダ側とデコーダ側で同じパラメータを使用することができる。したがって、例えば、エンコーダは、デコーダが同じ特定のパラメータを使用できるように、(明示的シグナリング)特定のパラメータをデコーダに送信することができる。対照的に、デコーダがすでに特定のパラメータおよび他のパラメータを持っている場合、シグナリングを使用して、特定のパラメータをデコーダが知り、選択することを簡単に可能にすることができる(暗黙的シグナリング)。実際の機能の伝送を回避することにより、様々な実施形態でビット節約が実現される。シグナリングは、様々な方法で実装されうることを理解されたい。例えば、様々な実施形態では、対応するデコーダに情報を信号で送るために、1つまたは複数のシンタックス要素、フラグなどが使用される。前には「信号」という言葉の動詞フォーマットに関連しているが、「信号」という言葉はここでは名詞としても使用できる。
【0245】
多くの実施形態が説明されている。しかしながら、様々な修正が可能であることを理解すべきである。例えば、異なる実施形態の要素を組み合わせ、補足、修正、または除去して、他の実施形態を生成することができる。さらに、一般的な技術者は、他の構造およびプロセスが開示されている構造およびプロセスに取って代わることができ、したがって生成された実施形態は、開示されている実施形態の基本と少なくとも同じ結果を達成するために、少なくとも実質的に同じ方法で少なくとも実質的に同じ機能を実行することができることを理解するであろう。したがって、本願は、これら及び他の実施形態を想定している。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19