(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024152412
(43)【公開日】2024-10-25
(54)【発明の名称】メッシュ復号装置、メッシュ復号方法及びプログラム
(51)【国際特許分類】
G06T 9/00 20060101AFI20241018BHJP
【FI】
G06T9/00 100
【審査請求】未請求
【請求項の数】5
【出願形態】OL
(21)【出願番号】P 2023066595
(22)【出願日】2023-04-14
【国等の委託研究の成果に係る記載事項】(出願人による申告)令和5年度、総務省「3次元空間データの無線伝送に向けた高能率圧縮技術の研究開発」、産業技術力強化法第17条の適用を受ける特許出願
(71)【出願人】
【識別番号】000208891
【氏名又は名称】KDDI株式会社
(74)【代理人】
【識別番号】110001564
【氏名又は名称】フェリシテ弁理士法人
(72)【発明者】
【氏名】西村 仁志
(72)【発明者】
【氏名】河村 圭
(57)【要約】
【課題】符号化効率を向上させること。
【解決手段】本発明に係るメッシュ復号装置200の変位量復号部205は、 変位量ビットストリームに対してバイパス有り算術復号を行うことによって係数レベル値を生成するバイパス有り算術復号部205Aと、係数レベル値に対して逆量子化を行うことによって第1変換係数を生成する逆量子化部205Bと、予測変換係数と予測残差とを加算することによって第2変換係数を生成する加算器205Dと、フレームバッファ205Eから読み出された参照フレームの第2変換係数を用いてインター予測を行うことによって予測変換係数を生成するインター予測部205Fと、第2変換係数に対して第2逆変換を行うことによって復号変位量を生成する第2逆変換部205Gとを備える。
【選択図】
図3
【特許請求の範囲】
【請求項1】
メッシュ復号装置であって、
変位量ビットストリームを復号して変位量を生成して出力するように構成されている変位量復号部を備え、
前記変位量復号部は、
前記変位量ビットストリームに対してバイパス有り算術復号を行うことによって係数レベル値を生成するように構成されているバイパス有り算術復号部と、
前記係数レベル値に対して逆量子化を行うことによって第1変換係数を生成するように構成されている逆量子化部と、
予測変換係数と予測残差とを加算することによって第2変換係数を生成するように構成されている加算器と、
前記加算器から出力された前記第2変換係数を取得して蓄積するように構成されているフレームバッファと、
前記フレームバッファから読み出された参照フレームの前記第2変換係数を用いてインター予測を行うことによって前記予測変換係数を生成するように構成されているインター予測部と、
前記第2変換係数に対して第2逆変換を行うことによって復号変位量を生成するように構成されている第2逆変換部と、を備えることを特徴とするメッシュ復号装置。
【請求項2】
前記逆量子化部の直後に、前記第1変換係数に対して第1逆変換を行うことによって前記予測残差を生成する第1逆変換部を更に備えることを特徴とする請求項1に記載のメッシュ復号装置。
【請求項3】
前記バイパス有り算術復号部は、コンテキスト値の更新をバイパスするかどうかをシンタックスごとに設定するように構成されていることを特徴とする請求項1に記載のメッシュ復号装置。
【請求項4】
メッシュ復号方法であって、
変位量ビットストリームを復号して変位量を生成して出力する工程を有し、
前記工程は、
前記変位量ビットストリームに対してバイパス有り算術復号を行うことによって係数レベル値を生成する工程Aと、
前記係数レベル値に対して逆量子化を行うことによって第1変換係数を生成する工程Bと、
予測変換係数と予測残差とを加算することによって第2変換係数を生成する工程Cと、
前記工程Cによって生成された前記第2変換係数を取得してフレームバッファに蓄積する工程Dと、
前記フレームバッファから読み出された参照フレームの前記第2変換係数を用いてインター予測を行うことによって前記予測変換係数を生成する工程Eと、
前記第2変換係数に対して第2逆変換を行うことによって復号変位量を生成する工程Fと、を有することを特徴とするメッシュ復号方法。
【請求項5】
コンピュータを、メッシュ復号装置として機能させるプログラムであって、
前記メッシュ復号装置は、変位量ビットストリームを復号して変位量を生成して出力するように構成されている変位量復号部を備え、
前記変位量復号部は、
前記変位量ビットストリームに対してバイパス有り算術復号を行うことによって係数レベル値を生成するように構成されているバイパス有り算術復号部と、
前記係数レベル値に対して逆量子化を行うことによって第1変換係数を生成するように構成されている逆量子化部と、
予測変換係数と予測残差とを加算することによって第2変換係数を生成するように構成されている加算器と、
前記加算器から出力された前記第2変換係数を取得して蓄積するように構成されているフレームバッファと、
前記フレームバッファから読み出された参照フレームの前記第2変換係数を用いてインター予測を行うことによって前記予測変換係数を生成するように構成されているインター予測部と、
前記第2変換係数に対して第2逆変換を行うことによって復号変位量を生成するように構成されている第2逆変換部と、を備えることを特徴とするプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、メッシュ復号装置、メッシュ復号方法及びプログラムに関する。
【背景技術】
【0002】
非特許文献1には、メッシュを大まかな基本メッシュと詳細な変位量とに分けて復号し、変位量について2次元映像に変換した後で映像コーデックによって復号する技術について開示されている。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】Khaled Mammou, Jungsun Kim, Alexis Tourapis, Dimitri Podborski, Krasimir Kolarov, “[V-CG] Apple’s Dynamic Mesh Coding CfP Response,” ISO/IEC JTC 1/SC 29/WG 7 m5928, April 2022.
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、非特許文献1に開示されている技術では、生成された2次元映像が映像コーデックによる符号化には適しておらず、符号化効率が低下するという問題点があった。 そこで、本発明は、上述の課題に鑑みてなされたものであり、符号化効率を向上させることができるメッシュ復号装置、メッシュ復号方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0005】
本発明の第1の特徴は、メッシュ復号装置であって、変位量ビットストリームを復号して変位量を生成して出力するように構成されている変位量復号部を備え、前記変位量復号部は、前記変位量ビットストリームに対してバイパス有り算術復号を行うことによって係数レベル値を生成するように構成されているバイパス有り算術復号部と、前記係数レベル値に対して逆量子化を行うことによって第1変換係数を生成するように構成されている逆量子化部と、予測変換係数と予測残差とを加算することによって第2変換係数を生成するように構成されている加算器と、前記加算器から出力された前記第2変換係数を取得して蓄積するように構成されているフレームバッファと、前記フレームバッファから読み出された参照フレームの前記第2変換係数を用いてインター予測を行うことによって前記予測変換係数を生成するように構成されているインター予測部と、前記第2変換係数に対して第2逆変換を行うことによって復号変位量を生成するように構成されている第2逆変換部と、を備えることを要旨とする。
【0006】
本発明の第2の特徴は、メッシュ復号方法であって、変位量ビットストリームを復号して変位量を生成して出力する工程を有し、前記工程は、前記変位量ビットストリームに対してバイパス有り算術復号を行うことによって係数レベル値を生成する工程Aと、前記係数レベル値に対して逆量子化を行うことによって第1変換係数を生成する工程Bと、予測変換係数と予測残差とを加算することによって第2変換係数を生成する工程Cと、前記工程Cによって生成された前記第2変換係数を取得してフレームバッファに蓄積する工程Dと、前記フレームバッファから読み出された参照フレームの前記第2変換係数を用いてインター予測を行うことによって前記予測変換係数を生成する工程Eと、前記第2変換係数に対して第2逆変換を行うことによって復号変位量を生成する工程Fと、を有することを要旨とするメ。
【0007】
本発明の第3の特徴は、コンピュータを、メッシュ復号装置として機能させるプログラムであって、前記メッシュ復号装置は、変位量ビットストリームを復号して変位量を生成して出力するように構成されている変位量復号部を備え、前記変位量復号部は、前記変位量ビットストリームに対してバイパス有り算術復号を行うことによって係数レベル値を生成するように構成されているバイパス有り算術復号部と、前記係数レベル値に対して逆量子化を行うことによって第1変換係数を生成するように構成されている逆量子化部と、予測変換係数と予測残差とを加算することによって第2変換係数を生成するように構成されている加算器と、前記加算器から出力された前記第2変換係数を取得して蓄積するように構成されているフレームバッファと、前記フレームバッファから読み出された参照フレームの前記第2変換係数を用いてインター予測を行うことによって前記予測変換係数を生成するように構成されているインター予測部と、前記第2変換係数に対して第2逆変換を行うことによって復号変位量を生成するように構成されている第2逆変換部と、を備えることを要旨とする。
【発明の効果】
【0008】
本発明によれば、符号化効率を向上させることができるメッシュ復号装置、メッシュ復号方法及びプログラムを提供することができる。
【図面の簡単な説明】
【0009】
【
図1】
図1は、一実施形態に係るメッシュ処理システム1の構成の一例を示す図である。
【
図2】
図2は、一実施形態に係るメッシュ復号装置200の機能ブロックの一例を示す図である。
【
図3】
図3は、一実施形態に係るメッシュ復号装置200の変位量復号部205の機能ブロックの一例を示す図である。
【
図4】
図4は、変位量ビットストリームの構成の一例について示す図である。
【
図5】
図5は、DPSのシンタックス構成の一例について示す図である。
【
図6】
図6は、DFHのシンタックス構成の一例について示す図である。
【
図7】
図7は、DDUのシンタックス構成の一例について示す図である。
【
図8】
図8は、一実施形態に係るメッシュ復号装置200の変位量復号部205の動作の一例について示す図である。
【発明を実施するための形態】
【0010】
以下、本発明の実施の形態について、図面を参照しながら説明する。なお、以下の実施形態における構成要素は、適宜、既存の構成要素等との置き換えが可能であり、また、他の既存の構成要素との組み合わせを含む様々なバリエーションが可能である。したがって、以下の実施形態の記載をもって、特許請求の範囲に記載された発明の内容を限定するものではない。
【0011】
<第1実施形態>
以下、
図1~
図7を参照して、本実施形態に係るメッシュ処理システムについて説明する。
【0012】
図1は、本実施形態に係るメッシュ処理システム1の構成の一例を示す図である。
図1に示すように、メッシュ処理システム1は、メッシュ符号化装置100及びメッシュ復号装置200を備えている。
【0013】
図2は、本実施形態に係るメッシュ復号装置200の機能ブロックの一例を示す図である。
【0014】
図2に示すように、メッシュ復号装置200は、多重分離部201と、基本メッシュ復号部202と、細分割部203と、メッシュ復号部204と、変位量復号部205と、映像復号部206とを有する。
【0015】
多重分離部201は、多重化されたビットストリームを、基本メッシュビットストリームと変位量ビットストリームとテクスチャビットストリームとに分離するように構成されている。
【0016】
基本メッシュ復号部202は、基本メッシュビットストリームを復号し、基本メッシュを生成して出力するように構成されている。
【0017】
細分割部203は、制御情報によって示された細分割手法により、基本メッシュ復号部202によって復号された基本メッシュから、追加された細分割頂点及びそれらの接続情報を生成して出力するように構成されている。
【0018】
ここで、基本メッシュ、追加された細分割頂点、及び、それらの接続情報を、併せて「細分割メッシュ」と呼ぶ。
【0019】
メッシュ復号部204は、細分割部203で生成された細分割メッシュ及び変位量復号部205で復号された変位量を用いて、復号メッシュを生成して出力するように構成されている。
【0020】
変位量復号部205は、変位量ビットストリームを復号して変位量を生成して出力するように構成されている。
【0021】
映像復号部206は、映像符号化によってテクスチャを復号して出力するように構成されている。例えば、映像復号部206は、非特許文献1のHEVCを用いてもよい。
【0022】
(変位量復号部205)
図3に示すように、変位量復号部205は、バイパス有り算術復号部205Aと、逆量子化部205Bと、第1逆変換部205Cと、加算器205Dと、フレームバッファ205Eと、インター予測部205Fと、第2逆変換部205Gとを備えている。
【0023】
バイパス有り算術復号部205Aは、受信した変位量ビットストリームに対してバイパス有り算術復号を行うことによって、係数レベル値を生成して出力するように構成されている。
【0024】
バイパス有り算術復号部205Aは、後述する
図7のようなシンタックスを用いて効率的に係数レベル値を生成してもよい。
【0025】
バイパス有り算術復号部205Aによって生成される係数レベル値は、各フレームにおいて3×Nサイズの行列で表されてもよい。ここで、3は、次元数を示し、Nは、細分割頂点の総数を示す。各細分割頂点には、細分割レベルが定義されている。
【0026】
バイパス有り算術復号部205Aは、入力された2進数小数が数直線上のどの区間に含まれるかによって元の値を復号する。
【0027】
バイパス有り算術復号部205Aは、0から1までの数直線を定義し、その区間を2値の発生確率(以降、コンテキスト値と呼ぶ)によって分割して利用する。
【0028】
ここで、バイパス有り算術復号部205Aは、コンテキスト値を常に0.5に固定することでコンテキスト値の更新をバイパスしてもよい。コンテキスト値の更新をバイパスすることによって、高速な復号が可能となる。
【0029】
バイパス有り算術復号部205Aは、コンテキスト値の更新をバイパスするかどうかをシンタックスごとに設定してもよい。
【0030】
また、バイパス有り算術復号部205Aは、1ビットを復号する度にコンテキスト値を更新してもよい。
【0031】
バイパス有り算術復号部205Aは、0及び1のうち、発生確率が高いシンボルが発生した場合は少しコンテキスト値を更新し、発生確率が低いシンボルが発生した場合は大きくコンテキスト値を更新するような更新テーブルを用いてもよい。
【0032】
また、バイパス有り算術復号部205Aは、複数種類のコンテキスト値を用いて算術復号してもよい。
【0033】
例えば、コンテキスト値としては、次元ごとに分割して定義してもよいし、細分割レベルごとに分割して定義してもよいし、シンタックスごとに分割して定義してもよい。
【0034】
なお、バイパス有り算術復号部205Aは、上述したように、二値算術復号に基づいて係数レベル値を生成してもよいし、RangeCoderのような多値算術復号に基づいて係数レベル値を生成してもよい。
【0035】
逆量子化部205Bは、受信した係数レベル値に対して逆量子化を行うことによって、第1の変換係数を生成して出力するように構成されている。
【0036】
第1逆変換部205Cは、受信した第1の変換係数に対して第1逆変換を行うことによって、予測残差を生成して出力するように構成されている。
【0037】
例えば、第1逆変換部205Cは、逆DCTを用いて第1逆変換を行ってもよいし、逆ウェーブレット変換を用いて第1逆変換を行ってもよい。
【0038】
このように、逆量子化の後に逆変換を行うことによって、符号化時には量子化前に変換することが可能となり、符号化効率の向上が期待できる。
【0039】
加算器205Dは、インター予測部205Fから予測変換係数を取得し、第1逆変換部から予測残差を取得し、両者を加算して第2変換係数を生成して出力するように構成されている。
【0040】
生成された第2変換係数は、第2逆変換部205G及びフレームバッファ205Eに出力される。
【0041】
フレームバッファ205Eは、加算器205Dから第2変換係数を取得して蓄積するように構成されている。また、フレームバッファ205Eは、第1逆変換部205C予測残差を取得して第2変換係数として蓄積するように構成されている。
【0042】
フレームバッファ205Eは、図示しない制御情報に応じて、参照フレームにおいて対応する頂点における第2変換係数を出力するように構成されている。
【0043】
インター予測部205Fは、フレームバッファ205Eから読み出された参照フレームの第2変換係数を用いてインター予測を行うことによって、予測変換係数を生成して出力するように構成されている。
【0044】
例えば、インター予測部205Eは、参照フレームにおいて対応する周波数の第2変換係数をそのまま参照して、復号対象フレームにおいて各周波数の予測変換係数を決定してもよい。
【0045】
このように、逆量子化の後にインター予測を行うことによって、符号化時には量子化前にインター予測することが可能となり、符号化効率の向上が期待できる。
【0046】
第2逆変換部205Gは、受信した第2変換係数(或いは、予測残差)に対して第2逆変換を行うことによって、復号変位量を生成して出力するように構成されている。
【0047】
例えば、第2逆変換部205Gは、逆DCTを用いて第2逆変換を行ってもよいし、逆ウェーブレット変換を用いて第2逆変換を行ってもよい。
【0048】
(変位量ビットストリームの構成)
以下、
図4~
図7を参照して、変位量ビットストリームの構成の一例について説明する。
【0049】
なお、
図5~
図7において、Descriptor欄は、各シンタックスがどのように符号化されているかを意味している。また、
図5~
図7において、u(v)は、符号無し可変長符号であることを意味し、ue(v)は、符号無し可変長0次指数ゴロム符号であることを意味し、u(n)は、nビットの符号であることを意味する。
【0050】
図4は、変位量ビットストリームの構成の一例について示す図である。
【0051】
図4に示すように、第1に、変位量ビットストリームは、変位量の復号に関する制御情報の集合であるDPS(Displacement Parameter Set:ディスプレイスメントパラメータセット)を含んでいてもよい。
【0052】
第2に、変位量ビットストリームは、フレームに対応する制御情報の集合であるDFH(Displacement Frame Header:ディスプレイスメントフレームヘッダ)を含んでいてもよい。
【0053】
第3に、変位量ビットストリームは、DFHの次に、フレームに対応する符号化された変位量であるDDU(Displacement Data Unit:ディスプレイスメントデータユニット)を含んでいてもよい。
【0054】
図5は、DPSのシンタックス構成の一例について示す図である。
【0055】
DPSは、変換を行うか否かを制御するフラグ(transform_enabled_flag)を含んでもよい。例えば、transform_enabled_flagが1のときは変換を行うと定義し、transform_enabled_flagが0のときは変換を行わないと定義してもよい。
【0056】
図6は、DFHのシンタックス構成の一例について示す図である。
【0057】
DFHは、フレーム種別(frame_type)を含んでもよい。例えば、frame_typeが1のときは対応するフレームにおいてインター予測を行うと定義し、frame_typeが0のときは対応するフレームにおいてインター予測を行わないと定義してもよい。
【0058】
図7は、DDUのシンタックス構成の一例について示す図である。
【0059】
DDUは、係数レベル値が有意かどうかを示すフラグ(sig_coeff_flag)、係数レベル値の絶対値が2以上かどうかを示すフラグ(coeff_abs_level_greater1_flag)、係数レベル値の正負符号を示すフラグ(coeff_sign _flag)、係数レベル値の絶対値(coeff_abs_level_remaining)を含んでいてもよい。
【0060】
(変位量復号部205の動作)
以下、
図8を参照して、変位量復号部205の動作の一例について説明する。
図8は、変位量復号部205の動作の一例について示す図である。
【0061】
ステップS101において、バイパス有り算術復号部205Aは、バイパス有り算術復号を行うことによって係数レベル値を生成する。
【0062】
ステップS102において、逆量子化部205Bは、逆量子化を行うことによって第一の変換係数を生成する。
【0063】
ステップS103において、第1逆変換部205Cは、transform_enabled_flagが1であるか否かの判定を行う。Yesの場合、本動作は、ステップS104に進み、Noの場合、本動作は、ステップS105に進む。
【0064】
ステップS104において、第1逆変換部205Cは、第1逆変換を行うことによって予測残差を生成する。
【0065】
ステップS105において、インター予測部205Fは、frame_typeが1であるか否かの判定を行う。Yesの場合、本動作は、ステップS106に進み、Noの場合、本動作は、ステップS107に進む。
【0066】
ステップS106において、インター予測部205F及び加算器205Dは、インター予測を行うことによって予測変換係数を生成した後、予測残差と加算することによって、第2変換係数を生成する。
【0067】
ステップS107において、第2逆変換部205Gは、第2逆変換を行うことによって復号変位量を生成する。
【0068】
ステップS108において、バイパス有り算術復号部205Aは、現在処理しているフレームが最終フレームであるか否かの判定を行う。Yesの場合、本動作は、終了し、Noの場合、本動作は、ステップS109に進む。
【0069】
ステップS109において、バイパス有り算術復号部205Aは、次のフレームの処理に進む。
【0070】
本実施形態に係るメッシュ復号装置200によれば、バイパス有り算術復号の直後に逆量子化を行い、その後に逆変換及びインター予測を行うことによって、符号化時には量子化前に逆変換及びインター予測することが可能となり、符号化効率を向上させることができる。
【0071】
上述のメッシュ符号化装置100及びメッシュ復号装置200は、コンピュータに各機能(各工程)を実行させるプログラムであって実現されていてもよい。
【産業上の利用可能性】
【0072】
なお、本実施形態によれば、例えば、動画像通信において総合的なサービス品質の向上を実現できることから、国連が主導する持続可能な開発目標(SDGs)の目標9「レジリエントなインフラを整備し、持続可能な産業化を推進するとともに、イノベーションの拡大を図る」に貢献することが可能となる。
【符号の説明】
【0073】
1…メッシュ処理システム
100…メッシュ符号化装置
200…メッシュ復号部
201…多重分離部
202…基本メッシュ復号部
203…細分割部
204…メッシュ復号部
205…変位量復号部
205A…バイパス有り算術復号部
205B…逆量子化部
205C…第1逆変換部
205D…加算器
205E…フレームバッファ
205F…インター予測部
205G…第2逆変換部
206…映像復号部