(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024044347
(43)【公開日】2024-04-02
(54)【発明の名称】映像符号化装置及びプログラム、映像復号装置及びプログラム、並びに、映像処理システム
(51)【国際特許分類】
H04N 19/433 20140101AFI20240326BHJP
H04N 19/46 20140101ALI20240326BHJP
【FI】
H04N19/433
H04N19/46
【審査請求】未請求
【請求項の数】46
【出願形態】OL
(21)【出願番号】P 2022149825
(22)【出願日】2022-09-21
(71)【出願人】
【識別番号】000000295
【氏名又は名称】沖電気工業株式会社
(74)【代理人】
【識別番号】100180275
【弁理士】
【氏名又は名称】吉田 倫太郎
(74)【代理人】
【識別番号】100161861
【弁理士】
【氏名又は名称】若林 裕介
(72)【発明者】
【氏名】中川 聰
【テーマコード(参考)】
5C159
【Fターム(参考)】
5C159MA04
5C159MA05
5C159MA23
5C159MC11
5C159ME01
5C159PP04
5C159RC11
5C159UA02
5C159UA05
5C159UA16
5C159UA38
(57)【要約】
【課題】内部的な映像表現を、対象画像のビット深度に依存した、符号なしビット深度の映像表現とする標準方式の符号化・復号処理と互換動作する。
【解決手段】本発明の映像符号化装置は、符号化対象画像を、装置内部での演算に使用する符号付き固定ビット深度画像に変換する符号付き固定ビット深度化変換手段と、符号化処理によって符号付き固定ビット深度画像として再構成した再構成画像を、後続の画像の符号化時の予測画像の生成に用いる参照画像として保持する符号付き固定ビット深度参照画像バッファとを備え、符号化処理は、演算結果を、対象画像のビット深度に応じたビット精度に丸める処理、又は切り捨てる処理が既存標準方式に規定されている場合に、符号付き固定ビット深度の画素値表現のまま、既存標準方式の処理を模倣する処理を行う。
【選択図】
図1
【特許請求の範囲】
【請求項1】
入力された符号化対象画像を、映像符号化装置内部での演算に使用する符号付き固定ビット深度画像に変換する符号付き固定ビット深度化変換手段と、
符号付き固定ビット深度の領域で符号化処理を行う符号化処理手段と、
前記符号化処理によって符号付き固定ビット深度画像として再構成した再構成画像を、後続の画像の符号化時の予測画像の生成に用いる参照画像として保持する符号付き固定ビット深度参照画像バッファと
を備え、
前記符号化処理手段による前記符号化処理は、演算結果を、対象画像のビット深度に応じたビット精度に丸める処理、又は切り捨てる処理が既存映像標準符号化方式に規定されている場合に、符号付き固定ビット深度の画素値表現のまま、既存映像標準符号化方式の処理を模倣する互換動作モードで処理を行う
ことを特徴とする映像符号化装置。
【請求項2】
前記予測画像は、符号付き固定ビット深度の画像として生成されるものであることを特徴とする請求項1に記載の映像符号化装置。
【請求項3】
前記符号付き固定ビット深度参照画像バッファ内の前記参照画像を参照して、動き補償予測や双方向予測を用いて、符号付き固定ビット深度のインター予測画像を生成するインター予測手段をさらに備えることを特徴とする請求項1に記載の映像符号化装置。
【請求項4】
前記インター予測手段が、ビットマスク処理によって、既存映像標準符号化方式と互換可能なインター予測画像を生成することを特徴とする請求項3に記載の映像符号化装置。
【請求項5】
符号付き固定ビット深度の画像として生成された同じ画面内の画素を参照して、イントラ予測処理を行って、符号付き固定ビット深度のイントラ予測画像を生成するイントラ予測手段をさらに備えることを特徴とする請求項1に記載の映像符号化装置。
【請求項6】
前記イントラ予測手段が、ビットマスク処理によって、既存映像標準符号化方式と互換な前記イントラ予測画像を生成することを特徴とする請求項5に記載の映像符号化装置。
【請求項7】
前記再構成画像に対して、ループ内フィルタ処理を施した、符号付き固定ビット深度の復号画像を生成するループ内フィルタ手段を備え、
前記符号付き固定ビット深度参照画像バッファは、得られた符号付き固定ビット深度の前記復号画像を、前記参照画像として保持する
ことを特徴とする請求項1に記載の映像符号化装置。
【請求項8】
前記ループ内フィルタ手段が、
ビットマスク処理によって、既存映像標準符号化方式と互換な復号画像を生成するものであり、
得られた既存映像標準符号化方式における復号画像を符号付き固定ビット深度の画像として表現して得た符号付き固定ビット深度の復号画像を、前記符号付き固定ビット深度参照画像バッファに、前記参照画像として保持させることを特徴とする請求項7に記載の映像符号化装置。
【請求項9】
前記符号付き固定ビット深度化変換手段により変換された対象画像と、符号付き固定ビット深度の画像として生成された前記予測画像との差分から予測残差信号を求める差分処理手段を備え、
前記符号化処理は、前記予測残差信号を基にして行う
ことを特徴とする請求項1に記載の映像符号化装置。
【請求項10】
符号化された残差信号を復元する処理を行い、符号付き固定ビット深度の画像として生成された前記予測画像と、復元された残差信号を加算する加算処理手段を備え、
前記符号化処理は、前記加算処理手段による加算処理によって得られた結果から、符号付き固定ビット深度の前記再構成画像を生成する
ことを特徴とする請求項1に記載の映像符号化装置。
【請求項11】
前記加算処理手段が、ビットマスク処理によって、既存映像標準符号化方式と互換な前記再構成画像を生成することを特徴とする請求項10に記載の映像符号化装置。
【請求項12】
前記予測残差信号に対して、所定の変換処理を施して変換係数領域に変換する変換手段と、
前記変換手段によって変換された変換係数を量子化する量子化手段と
をさらに備えることを特徴とする請求項9に記載の映像符号化装置。
【請求項13】
量子化された前記変換係数を逆量子化する逆量子化手段と、
前記逆量子化手段によって得られた前記変換係数に対して、所定の変換処理を施して、前記予測残差信号を復元した復元予測残差信号を取得する逆変換手段と
をさらに備え、
前記復元予測残差信号は、符号付き固定ビット深度の再構成画像の生成に利用されることを特徴とする請求項12に記載の映像符号化装置。
【請求項14】
前記逆変換手段が、前記復元予測残差信号に対して、ビットマスク処理によって既存映像標準符号化方式と互換な符号付き固定ビット深度の残差信号を生成することを特徴とする請求項13に記載の映像符号化装置。
【請求項15】
量子化された前記変換係数を、前記符号付き固定ビット深度化変換手段で用いられた、入力された前記符号化対象画像のビット深度を表すビット深度パラメーターを含む変換パラメーターとともに多重化してエントロピー符号化するエントロピー符号化手段をさらに備えたことを特徴とする請求項12に記載の映像符号化装置。
【請求項16】
前記エントロピー符号化手段が、既存映像標準符号化方式に準拠する符号化ストリームを出力することを特徴とする請求項15に記載の映像符号化装置。
【請求項17】
前記符号付き固定ビット深度化変換手段が、
入力画像の画素値を、当該入力画像のビット深度パラメーターに応じて、固定のビット深度にスケールするスケール部と、
符号なしの入力画像の画素値を符号付きの画素値に変換する減算部と
を備えることを特徴とする請求項1に記載の映像符号化装置。
【請求項18】
前記インター予測手段が、
前記符号付き固定ビット深度参照画像バッファ内の符号付き固定ビット深度で表現された前記参照画像を参照して、水平と垂直の2次元の方向のいずれか一方の方向への補間フィルタ処理による中間結果を符号付き固定ビット深度の画像として求め、
符号付き固定ビット深度の前記中間結果を参照して、もう一方の方向への補間フィルタ処理によって、補間処理結果画像を、符号付き固定ビット深度の画像として求め、
符号付き固定ビット深度の前記補間処理結果画像を用いて、インター予測によるインター予測画像を生成する
ことを特徴とする請求項3に記載の映像符号化装置。
【請求項19】
前記イントラ予測手段は、イントラ予測に用いる参照画素が、当該参照画素としては用いない位置の画素であった場合には、その画素値を0であるとみなすような処理を行って、前記イントラ予測画像を生成することを特徴とする請求項5に記載の映像符号化装置。
【請求項20】
前記符号化対象画像の画素値を、符号付き固定のビット深度の画素値に変換する変換関数を、ビット深度パラメーター以外のパラメーターも用いた変換関数として定義可能として、前記パラメーターを、符号化ストリームに多重化する多重化手段をさらに備え、
前記符号付き固定ビット深度化変換手段は、前記変換関数に従って、前記符号化対象画像の画素値を符号付き固定のビット深度の画素値に変換する
ことを特徴とする請求項1に記載の映像符号化装置。
【請求項21】
入力画像の画素値を、そのまま符号化可能なPCMモードを設け、
PCMモードの領域についてはPCMモード用のビット深度パラメーターに基づいて符号化ストリームに多重化し、
PCMモードの領域に対応する再構成画像は、PCMモードの画素を符号付き固定ビット深度の画素に変換した画素値を用いて生成する
ことを特徴とする請求項1に記載の映像符号化装置。
【請求項22】
前記符号化処理手段による前記符号化処理は、前記互換動作モードと、既存映像標準符号化方式の処理を模倣する処理を行わず、高精度な符号付き固定ビット深度の画素値表現のまま符号化処理を行う拡張動作モードとを切り替えて処理することを特徴とする請求項1に記載の映像符号化装置。
【請求項23】
符号付き固定ビット深度の領域で復号処理を行う復号処理手段と、
前記復号処理によって再構成される画像を、符号付き固定ビット深度の画像として求め、この再構成した再構成画像を、後続の画像の符号化時の予測画像の生成に用いる参照画像として保持する符号付き固定ビット深度参照画像バッファと、
映像復号装置内部の映像表現である符号付き固定ビット深度の画像を、対象映像のビット深度の画像に変換する復号画像ビット深度変換手段と
を備え、
前記復号処理手段による前記復号処理は、演算結果を、対象画像のビット深度に応じたビット精度に丸める処理、又は切り捨てる処理が既存映像標準符号化方式に規定されている場合に、符号付き固定ビット深度の画素値表現のまま、既存映像標準符号化方式の処理を模倣する互換動作モードで処理を行う
ことを特徴とする映像復号装置。
【請求項24】
前記予測画像は、符号付き固定ビット深度の画像として生成されるものであることを特徴とする請求項23に記載の映像復号装置。
【請求項25】
前記符号付き固定ビット深度参照画像バッファ内の前記参照画像を参照して、動き補償予測や双方向予測を用いて、符号付き固定ビット深度のインター予測画像を生成するインター予測手段をさらに備えることを特徴とする請求項23に記載の映像復号装置。
【請求項26】
前記インター予測手段が、ビットマスク処理によって、既存映像標準符号化方式と互換可能なインター予測画像を生成することを特徴とする請求項25に記載の映像復号装置。
【請求項27】
符号付き固定ビット深度の画像として生成された同じ画面内の画素を参照して、イントラ予測処理を行って、符号付き固定ビット深度のイントラ予測画像を生成するイントラ予測手段をさらに備えることを特徴とする請求項23に記載の映像復号装置。
【請求項28】
前記イントラ予測手段が、ビットマスク処理によって、既存映像標準符号化方式と互換なイントラ予測画像を生成することを特徴とする請求項27に記載の映像復号装置。
【請求項29】
前記再構成画像に対して、ループ内フィルタ処理を施した、符号付き固定ビット深度の復号画像を生成するループ内フィルタ手段を備え、
前記符号付き固定ビット深度参照画像バッファは、得られた符号付き固定ビット深度の前記復号画像を、前記参照画像として保持する
ことを特徴とする請求項23に記載の映像復号装置。
【請求項30】
前記ループ内フィルタ手段が、
ビットマスク処理によって、既存映像標準符号化方式と互換な復号画像を生成するものであり、
得られた既存映像標準符号化方式における復号画像を符号付き固定ビット深度の画像として表現して得た符号付き固定ビット深度の復号画像を、前記符号付き固定ビット深度参照画像バッファに、前記参照画像として保持させることを特徴とする請求項29に記載の映像復号装置。
【請求項31】
符号化された残差信号を復元する処理を行い、符号付き固定ビット深度の画像として生成された前記予測画像と、復元された残差信号を加算する加算処理手段を備え、
前記復号処理は、前記加算処理手段による加算処理によって得られた結果から、符号付き固定ビット深度の前記再構成画像を生成する
ことを特徴とする請求項23に記載の映像復号装置。
【請求項32】
前記加算処理手段が、ビットマスク処理によって、既存映像標準符号化方式と互換な前記再構成画像を生成することを特徴とする請求項31に記載の映像復号装置。
【請求項33】
入力された符号化ストリームから抽出した、量子化された変換係数を逆量子化する逆量子化手段と、
前記逆量子化手段により得られた前記変換係数に対して、所定の逆変換処理を施して、符号化された残差信号を復元した復元予測残差信号を取得する逆変換手段と
をさらに備え、
前記復元予測残差信号は、符号付き固定ビット深度の再構成画像の生成に利用される
ことを特徴とする請求項23に記載の映像復号装置。
【請求項34】
前記逆変換手段が、前記復元予測残差信号に対して、ビットマスク処理によって、既存映像標準符号化方式と互換な符号付き固定ビット深度の残差信号を生成することを特徴とする請求項33に記載の映像復号装置。
【請求項35】
入力される符号化ストリームから、量子化された変換係数と、前記復号画像ビット深度変換手段で用いる対象画像のビット深度パラメーターを含む逆変換のためのパラメーターをエントロピー復号して抽出するエントロピー復号手段をさらに備え、
前記復号処理は、得られた量子化された前記変換係数を基に符号付き固定ビット深度の前記再構成画像を生成する処理を行い、
前記復号画像ビット深度変換手段は、エントロピー復号によって得られる前記パラメーターを基に、対象画像のビット深度の画像への変換を行う
ことを特徴とする請求項33に記載の映像復号装置。
【請求項36】
前記エントロピー復号手段は、既存映像標準符号化方式と互換な入力符号化ストリームをエントロピー復号するものであり、
前記復号処理は、既存映像標準符号化方式と互換な動作モードで動作させる
ことを特徴とする請求項35に記載の映像復号装置。
【請求項37】
前記復号画像ビット深度変換手段は、復号処理結果の復号画像の出力先の要求するビット深度が、符号化ストリームから得られるビット深度パラメーターと異なる場合には、符号付き固定ビット深度の画像として復号された前記復号画像を、前記出力先の要求するビット深度の画像に変換する処理を行うことを特徴とする請求項23に記載の映像復号装置。
【請求項38】
前記復号画像ビット深度変換手段は、
符号付き固定ビット深度の画像として生成されている復号画像に対して、符号付きの復号画素値を符号なしの画素値に変換する加算部と、
固定ビット深度の画素値を、対象画像のビット深度パラメーターに応じて、前記対象画像のビット深度の画素値に変換する逆スケール部と
を備えることを特徴とする請求項23に記載の映像復号装置。
【請求項39】
前記インター予測手段が、
前記符号付き固定ビット深度参照画像バッファ内の符号付き固定ビット深度で表現された前記参照画像を参照して、水平と垂直の2次元の方向のいずれか一方の方向への補間フィルタ処理による中間結果を符号付き固定ビット深度の画像として求め、
符号付き固定ビット深度の前記中間結果を参照して、もう一方の方向への補間フィルタ処理によって、補間処理結果画像を、符号付き固定ビット深度の画像として求め、
符号付き固定ビット深度の前記補間処理結果画像を用いて、インター予測によるインター予測画像を生成する
ことを特徴とする請求項25に記載の映像復号装置。
【請求項40】
前記イントラ予測手段は、イントラ予測に用いる参照画素が、当該参照画素としては用いない位置の画素であった場合には、その画素値を0であるとみなすような処理を行って、前記イントラ予測画像を生成することを特徴とする請求項27に記載の映像復号装置。
【請求項41】
前記復号画像ビット深度変換手段が、復号処理内部での画素値の表現である符号付き固定のビット深度の画素値を、出力画像の画素値に変換する逆変換関数を、ビット深度パラメーター以外のパラメーターも用いた逆変換関数として定義可能として、この変換パラメーターを符号化ストリームに多重化し、符号化ストリームの復号により抽出された変換パラメーターで表現された逆変換関数に従って、符号付き固定のビット深度の画像として生成された復号画像を、出力用の対象画像のビット深度の画像に変換する
ことを特徴とする請求項23に記載の映像復号装置。
【請求項42】
入力画像の画素値を、そのまま符号化可能なPCMモードを設け、
PCMモードの領域についてはPCMモード用のビット深度パラメーターに基づいて符号化ストリームから画素値を抽出し、
PCMモードの領域に対応する再構成画像は、符号化ストリームから抽出したPCMモードの画素値を、符号付き固定ビット深度度の画素値に変換した画素値を用いて生成する
ことを特徴とする請求項23に記載の映像復号装置。
【請求項43】
前記復号処理手段による前記復号処理は、前記互換動作モードと、既存映像標準符号化方式の処理を模倣する処理を行わず、高精度な符号付き固定ビット深度の画素値表現のまま復号処理を行う拡張動作モードとを切り替えて処理することを特徴とする請求項23に記載の映像復号装置。
【請求項44】
コンピュータを、
入力された符号化対象画像を、映像符号化装置内部での演算に使用する符号付き固定ビット深度画像に変換する符号付き固定ビット深度化変換手段と、
符号付き固定ビット深度の領域で符号化処理を行う符号化処理手段と、
前記符号化処理によって符号付き固定ビット深度画像として再構成した再構成画像を、後続の画像の符号化時の予測画像の生成に用いる参照画像として保持する符号付き固定ビット深度参照画像バッファと
して機能させ、
前記符号化処理は、演算結果を、対象画像のビット深度に応じたビット精度に丸める処理、又は切り捨てる処理が既存映像標準符号化方式に規定されている場合に、符号付き固定ビット深度の画素値表現のまま、既存映像標準符号化方式の処理を模倣する互換動作モードで処理を行う
ことを特徴とする映像符号化プログラム。
【請求項45】
コンピュータを、
符号付き固定ビット深度の領域で復号処理を行う復号処理手段と、
復号処理によって再構成される画像を、符号付き固定ビット深度の画像として求め、この再構成した再構成画像を、後続の画像の符号化時の予測画像の生成に用いる参照画像として保持する符号付き固定ビット深度参照画像バッファと、
映像復号装置内部の映像表現である符号付き固定ビット深度の画像を、対象映像のビット深度の画像に変換する復号画像ビット深度変換手段と
して機能させ、
前記復号処理は、演算結果を、対象画像のビット深度に応じたビット精度に丸める処理、又は切り捨てる処理が既存映像標準符号化方式に規定されている場合に、符号付き固定ビット深度の画素値表現のまま、既存映像標準符号化方式の処理を模倣する互換動作モードで処理を行う
ことを特徴とする映像復号プログラム。
【請求項46】
映像符号化装置と、前記映像符号化装置により符号化された符号化データを復号する映像復号装置とを備える映像処理システムにおいて、
前記映像符号化装置と前記映像復号装置とのいずれか一方又は両方が、
前記映像符号化装置として請求項1~22のいずれかに記載の映像符号化装置を適用し、
前記映像復号装置として請求項23~43のいずれかに記載の映像復号装置を適用した
ことを特徴とする映像処理システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、映像符号化装置及びプログラム、映像復号装置及びプログラム、並びに、映像処理システムに関する。
【背景技術】
【0002】
例えば、H.264/MPEG-4 AVC(Advanced Video Coding:以下、「AVC」と呼ぶ。)、H.265/MPEG-H HEVC(High Efficiency Video Coding:以下、「HEVC」と呼ぶ。)、H.266/MPEG-I VVC(Versatile Video Coding:以下、「VVC」と呼ぶ。)等に代表される映像符号化方式による映像情報の圧縮符号化処理は、入力された対象画像を分割した処理単位ごとに、イントラ予測や動き補償予測等のインター予測を行った予測画像と、入力された対象画像との差分である予測残差信号に、離散コサイン変換等の空間変換を施した変換係数を量子化して、これをエントロピー符号化することによって高効率の映像圧縮を実現している(非特許文献1)。
【0003】
図11は、従来技術の映像符号化装置の構成を示す構成図である。VVCのような符号化技術を用いる場合、入力された符号化対象画像(入力映像)は、差分処理部301に与えられる。差分処理部301は、符号化ユニット等の処理単位領域ごとに、動き補償を伴うインター予測部310もしくは画面内の符号化済み画素等から予測を行うイントラ予測部311による予測画像と、入力された符号化対象画像との差分をとり、その差分である予測残差信号を得る。予測残差信号は、変換部302においてDCT(離散コサイン変換)やDST(離散サイン変換)によって変換される。得られた変換係数は、量子化部303により量子化される。量子化された変換係数は、エントロピー符号化部304により、可変長符号や算術符号のようなエントロピー符号化され、エントロピー符号化部304が符号化ストリームを出力する。量子化された変換係数は、逆量子化部305により逆量子化され、逆変換部306により逆変換される。逆変換で得た復元された残差信号は、加算部307において予測画像を加算されることによって再構成画像が得られる。さらに、再構成画像はブロック歪を軽減するデブロッキングフィルタなどのループ内フィルタ308が適用され、後続の画像の符号化時のインター予測の動き補償のための参照画像として参照画像バッファ309に保持される。
【0004】
図12は、従来技術の映像復号装置の構成を示す構成図である。映像符号化装置で生成された符号化ストリームが入力されると、符号化ストリームはエントロピー復号部404によりエントロピー復号されて、DCT等の変換係数と、符号化モード情報や動きベクトル情報を得る。変換係数は、逆量子化部405により逆量子化され、逆変換部406により逆変換される。加算部407は、逆変換で得られる復元された残差信号と、インター予測部410もしくはイントラ予測部411により生成された予測画像とを加算する。これにより、映像符号化装置と同じ再構成画像を生成する。再構成画像は、デブロッキングフィルタなどのループ内フィルタ408が適用されて、復号画像として出力されるとともに、後続のインター予測のための参照画像として参照画像バッファ409に保持される。
【0005】
近年、ディスプレイ技術の進歩やネットワークの広帯域化に伴って、より高画質な映像の符号化が求められるようになり、従来、画素あたり8ビットのビット深度で輝度値等を表現していたSDR(Standard Dynamic Range)から、10ビット以上のビット深度で画素値を表現するHDR(High Dynamic Range)映像が主流となりつつある。VVCでも、映像のビット深度に応じた符号化が可能となるように設計されており、VVCの第1版では10ビット深度映像を対象とするプロファイル(用途等に応じた利用可能な機能のセット)が主要プロファイルとして定義されている。
【0006】
映像符号化技術のコーデックでのビット深度の取り扱いは、非特許文献2に示されるように、一般にコーデックに入出力される映像のビット深度よりも、コーデック内部での演算で用いるビット深度をより大きくするほうが、符号化効率が向上することが知られている。例えばVVCでも参照画像バッファのビット深度は入出力映像のビット深度と同じとしているが、インター予測の動き補償予測画像の生成や変換演算等で、よりビット深度の大きな演算を用いるように設計されている。
【0007】
このように、8ビット映像や10ビット映像など様々なビット深度の映像に対応する映像符号化技術では、コーデック内部の様々な構成要素における演算処理で、処理対象となっている映像のビット深度をパラメーターとするシフト演算等の演算によって、ビット深度の異なる様々な対象映像の処理を可能とするように設計されている。
【0008】
特許文献1では、コーデック内部の映像表現を、十分なビット深度を持つ符号付きの固定ビット深度の映像表現とし、符号化対象映像の入力時、復号映像の出力時にのみ、対象映像のビット深度に応じた符号なしの(可変)ビット深度映像表現とすることで、コーデック内部での演算を簡素化し、かつ、高精度な演算処理を実現する方法を開示している。
【先行技術文献】
【特許文献】
【0009】
【非特許文献】
【0010】
【非特許文献1】ITU-T H.266 ISO/IEC 23090-3,“Versatile Video Coding”,(http://handle.itu.int/11.1002/1000/14336)
【非特許文献2】Takeshi Chujoh, et al. “Internal bit depth increase for coding efficiency,” VCEG-AE13,(https://www.itu.int/wftp3/av-arch/video-site/0701_Mar/VCEG-AE13.zip)
【発明の概要】
【発明が解決しようとする課題】
【0011】
しかしながら、従来技術の映像符号化技術では、非特許文献2で示されるように、参照画像のビット深度を入出力画像のビット深度と同じとしていたため、入出力ビット深度よりも大きなビット深度の参照画像バッファを用いる場合に比べて、符号化効率が低下してしまうという問題がある。
【0012】
一方、特許文献1の方法では、コーデック内部で高精度な演算を行うことにより符号化効率を向上させることは可能である。しかし、VVC第1版標準やAVC、HEVC標準等ではビット深度依存の丸め処理等が規定されているため、VVC第1版標準等の標準コーデックと互換性のあるストリームへの符号化、標準コーデックと互換性のあるストリームの復号ができないという課題がある。
【0013】
以上のように、特許文献1のような映像コーデックにおいても既存の標準コーデックと互換性のある符号化・復号処理が可能であることが望ましく、また、これら双方に対応するコーデックであっても、大部分の構成要素や演算処理が共通の構成要素や演算処理で構成されていることが望ましい。
【0014】
そのため、内部的な映像表現を、符号付き固定ビット深度の映像表現とする映像符号化技術の映像符号化装置、映像復号装置において、内部的な映像表現を対象画像のビット深度に依存したビット深度の符号なし(可変)ビット深度の映像表現とする映像符号化標準方式の符号化・復号処理と互換な動作が可能であり、その映像符号標準方式との互換動作時においても標準演算よりも軽量な演算処理とすることが求められている。
【課題を解決するための手段】
【0015】
本発明は、前記課題を解決するためになされたものであり、次のような構成を有する。
【0016】
第1の本発明の映像符号化装置は、入力された符号化対象画像を、映像符号化装置内部での演算に使用する符号付き固定ビット深度画像に変換する符号付き固定ビット深度化変換手段と、符号付き固定ビット深度の領域で符号化処理を行う符号化処理手段と、符号化処理によって符号付き固定ビット深度画像として再構成した再構成画像を、後続の画像の符号化時の予測画像の生成に用いる参照画像として保持する符号付き固定ビット深度参照画像バッファとを備え、符号化処理は、演算結果を、対象画像のビット深度に応じたビット精度に丸める処理、又は切り捨てる処理が既存映像標準符号化方式に規定されている場合に、符号付き固定ビット深度の画素値表現のまま、既存映像標準符号化方式の処理を模倣する互換動作モードで処理を行うことを特徴とする。
【0017】
第2の本発明の映像復号装置は、符号付き固定ビット深度の領域で復号処理を行う復号処理手段と、復号処理によって再構成される画像を、符号付き固定ビット深度の画像として求め、この再構成した再構成画像を、後続の画像の符号化時の予測画像の生成に用いる参照画像として保持する符号付き固定ビット深度参照画像バッファと、映像復号装置内部の映像表現である符号付き固定ビット深度の画像を、対象映像のビット深度の画像に変換する復号画像ビット深度変換手段とを備え、復号処理は、演算結果を、対象画像のビット深度に応じたビット精度に丸める処理、又は切り捨てる処理が既存映像標準符号化方式に規定されている場合に、符号付き固定ビット深度の画素値表現のまま、既存映像標準符号化方式の処理を模倣する互換動作モードで処理を行うことを特徴とする。
【0018】
第3の本発明の映像符号化装置は、コンピュータを、入力された符号化対象画像を、映像符号化装置内部での演算に使用する符号付き固定ビット深度画像に変換する符号付き固定ビット深度化変換手段と、符号付き固定ビット深度の領域で符号化処理を行う符号化処理手段と、符号化処理によって符号付き固定ビット深度画像として再構成した再構成画像を、後続の画像の符号化時の予測画像の生成に用いる参照画像として保持する符号付き固定ビット深度参照画像バッファとして機能させ、符号化処理は、演算結果を、対象画像のビット深度に応じたビット精度に丸める処理、又は切り捨てる処理が既存映像標準符号化方式に規定されている場合に、符号付き固定ビット深度の画素値表現のまま、既存映像標準符号化方式の処理を模倣する互換動作モードで処理を行うことを特徴とする。
【0019】
第4の本発明の映像復号装置は、コンピュータを、符号付き固定ビット深度の領域で復号処理を行う復号処理手段と、復号処理によって再構成される画像を、符号付き固定ビット深度の画像として求め、この再構成した再構成画像を、後続の画像の符号化時の予測画像の生成に用いる参照画像として保持する符号付き固定ビット深度参照画像バッファと、映像復号装置内部の映像表現である符号付き固定ビット深度の画像を、対象映像のビット深度の画像に変換する復号画像ビット深度変換手段として機能させ、復号処理は、演算結果を、対象画像のビット深度に応じたビット精度に丸める処理、又は切り捨てる処理が既存映像標準符号化方式に規定されている場合に、符号付き固定ビット深度の画素値表現のまま、既存映像標準符号化方式の処理を模倣する互換動作モードで処理を行うことを特徴とする。
【0020】
第5の本発明の映像処理システムは、映像符号化装置と、前記映像符号化装置により符号化された符号化データを復号する映像復号装置とを備える映像処理システムにおいて、映像符号化装置と映像復号装置のいずれか一方又は両方が、映像符号化装置として第1の本発明の映像符号化装置を適用し、映像復号装置として第2の本発明の映像復号装置を適用したことを特徴とする。
【発明の効果】
【0021】
本発明によれば以下のような効果が得られる。
【0022】
本発明によれば、内部的な映像表現を、符号付き固定ビット深度の映像表現とする映像符号化技術の符号化装置・復号装置において、内部的な映像表現を対象画像のビット深度に依存したビット深度の符号なし(可変)ビット深度の映像表現とする映像符号化標準方式の符号化・復号処理と互換な動作を可能とすることができる。また、映像符号化標準方式との互換動作時においても標準演算よりも軽量な演算処理とすることができる。
【図面の簡単な説明】
【0023】
【
図1】実施形態に係る映像符号化装置の構成を示す構成図である。
【
図2】実施形態に係る映像復号装置の構成を示す構成図である。
【
図3】実施形態に係る映像処理システムの全体構成を示した図である。
【
図4】実施形態に係る符号付き固定ビット深度化変換部の構成の一例を示す図である。
【
図5】実施形態に係る符号付き復号画像ビット深度変換部の構成の一例を示す図である。
【
図6】VVCにおける輝度画像の予測に使われる補間フィルタのフィルタ係数の一例である。
【
図7】VVCにおける補間画像生成処理の構成を示す図である。
【
図8】特許文献1のインター予測処理における補間画像生成処理の構成を示す図である。
【
図9】本実施形態のインター予測処理における補間画像生成処理の構成を示す図である。
【
図10】実施形態に係る符号付き固定ビット深度への変換、対象ビット深度への変換の様子(各画像における画素値の取りうる範囲)を示している。
【
図11】従来の映像符号化装置の構成を示す構成図である。
【
図12】従来の映像復号装置の構成を示す構成図である。
【発明を実施するための形態】
【0024】
(A)主たる実施形態
以下、本発明に係る映像符号化装置及びプログラム、映像復号装置及びプログラム、並びに、映像処理システムの実施形態を、図面を参照しながら詳細に説明する。
【0025】
なお、以下の説明では、内部的な映像表現(参照画像バッファ等に保持される画像表現)を、符号化対象画像のビット深度に依存したビット深度の符号なし(可変)ビット深度の映像表現として定義されている既存の標準符号化方式等を、単に「従来の」映像符号化方式、あるいは、「標準の」映像符号化方式のように呼ぶ場合もある。
【0026】
また、標準の符号化方式と互換な符号化処理・復号処理を行う本実施形態における動作モードを「互換動作モード」、特許文献1と同様な内部的に符号付き固定ビット深度の高精度の符号化処理・復号処理を行う本実施形態における動作モードを「拡張動作モード」のように呼ぶ。
【0027】
(A-1)実施形態の構成
(A-1-1)映像処理システムの全体構成
図3は、実施形態に係る映像処理システムの全体構成を示した図である。
【0028】
映像処理システム1は、符号化対象の入力映像を符号化し、その符号化したストリームデータ(以下、「符号化ストリーム」と呼ぶ。)を出力する映像符号化装置10と、映像符号化装置10により符号化された符号化ストリームを復号して復号映像を得る映像復号装置20とを有する。
【0029】
映像符号化装置10に供給される入力映像の入力方式は限定されず、入力映像の入力方式は、リアルタイムにカメラで撮影(撮像)された映像信号としても良いし、HDDやDVD等のデータ記録媒体に記録されたデータ(オフラインデータ)に基づく映像を読み込むようにしても良いし、通信により供給されるデータ(オンラインデータ)に基づく映像を読み込むようにしても良い。
【0030】
映像復号装置20に供給される符号化ストリームのデータについても入力方式は限定されず、符号化ストリームの入力方式は、通信により符号化ストリームをリアルタイムに受信(映像符号化装置10から受信)するようにしても良いし、データ記録媒体に記録された符号化ストリームのデータをオフラインで読み込むようにしても良い。
【0031】
(A-1-2)映像符号化装置10の詳細な構成
図1は、実施形態に係る映像符号化装置10の構成を示す構成図である。
図1において、映像符号化装置10は、差分処理部101、変換部102、量子化部103、エントロピー符号化部104、逆量子化部105、逆変換部106、加算部107、ループ内フィルタ部108、符号付き固定ビット深度参照画像バッファ109、インター予測部110、イントラ予測部111、切り替え部112、符号付き固定ビット深度化変換部120を有する。
【0032】
図1において、映像符号化装置10は、符号付き固定ビット深度化変換部120以外の各構成要素が、特許文献1と同様な符号付き固定ビット深度映像表現を想定した処理を行う動作モード(拡張動作モード)を備えることに加えて、内部的な映像表現が標準符号化方式と互換な動作モード(互換動作モード)も備える。
【0033】
映像符号化装置10は、
図1に例示する各構成部を有する専用のICチップ等のハードウェアとして構成しても良いし、又は、CPUと、CPUが実行するプログラムを中心としてソフトウェア的に構成してもよく、機能的には、
図1で表すことができる。
【0034】
映像符号化装置10は、入力映像を、符号付き固定ビット深度画像に変換し、符号付き固定ビット深度画像に変換された符号化対象画像(入力映像)を、符号化ユニット等の所定単位領域ごとに符号化し、符号化ストリームを出力する。
【0035】
符号付き固定ビット深度化変換部120は、入力された符号化対象画像を、そのビット深度を表すビット深度パラメーターに応じて、符号化装置内部での演算に使用する符号付き固定ビット深度の画像に変換するものである。符号付き固定ビット深度化変換部120は、符号付き固定ビット深度に変換した画像を、差分処理部101に与える。
【0036】
差分処理部101は、予測残差信号を求めるために、処理単位領域の符号付き固定ビット深度に変換された入力画像と、インター予測部110若しくはイントラ予測部111からの、上記処理単位領域に対応する符号付き固定ビット深度の予測画像との差分を求め、その差分を予測残差信号として変換部102に与える。
【0037】
変換部102は、入力された予測残差信号を変換係数に変換するものである。変換部102は、例えば、DCT(離散コサイン変換)やDST(離散コサイン変換)等を適用できる。
【0038】
量子化部103は、変換部102により変換された変換係数を量子化するものである。量子化部103は、得られた量子化された変換係数をエントロピー符号化部104及び逆量子化部105に出力する。
【0039】
エントロピー符号化部104は、符号の出現確率の偏りを圧縮するために、量子化部103からの量子化された変換係数、符号化モード情報、予測モード情報、動きベクトル情報、ビット深度パラメーター等をエントロピー符号化して、符号化ストリームを出力する。
【0040】
逆量子化部105は、符号化信号から残差信号(残差画像)を復元するために、量子化部103からの量子化された変換係数を逆量子化するものである。
【0041】
逆変換部106は、逆量子化部105により逆量子化された信号を逆変換して残差信号(残差画像)を復元して、加算部107に与える。
【0042】
加算部107は、逆変換部106からの復元された残差信号に、切り替え部112を介してインター予測部110若しくはイントラ予測部111からの符号付き固定ビット深度の予測画像を加算して、復号側で復号される符号付き固定ビット深度の再構成画像を求めるものである。加算部107は、符号付き固定ビット深度の再構成画像を、ループ内フィルタ部108に与える。
【0043】
ループ内フィルタ部108は、符号化ループ内の量子化処理によって生じる符号化歪み(例えばブロック歪、リンギング歪等)を低減するために、加算部107からの符号付き固定ビット深度の再構成画像をフィルタリングするものである。
【0044】
符号付き固定ビット深度参照画像バッファ109は、ループ内フィルタ部108から出力される画像を、符号付き固定ビット深度画像のまま参照画像として保持するものである。符号付き固定ビット深度参照画像バッファ109に保持されている画像が、後続の入力画像の符号化時のインター予測の動き補償のための参照画像となる。
【0045】
インター予測部110は、符号付き固定ビット深度参照画像バッファ109に保持されている画像を参照画像として取得して動き補償予測を行うものである。
【0046】
イントラ予測部111は、加算部107から出力される再構成画像を用いて、画面内の符号付き固定ビット深度の再構成画素等からイントラ予測を行うものである。
【0047】
切り替え部112は、符号化モード(イントラモード又はインターモード)に応じて、インター予測部110又はイントラ予測部111の出力を切り替えるものである。
【0048】
従来の映像符号化装置(
図11)との違いは、入力画像を符号付き固定ビット深度の内部処理用の画像に変換する、符号付き固定ビット深度化変換部120設けたことと、参照画像を符号付き固定ビット深度の画像のまま保持する符号付き固定ビット深度参照画像バッファ109を設けたことである。
【0049】
また、符号付き固定ビット深度化変換部120及び符号付き固定ビット深度参照画像バッファ109以外の構成要素に関しても、符号付き固定ビット深度の処理対象画像を扱うように演算処理等が修正されている。
【0050】
さらに、特許文献1の映像符号化装置との違いは、上述したように符号付き固定ビット深度化変換部120以外の各構成要素が、従来技術の映像符号化方式と互換な符号化ストリームを出力することも可能な、互換動作モードを備えることである。
【0051】
互換動作モードでは、各処理部の演算結果を対象画像のビット深度に応じたビット精度に丸める処理、切り捨てる処理等が標準で規定されている箇所では、符号付き固定ビット深度の画素値表現のまま、ビットマスク処理等によって標準方式の処理を模倣する処理を行う。
【0052】
(A-1-3)映像復号装置20の詳細な構成
図2は、実施形態に係る映像復号装置20の構成を示す構成図である。
図2において、映像復号装置20は、エントロピー復号部204、逆量子化部205、逆変換部206、加算部207、ループ内フィルタ部208、符号付き固定ビット深度参照画像バッファ209、インター予測部210、イントラ予測部211、切り替え部212、符号付き復号画像ビット深度変換部220を有する。
【0053】
図2の映像復号装置20は、符号付き復号画像ビット深度変換部220以外の各構成要素が、特許文献1と同様な符号付き固定ビット深度映像表現を想定した処理を行う動作モード(拡張動作モード)を備えることに加えて、内部的な映像表現が標準符号化方式と互換な動作モード(互換動作モード)も備える。
【0054】
映像復号装置20は、
図2に示す各構成部を搭載した専用のICチップ等のハードウェアとして構成しても良いし、又は、CPUと、CPUが実行するプログラムを中心としてソフトウェア的に構成して良いが、機能的には、
図2で表すことができる。
【0055】
映像復号装置20は、入力された符号化ストリームを復号して、復号映像を出力する。
【0056】
エントロピー復号部204は、入力された符号化ストリームをエントロピー復号して、変換係数や符号化モード情報、予測モード情報、動きベクトル情報、ビット深度パラメーター等を取得するものである。
【0057】
逆量子化部205は、エントロピー復号部204からの変換係数を逆量子化するものである。
【0058】
逆変換部206は、逆量子化部205により逆量子化された信号を逆変換して残差信号(残差画像)を復元して、加算部207に与える。
【0059】
インター予測部210は、符号付き固定ビット深度参照画像バッファ209に保持されている画像を参照画像として取得して動き補償予測を行うものである。
【0060】
イントラ予測部211は、加算部207から出力される再構成画像を用いて、画面内の符号付き固定ビット深度の再構成画素等からイントラ予測を行うものである。
【0061】
切り替え部212は、予測画像を切り替えるため、符号化モード(イントラモード又はインターモード)に応じて、インター予測部210又はイントラ予測部211の出力を切り替えるものである。
【0062】
加算部207は、逆変換部206からの復元された残差信号に、切り替え部212を介してインター予測部210若しくはイントラ予測部211からの予測画像(符号付き固定ビット深度の画像)を加算して、符号付き固定ビット深度の再構成画像を生成する。加算部207は、符号付き固定ビット深度の再構成画像を、ループ内フィルタ部208に与える。
【0063】
ループ内フィルタ部208は、符号化ループ内の量子化処理によって生じる符号化歪み(例えばブロック歪、リンギング歪等)を低減するために、加算部207からの符号付き固定ビット深度の再構成画像をフィルタリングするものである。
【0064】
符号付き固定ビット深度参照画像バッファ209は、ループ内フィルタ部208で得られた符号付き固定ビット深度の復号画像を、後続のインター予測のための参照画像として保持するものである。また、当該画像は、復号処理結果として符号付き復号画像ビット深度変換部220で対象画像のビット深度に変換されて出力される。
【0065】
符号付き復号画像ビット深度変換部220は、符号付き固定ビット深度参照画像バッファ209から出力されるループ内フィルタ適用後の符号付き固定ビット深度の復号画像を、エントロピー復号部204から得られるビット深度パラメーターに従って、(符号なしの)対象画像のビット深度の画像に変換して出力するものである。
【0066】
ループ内フィルタ部208で得られた符号付き固定ビット深度の復号画像は、後続のインター予測のための参照画像として符号付き固定ビット深度画像のまま、符号付き固定ビット深度参照画像バッファ209に保持され、また、復号処理結果として符号付き復号画像ビット深度変換部220で対象画像のビット深度に変換されて出力される。互換動作モードでは、各処理部の演算結果を対象画像のビット深度に応じたビット精度に丸める処理、切り捨てる処理等が標準で規定されている箇所では、符号付き固定ビット深度の画素値表現のまま、ビットマスク処理等によって標準方式の処理を模倣する処理を行う。
【0067】
従来の映像復号装置(
図12)との違いは、復号処理で得られる符号付き固定ビット深度の復号画像を符号付き固定ビット深度のまま保持する符号付き固定ビット深度参照画像バッファ209を用いることと、符号付き固定ビット深度の復号画像を、エントロピー復号部204から得られるビット深度パラメーターに従って、対象画像のビット深度の画像に変換して出力する符号付き復号画像ビット深度変換部220を設けたことである。
【0068】
また、その他の構成要素に関しても、符号付き固定ビット深度の処理対象画像を扱うように演算処理等が修正されている。
【0069】
さらに、特許文献1の映像復号装置との違いは、上述したように、構成要素各部が、従来技術の映像符号化方式と互換な符号化ストリームを入力として復号処理を行うことが可能な、互換動作モードを備えることである。
【0070】
なお、符号付き復号画像ビット深度変換部220では復号画像の利用環境(出力先ディスプレイ等)によっては、ビット深度パラメーターとして符号化装置側から受け取ったビット深度まで映像のビット深度を小さくすることはせず、出力先の(表示能力等の)要求に応じたビット深度に変換して出力するように構成しても良い。
【0071】
(A-2)実施形態の動作
次に、この実施形態における映像処理システム1の動作(実施形態の映像符号化処理、及び映像復号処理)を説明する。
【0072】
(A-2-1)映像符号化処理、及び映像復号処理の前提説明
以下の説明では、処理対象の映像のビット深度を表すビット深度パラメーターを「B」と表記する。なお、輝度成分と色差成分でビット深度が異なるような対象画像も処理対象とすることが可能であり、その場合、パラメーターBは色成分ごとに保持しても良い。また、以下の説明では、簡略化のために単にBと記載するが、Bは処理対象となっているそれぞれの色成分に対応するビット深度パラメーターを表しているものとする。パラメーターBは、例えば、SDR映像で8、HDR映像で10といった値で、入力画像と共に与えられる。
【0073】
また、本実施形態で用いる符号付き固定ビット深度画像のビット深度を表す固定値を「W」で表す。これは固定値として、本実施形態の映像符号化方法を用いる映像符号化装置10、映像復号装置20であらかじめ決められた定数値であり、処理対象に応じて変更可能とする値ではない。例えば、16ビット演算器を主に用いる装置構成を想定して、Wを16(又は演算途中の桁あふれを考慮した15)のような定数として固定する。
【0074】
本実施形態では、符号化処理、復号処理を構成する大部分の構成要素において、処理対象画像のビット深度を表すパラメーターBに依存しない演算処理となるように、処理の大部分で画素値を表すデータを符号付きの固定のビット深度Wのデータとして取り扱うように構成する。
【0075】
まず、
図1に示すように、映像符号化装置10では、符号付き固定ビット深度化変換部120において、パラメーターBとともに与えられるビット深度Bの入力映像を、符号付きの固定ビット深度Wの画像に変換する。以降の符号化処理はパラメーターBには依存しない処理となるよう構成する。ただし、互換動作モードではパラメーターBに依存する演算も使用する場合もある。
【0076】
図4は、実施形態に係る符号付き固定ビット深度化変換部120の構成の一例を示す図である。
【0077】
符号付き固定ビット深度化変換部120は、入力されるビット深度Bの(符号なしの)画素値をもつ画像を、画素ごとに、符号付き固定ビット深度Wの画素値に変換する。
【0078】
スケール部501は、符号なしBビットのデータを、符号なしWビットの数値に変換する。例えば、単純に入力画素値を(W-B)ビット左シフトする。これによって、0~2B-1の入力画素値は0~2W-1の値をもつ符号なしWビットのデータとなる。次に、減算部502は、スケールされたデータから2W-1を減算する。これによって、-2W-1~2W-1-1の値をもつ符号付きWビットのデータとなる。
【0079】
なお、符号付き固定ビット深度化変換処理は、
図4のような構成に限定されず、2
B-1を減算したのちに(W-B)ビット左シフトするような構成としたり、これらの値以外のシフトや減算を行ったり、あるいは、スケール処理を2のべき乗とは限らない数値の乗算としたりしても良い。また、ここでの変換に用いたパラメーターを、ビット深度パラメーターBと合わせて、エントロピー符号化部104で符号化ストリームに多重化して、復号装置側にシグナリングするようにしても良い。
【0080】
さらに、互換動作モード時においても、内部的には符号付き固定ビット深度Wの画素値として表現することで、コーデック構成要素各部の処理をなるべく共通化するように構成する。このとき、互換動作モード時の処理途中の中間結果画素値(予測画像画素値など)や符号付き固定ビット深度参照画像バッファ109内の画像画素値は、本来Bビット精度の値となる様に標準で規定されているので、実施形態における内部的な画素値表現では、Wビットに満たない(W-B)ビット分の下位ビット部分は「0」で満たされたような画素値表現となる。
【0081】
一方、特許文献1のような符号付き固定ビット深度のコーデックとしての動作モードである拡張動作モードでは、処理途中の中間結果画素値や符号付き固定ビット深度参照画像バッファ内の画素値は最下位ビットまで有効な値を持つ高精度な画素値表現なままで処理を行う。
【0082】
いずれにしても、ここでは、入力される画素値の取りうる範囲が、符号付きWビットで表現可能な数値の範囲の大部分の範囲にわたって写像されるような変換を行う。復号装置側の符号付き復号画像ビット深度変換部220では、ここで行われた変換処理の逆変換処理を行うことになる。
図10は、実施形態に係る符号付き固定ビット深度への変換、対象ビット深度への変換の様子(各画像における画素値の取りうる範囲)を示している。
【0083】
以下の説明では、入力映像や出力映像のような、(符号なし)Bビットで表現された画像(画素値)を、「(符号なし)Bビット領域の画像(画素値)」、符号付き固定ビット深度化変換後の符号化対象画像や、再構成画像、参照画像バッファ内の画像、予測画像など、符号付きWビットで表現された画像(画素値)を、「符号付きWビット領域の画像(画素値)」のように呼ぶ場合もある。
【0084】
この実施形態の符号付き固定ビット深度参照画像バッファ109(符号付き固定ビット深度参照画像バッファ209)では、符号付きWビット領域の参照画像が保持されている。また、加算部107(加算部207)で生成される再構成画素も符号付きWビット領域の画素である。イントラ予測部111(イントラ予測部211)、インター予測部110(インター予測部210)では、これら符号付きWビット領域の画素値を参照して予測処理を行い、符号付きWビット領域で表現された予測画像を生成する。
【0085】
そして、互換動作モード時においては、これら符号付きWビット領域の画素値は、下位ビット部分を「0」とするようなビットマスク操作によって、従来の符号化方式ではシフト演算等によって下位ビットの情報が失われる処理を模倣する処理を符号付きWビット領域のまま行う。
【0086】
(A-2-2)映像符号化処理
映像符号化装置10では、(符号なし)Bビット領域の入力画像が入力されると、符号付き固定ビット深度化変換部120で、符号付きWビット領域に変換した符号化対象画像を求める。
【0087】
符号付きWビット領域の画像に変換された符号化対象画像を、従来技術の映像符号化装置と同様に、符号化ユニット等の処理単位領域ごとに処理を行う。
【0088】
それぞれの処理単位領域に対して、符号付き固定ビット深度参照画像バッファ109を参照して動き補償を伴うインター予測を行うインター予測部110、もしくは、画面内の符号化済の符号付きWビット領域の再構成画素等から予測を行うイントラ予測部111を用いて、符号付きWビット領域の予測画像を生成する。選択した符号化モードに応じて切り替え部112で選択された予測画像と、符号付きWビット領域に変換された符号化対象画像との差分である予測残差を差分処理部101で求める。
【0089】
予測残差は、DCT(離散コサイン変換)やDST(離散サイン変換)によって変換部102で変換し、得られた変換係数を量子化部103で量子化する。量子化された変換係数と、符号化モード情報、予測モード情報、動きベクトル情報、ビット深度パラメーター等をエントロピー符号化部104でエントロピー符号化、多重化して符号化ストリームとして出力する。
【0090】
一方、量子化された変換係数は、逆量子化部105と逆変換部106で逆量子化・逆変換処理を行い、残差信号を復元する。復元された残差信号に符号付きWビット領域の予測画像を、加算部107で加算して、符号付き固定ビット深度の再構成画像を求める。
【0091】
得られた符号付きWビット領域の再構成画像は、ループ内フィルタ部108でループ内フィルタ処理を適用して、符号付き固定ビット深度の復号画像を求め、後続の画像の符号化時のインター予測の動き補償のための参照画像として、符号付きWビット領域の画像のまま、符号付き固定ビット深度参照画像バッファ109に保持する。
【0092】
そして、互換動作モード時においては、後述するように、構成要素各部において標準符号化方式でのBビット精度へのビットマスク処理等の追加の処理が行われる。
【0093】
なお、符号化装置においては、通常、利用可能な符号化モード、予測モード、動きベクトルなど複数の候補から最適な符号化方法を選択する処理が行われるため、そのそれぞれについて予測画像を生成してみるような処理が行われる。
【0094】
以上の処理によって、エントロピー符号化部104から得られた符号化ストリームを、符号化処理結果として出力する。
【0095】
(A-2-3)映像復号処理
映像復号装置20では、まず、入力された符号化ストリームを、エントロピー復号部204でエントロピー復号して、量子化された変換係数や符号化モード情報、予測モード情報、動きベクトル情報、ビット深度パラメーター等を取得する。得られた量子化された変換係数は、逆量子化部205と逆変換部206で逆量子化・逆変換して、復元された残差信号を求める。
【0096】
一方、予測モード情報や動きベクトル情報から、符号付き固定ビット深度参照画像バッファ209を参照して動き補償予測を行うインター予測部210、もしくは、画面内の符号付き固定ビット深度の再構成画素等から予測を行うイントラ予測部211を用いて、符号付きWビット領域の予測画像を生成し、符号化モード情報にしたがって切り替え部212で選択された符号付きWビット領域の予測画像に、逆量子化・逆変換で得られた復元された残差信号を加算部207で加算して、符号付き固定ビット深度の再構成画像を生成する。
【0097】
符号付きWビット領域の再構成画像に対して、ループ内フィルタ部208でループ内フィルタ処理を適用して、符号付き固定ビット深度の復号画像を求める。ループ内フィルタ部208で得られた符号付きWビット領域の復号画像は、後続の画像のインター予測のための参照画像として、符号付きWビット領域の画像のまま、符号付き固定ビット深度参照画像バッファ209に保持される。
【0098】
そして、互換動作モード時においては、後述するように、構成要素各部において標準符号化方式でのBビット精度へのビットマスク処理等の追加の処理が行われる。
【0099】
また、符号付き復号画像ビット深度変換部220では、ループ内フィルタ部208で得られた符号付き固定ビット深度の復号画像を、エントロピー復号部204から得られるビット深度パラメーターに従って(符号なしの)対象画像のビット深度の画像に変換して復号処理結果として出力する。
【0100】
図5は、実施形態に係る符号付き復号画像ビット深度変換部220の構成の一例を示す図である。
【0101】
ループ内フィルタ部208で得られた符号付き固定ビット深度の復号画像は、参照画像として、あるいは、出力順の並べ替えのために、符号付き固定ビット深度参照画像バッファ209に符号付きWビット領域の画像として保持されている。この、符号付きWビット領域の画素値をもつ画像を、画素ごとに、エントロピー復号部204から得られるビット深度パラメーターBに従って(符号なしの)対象画像のビット深度の画素値に変換する。
【0102】
加算部602では、-2W-1~2W-1-1の値をもつ符号付きWビットのデータに2W-1を加算して、0~2W-1の値をもつ符号なしWビットのデータを得る。次に、逆スケール部601では符号なしWビットのデータを符号なしBビットの画素値に変換する。例えば、単純に(W-B)ビット右シフトする。これによって、0~2B-1の画素値となる。
【0103】
なお、復号画像ビット深度変換部の処理は、
図5のような構成に限定されず、符号付きWビット領域のデータを(W-B)ビット符号付き右シフトしたのちに2
B-1を加算するような構成としたり、これらの値以外のシフトや加算を行ったり、丸め処理を行ったり、あるいは、符号化装置側でスケール処理に2のべき乗とは限らない数値の乗算を用いたような場合は、スケール係数の逆数に相当する数の乗算等(逆数倍に相当するような乗算とシフト演算など)を行うようにしても良い。
【0104】
また、ここでの変換に用いるパラメーターは、ビット深度パラメーターBとともにエントロピー復号部204で符号化ストリームから得るようにしても良い。また例えば、出力先のディスプレイ装置等がビット深度Bより大きな「ビット深度B’」の表示能力を持つなど、ビット深度パラメーターBとは異なる「ビット深度パラメーターB’」に基づくビット深度の変換処理を行って出力するような構成としても良い。
【0105】
以上の処理によって、符号付き復号画像ビット深度変換部220で得られた対象画像のビット深度で表現された復号映像を、復号処理結果として出力する。
【0106】
(A-2-4)従来技術との差異
次に、本実施形態の映像符号化装置10、映像復号装置20の各部における動作について、従来技術である既存映像符号化標準コーデックや、特許文献1のような映像符号化技術との違いを中心に説明する。
【0107】
なお、互換動作モード時の対象とする標準符号化方式は、VVC第1版を対象とする例で記載するが、その他の符号化標準を互換動作モードの対象としても同様に構成することが可能である。
【0108】
(A-2-4-1)インター予測処理
インター予測処理における、予測単位領域への分割方法や動きベクトルの表現、動きベクトルの予測などは、従来技術のVVC等と同様な方法など、様々な方法を用いることができる。ここでは、参照画像から整数精度とは限らない動きベクトル位置の予測画像を、補間フィルタ処理を用いて生成する処理について説明する。
【0109】
図6は、VVCにおける輝度画像の予測に使われる補間フィルタのフィルタ係数の一例である。VVCでは予測モードや解像度変換の有無によって
図6の他にも複数種類のフィルタ係数セットがある。VVCでは1/16画素精度までの画素位置精度の動きベクトルを用いており、整数画素位置からの1/16画素精度のずれに応じて、8タップの補間フィルタを用いて水平方向のフィルタ処理、垂直方向のフィルタ処理を行って補間画像が生成される。また、色差成分に関しては1/32画素精度の4タップの補間フィルタが用いられるなどさまざまなフィルタが用いられるが、詳細の説明は省略する。
【0110】
図7は、VVCにおける補間画像生成処理の構成を示す図である。VVCにおける参照画像バッファに保持されている参照画像は、処理対象画像のビット深度Bと同じ、符号なしBビット領域画像である。また、予測画像として生成する画像のビット深度も同じく符号なしBビット領域の画像である。VVCでは、水平方向のフィルタ処理を施した中間結果をBビットよりもビット深度の大きなW’ビット領域の画像として生成し、中間結果のW’ビット領域の画像に対して垂直フィルタ処理を施した結果を符号なしBビット領域の画像として生成するように規定されている。また、双方向予測のように複数の補間画像を加重平均して予測画像を生成するような場合は、補間結果画像をW’ビット領域の画像として出力して加重平均ののち、符号なしBビット領域の画像に変換して予測画像を生成するなどしている。水平方向フィルタでは、水平方向に隣り合う8画素を参照してフィルタ係数を乗算して加算し、得られた結果をW’ビット精度の値となるように、ビット深度パラメーターBに依存したシフト演算を行う。水平方向が整数位置である場合は、フィルタ演算は行わず、参照位置の符号なしBビットの画素をW’ビット領域の画素に変換するための、ビット深度パラメーターBに依存したシフト演算を行う。VVCの参照ソフトであるVTMでは、中間結果のW’ビット領域の画像を、符号付きW’ビット領域の画像として表すための減算処理なども行われる。続く垂直方向のフィルタ処理では、W’ビット領域の画像として求められている中間結果の画素の垂直方向に隣り合う8画素を参照してフィルタ係数を乗算して加算し、得られた結果を符号なしBビット精度の画素値となるように、ビット深度パラメーターBに依存したシフト演算を行う。垂直方向が整数位置である場合は、フィルタ演算は行わず、参照位置のW’ビット領域の中間結果画素を符号なしBビットの画素に変換するための、ビット深度パラメーターBに依存したシフト演算を行う。
【0111】
図7では詳細な記載を省略しているが、双方向予測の場合など、垂直フィルタも施した補間処理結果を、さらに加重平均するなどして予測画像を生成するときは、補間結果画像をW’ビット領域の画像として出力する場合もあり、この場合は、符号なしBビットの補間処理結果を出力する場合とは別の変換処理(ビット深度パラメーターBに依存したシフト演算)を行う。VTMのように、中間結果のW’ビット領域の画像を符号付きW’ビット領域の画像として表していた場合は、符号なしBビット領域の予測画像とするための加算処理なども行われる。なお、VVC第1版では、W’=max(14,B+4)ビット相当を想定した規定となっている(つまり、中間結果のビット精度もBに依存するような規定となっている)。
【0112】
以上のように、従来技術の補間画像生成処理では、符号なしBビット領域の参照画像から、符号なしBビット領域の予測画像を生成するようにしていたため、フィルタ処理途中の演算精度を確保するために、ビット深度パラメーターBに依存したシフト演算を多用して処理が行われていた。また、中間結果を符号付きW’ビット領域の画像とするための減算処理や加算処理も行われていた。
【0113】
これに対して、特許文献1のインター予測処理における補間画像の生成処理は、
図8に示すように構成している。特許文献1の補間画像生成処理では、符号付き固定ビット深度参照画像バッファに保持された符号付きWビット領域の参照画像を参照して補間処理を行い、補間処理結果も符号付きWビット領域の画像として出力する。このため、ビット深度パラメーターBに依存するような演算処理は行う必要がない。水平方向フィルタでは、符号付きWビット領域の参照画像の水平方向に隣り合う複数の画素を参照してフィルタ係数を乗算して加算し、得られた結果を符号付きWビット領域の値となるように、フィルタ係数のビット精度分だけシフトする固定のシフト演算を行う。水平方向が整数位置である場合は、フィルタ演算は行わず参照位置の画素値がそのまま中間結果の画素値となる。続く垂直方向のフィルタ処理では、符号付きWビット領域の画像として求められている中間結果の画素の垂直方向に隣り合う複数の画素を参照してフィルタ係数を乗算して加算し、得られた結果をフィルタ係数のビット精度分だけシフトする固定のシフト演算を行う。垂直方向が整数位置である場合は、フィルタ演算は行わず参照位置の符号付きWビット領域の中間結果画素をそのまま補間処理結果として出力する。参照画像、中間結果、補間処理結果とも符号付きW領域の画像であるため、符号なし画像との変換のための減算や加算は不要である。ここで用いられるシフト演算は、フィルタ係数の固定のビット精度に応じたシフト演算であり、ビット深度パラメーターBには依存せず、固定ビット分のシフト演算である。例えば、
図6のようなVVCの補間フィルタ係数は、6ビット相当のビット精度であるとみなされる。フィルタ係数やフィルタのタップ数、フィルタのビット精度はVVCのような6ビット精度8タップフィルタに限定されず、ビット精度が固定されていれば、より大きなビット精度や、よりタップ数の大きなフィルタ、さらにはフィルタ係数自体も符号化装置側で対象映像に応じて自由に設計したフィルタ係数をシグナリングできるように構成しても良い。以上の処理によって求められた、符号付きWビット領域の補間処理結果は、そのまま予測画像として利用したり、あるいは、双方向予測のように複数の補間画像を加重平均して予測画像を生成する場合は、これら符号付きWビット領域の補間結果画像を加重平均するなどして符号付きWビット領域の予測画像を生成したりすることでインター予測処理を行なっている。
【0114】
本実施形態のインター予測処理では、特許文献1のような高精度なインター予測画像を生成可能な拡張動作モードに加えて、標準のインター予測処理と互換なBビット精度相当のインター予測画像を符号付きWビット領域の画像として生成する互換動作モードを備える。
【0115】
本実施形態のインター予測処理における補間画像の生成処理は、
図9に示すように構成する。本実施形態の補間画像生成処理では、符号付き固定ビット深度参照画像バッファに保持された符号付きWビット領域の参照画像を参照して補間処理を行い、補間処理結果も符号付きWビット領域の画像として出力する。特許文献1と同様な拡張動作モードでは、ビット深度パラメーターBに依存するような演算処理は行う必要はない。一方、従来の符号化方式と互換な互換動作モードでは、従来の方式でBビット領域の画素値にシフト演算等で精度を落とすように規定されている処理を、符号付きWビット領域で模倣するためのビットマスク処理が追加される。
【0116】
水平方向フィルタでは、符号付きWビット領域の参照画像の水平方向に隣り合う複数の画素を参照してフィルタ係数を乗算して加算し、得られた結果を符号付きWビット領域の値となるように、フィルタ係数のビット精度に相当するビット数分だけシフトする固定のシフト演算を行う。水平方向が整数位置である場合は、フィルタ演算は行わず参照位置の画素値がそのまま中間結果の画素値となる。拡張動作モードではこれをそのまま水平方向フィルタ処理後の中間結果とするが、互換動作モードでは更に、符号付きWビット領域で求められている中間結果を、W’ビット領域の中間結果相当の値とするためのビットマスク処理を施してこれを中間結果とする。つまり、符号付きWビット領域の中間結果の下位(W-W’)ビットを「0」とするようなビットマスク処理を行う。
【0117】
なお、互換動作モードの対象となる符号化方式がVVC(HEVCも同様)の場合は、符号化対象画像のビット深度Bを10ビット以下に限定して、W=W’=14ビットとなるように構成することによって、符号付きWビット領域の画素値から、W’ビット精度相当の画素値へ、精度を落とすためのマスク演算を不要とすることも出来る。
【0118】
また、より大きなビット深度Bの対象画像も処理対象とするために、中間結果に関してはW”>Wであるような符号付きW”ビット領域の画素値を求めるように構成し、互換動作モードでは符号付きW”領域の画素値をW’ビット精度相当にビットマスクするように構成しても良い。ビットマスク処理は、例えば汎用のCPUなどを用いる場合は、上位ビットが全て「1」で、「0」にすべき下位ビット部分が「0」であるような、対象画像のビット深度Bに依存するあらかじめ算出しておいたマスク値とのビット後との論理積演算で実現できる。
【0119】
続く垂直方向のフィルタ処理では、符号付きWビット領域(あるいはW”ビット領域)の画像として求められている中間結果の画素の垂直方向に隣り合う複数の画素を参照してフィルタ係数を乗算して加算し、得られた結果をフィルタ係数のビット精度に相当するビット数分だけシフトする固定のシフト演算を行う。垂直方向が整数位置である場合は、フィルタ演算は行わず参照位置の符号付きWビット領域の中間結果画素をそのまま補間処理結果として出力する(W”>WであるW”ビット領域の中間結果を用いる場合は一部固定のシフト演算を伴う)。
【0120】
拡張動作モードでは、符号付きWビット領域の画素値として求められた補間処理結果をそのまま用いるが、互換動作モードでは更に、符号付きWビット領域で求められている補間処理結果を、Bビット精度相当の値とするためのビットマスク処理を施してこれを補間処理結果とする。つまり、符号付きWビット領域の中間結果の下位(W-B)ビットを「0」とするようなビットマスク処理を行う。この時、切り捨てられる下位ビット部分に対する丸め処理が規定されている場合は、丸め処理のためのオフセット値相当の値(2W-B-1)を加算したのちにビットマスク処理を行う。なお、双方向予測の場合など、垂直フィルタも施した補間処理結果を、さらに加重平均するなどして予測画像を生成するときは、補間処理結果画像をW’ビット領域の画像として出力するよう規定されている場合もあり、この場合の互換動作モードでは、符号なしBビットの補間処理結果を出力する場合とは別に、前記水平フィルタ後のマスク処理と同等の処理によって、W’ビット精度相当の画素値として補間処理結果を出力する。
【0121】
以上のように、参照画像、中間結果、補間処理結果とも符号付きW領域の画像であるため、符号なし画像との変換のための減算や加算は不要である。(中間結果をW”>WであるW”ビット領域で求める場合はW領域への固定のシフト演算を用いる場合もある)。ここで用いられるシフト演算は、フィルタ係数の固定のビット精度に応じたシフト演算であり、ビット深度パラメーターBには依存せず、固定ビット数分のシフト演算である。例えば、
図6のようなVVCの補間フィルタ係数は、6ビット相当のビット精度であるとみなされる。フィルタ係数やフィルタのタップ数、フィルタのビット精度はVVCのような6ビット精度8タップフィルタに限定されず、ビット精度が固定されていれば、より大きなビット精度や、よりタップ数の大きなフィルタ、さらにはフィルタ係数自体も符号化装置側で対象映像に応じて自由に設計したフィルタ係数をシグナリングできるように構成しても良い。
【0122】
以上の処理によって求められた、符号付きWビット領域の補間処理結果は、そのまま予測画像として利用したり、あるいは、双方向予測のように複数の補間画像を加重平均して予測画像を生成する場合は、これら符号付きWビット領域の補間結果画像を加重平均するなどして符号付きWビット領域の予測画像を生成したりすることでインター予測処理を行う。
【0123】
(A-2-4-2)イントラ予測処理
イントラ予測処理における、予測単位領域への分割方法や予測モードなどは、従来技術のVVC等と同様な方法など、様々な方法を用いることができる。ここでは、イントラ予測処理が参照する再構成画像と、生成されるイントラ予測画像における違いについて説明する。
【0124】
VVC第1版等の従来技術の映像符号化技術では、イントラ予測の参照画素に用いる画面内の再構成画像は符号なしBビット深度の画像として参照される。また、イントラ予測画像も符号なしBビット深度の画像として生成されている。
【0125】
これに対して、特許文献1や本実施形態のイントラ予測処理では、符号付きWビット領域の画像として再構成画像を生成しているので、イントラ予測処理に用いる参照画素は符号付きWビット領域の画素である。イントラ予測処理では処理対象の領域に隣接する参照画素から、例えば、方向性の予測を行うような場合には複数の参照画素を補間処理するなどして予測用の画素値を求めている。特許文献1や本実施形態の拡張動作モードにおけるイントラ予測処理では、このような処理をすべて符号付きWビット領域で高精度に行うことが可能となる。得られる符号付きWビット領域の予測画素値を、Bビット精度にビット深度を落とすことなく、予測画素値として利用することができる。
【0126】
本実施形態の互換動作モードでは、イントラ予測処理が参照する画面内の処理対象領域に隣接する参照画素は符号付きWビット領域ではあるが、Bビット精度相当の上位ビット部分以外の下位ビット部分は0となるようビットマスクされた状態の再構成画素が算出されている。互換動作モードでも拡張動作モードと同様にこれら符号付きWビット領域の参照画素を参照して予測処理を行うが、前記インター予測処理でも説明したように、得られた符号付きWビット領域の予測画像は、Bビット精度相当にビットマスクした物をイントラ予測処理結果とする。また、参照画素の補間処理等においてもBビット精度への(四捨五入に相当するような)丸め処理などが規定されている部分の中間結果は、拡張動作モードでは丸め処理なし(下位ビットまで有効なビットのまま)で予測画像生成処理を行うが、互換動作モードでは、Bビット精度への丸め処理に相当する処理を、符号付きWビット領域で行うために、丸め処理に相当するオフセット値の加算ののちに下位ビットを「0」にするようなビットマスク処理を行う。なお、VVCにおけるスライス境界などでは、同じスライス領域内以外の画素を参照しないよう、このような画素の画素値を参照可能であった画素の画素値で置き換える処理が行われ、このような置き換え可能な画素もない場合には、参照画素の画素値を2B-1とみなすような処理が行われる。これに相当する、本発明のインター予測処理における参照しないようにする参照画素の画素値は、0(符号付きWビット領域での中央値)とみなすような処理とするように構成する。
【0127】
以上の処理によって、符号付きWビット領域の再構成画像を参照して、符号付きWビット領域の予測画像を生成することでイントラ予測処理を行う。
【0128】
(A-2-4-3)差分処理
従来技術では、符号化対象画像、予測画像とも符号なしBビット領域の画像として残差信号を算出するため、残差信号は符号付きB+1ビットの数値となる。
【0129】
これに対して、本発明の符号化装置の差分処理では、符号付きWビット領域に変換された符号化対象画像と、符号付きWビット領域の画像として生成された予測画像との残差新語を求めるため、残差信号は符号付きW+1ビットの数値となる。
【0130】
VVCでは、イントラ予測画像とインター予測画像を重み付きで合成した画像を予測画像とする様なモードもあり、この場合、切り替え部112、212は単なる切り替え処理ではなく合成処理となる。この様な合成処理もインター予測処理における双方向予測で説明した様に、拡張動作モードでは符号付きWビット領域の高精度な予測画像のまま合成を行うが、互換動作モードでは合成結果である予測画像をBビット精度相当とするための(丸め処理を伴う)ビットマスク処理を追加で行う。
【0131】
(A-2-4-4)変換・量子化処理
変換・量子化処理における、変換単位領域への分割方法や、変換に用いるDCTやDSTといった変換関数、変換関数の選択処理などは、従来技術のVVC等と同様に複数種類のDCTやDSTから選択可能としたり、変換結果にさらに別の変換を施したりするなど、様々な方法を用いることができる。
【0132】
変換処理では、従来技術では残差信号が符号付きB+1ビットの数値であるのに対して、本実施形態では、残差信号が符号付きW+1ビットの数値となることを想定した変換処理とする。ただし、従来技術ではビット深度パラメーターBが変数であることを想定した処理が必要となる場合があるのに対して、本発明の変換処理では、Wは固定値とするためこのような処理は不要である。量子化処理についても、従来技術では、ビット深度パラメーターBに依存して、量子化処理で用いられる量子化パラメーターを導出する処理が必要であったが、ビット深度パラメーターBに依存しない導出方法とすることも可能である。
【0133】
(A-2-4-5)エントロピー符号化・エントロピー復号
エントロピー符号化、エントロピー復号処理も、従来技術のVVC等と同様に可変長符号や算術符号を用いるなど、様々な方法を用いることができる。
【0134】
対象画像のビット深度を表すビット深度パラメーターも、色成分ごとに異なるビット深度を持つことができる可能性も含めて、従来技術と同様に、符号化ストリームの上位シンタックスに多重化して符号化することができる。さらに、単純なシフト演算と減算のみで符号付き固定ビット深度化変換部を構成する以外に、2のべき乗以外を含む数値の乗算を用いる逆スケール処理を行うなど、逆変換で用いる変換パラメーターを符号化ストリームに多重化するように構成しても良い。さらに、線形変換だけでなく非線形な変換関数も表現できるようなパラメーターを符号化ストリームに多重化できるように構成しても良い。
【0135】
なお、従来技術でも用いられている、対象画像の画素値を変換量子化せずに伝送するPCMモードのような符号化モードを用いる場合は、この部分についてのみビット深度パラメーターBに依存するようなビット数の、あるいは、VVCのように、PCMモード用に別途明示的にシグナリングしたビット数の符号語を割り当てるようにエントロピー符号化処理、復号処理を構成する。
【0136】
拡張動作モードは以上のように様々な符号化ストリームを処理するように構成しても良いが、互換動作モードでは、既存映像符号化標準に準拠する符号化ストリームを出力可能なように本実施形態の映像符号化装置10を構成し、既存映像符号化標準に準拠する符号化ストリームを入力として標準準拠の復号結果映像を出力可能とするように本実施形態の映像復号装置20を構成する。
【0137】
(A-2-4-6)逆量子化・逆変換処理
逆量子化・逆変換処理においても、変換・量子化処理に対応する形で、従来技術のVVC等と同様な方法など、様々な方法を用いることができる。
【0138】
逆量子化処理で用いられる量子化パラメーターの導出方法も、量子化処理と同様、ビット深度パラメーターBに依存しない導出方法とすることも可能である。
【0139】
逆変換処理の処理結果である復元された残差信号については、従来技術では、符号付きB+1ビット程度の数値として残差信号を復元するのに対して、本発明では、符号付きW+1ビット程度の数値として残差信号を復元する。ビット深度パラメーターBに依存する処理は行わない。
【0140】
なお、符号付きW+1ビット程度と記載したのは、復元される残差信号には量子化誤差が含まれるため、必ずしも符号付きW+1ビットの範囲に収まる数値が算出されるわけではないことによる。逆変換処理の演算過程で符号付きW+1ビットの範囲に収まるようにクリッピング処理を行うように構成しても良い。
【0141】
互換動作モードでの逆量子化処理では、既存映像符号化標準では残差信号をBビット領域の値である符号付きB+1ビット程度の数値(Bビット領域の予測画像画素値と直接加算可能な値)として求めるよう規定されているため、拡張動作モードと同様に符号付きW+1ビット程度の数値として求めた符号付きWビット領域の残差信号から、下位ビットを(丸め処理を伴う)ビットマスク処理することによって、符号付きWビット領域の数値のまま、Bビット領域よりも高精度にもとまっている符号付きW領域の残差信号を標準の動作と同じ意味となるように処理を行う。
【0142】
(A-2-4-7)加算処理
従来技術では、符号付きB+1ビット程度の数値として復元された残差信号と、符号なしBビット領域の画像として生成された予測画像とを加算して、符号なしBビットの数値範囲(0~2B-1)にクリッピングすることで再構成画像を生成していた。
【0143】
これに対して、本発明の加算処理による再構成画像の生成処理では、符号付きW+1ビット程度の数値として復元された残差信号と、符号付きWビット領域の画像として生成された予測画像とを加算して、符号付きWビットの数値範囲(-2W-1~2W-1-1)にクリッピングすることで、符号付きWビット領域の再構成画像を生成する。クリッピング処理は、ビット深度パラメーターBに非依存な処理とできるほか、クリッピング処理を含む飽和演算が可能な演算器を用いる場合は、これを有効活用することもできる。
【0144】
クリッピング処理は、ほかにもインター予測処理のフィルタ処理やイントラ予測処理の参照画素のフィルタ処理など、画素値領域での演算処理の随所で用いられるが、これらもすべてビット深度パラメーターBに非依存な処理とすることが可能である。
【0145】
なお、VVCでは対象画像の画素値が取りうる範囲(画素値の最小値・最大値)をシグナリングできるようにしており、クリッピング処理をこの範囲へのクリッピング処理とする場合は、符号化ストリームでシグナリングする画素値の範囲の表現は、Bビット領域の値で表現するが、これを符号付きWビット領域の数値に、符号付き固定ビット深度化変換部と同様な変換処理によって変換した符号付きWビット領域での画素値の範囲(符号付きWビット領域での画素値の最小値・最大値)をもちいてクリッピング処理を行うように構成しても良い。
【0146】
なお、互換動作モードにおける加算処理の入力は、ビットマスク処理済みの予測画像とビットマスク処理済みの残差信号とするように記載したが、どちらか一方のみをビットマスク処理済みの値として、加算処理結果をビットマスク処理するような構成としても良い。この場合、ビットマスク処理されていない方の入力値は下位ビット部分も有効な値を持つ事になるが、他方のビットマスク処理された入力値の下位ビットは0である事から、下位ビット分からの桁上がりは発生せず、加算後にビットマスク処理する構成としても同じ値を求めることが可能である。
【0147】
(A-2-4-8)ループ内フィルタ処理
ループ内フィルタ処理も、従来技術のVVC等と同様な、デブロッキングフィルタやサンプル適応オフセット(SAO)、適応ループフィルタ(ALF)など、様々な方法を用いることができる。
【0148】
従来技術のループ内フィルタ処理は、入力される再構成画像、出力されるフィルタ処理後の復号画像とも符号なしBビット領域の画像であるのに対して、本実施形態のループ内フィルタ処理では、符号付きWビット領域の再構成画像を入力してフィルタ処理を行い、符号付きWビット領域のフィルタ処理後の復号画像を生成する。
【0149】
入出力のビット深度、符号の有無のほか、例えば、デブロッキングフィルタでは、量子化パラメーターに依存して、フィルタ処理の適用・非適用を判断する閾値やフィルタによる補正値の取りうる範囲となる閾値を求めるような処理があるが、ここで求める閾値等も、符号付きWビット領域の数値として閾値を導出する。また、例えば、SAO等では、画素値の領域でのオフセット値を符号化するため、この部分に関しては、ビット深度パラメーターBに依存するような精度のオフセット値をシグナリングするようにして、これを符号付きWビット領域のオフセット値に変換して使用するようにしても良い。
【0150】
なお、フィルタ処理後にクリッピング処理が必要な場合は、加算処理で説明したようなクリッピング処理を行う。
【0151】
互換動作モードでは、さらにフィルタ処理結果として求めた符号付きWビット領域の画素値を、符号付きWビット領域のままBビット精度相当の値に丸める処理としてオフセット値の加算やビットマスク処理を行う。これらの互換動作モードでの追加の処理はインター予測処理の説明等で詳細に説明したのと同様である。互換動作モードにおいてもフィルタ処理結果は符号付きWビット領域の画素値として算出処理を行い、符号付き固定ビット深度参照画像バッファ209に保持したり、符号付き復号画像ビット深度変換部220を介して映像復号装置20の処理結果として出力したりするように構成する。
【0152】
以上のように、本実施形態の映像符号化装置10、映像復号装置20の各構成要素においては、画素値に関する処理は、基本的に符号付きWビット領域の画素値を想定した処理を行い、PCMモードのような符号化ストリームにWビットの情報を多重化する無駄を回避するためなど、一部の処理でBビット領域の画素値を用いるが、演算処理を行うに当たっては、符号付きWビット領域に変換して用いるように構成する。
【0153】
さらに、互換動作モードでは、互換動作モードが模倣する標準符号化方式の符号化・復号処理の過程において、高精度で求めた中間結果等をBビット領域の値とするためのビットシフト処理(切り捨て処理)や、オフセット加算を伴うビットシフト処理(丸め処理)によって下位ビットの情報が失われる様に標準で規定されている処理部分に対応する処理を、符号付きWビット領域の値のまま、ビットマスク処理やオフセット加算を伴うビットマスク処理で模倣する事によって、従来の標準符号化方式の符号化装置、復号装置としても動作可能とするように構成する。
【0154】
なお、上記説明では、特許文献1と同等な高精度な符号化方式である拡張動作モードと、従来の標準符号化方式である互換動作モードの両方を備える映像符号化装置10、映像復号装置20として説明したが、拡張動作モードのみに関わる構成要素や処理を省略して、互換動作モード相当の動作のみが可能な映像符号化装置10、映像復号装置20として構成しても良い。この場合の従来技術の映像符号化装置、映像復号装置との違いは、入出力時にのみBビット領域の画像として表現されているが、内部的には基本的に符号付きWビット領域の画素値を処理対象とするように構成されており、参照画像バッファにも符号付きWビット領域の画像として保持している事である。Bビット精度相当の演算結果とするためのビットマスク処理が行われるため、特許文献1ほど内部処理からビット深度B依存の演算を排除できているわけでは無いが、ビットB依存の演算の一部が固定ビット数のビット演算となるなど、処理を軽量化することが可能である。
【0155】
(A-3)実施形態の効果
以上のように、この実施形態によれば、以下のような効果が得られる。
【0156】
この実施形態の映像処理システム1(映像符号化装置10,映像復号装置20)では、映像符号化技術の符号化処理、復号処理の大半の部分において、処理対象映像のビット深度に依存する処理を排除でき処理の軽量化、実装の簡素化が図れる。また、内部で利用する演算器のビット幅を最大限に利用する演算を行うので、対象画像のビット深度に合わせる演算によるノイズ成分の発生を低減することができ、符号化効率を向上させることができる。
【0157】
特に、符号化処理、復号処理で最も大量の演算処理が必要となるインター予測処理において、ビット深度パラメーターBに依存するような演算処理を排除することができる。
【0158】
対象画像のビット深度への丸め処理は、Bビット深度の画素値の最下位桁への切り上げ/切る捨てがほぼランダムに起こるため、画素値として知覚可能なランダムなノイズを発生させていることに相当する。これが、参照画像や参照画素として繰り返し丸めながら利用されるため、さらにノイズは大きなものとなる。本発明では、最終的な復号結果としての出力時以外の丸め演算は、Bビットよりも深い、Wビットの最下位桁に向けて行われるので、
このようなノイズの振幅は非常に小さなものとなり、符号化効率を向上させることが可能となる。互換動作モード時においてはこのような丸めや切り捨て処理による下位ビット情報の欠落とノイズの発生を、ビットマスク処理によってあえて模倣することで、標準の符号化方式に準拠する符号化動作、復号動作を行うことが可能となり、ビットマスク処理以外の大部分の構成要素や処理は拡張動作モードと共通の処理とする事によって、わずかな構成規模の増加で柔軟な符号化処理、復号処理を行うことが可能となる。
【0159】
(B)他の実施形態
本発明は、上述した実施形態に限定されず、以下に例示するような、さまざまな映像符号化処理にも適用可能である。
【0160】
互換動作モードの処理対象とする標準符号化方式は、VVC第1版に限定されず、HEVCやAVCなど様々な標準符号化方式を互換動作モードの処理対象としても良い。
【0161】
また、拡張動作モードにおける符号化処理や復号処理で用いる様々な構成要素も、互換動作モードの処理対象である標準符号化方式に含まれる構成要素以外にも、様々な符号化ツールや補間フィルタ係数、DCT等の変換マトリックス組み合わせて用いるような構成としても良い。
【0162】
上記の説明における、固定のビット深度Wとしては、処理対象とする様々なビット深度Bのいずれよりも十分大きなWの値を規定することが望ましい。例えば、2バイト(16ビット)での参照画像バッファの構成を想定して、Wを16としても良いし、符号付きWビットの数値同士の演算の桁あふれ等も含めた16ビットの演算器での実装を想定して、Wを15としても良い。あるいは、乗算結果に必要なビット幅を考慮してこれらより小さな値としたり、16ビットの医用画像のような限定された目的用にこれらより大きな値としたりしても良い。
【0163】
また、
図9のようなフィルタ処理の例では、中間結果もWビットとして説明したが、中間結果はWとは異なるW”のビット深度で演算するようにしても良い。また、互換動作モードの対象とするビット深度Bを12ビット以下に等に限定するなどにより、互換動作モードの対象とする標準符号化方式で規定されている中間結果のビット深度W’とW”を合わせるように構成することで、中間結果等における互換動作モードのためのビット精度整合のためのビットマスク処理を省略可能とするように構成しても良い。
【0164】
また、本発明は、上記構成を有するような装置として構成する場合や、上記処理を実現するようなプログラムとしても実施可能である。
【符号の説明】
【0165】
1…映像処理システム、10…映像符号化装置、20…映像復号装置、101…差分処理部、102…変換部、103…量子化部、104…エントロピー符号化部、105…逆量子化部、106…逆変換部、107…加算部、108…ループ内フィルタ部、109…符号付き固定ビット深度参照画像バッファ、110…インター予測部、111…イントラ予測部、112…切り替え部、120…符号付き固定ビット深度化変換部、204…エントロピー復号部、205…逆量子化部、206…逆変換部、207…加算部、208…ループ内フィルタ部、209…符号付き固定ビット深度参照画像バッファ、210…インター予測部、211…イントラ予測部、212…切り替え部、220…符号付き復号画像ビット深度変換部、301…差分処理部、302…変換部、303…量子化部、304…エントロピー符号化部、305…逆量子化部、306…逆変換部、307…加算部、308…ループ内フィルタ、309…参照画像バッファ、310…インター予測部、311…イントラ予測部、404…エントロピー復号部、405…逆量子化部、406…逆変換部、407…加算部、408…ループ内フィルタ、409…参照画像バッファ、410…インター予測部、411…イントラ予測部、501…スケール部、502…減算部、601…逆スケール部、602…加算部。