IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ▲騰▼▲訊▼科技(深▲セン▼)有限公司の特許一覧

特開2024-138096ビデオ復号方法、ビデオ符号化方法、装置、機器及び記憶媒体
<>
  • 特開-ビデオ復号方法、ビデオ符号化方法、装置、機器及び記憶媒体 図1
  • 特開-ビデオ復号方法、ビデオ符号化方法、装置、機器及び記憶媒体 図2
  • 特開-ビデオ復号方法、ビデオ符号化方法、装置、機器及び記憶媒体 図3
  • 特開-ビデオ復号方法、ビデオ符号化方法、装置、機器及び記憶媒体 図4
  • 特開-ビデオ復号方法、ビデオ符号化方法、装置、機器及び記憶媒体 図5
  • 特開-ビデオ復号方法、ビデオ符号化方法、装置、機器及び記憶媒体 図6
  • 特開-ビデオ復号方法、ビデオ符号化方法、装置、機器及び記憶媒体 図7
  • 特開-ビデオ復号方法、ビデオ符号化方法、装置、機器及び記憶媒体 図8
  • 特開-ビデオ復号方法、ビデオ符号化方法、装置、機器及び記憶媒体 図9
  • 特開-ビデオ復号方法、ビデオ符号化方法、装置、機器及び記憶媒体 図10
  • 特開-ビデオ復号方法、ビデオ符号化方法、装置、機器及び記憶媒体 図11
  • 特開-ビデオ復号方法、ビデオ符号化方法、装置、機器及び記憶媒体 図12
  • 特開-ビデオ復号方法、ビデオ符号化方法、装置、機器及び記憶媒体 図13
  • 特開-ビデオ復号方法、ビデオ符号化方法、装置、機器及び記憶媒体 図14
  • 特開-ビデオ復号方法、ビデオ符号化方法、装置、機器及び記憶媒体 図15
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024138096
(43)【公開日】2024-10-07
(54)【発明の名称】ビデオ復号方法、ビデオ符号化方法、装置、機器及び記憶媒体
(51)【国際特許分類】
   H04N 19/70 20140101AFI20240927BHJP
   H04N 19/126 20140101ALI20240927BHJP
【FI】
H04N19/70
H04N19/126
【審査請求】有
【請求項の数】1
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2024119640
(22)【出願日】2024-07-25
(62)【分割の表示】P 2022515567の分割
【原出願日】2020-12-08
(31)【優先権主張番号】201911309768.6
(32)【優先日】2019-12-18
(33)【優先権主張国・地域又は機関】CN
(71)【出願人】
【識別番号】517392436
【氏名又は名称】▲騰▼▲訊▼科技(深▲セン▼)有限公司
【氏名又は名称原語表記】TENCENT TECHNOLOGY (SHENZHEN) COMPANY LIMITED
【住所又は居所原語表記】35/F,Tencent Building,Kejizhongyi Road,Midwest District of Hi-tech Park,Nanshan District, Shenzhen,Guangdong 518057,CHINA
(74)【代理人】
【識別番号】100110364
【弁理士】
【氏名又は名称】実広 信哉
(74)【代理人】
【識別番号】100150197
【弁理士】
【氏名又は名称】松尾 直樹
(72)【発明者】
【氏名】▲張▼ 洪彬
(72)【発明者】
【氏名】李 翔
(72)【発明者】
【氏名】李 ▲貴▼春
(72)【発明者】
【氏名】▲劉▼ 杉
(57)【要約】
【課題】本願はビデオ復号方法、ビデオ符号化方法、装置、機器及び記憶媒体を提供し、ビデオ符号化・復号処理の技術分野に関する。
【解決手段】前記復号方法は、復号対象のビデオフレームに対応する第1パラメータセットを取得するステップと、第1パラメータセットに含まれるシンタックス要素に基づいて、有効なQMを決定するステップであって、該有効なQMとは復号対象のビデオフレームの復号過程において量子化された変換係数に対して逆量子化を行うときに実際に使用するQMを指す、ステップと、有効なQMに対して復号を行うステップと、を含む。本願の技術的手段を採用することで、デコーダ側は有効なQMに対して復号を行うだけでよく、それによりデコーダ側の計算の複雑度合いを低減させる。
【選択図】図10
【特許請求の範囲】
【請求項1】
ビデオ復号方法であって、前記方法は、
復号対象のビデオフレームに対応する第1パラメータセットを取得するステップであって、前記第1パラメータセットは量子化マトリクスQMに関連するシンタックス要素を含む、ステップと、
前記第1パラメータセットに含まれるシンタックス要素に基づいて、有効なQMを決定するステップであって、前記有効なQMとは前記復号対象のビデオフレームの復号過程において量子化された変換係数に対して逆量子化を行うときに使用されるQMを指す、ステップと、
前記有効なQMに対して復号を行うステップと、を含む、ビデオ復号方法。
【請求項2】
前記第1パラメータセットに含まれるシンタックス要素に基づいて、有効なQMを決定する前記ステップは、
前記第1パラメータセットに含まれるシンタックス要素に基づいて、QMの有効なサイズ範囲を決定するステップと、
前記有効なサイズ範囲内に属するQMを前記有効なQMとして決定するステップと、を含む、請求項1に記載の方法。
【請求項3】
前記第1パラメータセットに含まれるシンタックス要素に基づいて、QMの有効なサイズ範囲を決定する前記ステップは、
前記第1パラメータセットに含まれるシンタックス要素に基づいて、最小の輝度符号化ブロックサイズ、輝度符号化ツリーのブロックサイズ及び最大の輝度変換ブロックTBサイズを決定するステップと、
前記最小の輝度符号化ブロックサイズ、前記輝度符号化ツリーのブロックサイズ及び前記最大の輝度TBサイズに基づいて、輝度QMの有効なサイズ範囲を決定するステップであって、前記輝度QMの有効なサイズ範囲は前記輝度QMの最小サイズ及び最大サイズを含む、ステップと、
前記輝度QMの有効なサイズ範囲と輝度成分に対する色差成分のサンプリングレートとに基づいて、色差QMの有効なサイズ範囲を決定するステップであって、前記色差QMの有効なサイズ範囲は前記色差QMの最小サイズ及び最大サイズを含む、ステップと、を含む、請求項2に記載の方法。
【請求項4】
前記最小の輝度符号化ブロックサイズ、前記輝度符号化ツリーのブロックサイズ及び前記最大の輝度TBサイズに基づいて、輝度QMの有効なサイズ範囲を決定する前記ステップは、
前記最小の輝度符号化ブロックサイズに基づいて、前記輝度QMの最小サイズを決定するステップと、
前記輝度符号化ツリーのブロックサイズ及び前記最大の輝度TBサイズのうちの比較的大きな値を、前記輝度QMの最大サイズとして決定するステップと、を含む、請求項3に記載の方法。
【請求項5】
前記第1パラメータセットに含まれるシンタックス要素に基づいて、QMの有効なサイズ範囲を決定する前記ステップは、
前記第1パラメータセットに含まれるシンタックス要素に基づいて、輝度QMの有効なサイズ範囲を決定するステップであって、前記輝度QMの有効なサイズ範囲は前記輝度QMの最小サイズ及び最大サイズを含む、ステップと、
前記輝度QMの有効なサイズ範囲と輝度成分に対する色差成分のサンプリングレートとに基づいて、色差QMの有効なサイズ範囲を決定するステップであって、前記色差QMの有効なサイズ範囲は前記色差QMの最小サイズ及び最大サイズを含む、ステップと、を含む、請求項2に記載の方法。
【請求項6】
輝度QMの有効なサイズ範囲と輝度成分に対する色差成分のサンプリングレートとに基づいて、色差QMの有効なサイズ範囲を決定する前記ステップは、
前記輝度QMの最小サイズと前記輝度成分に対する色差成分のサンプリングレートとに基づいて、前記色差QMの最小サイズを計算するステップと、
前記輝度QMの最大サイズと前記輝度成分に対する色差成分のサンプリングレートとに基づいて、前記色差QMの最大サイズを計算するステップと、を含む、請求項2又は5に記載の方法。
【請求項7】
前記有効なサイズ範囲内に属するQMを前記有効なQMとして決定する前記ステップは、
もし第1QMが第1条件及び第2条件のうちの1つを満たすなら、前記第1QMを前記有効なQMとして決定するステップを含み、
前記第1条件はcIdx==0 && (matrixQMSize >= minQMSizeY && matrixQMSize <= maxQMSizeY )であり、前記第1条件は前記第1QMが、輝度TBの量子化過程に用いられる輝度成分に属することを表し、且つ前記第1QMは前記輝度QMの有効なサイズ範囲[MinQMSizeY,MaxQMSizeY]内にあり、前記MinQMSizeYは前記輝度QMの最小サイズを表し、前記MaxQMSizeYは前記輝度QMの最大サイズを表し、
前記第2条件はcIdx!=0 && (matrixQMSize >= minQMSizeUV && matrixQMSize <= maxQMSizeUV )であり、前記第2条件は前記第1QMが、色差TBの量子化過程に用いられる色差成分に属することを表し、且つ前記第1QMは前記色差QMの有効なサイズ範囲[MinQMSizeUV,MaxQMSizeUV]内にあり、前記MinQMSizeUVは前記色差QMの最小サイズを表し、前記MaxQMSizeUVは前記色差QMの最大サイズを表す、請求項3又は5に記載の方法。
【請求項8】
前記第1パラメータセットに含まれるシンタックス要素に基づいて、有効なQMを決定する前記ステップは、
前記第1パラメータセットから第1QMに対応するフラグシンタックス要素の値を読み取るステップと、
もし前記第1QMに対応するフラグシンタックス要素の値が第1の数値であるなら、前記第1QMが前記有効なQMに属すると決定するステップと、
もし前記第1QMに対応するフラグシンタックス要素の値が第2の数値であるなら、前記第1QMが前記有効なQMに属しないと決定するステップと、を含む、請求項1に記載の方法。
【請求項9】
同じ予測モード及び同じサイズを有する第1色差QM及び第2色差QMは、同一のフラグシンタックス要素を共有する、請求項8に記載の方法。
【請求項10】
前記フラグシンタックス要素はscaling_matrix_present_flagであることを特徴とする請求項8に記載の方法。
【請求項11】
前記第1パラメータセットは自己適応パラメータセットAPSである、請求項1に記載の方法。
【請求項12】
前記有効なQMに属しない他のQMについては、そのすべての要素がデフォルト値であると予め定義する、請求項1に記載の方法。
【請求項13】
前記デフォルト値は16である、請求項12に記載の方法。
【請求項14】
ビデオ符号化方法であって、前記方法は、
符号化対象のビデオフレームに対応する有効な量子化マトリクスQMを決定するステップであって、前記有効なQMとは前記符号化対象のビデオフレームの符号化過程において変換係数に対して量子化を行うときに使用されるQMを指す、ステップと、
前記有効なQMを決定することに用いられるシンタックス要素及び前記有効なQMに対して符号化を行って、第1パラメータセットに対応するコードストリームを生成するステップであって、前記第1パラメータセットはQMに関連するシンタックス要素を含む、ステップと、を含む、ビデオ符号化方法。
【請求項15】
ビデオ復号装置であって、前記装置は、パラメータ取得モジュールと、QM決定モジュールと、QM復号モジュールと、を含み、
前記パラメータ取得モジュールは、復号対象のビデオフレームに対応する第1パラメータセットを取得することに用いられ、前記第1パラメータセットは量子化マトリクスQMに関連するシンタックス要素を含み、
前記QM決定モジュールは、前記第1パラメータセットに含まれるシンタックス要素に基づいて、有効なQMを決定することに用いられ、前記有効なQMとは前記復号対象のビデオフレームの復号過程において量子化された変換係数に対して逆量子化を行うときに使用されるQMを指し、
前記QM復号モジュールは、前記有効なQMに対して復号を行うことに用いられる、ビデオ復号装置。
【請求項16】
コンピュータ機器であって、前記コンピュータ機器はプロセッサとメモリとを含み、前記メモリに、少なくとも1つのプログラム、コードセット又は命令セットが記憶されており、前記少なくとも1つのプログラム、前記コードセット又は命令セットは前記プロセッサによりロードされ且つ実行されて、請求項1~14のいずれか一項に記載の方法を実現する、コンピュータ機器。
【請求項17】
コンピュータ可読記憶媒体であって、前記コンピュータ可読記憶媒体に少なくとも1つのプログラム、コードセット又は命令セットが記憶されており、前記少なくとも1つのプログラム、前記コードセット又は命令セットはプロセッサによりロードされ且つ実行されて請求項1~14のいずれか一項に記載の方法を実現する、コンピュータ可読記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本願の実施例はビデオ符号化・復号の技術分野に関し、特にビデオ復号方法、ビデオ符号化方法、装置、機器及び記憶媒体に関する。
【0002】
本願は2019年12月18日に提出された出願番号が201911309768.6であり、発明の名称が「ビデオ復号方法、装置、機器及び記憶媒体」である中国特許出願の優先権を要求し、その全部の内容は引用によって本願に組み込まれている。
【背景技術】
【0003】
H.266は、H.265/HEVC(High Efficient Video Coding、高効率ビデオ圧縮符号化)を基に改良された次世代ビデオ符号化技術であり、既にVVC(Versatile Video Coding、汎用ビデオ符号化)と正式に命名され、JVET(Joint Video Experts Team、連合ビデオ専門家チーム)組織の指導により継続的に更新及び整備がなされている。
【0004】
第14回のJVET会議では、VVCにおいてデフォルトの量子化マトリクス、及びユーザ定義の量子化マトリクスの二種の形式の量子化マトリクスを使用することにより、周波数関連スケーリングをサポートすることができると決められた。量子化マトリクスを有効にする場合、該量子化マトリクスに含まれる量子化係数(すなわち整数重み付け値)に基づいて、TB(Transform Block、変換ブロック)における変換係数に対して単独の量子化を行うことができる。
【0005】
現状では、VVCで採用される量子化マトリクスの復号方法は、デコーダ側の計算複雑度合いが比較的高い。
【発明の概要】
【発明が解決しようとする課題】
【0006】
本願の実施例はビデオ復号方法、ビデオ符号化方法、装置、機器及び記憶媒体を提供し、デコーダ側の計算の複雑度合いを低減させることができる。上記技術的手段は以下のとおりである。
【課題を解決するための手段】
【0007】
一態様では、本願の実施例はビデオ復号方法を提供し、前記方法は、
復号対象のビデオフレームに対応する第1パラメータセットを取得するステップであって、前記第1パラメータセットはQM(Quantization Matrix、量子化マトリクス)に関連するシンタックス要素(syntax element)を定義することに用いられるパラメータセットを含む、ステップと、
前記第1パラメータセットに含まれるシンタックス要素に基づいて、有効なQMを決定するステップであって、前記有効なQMとは前記復号対象のビデオフレームの復号過程において量子化された変換係数に対して逆量子化を行うときに実際に使用するQMを指す、ステップと、
前記有効なQMに対して復号を行うステップと、を含む。
【0008】
別の態様では、本願の実施例はビデオ符号化方法を提供し、前記方法は、
符号化対象のビデオフレームに対応する有効なQMを決定するステップであって、前記有効なQMとは前記符号化対象のビデオフレームの符号化過程において変換係数に対して量子化を行うときに実際に使用するQMを指す、ステップと、
前記有効なQMを決定することに用いられるシンタックス要素及び前記有効なQMに対して符号化を行って、第1パラメータセットに対応するコードストリームを生成するステップであって、前記第1パラメータセットはQMに関連するシンタックス要素を定義することに用いられるパラメータセットを含む、ステップと、を含む。
【0009】
更に別の態様では、本願の実施例はビデオ復号装置を提供し、前記装置は、パラメータ取得モジュールと、QM決定モジュールと、QM復号モジュールと、を含み、
前記パラメータ取得モジュールは、復号対象のビデオフレームに対応する第1パラメータセットを取得することに用いられ、前記第1パラメータセットはQMに関連するシンタックス要素を定義することに用いられるパラメータセットを含み、
前記QM決定モジュールは、前記第1パラメータセットに含まれるシンタックス要素に基づいて、有効なQMを決定することに用いられ、前記有効なQMとは前記復号対象のビデオフレームの復号過程において量子化された変換係数に対して逆量子化を行うときに実際に使用するQMを指し、
前記QM復号モジュールは、前記有効なQMに対して復号を行うことに用いられる。
【0010】
更に別の態様では、本願の実施例はビデオ符号化装置を提供し、前記装置は、QM決定モジュールと、QM符号化モジュールと、を含み、
前記QM決定モジュールは、符号化対象のビデオフレームに対応する有効なQMを決定することに用いられ、前記有効なQMとは前記符号化対象のビデオフレームの符号化過程において変換係数に対して量子化を行うときに実際に使用するQMを指し、
前記QM符号化モジュールは、前記有効なQMを決定することに用いられるシンタックス要素及び前記有効なQMに対して符号化を行って、第1パラメータセットに対応するコードストリームを生成することに用いられ、前記第1パラメータセットはQMに関連するシンタックス要素を定義することに用いられるパラメータセットを含む。
【0011】
また更に別の態様では、本願の実施例はコンピュータ機器を提供し、前記コンピュータ機器はプロセッサとメモリとを含み、前記メモリに少なくとも1つの命令、少なくとも1つのプログラム、コードセット又は命令セットが記憶されており、前記少なくとも1つの命令、前記少なくとも1つのプログラム、前記コードセット又は命令セットは前記プロセッサによりロードされ且つ実行され、上記ビデオ復号方法を実現し、又は上記ビデオ符号化方法を実現する。
【0012】
また更に別の態様では、本願の実施例はコンピュータ可読記憶媒体を提供し、前記コンピュータ可読記憶媒体に少なくとも1つの命令、少なくとも1つのプログラム、コードセット又は命令セットが記憶されており、前記少なくとも1つの命令、前記少なくとも1つのプログラム、前記コードセット又は命令セットはプロセッサによりロードされ且つ実行され、上記ビデオ復号方法を実現し、又は上記ビデオ符号化方法を実現する。
【0013】
また更に別の態様では、本願の実施例はコンピュータプログラム製品を提供し、前記コンピュータプログラム製品はプロセッサに実行されるときに、上記ビデオ復号方法を実現し、又は上記ビデオ符号化方法を実現することに用いられる。
【発明の効果】
【0014】
本願の実施例が提供する技術的手段は以下の有益な効果を含み得る。
【0015】
復号対象のビデオフレームに対応する第1パラメータセットを取得することによって、該第1パラメータセットに含まれるシンタックス要素に基づいて有効なQMを決定し、該有効なQMとは該復号対象のビデオフレームを符号化して生成する過程において変換係数に対して量子化を行うときに実際に使用するQMを指し、その後、該有効なQMに対して復号を行う。このように、デコーダ側は有効なQMに対して復号を行うだけでよく、それによりデコーダ側の計算の複雑度合いを低減させる。
【図面の簡単な説明】
【0016】
図1】本願に例示的に示されるビデオ符号化の模式図である。
図2】本願の1つの実施例が提供する通信システムの簡略化ブロック図である。
図3】本願に例示的に示されるビデオエンコーダ及びビデオデコーダのストリーミング環境における配置方式の模式図である。
図4】本願の1つの実施例が提供するフレーム間予測モード下での符号化模式図である。
図5】本願の1つの実施例が提供するフレーム内予測モード下での符号化模式図である。
図6】本願の1つの実施例が提供するビデオエンコーダの機能モジュールの模式図である。
図7】本願の1つの実施例が提供するビデオデコーダの機能モジュールの模式図である。
図8】本願の1つの実施例が提供するダウンサンプリングコピーによってQMを生成する模式図である。
図9】本願の1つの実施例が提供する対角走査順序の模式図である。
図10】本願の1つの実施例が提供するビデオ復号方法のフローチャートである。
図11】本願の1つの実施例が提供するビデオ符号化方法のフローチャートである。
図12】本願の1つの実施例が提供するビデオ復号装置のブロック図である。
図13】本願の別の実施例が提供するビデオ復号装置のブロック図である。
図14】本願の1つの実施例が提供するビデオ符号化装置のブロック図である。
図15】本願の1つの実施例が提供するコンピュータ機器の構造ブロック図である。
【発明を実施するための形態】
【0017】
本願の目的、技術的手段及び利点をより明確にするために、以下、図面を併せて参照し本願の実施形態を更に詳細に記述する。
【0018】
図1に参照されるように、現在のブロック101は動き検出の過程期間に既にエンコーダにより発見されたサンプルを含み、空間オフセットが生じている同じ大きさの以前のブロックに基づいて、上記サンプルを予測することができる。また、1つ又は複数の参照ピクチャと関連付けられるメタデータから上記MV(Motion Vector、動きベクトル)を導出することができ、MVを直接符号化することではない。例えば、A0、A1、B0、B1、及びB2(それぞれ102~106に対応する)の5つの周囲サンプルのうちのいずれかのサンプルに関連付けられるMVを使用し、(復号の順番に応じて)最も近い参照ピクチャのメタデータから上記MVを導出する。
【0019】
図2に示すように、それは本願の1つの実施例が提供する通信システムの簡略化ブロック図を示す。通信システム200は複数の機器を含み、上記機器は例えばネットワーク250によって互いに通信できる。例を挙げると、通信システム200はネットワーク250によって相互に接続される第1機器210及び第2機器220を含む。図2の実施例において、第1機器210及び第2機器220は一方向のデータ伝送を実行する。例を挙げると、第1機器210は、ビデオデータ、例えば第1機器210により収集されたビデオピクチャストリームに対して符号化を行ってネットワーク250によって第2機器220に伝送することができる。符号化済みビデオデータは1つ又は複数の符号化済みビデオコードストリーム形式で伝送される。第2機器220はネットワーク250から符号化済みビデオデータを受信し、符号化済みビデオデータに対して復号を行ってビデオデータを回復し、且つ回復したビデオデータに基づいてビデオピクチャを表示することができる。一方向のデータ伝送はメディアサービス等のアプリケーションにおいてよく見られる。
【0020】
別の実施例において、通信システム200は符号化済みビデオデータの双方向の伝送を実行する第3機器230及び第4機器240を含み、上記双方向の伝送は例えばビデオ会議期間に発生できる。双方向のデータ伝送については、第3機器230及び第4機器240のうちの各機器はビデオデータ(例えば機器により収集されたビデオピクチャストリーム)に対して符号化を行って、ネットワーク250によって第3機器230及び第4機器240のうちの他方の機器に伝送することができる。第3機器230及び第4機器240のうちの各機器はさらに、第3機器230及び第4機器240のうちの他方の機器により伝送された符号化済みビデオデータを受信することができ、且つ上記符号化済みビデオデータに対して復号を行ってビデオデータを回復することができ、且つ回復したビデオデータに基づいてアクセス可能な表示装置上にビデオピクチャを表示することができる。
【0021】
図2の実施例において、第1機器210、第2機器220、第3機器230及び第4機器240はサーバ、パーソナルコンピュータ及びスマートフォン等のコンピュータ機器であってもよいが、本願に開示されている原理はこれに限定されない。本願の実施例はPC(Personal Computer、パーソナルコンピュータ)、携帯電話、タブレットパソコン、メディアプレーヤー及び/又は専用ビデオ会議機器に適用される。ネットワーク250は第1機器210、第2機器220、第3機器230及び第4機器240の間で符号化済みビデオデータを伝送する任意の数のネットワークを表し、例えば有線で接続するもの及び/又は無線通信ネットワークを含む。通信ネットワーク250は回路交換及び/又はパケット交換チャネルにおいてデータを交換できる。該ネットワークは電子通信ネットワーク、ローカルエリアネットワーク、ワイドエリアネットワーク及び/又はインターネットを含んでもよい。本願の目的の点から、下記において解釈されない限り、ネットワーク250のアーキテクチャ及びトポロジーは、本願に開示されている操作にとって無関係である可能性がある。
【0022】
実施例として、図3はビデオエンコーダ及びビデオデコーダのストリーミング環境における配置方式を示す。本願に開示されている主題は、ビデオをサポートする他のアプリケーションに同様に適用でき、例えばビデオ会議、デジタルTV(テレビ)、及び、CD(Compact Disc、コンパクトディスク)、DVD(Digital Versatile Disc、デジタル多用途ディスク)やメモリスティック等を含むデジタル媒体において圧縮ビデオを記憶すること等を含む。
【0023】
ストリーミングシステムは収集サブシステム313を含んでもよく、上記収集サブシステムはデジタルカメラ等のビデオソース301を含んでもよく、上記ビデオソースは圧縮されていないビデオピクチャストリーム302を作成する。実施例において、ビデオピクチャストリーム302はデジタルカメラにより撮影されたサンプルを含む。符号化済みビデオデータ304(又は符号化済みビデオコードストリーム)と比較して、ビデオピクチャストリーム302は太い線として描画されて高いデータ量のビデオピクチャストリームを強調し、ビデオピクチャストリーム302は電子装置320により処理され得る。上記電子装置320はビデオソース301に結合されたビデオエンコーダ303を含む。下記により詳細に記述される、開示される主題の各態様を実現又は実施するために、ビデオエンコーダ303はハードウェア、ソフトウェア又はソフトウェアとハードウェアとの組み合わせを含んでもよい。ビデオピクチャストリーム302と比較して、符号化済みビデオデータ304(又は符号化済みビデオコードストリーム304)は細い線として描画されて、比較的低いデータ量の符号化済みビデオデータ304(又は符号化済みビデオコードストリーム304)を強調し、それは将来の使用のためにストリーミングサーバ305に記憶され得る。1つ又は複数のストリーミングクライアント端末サブシステム、例えば図3におけるクライアント端末サブシステム306及びクライアント端末サブシステム308は、ストリーミングサーバ305にアクセスして、符号化済みビデオデータ304の副本307及び副本309を検索することができる。クライアント端末サブシステム306は例えば電子装置330におけるビデオデコーダ310を含んでもよい。ビデオデコーダ310は符号化済みビデオデータの導入された副本307に対して復号を行い、且つディスプレイ312(例えば表示スクリーン)又は別の提示装置(図示せず)に提示できる出力ビデオピクチャストリーム311を生じさせる。いくつかのストリーミングシステムにおいて、あるいくつかのビデオ符号化/圧縮標準に基づいて、符号化済みビデオデータ304、ビデオデータ307及びビデオデータ309(例えばビデオコードストリーム)に対して符号化を行うことができる。
【0024】
注意する点として、電子装置320及び電子装置330は他のコンポーネント(図示せず)を含んでもよい。例を挙げると、電子装置320はビデオデコーダ(図示せず)を含んでもよく、且つ電子装置330はさらにビデオエンコーダ(図示せず)を含んでもよい。ビデオデコーダは受信した符号化済みビデオデータに対して復号を行うことに用いられ、ビデオエンコーダはビデオデータに対して符号化を行うことに用いられる。
【0025】
ビデオフレームにおける画像ブロックに対して符号化を行うときに、フレーム間予測モード又はフレーム内予測モードを使用でき、1つ又は複数の符号化済み参照ブロックを基に、1つの予測ブロックを生成する。予測ブロックはオリジナルブロックの推定バージョンであってもよい。予測ブロックから該オリジナルブロックを差し引くことによって残差ブロックを生成することができ、逆も同様であり、該残差ブロックは予測残差(又は予測誤差と称される)を表すことに用いることができる。予測残差を表すことに用いられる必要があるデータ量が、通常、オリジナルブロックを表すことに用いられる必要があるデータ量よりも少ない可能性があるため、残差ブロックに対して符号化を行うことで比較的高い圧縮比を実現することができる。例えば、図4に示すように、フレーム間予測モードについては、符号化済み参照ブロック41及び符号化対象のブロック42は2つの異なるビデオフレームに位置する。図5に示すように、フレーム内予測モードについては、符号化済み参照ブロック51及び符号化対象のブロック52は同一のビデオフレームに位置する。
【0026】
続いて、空間領域における残差ブロックの残差値は周波数領域における変換係数に変換できる。該変換は、例えば、離散コサイン変換(Discrete Cosine Transform、DCT)等と類似する2次元変換によって実現できる。変換マトリクスにおいて、低いインデックス変換係数(例えば、左上領域に位置する)は大きな空間的特徴に対応でき、且つ相対的に比較的大きい量の値を有し、高いインデックス変換係数(例えば、右下領域に位置する)は小さい空間的特徴に対応でき、且つ相対的に比較的小さい量の値を有する。更に、量子化係数を含む量子化マトリクスは変換マトリクスに適用でき、それによりすべての変換係数を量子化して、量子化した変換係数とする。量子化の結果としては、変換係数のスケール又は量の値は低くなる可能性がある。いくつかの高いインデックス変換係数はゼロに減らすことができ、その後、後続の走査及び符号化ステップにおいてスキップする可能性がある。
【0027】
図6は変換モジュール62、量子化モジュール64及びエントロピー符号化モジュール66を含む例示的なビデオエンコーダ60の一部を示す。図6において図示されないが、理解すべきであるように、ビデオエンコーダ60において、例えば予測モジュール、量子化解除モジュール、及び再構成モジュール等の他のモジュールが含まれてもよい。操作において、ビデオエンコーダ60はビデオフレームを取得でき、ビデオフレームは複数の画像ブロックを含んでもよい。簡潔にするために、1つの画像ブロックに対して符号化を行うことは、ここでは1つの例として見なされてもよい。画像ブロックに対して符号化を行うために、まず予測ブロックを生成して該画像ブロックの推定とすることができる。上記と併せて、予測ブロックは予測モジュールによりフレーム間予測又はフレーム内予測モードによって生成され得る。続いて、該画像ブロックと予測ブロックとの間の差値を計算して残差ブロックを生成することができる。残差ブロックは変換モジュール62により変換係数に変換され得る。変換の期間において、空間領域における残差値は大きな特徴及び小さな特徴を含み、周波数領域における変換係数に変換され、該周波数領域は高周波帯域及び低周波帯域を含む。その後、量子化モジュール64はQMを使用して該変換係数を量子化することができ、それにより量子化された変換係数を生成する。更に、該量子化された変換係数はエントロピー符号化モジュール66により符号化され、最後にビットストリームの一部としてビデオエンコーダ60から送信され得る。
【0028】
図7はエントロピー復号モジュール72、逆量子化(反量子化)モジュール74及び逆変換モジュール76を含む例示的なビデオデコーダ70の一部を示す。図7において図示されないが、理解すべきであるように、ビデオデコーダ70において、例えば予測モジュール、変換モジュール、及び量子化モジュール等の他のモジュールが含まれてもよい。操作において、ビデオデコーダ70はビデオエンコーダ60から出力されたビットストリームを受信し、フレーム間予測又はフレーム内予測モードに応じてビットストリームに対して復号を実行し、且つ再構成されたビデオフレームを出力することができる。ここで、エントロピー復号モジュール72は入力ビットストリームに対してエントロピー復号を実行することによって、量子化された変換係数を生成することができる。逆量子化モジュール74はQMに基づき、量子化された変換係数に対して逆量子化を行って、逆量子化を経た変換係数を獲得することができる。逆変換モジュール76は逆量子化を経た変換係数に対して逆変換を行って、再構成された残差ブロックを生成する。その後、再構成された残差ブロック及び予測ブロックに基づいて、再構成された画像ブロックを生成する。
【0029】
上記から分かるように、QMはビデオ符号化・復号過程において不可欠な一部である。QMの設定は変換係数の情報をどれほど保留するか、又はフィルタリングするかを決定でき、従って、QMは符号化性能及び符号化品質に影響を与えることができる。実際に、エンコーダ及びデコーダにおいていずれもQMを必要とする。具体的に言えば、画像を正確に復号するために、エンコーダにおいてQMにおける量子化係数に関する情報に対して符号化を行い且つ該情報をエンコーダからデコーダに送信する必要がある。ビデオ符号化・復号技術及び標準において、QMはスケーリングマトリクス又は重みマトリクスと称される場合がある可能性がある。従って、本明細書に使用される用語「QM」は量子化マトリクス、スケーリングマトリクス、重みマトリクス、及び他の同等の用語をカバーする汎用用語であってもよい。
【0030】
以下、本願の実施例に関するいくつかの基本的な概念に対して紹介及び説明を行う。
【0031】
1.量子化マトリクス
【0032】
VTM(VVC Test Model、VVCテストモデル)の最新バージョン(すなわちVTM7)においては、正方形TBを許可するだけでなく、非正方形TBも許可しているため、QMの数量は比較的多くなる。QMシグナリングの桁数及びメモリニーズを減少するために、VVCは非正方形TB及び大型正方形TBに対して、アップサンプリング及びコピー設計を採用する。
【0033】
非正方形QMはVVCビットストリームには存在せず、それらはデコーダ側で相応な正方形QMをコピーすることによって得られるものである。より具体的に言えば、32×4のQMは32×32のQMの0、8、16及び24行目をコピーすることによって得られるものである。図8に示すように、32×32のQMに対してダウンサンプリングを行うことによって32×4のQMを得る。斜線で塗られている行0、8、16及び24は32×32のQMから32×4のQMにコピーされる。
【0034】
正方形TBのサイズが8×8よりも大きいときに、VTM7における相応なQMのサイズは8×8に制約される。これらの8×8のQMに対してアップサンプリング方法を採用して16×16、32×32及び64×64のQMを作成する。より具体的に言えば、16×16サイズのQMを作成するために、それに対応する8×8サイズのQMにおける各要素はアップサンプリングされて2×2の領域にコピーされ、32×32サイズのQMを作成するために、それに対応する8×8サイズのQMにおける各要素はアップサンプリングされて4×4の領域にコピーされる。
【0035】
VTM7において28個と多いQMを符号化する必要がある。表1はそれぞれ表2及び表3において指定される変数sizeId及びmatrixIdに基づいてQMの識別子変数(id)を決定する。ここで、sizeIdは量子化マトリクスのサイズを表し、matrixIdは予測モード(predMode)及び色成分(cIdx)に基づくQMのタイプの識別子である。
【0036】
【表1】
【0037】
【表2】
【0038】
【表3】
【0039】
表2において、sizeIdが3よりも大きいときに、DC(Direct Current、直流)係数を有し、DC係数はQMにおける(0,0)位置の要素値である。VVCにおいて、DC値が0であるときに、該QMはデフォルトのQMを使用し得るが、該QMは依然として伝送され得る。主な理由は符号化されていないQMが該QMを参照する必要がある可能性があることである。DC値が0ではないときに、該QMはユーザ定義のQMを使用し、且つ下記で紹介される符号化方式を採用して符号化を行った後に伝送する。
【0040】
表3において、MODE_INTRAはフレーム内予測モードを表し、MODE_INTERはフレーム間予測モードを表し、MODE_IBCはIBC(Intra Block Copy、フレーム内ブロックコピー)予測モードを表す。Yは輝度を表し、Cb及びCrは色差を表す。
【0041】
2.量子化マトリクス符号化方式
【0042】
ビットオーバーヘッドを減少するために、VTM7はフレーム内及びフレーム間予測符号化を採用して28個のQMに対して符号化を行う。
【0043】
フレーム内予測モードにおいて、DPCM(Differential Pulse Code Modulation、差分パルス符号変調)符号化は対角走査順序でQMに適用される。DPCMフレーム内残差もビットストリームに伝送される必要がある。例示的に、図9に示すように、4×4サイズのQMを例に、対角走査順序は順に(0,0)、(1,0)、(0,1)、(2,0)、(1,1)、…、(2,3)、(3,3)である。
【0044】
二種のフレーム間予測モードがあり、すなわち、コピーモード及び予測モードである。コピーモードにおいて、符号化されようとする現在のQMは参照QMと称される1つの復号に使用できるQMと完全に同じである。これはコピーモードがゼロフレーム間残差を有することも意味し、勿論、信号を送信して残差を通知する必要がない。エンコーダは現在のQMとその参照QMとの間で増分IDを伝送することにより、デコーダが参照QMを直接コピーすることで現在のQMを再構成させるようにする必要がある。予測モードはコピーモードと類似するが、追加のフレーム間残差を有する。DPCM符号化は対角走査順序でフレーム間残差に適用され、エンコーダはビットストリームにおいてDPCMフレーム間残差を伝送する必要がある。
【0045】
上記のように、QMのsizeIdが3よりも大きいときに、アップサンプリングアルゴリズムを応用してQMにおける各要素を大きな正方形領域にコピーする。(0,0)位置のDC係数がビデオの再構成に対して最も重要であるため、VTM7は、他のQMの対応する要素からコピーするのではなく、直接それに対して符号化を行う。各QMについては、モード判定を使用して、該QMの3つの候補モード(すなわち、フレーム間予測モードのコピーモード、フレーム間予測モードの予測モード及びフレーム内予測モード)のビットコストを計算し、且つ最小のビットコストを有する1つを最終的な最適モードとして選択する。その後、該最適モードを採用して該QMに対して符号化を行う。
【0046】
3.量子化マトリクスシグナリング
【0047】
QMを使用することによって、VVCは変換ブロックの周波数関連量子化をサポートする。QMがWであると仮定し、W[x][y]はTBにおける位置(x,y)での変換係数のQM重みを表す。変換係数coeff[x][y]については、以下の数式1を採用して量子化された変換係数level[x][y]を計算する。
【0048】
【数1】
【0049】
ここで、QPは量子化パラメータ(量子化ストライドとも称されてもよい)であり、offsetはオフセット値である。W[x][y]=16は位置(x,y)で変換係数に対して重み付けを行わないことを表す。また、QMにおけるすべての要素の値がいずれも16に等しいときに、QMを使用しない効果と同じである。
【0050】
SPS(Sequence Parameter Set、シーケンスパラメータセット)シンタックス要素sps_scaling_list_enable_flagは、その画像ヘッダ(Picture Header、PH)が既に該SPSを引用したそれらの画像に対してQMを有効にするか否かを示すことに用いられる。該フラグ(flag)を有効にするときに、すなわち、sps_scaling_list_enable_flagを有効にするときに、PHにおける付加フラグは、すべての要素がいずれも16に等しいデフォルトのQMを使用するか、それともユーザ定義のQMを使用するかを制御することに用いられる。VTM7において、ユーザ定義のQMはAPS(Adaptive Parameter Set、自己適応パラメータセット)において通知される。もしSPS及びPHにおいてユーザ定義のQMを有効にするとすれば、PHにおいて1つのAPSインデックスを送信でき、それによって、このPHを引用した画像のQMセットを指定することに用いる。
【0051】
1つのAPSにおいて、28グループと多いQM符号化モード、Δid(増分id)、AC、及びDC係数を通知すべきである。各APSにおいて、28グループのQMはidの逓増順序に応じて符号化・復号を行う。
【0052】
VVCドラフト7において、QM符号化モード、Δid(増分id)、AC及びDC係数のシンタックス(syntaxes)及びセマンティクス(semantics)の定義は以下の表4に示される。
【0053】
【表4】
【0054】
scaling_list_copy_mode_flag[ id ]が1に等しいことは、現在のQMとその参照QMとの要素値が同じであることを表す。参照QMはscaling_list_pred_id_delta[ id ]により表わされる。scaling_list_copy_mode_flag[ id ]が0に等しいことは、scaling_list_pred_mode_flagが存在することを表す。
【0055】
scaling_list_pred_mode_flag[ id ]が1に等しいことは、参照QMから現在のQMを予測できることを表す。参照QMはscaling_list_pred_id_delta[ id ]により表わされる。scaling_list_pred_mode_flag[ id ]が0に等しいことは、明示的に信号を送信して現在のQMの要素値を通知することを表す。存在しないときに、scaling_list_pred_mode_flag[ id ]の値は0に等しいと推断される。
【0056】
scaling_list_pred_id_delta[ id ]は、予測QM、すなわちScalingMatrixPred[id]を推断することに用いられる参照QMを表す。存在しないときに、scaling_list_pred_id_delta[ id ]の値は0に等しいと推断される。scaling_list_pred_id_delta[ id ]の値は0~maxIdDeltaの範囲内にあるはずであり、maxIdDeltaはidに基づいて推断され、以下の数式2に示される。
【0057】
【数2】
【0058】
すなわち、もしid<2であれば、maxIdDelta=idであり、もしid≧2且つ<8であれば、maxIdDelta=id-2であり、もしid≧8であれば、maxIdDelta=id-8である。
【0059】
変数refId及びmatrixSizeは以下の数式を採用して計算される。
【0060】
refId=id- scaling_list_pred_id_delta[ id ] 数式3
【数3】
【0061】
すなわち、もしid<2であれば、matrixSize=2であり、もしid≧2且つ<8であれば、matrixSize=4であり、もしid≧8であれば、matrixSize=8である。
【0062】
matrixSize×matrixSizeのQM予測マトリクスはScalingMatrixPred[x][y]として表わされ、ここで、x∈[0,matrixSize-1]、y∈[0,matrixSize-1]であり、且つ変数ScalingMatrixDCPredはDCの予測値として表わされ、それらは具体的に以下のように計算される。
【0063】
scaling_list_copy_mode_flag[ id ]及びscaling_list_pred_mode_flag[ id ]がいずれも0に等しいときに、ScalingMatrixPredのすべての要素はいずれも8に等しいと設定され、ScalingMatrixDCPredの値は8に等しいと設定される。
【0064】
そうでなければ、scaling_list_pred_id_delta[ id ]が0に等しいときに、ScalingMatrixPredのすべての要素をいずれも16に等しいと設定し、且つScalingMatrixDCPredの値を16に等しいと設定する。
【0065】
そうでなければ、scaling_list_copy_mode_flag[ id ]又はscaling_list_pred_mode_flag[ id ]が1に等しく、且つscaling_list_pred_id_delta[ id ]が0よりも大きいときに、ScalingMatrixPredはScalingMatrixPred[refId]に等しいと設定され、且つScalingMatrixDCPredの値の計算は以下のとおりである。もしrefIdが13よりも大きいとすれば、ScalingMatrixDCPredの値はScalingMatrixDCRec[ refId - 14 ]に等しいと設定され、さもなければ(すなわちrefIdが13以下である)、ScalingMatrixDCPredの値はScalingMatrixPred[0][0]に等しいと設定される。
【0066】
scaling_list_dc_coef[ id - 14 ]はidが13よりも大きいときに変数ScalingMatrixDC[ id - 14 ]の値を計算することに用いられ、以下の数式5に示される。
【0067】
ScalingMatrixDCRec[ id - 14 ] = ( ScalingMatrixDCPred + scaling_list_dc_coef[ id - 14 ] + 256 ) % 256 ) 数式5
【0068】
ここで、%は余数を求めることを表す。
【0069】
存在しないときには、scaling_list_dc_coef[ id - 14 ]の値は0に等しいと推断される。scaling_list_dc_coef[ id - 14 ]の値は-128~127の範囲内(-128及び127を含む)にあるはずである。ScalingMatrixDCRec[ id - 14 ]の値は0よりも大きくなるはずである。
【0070】
scaling_list_delta_coef[ id ][ i ]は、scaling_list_copy_mode_flag[ id ]が0に等しいときに、現在のマトリクス係数ScalingList[id][i]と前の1つのマトリクス係数ScalingList[id][i-1]との間の差値を表す。scaling_list_delta_coef[ id ][ i ]の値は-128~127の範囲内(-128及び127を含む)にあるはずである。scaling_list_copy_mode_flag[ id ]が1に等しいときに、ScalingList[id]のすべての要素はいずれも0に等しいと設定される。
【0071】
matrixSize×matrixSizeのQMのScalingMatrixRec[ id ]は以下の数式6を採用して計算できる。
【0072】
ScalingMatrixRec[ id ][ x ][ y ] = ( ScalingMatrixPred[ x ][ y ] + ScalingList[ id ][ k ] + 256 ) % 256 ) 数式6
【0073】
ここで、%は余数を求めることを表し、k∈[0,(matrixSize×matrixSize-1)]である。
【0074】
x= DiagScanOrder[ Log2( matrixSize ) ][ Log2( matrixSize ) ][ k ][ 0 ]、且つ
y= DiagScanOrder[ Log2( matrixSize ) ][ Log2( matrixSize ) ][ k ][ 1 ]である。
【0075】
ScalingMatrixRec[ id ][ x ][ y ]の値は0よりも大きいはずである。
【0076】
1つのQMの復号過程、すなわち、上記シンタックス要素に基づいて復号してScalingMatrixRec[ id ][ x ][ y ]及びScalingMatrixDCRecを得る過程を考慮する。
【0077】
4.SPSによってTBの大きさを制限する
【0078】
VVCドラフト7において、TBの大きさ制約に関連するSPSシンタックス及びセマンティクスの定義は以下の表5に示される。
【0079】
【表5】
【0080】
sps_max_luma_transform_size_64_flagが1に等しいことは、輝度サンプリングにおける最大変換ブロックの大きさが64に等しいことを表す。sps_max_luma_transform_size_64_flagが0に等しいことは、輝度サンプリングにおける最大変換ブロックの大きさが32に等しいことを表す。
【0081】
chroma_format_idcは輝度サンプリングに対応する色差サンプリングを表し、表6に示される。
【0082】
【表6】
【0083】
上記表6において、SubWidthC及びSubHeightCはそれぞれ色差成分に対応するCTU(Coding Tree Unit、符号化ツリーユニット)の幅及び高さを表し、Monochromeは色差成分がないことを表す。
【0084】
separate_colour_plane_flagが1に等しいことは、4:4:4色差フォーマットの3つの色成分をそれぞれ符号化することを表す。separate_colour_plane_flagが0に等しいことは、単独で色成分を符号化しないことを表す。separate_colour_plane_flagが存在しないときに、その値は0に等しいと推断される。
【0085】
separate_colour_plane_flagが1に等しいときに、符号化画像は3つの単独の成分からなり、各成分は1つのカラープレーン(Y、Cb又はCr)の符号化サンプルからなり、且つ単色符号化シンタックスを使用する。この場合、各カラープレーンはいずれも特定のcolour_plane_id値と関連付けられる。
【0086】
colour_plane_idはPHに関連付けられるスライスと関連付けられるカラープレーンを指定し、separate_colour_plane_flagが1に等しいときに、colour_plane_idの値は0~2の範囲内(0及び2を含む)にあるはずである。colour_plane_idの値0、1及び2はそれぞれY、Cb及びCr平面に対応する。注意する必要がある点として、異なるcolour_plane_id値を有する画像の復号過程の間には依存性がない。
【0087】
sps_log2_ctu_size_minus5+5は各CTUの輝度符号化ツリーブロックの大きさを表す。sps_log2_ctu_size_minus5の値が2以下であることはビットストリームの整合性の要件である。
【0088】
sps_log2_ctu_size_minus5に基づき、最大の輝度符号化ブロックサイズを計算できる。
【0089】
CtbLog2SizeY = sps_log2_ctu_size_minus5 + 5
CtbSizeY = 1 << CtbLog2SizeY
【0090】
ここで、CtbSizeYは最大の輝度符号化ブロックサイズを表し、CtbLog2SizeYは2を底とするCtbSizeYの対数を表し、<<は左シフト演算子である。
【0091】
log2_min_luma_coding_block_size_minus2+2は最小の輝度符号化ブロックサイズを表す。log2_min_luma_coding_block_size_minus2の数値範囲は0~sps_log2_ctu_size_minus5+3の範囲内(0及びsps_log2_ctu_size_minus5+3を含む)にあるはずである。
【0092】
変数MinCbLog2SizeY、MinCbSizeY及びVSizeの計算過程は以下のとおりである。
【0093】
MinCbLog2SizeY = log2_min_luma_coding_block_size_minus2 + 2 数式7
MinCbSizeY = 1 << MinCbLog2SizeY 数式8
VSize = Min( 64、 CtbSizeY ) 数式9
【0094】
ここで、MinCbSizeYは最小の輝度符号化ブロックサイズを表し、MinCbLog2SizeYは2を底とするMinCbSizeYの対数を表し、VSizeは最大の輝度符号化ブロックサイズを表し、<<は左シフト演算子である。MinCbSizeYの値はVSize以下であるはずである。
【0095】
各色差CTB(Coding Tree Block、ツリー符号化ブロック)の幅及び高さ、すなわち変数CtbWidthC及びCtbHeightCは以下の方式を採用して決定される。
【0096】
もしchroma_format_idcが0に等しく(単色)又はSeparate_color_Plane_flagが1に等しいとすれば、CtbWidthC及びCtbHeightCはいずれも0に等しい。
【0097】
さもなければ、CtbWidthC及びCtbHeightCは以下の数式を採用して計算される。
【0098】
CtbWidthC = CtbSizeY / SubWidthC 数式10
CtbHeightC = CtbSizeY / SubHeightC 数式11
【0099】
ここで、CtbSizeYは輝度CTBのサイズを表す。
【0100】
現状では、VVCが採用した量子化マトリクスに対する符号化方法は、全部の28個のQMがいずれも符号化され且つAPSにおいて伝送されるため、QMシグナリングが比較的多いコードワードを占有する必要があり、ビットオーバーヘッドが大きく、且つデコーダ側の計算の複雑度合いを増加させてしまう。本願の実施例が提供する技術的手段において、復号対象のビデオフレームに対応する第1パラメータセットを取得することによって、該第1パラメータセットに含まれるシンタックス要素に基づいて有効なQMを決定し、該有効なQMとは該復号対象のビデオフレームを符号化して生成する過程において変換係数に対して量子化を行うときに実際に使用するQMを指し、その後、該有効なQMに対して復号を行う。このように、エンコーダ側は有効なQMのみを符号化して伝送し、それにより、QMシグナリングが占有する必要があるコードワードの節約に寄与し、ビットオーバーヘッドを低減させ、且つデコーダ側は有効なQMに対して復号を行うだけでよく、それによりデコーダ側の計算の複雑度合いを低減させる。
【0101】
説明する必要がある点として、本願の実施例が提供する技術的手段はH.266/VCC標準又は次世代ビデオ符号化・復号標準に適用できるが、本願の実施例はこれに限定されない。
【0102】
さらに説明する必要がある点として、本願の実施例が提供するビデオ復号方法において、各ステップの実行主体は復号側機器であり、本願の実施例が提供するビデオ符号化方法の各ステップの実行主体は符号化側機器であり、復号側機器及び符号化側機器はいずれもコンピュータ機器であってもよい。該コンピュータ機器とは、データ計算、処理及び記憶能力を備える電子機器、例えばPC、携帯電話、タブレットパソコン、メディアプレーヤー、専用ビデオ会議機器、又はサーバ等を指す。
【0103】
また、本願に提供される方法は単独で使用されてもよく、又は任意の順序で他の方法と組み合わせて使用されてもよい。本願に提供される方法に基づくエンコーダ及びデコーダは、1つ又は複数のプロセッサ又は1つ又は複数の集積回路により実現されてもよい。以下、いくつかの実施例によって本願の技術的手段に対して紹介及び説明を行う。
【0104】
図10に参照されるように、それは本願の1つの実施例が提供するビデオ復号方法のフローチャートを示す。本実施例において、主に該方法が上記で紹介された復号側機器に適用されることを例として説明する。該方法は以下のいくつかのステップ(1001~1003)を含んでもよい。
【0105】
ステップ1001:復号対象のビデオフレームに対応する第1パラメータセットを取得する。
【0106】
復号対象のビデオフレームは復号対象のビデオにおける任意の1つの復号対象のビデオフレーム(又は画像フレームと称される)であってもよい。第1パラメータセットはQMに関連するシンタックス要素を定義することに用いられるパラメータセットを含み、例えば、復号側機器は該第1パラメータセットにおけるシンタックス要素に基づいて、復号してQMを得ることができる。
【0107】
選択可能に、第1パラメータセットはAPSである。勿論、いくつかの他の実施例において、第1パラメータセットはAPSではなくてもよく、さらにSPS等であってもよく、本願の実施例はこれを限定しない。
【0108】
ステップ1002:第1パラメータセットに含まれるシンタックス要素に基づいて、有効なQMを決定する。該有効なQMとは復号対象のビデオフレームの復号過程において量子化された変換係数に対して逆量子化を行うときに実際に使用するQMを指す。
【0109】
量子化された変換係数に対して逆量子化を行うときに使用する可能性があるQMの数量がnであると仮定すると、該有効なQMの数量はn未満である可能性があり、nに等しい可能性もあり、nは正の整数である。例えば、量子化された変換係数に対して逆量子化を行うときに実際に全部のn個のQMを使用すると、有効なQMの数量はnであり、量子化された変換係数に対して逆量子化を行うときに実際に全部のn個のQMのうちの一部のQM(例えばm個のQM、mはn未満の正の整数である)を使用すると、有効なQMの数量はmである。
【0110】
第1パラメータセットにおいて有効なQMを決定することに用いられるシンタックス要素を定義することによって、復号側機器は該シンタックス要素を読み取ることによってどれが有効なQMであるか、どれが有効なQMではないかを決定することができる。有効なQMではないQM(無効なQMと称されてもよい)、すなわち、復号対象のビデオフレームを符号化して生成する過程において変換係数に対して量子化を行うときに実際に使用していないQMについては、復号側機器はそれに対して復号を行う必要がなくてもよい。
【0111】
選択可能に、有効なQMに属しない他のQMについては、そのすべての要素がデフォルト値であると予め定義する。選択可能に、該デフォルト値は16であり、数式1を併せて参照し、このときに、TBにおけるすべての変換係数の伸縮量子化係数がいずれも1であるため、QMを使用しない効果と同じである。
【0112】
ステップ1003:有効なQMに対して復号を行う。
【0113】
有効なQMを決定した後に、有効なQMの数量が1つである可能性があり、複数である可能性もあるため、復号側機器はそれぞれ各有効なQMに対して復号を行う必要がある。任意の1つの有効なQMを例に、該有効なQMに対して復号を行うときに、該有効なQMに対応する符号化モードを決定でき、その後、該符号化モードに基づいて該有効なQMを復号する。
【0114】
例えば、上記表1を併せて参照し、変換係数に対して量子化を行うときに使用する可能性があるQMの数量が28個であり、そのうち12個が有効なQMであることを決定したと仮定すると、復号側機器は該12個の有効なQMに対して復号を行うだけでよく、残り16個の無効なQMに対して復号を行う必要がない。
【0115】
以上のように、本願の実施例が提供する技術的手段において、復号対象のビデオフレームに対応する第1パラメータセットを取得することによって、該第1パラメータセットに含まれるシンタックス要素に基づいて有効なQMを決定する。該有効なQMとは該復号対象のビデオフレームを符号化して生成する過程において変換係数に対して量子化を行うときに実際に使用するQMを指し、その後、該有効なQMに対して復号を行う。このように、デコーダ側は有効なQMに対して復号を行うだけでよく、それによりデコーダ側の計算の複雑度合いを低減させる。
【0116】
例示的な実施例において、第1パラメータセットに含まれるシンタックス要素に基づいて、有効なQMを決定する上記ステップは、以下のいくつかのサブステップを含む。
【0117】
1:第1パラメータセットに含まれるシンタックス要素に基づいて、QMの有効なサイズ範囲を決定する。
【0118】
QMの有効なサイズ範囲は、復号過程において量子化された変換係数に対して逆量子化を行うときに実際に使用するQMの最小サイズ及び最大サイズを定義する。また、QMのサイズの数値は2の冪乗、例えば2、4、8、16、32及び64等である。
【0119】
2:該有効なサイズ範囲内に属するQMを有効なQMとして決定する。
【0120】
例えば、QMの有効なサイズ範囲が[4,32]であるときに、有効なQMは4×4サイズのQM、8×8サイズのQM、16×16サイズのQM及び32×32サイズのQMを含む。また例えば、QMの有効なサイズ範囲が[8,16]であるときに、有効なQMは8×8サイズのQM及び16×16サイズのQMを含む。
【0121】
例えば、QMの有効なサイズ範囲が[8,16]であると決定したと仮定すると、上記表1及び表2を併せて参照し、8×8サイズのQMに対応するsizeIdは3であり、16×16サイズのQMに対応するsizeIdは4である。復号側機器は、idが8~19である合計で12個のQMが有効なQMであり、残りのidが0~7及び20~27である16個のQMが無効なQMであると決定する。
【0122】
1つの例において、以下の方式を採用して、第1パラメータセットに含まれるシンタックス要素に基づいてQMの有効なサイズ範囲を決定する。
【0123】
1.1:第1パラメータセットに含まれるシンタックス要素に基づいて、最小の輝度符号化ブロックサイズ、輝度符号化ツリーのブロックサイズ及び最大の輝度TBサイズを決定する。
【0124】
選択可能に、第1パラメータセットにおいて第1シンタックス要素を定義し、該第1シンタックス要素は最小の輝度符号化ブロックサイズを指示することに用いられる。第1パラメータセットにおいて第2シンタックス要素を定義し、該第2シンタックス要素は輝度符号化ツリーのブロックサイズを指示することに用いられる。第1パラメータセットにおいて第3シンタックス要素を定義し、該第3シンタックス要素は最大の輝度TBサイズを指示することに用いられる。復号側機器は第1パラメータセットから上記第1シンタックス要素、第2シンタックス要素及び第3シンタックス要素を読み取り、最小の輝度符号化ブロックサイズ、輝度符号化ツリーのブロックサイズ及び最大の輝度TBサイズを決定する。
【0125】
1.2:最小の輝度符号化ブロックサイズ、輝度符号化ツリーのブロックサイズ及び最大の輝度TBサイズに基づいて、輝度QMの有効なサイズ範囲を決定する。ここで、輝度QMの有効なサイズ範囲は輝度QMの最小サイズ及び最大サイズを含む。
【0126】
選択可能に、復号側機器は最小の輝度符号化ブロックサイズに基づいて、輝度QMの最小サイズを決定する。例えば、該最小の輝度符号化ブロックサイズは輝度QMの最小サイズとして決定される。復号側機器は、輝度符号化ツリーのブロックサイズ及び最大の輝度TBサイズのうちの比較的大きな値を、輝度QMの最大サイズとして決定する。例えば、輝度符号化ツリーのブロックサイズが最大の輝度TBサイズよりも大きいときに、該輝度符号化ツリーのブロックサイズは輝度QMの最大サイズとして決定され、輝度符号化ツリーのブロックサイズが最大の輝度TBサイズ未満であるときに、該最大の輝度TBサイズは輝度QMの最大サイズとして決定され、輝度符号化ツリーのブロックサイズが最大の輝度TBサイズに等しいときには、両者が等しいため、輝度符号化ツリーのブロックサイズを輝度QMの最大サイズとして決定するか、又は最大の輝度TBサイズを輝度QMの最大サイズとして決定し、結果は同じになる。
【0127】
1.3:輝度QMの有効なサイズ範囲と、輝度成分に対する色差成分のサンプリングレートとに基づいて、色差QMの有効なサイズ範囲を決定し、ここで、色差QMの有効なサイズ範囲は色差QMの最小サイズ及び最大サイズを含む。
【0128】
選択可能に、第1パラメータセットにおいて第4シンタックス要素を定義し、該第4シンタックス要素は輝度成分に対する色差成分のサンプリングレートを指示することに用いられる。
【0129】
選択可能に、復号側機器は、輝度QMの最小サイズと輝度成分に対する色差成分のサンプリングレートとに基づいて、色差QMの最小サイズを計算し、輝度QMの最大サイズと輝度成分に対する色差成分のサンプリングレートとに基づいて、色差QMの最大サイズを計算する。
【0130】
例示的な実施例において、第1パラメータセットがAPSであることを例にすると、APSに含まれるシンタックス要素及びシンタックス構造テーブルは以下の表7に示される。
【0131】
【表7】
【0132】
aps_qm_size_info_present_flagはQMサイズに関連するシンタックス要素がビットストリームに存在するか否かを表す。その値が1であることはQMサイズに関連するシンタックス要素がビットストリームに現れることを表し、且つこれに基づいてQMの有効なサイズ範囲を決定し、これによってどのサイズのQMを復号する必要があるかを決めることができる。その値が0であることは、QMサイズに関連するシンタックス要素がビットストリームに存在せず、すべてのサイズのQMをいずれも復号する必要があることを表す。
【0133】
aps_ log2_ctu_size_minus5について、その値+5は輝度符号化ツリーのブロックサイズを指し示す。その値はシンタックス要素sps_log2_ctu_size_minus5の数値と同じであると規定される。
【0134】
aps_log2_min_luma_coding_block_size_minus2について、その値+2は最小の輝度符号化ブロックサイズを指し示す。その値はシンタックス要素sps_log2_min_luma_coding_block_size_minus2の数値と同じであると規定される。
【0135】
aps_max_luma_transform_size_64_flagについて、その値が1であることは、最大の輝度TBサイズが64であることを表し、その値が0であることは、最大の輝度TBサイズが32であることを表す。その値はシンタックス要素sps_max_luma_transform_size_64_flagの数値と同じであると規定される。
【0136】
aps_chroma_format_idcは輝度成分に対する色差成分のサンプリングレートを指し示し、具体的に表6に示される。その値はシンタックス要素chroma_format_idcの数値と同じであると規定される。
【0137】
上記シンタックス要素に基づき、変数minQMSizeY(輝度QMの最小サイズを表す)及びmaxQMSizeY(輝度QMの最大サイズを表す)の導出過程は以下のとおりである。
【0138】
シンタックス要素aps_qm_size_info_present_flagの値が1であるときに、以下のとおりである。
【0139】
minQMSizeY = 1 << (aps_log2_min_luma_coding_block_size_minus2+2) 数式12
【数4】
【0140】
ここで、<<は左シフト演算子であり、
【数5】
は三項条件演算子である。
【0141】
シンタックス要素aps_qm_size_info_present_flagの値が0であるときに、以下のとおりである。
【0142】
minQMSizeY = 4、
maxQMSizeY = 64。
【0143】
変数minQMSizeUV(色差QMの最小サイズを表す)及びmaxQMSizeUV(色差QMの最大サイズを表す)の導出過程は以下のとおりである。
【0144】
シンタックス要素aps_qm_size_info_present_flagの値が1であるときに、以下のとおりである。
【0145】
【数6】
【0146】
ここで、!は論理否定演算を表し、
【数7】
は三項条件演算子である。
【0147】
上記数式14及び数式15は以下のように解釈される。
【0148】
もしaps_chroma_format_idcが存在しなければ、minQMSizeUV=0であり、逆に、minQMSizeUV = minQMSizeY / SubWidthCであり、
もしaps_chroma_format_idcが存在しなければ、maxQMSizeUV=0であり、逆に、maxQMSizeUV = maxQMSizeY / SubHeightCである。
【0149】
シンタックス要素aps_qm_size_info_present_flagの値が0であるときに、以下のとおりである。
【0150】
minQMSizeUV = 2、
maxQMSizeUV = 32。
【0151】
表7に示されるシンタックス構造テーブルにおいて、変数cIdxは現在のQMに対応する色彩成分を表す。輝度成分Yについては、その値は0であり、色差Cbについては、その値は1であり、色差Crについては、その値は2である。変数matrixSizeは現在のQMの実際の符号化サイズを表し、表2の3列目により指し示される。変数matrixQMSizeは現在のQMと対応するTBサイズを表し、表1及び表2により指し示される。
【0152】
表7に示されるシンタックス構造テーブルにおいて、復号側機器は、まず本願が提案する2つの条件に対して判断を行い、その後、現在のQMに対して復号を行うか否かを決める。第1QMが有効なQMであるか否かを決定することを例に(該第1QMは任意の1つの使用可能なQM、すなわち上記全部の28個のQMのうちの任意の1つであってもよい)、もし第1QMが第1条件及び第2条件のうちの1つを満たすなら、該第1QMを有効なQMとして決定する。
【0153】
ここで、第1条件はcIdx==0 && (matrixQMSize >= minQMSizeY && matrixQMSize <= maxQMSizeY )であり、該第1条件は第1QMが、輝度TBの量子化過程に用いられる輝度成分に属することを表し、且つ第1QMは輝度QMの有効なサイズ範囲[MinQMSizeY,MaxQMSizeY]内にあり、MinQMSizeYは輝度QMの最小サイズを表し、MaxQMSizeYは輝度QMの最大サイズを表す。第2条件はcIdx!=0 && (matrixQMSize >= minQMSizeUV && matrixQMSize <= maxQMSizeUV )であり、第2条件は第1QMが、色差TBの量子化過程に用いられる色差成分に属することを表し、且つ第1QMは色差QMの有効なサイズ範囲[MinQMSizeUV,MaxQMSizeUV]内にあり、MinQMSizeUVは色差QMの最小サイズを表し、MaxQMSizeUVは色差QMの最大サイズを表す。
【0154】
上記の例において、復号側機器は、第1パラメータセットに含まれるシンタックス要素に基づき、QMの有効なサイズ範囲を計算する必要があり、その後、該有効なサイズ範囲に基づいて有効なQMを決定する。下記で紹介される例において、直接第1パラメータセットにおいて輝度QMの有効なサイズ範囲のシンタックス要素を定義してもよく、復号側機器は該シンタックス要素を読み取った後に、輝度QMの有効なサイズ範囲を直接得ることができ、その後、該輝度QMの有効なサイズ範囲に基づいて、色差フォーマットと併せて、色差QMの有効なサイズ範囲を決定する。具体的に以下のとおりである。
【0155】
別の例において、以下の方式を採用し、第1パラメータセットに含まれるシンタックス要素に基づいてQMの有効なサイズ範囲を決定する。
【0156】
1.1:第1パラメータセットに含まれるシンタックス要素に基づいて、輝度QMの有効なサイズ範囲を決定し、ここで、輝度QMの有効なサイズ範囲は輝度QMの最小サイズ及び最大サイズを含む。
【0157】
選択可能に、第1パラメータセットにおいて第5シンタックス要素を定義し、該第5シンタックス要素は輝度QMの最小サイズを指示することに用いられる。APSにおいて第6シンタックス要素を定義し、該第5シンタックス要素は輝度QMの最大サイズを指示することに用いられる。復号側機器は第1パラメータセットから上記第5シンタックス要素及び第6シンタックス要素を読み取り、輝度QMの最小サイズ及び最大サイズを決定する。
【0158】
1.2:輝度QMの有効なサイズ範囲と輝度成分に対する色差成分のサンプリングレートとに基づいて、色差QMの有効なサイズ範囲を決定する。ここで、色差QMの有効なサイズ範囲は色差QMの最小サイズ及び最大サイズを含む。
【0159】
選択可能に、第1パラメータセットにおいて第4シンタックス要素を定義し、該第4シンタックス要素は輝度成分に対する色差成分のサンプリングレートを指示することに用いられる。
【0160】
選択可能に、復号側機器は、輝度QMの最小サイズと輝度成分に対する色差成分のサンプリングレートとに基づいて、色差QMの最小サイズを計算し、輝度QMの最大サイズと輝度成分に対する色差成分のサンプリングレートとに基づいて、色差QMの最大サイズを計算する。
【0161】
例示的な実施例において、第1パラメータセットがAPSであることを例に、APSに含まれるシンタックス要素及びシンタックス構造テーブルは以下の表8に示される。
【0162】
【表8】
【0163】
aps_qm_size_info_present_flagはQMサイズに関連するシンタックス要素がビットストリームに存在するか否かを表す。その値が1であることはQMサイズに関連するシンタックス要素がビットストリームに現れることを表し、且つこれに基づいてQMの有効なサイズ範囲を決定し、これによってどのサイズのQMを復号する必要があるかを決めることができる。その値が0であることは、QMサイズに関連するシンタックス要素がビットストリームに存在せず、すべてのサイズのQMをいずれも復号する必要があることを表す。
【0164】
aps_log2_min_luma_qm_size_minus2について、その値+2は輝度QMの最小サイズを指し示す。
【0165】
aps_log2_max_luma_qm_size_minus5について、その値+5は輝度QMの最大サイズを指し示す。
【0166】
上記シンタックス要素に基づき、変数minQMSizeY(輝度QMの最小サイズを表す)及びmaxQMSizeY(輝度QMの最大サイズを表す)の導出過程は以下のとおりである。
【0167】
シンタックス要素aps_qm_size_info_present_flagの値が1であるときに、以下のとおりである。
【0168】
minQMSizeY = 1 << (aps_log2_min_luma_qm_size_minus2 + 2) 数式16
maxQMSizeY = 1 << (aps_log2_max_luma_qm_size_minus5 + 5) 数式17
【0169】
ここで、<<は左シフト演算子である。
【0170】
aps_qm_size_info_present_flagの値が1であるときに、minQMSizeY及びmaxQMSizeYはそれぞれSPSシンタックス要素によって計算して獲得されたTBサイズ変数MinCbSizeY及びVSizeの数値と同じであると規定される。
【0171】
シンタックス要素aps_qm_size_info_present_flagの値が0であるときに、以下のとおりである。
【0172】
minQMSizeY = 4、
maxQMSizeY = 64。
【0173】
aps_chroma_format_idcは輝度成分に対する色差成分のサンプリングレートを指し示し、具体的に表6に示される。その値はシンタックス要素chroma_format_idcの数値と同じであると規定される。
【0174】
変数minQMSizeUV(色差QMの最小サイズを表す)及びmaxQMSizeUV(色差QMの最大サイズを表す)の導出過程は以下のとおりである。
【0175】
シンタックス要素aps_qm_size_info_present_flagの値が1であるときに、以下のとおりである。
【0176】
【数8】
【0177】
ここで、!は論理否定演算を表し、
【数9】

は三項条件演算子である。
【0178】
シンタックス要素aps_qm_size_info_present_flagの値が0であるときに、以下のとおりである。
【0179】
minQMSizeUV = 2、
maxQMSizeUV = 32。
【0180】
いくつかの他の例において、復号側機器はSPSに含まれるシンタックス要素に基づいて、有効なQMを決定することもできる。具体的に、復号側機器はSPSに含まれるシンタックス要素に基づいて、輝度QMの有効なサイズ範囲[MinQMSizeY,MaxQMSizeY]及び色差QMの有効なサイズ範囲[MinQMSizeUV,MaxQMSizeUV]を計算することができる。ここで、変数MinQMSizeYは輝度QMの最小サイズを表し、変数MaxQMSizeYは輝度QMの最大サイズを表し、変数MinQMSizeUVは色差QMの最小サイズを表し、変数MaxQMSizeUVは色差QMの最大サイズを表す。
【0181】
上記表5に示されるSPSシンタックス構造テーブルと併せて参照されるように、上記変数は以下の数式によって計算して獲得することができる。
【0182】
【数10】
【0183】
ここで、<<は左シフト演算子であり、!は論理否定演算を表し、
【数11】

は三項条件演算子である。
【0184】
SPSに含まれるシンタックス要素に基づいて有効なQMを決定することに比べて、APSにおいて関連するシンタックス要素を定義し、該APSにおいて定義された関連シンタックス要素に基づいて有効なQMを決定することによって、APSとSPSとのコードストリームの間の分析依存性(parsing dependency)をなくすことができ、それによって、APSの復号はSPSのシンタックス要素に依存する必要がなくなる。
【0185】
例示的な実施例において、第1パラメータセットに含まれるシンタックス要素に基づいて、有効なQMを決定する上記ステップは、以下のいくつかのサブステップを含む。
【0186】
1:第1パラメータセットから第1QMに対応するフラグシンタックス要素の値を読み取る。
【0187】
2:もし第1QMに対応するフラグシンタックス要素の値が第1の数値であるなら、第1QMが有効なQMに属すると決定する。
【0188】
3:もし第1QMに対応するフラグシンタックス要素の値が第2の数値であるなら、第1QMが有効なQMに属しないと決定する。
【0189】
本実施例において、APSにおいて1つのフラグシンタックス要素を定義することによって、該フラグシンタックス要素によってQMが有効なQMに属するか否かを指示する。該フラグシンタックス要素の記述子はu(1)であってもよく、1ビットの符号なし整数を表す。例えば、該フラグシンタックス要素の値が1であることは、QMが有効なQMに属することを表し、それに対して復号を行う必要があり、該フラグシンタックス要素の値が0であることは、QMが有効なQMに属しないことを表し、それに対して復号を行う必要がない。復号を行わないQMについては、そのすべての要素がデフォルト値であると予め定義する。選択可能に、該デフォルト値は16であり、数式1を併せて参照し、このときに、TBにおけるすべての変換係数の伸縮量子化係数がいずれも1であるため、QMを使用しない効果と同じである。
【0190】
また、第1QMは任意の1つの使用可能なQM、すなわち、上記全部の28個のQMのうちの任意の1つであってもよい。
【0191】
選択可能に、第1パラメータセットはAPSである。勿論、いくつかの他の実施例において、第1パラメータセットはAPSではなくてもよく、本願の実施例はこれを限定しない。
【0192】
例示的な実施例において、第1パラメータセットがAPSであることを例に、APSに含まれるシンタックス要素及びシンタックス構造テーブルは以下の表9に示される。
【0193】
【表9】
【0194】
選択可能に、上記フラグシンタックス要素はscaling_matrix_present_flagである。scaling_matrix_present_flag[ id ]について、その値が1であることは、現在のQMを復号する必要があることを表し、その値が0であることは、現在のQMを復号する必要がないことを表し、復号側機器は該QMのすべての要素が16であると推測できる。
【0195】
選択可能に、輝度QMは1つのフラグシンタックス要素に対応し、該輝度QMを復号する必要があるか否かを表す。同じ予測モード及び同じサイズを有する第1色差QM(すなわちCbに対応するQM)及び第2色差QM(すなわちCrに対応するQM)については、同一のフラグシンタックス要素を共有して、該第1色差QM及び第2色差QMを復号する必要があるか否かを表す。すなわち、第1色差QM及び第2色差QMはそれぞれ1つのフラグシンタックス要素を単独で使用する必要がなく、これは、QM符号化シグナリングのビットオーバーヘッドを更に節約することに寄与する。
【0196】
例示的な実施例において、第1パラメータセットがAPSであることを例に、APSに含まれるシンタックス要素及びシンタックス構造テーブルは以下の表10に示される。
【0197】
【表10】
【0198】
scaling_matrix_present_flag[ predMode != MODE_INTRA ][ cIdx != 0 ][ sizeId ]の値が1であるときに、輝度QMとして復号するときに、APSにおいて該輝度QMを符号化することを表し、色差QMとして復号するときに、APSにおいて予測モードがpredModeであり且つサイズが同じである色差Cb及びCrに対応するQMを符号化することを表す。このシンタックス要素の値が0であるときに、輝度QM又は2つの色差QMを復号する必要がないことを表し、復号側機器はそれらの要素がいずれも16であると推測できる。
【0199】
説明する必要がある点として、符号化側機器にとって、各QMに対応するフラグシンタックス要素の値を設定するとき、すなわち、どのQMを符号化する必要があるか、どのQMを符号化する必要がないかを決定するときに、QMのサイズに基づいて行ってもよく、QMに対応する符号化予測モードに基づいて行ってもよく、さらにQMに対応するYUV色成分に基づいて行ってもよく、又はQMのサイズ、符号化予測モード及びYUV色成分のうちの複数の要素と併せて統合的に考慮してもよく、本願の実施例はこれを限定しない。
【0200】
本実施例において、第1パラメータセットにおいて1つのフラグシンタックス要素を定義することによって、該フラグシンタックス要素によってQMが有効なQMに属するか否かを指示し、それにより各QMを復号する必要があるか否かをより柔軟に指示することができる。
【0201】
図11に参照されるように、それは本願の1つの実施例が提供するビデオ符号化方法のフローチャートを示す。本実施例において、主に該方法が上記で紹介された符号化側機器に適用されることを例として説明する。該方法は以下のいくつかのステップ(1101~1102)を含んでもよい。
【0202】
ステップ1101:符号化対象のビデオフレームに対応する有効なQMを決定し、該有効なQMとは符号化対象のビデオフレームの符号化過程において変換係数に対して量子化を行うときに実際に使用するQMを指す。
【0203】
符号化対象のビデオフレームは符号化対象のビデオにおける任意の1つの符号化対象のビデオフレーム(又は画像フレームと称される)であってもよい。
【0204】
変換係数に対して量子化を行うときに使用する可能性があるQMの数量がnであると仮定すると、該有効なQMの数量はn未満である可能性があり、nに等しい可能性もあり、nは正の整数である。例えば、変換係数に対して量子化を行うときに実際に全部のn個のQMを使用すると、有効なQMの数量はnであり、変換係数に対して量子化を行うときに実際に全部のn個のQMのうちの一部のQM(例えばm個のQM、mはn未満の正の整数である)を使用すると、有効なQMの数量はmである。
【0205】
選択可能に、有効なQMに属しない他のQMについては、そのすべての要素がデフォルト値であると予め定義する。選択可能に、該デフォルト値は16であり、数式1を併せて参照し、このときに、TBにおけるすべての変換係数の伸縮量子化係数がいずれも1であるため、QMを使用しない効果と同じである。
【0206】
ステップ1102:該有効なQMを決定することに用いられるシンタックス要素及び有効なQMに対して符号化を行い、第1パラメータセットに対応するコードストリームを生成し、ここで、第1パラメータセットはQMに関連するシンタックス要素を定義することに用いられるパラメータセットを含む。
【0207】
有効なQMを決定した後に、有効なQMの数量が1つである可能性があり、複数である可能性もあるため、符号化側機器はそれぞれ各有効なQMに対して符号化を行う必要がある。任意の1つの有効なQMを例に、該有効なQMに対して符号化を行うときに、該有効なQMに対応する最適モードを決定でき、その後、該最適モードに基づいて該有効なQMを符号化する。ここで、最適モードは、上記で紹介されたフレーム間予測モードのコピーモデル、フレーム間予測モードの予測モード及びフレーム内予測モードという三種の候補モードから選ばれる、ビットコストが最小のモードであってもよい。
【0208】
例えば、上記表1を併せて参照し、変換係数に対して量子化を行うときに使用する可能性があるQMの数量が28個であり、そのうち12個が有効なQMであることを決定したと仮定すると、符号化側機器は該12個の有効なQMに対して符号化を行うだけでよく、残り16個の無効なQMに対して符号化を行う必要がない。
【0209】
また、符号化側機器は有効なQMに対して符号化を行う必要があることに加えて、有効なQMを決定することに用いられるシンタックス要素に対して符号化を行う必要があり、それによって復号側機器は該シンタックス要素に基づいて有効なQMを決定する。符号化側機器は、有効なQMを決定することに用いられるシンタックス要素及び有効なQMに対して符号化を行い、第1パラメータセットに対応するコードストリームを生成する。該第1パラメータセットはAPSであってもよく、QMに関連するシンタックス要素を定義することに用いられる他のパラメータセットであってもよく、本願の実施例はこれを限定しない。
【0210】
以上のように、本願の実施例が提供する技術的手段において、符号化対象のビデオフレームに対応する有効なQMを決定することによって、該有効なQMとは該符号化対象のビデオフレームの符号化過程において変換係数に対して量子化を行うときに実際に使用するQMを指し、その後、該有効なQMを決定することに用いられるシンタックス要素及び有効なQMに対して符号化を行い、第1パラメータセットに対応するコードストリームを生成する。このように、エンコーダ側は有効なQMのみを符号化して伝送し、それによりQMシグナリングが占有する必要があるコードワードの節約に寄与し、ビットオーバーヘッドを低減させ、且つデコーダ側は有効なQMに対して復号を行うだけでよく、それによりデコーダ側の計算の複雑度合いを低減させる。
【0211】
また、符号化側機器の符号化過程は復号側機器の復号過程と対応し、符号化過程において詳細に説明していない細部については、上記の復号過程の実施例についての紹介及び説明を参照でき、ここでは再度詳細に説明しない。
【0212】
下記は本願の装置の実施例であり、本願の方法の実施例を実行することに用いることができる。本願の装置の実施例に開示されていない細部については、本願の方法の実施例を参照できる。
【0213】
図12に参照されるように、それは本願の1つの実施例が提供するビデオ復号装置のブロック図を示す。該装置は上記ビデオ復号方法の例を実現する機能を有し、上記機能はハードウェアにより実現されてもよく、ハードウェアが相応なソフトウェアを実行することにより実現されてもよい。該装置は上記で紹介された復号側機器であってもよく、復号側機器上に設置されてもよい。該装置1200は、パラメータ取得モジュール1210と、QM決定モジュール1220と、QM復号モジュール1230とを含んでもよい。
【0214】
パラメータ取得モジュール1210は、復号対象のビデオフレームに対応する第1パラメータセットを取得することに用いられ、上記第1パラメータセットはQMに関連するシンタックス要素を定義することに用いられるパラメータセットである。
【0215】
QM決定モジュール1220は、上記第1パラメータセットに含まれるシンタックス要素に基づいて、有効なQMを決定することに用いられ、上記有効なQMとは上記復号対象のビデオフレームの復号過程において量子化された変換係数に対して逆量子化を行うときに実際に使用するQMを指す。
【0216】
QM復号モジュール1230は、上記有効なQMに対して復号を行うことに用いられる。
【0217】
例示的な実施例において、図13に示すように、上記QM決定モジュール1220は、範囲決定ユニット1221と、QM決定ユニット1222とを含む。
【0218】
範囲決定ユニット1221は、上記第1パラメータセットに含まれるシンタックス要素に基づいて、QMの有効なサイズ範囲を決定することに用いられる。
【0219】
QM決定ユニット1222は、上記有効なサイズ範囲内に属するQMを上記有効なQMとして決定することに用いられる。
【0220】
例示的な実施例において、上記範囲決定ユニット1221は、
上記第1パラメータセットに含まれるシンタックス要素に基づいて、最小の輝度符号化ブロックサイズ、輝度符号化ツリーのブロックサイズ及び最大の輝度TBサイズを決定することと、
上記最小の輝度符号化ブロックサイズ、上記輝度符号化ツリーのブロックサイズ及び上記最大の輝度TBサイズに基づいて、輝度QMの有効なサイズ範囲を決定することであって、ここで、上記輝度QMの有効なサイズ範囲は上記輝度QMの最小サイズ及び最大サイズを含む、ことと、
上記輝度QMの有効なサイズ範囲と輝度成分に対する色差成分のサンプリングレートとに基づいて、色差QMの有効なサイズ範囲を決定することであって、ここで、上記色差QMの有効なサイズ範囲は上記色差QMの最小サイズ及び最大サイズを含む、ことと、に用いられる。
【0221】
例示的な実施例において、上記範囲決定ユニット1221は、
上記最小の輝度符号化ブロックサイズに基づいて、上記輝度QMの最小サイズを決定することと、
上記輝度符号化ツリーのブロックサイズ及び上記最大の輝度TBサイズのうちの比較的大きな値を、上記輝度QMの最大サイズとして決定することと、に用いられる。
【0222】
例示的な実施例において、上記範囲決定ユニット1221は、
上記第1パラメータセットに含まれるシンタックス要素に基づいて、輝度QMの有効なサイズ範囲を決定することであって、ここで、上記輝度QMの有効なサイズ範囲は上記輝度QMの最小サイズ及び最大サイズを含む、ことと、
上記輝度QMの有効なサイズ範囲と輝度成分に対する色差成分のサンプリングレートとに基づいて、色差QMの有効なサイズ範囲を決定することであって、ここで、上記色差QMの有効なサイズ範囲は上記色差QMの最小サイズ及び最大サイズを含む、ことと、に用いられる。
【0223】
例示的な実施例において、上記範囲決定ユニット1221は、
上記輝度QMの最小サイズと上記輝度成分に対する色差成分のサンプリングレートとに基づいて、上記色差QMの最小サイズを計算することと、
上記輝度QMの最大サイズと上記輝度成分に対する色差成分のサンプリングレートとに基づいて、上記色差QMの最大サイズを計算することと、に用いられる。
【0224】
例示的な実施例において、上記QM決定ユニット1222は、
もし第1QMが第1条件及び第2条件のうちの1つを満たすなら、上記第1QMを上記有効なQMとして決定することに用いられ、
ここで、上記第1条件はcIdx==0 && (matrixQMSize >= minQMSizeY && matrixQMSize <= maxQMSizeY )であり、上記第1条件は上記第1QMが、輝度TBの量子化過程に用いられる輝度成分に属することを表し、且つ上記第1QMは上記輝度QMの有効なサイズ範囲[MinQMSizeY,MaxQMSizeY]内にあり、上記MinQMSizeYは上記輝度QMの最小サイズを表し、上記MaxQMSizeYは上記輝度QMの最大サイズを表し、
上記第2条件はcIdx!=0 && (matrixQMSize >= minQMSizeUV && matrixQMSize <= maxQMSizeUV )であり、上記第2条件は上記第1QMが、色差TBの量子化過程に用いられる色差成分に属することを表し、且つ上記第1QMは上記色差QMの有効なサイズ範囲[MinQMSizeUV,MaxQMSizeUV]内にあり、上記MinQMSizeUVは上記色差QMの最小サイズを表し、上記MaxQMSizeUVは上記色差QMの最大サイズを表す。
【0225】
例示的な実施例において、図13に示すように、上記QM決定モジュール1220は、要素読取ユニット1223と、QM判定ユニット1224とを含む。
【0226】
要素読取ユニット1223は、上記第1パラメータセットから第1QMに対応するフラグシンタックス要素の値を読み取ることに用いられる。
【0227】
QM判定ユニット1224は、もし上記第1QMに対応するフラグシンタックス要素の値が第1の数値であるなら、上記第1QMが上記有効なQMに属すると決定し、もし上記第1QMに対応するフラグシンタックス要素の値が第2の数値であるなら、上記第1QMが上記有効なQMに属しないと決定することに用いられる。
【0228】
例示的な実施例において、同じ予測モード及び同じサイズを有する第1色差QM及び第2色差QMは、同一のフラグシンタックス要素を共有する。
【0229】
例示的な実施例において、上記フラグシンタックス要素はscaling_matrix_present_flagである。
【0230】
例示的な実施例において、上記第1パラメータセットはAPSである。
【0231】
例示的な実施例において、上記有効なQMに属しない他のQMについては、そのすべての要素がデフォルト値であると予め定義する。
【0232】
例示的な実施例において、上記デフォルト値は16である。
【0233】
以上のように、本願の実施例が提供する技術的手段において、復号対象のビデオフレームに対応する第1パラメータセットを取得することによって、該第1パラメータセットに含まれるシンタックス要素に基づいて有効なQMを決定する。該有効なQMとは該復号対象のビデオフレームを符号化して生成する過程において変換係数に対して量子化を行うときに実際に使用するQMを指し、その後、該有効なQMに対して復号を行う。このように、デコーダ側は有効なQMに対して復号を行うだけでよく、それによりデコーダ側の計算の複雑度合いを低減させる。
【0234】
図14に参照されるように、それは本願の1つの実施例が提供するビデオ符号化装置のブロック図を示す。該装置は上記ビデオ符号化方法の例を実現する機能を有し、上記機能はハードウェアにより実現されてもよく、ハードウェアが相応なソフトウェアを実行することにより実現されてもよい。該装置は上記で紹介された符号化側機器であってもよく、符号化側機器上に設置されてもよい。該装置1400は、QM決定モジュール1410とQM符号化モジュール1420とを含んでもよい。
【0235】
QM決定モジュール1410は、符号化対象のビデオフレームに対応する有効なQMを決定することに用いられ、上記有効なQMとは上記符号化対象のビデオフレームの符号化過程において変換係数に対して量子化を行うときに実際に使用するQMを指す。
【0236】
QM符号化モジュール1420は、上記有効なQMを決定することに用いられるシンタックス要素及び上記有効なQMに対して符号化を行って、第1パラメータセットに対応するコードストリームを生成することに用いられる。ここで、上記第1パラメータセットはQMに関連するシンタックス要素を定義することに用いられるパラメータセットである。
【0237】
以上のように、本願の実施例が提供する技術的手段において、符号化対象のビデオフレームに対応する有効なQMを決定することによって、該有効なQMとは該符号化対象のビデオフレームの符号化過程において変換係数に対して量子化を行うときに実際に使用するQMを指し、その後、該有効なQMを決定することに用いられるシンタックス要素及び有効なQMに対して符号化を行い、第1パラメータセットに対応するコードストリームを生成する。このように、エンコーダ側は有効なQMのみを符号化して伝送し、それによりQMシグナリングが占有する必要があるコードワードの節約に寄与し、ビットオーバーヘッドを低減させ、且つデコーダ側は有効なQMに対して復号を行うだけでよく、それによりデコーダ側の計算の複雑度合いを低減させる。
【0238】
説明する必要がある点として、上記実施例が提供する装置については、その機能を実現するときに、上記各機能モジュールの分割のみを例に説明したが、実際のアプリケーションにおいて、必要に応じて上記機能を異なる機能モジュールに割り当てて完成させることができる。すなわち、機器の内部構造を異なる機能モジュールに分割して、以上に記述された全部又は一部の機能を完成させる。また、上記実施例が提供する装置は方法の実施例と同一の発想に属し、その具体的な実現過程は詳しくは方法の実施例を参照することができるため、ここでは再度詳細に説明しない。
【0239】
図15に参照されるように、それは本願の1つの実施例が提供するコンピュータ機器の構造ブロック図を示す。該コンピュータ機器は上記で紹介された符号化側機器であってもよく、上記で紹介された復号側機器であってもよい。該コンピュータ機器150はプロセッサ151、メモリ152、通信インタフェース153、エンコーダ/デコーダ154及びバス155を含んでもよい。
【0240】
プロセッサ151は1つ又は1つ以上の処理コアを含み、プロセッサ151はソフトウェアプログラム及びモジュールを動作させることによって、各種の機能アプリケーション及び情報処理を実行する。
【0241】
メモリ152はコンピュータプログラムを記憶することに用いることができ、プロセッサ151は該コンピュータプログラムを実行することに用いられ、それによって、上記ビデオ符号化方法を実現し、又は上記ビデオ復号方法を実現する。
【0242】
通信インタフェース153は他の機器と通信することに用いることができ、例えばオーディオ・ビデオデータを送受信する。
【0243】
エンコーダ/デコーダ154は符号化及び復号機能を実現することに用いることができ、例えばオーディオ・ビデオデータに対して符号化及び復号を行う。
【0244】
メモリ152はバス155によってプロセッサ151と連結される。
【0245】
また、メモリ152はいかなるタイプの揮発性又は不揮発性記憶機器又はそれらの組み合わせにより実現されてもよい。揮発性又は不揮発性記憶機器は、磁気ディスク又はコンパクトディスク、EEPROM(Electrically Erasable Programmable Read-Only Memory、電気的消去可能プログラマブル読み出し専用メモリ)、EPROM(Erasable Programmable Read-Only Memory、消去可能プログラマブル読み出し専用メモリ)、SRAM(Static Random-Access Memory、スタティックランダムアクセスメモリ)、ROM(Read-Only Memory、読み出し専用メモリ)、磁気メモリ、フラッシュメモリ、及びPROM(Programmable read-only memory、プログラマブル読み出し専用メモリ)を含むが、それらに限定されない。
【0246】
当業者であれば理解できるように、図15に示される構造はコンピュータ機器150に対する限定を構成するものではなく、図示よりも多い又は少ないコンポーネントを含んでもよく、又はあるいくつかのコンポーネントを組み合わせてもよく、又は異なるコンポーネントを採用して配置してもよい。
【0247】
例示的な実施例において、さらにコンピュータ可読記憶媒体を提供し、上記コンピュータ可読記憶媒体に少なくとも1つの命令、少なくとも1つのプログラム、コードセット又は命令セットが記憶されており、上記少なくとも1つの命令、上記少なくとも1つのプログラム、上記コードセット又は上記命令セットはプロセッサに実行されるときに、上記ビデオ復号方法を実現し、又は上記ビデオ符号化方法を実現する。
【0248】
例示的な実施例において、さらにコンピュータプログラム製品を提供し、該コンピュータプログラム製品はプロセッサに実行されるときに、それは上記ビデオ復号方法を実現し、又は上記ビデオ符号化方法を実現することに用いられる。
【0249】
理解されるように、本明細書に言及される「複数」とは2つ又は2つ以上を指す。「及び/又は」は、関連対象の関連関係を記述し、三種の関係が存在してもよいことを表し、例えば、A及び/又はBは、Aが単独で存在すること、A及びBが同時に存在すること、Bが単独で存在することという3つの状況を表してもよい。文字「/」は一般的に、前後の関連対象が一種の「又は」の関係であることを表す。
【0250】
以上は単に本願の例示的な実施例であり、本願を制限するために用いられず、本願の精神及び原則内に作られるいかなる修正、均等物への置換や改良等もいずれも本願の保護範囲内に含まれるべきである。
【符号の説明】
【0251】
60 ビデオエンコーダ
62 変換モジュール
64 量子化モジュール
66 エントロピー符号化モジュール
70 ビデオデコーダ
72 エントロピー復号モジュール
74 逆量子化モジュール
76 逆変換モジュール
150 コンピュータ機器
151 プロセッサ
152 メモリ
153 通信インタフェース
154 デコーダ
155 バス
200 通信システム
210 第1機器
220 第2機器
230 第3機器
240 第4機器
250 ネットワーク
301 ビデオソース
302 ビデオピクチャストリーム
303 ビデオエンコーダ
304 ビデオデータ
305 ストリーミングサーバ
310 ビデオデコーダ
311 出力ビデオピクチャストリーム
312 ディスプレイ
313 収集サブシステム
1210 パラメータ取得モジュール
1220 QM決定モジュール
1221 範囲決定ユニット
1222 QM決定ユニット
1223 要素読取ユニット
1224 QM判定ユニット
1230 QM復号モジュール
1410 QM決定モジュール
1420 QM符号化モジュール
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
【手続補正書】
【提出日】2024-07-30
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
ビデオ復号方法であって、前記方法は、
復号対象のビデオフレームに対応する第1パラメータセットを取得するステップであって、前記第1パラメータセットは量子化マトリクスQMに関連するシンタックス要素を含む、ステップと、
前記第1パラメータセットに含まれるシンタックス要素に基づいて、有効なQMを決定するステップであって、前記有効なQMとは前記復号対象のビデオフレームの復号過程において量子化された変換係数に対して逆量子化を行うときに使用されるQMを指す、ステップと、
前記有効なQMに対して復号を行うステップと、を含む、ビデオ復号方法。
【外国語明細書】