【文献】
Marta Mrak(外2名),Transform skip mode,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 JCTVC-G575,米国,ITU-T,2011年11月30日,p.1-13
(58)【調査した分野】(Int.Cl.,DB名)
前記ビデオ残差データの前記処理することは、ビットシフトするステップが、複数のユニットの1つまたは複数においてまたは複数のユニットの1つまたは複数の後に発生するように、少なくとも前記変換ユニットおよび前記量子化ユニットを含んでいる前記複数のユニット内で実行されることを特徴とする請求項1に記載の方法。
前記処理することにおいて使用された前記ビデオブロックに関連して量子化された係数の前記送信されエントロピコーディングされた第1のグループから再構成された、再構成されたビデオブロックの同一のダイナミックレンジを保持するステップをさらに備えたことを特徴とする請求項4に記載の方法。
前記再構成されたビデオブロックの前記同一のダイナミックレンジを保持する前記ステップは、前記複数のユニットの各々においてまたは前記複数のユニットの各々の後で前記ダイナミックレンジを調整するステップを含むことを特徴とする請求項5に記載の方法。
(1)係数の前記第1のセットを前記ビットシフトするステップは、Nビット演算によって実現されたそのダイナミックレンジを最大にすることであり、Nは、正の整数値であり、(2)係数の前記第2のセットを前記ビットシフトするステップは、Nビット演算によって実現されたその前記ダイナミックレンジを最大にすることであり、Nは、正の整数値であり、または(3)量子化された係数の前記第1のグループを前記ビットシフトするステップは、その前記ダイナミックレンジを前記ビデオ残差データのそれに調整することであることを特徴とする請求項2に記載の方法。
スケール係数の前記セットにおける前記スケール係数の前記2番目のものは、スケール係数の前記セットにおける前記スケール係数の前記最初のものに関連して循環的にシフトされることを特徴とする請求項1または9に記載の方法。
逆スケール係数の前記セットにおける前記逆スケール係数の前記2番目のものは、逆スケール係数の前記セットにおける前記逆スケール係数の前記最初のものに関連して循環的にシフトされることを特徴とする請求項2、10、11、または12に記載の方法。
【発明を実施するための形態】
【0013】
図1Aは、1または複数の実施形態を実行し、かつ/または実施することができる例のビデオ符号化および復号システム100を示すブロック図である。システム100は、通信チャネル116を介して宛先デバイス114に符号化されたビデオ情報を送信することができるソースデバイス112を含むことができる。
【0014】
ソースデバイス112および/または宛先デバイス114は、広範囲のデバイスのいずれとすることもできる。いくつかの代表的な実施形態では、ソースデバイス112および/または宛先デバイス114は、無線送受器または通信チャネル116を介してビデオ情報を通信することができる任意の無線デバイス(この場合に、通信チャネル116は無線リンクを含む)などの無線送受信ユニット(WTRU)を含むことができる。しかし、本明細書で説明され、開示され、または他の形で明示的に、暗黙のうちに、および/もしくは固有に提供される(集合的に「提供される」)方法、装置、およびシステムは、必ずしも無線アプリケーションまたは無線設定に限定されない。たとえば、これらの技法は、無線テレビジョン放送、ケーブルテレビジョン伝送、衛星テレビジョン伝送、インターネットビデオ伝送、記憶媒体に符号化される符号化されたディジタルビデオ、および/または他のシナリオに適用することができる。通信チャネル116は、符号化されたビデオデータの伝送に適する無線媒体または有線媒体の任意の組合せを含むことができ、かつ/またはそれらとすることができる。
【0015】
ソースデバイス112は、ビデオ符号器ユニット118、送信および/もしくは受信(Tx/Rx)ユニット120、ならびに/またはTx/Rx要素122を含むことができる。図示されているように、ソースデバイス112は、ビデオソース124を含むことができる。宛先デバイス114は、Tx/Rx要素126、Tx/Rxユニット128、および/またはビデオ復号器ユニット130を含むことができる。図示されているように、宛先デバイス114は、ディスプレイデバイス132を含むことができる。Tx/Rxユニット120、128のそれぞれは、送信器、受信器、または送信器および受信器の組合せ(たとえば、トランシーバすなわち送信器−受信器)とすることができ、またはこれらを含むことができる。Tx/Rx要素122、126のそれぞれは、たとえばアンテナとすることができる。本開示によれば、ソースデバイス112のビデオ符号器ユニット118および/または宛先デバイス114のビデオ復号器ユニット130を、本明細書で提供されるコーディング技法を適用するように構成し、かつ/または適合させる(集合的に「適合させる」)ことができる。
【0016】
ソースデバイス112および宛先デバイス114は、他の要素/コンポーネントまたは配置を含むことができる。たとえば、ソースデバイス112を、外部ビデオソースからビデオデータを受け取るように適合させることができる。宛先デバイス114は、外部ディスプレイデバイス(図示せず)とインターフェース接続することができ、かつ/または(たとえば、一体化された)ディスプレイデバイス132を含み、かつ/もしくは使用することができる。いくつかの実施形態では、ビデオ符号器ユニット118によって生成されたビデオストリームを、直接ディジタル転送によるなど、データを搬送波に変調することなく他のデバイスに伝えることができ、他のデバイスは、送信のためにデータを変調してもしなくてもよい。
【0017】
本明細書で提供される技法を、任意のディジタルビデオ符号化デバイスおよび/またはディジタルビデオ復号デバイスによって実行することができる。一般に、本明細書で提供される技法は、別々のビデオ符号化デバイスおよび/またはビデオ復号デバイスによって実行されるが、これらの技法を、通常は「コーデック」と称する組み合わされたビデオ符号器/復号器によって実行することもできる。本明細書で提供される技法を、ビデオプリプロセッサまたは類似物によって実行することもできる。ソースデバイス112および宛先デバイス114は、ソースデバイス112が、宛先デバイス114への送信のために符号化されたビデオ情報を生成することができる(かつ/またはビデオデータを受け取り、そのようなビデオ情報を生成することができる)そのようなコーディングデバイスの単なる例である。いくつかの代表的な実施形態では、ソースデバイス112および宛先デバイス114は、デバイス112、114のそれぞれがビデオ符号化コンポーネントおよび/または要素(集合的に「要素」)とビデオ復号コンポーネントおよび/または要素との両方を含むことができるように、実質的に対称の形で動作することができる。したがって、システム100は、ソースデバイス112と宛先デバイス114との間の1方向および2方向のビデオ伝送(たとえば、とりわけ、ビデオストリーミング、ビデオ再生、ビデオブロードキャスト、ビデオ電話、および/またはビデオ会議のいずれかのための)のいずれかをサポートすることができる。ある種の代表的な実施形態では、ソースデバイス112を、たとえば、1または複数の宛先デバイスのために符号化されたビデオ情報を生成する(かつ/または、ビデオデータを受け取り、そのようなビデオデータを生成する)ように適合されたビデオストリーミングサーバとすることができ、宛先デバイスは、有線通信システムおよび/または無線通信システムを介してソースデバイス112と通信しているものとすることができる。
【0018】
外部ビデオソースおよび/またはビデオソース124は、ビデオカメラ、以前に取り込まれたビデオを含むビデオアーカイブ、および/またはビデオコンテンツプロバイダからのビデオフィードなど、ビデオ取込デバイスとし、かつ/またはこれを含むことができる。ある種の代表的な実施形態では、外部ビデオソースおよび/またはビデオソース124は、ソースビデオとしてのコンピュータグラフィックスベースのデータ、または生ビデオ、アーカイブされたビデオおよび/またはコンピュータ生成されたビデオの組合せを生成することができる。ある種の代表的実施形態では、ビデオソース124がビデオカメラである時に、ソースデバイス112および宛先デバイス114を、カメラ付き電話機またはビデオ付き電話機とすることができ、かつ/またはこれを実施することができる。
【0019】
取り込まれた、事前に取り込まれた、コンピュータ生成されたビデオ、ビデオフィード、および/または他のタイプのビデオデータ(集合的に「符号化されていないビデオ」)を、ビデオ符号器ユニット118によって符号化して、符号化されたビデオ情報を形成することができる。Tx/Rxユニット120は、符号化されたビデオ情報を変調することができる(たとえば、通信標準に従って、符号化されたビデオ情報を搬送する1または複数の変調された信号を形成するために)。Tx/Rxユニット120は、変調された信号を送信のためにその送信器に渡すことができる。送信器は、Tx/Rx要素122を介して宛先デバイス114に変調された信号を送信することができる。
【0020】
宛先デバイス114では、Tx/Rxユニット128が、チャネル116上からTx/Rx要素122、126を介して変調された信号を受信することができる。Tx/Rxユニット128は、変調された信号を復調して、符号化されたビデオ情報を取得することができる。Tx/Rxユニット128は、符号化されたビデオ情報をビデオ復号器ユニット130に渡すことができる。
【0021】
ビデオ復号器ユニット130は、符号化されたビデオ情報を復号して、復号されたビデオデータを取得することができる。符号化されたビデオ情報は、ビデオ符号器ユニット118によって定義される構文情報を含むことができる。この構文情報は、1または複数の要素(「構文要素」)を含むことができ、その一部またはすべてが、符号化されたビデオ情報の復号に有用である可能性がある。構文要素は、たとえば、符号化されたビデオ情報の特性を含むことができる。構文要素は、符号化されたビデオ情報を形成するのに使用された符号化されていないビデオの特性を含み、かつ/またはその符号化されていないビデオの処理を記述することもできる。
【0022】
ビデオ復号器ユニット130は、後の格納および/または外部ディスプレイ(図示せず)上での表示のために、復号されたビデオデータを出力することができる。ある種の代表的な実施形態では、ビデオ復号器ユニット130は、ディスプレイデバイス132に復号されたビデオデータを出力することができる。ディスプレイデバイス132は、復号されたビデオデータをユーザに表示するように適合された任意の個々の、複数の、組み合わされた、さまざまなディスプレイデバイスとすることができ、かつ/またはこれを含むことができる。そのようなディスプレイデバイスの例は、とりわけ、液晶ディスプレイ(LCD)、プラズマディスプレイ、有機発光ダイオード(OLED)ディスプレイ、および/または陰極線管(CRT)を含む。
【0023】
通信チャネル116は、ラジオ周波数(RF)スペクトルまたは1もしくは複数の物理伝送線などの任意の無線通信媒体もしくは有線通信媒体、または無線媒体および有線媒体の任意の組合せとすることができる。通信チャネル116は、ローカルエリアネットワーク、広域ネットワーク、またはインターネットなどのグローバルネットワークなど、パケットベースのネットワークの一部を形成することができる。通信チャネル116は、一般に、有線媒体および/または無線媒体の任意の適切な組合せを含む、ソースデバイス112から宛先デバイス114にビデオデータを送信するための任意の適切な通信媒体または異なる通信媒体の集合を表す。通信チャネル116は、ソースデバイス112から宛先デバイス114への通信を容易にするのに有用である可能性がある、ルータ、スイッチ、基地局、および/または任意の他の機器を含むことができる。デバイス112と114との間のそのような通信を容易にすることができる例の通信システムの詳細を、下で
図4A〜4Eを参照して提供する。ソースデバイス112および宛先デバイス114を表すことができるデバイスの詳細も、下で提供する。
【0024】
ビデオ符号器ユニット118およびビデオ復号器ユニット130は、たとえば、とりわけ、MPEG−2、H.261、H.263、H.264、H.264/AVC、および/またはSVC拡張に従って拡張されたH.264(「H.264/SVC」)などの1または複数の標準および/または仕様に従って動作することができる。本明細書で示される方法、装置、および/またはシステムが、異なる標準に従って(および/またはこれに準拠して)実施された他のビデオ符号器、ビデオ復号器、および/もしくはビデオコーデックに、または将来のビデオ符号器、ビデオ復号器、および/またはビデオコーデックを含むプロプライエタリなビデオ符号器、ビデオ復号器、および/もしくはビデオコーデックに適用可能であることを、当業者は理解する。本明細書で示される技法は、どの特定のコーディング標準にも限定されない。
【0025】
上で注記したH.264/AVCの関連部分は、国際電気通信連合からITU−T勧告H.264として取得可能である(たとえば、より具体的には、参照によって本明細書に組み込まれている、本明細書でH.264標準、H.264仕様、H.264/AVC標準、および/またはH.264/AVC仕様と称する場合がある、非特許文献4および非特許文献5参照)。本明細書で提供される技法を、H.264標準に準拠する(たとえば、全体的に準拠する)デバイスに適用することができる。
【0026】
図1Aには図示されていないが、ビデオ符号器ユニット118およびビデオ復号器ユニット130のそれぞれは、オーディオ符号器および/またはオーディオ復号器を含み、かつ/またはこれと一体化され得る(適当に)。ビデオ符号器ユニット118およびビデオ復号器ユニット130は、共通のデータストリームおよび/または別々のデータストリーム内のオーディオとビデオとの両方の符号化を処理するために、適当なマルチプレクサ−デマルチプレクサユニットまたは他のハードウェアおよび/もしくはソフトウェアを含むことができる。適用可能な場合に、マルチプレクサ−デマルチプレクサユニットは、ITU−T勧告H.223マルチプレクサプロトコルおよび/またはユーザデータグラムプロトコル(UDP)などの他のプロトコルに準拠することができる。
【0027】
1または複数のビデオ符号器ユニット118およびビデオ復号器ユニット130を、1または複数の符号器および/または復号器に含めることができ、この符号器および/または復号器のいずれかを、コーデックの一部として一体化することができ、とりわけ、それぞれのカメラ、コンピュータ、モバイルデバイス、加入者デバイス、ブロードキャストデバイス、セットトップボックス、および/またはサーバと一体化し、かつ/または組み合わせることができる。ビデオ符号器ユニット118および/またはビデオ復号器ユニット130を、1または複数のマイクロプロセッサ、ディジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、ディスクリート論理、ソフトウェア、ハードウェア、ファームウェア、またはその任意の組合せなど、それぞれさまざまな適切な符号器回路網および/または復号器回路網のいずれかとして実施することができる。ビデオ符号器ユニット118およびビデオ復号器ユニット130のいずれかまたは両方を、実質的にソフトウェアで実施することができ、ビデオ符号器ユニット118および/またはビデオ復号器ユニット130の要素の動作を、1または複数のプロセッサ(図示せず)によって実行される適当なソフトウェア命令によって実行することができる。そのような実施形態は、プロセッサに加えて、オフチップコンポーネント、たとえば、とりわけ、外部ストレージ(たとえば、不揮発性メモリの形の)および/または入出力インターフェースを含むことができる。
【0028】
ビデオ符号器ユニット118および/またはビデオ復号器ユニット130の要素の動作を1または複数のプロセッサによって実行されるソフトウェアによって実行できる任意の実施形態では、ソフトウェア命令を、たとえば、とりわけ、CPUによって可読の、磁気ディスク、光ディスク、任意の他の揮発性(たとえば、ランダムアクセスメモリ(「RAM」))、不揮発性(たとえば、読取り専用メモリ(「ROM」))、および/またはマスストレージシステムを含むコンピュータ可読媒体上で維持することができる。コンピュータ可読媒体は、協力するまたは相互接続されたコンピュータ可読媒体を含むことができ、このコンピュータ可読媒体は、処理システム上に排他的に存在することができ、かつ/または処理システムにローカルまたはリモートとすることができる複数の相互接続された処理システムにまたがって分散される。
【0029】
図1Bは、システム100などのビデオ符号化および/または復号システムと共に使用される例のビデオ符号器ユニット118を示すブロック図である。ビデオ符号器ユニット118は、ビデオ符号器133、出力バッファ134、およびシステムコントローラ136を含むことができる。ビデオ符号器133(またはその1または複数の要素)を、たとえば、とりわけ、H.261、H.263、H.264、H.264/AVC、H.264/AVCのSVC拡張(H.264/AVC Annex G)、および/またはHEVCなどの1または複数の標準および/または仕様に従って実施することができる。当業者は、本明細書で提供される方法、装置、および/またはシステムを、異なる標準に従って実施された他のビデオ符号器および/または将来のコーデックを含むプロプライエタリコーデックに適用可能とすることができることを理解する。
【0030】
ビデオ符号器133は、ビデオソース124および/または外部ビデオソースなどのビデオソースから供給されたビデオ信号を受け取ることができる。このビデオ信号は、符号化されていないビデオを含むことができる。ビデオ符号器133は、符号化されていないビデオを符号化し、その出力で符号化された(すなわち、圧縮された)ビデオビットストリーム(BS)を提供することができる。
【0031】
符号化されたビデオビットストリームBSを、出力バッファ134に供給することができる。出力バッファ134は、符号化されたビデオビットストリームBSをバッファリングすることができ、そのような符号化されたビデオビットストリームBSを、通信チャネル116を介する送信のために、バッファリングされたビットストリーム(BBS)として供給することができる。
【0032】
出力バッファ134から出力されたバッファリングされたビットストリームBBSを、後の表示または伝送のためにストレージデバイス(図示せず)に送ることができる。ある種の代表的な実施形態では、ビデオ符号器ユニット118を、バッファリングされたビットストリームBBSを指定された一定のおよび/または可変のビットレート(たとえば、遅延(たとえば、非常に短いまたは最小の遅延)を伴う)で通信チャネル116を介して伝送できる視覚的通信のために構成することができる。
【0033】
符号化されたビデオビットストリームBSおよびバッファリングされたビットストリームBBSは、符号化されたビデオ情報のビットを搬送することができる。バッファリングされたビットストリームBBSのビットを、符号化されたビデオフレームのストリームとして配置することができる。符号化されたビデオフレームは、イントラコーディングされたフレーム(たとえば、Iフレーム)またはインターコーディングされたフレーム(たとえば、Bフレームおよび/またはPフレーム)とすることができる。符号化されたビデオフレームのストリームを、たとえば、各グループオブピクチャ(GOP)の符号化されたビデオフレームが指定された順序で配置された、一連のGOPとして配置することができる。一般に、各GOPは、イントラコーディングされたフレーム(たとえば、Iフレーム)から始まり、これに1または複数のインターコーディングされたフレーム(たとえば、Pフレームおよび/またはBフレーム)が続く。各GOPは、単一のイントラコーディングされたフレームのみを含むことができるが、GOPのいずれもが、複数を含むことができる。たとえば、両方向予測が、単一方向予測(Pフレーム)と比較して余分なコーディング遅延を引き起こす可能性があるので、Bフレームが、リアルタイム低遅延アプリケーションに使用され得ないことが企図されている。当業者によって理解されるように、追加のおよび/または他のフレームタイプを使用することができ、符号化されたビデオフレームの特定の順序付けを、変更することができる。
【0034】
各GOPは、構文データ(「GOP構文データ」)を含む場合がある。GOP構文データを、GOPのヘッダ内、GOPの1または複数のフレームのヘッダ内、および/または他の場所に配置することができる。GOP構文データは、順序付け、量、またはタイプを示すことができ、かつ/またはそれぞれのGOPの符号化されたビデオフレームを記述することができる。各符号化されたビデオフレームは、構文データ(「符号化されたフレーム構文データ」)を含む場合がある。符号化されたフレーム構文データは、それぞれの符号化されたビデオフレームの符号化モードを示し、かつ/または記述することができる。
【0035】
システムコントローラ136は、チャネル116に関連付けられたさまざまなパラメータおよび/または制約、ビデオ符号器ユニット118の計算能力、ユーザによる需要などを監視することができ、チャネル116の指定された制約および/または条件に適切な付随する体感品質(QoE)を提供するためにターゲットパラメータを確立することができる。ターゲットパラメータのうちの1または複数を、指定された制約および/またはチャネル条件に依存して、時々または周期的に調整することができる。一例として、QoEを、たとえば符号化されたビデオシーケンスの相対知覚品質(relative perceptive quality of encoded video sequence)と一般に称するメトリックを含む、ビデオ品質を査定するための1または複数のメトリックを使用して、定量的に査定することができる。たとえば、ピーク信号対雑音比(「PSNR」)メトリックを使用して査定される符号化されたビデオシーケンスの相対知覚品質を、符号化されたビットストリームBSのビットレート(BR)によって制御することができる。ターゲットパラメータのうちの1または複数(たとえば、量子化パラメータ(QP)を含む)を調整して、符号化されたビットストリームBSのビットレートに関連付けられた制約の中でビデオの相対知覚品質を最大にすることができる。
【0036】
図2は、システム100などのビデオ符号化および/または復号システムと共に使用されるブロックベースのハイブリッドビデオ符号器200のブロック図である。
【0037】
図2を参照すると、ブロックベースのハイブリッド符号化システム200は、とりわけ、変換ユニット204、量子化ユニット206、エントロピコーディングユニット208、逆量子化ユニット210、逆変換ユニット212、第1の加算器216、第2の加算器226、空間予測ユニット260、動き/時間予測ユニット262、基準ピクチャストア264、1または複数のフィルタ266(たとえば、ループフィルタ)、および/またはモード判断および符号器コントローラユニット280を含むことができる。
【0038】
ビデオ符号器200の詳細は、単に例示であることが意図され、実世界の実施態様は、異なる可能性がある。実世界の実施態様は、たとえば、より多数、より少数、および/または異なる要素を含む可能性があり、かつ/または
図2に示された配置とは異なって配置される可能性がある。たとえば、別々に図示されているが、変換ユニット204と量子化ユニット206との両方の一部またはすべての機能性を、たとえばH.264標準のコア変換を使用する実施態様など、実世界実施態様の一部で高度に一体化することができる。同様に、逆量子化ユニット210および逆変換ユニット212を、実世界実施態様(たとえば、H.264標準準拠実施態様)の一部で高度に一体化することができるが、同様に、概念のために別々に図示されている。
【0039】
上で説明したように、ビデオ符号器200は、その入力202でビデオ信号を受け取ることができる。ビデオ符号器200は、受け取った符号化されていないビデオから符号化されたビデオ情報を生成し、符号化されたビデオ情報(たとえば、イントラフレームまたはインターフレームのいずれであれ)を符号化されたビデオビットストリームBSの形でその出力220から出力することができる。ビデオ符号器200は、たとえば、ハイブリッドビデオ符号器として動作することができ、符号化されていないビデオを符号化するためにブロックベースのコーディングプロセスを使用することができる。そのような符号化プロセスを実行する時に、ビデオ符号器200は、符号化されていないビデオの個々のフレーム、ピクチャ、および/またはイメージ(集合的に「符号化されていないピクチャ」)を操作することができる。
【0040】
ブロックベースの符号化プロセスを容易にするために、ビデオ符号器200は、その入力202で受け取られた各符号化されていないピクチャを複数の符号化されていないビデオブロックにスライスし、区分し、分割し、かつ/またはセグメント化する(集合的に「セグメント化する」)ことができる。たとえば、ビデオ符号器200は、符号化されていないピクチャを複数の符号化されていないビデオセグメント(たとえば、スライス)にセグメント化することができ、符号化されていないビデオセグメントのそれぞれを符号化されていないビデオブロックにセグメント化することができる(たとえば、その後にセグメント化することができる)。ビデオ符号器200は、符号化されていないビデオブロックを空間予測ユニット260、動き/時間予測ユニット262、モード判断および符号器コントローラユニット280、および/または第1の加算器216に渡し、供給し、送り、または提供することができる。下でより詳細に説明するように、符号化されていないビデオブロックを、ブロックごとに供給することができる。
【0041】
空間予測ユニット260は、符号化されていないビデオブロックを受け取り、そのようなビデオブロックをイントラモードで符号化することができる。イントラモードは、空間ベースの圧縮の複数のモードのいずれかを指し、イントラモードでの符号化は、符号化されていないピクチャの区間ベースの圧縮を提供しようと努力する。空間ベースの圧縮がある場合に、その圧縮は、符号化されていないピクチャ内のビデオ情報の空間的冗長性の削減または除去から生じる可能性がある。予測ブロックを形成する際に、空間予測ユニット260は、既に符号化された(「符号化されたビデオブロック」)および/または再構成された(「再構成されたビデオブロック」)符号化されていないピクチャの1または複数のビデオブロックに対する各符号化されていないビデオブロックの空間予測(または「イントラ予測」)を実行することができる。符号化されたおよび/または再構成されたビデオブロックは、符号化されていないビデオブロックの近傍、これに隣接する、またはこれに近接する(たとえば、非常に近接する)ものとすることができる。
【0042】
動き/時間予測ユニット262は、入力202から符号化されていないビデオブロックを受け取り、それらをインターモードで符号化することができる。インターモードは、たとえばPモード(単一方向予測)および/またはBモード(両方向予測)を含む時間ベースの圧縮の複数のモードのいずれかをさす。インターモードでの符号化は、符号化されていないピクチャの時間ベースの圧縮を提供しようと努力する。時間ベースの圧縮がある場合に、その圧縮は、符号化されていないピクチャおよび1または複数の基準(たとえば、隣接する)ピクチャの間のビデオ情報の時間的冗長性の削減または除去から生じる可能性がある。動き/時間予測ユニット262は、基準ピクチャの1または複数のビデオブロック(「基準ビデオブロック」)に対する各符号化されていないビデオブロックの時間予測(または「インター予測」)を実行することができる。実行される時間予測を、単一方向予測(たとえば、Pモードに関する)および/または両方向予測(たとえば、Bモードに関する)とすることができる。
【0043】
単一方向予測について、基準ビデオブロックを、1または複数の以前に符号化されたおよび/または再構成されたピクチャからのブロックとすることができる。符号化されたおよび/または再構成されたピクチャ(1または複数)を、符号化されていないピクチャの近傍、これに隣接する、および/またはこれに近接するものとすることができる。
【0044】
両方向予測について、基準ビデオブロックを、1または複数の以前に符号化されたおよび/または再構成されたピクチャならびにビデオストリームの1または複数の他の符号化されていないピクチャからのブロックとすることができる。符号化されたおよび/または再構成されたピクチャならびに他の符号化されていないピクチャを、符号化されていないピクチャの近傍、これに隣接する、および/またはこれに近接するものとすることができる。
【0045】
ビデオブロックごとに複数の基準ピクチャが使用される(H.264/AVCおよび/またはHEVCなどの最近のビデオコーディング標準についてそうである可能性があるように)場合に、その基準ピクチャインデックスを、後続の出力および/または送信のためにエントロピコーディングユニット208に送ることができる。基準インデックスを使用して、時間予測が基準ピクチャストア264内のどの1または複数の基準ピクチャに由来するのかを識別することができる。
【0046】
通常は高度に一体化されるが、動き推定および動き補償に関する動き/時間予測ユニット262の諸機能を、別々のエンティティまたはユニット(図示せず)によって実行することができる。動き推定を実行して、基準ピクチャビデオブロックに対する符号化されていないビデオブロックごとの動きを推定することができ、動き推定は、符号化されていないビデオブロックの動きベクトルの生成を含むことができる。動きベクトルは、コーディングされつつある符号化されていないビデオブロックに対する予測ブロックの変位を示すことができる。この予測ブロックは、たとえばコーディングされつつある符号化されていないビデオブロックの画素差に関してよく一致することがわかった基準ピクチャビデオブロックである。一致は、絶対誤差和(SAD)、二乗誤差和(SSD)、および/または他の差メトリックによって決定することができる。動き補償は、動き推定によって決定された動きベクトルに基づいて予測ブロックを取り出すことおよび/または生成することを含むことができる。
【0047】
動き/時間予測ユニット262は、符号化されていないビデオブロックを基準ピクチャストア264内に格納された基準ピクチャからの基準ビデオブロックと比較することによって、符号化されていないビデオブロックの動きベクトルを計算することができる。動き/時間予測ユニット262は、基準ピクチャストア264内に含まれる基準ピクチャの分数画素位置の値を計算することができる。いくつかの場合に、加算器226またはビデオ符号器200の別のユニットが、再構成されたビデオブロックの分数画素位置値を計算することができ、分数画素位置の計算された値と共に、再構成されたビデオブロックを基準ピクチャストア264に格納することができる。動き/時間予測ユニット262は、基準ピクチャ(たとえば、Iフレームおよび/またはPフレーム)のサブ整数画素を補間することができる。
【0048】
動き/時間予測ユニット262を、選択された動きプレディクタ(motion predictor)に対して動きベクトルを符号化するように構成することができる。動き/時間予測ユニット262によって選択される動きプレディクタは、たとえば、既に符号化された近傍のブロックの動きベクトルの平均値と同等のベクトルとすることができる。符号化されていないビデオブロックの動きベクトルを符号化するために、動き/時間予測ユニット262は、動きベクトルと動きプレディクタとの間の差を計算して、動きベクトル差値を形成することができる。
【0049】
H.264は、潜在的な基準フレームのセットを「リスト」と称する。基準ピクチャストア264に格納された基準ピクチャのセットは、基準フレームのそのようなリストに対応することができる。動き/時間予測ユニット262は、基準ピクチャストア264からの基準ピクチャ(たとえば、PフレームまたはBフレーム)の基準ビデオブロックを符号化されていないビデオブロックと比較することができる。基準ピクチャストア264内の基準ピクチャが、サブ整数画素の値を含む時には、動き/時間予測ユニット262によって計算される動きベクトルは、基準ピクチャのサブ整数画素位置を参照することができる。動き/時間予測ユニット262は、計算された動きベクトルをエントロピコーディングユニット208および動き/時間予測ユニット262の動き補償機能に送ることができる。動き/時間予測ユニット262(またはその動き補償機能)は、コーディングされつつある符号化されていないビデオブロックに対する予測ブロックの誤差値を計算することができる。動き/時間予測ユニット262は、予測ブロックに基づいて予測データを計算することができる。
【0050】
モード判断および符号器コントローラユニット280は、コーディングモードすなわちイントラモードまたはインターモードのうちの1つを選択することができる。モード判断および符号器コントローラユニット280は、たとえば、レートひずみ最適化方法および/または各モードで作られる誤差結果に基づいて、それを行うことができる。
【0051】
ビデオ符号器200は、コーディングされつつある符号化されていないビデオブロックから、動き/時間予測ユニット262から供給される予測データを減算することによって、残差のブロック(「残差ビデオブロック」)を形成することができる。加算器216は、この減算動作を実行することができる1または複数の要素を表す。
【0052】
変換ユニット204は、残差ビデオブロックに変換を適用して、そのような残差ビデオブロックを画素値領域から周波数領域などの変換領域に変換することができる。変換は、たとえば、本明細書で提供される変換、離散コサイン変換(DCT)、または概念的に類似する変換のいずれとすることもできる。変換の他の例は、とりわけ、H.264で定義される変換、ウェーブレット変換、整数変換、および/またはサブバンド変換を含む。変換ユニット204による残差ビデオブロックへの変換の適用は、残差ビデオブロックの変換係数(「残差変換係数」)の対応するブロックを作る。これらの残差変換係数は、残差ビデオブロックの周波数成分の大きさを表すことができる。変換ユニット204は、残差変換係数を量子化ユニット206に転送することができる。
【0053】
量子化ユニット206は、符号化されたビットレートをさらに減らすために、残差変換係数を量子化することができる。量子化プロセスは、たとえば、残差変換係数の一部またはすべてに関連付けられたビット深さを減らすことができる。ある種の例では、量子化ユニット206は、量子化された変換係数のブロックを形成するために、QPに対応する量子化レベルによって残差変換係数の値を除算することができる。量子化の度合を、QP値を調整することによって変更することができる。量子化ユニット206は、所望の個数の量子化ステップを使用して残差変換係数を表すために量子化を適用することができ、使用されるステップの個数(または、対応して、量子化レベルの値)は、残差ビデオブロックを表すのに使用される符号化されたビデオビットの個数を決定することができる。量子化ユニット206は、レートコントローラ(図示せず)からQP値を取得することができる。量子化に続いて、量子化ユニット206は、量子化された変換係数をエントロピコーディングユニット208および逆量子化ユニット210に供給することができる。
【0054】
エントロピコーディングユニット208は、エントロピコーディングされた係数(すなわち、ビットストリーム)を形成するために、量子化された変換係数にエントロピコーディングを適用することができる。エントロピコーディングユニット208は、adaptive variable length coding(CAVLC)、context adaptive binary arithmetic coding(CABAC)、および/またはエントロピコーディングされた係数を形成する別のエントロピコーディング技法を使用することができる。CABACは、当業者が理解するように、コンテキスト情報(「コンテキスト」)の入力を必要とする場合がある。このコンテキストは、たとえば、近傍のビデオブロックに基づくものとすることができる。
【0055】
エントロピコーディングユニット208は、生の符号化されたビデオビットストリームの形の動きベクトルと一緒に、エントロピコーディングされた係数を内部ビットストリームフォーマット(図示せず)に供給することができる。このビットストリームフォーマットは、たとえば、ビデオ復号器ユニット300(
図3)が生の符号化されたビデオビットストリームからの符号化されたビデオブロックを復号することを可能にするヘッダおよび/または他の情報を含む、追加情報を生の符号化されたビデオビットストリームに付加することによって、出力バッファ134(
図1B)に供給される符号化されたビデオビットストリームBSを形成することができる。エントロピコーディングに続いて、エントロピコーディングユニット208から供給された符号化されたビデオビットストリームBSを、たとえば出力バッファ134に出力することができ、たとえば、チャネル116を介して宛先デバイス114に送信するか、または後の送信または取出のためにアーカイブすることができる。
【0056】
ある種の代表的な実施形態では、エントロピコーディングユニット208またはビデオ符号器133、200の別のユニットを、エントロピコーディングに加えて他のコーディング機能を実行するように構成することができる。たとえば、エントロピコーディングユニット208を、ビデオブロックのコードブロックパターン(CBP)値を決定するように構成することができる。ある種の代表的な実施形態では、エントロピコーディングユニット208は、ビデオブロック内の量子化された変換係数のランレングスコーディングを実行することができる。一例として、エントロピコーディングユニット208は、ジグザグスキャンまたは他のスキャンパターンを適用して、ビデオブロック内の量子化された変換係数を配置し、さらなる圧縮のためにゼロのランを符号化することができる。エントロピコーディングユニット208は、符号化されたビデオビットストリームBSでの送信のために適当な構文要素を用いてヘッダ情報を構成することができる。
【0057】
逆量子化ユニット210および逆変換ユニット212は、それぞれ逆量子化および逆変換を適用して、たとえば基準ビデオブロックの1つとしての後の使用のために(たとえば、基準ピクチャリスト内の基準ピクチャの1つの中で)、画素領域で残差ビデオブロックを再構成することができる。
【0058】
モード判断および符号器コントローラユニット280は、再構成された残差ビデオブロックを基準ピクチャストア264に格納された基準ピクチャのうちの1つの予測ブロックに加算することによって、基準ビデオブロックを計算することができる。モード判断および符号器コントローラユニット280は、再構成された残差ビデオブロックに1または複数の補間フィルタを適用して、動き推定での使用のためにサブ整数画素値(たとえば、1/2画素位置に関する)を計算することができる。
【0059】
加算器226は、再構成された残差ビデオブロックを、動き補償予測ビデオブロックに加算して、基準ピクチャストア264に格納される再構成されたビデオブロックを作ることができる。再構成された(画素値領域)ビデオブロックを、後続の符号化されていないビデオ内の符号化されていないビデオブロックのインターコーディングのための基準ブロックの1つとして、動き/時間予測ユニット262(またはその動き推定機能および/またはその動き補償機能)によって使用することができる。
【0060】
フィルタ266(たとえば、ループフィルタ)は、デブロッキングフィルタを含むことができる。デブロッキングフィルタは、再構成されたマクロブロック内に存在する可能性がある視覚的アーチファクトを除去するように動作することができる。これらのアーチファクトは、たとえば、Iタイプ、Pタイプ、またはBタイプなど、符号化の異なるモードの使用に起因して符号化プロセスで導入される可能性がある。アーチファクトは、たとえば、受け取られたビデオブロックの境界および/または縁に存在する可能性があり、デブロッキングフィルタは、視覚的品質を改善するためにビデオブロックの境界および/または縁を平滑化するように動作することができる。デブロッキングフィルタは、加算器226の出力を平滑化することができる。
【0061】
図3は、
図1Aのビデオ復号器ユニット130などのビデオ復号器ユニットと共に使用されるビデオ復号器300の例を示すブロック図である。ビデオ復号器300は、入力302、エントロピ復号ユニット308、動き補償予測ユニット362、空間予測ユニット360、逆量子化ユニット310、逆変換ユニット312、基準ピクチャストア364、フィルタ366、加算器326、および出力320を含むことができる。ビデオ復号器300は、全般的にビデオ符号器133、200に関して提供された符号化プロセスに相反する復号プロセスを実行することができる。この復号プロセスを、下で示すように実行することができる。
【0062】
動き補償予測ユニット362は、エントロピ復号ユニット308から受け取られた動きベクトルに基づいて、予測データを生成することができる。動きベクトルを、符号化された動きベクトルに対応するビデオブロックの動きプレディクタに対して符号化することができる。動き補償予測ユニット362は、たとえば、復号されるビデオブロックの近傍のブロックの動きベクトルの中央値として、動きプレディクタを決定することができる。動きプレディクタを決定した後に、動き補償予測ユニット362は、符号化されたビデオビットストリームBSから動きベクトル差値を抽出すること、および動きプレディクタに動きベクトル差値を加算することによって、符号化された動きベクトルを復号することができる。動き補償予測ユニット362は、符号化された動きベクトルと同一の分解能までで動きプレディクタを量子化することができる。ある種の代表的実施形態では、動き補償予測ユニット362は、一部のまたはすべての符号化された動きプレディクタについて、同一の精度を使用することができる。もう1つの例として、動き補償予測ユニット362を、上の方法のいずれかを使用し、符号化されたビデオビットストリームBSから取得されたシーケンスパラメータセット、スライスパラメータセット、またはピクチャパラメータセットに含まれるデータを分析することによって、使用すべき方法を決定するように構成することができる。
【0063】
動きベクトルを復号した後に、動き補償予測ユニット362は、動きベクトルによって識別された予測ビデオブロックを基準ピクチャストア364の基準ピクチャから抽出する。動きベクトルが、1/2画素などの分数画素位置をポイントする場合には、動き補償予測ユニット362は、分数画素位置について値を補間することができる。動き補償予測ユニット362は、適応補間フィルタまたは固定補間フィルタを使用して、これらの値を補間することができる。動き補償予測ユニット362は、受け取られた符号化されたビデオビットストリームBSから、フィルタ366のどれを使用すべきかのしるしと、いくつかの代表的な実施形態で、フィルタ366の係数とを取得することができる。
【0064】
空間予測ユニット360は、符号化されたビデオビットストリームBS内で受け取られたイントラ予測モードを使用して、空間的に隣接するブロックから予測ビデオブロックを形成することができる。逆量子化ユニット310は、逆量子化を行うことができる(たとえば、符号化されたビデオビットストリームBS内で供給され、エントロピ復号ユニット308によって復号される、量子化されたブロック係数を逆量子化する)。逆量子化プロセスは、たとえばH.264によって定義される、従来のプロセスを含むことができる。逆量子化プロセスは、適用される量子化の度合および/または逆量子化の度合を決定するためにビデオブロックごとにビデオ符号器133、200によって計算された量子化パラメータQPの使用を含むことができる。
【0065】
逆変換ユニット312は、画素領域で残差ビデオブロックを作るために、変換係数に逆変換(たとえば、本明細書で提供される変換のいずれかの逆、逆DCT、逆整数変換、または概念的に類似する逆変換プロセス)を適用することができる。動き補償予測ユニット362は、動き補償ブロックを作ることができ、補間フィルタに基づいて補間を実行することができる。サブ画素精度を有する動き推定に使用される補間フィルタの識別子を、ビデオブロックの構文要素に含めることができる。動き補償予測ユニット362は、基準ブロックのサブ整数画素の補間された値を計算するために、ビデオブロックの符号化中にビデオ符号器133、200によって使用された補間フィルタを使用することができる。動き補償予測ユニット362は、受け取られた構文情報に従ってビデオ符号器133、200によって使用された補間フィルタを決定し、予測ブロックを作るのにその補間フィルタを使用することができる。
【0066】
動き補償予測ユニット362は、(1)符号化されたビデオシーケンスの1または複数のピクチャを符号化するのに使用されたビデオブロックのサイズを決定するための構文情報、(2)符号化されたビデオシーケンスのフレームの各ビデオブロックがどのように区分されるのかを記述するパーティション情報、(3)各パーティションがどのように符号化されるのかを示すモード(またはモード情報)、(4)インター符号化されたビデオブロックごとの1もしくは複数の基準ピクチャ、および/または(5)符号化されたビデオシーケンスを復号するための他の情報を使用することができる。
【0067】
加算器326は、復号されたビデオブロックを形成するために、残差ブロックを、動き補償予測ユニット362または空間予測ユニット360によって生成された対応する予測ブロックと合計することができる。デブロッキングフィルタ366(たとえば、フィルタまたはループフィルタ)を適用して、ブロッキネスアーチファクトを除去するために復号されたビデオブロックをフィルタリングすることができる。復号されたビデオブロックを、基準ピクチャストア364に格納することができ、基準ピクチャストア364は、後続の動き補償のために基準ビデオブロックを提供することができ、かつディスプレイデバイス(図示せず)上での提示のために復号されたビデオを作ることができる。
【0068】
各ビデオブロックが、符号化プロセスおよび/または復号プロセスを受ける時に、そのビデオブロックに関連付けられたビデオ情報が、異なって表される可能性がある。たとえば、ビデオブロックは、(i)画素領域の画素データ、(ii)符号化されていないビデオブロックと予測ブロックとの間の画素差を表す残差データ(「残差」)、(iii)変換領域の変換係数(たとえば、変換の適用の後)、および(iv)量子化された変換領域の量子化された変換係数を含むことができる。
【0069】
各ビデオブロックは、所与の次元または集合的に「サイズ」を有することができる。ビデオブロックサイズは、コーディング標準に依存するものとすることができる。一例として、H.264標準は、ルマ成分の16x16、8x8、または4x4およびクロマ成分の8x8などのさまざまなビデオブロックサイズでのイントラ予測をサポートし、かつルマ成分の16x16、16x8、8x16、8x8、8x4、4x8、および4x4ならびにクロマ成分の対応するスケーリングされたサイズなどのさまざまなブロックサイズでのインター予測をサポートする。H.264標準では、次元16画素×16画素のビデオブロックを、一般に、マクロブロック(MB)と称し、16画素×16画素未満を有するビデオブロックを、一般に、MBのパーティション(「MBパーティション」)と称する。HEVCでは、「coding unit」または「CU」と呼ばれるビデオブロックを、高解像度(たとえば、1080p以上)ビデオ信号をより効率的に圧縮するのに使用することができる。HEVCでは、CUサイズは、パラメータシーケンスセット内でセットされ、64x64画素ほどに大きくまたは4x4画素ほどに小さくセットすることができる。CUを、さらに、予測ユニット(PU)に区分することができ、PUについて、別々の予測方法を適用することができる。各ビデオブロック(とりわけ、MB、CU、および/またはPUのいずれであれ)を、空間予測ユニット360および/または動き/時間予測ユニット362を使用することによって処理することができる。
【0070】
本明細書で使用される時に、「NxN」および「N×N」は、垂直次元と水平次元との両方でコンポーネント(たとえば、とりわけ、画素、残差、変換係数、および/または量子化された変換係数)に関してブロックのサイズを指すのに交換可能に使用される場合がある。一般に、16x16ビデオブロックは、垂直次元で16個の要素(y=16)および水平次元で16個の要素(x=16)を有する。NxNブロックは、一般に、垂直次元でN個の要素、水平次元でN個の要素を有し、ここで、Nは、非負の整数値を表す。ビデオブロック内の要素を、行および列に配置することができる。ビデオブロックは、水平次元に、垂直次元と同一のまたは異なる個数の画素を有することができる。たとえば、ビデオブロックは、NxM画素を含むことができ、ここで、Mは、Nと等しいまたは等しくない。
【0071】
H.264/AVC標準は、下に示すように、4次および8次の整数変換すなわちT
4およびT
8を指定する。
【0074】
この2つの整数変換T
4およびT
8は、直交であり、非常に低い複雑さを有する。そのような変換の基底ベクトルは、DCTとは実質的に異なり、したがって、性能は、DCTより悪い場合がある。基底ベクトルのノルムは、お互いと異なる。可逆性およびエネルギ節約のために、欠点を補償するために変換の後でスケーリングプロセスを実行しなければならず、これは、計算的複雑さおよびメモリ使用量を増やす可能性がある。そのようなスケーリング行列は、しばしば、変換ごとに異なる。たとえば、4次および8次の変換T
4およびT
8は、異なるスケーリング行列の使用を必要とする可能性がある。異なるスケーリング行列の使用は、コーデックの設計および実施態様をも複雑にする可能性があり、追加の変換をサポートすることをよりむずかしくする可能性がある。
【0075】
上で注記したように、HEVCでは、CUサイズおよびPUサイズを、64x64要素もの大きさにすることができ、4次および8次より高次の変換が、使用される。4次、8次、16次、および/または32次を含む4つの変換サイズを、HEVCで使用することができる。
【0076】
図2および3を参照すると、ビデオ符号器200およびビデオ復号器300について、ビデオ符号器200の変換ユニット204への入力のダイナミックレンジおよびビデオ復号器300の逆変換ユニット312の出力のダイナミックレンジを、同一とすることができる。ビデオ符号器200および/またはビデオ復号器300での変換動作について、このダイナミックレンジを、検出し、ビット深さ(「BD」)によって表すことができる。一例として、ダイナミックレンジが[−255,255]である場合に、BDは、8と等しい。ダイナミックレンジが[−1023,1023]である場合に、BDは、10と等しい。ダイナミックレンジを決定した後に、変数ΔBDを計算することができる。変数ΔBDを、たとえばBD−8として計算することができる。
【0077】
ビデオ符号器200では、そのサイズがMxN(M,N∈{4,8,16,32})である予測残差ブロックX
MxNを、変換ユニット204、量子化ユニット206、逆量子化ユニット210、および逆変換ユニット212内で順次処理することができる。ビデオ処理のこの4つの動作を、下でより詳細に提供する。本明細書で使用される時に、逆量子化ユニット210および逆変換ユニット212内で実行される動作を、それぞれ逆量子化および逆変換と称する場合がある。ビデオ復号器300では、逆量子化ユニット310および逆変換ユニット312内で実行される動作は、通常、逆量子化ユニット210および逆変換ユニット212内で実行される動作と同一である。
順方向変換
【0078】
順方向変換への入力を、X
MxNと表される予測残差ブロックとすることができる。X
MxNに対して2次元(2−D)順方向変換を実行するために、X
MxNのM行およびN列が、各次元で順次変換され、これを、それぞれ水平順方向変換および垂直順方向変換と称する。水平変換または垂直順方向変換のいずれかを、まず形成することができる。水平順方向変換が最初に実行される場合には、X
MxNに、まず
【0080】
を右乗算し(上付きのTは転置を意味する)、16ビット演算(arithmetic)に対処するために、正しいビット数、右シフトすることができる。結果を、次のようにU
MxNとすることができ、
【0082】
ここで、上と同様にT
N(N∈{4,8,16,32})であり、「>>」は、右シフトを意味する。係数f
fwd,hは、丸めのためのものであり、範囲
【0084】
に含まれるものとすることができる。本明細書での公開の単純さのために、f
fwd,hが、
【0087】
水平順方向変換の後に、垂直順方向変換を、中間ブロックU
MxNに対して実行することができる。垂直順方向変換のプロセスは、次とすることができ、
Y
MxN=(T
M×U
MxN+f
fwd,v)>>(log
2(M)+7) (4)
ここで、係数f
fwd,vは、範囲
【0089】
に含まれるものとすることができ、本明細書での公開の単純さのために、
【0092】
垂直順方向変換が最初に実行される場合には、X
MxNに、まずT
Mを左乗算し、16ビット演算に収めるために正しいビット数、右シフトすることができる。結果を、次のようにU
MxNとすることができ、
U
MxN=(T
M×X
MxN+f
fwd,v)>>(log
2(M)+ΔBD) (5)
ここで、係数f
fwd,vは、丸めのためのものであり、範囲
【0094】
に含まれるものとすることができる。本明細書での公開の単純さのために、f
fwd,vを、
【0097】
垂直順方向変換の後に、水平順方向変換を、中間ブロックU
MxNに対して実行することができる。水平順方向変換のプロセスは、次とすることができ、
【0101】
に含まれるものとすることができ、本明細書での公開の単純さのために、
【0104】
量子化
量子化の入力は、2−D順方向変換の出力(たとえば、Y
MxN)とすることができる。Y
MxNのすべての要素に関する量子化プロセスを、同一または異なるいずれかとすることができる。要素Y
MxN(i,j)(0≦i≦M−1,0≦j≦N−1)および関連付けられた量子化ステップサイズW
MxN(i,j)を与えられて、量子化プロセスを、次のように式7に示されたものとすることができる。
【0106】
ここで、f
MxN,q(i,j)は、丸めのための係数であり、範囲
【0108】
に含まれるものとすることができる。本明細書での公開の単純さのために、f
MxN,q(i,j)を、
【0110】
と等しいものとすることができる。式(7)では、S
MxN(i,j)およびQ
MxN(i,j)は、次のように近似(8)に示された関係を満足することができる。
【0112】
ここで、≒は、S
MxN(i,j)の乗算およびその後のQ
MxN(i,j)ビットの右シフトを意味し、量子化ステップサイズW
MxN(i,j)による除算を近似するのに使用され得る。より正確な近似を、右シフトのビット数Q
MxN(i,j)を増やすことによって達成することができる。
【0113】
逆量子化
逆量子化は、入力Z
MxNを使用してY
MxNを再構成するのに使用することができる。再構成されたブロックは、Y’
MxNと表される。直観的には、Y’
MxNは、Z
MxN(i,j)に量子化ステップサイズW
MxN(i,j)を乗算したものと等しい可能性がある。しかし、W
MxN(i,j)は、必ずしも整数ではない可能性があり、したがって、近似(8)に似た近似を、下の近似(9)のように逆量子化に関して実行することもできる。
【0115】
同様に、大きいIQ
MxN(i,j)は、高い精度を意味する可能性がある。逆量子化プロセスを、次のように式(10)に示されたものとすることができる。
【0117】
f
MxN,dq(i,j)は、丸めのための係数であり、範囲
【0119】
に含まれるものとすることができる。本明細書での公開の単純さのために、f
MxN,dq(i,j)を、
【0121】
と等しい、かつ/またはこれに従うものとすることができる。0より小さい
【0123】
の値が、左シフトを意味し、その場合に、f
MxN,dq(i,j)に0をセットすることができることが企図されている。
【0124】
逆変換
逆変換への入力を、逆量子化されたブロックY’
MxNとすることができる。Y’
MxNに対して2−D逆変換を実行するために、Y’
MxNのM行およびN列は、それぞれ水平逆変換および垂直逆変換を使用して、順次の形で変換される。水平逆変換または垂直逆変換のいずれかを、最初に実行することができる。水平逆変換が最初に実行される場合に、Y’
MxNに、まずT
Nを右乗算し、16ビット演算に対処するために正しいビット数、右シフトすることができる。結果の中間ブロックV
MxNは、次のように式11に示されたものとすることができる。
【0125】
V
MxN=(Y’
MxN×T
N+f
inv,h)>>8 (11)
【0126】
係数f
inv,hは、範囲[0,256]に含まれるものとすることができる。本明細書での公開の単純さのために、f
inv,hを、128と等しいものとすることができる。
【0127】
水平逆変換の後に、垂直逆変換を、中間ブロックV
MxNに対して実行することができる。垂直逆変換のプロセスを、次のように式12に示されたものとすることができる。
【0129】
ここで、係数f
inv,vは、範囲[0,2
(13−ΔBD)]に含まれるものとすることができ、本明細書での公開の単純さのために、2
(12−ΔBD)と等しいものとすることができる。
【0130】
垂直逆変換が最初に実行される場合には、Y’
MxNに、まず
【0132】
を左乗算し、16ビット演算に対処するために正しいビット数、右シフトすることができる。結果の中間ブロックV
MxNは、次のように式13に示されたものとすることができる。
【0134】
係数f
inv,vは、丸めのためのものであり、範囲[0,256]に含まれるものとすることができる。本明細書での公開の単純さのために、f
inv,vを、128と等しいものとすることができる。
【0135】
垂直逆変換の後に、水平逆変換を、中間ブロックV
MxNに対して実行することができる。水平逆変換のプロセスを、次のように式14に示されたものとすることができる。
【0136】
X’
MxN=(V
MxN×T
N+f
inv,h)>>(13−ΔBD) (14)
ここで、係数f
inv,hは、範囲[0,2
(13−ΔBD)]に含まれるものとすることができ、本明細書での公開の単純さのために、2
(12−ΔBD)と等しいものとすることができる。
【0137】
下の表1に、水平変換が垂直変換の前に実行されると仮定して、上で開示された動作の各ステップの後のダイナミックレンジを要約する。この表から明白であるように、プロセスのすべてを、16ビット演算を使用して実施することができる。
【0139】
例の符号器
図2を参照すると、すべての既存のビデオコーディング標準で、ビデオブロックユニットは、一般にマクロブロック(MB)と称する16x16画素からなる。Joint Collaborative Team on Video Coding JCT−VCは、High Efficiency Video Coding(HEVC)と称する次世代ビデオコーディング標準を開発しつつある。
【0140】
次世代ビデオコーディングについて、拡張されたブロックサイズ(たとえば、coding unit(CU))を使用して、高解像度(1080p以上)ビデオ信号を圧縮することができる。CUは、64x64画素までの任意のサイズとすることができ、予測ユニット(PU)にさらに区分することができ、PUについて、別々の予測方法を適用することができる。入力ビデオブロック(たとえば、MBまたはCU)ごとに、空間予測ユニット260が、空間予測を実行することができ、かつ/または動き補償予測ユニット262が、動き予測を実行することができる。空間予測ユニット260(たとえば、イントラ予測について)は、現在のビデオブロックを予測するために、同一のビデオピクチャ/スライス内の既にコーディングされた近傍ブロックからの画素を使用することができる。空間予測ユニット260は、ビデオ信号に固有の空間冗長性を減らすことができる。動き/時間予測ユニット262(たとえば、インター予測および/または動き補償予測について)は、現在のビデオブロックを予測するために、既にコーディングされたビデオピクチャからの画素を使用することができる。時間予測262は、ビデオ信号に固有の時間冗長性を減らすことができる。所与のビデオブロックの動き/時間予測信号を、現在のブロックとその基準ブロックとの間の動きの量および方向を示すことができる1または複数の動きベクトルによってシグナリングすることができる。ビデオブロックごとに複数の基準ピクチャが使用可能にされる(かつ/またはサポートされる)(H.264/AVCおよびHEVCなどの最新のビデオコーディング標準についてそうであるように)場合に、基準ピクチャとは別々またはこれに加えて、基準ピクチャインデックスを送信することができる。基準インデックスを使用して、動き/時間予測信号が基準ピクチャストア264内のどの基準ピクチャに由来するのか(たとえば、どの基準ピクチャから提供されるのか)を識別することができる。空間予測および/または動き/時間予測の後に、符号器内のモード判断および符号器コントローラユニット(MDECU)280は、たとえばレート−ひずみ最適化方法に基づいて、最良の予測モードを選択することができる。予測ブロックを、第1の加算器216で現在のビデオブロックから減算することができ、予測残差を、変換ユニット204を使用して無相関化(de-correlate)することができ、量子化ユニット206で量子化して、ターゲットビットレートを達成することができる。量子化された残差係数を、逆量子化ユニット210で逆量子化し、逆変換ユニット212で逆変換して、再構成された残差を形成することができ、この再構成された残差を、第2の加算器226で予測ブロックに戻って加算して、再構成されたビデオブロックを形成することができる。
【0141】
たとえば、デブロッキングフィルタおよび/または適応ループフィルタ266を含むループ内フィルタリングを、再構成されたビデオブロックが基準ピクチャストア264に格納されかつ/または将来のビデオブロックのコーディングに使用され得る前に、再構成されたビデオブロックに適用することができる。コーディングモード(インターまたはイントラ)、予測モード情報、動き情報、および/または量子化された残差係数を、エントロピコーディングユニット208に送って(たとえば、すべてを送って)、出力ビデオビットストリームBS 220を形成するためにさらに圧縮する(かつパックする)ことができる。
【0142】
例の復号器
図3を参照すると、ビデオビットストリームBS 302を、エントロピ復号ユニット308でアンパックし、エントロピ復号することができる。コーディングモードおよび予測情報を、空間予測ユニット360(エントロピ復号されたビットストリームがイントラコーディングされている場合)および/または時間/動き予測ユニット362(エントロピ復号されたビットストリームがインターコーディングされている場合)のいずれかに送って、予測ブロックを形成することができる。残差変換係数を、逆量子化ユニット310および逆変換ユニット312に送って、残差ブロックを再構成することができる。予測ブロックおよび残差ブロックを、加算器326で一緒に加算することができる。再構成されたブロックは、基準ピクチャストア364に格納される前に、ループ内フィルタ366を通る(たとえば、通過する)ことができる。基準ピクチャストア364内の再構成されたビデオを、ディスプレイデバイスを駆動するために送出することができると同時に、将来のビデオブロックを予測するのに使用することができる。
【0143】
変換、量子化、逆量子化、および逆変換を実行するシステムおよび方法を、本明細書で説明する。ビデオコーディングシステムを与えられて、変換行列を事前定義することができる。H.261、MPEG−2、およびMPEG−4では、変換行列は、サイズ8x8を有する離散コサイン変換(DCT)行列である。H.264/AVCでは、4x4および8x8の変換行列が使用され、これらは、4x4DCTおよび8x8DCTの整数変形形態である。進行中のビデオ標準化プロジェクトであるHEVCでは、4x4、8x8、16x16、および32x32の整数変換行列を使用することができる。T
Mと表されるMxM変換行列では、各行は、基底ベクトルであり、T
Mは、M個の基底ベクトルを有する。
【0144】
変換ユニット204への入力は、サイズMxN(M行およびN列)を有し、X
MxNと表されるブロックとすることができる。一般に、MおよびNは、2のべき乗(たとえば、4、8、16、および/または32)である。変換ユニット204では、X
MxNに2つの変換行列T
MおよびT
NTを左乗算し、右乗算することができ(上付きのTは、行列転置を表す)、X
MxNを、変換領域でのその表現(Y
MxNと表される)に変換することができる。左乗算または右乗算のどちらを先に実行しても、式(15)に示されているように、同一の結果につながる。
【0145】
Y
MxN=(T
M×X
MxN)×T
NT=T
M×(X
MxN×T
NT) (15)
【0146】
左乗算は、X
MxNまたは(X
MxN×T
NT)の各列をT
Mの基底ベクトルに射影し、垂直変換と称する。右乗算は、(T
M×X
MxN)またはX
MxNの各行をT
Nの基底ベクトルに射影し、水平変換と称する。
【0147】
ある種の代表的な実施形態では、量子化ユニット206を介する量子化の手順は、(1)変換を正規化するためにY
MxN(i,j)(0≦i<M,0≦j<N)を(T
M(0,0)×T
M(0,0)×
√MN)によって除算すること、および/または(2)ターゲットビットレートを達成するためにY
MxN(i,j)を量子化ステップサイズZ
MxN(i,j)によって除算することを含む。T
M(0,0)およびT
N(0,0)は、それぞれT
MおよびT
Nの左上要素を指す。出力を、W
MxN(i,j)と表す。
【0148】
この手順を、スケーリング係数S
MxN(i,j)を乗算すること、および適当なビット数Q
MxN(i,j)、右シフトすることによって、組み合わせ、実施することができる。数をnビット、右シフトすることは、その数を2
nによって除算することと同等である。ある種の代表的な実施形態では、S
MxN(i,j)およびQ
MxN(i,j)の値は、近似(16)に示されている近似を満足することができる。
【0150】
H.264/AVCおよび/またはHEVCは、QP(QP=0,1…51)によってインデクシングされ、0.63(QP=0)から228(QP=51)までの範囲にわたる52個の事前定義された有理数値のステップサイズを有する。ステップサイズは、QPの各増分に伴って約2
1/6倍増え、6つの増分おきに2倍になる(たとえば、正確に2倍になる)。インデックスQP+6k(ここで、kは正整数である)を有するステップサイズ(たとえば、Z
MxN(QP+6k,i,j)と表される)は、インデックスQPを有するステップサイズ(たとえば、Z
MxN(QP,i,j)と表される)の2
k倍である。近似(16)のZ
MxN(QP+6k,i,j)を除算する除算手順は、Z
MxN(QP,i,j)を除算する除算手順と同一のスケーリング係数を共有することができ、右シフトについてk個多いビットを使用することができる。このプロパティを用いて、6つのスケーリング係数(たとえば、6つのみのスケーリング係数)が、表2の第2の行に示されているように、定義され、かつ/または格納されなければならない。6つのスケーリング係数を使用して、右シフトすべきビット数を制御することによって52個のステップサイズを表すことができる。1と等しいステップサイズは、4と等しいQPに対応し、スケーリング係数は、16384=2
14であり、右シフトのビット数は、14である。
【0152】
ある種の代表的な実施形態では、逆量子化ユニット210、310での逆量子化の手順は、前もって逆変換を正規化するためにW
MxN(i,j)を(T
M(0,0)×T
M(0,0))によって除算すること、および/または(2)W
MxN(i,j)に量子化ステップサイズZ
MxN(i,j)を乗算することを含むことができる。
【0153】
整数演算を使用するために、逆量子化(たとえば、除算および/または乗算)の手順を、近似(17)に示されているように、
【0155】
を得るために、スケーリング係数IS
MxN(i,j)を乗算すること、およびIQ
MxN(i,j)ビット数、右シフトすることによって近似することができる。量子化に似て、6つの逆スケーリング係数(たとえば、6つのみの逆スケーリング係数)が、表2の第3の行に示されているように、定義され格納されなければならない。
【0157】
逆変換212および/または312では、
【0159】
を、式(18)に示されているように、
【0161】
と表される、X
MxNのひずまされた版を得るために、空間領域に戻って変換することができる。
【0163】
例の16ビット実施態様
16ビット実施態様では、入力ビデオは、一般に、8ビットと等しいビット深さを有し、画素値のダイナミックレンジは、[0,255]である。本明細書では、ダイナミックレンジを、時々ビット数によって表す。より高品質のビデオなど、一部の応用例は、より広いダイナミックレンジ(たとえば、10ビット、12ビット、14ビット、および/またはnビット、ただし、nは、実施態様ビット値(たとえば、16ビット実施態様)未満の整数である)を有する場合がある。変換への入力を、しばしば残差と称する予測誤差とすることができ、この予測誤差は、負になる50%の可能性を有することができ、ダイナミックレンジを1ビット増やすことができる。たとえば、入力ビデオが、8ビット深さを有する場合に、変換入力のダイナミックレンジは、[−255,255]すなわち9ビットである。変換入力のダイナミックレンジを、9+Δビット深さ(ΔBD)と表すことができる。ΔBDは、より高品質のビデオについて0より大きくすることができる。各ステージの出力ダイナミックレンジを、表3に示す。
【0165】
たとえば、変換でのT
Mとの行列乗算は、log
2(T
M(0,0)×M)ビットのダイナミックレンジ増加を引き起こす可能性がある。量子化は、
【0167】
ビット(たとえば、近似(16)に示された分母である)のダイナミックレンジ減少を引き起こす可能性がある。逆量子化は、
【0169】
ビットのダイナミックレンジ増加を引き起こす可能性がある(近似(17)を参照されたい)。逆変換での
【0171】
との行列乗算は、log
2T
M(0,0)ビットのダイナミックレンジ増加を引き起こす可能性がある。
【0172】
プロセス全体(たとえば、代表的な手順)の入力および出力のダイナミックレンジを、同一になるように構成することができる。ダイナミックレンジ増加を引き起こす可能性がある要因は、変換、逆変換、量子化のためのS
MxN(i,j)の乗算、および逆量子化でのIS
MxN(i,j)の乗算を含むことができる。ダイナミックレンジ減少を引き起こす可能性がある要因は、量子化でのQ
MxN(i,j)ビットの右シフト、および逆量子化でのIQ
MxN(i,j)ビットの右シフトを含むことができる。Q
MxN(i,j)ビットおよびIQ
MxN(i,j)ビットの右シフトを、それぞれ、量子化および逆量子化に加えないものとすることができる。ある種の代表的な手順では、シフト(たとえば、いずれかの方向での)を、表4に示された任意のステージに分散させる(たとえば、任意に分散させる)ことができ、右シフトするビット数の合計がQ
MxN(i,j)+IQ
MxN(i,j)と等しい限り、ダイナミックレンジを、プロセスの終りに9+ΔBDにする(たとえば、戻す)ことができる。Q
MxN(i,j)+IQ
MxN(i,j)を計算するために、近似(19)に示されているように、近似(16)および(17)を乗算することができる。
【0174】
近似(35)を、近似(20)に示されているように単純化することができる。
【0176】
したがって、Q
MxN(i,j)+IQ
MxN(i,j)を、
【0178】
と等しい(または近似的に等しい)ものとすることができ、量子化ステップサイズZ
MxN(i,j)と独立とすることができる。
【0179】
ある種の代表的な実施形態では、諸手順が、1または複数のステージ(または各ステージ)での右シフトおよび/または左シフトの分配を決定することができる。たとえば、上で示したように、Z
MxN(i,j)が1と等しい場合に、対応するインデックスQP=4であり、スケーリング係数S
MxN(i,j)は16384であり、逆スケーリング係数IS
MxN(i,j)は64であり、これらは、それぞれ14ビットおよび6ビット(たとえば、正確に14ビットおよび6ビット)である。
【0180】
各ステージの出力ダイナミックレンジが、16ビットに制限される(たとえば、すべてのステージが、16ビットに制限される)場合に、16ビットハードウェアを使用して、プロセス(たとえば、プロセス全体)を実施することができ、潜在的に、たとえば32ビットハードウェアの使用と比較して、はるかに低コストで実施することができる。
【0181】
たとえば、HEVC標準では、4つの変換サイズすなわち、4x4、8x8、16x16、および32x32を使用することができる。変換行列を、T
M(M=4,8,16,および32)と表す。T
M(0,0)は64である。S
MxN(i,j)×IS
MxN(i,j)は、QPに関わりなく、2
20と等しい(たとえば、必ず2
20と等しいものとすることができる)(本明細書の表2を参照されたい)。これらの条件を表3に代入すると、各ステージの後の理論的ダイナミックレンジを決定することができる。近似(36)に基づいて、右シフトの総ビット数は、それぞれ4x4/8x8/16x16/32x32変換について48/50/52/54である。同一の表記パターンA/B/C/Dを、表4で使用する。HEVCは、4つの非正方形変換すなわちM=4、N=16;M=16、N=4;M=8、N=32;M=32、N=8を採用した。簡潔さのために、正方形変換(M=N)のみを議論するが、当業者は、非正方形変換が、正方形変換に類似し、その手順も類似することを理解する。
【0182】
量子化ステップサイズZ
MxN(i,j)が1と等しい時に、表4は、右シフトの総ビット数が、第4の列の各ステージの後および各ステップの右シフトの後にどのように分配されるのかを示す。出力ダイナミックレンジは、陰付きのセルによって示される。ステージ3の出力は、ビットストリームにコーディングされる変換係数であり、ステージ6の出力は、ビデオを再構成するのに使用される残差である。ステージ3および6に関連付けられたダイナミックレンジを、理論的ダイナミックレンジと一貫するように構成することができる。他のステージの出力は、16ビット範囲におさまり、右シフトのビット数によって制御される。丸めが考慮に入れられるので、ステー5の出力を15と等しくすることが保守的であることが企図されている
【0184】
ある種の代表的な実施形態では、変換スキップモード手順およびダイナミックレンジ制御手順を実施することができる。たとえば、ビデオコーディングでの変換を使用して、予測誤差の間の相関を除去することができる。HEVCでのインター予測は、非常に洗練されたものになる可能性があり、低いエネルギおよびわずかな相関を有する予測誤差をもたらす可能性があるので、たとえば、相関は、水平方向または垂直方向に存在する可能性がある(たとえば、存在するのみである可能性がある)。(1)水平変換のみを適用でき、垂直変換をスキップできる第1のモード、(2)垂直変換のみを適用でき、水平変換をスキップできる第2のモード、および(3)通常の2−D変換に加えて、水平方向と垂直方向との両方での変換をスキップできる第3のモードを含む、3つの変換スキップモードを使用することができる。第1、第2、および第3のモードについて、右シフトの総ビット数を、各ステージで異なって分配することができる。第1、第2、および第3のモードの各ステージの右シフトの総ビット数を、それぞれ表5、表6、および表7に示す。
【0189】
中間データの精度を保ち、よい性能を得るために、データのダイナミックレンジを、できる限り広くする(またはセットする)ことができる。16ビット実施態様では、ダイナミックレンジを、最大にすることができ、すべてのステージの終りでのダイナミックレンジを、16ビットにセットすることができる。しかし、ダイナミックレンジ制御は、(1)第1のモード(たとえば、水平のみの変換モード)(表5を参照されたい)および(2)第2のモード(たとえば、垂直のみの変換モード)(表6を参照されたい)について効率的ではない可能性がある。表5では、ステージ3の出力が、15ビット範囲(15ビット範囲のみ)を有する可能性がある。表6では、ステージ1および3の出力が、それぞれ9+ΔBD範囲および10+ΔBD範囲を有する可能性がある(たとえば、のみを有する可能性がある)。
【0190】
本明細書で説明する実施形態は、(1)垂直変換を除いて水平変換が適用される第1のモード(または水平のみの変換モード)および/または(2)垂直変換を除いて水平変換が適用される第2のモード(または垂直のみの変換モード)のダイナミックレンジ制御を提供する。ある種の代表的な実施形態では、第1のモードおよび第2のモードは、Nビット精度の最大化を可能にすることができる(たとえば、Nビットハードウェアおよび論理の単純化のための、ここで、Nは、整数であり、たとえば2
1、2
2、2
3、2
4…とすることができる)。
【0191】
表8に、量子化および逆量子化の後の右シフトのビット数を示す。示された4つの変換スキップモードは、表8に示されているように、同一のS
MxN(i,j)およびIS
MxN(i,j)を共有し、異なるQ
MxN(i,j)およびIQ
MxN(i,j)を使用することができる。モード(たとえば、すべてのモード)(たとえば、水平および垂直(H&V)、垂直のみ(VO)、水平のみ(HO)、および/または両方スキップ(BS))は、H&Vモードと同一の右シフトのビット数を使用することができ、右シフトの適当な(たとえば、正しい)ビット数に合わせるために、S
MxN(i,j)およびIS
MxN(i,j)の値を調整することができる。たとえば、量子化ユニット206では、4x4HOモードを、20ビット、右にシフトシフトすることができる。Q
MxN(i,j)を、19である4x4H&Vモードに整列させることができる。右シフトの1つ多いビットを補償するために、S
MxN(i,j)を1ビット、右にシフトシフトすることができる。もう1つの例として、逆量子化ユニット210では、16x16HOモード(たとえば、第1のモード)は、右シフトに2ビットを使用することができ、IQ
MxN(i,j)は、3と等しいものとすることができる。IS
MxN(i,j)を、1ビット、左にシフトしなければならない場合がある。非整数ビット数のシフトを、整数演算を使用して実施することはできない。それぞれ4x4、8x8、16x16、および32x32の変換について、ルックアップテーブルを定義することができる{128,181,256,362}。このテーブル内の数は、{2
7,2
7.5,2
8,2
8.5}と等しいものとすることができる。8x8変換の量子化に1.5ビットの右シフトを適用することによって、S
MxN(i,j)に181を乗算し、9ビット、右にシフトシフトすることができる。32x32変換の量子化に2.5ビットの右シフトを適用することによって、S
MxN(i,j)に362を乗算し、11ビット、右にシフトシフトすることができる。ある種の手順では、4つの整数を含むルックアップテーブルを格納することができ、かつ/または量子化および逆量子化が、複数の右シフト(たとえば、2回右にシフトする)を実施することができる。追加のまたは第2の右シフトは、より多くの精度損失を引き起こす可能性があり、より非効率的なコーディングを生成する可能性がある(たとえば、単一の右シフトに対する全体的なコーディング効率のペナルティ)。
【0192】
本明細書で詳細に説明されるのは、非整数ビットの右シフトを解決する方法、装置、およびシステムである。異なる変換スキップモードに使用される量子化ステップサイズは、同一とすることができ、これは、より少ない変換を使用するモードが、より多くの変換を使用するモードより大きい量子化誤差を有することを引き起こす可能性がある。異なる変換スキップモードの量子化誤差を一様にするために、量子化ステップサイズを、2−D変換、水平/垂直のみの変換、および/または変換なしのモードに関して減らすことができる。ΔQPが、変換の異なる次元を使用して見つけられまたは決定され得る(たとえば、変換の次元のそれぞれについてΔQPを見つける)ことが企図されている。
【0195】
1つの代表的な実施形態では、HOおよび/またはVO変換モードのダイナミックレンジ制御を提供することができる。HOおよび/またはVOモードの両方に関する1つの代表的なダイナミックレンジ制御プロセスは、表9に示されているように、表5および/または表6に示された手順を置換することができる。理論的なダイナミックレンジと一貫するダイナミックレンジを有する第2および第4のステージの出力を除いて、右シフトの後の他の出力は、16ビットダイナミックレンジを有することができる(たとえば、すべてが有することができる)。
【0196】
ある種の代表的実施形態は、非整数ビットのシフトを提供することができる。たとえば、HOおよびVOモードのQ
MxN(i,j)およびIQ
MxN(i,j)を、表8に示す。両方のスキップされるモードのQ
MxN(i,j)およびIQ
MxN(i,j)は、表8に示されているように14および6である。Q
MxN(i,j)およびIQ
MxN(i,j)が整数である場合には、4つの変換スキップモードは、同一のS
MxN(i,j)およびIS
MxN(i,j)を共有することができ、それら自体のQ
MxN(i,j)およびIQ
MxN(i,j)を右シフトする(たとえば、直接に右シフトする)ことができる。Q
MxN(i,j)およびIQ
MxN(i,j)が非整数値(たとえば、19.5、18.5、0.5、および1.5)と等しい時には、動作を、下で説明するように変更することができる。
【0197】
表10に示されているように、表2のSおよびISの行を、3のステップで循環シフトすることができる(たとえば、とりわけ、インデックス0のエントリを、インデックス3のエントリまで移動することができ、インデックス5のエントリを、インデックス2のエントリに移動することができる)。本明細書で議論するように、近傍エントリ(たとえば、2つの近傍エントリ)の大きさの差を、2
1/6倍とすることができ、3の距離を有するエントリ(たとえば、2つのエントリ)の大きさの差を、2
1/2倍とすることができる。たとえば、そのQP%6が3以上であるSの大きさを、2
0.5倍増やすことができ、そのQP%6が3より小さいSの大きさを、2
0.5倍減らすことができる。そのQP%6が3以上であるISの大きさを、2
0.5倍減らすことができ、そのQP%6が3より小さいISの大きさを、2
0.5倍増やすことができる。その結果は、1/2ビットシフトが、SおよびISを調整することによって行われ、整数個のビットが、QおよびIQに関して残されることとすることができる。X.5ビットの右シフトが、Qおよび/またはIQについて望まれる場合に、正しい整数個数のビットを、表11に示す。プロセスは、スケーリング係数にこの表を再利用することができ、量子化および逆量子化に1つのみの右シフト動作を使用することができる。
【0201】
ある種の代表的な実施形態では、たとえば異なる変換スキップモードについて、適応量子化ステップサイズを提供する手順を実施することができる。1−D変換の場合について、変換を有するおよび変換を有しない信号に同一のQPを使用する時に、量子化誤差の重みを、式(21)に示されているように符号化利得(CG)によって測定することができる。
【0203】
ここで、D
Sは、変換を有しない信号の量子化誤差であり、D
Tは、変換を有する信号の量子化誤差である。下付きのSおよびTは、それぞれ空間領域および変換領域を表す。式またはアルゴリズム(たとえば、ハードウェアを介して実行される)を使用して、CG(たとえば、その値が、変換サイズおよび入力信号の相関ρに依存する可能性がある)を計算することができる。変化サイズおよび相関ρを考慮して、コーディング利得をCG(size,ρ)と表すことができる。その式に基づいて、CG(size,ρ)を計算することができる。値を、表12に示す。変換の1つ少ない次元によって引き起こされるより大きい量子化誤差を補償するために、変換を有しない信号のステップサイズに対する変換を有する信号のステップサイズの比が表12に示された値になるように、小さいQPを使用することができる。たとえば、QPの減分は、式(22)に示されているように、CG(size,ρ)倍のステップサイズ減少を引き起こす可能性がある。
【0205】
式(22)に基づいて、ΔQPを、式(39)に示されているように計算することができ、その値を、表13に示す。
【0206】
ΔQP=round(log
2CG(size,ρ)×6) (23)
【0207】
本明細書で説明される代表的なシステムおよび方法は、有線ネットワークおよび無線ネットワークを含むすべてのタイプの通信を用いるビデオ通信によく適するものとすることができる。さまざまなタイプの無線デバイスおよびインフラストラクチャの概要を、
図4A〜4Eに関して提供し、ここで、ネットワークのさまざまな要素は、本明細書で説明されるシステムおよび方法を利用することができる。簡潔さのために、無線ネットワークを説明するが、当業者が理解するように、さまざまな実施形態は、とりわけ、有線ネットワーク、混合されたネットワーク(たとえば、有線および無線)、および/またはアドホックネットワークにも同等にあてはまる。より具体的には、無線基地局(BTS)、Node−B、eNode B、Home Node B、Home eNode B、サイトコントローラ、アクセスポイント(AP)、無線ルータ、無線送受信ユニット(WTRU)を含むメディアアウェアネットワーク要素(media aware network element、MANE)などの基地局は、あるエンティティから別のエンティティにコーディングされたビデオデータを伝えるのに、本明細書で説明される方法を利用することができる。
【0208】
図4Aは、1または複数の開示される実施形態を実施できる例の通信システム400の図である。通信システム400を、音声、データ、ビデオ、メッセージング、ブロードキャストなどのコンテンツを複数の無線ユーザに提供する多元接続システムとすることができる。通信システム400は、複数の無線ユーザが、無線帯域幅を含むシステムリソースの共有を介してそのようなコンテンツにアクセスすることを可能にすることができる。たとえば、通信システム400は、符号分割多元接続(CDMA)、時分割多元接続(TDMA)、周波数分割多元接続(FDMA)、直交FDMA(OFDMA)、single−carrier FDMA(SC−FDMA)、および類似物などの1または複数のチャネルアクセス方法を使用することができる。
【0209】
図4Aに示されているように、通信システム400は、無線送受信ユニット(WTRU)402a、402b、402c、402d、無線アクセスネットワーク(RAN)404、コアネットワーク406、公衆交換電話網(PSTN)408、インターネット410、および他のネットワーク412を含むことができるが、開示される実施形態が、任意の個数のWTRU、基地局、ネットワーク、および/またはネットワーク要素を企図することを了解されたい。WTRU 402a、402b、402c、402dのそれぞれを、無線環境内で動作し、かつ/または通信するように構成された任意のタイプのデバイスとすることができる。たとえば、WTRU 402a、402b、402c、402dを、無線信号を送信し、かつ/または受信するように構成することができ、WTRU 402a、402b、402c、402dは、ユーザ機器(UE)、移動局、固定のまたは可動のサブスクライバユニット、ポケットベル、セルラ電話機、携帯情報端末(PDA)、スマートホン、ラップトップ機、ネットブック、パーソナルコンピュータ、無線センサ、消費者エレクトロニクス、または圧縮されたビデオ通信を受信し、処理することができる任意の他の端末を含むことができる。
【0210】
通信システム400は、基地局414aおよび基地局414bをも含むことができる。基地局414a、414bのそれぞれは、コアネットワーク406、インターネット410、および/またはネットワーク412などの1または複数の通信ネットワークへのアクセスを容易にするためにWTRU 402a、402b、402c、402dのうちの少なくとも1つと無線でインターフェース接続するように構成された任意のタイプのデバイスとすることができる。たとえば、基地局414a、414bを、無線基地局(BTS)、Node−B、eNode B、Home Node B、Home eNode B、サイトコントローラ、アクセスポイント(AP)、無線ルータ、および類似物とすることができる。基地局414a、414bは、それぞれ単一の要素として図示されているが、基地局414a、414bが、任意の個数の相互接続された基地局および/またはネットワーク要素を含むことができることを了解されたい。
【0211】
基地局414aを、RAN 404の一部とすることができ、RAN 404は、他の基地局および/または基地局制御装置(BSC)、無線ネットワーク制御装置(RNC)、中継ノード、その他などのネットワーク要素(図示せず)を含むこともできる。基地局414aおよび/または基地局414bを、セル(図示せず)と称する場合もある特定の地理的領域内で無線信号を送信し、かつ/または受信するように構成することができる。セルを、さらに、セルセクタに分割することができる。たとえば、基地局414aに関連付けられたセルを、3つのセクタに分割することができる。したがって、一実施形態では、基地局414aは、3つのトランシーバすなわち、セルのセクタごとに1つのトランシーバを含むことができる。別の実施形態では、基地局414aは、multiple−input multiple output(MIMO)技術を使用することができ、したがって、セルのセクタごとに複数のトランシーバを利用することができる。
【0212】
基地局414a、414bは、エアインターフェース416を介してWTRU 402a、402b、402c、402dのうちの1または複数と通信することができ、エアインターフェース416は、任意の適切な無線通信リンク(たとえば、ラジオ周波数(RF)、マイクロ波、赤外線(IR)、紫外線(UV)、可視光、その他)とすることができる。エアインターフェース416を、任意の適切な無線アクセス技術(RAT)を使用して確立することができる。
【0213】
より具体的には、上で注記したように、通信システム400は、多元接続システムとすることができ、CDMA、TDMA、FDMA、OFDMA、SC−FDMA、および類似物など、1または複数のチャネルアクセス方式を使用することができる。たとえば、RAN 404内の基地局414aおよびWTRU 402a、402b、402cは、Universal Mobile Telecommunications System(UMTS)Terrestrial Radio Access(UTRA)などの無線技術を実施することができ、UTRAは、wideband CDMA(WCDMA(登録商標))を使用してエアインターフェース416を確立することができる。WCDMAは、High−Speed Packet Access(HSPA)および/またはEvolved HSPA(HSPA+)などの通信プロトコルを含むことができる。HSPAは、High−Speed Downlink Packet Access(HSDPA)および/またはHigh−Speed Uplink Packet Access(HSUPA)を含むことができる。
【0214】
別の実施形態では、基地局414aおよびWTRU 402a、402b、402cは、Evolved UMTS Terrestrial Radio Access(E−UTRA)などの無線技術を実施することができ、E−UTRAは、Long Term Evolution(LTE)および/またはLTE−Advanced(LTE−A)を使用してエアインターフェース416を確立することができる。
【0215】
他の実施形態では、基地局414aおよびWTRU 402a、402b、402cは、IEEE 802.16(すなわち、Worldwide Interoperability for Microwave Access(WiMAX))、CDMA2000、CDMA2000 1X、CDMA2000 EV−DO、Interim Standard 2000(IS−2000)、Interim Standard 45(IS−95)、Interim Standard 856(IS−856)、Global System for Mobile communications(GSM(登録商標))、Enhanced Data rates for GSM Evolution(EDGE)、GSM EDGE(GERAN)、および類似物などの無線技術を実施することができる。
【0216】
図4Aの基地局414bは、たとえば無線ルータ、Home Node B、Home eNode B、またはアクセスポイントとすることができ、仕事場、家庭、車両、キャンパス、および類似物など、局所化された区域内での無線接続性を容易にするために任意の適切なRATを利用することができる。一実施形態では、基地局414bおよびWTRU 402c、402dは、無線ローカルエリアネットワーク(WLAN)を確立するためにIEEE 802.11などの無線技術を実施することができる。別の実施形態では、基地局414bおよびWTRU 402c、402dは、無線パーソナルエリアネットワーク(WPAN)を確立するためにIEEE 802.15などの無線技術を実施することができる。別の実施形態では、基地局414bおよびWTRU 402c、402dは、ピコセルまたはフェムトセルを確立するためにセルラベースのRAT(たとえば、WCDMA、CDMA2000、GSM、LTE、LTE−A、その他)を利用することができる。
図4Aに示されているように、基地局414bは、インターネット410への直接接続を有することができる。したがって、基地局414bは、コアネットワーク406を介してインターネット410にアクセスすることを要求されないものとすることができる。
【0217】
RAN 404は、コアネットワーク406と通信しているものとすることができ、コアネットワーク406は、音声、データ、アプリケーション、および/またはvoice over internet protocol(VoIP)のサービスをWTRU 402a、402b、402c、402dのうちの1または複数に提供するように構成された任意のタイプのネットワークとすることができる。たとえば、コアネットワーク406は、呼制御、請求サービス、モバイル位置ベースのサービス、前払い呼、インターネット接続性、ビデオ分配、その他を提供し、かつ/またはユーザ認証などの高レベルセキュリティ機能を実行することができる。
図4Aには図示されていないが、RAN 404および/またはコアネットワーク406が、RAN 404と同一のRATまたは異なるRATを使用する他のRANと直接にまたは間接に通信しているものとすることができることを了解されたい。たとえば、E−UTRA無線技術を利用している可能性があるRAN 404に接続されることに加えて、コアネットワーク406は、GSM無線技術を利用している別のRAN(図示せず)と通信しているものとすることもできる。
【0218】
コアネットワーク406は、WTRU 402a、402b、402c、402dがPSTN 408、インターネット410、および/または他のネットワーク412にアクセスするためのゲートウェイとして働くこともできる。PSTN 408は、plain old telephone service(POTS)を提供する回線交換電話網を含むことができる。インターネット410は、伝送制御プロトコル(TCP)/インターネットプロトコル(IP)インターネットプロトコルスイート内のTCP、ユーザデータグラムプロトコル(UDP)、およびIPなどの共通の通信プロトコルを使用する相互接続されたコンピュータネットワークおよびデバイスの全世界のシステムを含むことができる。ネットワーク412は、他のサービスプロバイダによって所有され、かつ/または運営される有線または無線の通信ネットワークを含むことができる。たとえば、ネットワーク412は、RAN 404と同一のRATまたは異なるRATを使用することができる1または複数のRANに接続された別のコアネットワークを含むことができる。
【0219】
通信システム400内のWTRU 402a、402b、402c、402dの一部またはすべては、マルチモード能力を含むことができる、すなわち、WTRU 402a、402b、402c、402dは、異なる無線リンクを介して異なる無線ネットワークと通信する複数のトランシーバを含むことができる。たとえば、
図4Aに示されたWTRU 402cを、セルラベースの無線技術を使用できる基地局414aおよびIEEE 802無線技術を使用できる基地局414bと通信するように構成することができる。
【0220】
図4Bは、例のWTRU 402のシステム図である。
図4Bに示されているように、WTRU 402は、プロセッサ418、トランシーバ420、送受信要素422、スピーカ/マイクロホン424、キーパッド426、ディスプレイ/タッチパッド428、ノンリムーバブルメモリ430、リムーバブルメモリ432、電源434、全地球測位システム(GPS)チップセット436、および他の周辺機器438を含むことができる。WTRU 402が、実施形態と一貫したままでありながら前述の要素の任意の副組合せを含むことができることを了解されたい。
【0221】
プロセッサ418を、汎用プロセッサ、特殊目的プロセッサ、従来のプロセッサ、ディジタル信号プロセッサ(DSP)、グラフィックス処理ユニット(GPU)、複数のマイクロプロセッサ、DSPコアに関連付けられた1または複数のマイクロプロセッサ、コントローラ、マイクロコントローラ、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)回路、任意の他のタイプの集積回路(IC)、状態機械、および類似物とすることができる。プロセッサ418は、信号符号化、データ処理、電力制御、入出力処理、および/またはWTRU 402が無線環境内で動作することを可能にする任意の他の機能性を実行することができる。プロセッサ418を、トランシーバ420に結合することができ、トランシーバ420を、送受信要素422に結合することができる。
図4Bは、別々のコンポーネントとしてプロセッサ418およびトランシーバ420を示すが、プロセッサ418およびトランシーバ420を、電子パッケージまたはチップ内に一緒に一体化することができることを了解されたい。
【0222】
エアインターフェース416を介して基地局(たとえば、基地局414a)へ信号を送信しまたはこれから信号を受信するように、送受信要素422を構成することができる。たとえば、一実施形態では、送受信要素422を、RF信号を送信し、かつ/または受信するように構成されたアンテナとすることができる。別の実施形態では、送受信要素422を、たとえばIR、UV、または可視光信号を送信し、かつ/または受信するように構成されたエミッタ/検出器とすることができる。別の実施形態では、送受信要素422を、RF信号と光信号との両方を送信し、受信するように構成することができる。送受信要素422を、無線信号の任意の組合せを送信し、かつ/または受信するように構成することができることを了解されたい。
【0223】
さらに、送受信要素422は、
図4Bでは単一の要素として図示されているが、WTRU 402は、任意の個数の送受信要素422を含むことができる。より具体的には、WTRU 402は、MIMO技術を使用することができる。したがって、一実施形態では、WTRU 402は、エアインターフェース416を介して無線信号を送信し、かつ受信する複数の送受信要素422(たとえば、複数のアンテナ)を含むことができる。
【0224】
送受信要素422によって送信される信号を変調し、かつ送受信要素422によって受信される信号を復調するように、トランシーバ420を構成することができる。上で注記したように、WTRU 402は、マルチモード能力を有することができる。したがって、トランシーバ420は、WTRU 402がたとえばUTRAおよびIEEE 802.11などの複数のRATを介して通信することを可能にする複数のトランシーバを含むことができる。
【0225】
WTRU 402のプロセッサ418は、スピーカ/マイクロホン424、キーパッド426、および/またはディスプレイ/タッチパッド428(たとえば、液晶ディスプレイ(LCD)表示ユニットまたは有機発光ダイオード(OLED)表示ユニット)に結合され、これらからユーザ入力データを受け取ることができる。プロセッサ418は、ユーザデータをスピーカ/マイクロホン424、キーパッド426、および/またはディスプレイ/タッチパッド428に出力することもできる。さらに、プロセッサ418は、ノンリムーバブルメモリ430および/またはリムーバブルメモリ432などの任意のタイプの適切なメモリからの情報にアクセスし、かつそのメモリにデータを格納することができる。ノンリムーバブルメモリ430は、ランダムアクセスメモリ(RAM)、読取り専用メモリ(ROM)、ハードディスク、または任意の他のタイプのメモリストレージデバイスを含むことができる。リムーバブルメモリ432は、subscriber identity module(SIM)カード、メモリスティック、secure digital(SD)メモリカード、および類似物を含むことができる。他の実施形態では、プロセッサ418は、サーバ上またはホームコンピュータ(図示せず)上など、WTRU 402上に物理的に配置されていないメモリからの情報にアクセスし、かつそのメモリにデータを格納することができる。
【0226】
プロセッサ418は、電源434から電力を受け取ることができ、かつWTRU 402内の他のコンポーネントに電力を分配し、かつ/または制御するように構成することができる。電源434は、WTRU 402に電力を供給する任意の適切なデバイスとすることができる。たとえば、電源434は、1または複数の乾電池(たとえば、ニッケル−カドミウム(NiCd)、ニッケル−亜鉛(NiZn)、ニッケル水素(NiMH)、リチウムイオン(Li−ion)、その他)、太陽電池、燃料電池、および類似物を含むことができる。
【0227】
プロセッサ418を、GPSチップセット436に結合することもでき、GPSチップセット436を、WTRU 402の現在位置に関する位置情報(たとえば、経度および緯度)を提供するように構成することができる。GPSチップセット436からの情報に加えてまたはその代わりに、WTRU 402は、基地局(たとえば、基地局414a、414b)からエアインターフェース416を介して位置情報を受信し、かつ/または複数の近くの基地局から受信されつつある信号のタイミングに基づいてその位置を決定することができる。WTRU 402が、実施形態と一貫したままでありながら任意の適切な位置決定方法によって位置情報を獲得できることを了解されたい。
【0228】
プロセッサ418を、他の周辺機器438にさらに結合することができ、他の周辺機器438は、追加の特徴、機能性、および/または有線もしくは無線の接続性を提供する1または複数のソフトウェアモジュールおよび/またはハードウェアモジュールを含むことができる。たとえば、周辺機器438は、加速度計、eコンパス、衛星トランシーバ、ディジタルカメラ(写真またはビデオ用)、universal serial bus(USB)ポート、振動デバイス、テレビジョントランシーバ、ハンズフリーヘッドセット、Bluetooth(登録商標)モジュール、周波数変調(FM)ラジオユニット、ディジタル音楽プレイヤ、メディアプレイヤ、ビデオゲームプレイヤモジュール、インターネットブラウザ、および類似物を含むことができる。
【0229】
図4Cは、一実施形態によるRAN 404およびコアネットワーク406のシステム図である。上で注記したように、RAN 404は、エアインターフェース416を介してWTRU 402a、402b、402cと通信するのにUTRA無線技術を使用することができる。RAN 404は、コアネットワーク406と通信していることもできる。
図4Cに示されているように、RAN 404は、Node−B 440a、440b、440cを含むことができ、このNode−B 440a、440b、440cは、それぞれ、エアインターフェース416を介してWTRU 402a、402b、402cと通信する1または複数のトランシーバを含むことができる。Node−B 440a、440b、440cのそれぞれを、RAN 404内の特定のセル(図示せず)に関連付けることができる。RAN 404は、RNC 442a、442bをも含むことができる。RAN 404が、実施形態と一貫したままでありながら任意の個数のNode−BおよびRNCを含むことができることを了解されたい。
【0230】
図4Cに示されているように、Node−B 440a、440bは、RNC 442aと通信しているものとすることができる。さらに、Node−B 440cは、RNC 442bと通信しているものとすることができる。Node−B 440a、440b、440cは、Iubインターフェースを介してそれぞれのRNC 442a、442bと通信することができる。RNC 442a、442bは、Iurインターフェースを介してお互いと通信しているものとすることができる。RNC 442a、442bのそれぞれは、それが接続されるそれぞれのNode−B 440a、440b、440cを制御するように構成され得る。さらに、RNC 442a、442bのそれぞれは、外側ループ電力制御、負荷制御、アドミッション制御、パケットスケジューリング、ハンドオーバ制御、マクロダイバーシティ、セキュリティ機能、データ暗号化、および類似物などの他の機能性を実行しまたはサポートするように構成され得る。
【0231】
図4Cに示されたコアネットワーク406は、メディアゲートウェイ(MGW)444、mobile switching center(MSC)446、serving GPRS support node(SGSN)448、および/またはgateway GPRS support node(GGSN)450を含むことができる。前述の要素のそれぞれが、コアネットワーク406の一部として図示されているが、これらの要素の任意の1つが、コアネットワークオペレータ以外のエンティティによって所有され、かつ/または運営される場合があることを了解されたい。
【0232】
RAN 404内のRNC 442aを、IuCSインターフェースを介してコアネットワーク406内のMSC 446に接続することができる。MSC 446を、MGW 444に接続することができる。MSC 446およびMGW 444は、WTRU 402a、402b、402cと伝統的な陸線通信デバイスとの間の通信を容易にするために、PSTN 408などの回線交換ネットワークへのアクセスをWTRU 402a、402b、402cに与えることができる。
【0233】
RAN 404内のRNC 442aを、IuPSインターフェースを介してコアネットワーク406内のSGSN 448に接続することもできる。SGSN 448を、GGSN 450に接続することができる。SGSN 448およびGGSN 450は、WTRU 402a、402b、402cとIP対応デバイスとの間の通信を容易にするために、インターネット410などのパケット交換ネットワークへのアクセスをWTRU 402a、402b、402cに与えることができる。
【0234】
上で注記したように、コアネットワーク406を、ネットワーク412に接続することもでき、ネットワーク412は、他のサービスプロバイダによって所有され、かつ/または運営される他の有線ネットワークまたは無線ネットワークを含むことができる。
【0235】
図4Dは、もう1つの実施形態によるRAN 404およびコアネットワーク406のシステム図である。上で注記したように、RAN 404は、エアインターフェース416を介してWTRU 402a、402b、402cと通信するのにE−UTRA無線技術を使用することができる。RAN 404は、コアネットワーク406と通信していることもできる。
【0236】
RAN 404は、eNode−B 460a、460b、460cを含むことができるが、RAN 404が、実施形態と一貫したままでありながら任意の個数のeNode−Bを含むことができることを了解されたい。eNode−B 460a、460b、460cは、それぞれ、エアインターフェース416を介してWTRU 402a、402b、402cと通信する1または複数のトランシーバを含むことができる。一実施形態では、eNode−B 460a、460b、460cは、MIMO技術を実施することができる。したがって、たとえば、eNode−B 460aは、WTRU 402aに無線信号を送信し、かつこれから無線信号を受信するのに複数のアンテナを使用することができる。
【0237】
eNode−B 460a、460b、460cのそれぞれを、特定のセル(図示せず)に関連付けることができ、無線リソース管理判断、ハンドオーバ判断、アップリンクおよび/またはダウンリンクでのユーザのスケジューリング、ならびに類似物を処理するように構成することができる。
図4Dに示されているように、eNode−B 460a、460b、460cは、X2インターフェースを介してお互いと通信することができる。
【0238】
図4Dに示されたコアネットワーク406は、mobility management gateway(MME)462、サービングゲートウェイ464、およびpacket data network(PDN)ゲートウェイ466を含むことができる。前述の要素のそれぞれが、コアネットワーク406の一部として図示されているが、これらの要素の任意の1つが、コアネットワークオペレータ以外のエンティティによって所有され、かつ/または運営される場合があることを了解されたい。
【0239】
MME 462は、S1インターフェースを介してRAN 404内のeNode−B 460a、460b、460cのそれぞれに接続され得、制御ノードとして働くことができる。たとえば、MME 462は、WTRU 402a、402b、402cのユーザの認証、ベアラアクティブ化/非アクティブ化、WTRU 402a、402b、402cの初期アタッチ中の特定のサービングゲートウェイの選択、および類似物の責任を負うことができる。MME 462は、RAN 404とGSMまたはWCDMAなどの他の無線技術を使用する他のRAN(図示せず)との間で切り替えるための制御プレーン機能を提供することもできる。
【0240】
サービングゲートウェイ464を、S1インターフェースを介してRAN 404内のeNode−B 460a、460b、460cのそれぞれに接続することができる。サービングゲートウェイ464は、一般に、WTRU 402a、402b、402cへ/からユーザデータパケットをルーティングし、転送する。サービングゲートウェイ464は、eNode B間ハンドオーバ中のユーザプレーンのアンカリング、ダウンリンクデータがWTRU 402a、402b、402cについて使用可能である時のページングのトリガ、WTRU 402a、402b、402cのコンテキストの管理および格納、ならびに類似物など、他の機能を実行することもできる。
【0241】
サービングゲートウェイ464を、PDNゲートウェイ466に接続することもでき、PDNゲートウェイ466は、WTRU 402a、402b、402cとIP対応デバイスとの間の接続を容易にするために、インターネット410などのパケット交換ネットワークへのアクセスをWTRU 402a、402b、402cに与えることができる。
【0242】
コアネットワーク406は、他のネットワークとの通信を容易にすることができる。たとえば、コアネットワーク406は、WTRU 402a、402b、402cと伝統的な陸線通信デバイスとの間の通信を容易にするために、PSTN 408などの回線交換ネットワークへのアクセスをWTRU 402a、402b、402cに与えることができる。たとえば、コアネットワーク406は、コアネットワーク406とPSTN 408との間のインターフェースとして働くIPゲートウェイ(たとえば、IMS(IPマルチメディアサブシステム)サーバ)を含むことができ、またはこれと通信することができる。さらに、コアネットワーク406は、他のサービスプロバイダによって所有され、かつ/または運営される他の有線または無線のネットワークを含むことができるネットワーク412へのアクセスをWTRU 402a、402b、402cに与えることができる。
【0243】
図4Eは、一実施形態によるRAN 404およびコアネットワーク406を示すシステム図である。RAN 404は、エアインターフェース416を介してWTRU 402a、402b、402cと通信するのにIEEE 802.16無線技術を使用するASN(アクセスサービスネットワーク)とすることができる。下でさらに議論するように、WTRU 402a、402b、402c、RAN 404、およびコアネットワーク406の異なる機能エンティティの間の通信リンクを、基準ポイントと定義することができる。
【0244】
図4Eに示されているように、RAN 404は、基地局470a、470b、470c、およびASNゲートウェイ472を含むことができるが、RAN 404が、実施形態と一貫したままでありながら任意の個数の基地局およびASNゲートウェイを含むことができることを了解されたい。基地局470a、470b、470cを、それぞれ、RAN 404内の特定のセル(図示せず)に関連付けることができ、基地局470a、470b、470cは、それぞれ、エアインターフェース416を介してWTRU 402a、402b、402cと通信するために1または複数のトランシーバを含むことができる。一実施形態では、基地局470a、470b、470cは、MIMO技術を実施することができる。したがって、たとえば、基地局470aは、WTRU 402aに無線信号を送信し、かつWTRU 402aから無線信号を受信するのに複数のアンテナを使用することができる。基地局470a、470b、470cは、ハンドオフトリガ、トンネル確立、無線リソース管理、トラフィック分類、サービス品質(QoS)ポリシ実施、および類似物などのモビリティ管理機能を提供することもできる。ASNゲートウェイ472は、トラフィックアグリゲーションポイントとして働くことができ、ページング、サブスクライバプロファイルのキャッシング、コアネットワーク406へのルーティング、および類似物の責任を負うことができる。
【0245】
WTRU 402a、402b、402cとRAN 404との間のエアインターフェース416は、IEEE 802.16仕様を実施するR1基準ポイントと定義することができる。さらに、WTRU 402a、402b、402cのそれぞれは、コアネットワーク406との論理インターフェース(図示せず)を確立することができる。WTRU 402a、402b、402cとコアネットワーク406との間の論理インターフェースは、認証、認可、IPホスト構成管理、および/またはモビリティ管理に使用できるR2基準ポイントと定義することができる。
【0246】
基地局470a、470b、470cのそれぞれの間の通信リンクは、WTRUハンドオーバおよび基地局の間のデータの転送を容易にするプロトコルを含むR8基準ポイントと定義することができる。基地局470a、470b、470cとASNゲートウェイ215との間の通信リンクを、R6基準ポイントと定義することができる。R6基準ポイントは、WTRU 402a、402b、402cのそれぞれに関連付けられたモビリティイベントに基づくモビリティ管理を容易にするプロトコルを含むことができる。
【0247】
図4Eに示されているように、RAN 404を、コアネットワーク406に接続することができる。RAN 404とコアネットワーク406との間の通信リンクを、たとえばデータ転送およびモビリティ管理能力を容易にするプロトコルを含むR3基準ポイントと定義することができる。コアネットワーク406は、mobile IP home agent(MIP−HA)474、authentication,authorization,accounting(AAA)サーバ476、およびゲートウェイ478を含むことができる。前述の要素のそれぞれは、コアネットワーク406の一部として図示されているが、これらの要素のいずれかを、コアネットワークオペレータ以外のエンティティが所有し、かつ/または運営することができることを了解されたい。
【0248】
MIP−HA 474は、IPアドレス管理の責任を負うことができ、WTRU 402a、402b、402cが異なるASNおよび/または異なるコアネットワークの間でローミングすることを可能にすることができる。MIP−HA 474は、WTRU 402a、402b、402cとIP対応デバイスとの間の通信を容易にするために、インターネット410などのパケット交換ネットワークへのアクセスをWTRU 402a、402b、402cに与えることができる。AAAサーバ476は、ユーザ認証の責任およびユーザサービスをサポートする責任を負うことができる。ゲートウェイ478は、他のネットワークとのインターワーキングを容易にすることができる。たとえば、ゲートウェイ478は、WTRU 402a、402b、402cと伝統的な陸線通信デバイスとの間の通信を容易にするために、PSTN 408などの回線交換ネットワークへのアクセスをWTRU 402a、402b、402cに与えることができる。さらに、ゲートウェイ478は、他のサービスプロバイダによって所有され、かつ/または運営される他の有線または無線のネットワークを含むことができるネットワーク412へのアクセスをWTRU 402a、402b、402cに与えることができる。
【0249】
図4Eには示されていないが、RAN 404を他のASNに接続することができ、かつコアネットワーク406を他のコアネットワークに接続することができることを了解されたい。RAN 404他のASN間の通信リンクを、RAN 404と他のASNとの間でWTRU 402a、402b、402cのモビリティをコーディネートするプロトコルを含むことができるR4基準ポイントと定義することができる。コアネットワーク406と他のコアネットワークとの間の通信リンクを、ホームコアネットワークと訪問されたコアネットワークとの間のインターワーキングを容易にするプロトコルを含むことができるR5基準と定義することができる。
【0250】
図5は、ビデオ残差データを処理する代表的な方法500を示す流れ図である。
【0251】
図5を参照すると、代表的な方法500は、ブロック510で、単一の1次元変換を使用してビデオ残差データを変換して、ビデオブロックに関連付けられた係数の第1のセットを生成できる変換ユニット204と、ブロック520で、係数の第1のセットを量子化して、量子化された係数の第2のセットを生成できる量子化ユニット206とを含むことができる。ブロック530では、エントロピコーディングユニット208が、量子化された係数の第2のセットをエントロピコーディングすることができる。ビットシフトを、エントロピコーディングユニット208によるエントロピコーディングの前に行うことができる。たとえば、ビットシフトを、変換ユニット204での変換または量子化ユニット206での量子化のいずれかの中または後に行うことができる。ブロック540では、送受信ユニット、たとえばTx/Rxユニット120が、量子化された係数のエントロピコーディングされた第2のセットを送信することができる。
【0252】
ある種の代表的な実施形態では、ビデオ残差データの処理は、係数の第1および第2のセットのいずれかをビットシフトすることを含むことができ、ビットシフトは、いずれかの方向(たとえば、処理の任意のステージについて右および/または左)での整数個数のシフトおよび/または分数個数のシフトとすることができる。シフトを、汎用プロセッサ(たとえば、システムコントローラ136)によって生成することができ、または、シフトは、たとえば係数(たとえば、係数のセット)のビットをシフトするのにシフト補償ユニット(図示せず)を使用することができる。整数ビットシフトを、直接ビットシフトによって実施することができ、分数ビットシフトを、それぞれ量子化ユニット206および逆量子化ユニット210で使用されるスケール係数および逆スケール係数に対する調整を使用して実施することができる。
【0253】
ある種の代表的な実施形態では、逆量子化ユニット210は、係数の第2のセットを逆量子化して、逆量子化された係数の第3のセットを生成することができる。
【0254】
ある種の代表的な実施形態では、逆変換ユニット212は、ビデオ残差データを生成するための逆変換された出力として、単一の1次元逆変換を使用して、逆量子化された係数の第3のセットを逆変換することができる。
【0255】
ある種の代表的な実施形態では、係数の第1、第2、および第3のセットまたは逆変換された出力のいずれかをビットシフトすることができる。
【0256】
ある種の代表的な実施形態では、単一の1次元変換を、水平変換または垂直変換(たとえば、順方向水平変換または順方向垂直変換)とすることができる。
【0257】
ある種の代表的な実施形態では、ビットシフト(たとえば、右ビットシフト)を複数のユニット(またはステージ)のうちの1または複数の中または後で行えるように、ビデオ残差データの処理を、少なくとも変換ユニット204(またはステージ)および/または量子化ユニット206(またはステージ)を含む複数のユニットまたはステージで実施することができる。
【0258】
ある種の代表的な実施形態では、処理で使用されるビデオブロックに対する量子化された係数の送信されたエントロピコーディングされた第2のセットから再構成された再構成されたビデオブロックの同一のダイナミックレンジを、たとえば、複数のユニットまたはステージのそれぞれの中または後でダイナミックレンジを調整することによって維持することができる。
【0259】
ある種の代表的な実施形態では、ビデオブロックの処理は、Nが、とりわけ、16ビット処理、32ビット処理、または64ビット処理などの整数である、Nビット処理のみを含むことができる。
【0260】
ある種の代表的な実施形態では、量子化された係数の第2のセットを1ビットの分数、たとえば1/2ビット、ビットシフトするように、HEVC標準に従って確立されたスケール係数のセットを、決定し、調整し、かつ/または事前定義することができ、量子化ユニット206は、スケール係数が決定され、調整され、かつ/または事前定義されたセットを適用することができる。他の代表的な実施形態では、スケール係数の追加のセットを、量子化ユニット206の直後に実施することができる。
【0261】
ある種の代表的な実施形態では、ビットシフトは、循環シフトされるHEVC標準に関連付けられたスケール係数のセットを使用して量子化処理中に1/2ビットシフトすることを含むことができる。
【0262】
ある種の代表的な実施形態では、変換が単一の1次元2
N次変換を使用する時に、分数シフト(たとえば、1/2ビットシフト)を適用する(たとえば、適用するのみとする)ことができ、Nは、奇数の整数である。
【0263】
ある種の代表的な実施形態では、ビットシフトは、変換サイズおよび変換のタイプ(たとえば、とりわけ、垂直、水平、および/または対角線)に従って複数の右ビットシフトまたは左ビットシフト(たとえば、総数および/またはステージごとの)を決定することと、決定されたビットシフトを適用することとを含むことができる。たとえば、右ビットシフトの回数を、変換のサイズに伴って増やすことができる。
【0264】
ある種の代表的な実施形態では、単一の1次元逆変換を、とりわけ、水平逆変換または垂直逆変換とすることができる。
【0265】
ある種の代表的な実施形態では、ビデオ残差データの処理を、複数のユニット(またはステージ)内で実施することができ、ビットシフト(たとえば、右ビットシフトまたは左ビットシフト)を、複数のユニット(またはステージ)のうちの1または複数の中または後に行うことができる。
【0266】
ある種の代表的な実施形態では、処理に使用されるビデオブロックに対する量子化された係数の送信されたエントロピコーディングされた第2のセットから再構成された再構成されたビデオブロックの同一のダイナミックレンジを、複数のユニット(またはステージ)のそれぞれの中または後でダイナミックレンジを調整することによって維持することができる。
【0267】
ある種の代表的な実施形態では、逆量子化ユニット210は、逆量子化された係数の第3のセットを1/2ビット、ビットシフトするように、HEVC標準に従って確立された逆スケール係数のセットを決定し、調整し、かつ/または事前定義することができ、逆スケール係数が決定され、調整され、または事前定義されたセットを適用することができる。
【0268】
ある種の代表的な実施形態では、ビットシフトは、循環シフトされるHEVC標準に関連付けられた逆スケール係数のセットを使用する逆量子化中の1/2ビットシフトまたは分数ビットシフトを含むことができる。
【0269】
ある種の代表的な実施形態では、量子化ユニット206は、スケール係数のセットを選択的に調整しまたは事前定義することができ、逆量子化ユニット210は、量子化された係数の第2のセットを1/2ビット、ビットシフトするように、変換サイズに基づいて、逆スケール係数のセット(たとえば、それぞれ最初はHEVC標準に従って確立された)を選択的に調整しまたは事前定義することができる。量子化ユニット206および逆量子化ユニット210は、選択的に調整されまたは事前定義されたセットを適用することができる。
【0270】
ある種の代表的な実施形態では、ビットシフトは、変換サイズ(たとえば、とりわけ、8x8または32x32の変換サイズ)に基づいて、量子化ユニット206および逆量子化ユニット210の一方または両方の中および/または直後の分数ビットシフトまたは1/2ビットシフトを含むことができる。
【0271】
図6は、ビデオを処理する代表的な方法600を示す流れ図である。
【0272】
図6を参照すると、代表的な方法600は、ブロック610で、Tx/Rxユニット(たとえば、Tx/Rxユニット128)がビデオのビデオブロックに関連付けられた符号化され量子化された係数の第1のセットを取得することと、ブロック620で、エントロピ復号ユニット308が量子化された係数の第1のセットをエントロピ復号することとを含むことができる。ブロック630では、逆量子化ユニット310が、復号された量子化された係数の第1のセットを逆量子化して、逆量子化された係数の第2のセットを生成することができる。ブロック640では、逆変換ユニット312が、単一の1次元逆変換を使用して、逆量子化された係数の第2のセットを逆変換して、再構成されたビデオブロックを生成することができる。
【0273】
当業者が理解するように、代表的な方法600に関連付けられた復号プロセスは、代表的な方法500によって生成されたエントロピ符号化された信号に関連付けられたビデオ(ビデオブロック)を再構成することができる(また、代表的な方法500の逆とすることができる)。ブロック650では、プロセッサおよび/またはシフト補償ユニットが、係数の第1および第2のセットのいずれかをビットシフトすることができる。当業者は、代表的な実施形態の一部またはすべてが、符号器200と復号器300との両方に同等に適用可能であることをも理解する。
【0274】
ある種の代表的な実施形態では、符号器200または復号器300によるビットシフトは、変換サイズおよび変換のタイプ(たとえば、とりわけ、垂直、水平、および/または対角線)に従って複数のビットシフト(たとえば、右ビットシフトおよび/または左ビットシフト(総数および/またはステージごとの))を決定することと、決定されたビットシフト(たとえば、整数ビットシフトおよび/または分数ビットシフト)を適用することとを含むことができる。
【0275】
ある種の代表的な実施形態では、逆量子化ユニット310は、逆量子化された係数の第2のセットを分数ビットまたは1/2ビット、ビットシフトするように、HEVC標準に従って確立された逆スケール係数のセットを決定し、調整し、かつ/または事前定義することができ、変換サイズ(たとえば、とりわけ、8x8または32x32)に基づいて、決定され、調整され、かつ/または事前定義されたセットを選択的に適用することができる。
【0276】
ある種の代表的な実施形態では、ビットシフトは、変換サイズに基づいて、逆量子化ユニット310の中または直後に、分数ビットシフトまたは1/2ビットシフトを選択的に適用することを含むことができる。
【0277】
図7は、ビデオ残差データを処理するもう1つの代表的な方法700を示す流れ図である。
【0278】
図7を参照すると、もう1つの代表的な方法700は、ブロック710で、ビデオ残差データの変換を全く含まないビデオ残差データを量子化して、ステージのうちの第1のステージの出力結果として量子化されたビデオ残差データを生成できる量子化ユニット206を含むことができる。ブロック720では、逆量子化ユニット210が、量子化されたビデオ残差データを逆量子化して、ステージのうちの第2のステージの出力結果として再構成されたビデオ残差データを生成することができる。ブロック730では、ステージのうちの1または複数の中および/またはその後に、その出力結果をビットシフトすることができる。
【0279】
図8は、ビデオを処理するさらなる代表的な方法800を示す流れ図である。
【0280】
図8を参照すると、さらなる代表的な方法800は、ブロック810で、送受信ユニット128が、ビデオのビデオブロックに関連付けられた符号化され量子化された係数の第1のセットを取得することを含むことができる。ブロック820では、エントロピ復号ユニット308が、量子化された係数の第1のセットをエントロピ復号する。ブロック830では、逆量子化ユニット310が、復号された量子化された係数の第1のセットを逆量子化して、逆量子化された係数の第2のセットを生成する。ブロック840では、逆変換ユニット312が、単一の1次元逆変換を使用して、逆量子化された係数の第2のセットを逆変換する。ブロック850では、逆量子化ユニット310、プロセッサ、および/またはシフト補償ユニットが、係数の第1および第2のセットのいずれかをビットシフトする(たとえば、整数ビットシフトし、かつ/または分数ビットシフトする)ことができる。
【0281】
図9は、ビデオを処理する追加の代表的な方法900を示す流れ図である。
【0282】
図9を参照すると、追加の代表的な方法900は、ブロック910で、送受信ユニット120がビデオのビデオブロックを取得することを含むことができる。ブロック920では、変換ユニット204が、単一の1次元変換を使用してビデオ残差データを変換して、ステージのうちの第1のステージの出力結果として、ビデオブロックに関連付けられた係数のセットを生成することができる。ブロック930では、量子化ユニット206が、変換された係数のセットを量子化して、ステージのうちの第2のステージの出力結果として、量子化された係数のセットを生成することができる。ブロック940では、逆量子化ユニット210が、量子化された係数のセットを逆量子化して、ステージのうちの第3のステージの出力結果として、逆量子化された変換された係数のセットを生成することができる。ブロック950では、逆変換ユニット212が、単一の1次元逆変換を使用して、逆量子化された変換された係数のセットを逆変換して、ステージのうちの第4のステージの出力結果として、ビデオ残差データを生成することができる。ブロック960では、量子化ユニット206、逆量子化ユニット210、プロセッサ、および/またはシフト補償ユニットが、係数のセットのいずれかをビットシフトすることができる(たとえば、整数ビットシフトおよび/または分数ビットシフト)。
【0283】
ある種の代表的な実施形態では、量子化は、量子化ユニット206が、ビデオブロックの処理で使用される変換の複数の次元の関数として量子化パラメータを選択しまたは決定することと、量子化の出力結果を生成するために量子化パラメータを適用することとを含むことができる。
【0284】
ある種の代表的な実施形態では、逆量子化は、たとえば、逆量子化ユニット210、310が、ビデオプロセスの処理で使用される逆変換の複数の次元の関数として量子化パラメータを選択しまたは決定することと、逆量子化の出力結果を生成するために量子化パラメータを適用することとを含むことができる。
【0285】
図10は、ビデオを処理するもう1つの代表的な方法1000を示す流れ図である。
【0286】
図10を参照すると、代表的な方法1000は、ブロック1010で、送受信ユニット120がビデオのビデオブロックを取得することを含むことができる。ブロック1020では、量子化ユニット206が、Nの関数として量子化の量子化パラメータを選択しまたは決定することができ、Nは、ビデオブロックの処理で使用される変換の次元の非負の整数個数であり、ブロック1030では、選択されまたは決定された量子化パラメータを使用して変換されまたは逆変換されていないビデオ残差データ量子化して、量子化されたデータの第1のセットを生成することができる。たとえば、Nを、0、1、2、…とすることができる。
【0287】
ブロック1040では、逆量子化ユニット210が、選択されまたは決定された量子化パラメータを使用して量子化されたデータの第1のセットを逆量子化して、逆量子化されたデータの第2のセットを生成することができる。
【0288】
ある種の代表的な実施形態では、逆変換ユニット212は、N次元での変換を使用して変換されていないビデオ残差データを変換して、ビデオブロックに関連付けられた係数のセットとして、変換されたビデオ残差データを生成することができる。
【0289】
図11は、ビデオを処理するもう1つの代表的な方法1100を示す流れ図である。
【0290】
図11を参照すると、代表的な方法1100は、ブロック1110で、送受信ユニット128が、ビデオのビデオブロックに関連付けられた符号化され量子化されたデータの第1セットを取得することを含む。ブロック1120では、逆量子化ユニット310は、Nの関数として量子化のための量子化パラメータを選択しまたは決定することができ、Nは、ビデオブロックの処理で使用される変換の次元の非負の整数個数である。ある種の代表的な実施形態では、Nを0、1、および2…とすることができる。
【0291】
ブロック1130では、エントロピ復号ユニット308が、量子化されたデータの第1のセットをエントロピ復号することができる。ブロック1140では、逆量子化ユニット310が、選択されまたは決定された量子化パラメータを使用して、復号され量子化されたデータの第1のセットを逆量子化して、逆量子化されたデータの第2のセットを生成することができる。
【0292】
ある種の代表的な実施形態では、逆変換ユニット312は、N次元で変換を使用して逆量子化されたデータの第2のセットを逆変換して、再構成されたビデオブロックを生成することができる。
【0293】
ある種の代表的な実施形態では、変換が、より多くの次元で使用されるものに対してより少ない次元で使用される時に(たとえば、逆変換ユニット212、312、および/または変換ユニット204のいずれかによって)、量子化パラメータを減らすことができる。
【0294】
上で説明される方法、装置、およびシステムの変形形態が、本発明の範囲から逸脱せずに可能である。適用できるさまざまな実施形態に鑑みて、示された実施形態が例示にすぎず、以下の特許請求の範囲の範囲を限定するものと解釈されてはならないことを理解されたい。たとえば、本明細書で説明される例示的な実施形態は、ハンドヘルドデバイスを含む。
【0295】
本開示全体で、当業者は、ある種の代表的な実施形態を、代替形態でまたは他の代表的な実施形態と組み合わせて使用することができることを理解する。
【0296】
適切なプロセッサは、たとえば、汎用プロセッサ、特殊目的プロセッサ、従来のプロセッサ、ディジタル信号プロセッサ(DSP)、複数のマイクロプロセッサ、DSPコアに関連付けられた1もしくは複数のマイクロプロセッサ、コントローラ、マイクロコントローラ、特定用途向け集積回路(ASIC)、特定用途用標準品(ASSP)、フィールドプログラマブルゲートアレイ(FPGA)回路、任意の他のタイプの集積回路(IC)、および/または状態機械を含む。
【0297】
ソフトウェアに関連付けられたプロセッサを使用して、無線送信受信ユニット(WTRU)、ユーザ機器(UE)、端末、基地局、Mobility Management Entity(MME)もしくはEvolved Packet Core(EPC)、または任意のホストコンピュータ内で使用されるラジオ周波数トランシーバを実施することができる。WTRUを、ソフトウェア無線(SDR)と、カメラ、ビデオカメラモジュール、ビデオ電話、スピーカホン、振動デバイス、スピーカ、マイクロホン、テレビジョントランシーバ、ハンズフリーヘッドセット、キーボード、Bluetooth(登録商標)モジュール、周波数変調(FM)ラジオユニット、ニアフィールド通信(NFC)モジュール、液晶ディスプレイ(LCD)表示ユニット、有機発光ダイオード(OLED)表示ユニット、ディジタル音楽プレイヤ、メディアプレイヤ、ビデオゲームプレイヤモジュール、インターネットブラウザ、および/または任意の無線ローカルエリアネットワーク(WLAN)モジュールもしくはウルトラワイドバンド(UWB)モジュールなどの他のコンポーネントとを含む、ハードウェアおよび/またはソフトウェアで実施されるモジュールに関連して使用することができる。
【0298】
本発明を、ビデオ符号化およびビデオ復号の方法、装置、およびシステムに関して説明したが、この方法、装置、およびシステムを、マイクロプロセッサ/汎用コンピュータ(図示せず)上のソフトウェアで実施できることが企図されている。ある種の実施形態では、さまざまなコンポーネントの機能のうちの1または複数を、汎用コンピュータを制御するソフトウェアで実施することができる。
【0299】
さらに、本発明が、本明細書では特定の実施形態を参照して図示され、説明されるが、本発明が、図示の詳細に限定されることは意図されていない。そうではなく、特許請求の範囲の同等物の範囲内で、本発明から逸脱せずに、詳細においてさまざまな変更を行うことができる。
【0300】
特徴および要素が、上で特定の組合せで説明されるが、各特徴または要素を、単独でまたは他の特徴および要素との任意の組合せで使用することができることを、当業者は了解するであろう。さらに、本明細書で説明される方法を、コンピュータまたはプロセッサによる実行のためにコンピュータ可読媒体に組み込まれたコンピュータプログラム、ソフトウェア、またはファームウェアで実施することができる。コンピュータ可読媒体の例は、コンピュータ可読記憶媒体を含む。コンピュータ可読記憶媒体の例は、読取り専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、レジスタ、キャッシュメモリ、半導体メモリデバイス、内蔵ハードディスクおよびリムーバブルディスクなどの磁気媒体、光磁気媒体、ならびにCD−ROMディスクおよびDVD(ディジタル多用途ディスク)などの光学媒体を含むが、これらに限定されない。ソフトウェアに関連付けられたプロセッサを使用して、WTRU、UE、端末、基地局、RNC、または任意のホストコンピュータ内で使用されるラジオ周波数トランシーバを実施することができる。
【0301】
さらに、上で説明された実施形態では、処理プラットフォーム、コンピューティングシステム、コントローラ、およびプロセッサを含む他のデバイスが、特に言及された。これらのデバイスは、少なくとも1つの中央処理装置(「CPU」)およびメモリを含むことができる。コンピュータプログラミングの当業者の実践に従って、行為および動作または命令の記号表現への参照が、さまざまなCPUおよびメモリによって実行される場合がある。そのような行為および動作または命令を、「実行される」、「コンピュータ実行される」、または「CPU実行される」と称する場合がある。
【0302】
当業者は、行為および記号的に表現された動作または命令が、CPUによる電気信号の操作を含むことを了解するであろう。電気システムは、これによってCPUの動作を再構成しまたは他の形で変更するために、電気信号の結果の変換または変形およびメモリシステム内のメモリ位置にあるデータビットの維持ならびに信号の他の処理を引き起こすことができるデータビットを表す。データビットが維持されるメモリ位置は、データビットに対応するかまたはこれを表す特定の電気的、磁気的、光学的、または有機的な特性を有する物理位置である。例示的実施形態が、上で言及したプラットフォームまたはCPUに限定されるのではなく、他のプラットフォームおよびCPUが、説明される方法をサポートできることを理解されたい。
【0303】
データビットを、磁気ディスク、光ディスク、およびCPUによって可読の任意の他の揮発性(たとえば、ランダムアクセスメモリ(「RAM」))または不揮発性(「たとえば、読取り専用メモリ(「ROM」))マスストレージシステムを含むコンピュータ可読媒体上で維持することもできる。コンピュータ可読媒体は、処理システム上に排他的に存在しまたは処理システムにローカルまたはリモートとすることができる複数の相互接続された処理システムの間で分散される、組み込むまたは相互接続されたコンピュータ可読媒体を含むことができる。実施形態が、上で述べたメモリに限定されず、他のプラットフォームおよびメモリが、説明される方法をサポートできることを理解されたい。
【0304】
本出願の説明で使用される要素、行為、または命令を、そのようなものとして明示的に説明されない限り、本発明にクリティカルまたは必須と解釈してはならない。また、本明細書で使用される時に、冠詞「a」および「an」のそれぞれは、1または複数の品目を含むことが意図されている。1つの品目のみが意図される場合には、用語「single(単一の)」または類似する言葉が使用される。さらに、本明細書で使用される時に、複数の品目および/または品目の複数のカテゴリが続く用語「any of(のいずれか)は、複数の品目および/または品目のカテゴリ「のいずれか」、「の組合せ」、「任意の複数の」、および/または「複数の〜の任意の組合せ」を、個別にまたは他の品目および/もしくは品目の他のカテゴリに関連して、含むことが意図されている。さらに、本明細書で使用される時に、用語「セット」は、0個を含む任意の個数の品目を含むことが意図されている。さらに、本明細書で使用される時に、用語「数」は、ゼロを含む任意の数を含むことが意図されている。
【0305】
さらに、特許請求の範囲を、その効果が述べられない限り、説明される順序または要素に限定されるものと解釈してはならない。さらに、任意の請求項での用語「手段」の使用は、米国特許法第112条第6項に訴えることが意図され、単語「手段」を含まない請求項は、そのような意図を含まない。
【0306】
次の参考文献が、参照によって本明細書に組み込まれている。
【0307】
(1)非特許文献4および非特許文献6
(2)非特許文献7
(3)非特許文献8
(4)非特許文献9
(5)非特許文献10
(6)非特許文献11
(7)非特許文献12
(8)非特許文献13
【0308】
代表的実施形態
少なくとも1つの実施形態で、ビデオブロックに関連付けられたビデオ残差データを処理する方法は、変換ユニットを介して、単一の1次元変換を使用してビデオ残差データを変換して、ビデオブロックに関連付けられた係数の第1のセットを生成するステップ、量子化ユニットを介して、係数の第1のセットを量子化して、量子化された係数の第2のセットを生成するステップであって、ビデオ残差データを処理する方法は、係数の第1のセットおよび係数の第2のセットのいずれかをビットシフトするステップを含む、量子化するステップ、ビットシフトするステップの後に、量子化された係数の第2のセットをエントロピコーディングするステップ、および/または量子化された係数のエントロピコーディングされた第2のセットを送信するステップを含むことができる。
【0309】
少なくとも1つの代表的な実施形態で、この方法は、逆量子化ユニットを介して係数の第2のセットを逆量子化して、逆量子化された係数の第3のセットを生成するステップ、逆変換ユニットを介して、ビデオ残差データを生成するための逆変換された出力として、単一の1次元逆変換を使用して逆量子化された係数の第3のセットを逆変換するステップ、および/または係数の第1のセット、係数の第2のセット、および係数の第3のセットのすべてまたは逆変換された出力をビットシフトするステップをさらに含むことができる。
【0310】
少なくとも1つの代表的な実施形態で、単一の1次元変換は、順方向水平変換または順方向垂直変換とすることができる。
【0311】
少なくとも1つの代表的な実施形態で、ビデオ残差データの処理は、ビットシフトするステップが、複数のユニットのうちの1または複数の中または後に発生し得るように、少なくとも変換ユニットおよび量子化ユニットを含む複数のユニット内で実施され得る。
【0312】
少なくとも1つの代表的な実施形態で、この方法は、処理で使用されるビデオブロックに対する量子化された係数の送信されたエントロピコーディングされた第2のセットから再構成された再構成されたビデオブロックの同一のダイナミックレンジを維持するステップをさらに含むことができる。
【0313】
少なくとも1つの代表的な実施形態で、再構成されたビデオブロックの同一のダイナミックレンジを維持するステップは、複数のユニットのそれぞれの中または後でダイナミックレンジを調整するステップを含むことができる。
【0314】
少なくとも1つの代表的な実施形態では、ビデオブロックの処理は、16ビット整数演算によって実現され得る。
【0315】
少なくとも1つの代表的実施形態では、この方法は、量子化された係数の第2のセットを1/2ビット、ビットシフトするように、HEVC標準に従って確立されたスケール係数のセットを調整しもしくは事前定義するステップ、および/または量子化ユニットの中または直後にスケール係数が調整されまたは事前定義されたセットを適用するステップをさらに含むことができる。
【0316】
少なくとも1つの代表的実施形態では、ビットシフトするステップは、循環シフトされるHEVC標準に関連付けられたスケール係数のセットを使用して量子化するステップ中に1/2ビットシフトするステップを含むことができる。
【0317】
少なくとも1つの代表的実施形態では、1/2ビットシフトするステップは、変換が単一の1次元2
N次変換を使用する時にのみ適用され得、Nは、奇数の整数である。
【0318】
少なくとも1つの代表的実施形態では、ビットシフトは、変換サイズおよび変換タイプ(たとえば、垂直、水平、および/または対角線)に従う右ビットシフト(たとえば、総数および/またはステージごとの)を決定すること、および/または決定された右ビットシフトを適用することをさらに含むことができる。
【0319】
少なくとも1つの代表的実施形態では、単一の1次元逆変換は、水平逆変換または垂直逆変換とすることができる。
【0320】
少なくとも1つの代表的実施形態では、ビデオ残差データの処理は、ビットシフトするステップが、複数のユニットのうちの1または複数の中および/または後に発生するように、複数のユニット内で実施され得る。
【0321】
少なくとも1つの代表的実施形態では、この方法は、複数のユニットのそれぞれの中および/または後でダイナミックレンジを調整することによって、処理で使用されるビデオブロックに対する量子化された係数の送信されたエントロピコーディングされた第2のセットから再構成された再構成されたビデオブロックの同一のダイナミックレンジを維持するステップをさらに含むことができる。
【0322】
少なくとも1つの代表的実施形態では、この方法は、逆量子化された係数の第3のセットを1/2ビット、ビットシフトするように、HEVC標準に従って確立された逆スケール係数のセットを調整しもしくは事前定義するステップ、および/または逆量子化ユニット内で逆スケール係数が調整されまたは事前定義されたセットを適用するステップをさらに含むことができる。
【0323】
少なくとも1つの代表的実施形態では、ビットシフトするステップは、循環シフトされるHEVC標準に関連付けられた逆スケール係数のセットを使用して逆量子化するステップ中に1/2ビットシフトするステップを含むことができる。
【0324】
少なくとも1つの代表的実施形態では、この方法は、量子化された係数の第2のセットを1/2ビット、ビットシフトするように、変換サイズに基づいてHEVC標準に従って確立されたスケール係数のセットおよび逆スケール係数のセットを選択的に調整しもしくは事前定義するステップ、および/または選択的に調整されまたは事前定義されたセットを適用するステップをさらに含むことができる。
【0325】
少なくとも1つの代表的実施形態では、ビットシフトするステップは、変換サイズに基づいて、量子化ユニットおよび逆量子化ユニットのどちらでもなくまたはその両方の中または直後に1/2ビットシフトするステップを含むことができる。
【0326】
少なくとも1つの代表的実施形態では、(1)係数の第1のセットをビットシフトするステップは、Nビット演算によって実現されるそのダイナミックレンジを最大にするためのものとすることができ、Nは、正の整数値であり、(2)係数の第3のセットをビットシフトするステップは、Nビット演算によって実現されるそのダイナミックレンジを最大にするためのものとすることができ、Nは、正の整数値であり、(3)量子化された係数の第2のセットをビットシフトするステップは、ビデオ残差データのダイナミックレンジに対してそのダイナミックレンジを調整するためのものとすることができる。
【0327】
少なくとも1つの代表的実施形態では、ビデオを処理する方法は、送受信ユニットを介して、ビデオのビデオブロックに関連付けられた符号化され量子化された係数の第1のセットを取得するステップ、エントロピ復号ユニットを介して、量子化された係数の第1のセットをエントロピ復号するステップ、逆量子化ユニットを介して、復号された量子化された係数の第1のセットを逆量子化して、逆量子化された係数の第2のセットを生成するステップ、逆変換ユニットを介して、単一の1次元逆変換を使用して逆量子化された係数の第2のセットを逆変換して、再構成されたビデオブロックを生成するステップ、および/または係数の第1のセットおよび第2のセットのすべてをビットシフトするステップを含むことができる。
【0328】
少なくとも1つの代表的実施形態では、単一の1次元変換は、水平逆変換または垂直逆変換とすることができる。
【0329】
少なくとも1つの代表的実施形態では、ビデオの処理は、ビットシフトするステップが、複数のユニットのうちの1または複数の中または後で発生するように、少なくとも逆変換ユニットおよび逆量子化ユニットを含む複数のユニット内で実施され得る。
【0330】
少なくとも1つの代表的実施形態では、この方法は、符号器での変換の前にビデオブロックに対する再構成されたビデオブロックの同一のダイナミックレンジを維持するステップをさらに含むことができる。
【0331】
少なくとも1つの代表的実施形態では、再構成されたビデオブロックの同一のダイナミックレンジを維持するステップは、複数のユニットのそれぞれの中または後でダイナミックレンジを調整するステップを含むことができる。
【0332】
少なくとも1つの代表的実施形態では、ビデオブロックの処理は、16ビット整数演算によって実現され得る。
【0333】
少なくとも1つの代表的実施形態では、この方法は、逆量子化された係数の第2のセットを1/2ビット、ビットシフトするように、HEVC標準に従って確立された逆スケール係数のセットを調整しもしくは事前定義するステップ、および/または逆量子化ユニットの中または直後に逆スケール係数の調整されまたは事前定義されたセットを適用するステップをさらに含むことができる。
【0334】
少なくとも1つの代表的実施形態では、ビットシフトするステップは、循環シフトされるHEVC標準に関連付けられた逆スケール係数のセットを使用して逆量子化するステップの中および/または後(たとえば、直後)に1/2ビットシフトするステップを含むことができる。
【0335】
少なくとも1つの代表的実施形態では、1/2ビットシフトするステップは、逆変換が単一の1次元2
N次逆変換を使用する時にのみ適用され得、Nは、奇数の整数である。
【0336】
少なくとも1つの代表的実施形態では、ビットシフトするステップは、変換サイズおよび変換タイプ(たとえば、垂直、水平、および/または対角線)に従う右ビットシフト(総数および/またはステージごとの)を決定するステップ、および/または決定された右ビットシフトを適用するステップを含むことができる。
【0337】
少なくとも1つの代表的実施形態では、この方法は、逆量子化された係数の第2のセットを1/2ビット、ビットシフトするように、HEVC標準に従って確立された逆スケール係数のセットを調整しもしくは事前定義するステップ、および/または変換サイズに基づいて、調整されまたは事前定義されたセットを選択的に適用するステップをさらに含むことができる。
【0338】
少なくとも1つの代表的実施形態では、ビットシフトするステップは、変換サイズに基づいて、逆量子化ユニットの中または直後に分数シフトまたは1/2ビットシフトを選択的に適用するステップを含むことができる。
【0339】
少なくとも1つの代表的実施形態では、符号器は、ビデオブロックに関連付けられたビデオ残差データを処理するように構成され得、単一の1次元変換を使用してビデオ残差データを変換して、ビデオブロックに関連付けられた係数の第1のセットを生成するように構成された変換ユニット、係数の第1のセットを量子化して、量子化された係数の第2のセットを生成するように構成された量子化ユニットであって、係数の第1のセットおよび係数の第2のセットのいずれもが、ビットシフトされる、量子化ユニット、ビットシフトされた後に量子化された係数の第2のセットをエントロピコーディングするように構成されたエントロピコーディングユニット、および/または量子化された係数のエントロピコーディングされた第2のセットを送信するように構成された送受信ユニットを含むことができる。
【0340】
少なくとも1つの代表的実施形態では、符号器は、係数の第2のセットを逆量子化して、逆量子化された係数の第3のセットを生成するように構成された逆量子化ユニット、および/またはビデオ残差データを生成するための逆変換された出力として、単一の1次元逆変換を使用して逆量子化された係数の第3のセットを逆変換するように構成された逆変換ユニットをさらに含むことができ、係数の第1のセット、係数の第2のセット、および係数の第3のセットのすべてまたは逆変換された出力は、ビットシフトされ得る。
【0341】
少なくとも1つの代表的実施形態では、単一の1次元変換は、順方向水平変換または順方向垂直変換とすることができる。
【0342】
少なくとも1つの代表的実施形態では、符号器は、複数のユニットのうちの1または複数のそれぞれのユニットの1または複数の出力がビットシフトされ得るように、少なくとも変換ユニットおよび量子化ユニットを含む複数のユニットを含むことができる。
【0343】
少なくとも1つの代表的実施形態では、符号器は、処理で使用されるビデオブロックに対する量子化された係数のエントロピコーディングされた第2のセットに基づいて再構成された再構成されたビデオブロックの同一のダイナミックレンジを維持するように構成され得る。
【0344】
少なくとも1つの代表的実施形態では、符号器は、16ビット整数演算によってビデオブロックの処理を提供することができる。
【0345】
少なくとも1つの代表的実施形態では、量子化ユニットは、量子化された係数の第2のセットを1/2ビット、ビットシフトするように、HEVC標準に従って確立されたスケール係数のセットを調整しもしくは事前定義し、かつ/またはスケール係数が調整されまたは事前定義されたセットを適用するように構成され得る。
【0346】
少なくとも1つの代表的実施形態では、量子化ユニットは、循環シフトされるHEVC標準に関連付けられたスケール係数のセットを使用して量子化中に1/2ビットシフトするように構成され得る。
【0347】
少なくとも1つの代表的実施形態では、量子化ユニットは、変換が単一の1次元2
N次変換を使用する時にのみ1/2ビットシフトすることができ、Nは、奇数の整数である。
【0348】
少なくとも1つの代表的実施形態では、符号器は、変換サイズおよび/または変換のタイプ(たとえば、とりわけ、垂直、水平、および/または対角線)に従って右ビットシフトの回数(たとえば、総数および/またはステージごとの)を決定するように構成され得る。
【0349】
少なくとも1つの代表的実施形態では、逆変換ユニットは、単一の1次元逆変換を適用することができ、この単一の1次元逆変換は、水平逆変換または垂直逆変換である。
【0350】
少なくとも1つの代表的実施形態では、逆量子化ユニットは、逆量子化された係数の第3のセットを1/2ビット、ビットシフトするように、HEVC標準に従って確立された逆スケール係数のセットを調整しもしくは事前定義し、かつ/または逆スケール係数が調整されまたは事前定義されたセットを適用するように構成され得る。
【0351】
少なくとも1つの代表的実施形態では、符号器は、循環シフトされるHEVC標準に関連付けられた逆スケール係数のセットを使用して逆量子化中に1/2ビットシフトするように構成され得る。
【0352】
少なくとも1つの代表的実施形態では、ビットシフトは、変換サイズに基づいて、量子化ユニットの中および/もしくは後(たとえば、直後)ならびに/または逆量子化ユニットの中および/もしくは後(たとえば、直後)に分数シフトしまたは1/2ビットシフトすることを含むことができる。
【0353】
少なくとも1つの代表的実施形態では、復号器は、ビデオを処理するように構成され得、ビデオのビデオブロックに関連付けられた符号化され量子化された係数の第1のセットを取得するように構成された送受信ユニット、量子化された係数の第1のセットをエントロピ復号するように構成されたエントロピ復号ユニット、復号された量子化された係数の第1のセットを逆量子化して、逆量子化された係数の第2のセットを生成するように構成された逆量子化ユニット、および/または単一の1次元逆変換を使用して逆量子化された係数の第2のセットを逆変換して、再構成されたビデオブロックを生成するように構成された逆変換ユニットを含むことができ、係数の第1のセットおよび第2のセットのすべては、ビットシフトされ得る。
【0354】
少なくとも1つの代表的実施形態では、逆変換ユニットは、単一の1次元逆変換を適用することができ、この単一の1次元逆変換は、水平逆変換または垂直逆変換である。
【0355】
少なくとも1つの代表的実施形態では、復号器は、それぞれのユニットの1または複数の出力をビットシフトできるように、少なくとも逆変換ユニットおよび/または逆量子化ユニットを含む複数のユニットを含むことができる。
【0356】
少なくとも1つの代表的実施形態では、復号器は、符号器での変換の前のビデオブロックに対する再構成されたビデオブロックの同一のダイナミックレンジを維持するように構成され得る。
【0357】
少なくとも1つの代表的実施形態では、復号器は、複数のユニットの出力のそれぞれのダイナミックレンジを調整するように構成され得る。
【0358】
少なくとも1つの代表的実施形態では、復号器は、16ビット整数演算によって処理を提供するように構成され得る。
【0359】
少なくとも1つの代表的実施形態では、逆量子化ユニットは、逆量子化された係数の第2のセットを1/2ビット、ビットシフトするように、HEVC標準に従って確立された逆スケール係数のセットを調整しもしくは事前定義し、かつ/または逆スケール係数が調整されまたは事前定義されたセットを適用するように構成され得る。
【0360】
少なくとも1つの代表的実施形態では、逆量子化ユニットは、循環シフトされるHEVC標準に関連付けられた逆スケール係数のセットを使用して逆量子化するステップの中または直後に1/2ビットシフトすることができる。
【0361】
少なくとも1つの代表的実施形態では、復号器は、変換のサイズに従って、選択的に1/2ビットシフトするように構成され得る。
【0362】
少なくとも1つの代表的実施形態では、復号器は、逆変換が単一の1次元2
N次逆変換を使用する時にのみ1/2ビットシフトするように構成され得、Nは、奇数の整数である。
【0363】
少なくとも1つの代表的実施形態では、復号器は、変換サイズおよび/または変換のタイプ(たとえば、とりわけ、垂直、水平、および/または対角線)に従って右ビットシフトの回数(たとえば、総数および/またはステージごとの)を決定するように構成され得る。
【0364】
少なくとも1つの代表的実施形態では、復号器は、変換サイズに基づいて逆量子化ユニットの出力を1/2ビットシフトするように構成され得る。
【0365】
少なくとも1つの代表的実施形態では、復号器は、変換サイズおよび適用される変換のタイプ(たとえば、とりわけ、垂直、水平、および/または対角線)に従って右ビットシフトの回数(たとえば、総数および/またはステージごとの)を決定し、かつ/または決定された右ビットシフトの回数を適用するように構成され得る。
【0366】
少なくとも1つの代表的実施形態では、逆量子化ユニットは、逆量子化された係数の第2のセットを1/2ビット、ビットシフトするように、HEVC標準に従って確立された逆スケール係数のセットを調整しもしくは事前定義し、かつ/または逆スケール係数が調整されまたは事前定義されたセットを選択的に適用するように構成され得る。
【0367】
少なくとも1つの代表的実施形態では、符号器は、変換サイズに基づいて、逆量子化ユニットの出力で1/2ビットシフトを選択的に適用するように構成され得る。
【0368】
少なくとも1つの代表的実施形態では、ステージでビデオブロックに関連付けられたビデオ残差データを処理する方法は、量子化ユニットを介して、ビデオ残差データのすべての変換を除くビデオ残差データを量子化して、ステージのうちの第1のステージの出力結果として量子化されたビデオ残差データを生成するステップ、逆量子化ユニットを介して、ビデオ残差データを逆量子化して、ステージのうちの第2のステージの出力結果として逆量子化されたビデオ残差データを生成するステップ、および/またはステージのうちの1または複数の後に、それぞれのステージの出力結果をビットシフトするステップを含むことができる。
【0369】
少なくとも1つの代表的実施形態では、ステージでビデオを処理する方法は、ビデオのビデオブロックを取得するステップ、変換ユニットを介して、単一の1次元変換を使用してビデオ残差データを変換して、ステージのうちの第1のステージの出力結果としてビデオブロックに関連付けられた係数のセットを生成するステップ、量子化ユニットを介して、変換された係数のセットを量子化して、ステージのうちの第2のステージの出力結果として量子化された係数のセットを生成するステップ、逆量子化ユニットを介して量子化された係数のセットを逆量子化して、ステージのうちの第3のステージの出力結果として逆量子化された変換された係数のセットを生成するステップ、再構成されたビデオデータを生成するために、単一の1次元逆変換を使用して、ステージのうちの第4のステージの出力結果として、逆変換ユニットを介して、逆量子化された変換された係数のセットを逆変換するステップ、および/またはステージのうちの1または複数の後に、出力された係数をビットシフトするステップを含むことができる。
【0370】
少なくとも1つの代表的実施形態では、ビットシフトするステップは、分数ビットシフトするステップを含むことができる。
【0371】
少なくとも1つの代表的実施形態では、量子化するステップは、ビデオブロックの処理で使用される変換の複数の次元の関数として量子化パラメータを選択しもしくは決定するステップ、および/または量子化の出力結果を生成するために量子化パラメータを適用するステップを含むことができる。
【0372】
少なくとも1つの代表的実施形態では、ビデオを処理する方法は、ビデオのビデオブロックを取得するステップと、Nの関数として量子化の量子化パラメータを選択しまたは決定するステップであって、Nは、ビデオブロックの処理に使用される変換の次元の整数個数である、選択しまたは決定するステップと、量子化ユニットを介して、選択されまたは決定された量子化パラメータを使用して、変換されたまたは変換されていないビデオ残差データを量子化して、量子化されたデータの第1のセットを生成するステップと、逆量子化ユニットを介して、選択されまたは決定された量子化パラメータを使用して、量子化されたデータの第1のセットを逆量子化して、逆量子化されたデータの第2のセットを生成するステップとを含むことができる。
【0373】
少なくとも1つの代表的実施形態では、この方法は、ビデオブロックに関連付けられた係数のセットとして変換されたビデオ残差データを生成するために、変換ユニットを介して、N次元の変換を使用して、変換されていないビデオ残差データを変換するステップをさらに含むことができる。
【0374】
少なくとも1つの代表的実施形態では、ビデオを処理する方法は、送受信ユニットを介して、ビデオのビデオブロックに関連付けられた符号化され量子化されたデータの第1のセットを取得するステップ、Nの関数として量子化の量子化パラメータを選択しもしくは決定するステップであって、Nは、ビデオブロックの処理で使用される変換の次元の整数個数である、選択しもしくは決定するステップ、エントロピ復号ユニットを介して、量子化されたデータの第1のセットをエントロピ復号するステップ、および/または逆量子化ユニットを介して、選択されまたは決定された量子化パラメータを使用して、復号された量子化されたデータの第1のセットを逆量子化して、逆量子化されたデータの第2のセットを生成するステップを含むことができる。
【0375】
少なくとも1つの代表的実施形態では、この方法は、逆変換ユニットを介して、N次元の変換を使用して逆量子化されたデータの第2のセットを逆変換して、再構成されたビデオブロックを生成するステップをさらに含むことができる。
【0376】
少なくとも1つの代表的実施形態では、Nは、0、1、および2…とすることができる(たとえば、非負の整数、たとえば、0、1、または2とすることができる)。
【0377】
少なくとも1つの代表的実施形態では、量子化パラメータは、変換が、より多くの次元で使用されることに対してより少ない次元で使用される時に、減らされ得る。
【0378】
少なくとも1つの代表的実施形態では、量子化パラメータは、ビデオ変換の処理に使用される変換の次元の個数が減る時に減る。