IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ オーピー ソリューションズ, エルエルシーの特許一覧

(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024088802
(43)【公開日】2024-07-02
(54)【発明の名称】指数関数的分割の方法およびシステム
(51)【国際特許分類】
   H04N 19/119 20140101AFI20240625BHJP
   H04N 19/14 20140101ALI20240625BHJP
   H04N 19/176 20140101ALI20240625BHJP
   H04N 19/46 20140101ALI20240625BHJP
【FI】
H04N19/119
H04N19/14
H04N19/176
H04N19/46
【審査請求】有
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2024066091
(22)【出願日】2024-04-16
(62)【分割の表示】P 2021542084の分割
【原出願日】2019-10-01
(31)【優先権主張番号】62/739,446
(32)【優先日】2018-10-01
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/739,677
(32)【優先日】2018-10-01
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/739,531
(32)【優先日】2018-10-01
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】521136080
【氏名又は名称】オーピー ソリューションズ, エルエルシー
(74)【代理人】
【識別番号】100078282
【弁理士】
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【弁理士】
【氏名又は名称】森下 夏樹
(74)【代理人】
【識別番号】100181674
【弁理士】
【氏名又は名称】飯田 貴敏
(74)【代理人】
【識別番号】100181641
【弁理士】
【氏名又は名称】石川 大輔
(74)【代理人】
【識別番号】230113332
【弁護士】
【氏名又は名称】山本 健策
(72)【発明者】
【氏名】ハリ カルバ
(72)【発明者】
【氏名】ボリヴォイェ ファート
(57)【要約】
【課題】指数関数的分割の方法およびシステムの提供。
【解決手段】デコーダは、ビットストリームを受け取ることと、指数関数的分割モードが有効にされているかどうかを決めることと、曲線に従ってブロックを第一の領域と第二の領域とへと分割することと、該ブロックのピクセルデータを、該曲線を用いて再構築することであって、該第一の領域および該第二の領域は非長方形である、こととを行うように構成されている回路を含む。一実施形態では、該指数関数的分割モードは該ビットストリーム内で信号伝達される。
【選択図】図7
【特許請求の範囲】
【請求項1】
コンプライアントデコーダによって復号化するためのビットストリームをエンコードするための映像エンコーダであって、前記デコーダは、回路を備え、
前記回路は、
符号化されたピクチャを含むビットストリームを受け取ることであって、前記符号化されたピクチャは、符号化ツリーユニットと信号伝達情報とを含み、前記符号化ツリーユニットは、複数の符号化ユニットを備え、前記信号伝達情報は、前記符号化ツリーユニット内の非直線の境界の開始点を決定するための第1のインデックスと終了点を決定するための第2のインデックスとを含み、前記符号化ツリーユニット内の前記非直線の境界は、少なくとも前記符号化ツリーユニット内の非長方形の第1の領域と非長方形の第2の領域とを画定し、かつ、前記符号化ツリーユニット内の少なくとも1つの符号化ユニットを前記第1の領域内および前記第2の領域内にそれぞれ配置されている非長方形の第1のサブブロックおよび非長方形の第2のサブブロックに分割する、ことと、
前記第1のインデックスおよび前記第2のインデックスを使用して、前記符号化ツリーユニット内の前記非直線の境界の前記開始点および前記終了点を決定することであって、前記開始点は、前記符号化ツリーユニットの第1の隅から第1のオフセット距離の、前記符号化ツリーユニットの第1のエッジ上にある、ことと、
前記第1の領域における第1の予測ピクセル値を生成することと、
前記第2の領域における第2の予測ピクセル値を生成することと、
残差ピクセル値を前記第1の予測ピクセル値および前記第2の予測ピクセル値に追加することによって、前記符号化ツリーユニットを復号化することと
を行うように構成されている、エンコーダ。
【請求項2】
前記非直線の境界は、曲線である、請求項1に記載のエンコーダ。
【請求項3】
前記ピクチャは、曲がった境界を有する対象を含有する画像に対応し、前記非直線の境界は、前記対象の前記曲がった境界を表す、請求項1に記載のエンコーダ。
【請求項4】
前記符号化ツリーユニットは、N×Nであり、各符号化ユニットは、N/2×N/2であり、Nは、128、64、または、32のうちの1つである、請求項1に記載のエンコーダ。
【請求項5】
前記終了点は、前記符号化ツリーユニットの第2の隅から第2のオフセット距離の、前記符号化ツリーユニットの第2のエッジ上に位置する、請求項1に記載のエンコーダ。
【請求項6】
コンプライアントデコーダによって復号化するためのビットストリームをエンコードするための映像エンコーダであって、前記デコーダは、回路を備え、
前記回路は、
符号化されたピクチャを含むビットストリームを受け取ることであって、前記符号化されたピクチャは、符号化ツリーユニットと信号伝達情報とを含み、前記符号化ツリーユニットは、複数の符号化ユニットを備え、前記信号伝達情報は、非直線の境界の開始点を決定するための第1のインデックスと終了点を決定するための第2のインデックスとを含み、前記非直線の境界は、少なくとも前記符号化ツリーユニット内の非長方形の第1の領域と非長方形の第2の領域とを画定する、ことと、
前記第1のインデックスおよび前記第2のインデックスを使用して、前記符号化ツリーユニット内の前記非直線の境界の前記開始点および前記終了点を決定することであって、前記開始点は、前記符号化ツリーユニットの第1の隅から第1のオフセット距離の、前記符号化ツリーユニットの第1のエッジ上にある、ことと、
前記第1の領域における第1の予測ピクセル値を生成することと、
前記第2の領域における第2の予測ピクセル値を生成することと、
残差ピクセル値を前記第1の予測ピクセル値および前記第2の予測ピクセル値に追加することによって、前記符号化ツリーユニットを復号化することと
を行うように構成されている、エンコーダ。
【請求項7】
復号化方法によって復号化可能なエンコードされたビットストリームを記憶するコンピュータ読み取り可能な記録媒体であって、
前記方法は、
符号化されたピクチャを含むビットストリームを受け取ることであって、前記符号化されたピクチャは、符号化ツリーユニットと信号伝達情報とを含み、前記符号化ツリーユニットは、複数の符号化ユニットを備え、前記信号伝達情報は、前記符号化ツリーユニット内の非直線の境界の開始点を決定するための第1のインデックスと終了点を決定するための第2のインデックスとを含み、前記符号化ツリーユニット内の前記非直線の境界は、少なくとも前記符号化ツリーユニット内の非長方形の第1の領域と非長方形の第2の領域とを画定し、かつ、前記符号化ツリーユニット内の少なくとも1つの符号化ユニットを前記第1の領域内および前記第2の領域内にそれぞれ配置されている非長方形の第1のサブブロックおよび非長方形の第2のサブブロックに分割する、ことと、
前記第1のインデックスおよび前記第2のインデックスを使用して、前記符号化ツリーユニット内の前記非直線の境界の前記開始点および前記終了点を決定することであって、前記開始点は、前記符号化ツリーユニットの第1の隅から第1のオフセット距離の、前記符号化ツリーユニットの第1のエッジ上にある、ことと、
前記第1の領域における第1の予測ピクセル値を生成することと、
前記第2の領域における第2の予測ピクセル値を生成することと、
残差ピクセル値を前記第1の予測ピクセル値および前記第2の予測ピクセル値に追加することによって、前記符号化ツリーユニットを復号化することと
を含む、コンピュータ読み取り可能な記録媒体。
【請求項8】
復号化方法によって復号化可能なエンコードされたビットストリームを記憶するコンピュータ読み取り可能な記録媒体であって、
前記方法は、
符号化されたピクチャを含むビットストリームを受け取ることであって、前記符号化されたピクチャは、符号化ツリーユニットと信号伝達情報とを含み、前記符号化ツリーユニットは、複数の符号化ユニットを備え、前記信号伝達情報は、非直線の境界の開始点を決定するための第1のインデックスと終了点を決定するための第2のインデックスとを含み、前記非直線の境界は、少なくとも前記符号化ツリーユニット内の非長方形の第1の領域と非長方形の第2の領域とを画定する、ことと、
前記第1のインデックスおよび前記第2のインデックスを使用して、前記符号化ツリーユニット内の前記非直線の境界の前記開始点および前記終了点を決定することであって、前記開始点は、前記符号化ツリーユニットの第1の隅から第1のオフセット距離の、前記符号化ツリーユニットの第1のエッジ上にある、ことと、
前記第1の領域における第1の予測ピクセル値を生成することと、
前記第2の領域における第2の予測ピクセル値を生成することと、
残差ピクセル値を前記第1の予測ピクセル値および前記第2の予測ピクセル値に追加することによって、前記符号化ツリーユニットを復号化することと
を含む、コンピュータ読み取り可能な記録媒体。
【発明の詳細な説明】
【技術分野】
【0001】
(関連出願の相互参照)
この出願は、2018年10月1日に出願された、“EXPONENTIAL PARTITIONING”と題する米国仮特許出願第62/739,446号と、2018年10月1日に出願された、“PREDICTING EXPONENTIAL PARTITIONING PARAMETERS”と題する米国仮特許出願第62/739,677号と、2018年10月1日に出願された、“SHAPE ADAPTIVE DISCRETE COSINE TRANSFORMATION FOR EXPONENTIALLY PARTITIONED BLOCKS”と題する米国仮特許出願第62/739,531号とに対する優先権の利益を主張し、これらの出願の各々は、それらの全体が参照によって本明細書に援用される。
【0002】
(発明の分野)
本発明は、一般に、デコーディングおよびエンコーディングを含む、デジタル映像を圧縮および解凍する技術分野に関連する。特に、本発明は、符号化単位の指数関数的分割のための方法およびシステムに向けられる。
【背景技術】
【0003】
(背景)
映像コーデックは、デジタル映像を圧縮または解凍する電子回路またはソフトウェアを含み得る。それは、圧縮されていない映像を圧縮された形式に変換し得、またはその逆があり得る。映像圧縮の文脈では、映像を圧縮する(および/またはその何らかの機能を果たす)デバイスは、通常、エンコーダと呼ばれ得、映像を解凍する(および/またはその何らかの機能を果たす)デバイスは、デコーダと呼ばれ得る。
【0004】
圧縮されたデータの形式は、標準的な映像圧縮の仕様に従い得る。圧縮された映像が、もとの映像内に存在する何らかの情報を失っている点において、圧縮は非可逆であり得る。これの帰結は、解凍された映像が、もとの映像を正確に再構築するためには不十分な情報しかないので、もとの圧縮されていない映像より低い品質を有し得ることを含み得る。
【0005】
映像品質と、映像を表現することに用いられる(例えばビットレートによって定められる)データの量と、エンコーディングアルゴリズムおよびデコーディングアルゴリズムの複雑性と、データ損失および誤差への感度と、編集の容易さと、ランダムアクセスと、エンドツーエンド遅延(例えばレイテンシ)と、同様のものとには、複雑な関係があり得る。
【発明の概要】
【課題を解決するための手段】
【0006】
(開示の概要)
本発明の1つの側面において、デコーダは、ビットストリームを受け取るように構成され得る回路を含み得る。実施形態では、回路は、さらに、指数関数的分割モードが有効にされているかどうかを決めることと、および曲線に従ってブロックを第一の領域と第二の領域とに分割することとを行うように構成され得る。実施形態では、回路は、曲線を用いてブロックのピクセルデータを再構築するようにも構成され得、第一の領域および第二の領域は非長方形であり得る。
【0007】
デコーダは、単独で、または組み合わせにおいて活用される以下の特徴の1つまたは複数をさらに含み得る。実施形態では、指数関数的分割モードは、ビットストリーム内で信号伝達され得る。実施形態では、ブロックを第一の領域と第二の領域とへと分割する曲線は、あらかじめ定義されたテンプレートによって特徴付けられ得る。別の実施形態では、ブロックを第一の領域と第二の領域とへと分割する曲線は、あらかじめ定義された係数の値によって特徴付けられ得る。さらに、実施形態では、指数関数的分割モードは、8×8ルマサンプルより大きいまたは8×8ルマサンプルに等しいブロックサイズに対して使用可能である。別の実施形態では、ピクセルデータを再構築することは、ビットストリーム内に含有されている関連付けられた動きベクトルを用いて、第一の領域に対して予測子を計算することを含み得る。別の実施形態では、デコーダは、ビットストリームを受け取り、ビットストリームを量子化された係数へとデコードするように構成され得るエントロピーデコーダプロセッサも含み得る。デコーダは、逆離散コサイン変換を実行することを含めて、量子化された係数を処理するように構成され得る逆量子化および逆変換プロセッサも含み得る。さらに、デコーダは、デブロッキングフィルタと、フレームバッファと、イントラ予測プロセッサとを含み得る。実施形態では、ビットストリームは、指数関数的分割モードがブロックに対して有効にされているかどうかを指し示すパラメータを含み得る。別の実施形態では、ブロックは、クアッドツリープラスバイナリディシジョンツリーの一部を形成し得る。また、ブロックは、クアッドツリープラスバイナリディシジョンツリーの非リーフノードであり得る。実施形態では、ブロックは、符号化ツリーユニットまたは符号化ユニットであり得る。別の実施形態では、第一の領域は符号化ユニットまたは予測ユニットであり得る。
【0008】
本発明のさらなる側面において、方法は、デコーダがビットストリームを受け取ることと、上記デコーダが指数関数的分割モードが有効にされているかどうかを決めることとを含み得る。方法は、デコーダがブロックを第一の領域と第二の領域とへと分割する曲線を決めることと、また、デコーダがブロックのピクセルデータを、曲線を用いて再構築することとをも含み得る。
【0009】
方法は、単独で、または組み合わせにおいて活用される以下の特徴の1つまたは複数を、さらに含み得る。実施形態では、指数関数的分割モードは、ビットストリーム内で信号伝達され得る。別の実施形態では、ブロックを第一の領域と第二の領域とへと分割する曲線は、あらかじめ定義されたテンプレートによって特徴付けられ得る。実施形態では、ブロックを第一の領域と第二の領域とへと分割する曲線は、あらかじめ定義された係数の値によって特徴付けられ得る。実施形態では、指数関数的分割モードは、8×8ルマサンプルより大きいまたは8×8ルマサンプルに等しいブロックサイズに対して使用可能であり得る。別の実施形態では、ピクセルデータを再構築することは、ビットストリーム内に含有されている関連付けられた動きベクトルを用いて、第一の領域に対して予測子を計算することを含み得る。別の実施形態では、デコーダは、ビットストリームを受け取り、ビットストリームを量子化された係数へとデコードするように構成され得るエントロピーデコーダプロセッサも含み得る。デコーダは、逆離散コサイン変換を実行することを含めて、量子化された係数を処理するように構成され得る逆量子化および逆変換プロセッサも含み得る。さらに、デコーダは、デブロッキングフィルタと、フレームバッファと、イントラ予測プロセッサとを包含し得る。実施形態では、ビットストリームは、指数関数的分割モードがブロックに対して有効にされているかどうかを指し示すパラメータを含み得る。別の実施形態では、ブロックは、クアッドツリープラスバイナリディシジョンツリーの一部を形成し得る。また、ブロックは、クアッドツリープラスバイナリディシジョンツリーの非リーフノードであり得る。別の実施形態では、ブロックは、符号化ツリーユニットまたは符号化ユニットであり得る。実施形態では、第一の領域は符号化ユニットまたは予測ユニットであり得る。
【0010】
命令を記憶する非一時的なコンピュータプログラム製品(すなわち物理的に具体化されるコンピュータプログラム製品)も説明され、命令は1つまたは複数のコンピューティングシステムの1つまたは複数のデータプロセッサによって実行されると、本明細書中の動作を少なくとも1つのデータプロセッサに行わせる。同様に、1つまたは複数のデータプロセッサと、1つまたは複数のデータプロセッサに結合されたメモリとを有し得るコンピュータシステムも説明される。メモリは、本明細書に記載の動作の1つまたは複数を、少なくとも1つのプロセッサに実行させる命令を、一時的または永久に記憶し得る。加えて、方法は、単一のコンピューティングシステム内部の1つまたは複数のデータプロセッサ、または、2つまたはそれより多いコンピューティングシステム間に分散された1つまたは複数のデータプロセッサのどちらか一方によって実装され得る。このようなコンピューティングシステムは、複数のコンピューティングシステムのうち1つまたは複数の間の直接の接続を介して、ネットワーク(例えばインターネット、無線広域ネットワーク、ローカルエリアネットワーク、広域ネットワーク、有線ネットワーク、および同様のもの)上の接続を含む1つまたは複数の接続を介して、等で接続され得、データおよび/またはコマンドまたは他の命令または同様のものを授受し得る。
【0011】
本明細書に記載の主題の1つまたは複数のバリエーションの詳細が、付属の図面および下の説明に記述されている。本明細書に記載の他の特徴または利点は、説明および図面から、ならびに特許請求の範囲から明白である。
本発明は、例えば、以下を提供する。
(項目1)
ビットストリームを受け取ることと、
指数関数的分割モードが有効にされているかどうかを決めることと、
曲線に従って、ブロックを第一の領域と第二の領域とへと分割することと、
該ブロックのピクセルデータを、該曲線を用いて再構築することであって、該第一の領域および該第二の領域は、非長方形である、ことと
を行うように構成されている回路
を備えるデコーダ。
(項目2)
前記指数関数的分割モードが前記ビットストリーム内で信号伝達される、項目1に記載のデコーダ。
(項目3)
前記ブロックを前記第一の領域と前記第二の領域とへと分割する前記曲線が、あらかじめ定義されたテンプレートによって特徴付けられている、項目1に記載のデコーダ。
(項目4)
前記ブロックを前記第一の領域と前記第二の領域とへと分割する前記曲線が、あらかじめ定義された係数の値によって特徴付けられている、項目1に記載のデコーダ。
(項目5)
前記指数関数的分割モードが、8×8ルマサンプルより大きいまたは8×8ルマサンプルに等しいブロックサイズに対して使用可能である、項目1に記載のデコーダ。
(項目6)
前記ピクセルデータを再構築することが、前記ビットストリーム内に含有されている関連付けられた動きベクトルを用いて、前記第一の領域に対して予測子を計算することを含む、項目1に記載のデコーダ。
(項目7)
前記ビットストリームを受け取り、該ビットストリームを量子化された係数へとデコードするように構成されているエントロピーデコーダプロセッサと、
逆離散コサイン変換を実行することを含めて、該量子化された係数を処理するように構成されている逆量子化および逆変換プロセッサと、
デブロッキングフィルタと、
フレームバッファと、
イントラ予測プロセッサと
をさらに備える、項目1に記載のデコーダ。
(項目8)
前記ビットストリームが、前記指数関数的分割モードが前記ブロックに対して有効にされているかどうかを指し示すパラメータを含む、項目1に記載のデコーダ。
(項目9)
前記ブロックがクアッドツリープラスバイナリディシジョンツリーの一部を形成する、項目1に記載のデコーダ。
(項目10)
前記ブロックが、クアッドツリープラスバイナリディシジョンツリーの非リーフノードである、項目9に記載のデコーダ。
(項目11)
前記ブロックが符号化ツリーユニットまたは符号化ユニットである、項目1に記載のデコーダ。
(項目12)
前記第一の領域が符号化ユニットまたは予測ユニットである、項目1に記載のデコーダ。
(項目13)
デコーダが、ビットストリームを受け取ることと、
該デコーダが、指数関数的分割モードが有効にされているかどうかを決めることと、
該デコーダが、ブロックを第一の領域と第二の領域とへと分割する曲線を決めることと、
該デコーダが、該ブロックのピクセルデータを、該曲線を用いて再構築することと
を備える方法。
(項目14)
前記指数関数的分割モードが前記ビットストリーム内で信号伝達される、項目13に記載の方法。
(項目15)
前記ブロックを前記第一の領域と前記第二の領域とへと分割する前記曲線が、あらかじめ定義されたテンプレートによって特徴付けられている、項目13に記載の方法。
(項目16)
前記ブロックを前記第一の領域と前記第二の領域とへと分割する前記曲線が、あらかじめ定義された係数の値によって特徴付けられている、項目13に記載の方法。
(項目17)
前記指数関数的分割モードが、8×8ルマサンプルより大きいまたは8×8ルマサンプルに等しいブロックサイズに対して使用可能である、項目13に記載の方法。
(項目18)
前記ピクセルデータを再構築することが、前記ビットストリーム内に含有されている関連付けられた動きベクトルを用いて、前記第一の領域に対して予測子を計算することを含む、項目13に記載の方法。
(項目19)
前記デコーダが、
前記ビットストリームを受け取り、該ビットストリームを量子化された係数へとデコードするように構成されているエントロピーデコーダプロセッサと、
逆離散コサイン変換を実行することを含めて、該量子化された係数を処理するように構成されている逆量子化および逆変換プロセッサと、
デブロッキングフィルタと、
フレームバッファと、
イントラ予測プロセッサと
を備える、項目13に記載の方法。
(項目20)
前記ビットストリームが、前記指数関数的分割モードが前記ブロックに対して有効にされているかどうかを指し示すパラメータを含む、項目13に記載の方法。
(項目21)
前記ブロックがクアッドツリープラスバイナリディシジョンツリーの一部を形成する、項目13に記載の方法。
(項目22)
前記ブロックが、クアッドツリープラスバイナリディシジョンツリーの非リーフノードである、項目21に記載の方法。
(項目23)
前記ブロックが符号化ツリーユニットまたは符号化ユニットである、項目13に記載の方法。
(項目24)
前記第一の領域が符号化ユニットまたは予測ユニットである、項目13に記載の方法。
【図面の簡単な説明】
【0012】
(図面の説明)
図1図1は、ピクセルのブロック分割の例を図示した図である。
【0013】
図2図2は、幾何学分割の例を図示した図である。
【0014】
図3A図3Aは、圧縮効率を増大させ得る本主題のいくつかの側面に従った指数関数的分割の例を図示した図である。
【0015】
図3B図3Bは、例となるテンプレートの指数関数的分割を図示した一連の図である。
【0016】
図3C図3Cは、例となる指数関数を定義し得る4つのあらかじめ定義された係数に関連付けられた例となる曲線を図示している。
【0017】
図3D図3Dは、長方形ブロックを分割する、異なる開始P1インデックスおよび終了P2インデックスを示した別の例となるブロックを図示している。
【0018】
図4図4は、指数関数的分割を実行することが可能な例となる映像エンコーダを図示したシステムブロック図である。
【0019】
図5A図5Aは、圧縮効率を増大させながらエンコーディング複雑性を低減させ得る本主題のいくつかの側面に従った、指数関数的分割を伴って映像をエンコードすることの例となるプロセスを図示したプロセスフロー図である。
【0020】
図5B図5Bは、本主題のいくつかの側面に従った、指数関数的分割を伴って、分割パラメータを用いて映像をエンコードすることの例となるプロセスを図示したプロセスフロー図である。
【0021】
図5C図5Cは、本主題のいくつかの側面に従った、指数関数的分割を伴って、形適応離散コサイン変換を用いて映像をエンコードすることの例となるプロセスを図示したプロセスフロー図である。
【0022】
図6図6は、指数関数的分割を用いてビットストリームをデコードすることが可能な例となるデコーダを図示したシステムブロック図である。
【0023】
図7図7は、指数関数的分割を用いてビットストリームをデコードすることの例となるプロセスを図示したプロセスフロー図である。
【0024】
図8図8は、フレームのクアッドツリープラスバイナリツリー分割の例を図示している。
【0025】
図9図9は、図8に図示されているクアッドツリープラスバイナリツリーのCUレベルでの指数関数的分割の例を図示している。
【0026】
図10図10は、直線線分によって効率的に分割されないことがある、林檎を含有する画像を図示している。
【0027】
図11図11は、指数関数的分割に従って分割された別の例となるブロックを図示している。
【0028】
図12図12は、カレントブロックによる空間的に隣接するブロックからの指数関数的分割パラメータの引き継ぎを図示した図である。
【0029】
図13図13は、カレントブロックに対する、空間的に隣接するブロックの例を図示している。
【0030】
図14図14は、カレントブロックが指数関数的分割パラメータを引き継ぐ、時間的に隣接するブロックを伴う例となるカレントブロックを図示している。
【0031】
様々な図面における同様の参照記号は、同様の要素を指し示している。
【発明を実施するための形態】
【0032】
(詳細な説明)
本主題のいくつかの実装形態は、指数関数的分割に関連する。指数関数的分割では、長方形ブロックは、直線線分と比較して、曲線を伴う非長方形領域へと分割され得る。ブロックを分割するために曲線を用いることは、より低い動き補償予測誤差と、より小さな残差と、従って改善された圧縮効率とに帰着する、より精密に対象境界を追跡する分割を可能とし得る。いくつかの実装形態では、曲線は、指数関数によって特徴付けられ得る。曲線(例えば指数関数)は、デコーダ用のビットストリーム内で信号伝達され得る、あらかじめ定義された係数および/またはテンプレートを用いて、決められ得る。いくつかの実装形態では、指数関数的分割は、8×8ルマサンプルより大きいまたは8×8ルマサンプルに等しいものに使用可能であり得る。曲線を伴う長方形ブロックを分割することによって、幾何学分割を伴う等、直線線分分割に限定された技術より大きな圧縮効率が、特定の対象に対して達成され得る。
【0033】
また、本主題のいくつかの実装形態は、空間的および/または時間的な参照ブロックを用いて、指数関数的分割パラメータを予測することに関連する。いくつかの実装形態では、与えられたカレントブロックに対して、指数関数的分割マージ変数が信号伝達され得、与えられたカレントブロックが、別のブロックからのこれらの指数関数的分割パラメータの全てまたはいくつかを引き継ぎ得ることを指し示す。この別のブロックは、空間的または時間的に隣接し得る。ブロックが、他のブロックから指数関数的分割パラメータを引き継ぐことを可能とすることによって、ビットストリーム内部の信号の量は低減され得、より大きな圧縮効率を達成し得る。
【0034】
さらに、本主題のいくつかの実装形態は、直線線分と比較して、曲線を伴う非長方形領域へと分割されている領域(例えばブロック)上で、形適応離散コサイン変換(SADCT)を実行することを含み得る。ブロックが指数関数的分割されているところでは、結果として生じる領域(例えば分割)は、低い予測誤差を有する1つの領域および高い予測誤差を有する別の領域に帰着することが十分に考えられる。従って、本主題は、低い予測誤差を有する領域に対してSADCTを実行することを含み得る。低い予測誤差を有する領域に対してSADCTを実行することによって、圧縮効率は改善され得る。そして、いくつかの実装形態では、デコーディングの間中、逆SADCTは、指数関数的分割によって分割された1つの領域に対して実行され得る。いくつかの実装形態では、逆SADCTは、低い予測誤差を伴う区分に対するフルブロック離散コサイン変換(DCT)に加えた変換の選択肢として、ビットストリーム内で信号伝達され得る。いくつかの実装形態では、逆SADCTは、指数関数的分割パラメータに基づいて、および逆SADCTが実行されることとなるビットストリーム内で明確に信号伝達することを必要とせずに、実行され得る。
【0035】
動き補償は、以前および/または未来のフレームが与えられたとき、カメラおよび/または映像内の対象の動きを把握することによって、映像フレームまたはその一部を予測する手法を含み得る。それは、映像圧縮のための映像データのエンコーディングおよびデコーディング、例えばMotion Picture Experts Group(MPEG)-2(advanced video coding(AVC)とも称される)標準規格において採用され得る。動き補償は、参照ピクチャのカレントピクチャへの変換の観点から、ピクチャを説明し得る。参照ピクチャは、カレントピクチャと比較したときに、時間において以前または未来からであり得る。画像が、以前に送信および/または記憶された画像から正確に合成され得るとき、圧縮効率は改善され得る。
【0036】
ブロック分割は、映像符号化における類似した動きの領域を見つけるための方法に言及し得る。ブロック分割の何らかの方式が、MPEG-2と、H.264(AVCまたはMPEG-4 Part 10とも称される)と、H.265(High Efficiency Video Coding(HEVC)とも称される)とを含む映像コーデック標準規格において見出され得る。例となるブロック分割の手法では、映像フレームの重なり合っていないブロックは、類似した動きを伴うピクセルを含有するブロック分割を見つけるために、長方形サブブロックへと分割され得る。この手法は、ブロック分割の全てのピクセルが類似した動きを有するとき、うまく働き得る。ブロック内のピクセルの動きは、以前に符号化されたフレームに関連して決められ得る。
【0037】
図1は、実施形態に従った、ピクセルのブロック分割の例を図示した図である。それ自体がサブブロック(例えば符号化ツリー内部のノード)であり得る初めの長方形ピクチャまたはブロック100は、長方形サブブロックへと分割され得る。例えば、110では、ブロック100は、2つの長方形サブブロック110aおよび110bへと分割される。サブブロック110aおよび110bは、それから別々に処理され得る。別の例として、120では、ブロック100は、4つの長方形サブブロック120a、120b、120c、および120dへと分割される。サブブロックは、サブブロック内部のピクセルが同一の動きを共有していること、最小ブロックサイズが達せられていること、または他の基準が判定されるまで、それら自身がさらに分けられ得る。サブブロック内のピクセルが類似した動きを有するとき、動きベクトルは、その領域内の全てのピクセルの動きを説明し得る。
【0038】
映像符号化のいくつかの手法は、(例えば図1において図示されているような)長方形ブロックが、直線線分によって非長方形であり得る2つの領域へとさらに分けられる幾何学分割を含み得る。例えば、図2は、幾何学分割の例を図示した図である。例となる長方形ブロック200(M×Nピクセルのように表される、Mピクセルの幅およびNピクセルの高さを有し得る)は、直線線分P1 P2 205に沿って2つの領域(領域0および領域1)へと分けられ得る。領域内0のピクセルが類似した動きを有するとき、動きベクトルは、その領域内の全てのピクセルの動きを説明し得る。動きベクトルは、領域0を圧縮するために用いられ得る。同様に、領域1内のピクセルが類似した動きを有しているとき、関連付けられる動きベクトルは、領域1内のピクセルの動きを説明し得る。このような幾何学分割は、映像ビットストリーム内のエンコーディング位置P1およびP2(または位置P1およびP2に代わるもの)によって、受信機(例えばデコーダ)へと信号伝達され得る。
【0039】
幾何学分割を利用して映像データをエンコードするとき、直線線分205(または、より具体的にはP1およびP2)が、決められ得る。しかし、直線線分は、対象境界を反映するやり方ではブロックを分割できないことがある。結果として、直線線分を伴う分割は、(例えば結果として生じるいずれの残差も小さいような)効率的なやり方ではブロックを分割できないことがある。このことは、ブロックが、曲がった(例えば非直線の)境界を有する対象または境界を表現するピクセル(例えばルマサンプル)を含有し得る場合に当てはまり得る。例えば、今、図10を参照すると、直線線分によって効率的に分割されないことがある、林檎を含有する画像が示されている。林檎は、幾何学分割に従って直線線分によって分割された場合には、分割が対象(例えば林檎)の境界を密接に辿らないことがある画像の一部を指し示すいくつかの長方形ブロックを含む。
【0040】
本主題のいくつかの実装形態は、長方形ブロックを、直線線分と比較して、曲線を伴う非長方形領域へと分割することを含む。ブロックを分割するために曲線を用いることは、分割が対象境界をより密接に辿り、より低い予測誤差と、より小さな残差と、従って改善された圧縮効率とに帰着することを可能とし得る。いくつかの実装形態では、曲線は、指数関数によって特徴付けられ得る。曲線(例えば指数関数)は、デコーダ用のビットストリーム内で信号伝達され得る、あらかじめ定義された係数および/またはインデックスを用いて表現され得る。いくつかの実装形態では、指数関数的分割は、8×8ルマサンプルより大きいまたは8×8ルマサンプルに等しいものを伴うブロックに使用可能であり得る。曲線を伴う長方形ブロックを分割することによって、本主題は、幾何学分割を伴う等、直線線分分割に限定された技術より大きな圧縮効率を、特定の対象に対して達成し得る。
【0041】
図3Aは、圧縮効率を増大させ得る、本主題のいくつかの側面に従った指数関数的分割の例を図示した図である。長方形ブロック300は、ピクセル(例えばルマサンプル)を含む。長方形ブロック300は、例えば、8×8ピクセル(例えばルマサンプル)のサイズまたはこれより大きなものを有し得る。
【0042】
図3Aでは、長方形ブロック300は、曲線305によって2つの領域(例えば、310によって表される領域0および315によって表される領域1)へと分割され得る。領域310内部の全てのルマサンプルは、同一の動きまたは類似した動きを有すると見做され得、同一の動きベクトルによって表現され得る。同様に、領域315内部の全てのルマサンプルは、同一の動きまたは類似した動きを有すると見做され得、同一の動きベクトルによって表現され得る。いくつかの実装形態では、長方形ブロック300を分ける曲線線分305の左または上にある全てのルマサンプルは、領域0(310)に属すると見做され得る。いくつかの実装形態では、長方形ブロック300を分ける曲線線分305の右または下にある全てのルマサンプルは、領域1(315)に属すると見做され得る。いくつかの実装形態では、長方形ブロック300を分ける曲線線分が通過する全てのルマサンプルは、領域0(310)に属する。いくつかの実装形態では、長方形ブロック300が分ける曲線線分が通過する全てのルマサンプルは、領域1(315)に属すると見做され得る。他の実装形態が可能であり得る。
【0043】
いくつかの実装形態では、指数関数的分割を実行することによって、発生し得る可能な分割の数が(例えば、幾何学分割と比較して)低減され得、これは、相応しい分割を識別するための(例えば、ブロックを分割する最良の線分を識別するための)、動き推定を評価する計算上の要求を低減させ得る。いくつかの実装形態では、指数関数的分割を実行することによって、非長方形領域(例えば310および315)は、対象境界をより密接に辿り得、それによって、幾何学分割を用いて映像をエンコードすることと比較して、予測誤差と、残差サイズとを低減させ、圧縮効率を増大させ得る。
【0044】
指数関数的分割は、ビットストリーム内で表現され得る。いくつかの実装形態では、指数関数的分割モードが利用され得、相応しいパラメータがビットストリーム内で信号伝達され得る。例えば、指数関数的分割は、あらかじめ決められた指数関数的分割テンプレートを信号伝達することによって、ビットストリーム内で表現され得る。図3Bは、実施形態に従った、例となるテンプレート分割を図示した一連の図である。これらの規則的な指数関数的分割は、一組のあらかじめ決められた方向付けを指定し得る。いくつかの実装形態では、信号伝達は、あらかじめ定義されたこれらの規則的な指数関数的分割(例えばテンプレート)の1つまたは複数のインデックスを含むことによって実行され得る。例えば、図3Cは、実施形態に従った、4つのあらかじめ定義されたテンプレート(1、2、3、4)に関連付けられる、例となる曲線を図示している。テンプレート湾曲の数は、いくつかの実装形態において変化し得る。
【0045】
別の例として、指数関数的分割は、湾曲の程度を指し示す、あらかじめ決められた係数を信号伝達することによって、ビットストリーム内で表現され得、このことは、追加の指数関数を可能とし得る。
【0046】
いくつかの実装形態では、指数関数的分割モードで用いられる、あらかじめ定義されたテンプレートは、直線線分を指し示し得る。例えば、図3Cでは、係数1によってインデックスされた線分は直線であり、これは、指数関数的分割の特別な場合と見做され得、幾何学分割の所産に類似した所産に帰着し得る。
【0047】
いくつかの実装形態では、方向付けテンプレート(例が図3Bに図示されている)と、あらかじめ定義されたテンプレート(例が図3Cに図示されている)との両方が、多数の潜在的な指数関数的分割を効率的に信号伝達するために利用され得る。
【0048】
いくつかの実装形態では、開始インデックスおよび終了インデックスは、あらかじめ決められ得る。例えば、図3Aは、実施形態に従った、長方形ブロック300の左下隅から開始し、長方形ブロック300の右上隅で終了する曲線線分を図示している。いくつかの実装形態では、開始インデックスおよび終了インデックスは、ビットストリーム内で明瞭に信号伝達され得る。例えば、図3Dは、長方形ブロック300を分割する、異なる開始P1インデックスおよび終了P2インデックスを示している、別の例となるブロックを図示している。開始P1インデックスおよび終了P2インデックスは、直接、信号伝達され得るか、またはインデックスによって一組のあらかじめ決められた値へと指し示され得る。いくつかの実施形態では他のパラメータが可能である。
【0049】
いくつかの実装形態では、指数関数的分割パラメータは、指数関数的分割を受けている各ブロックに対しては(例えば、指数関数的分割モードが当てはまるブロックに対しては)、ビットストリームに含まれなくてもよい。例えば、与えられたカレントブロックに対して、指数関数的分割パラメータは、(ときおりペアレントブロックと称される)別のブロックから引き継がれ得る。ペアレントブロックは、空間的および/または時間的に隣接し得る。ペアレントブロックは、あらかじめ決められたリストへのインデックスによってビットストリーム内で指し示され得、かつ/または、少なくとも候補リストを構築することによって指し示され得、候補リストへのインデックスはビットストリーム内で信号伝達される。
【0050】
図4は、SADCTを伴う等、指数関数的分割を実行することが可能な映像エンコーダ400の例となる実施形態を図示したシステムブロック図である。例となる映像エンコーダ400は、入力映像405を受け取り、これは、ツリー構造化マクロブロック分割スキーム(例えばクアッドツリープラスバイナリツリー(QTBT))等の処理スキームに従って、初期に区分され得るか、または分け得る。ツリー構造化マクロブロック分割スキームの例は、符号化ツリーユニット(CTU)と呼ばれる大きなブロック要素へのピクチャフレームの分割を含み得る。いくつかの実装形態では、各CTUは、複数個の、符号化ユニット(CU)と呼ばれるサブブロックへと、一回または複数回、さらに分割され得る。この部分化の結果は、予測ユニット(PU)と呼ばれ得る一群のサブグループを含み得る。変換ユニット(TU)も利用され得る。このような分割スキームは、本主題のいくつかの側面に従って指数関数的分割を実行することを含み得る。例えば、図8はフレームのQTBT分割の例を図示しており、図9は、図8に図示されているQTBTの、CUレベルでの指数関数的分割の例を図示している。
【0051】
例となる映像エンコーダ400は、イントラ予測プロセッサ415と、指数関数的分割をサポートすることが可能な動き予測/補償プロセッサ420(インター予測プロセッサとも称される)と、変換/量子化プロセッサ425と、逆量子化/逆変換プロセッサ430と、ループ内フィルタ435と、復号化ピクチャバッファ440と、エントロピー符号化プロセッサ445とを含む。いくつかの実装形態では、動き予測/補償プロセッサ420は、カレントブロックが別のブロックから指数関数的分割パラメータを引き継ぎ得るかどうか、および、どのブロックからどのブロックへと引き継ぐかを決めることを含め、指数関数的分割を実行し得る。いくつかの実装形態では、変換/量子化プロセッサ425は、SADCTを実行し得る。指数関数的分割モードと、受け継ぎとを信号伝達するビットストリームパラメータは、出力ビットストリーム450での算入のために、エントロピー符号化プロセッサ445へと入力され得る。
【0052】
動作中には、入力映像405のフレームの各ブロックに対して、イントラピクチャ予測を介してブロックを処理するか、動き予測/補償を用いてブロックを処理するかが決められ得る。ブロックは、イントラ予測プロセッサ410または動き予測/補償プロセッサ420へと提供され得る。ブロックがイントラ予測を介して処理されることとなる場合、イントラ予測プロセッサ410は、予測子を出力するために処理を実行し得る。ブロックが動き予測/補償を介して処理されることとなる場合、動き予測/補償プロセッサ420は、予測子を出力するために指数関数的分割の使用を含む処理を実行し得る。
【0053】
残差は、入力映像から予測子を差し引くことによって形成され得る。残差は、係数(量子化され得る)を生じさせるために、変換/量子化プロセッサ425(変換処理(例えばSADCT)を実行し得る)によって受け取られ得る。量子化された係数および任意の関連付けられた信号伝達情報は、エントロピーエンコーディングおよび出力ビットストリーム450での算入のために、エントロピー符号化プロセッサ445へと提供され得る。エントロピーエンコーディングプロセッサ445は、指数関数的分割に関連する信号伝達情報のエンコーディングをサポートし得る。加えて、量子化された係数は、逆量子化/逆変換プロセッサ430へと提供され得、ピクセルを再現し得、ピクセルは、予測子と組み合わされ得、ループ内フィルタ435によって処理され得、ループ内フィルタ435の出力は、指数関数的分割をサポートすることが可能な動き予測/補償プロセッサ420用の復号化ピクチャバッファ440内に記憶される。
【0054】
図5Aは、圧縮効率を増大させながらエンコーディング複雑性を低減させ得る本主題のいくつかの側面に従った、指数関数的分割を伴って映像をエンコードすることの例となるプロセス500Aを図示したプロセスフロー図である。510Aでは、映像フレームが、例えば、ピクチャフレームをCTUおよびCUへと分割することを含み得るツリー構造化マクロブロック分割スキームを用いた初期のブロック区分化を受け得る。520では、ブロックは、指数関数的分割のために選定され得る。選定は、ブロックが指数関数的分割モードに従って処理されることとなることをメトリックルールに従って識別することを含み得る。
【0055】
530Aでは、指数関数的分割が決められ得る。曲線(例えば305)が、領域の1つ(例えば領域0)内部のピクセル(例えばルマサンプル)が類似した動きを有し、他の領域(例えば領域1)内部のピクセルが類似した動きを有するように、ピクセルのインターフレーム動きに従って、ブロック内部に含有されるピクセルを2つの非長方形領域(例えば領域0および領域1)へと分離すると決められ得る。550Aでは、決められた指数関数的分割は、ビットストリーム内で信号伝達され得る。ビットストリーム内の信号伝達は、例えば、1つまたは複数のあらかじめ決められたテンプレートおよび/または係数へのインデックスを含むことを含み得る。
【0056】
図5Bは、圧縮効率を増大させながらエンコーディング複雑性を低減させ得る本主題のいくつかの側面に従った、指数関数的分割を伴って映像をエンコードすることの例となるプロセス500Bを図示したプロセスフロー図である。510Bでは、映像フレームが、例えば、ピクチャフレームをCTUおよびCUへと分割することを含み得るツリー構造化マクロブロック分割スキームを用いた初期のブロック区分化を受け得る。520Bでは、ブロックが、指数関数的分割のために選定され得る。選定は、ブロックが指数関数的分割モードに従って処理されることとなることをメトリックルールに従って識別することを含み得る。
【0057】
530Bでは、指数関数的分割が決められ得る。曲線(例えば305)が、領域の1つ(例えば領域0)内部のピクセル(例えばルマサンプル)が類似した動きを有し、他の領域(例えば領域1)内部のピクセルが類似した動きを有するように、ピクセルのインターフレーム動きに従って、ブロック内部に含有されるピクセルを2つの非長方形領域(例えば領域0および領域1)へと分離すると決められ得る。
【0058】
540Bでは、分割パラメータ表現が決められ得、これは、カレントブロックが別のブロックから指数関数的分割パラメータを引き継ぐかどうか、および、カレントブロックがどの他のブロックから引き継ぐかを決めることを含み得る。
【0059】
550Bでは、決められた指数関数的分割が、ビットストリーム内で信号伝達され得る。ビットストリーム内の信号伝達は、例えば、空間的および時間的に隣接するブロックのあらかじめ決められたリストへのインデックスを含むことを含み得る。
【0060】
図5Cは、圧縮効率を増大させながらエンコーディング複雑性を低減させ得る本主題のいくつかの側面に従った、指数関数的分割と、SADCTとを伴って映像をエンコードすることの例となるプロセス500Cを図示したプロセスフロー図である。510Cでは、映像フレームが、例えば、ピクチャフレームをCTUおよびCUへと分割することを含み得るツリー構造化マクロブロック分割スキームを用いた初期のブロック区分化を受け得る。520Cでは、ブロックが、指数関数的分割のために選定され得る。選定は、ブロックが指数関数的分割モードに従って処理されることとなることをメトリックルールに従って識別することを含み得る。
【0061】
530Cでは、指数関数的分割が決められ得る。曲線(例えば305)が、領域の1つ(例えば領域0)内部のピクセル(例えばルマサンプル)が類似した動きを有し、他の領域(例えば領域1)内部のピクセルが類似した動きを有するように、ピクセルのインターフレーム動きに従って、ブロック内部に含有されるピクセルを2つの非長方形領域(例えば領域0および領域1)へと分離すると決められ得る。540Cでは、相応しい変換が、領域0および領域1のうちの1つまたは複数に対して決められ得る。例えば、領域0または領域1が低い予測誤差を有しているかが判定され得る。領域0が低い予測誤差を有すると判定することに応答して、領域0はSADCTを用いてエンコードされ得る。領域1が低い予測誤差を有すると判定することに応答して、領域1はSADCTを用いてエンコードされ得る。いくつかの実装形態では、領域は、予測誤差があらかじめ決められた閾値より下であるとき、低い予測誤差を有すると見做され得る。
【0062】
550Cでは、決められた指数関数的分割および変換の選択肢が、ビットストリーム内で信号伝達され得る。ビットストリーム内の信号伝達は、例えば、1つまたは複数のあらかじめ決められたテンプレートおよび/または係数へのインデックスを含むことを含み得る。ビットストリーム内の信号伝達は、例えば、低い予測誤差を有する領域(例えば領域0または領域1)に対するフルブロックDCTに加えた変換の選択肢として、信号伝達SADCTを含み得る。
【0063】
図6は、指数関数的分割および/または逆SADCTを用いてビットストリーム670をデコードすることが可能な例となるデコーダ600を図示したシステムブロック図である。デコーダ600は、エントロピーデコーダプロセッサ610と、逆量子化および逆変換プロセッサ620と、デブロッキングフィルタ630と、フレームバッファ640と、動き補償プロセッサ650と、イントラ予測プロセッサ660とを有している。いくつかの実装形態では、ビットストリーム670は、指数関数的分割モードを信号伝達するパラメータを含む。いくつかの実装形態では、ビットストリーム670は、適用すべき逆変換のタイプ(例えば逆ブロックDCTまたは逆SADCT)を信号伝達するパラメータを含む。動き補償プロセッサ650は、本明細書で説明されるように、指数関数的分割および/または逆SADCTを用いてピクセル情報を再構築し得る。
【0064】
動作中には、ビットストリーム670は、デコーダ600によって受け取られ得、エントロピーデコーダプロセッサ610へと入力され得、エントロピーデコーダプロセッサ610はビットストリームを量子化された係数へとエントロピーデコードする。量子化された係数は、逆量子化および逆変換プロセッサ620へと提供され得、逆量子化および逆変換プロセッサ620は、逆SADCTを利用して、および、ビットストリーム内の信号に従って、逆量子化および逆変換を実行し得る。逆変換は、残差信号を生み出し得、残差信号は、処理モードに従って、動き補償プロセッサ650またはイントラ予測プロセッサ660の出力へと追加され得る。動き補償プロセッサ650およびイントラ予測プロセッサ660の出力は、以前デコードされたブロックに基づいたブロック予測を含み得る。予測および残差の合計は、デブロッキングフィルタ630によって処理され得、フレームバッファ640内に記憶され得る。与えられたブロック(例えばCUまたはPU)に対して、ビットストリーム670が、分割モードが指数関数的分割であると信号伝達しているとき、動き補償プロセッサ650は、カレントブロックに対して、空間的および時間的に隣接するブロックのあらかじめ決められたリストへのインデックスをビットストリームから抽出すること、およびカレントブロックを再構築するために、指し示されたブロックに対して指数関数的分割パラメータを用いることを含む、本明細書において説明されている指数関数的分割スキームに基づいて、予測を構築し得る。
【0065】
図7は、いくつかの実装形態では逆SADCTを用い得る、指数関数的分割を用いてビットストリームをデコードすることの例となるプロセス700を図示したプロセスフロー図である。710では、ブロック(例えばCTU、CU、PU)が受け取られる。受け取ることは、ブロックおよび関連付けられた信号伝達情報をビットストリームから抽出および/またはパースすることを含み得る。720では、指数関数的分割モードがブロックに対して有効にされるかどうか(例えば当てはまるかどうか)が判定され得る。指数関数的分割モードが有効にされない場合(例えば当てはまらない場合)、デコーダは、幾何学分割等の代わりの分割モードを用いてブロックを処理し得る。指数関数的分割モードが有効にされる場合(例えば当てはまる場合)、730では、デコーダが、指数関数的分割および変換を特徴付ける1つまたは複数のパラメータを抽出および/または決め得る。これらのパラメータは、例えば、指数関数の係数のインデックス、指数関数の係数の値、方向付けテンプレートのインデックス、および/または曲線の開始および終了(例えばP1P2)のインデックスを含み得る。抽出パラメータは、ビットストリームからパラメータを識別およびリトリーブすること(例えばビットストリームをパースすること)を含み得る。上記パラメータは、例えば、逆SADCTを用いてブロックを処理するかどうかを指し示し得る変換パラメータを含み得る。さらに、指数関数的分割を特徴付ける1つまたは複数のパラメータを決めることは、指数関数的分割マージが信号伝達されていることを判定することと、ビットストリームに含有されているインデックス(カレントブロックが指数関数的分割パラメータを引き継ぐ隣り合うブロックを決める)を用いることとを含み得る。740では、ブロックが、各領域に対する関連付けられた動き情報を決めることを含め、(例えば、予測を生じさせるために)指数関数的分割に従って処理され得る。いくつかの実装形態では、740では、ブロックが、逆SADCTを利用してさらに処理され得る。
【0066】
いくつかのバリエーションが上で詳細に説明されているが、他の変更または追加が可能である。例えば、いくつかの実装形態では、指数関数的分割は、様々な非対称ブロック(8×4、16×8および同様のもの)だけでなく対称ブロック(8×8、16×16、32×32、64×64、128×128および同様のもの)へと適用し得る。
【0067】
いくつかの実装形態では、空間的および時間的な指数関数的分割予測は、64×64および/または128×128等の、16×16またはこれより大きいルマブロックサイズに対して実行され得る。いくつかの実装形態では、16×16の最小ブロックサイズが課され得る。
【0068】
分割は、エンコーダ内のレート歪み決定に基づいて、ビットストリーム内で信号伝達され得る。符号化は、規則的なあらかじめ定義された分割(例えばテンプレート)と、分割の時間的および空間的な予測と、追加のオフセットとの組み合わせに基づき得る。指数関数的分割がなされた各領域は、動き補償がなされた予測またはイントラ予測を利用し得る。予測された領域の境界は、残差が追加される前に平滑化され得る。残差符号化に対して、エンコーダは、ブロック全体に対する規則的な長方形DCTと、各領域に対するShape Adaptive DCTとのどちらかを選定し得る。
【0069】
いくつかの実装形態では、クアッドツリープラスバイナリディシジョンツリー(QTBT)が実装され得る。QTBTでは、符号化ツリーユニットレベルで、QTBTの分割パラメータが、いずれのオーバーヘッドも送信することを伴わないローカルな特性に適応するために動的に導出される。次いで、符号化ユニット(CU)レベルで、ジョイント分類器ディシジョンツリー構造が、不要な反復を排除し得、誤った予測のリスクを制御し得る。いくつかの実装形態では、指数関数的分割は、QTBTのリーフノード毎で使用可能な追加の分割オプションとして使用可能であり得る。いくつかの実装形態では、指数関数的分割は、QTBT分割のCUレベルにおける追加の符号化ツールとして使用可能である。例えば、図8は、フレームのQTBT分割の例を図示しており、図9は、図8に図示されているQTBTの、CUレベルでの指数関数的分割の例を図示している。
【0070】
いくつかの実装形態では、デコーダは、カレントブロックに対して指数関数的分割を生成し、かつ従属プロセスに対して分割に関連する全ての情報を提供する指数関数的分割プロセッサを含む。指数関数的分割プロセッサは、ブロックは指数関数的分割をなされている場合、区分的に実行され得るため、動き補償に直接影響を及ぼし得る。さらに、分割プロセッサは、形情報をイントラ予測プロセッサおよび変換符号化プロセッサへと提供し得る。
【0071】
いくつかの実装形態では、追加のシンタックス要素が、ビットストリームの異なる階層レベルで信号伝達され得る。全体のシーケンスに対して指数関数的分割を有効にするために、有効フラグがシーケンスパラメータセット(SPS)内で符号化され得る。さらに、符号化ツリーユニット(CTU)フラグが、任意の符号化ユニット(CU)が指数関数的分割を用いるかどうかを指し示すために、CTUレベルで符号化され得る。CUフラグは、カレント符号化ユニットが指数関数的分割を利用するかどうかを指し示すために、符号化され得る。ブロック上の曲線を指定するパラメータは符号化され得る。各領域に対して、フラグはデコードされ得、デコードされたフラグは、カレント領域がインター予測されるか、イントラ予測されるかを指定する。
【0072】
いくつかの実装形態では、最小領域サイズが指定され得る。
【0073】
ここで、図11を参照すると、指数関数的分割に従って分割された別の例となるブロック1100を図示した図が示されている。指数関数的分割は曲がった対象境界を伴う対象を含有するブロック(例えば符号化ユニット)に対して利用されることが十分に考えられるので、分割が、低い予測誤差を有する1つの領域と、高い予測誤差を有する別の領域とに帰着することは十分に考えられる。例えば、図11に図示されるように、ブロックは、指数関数的分割に従って、曲線を伴って分割される。ブロック内部のルマサンプルがボールおよび背景を表現すると仮定して、2つの領域(S0およびS1)は、それぞれ背景およびボールに相当するルマサンプルを含む。結果として、領域S1はボールに関連するので、領域S1は低い予測誤差を有する一方で、領域S0は背景に関連するので、領域S0は高い予測誤差を有する。従って、本主題のいくつかの側面は、低い予測誤差を有する領域に対してSADCTを実行することを含み得る。低い予測誤差を有する領域に対して、フルブロックDCTの代わりにSADCTを実行することによって、圧縮効率は改善され得る。
【0074】
いくつかの実装形態では、デコーディングの間中、逆SADCTを実行するためのパラメータが、指数関数的分割パラメータから推論され得る。例えば、変換サイズは、指数関数的分割テンプレートのインデックスから決められ得る。
【0075】
いくつかの実装形態では、SADCTが、64×64および/または128×128サイズのブロックに対して実装され得る。いくつかの実装形態では、SADCTが、低い予測誤差を伴う区分に対して、フルブロックDCTに加えた変換の選択肢として信号伝達され得る。
【0076】
ここで、図12を参照すると、空間的に隣接するブロック1210からの、カレントブロック1205による指数関数的分割パラメータの引き継ぎを図示した図が示されている。曲線は画像内で対象境界1215を指し示す。カレントブロック1205および空間的に隣接するブロック1210は、クアッドツリープラスバイナリツリー(QTBT)内の符号化ユニットまたは予測ユニットブロックを指し示す。図示されているように、対象境界1215は、一般に、比較的一様な湾曲を含む。隣接するブロック1210と、カレントブロック1205との両方が、指数関数的分割を用いて分割される。本主題のいくつかの実装形態を用いて、全ての指数関数的分割パラメータ(例えば形および/もしくは方向付けテンプレートへのインデックス、係数、開始インデックス、終了インデックスならびに/または同様のもの)を送るのではなく、指数関数的分割マージが、隣接するブロック1210へのインデックスと共にビットストリーム内で信号伝達され得る。カレントブロックのデコーディングの間中、カレントブロックは、指し示されている隣接するブロックから、指数関数的分割パラメータのいくつかまたは全てを引き継ぎ得る。図13は、カレントブロックに対する空間的に隣接するブロックの例を図示している。空間的に隣接するブロックは、A0(左下)と、A1(左)と、B0(右上)と、B1(上)と、B2(左上)と同一の(例えば、重なり合っている)場所にあるブロック(例えば符号化ユニットまたは予測ユニット)を含み得る。
【0077】
加えて、与えられたカレントブロックが指数関数的分割パラメータを引き継ぐ、隣接するブロックは、時間的に隣接し得る。図14は、カレントブロック1405が指数関数的分割パラメータを引き継ぐ、時間的に隣接するブロック1410を伴う例となるカレントブロック1405を図示している。図14に図示されているように、参照ピクチャ1415は隣接するブロック1410を含み、隣接するブロック1410は、参照ピクチャ1415からカレントピクチャ1425への隣接するブロック1410の動きを特徴付ける関連付けられた動きベクトル1420を有し、カレントピクチャ1425はカレントブロック1405を含有する。本主題のいくつかの実装形態を用いて、全ての指数関数的分割パラメータ(例えば形および/もしくは方向付けテンプレートへのインデックス、係数、ならびに/または同様のもの)を送るのではなく、指数関数的分割マージが、隣接するブロック1410へのインデックスと共にビットストリーム内で信号伝達され得る。カレントブロック1405のデコーディングの間中、カレントブロック1405は、指し示されている隣接するブロック1410から、指数関数的分割パラメータのいくつかまたは全てを引き継ぎ得る。
【0078】
いくつかの実装形態では、ペアレントブロックは隣接するブロックでなくてもよく、例えば、ペアレントブロックは、以前にデコードされている、カレントフレーム内の別のブロックであり得る。
【0079】
いくつかの実装形態では、カレントブロックは、別のブロックからいくつかの指数関数的分割パラメータのみを引き継ぎ得る。例えば、カレントブロックは、第一のペアレントブロックから第一のパラメータ(例えば形テンプレート)を引き継ぎ得、追加のパラメータ(例えば始点、終点、方向付けテンプレート、および同様のもの)はビットストリームに含まれ得る。
【0080】
本明細書で説明される主題は、多くの技術的な利点を提供する。例えば、本主題のいくつかの実装形態は、圧縮効率を増大させる、ブロックの分割を提供し得る。いくつかの実装形態では、対象境界をより密接に辿るやり方で分割を実装することによって、効果的な視覚効果が達成され得る。同様に、いくつかの実装形態では、対象境界をより密接に辿るやり方で分割を実装することによって、対象境界でのブロッキングアーティファクトが低減され得る。いくつかの実装形態では、フルブロックDCTに加えた変換の選択肢としてSADCTを実装し、低い予測誤差を有する、指数関数的分割がなされた領域へとSADCTを適用することによって、圧縮効率が増大され得、複雑性が低減され得る。
【0081】
本明細書で説明される主題の1つまたは複数の側面または特徴が、デジタル電子回路、集積回路、特別に設計された特定用途向け集積回路(ASICs)、フィールドプログラマブルゲートアレイ(FPGAs)コンピュータハードウェア、ファームウェア、ソフトウェア、および/またはそれらの組み合わせにおいて実現され得る。これらの様々な側面または特徴は、ストレージシステムと、少なくとも1つの入力デバイスと、少なくとも1つの出力デバイスとからデータおよび命令を受信し、かつストレージシステムと、少なくとも1つの入力デバイスと、少なくとも1つの出力デバイスとにデータおよび命令を送信するように結合された少なくとも1つのプログラマブルプロセッサ(専用または汎用であり得る)を含むプログラマブルシステム上で実行可能および/または解釈可能な1つまたは複数のコンピュータプログラムにおける実装を含み得る。プログラマブルシステムまたはコンピューティングシステムは、クライアントおよびサーバを含み得る。クライアントおよびサーバは、一般に互いから離れており、典型的にはコミュニケーションネットワークを経由して相互作用する。クライアントとサーバとの関係は、それぞれのコンピュータ上で走っている、かつ互いにクライアントサーバ関係を有しているコンピュータプログラムによって生じる。
【0082】
これらのコンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、アプリケーション、コンポーネントまたはコードとも称され得る)は、プログラマブルプロセッサに対する機械語命令を含み、高水準手続き型言語、オブジェクト指向プログラミング言語、関数型プログラミング言語、論理プログラミング言語、および/またはアセンブリ言語/機械語において実装され得る。本明細書で用いられる場合に、「機械読み取り可能な媒体」という用語は、例えば磁気ディスク、光学ディスク、メモリ、およびプログラマブルプロセッサへと機械語命令および/またはデータを提供することに用いられるプログラマブルロジックデバイス(PLDs)等の、機械読み取り可能な信号として機械語命令を受け取る機械読み取り可能な媒体を含む任意のコンピュータプログラム製品、装置、および/またはデバイスを参照している。「機械読み取り可能な信号」という用語は、機械語命令および/またはデータをプログラマブルプロセッサへと提供することに用いられる任意の信号を参照している。機械読み取り可能な媒体は、例えば非一過性ソリッドステートメモリまたは磁気ハードドライブまたは任意の同等な記憶媒体等がそうであるように、このような機械語命令を非一時的に記憶し得る。機械読み取り可能な媒体は、例えば1つまたは複数の物理プロセッサコアに関連付けられたプロセッサキャッシュメモリまたは他のランダムアクセスメモリがそうであるように、非一時的なやり方でこのような機械語命令を代わりに、または加えて記憶し得る。
【0083】
ユーザーとのインタラクションを提供するために、本明細書で説明される主題の1つまたは複数の側面または特徴が、ユーザーに情報を表示するための、例えばカソードレイチューブ(CRT)または液晶ディスプレイ(LCD)または発光ダイオード(LED)モニター等のディスプレイデバイスと、ユーザーがコンピュータへの入力を提供し得る、キーボードおよび、例えばマウスまたはトラックボール等のポインティングデバイスとを有するコンピュータに実装され得る。デバイスの他の種類も同じようにユーザーとのインタラクションを提供するために用いられ得る。例えば、ユーザーへと提供されるフィードバックは、例えば視覚フィードバック、聴覚フィードバックまたは触覚フィードバック等、感覚フィードバックの任意の方式であり得、ユーザーからの入力は、音響、発話または触知入力を含む任意の方式で受け取られ得る。他の可能な入力デバイスは、タッチスクリーンまたは他のタッチセンサー式デバイス(シングルまたはマルチポイント式の抵抗方式または静電容量方式トラックパッド、音声認識ハードウェアおよびソフトウェア、光学式スキャナ、光学式ポインタ、デジタル画像キャプチャデバイスおよび関連付けられた解釈ソフトウェア、ならびに同様のもの)を含む。
【0084】
上の記載および特許請求の範囲における記載では、「のうちの少なくとも1つ」または「のうちの1つまたは複数」等のフレーズは、要素または特徴の並列リストの後に現れ得る。「および/または」という用語も、2つまたはそれより多い要素または特徴のリストにおいて現れ得る。このようなフレーズが用いられている文脈によって、暗に、または明確に否定されることが特にない限り、このようなフレーズは、個々のリストされた要素もしくは特徴のいずれか、または、他の列挙された要素もしくは特徴のいずれかとの組み合わせにおける列挙された要素もしくは特徴のいずれかを意味することを意図されている。例えば、「AおよびBのうちの少なくとも1つ」、「AおよびBのうちの1つまたは複数」、および「Aおよび/またはB」というフレーズは、各々が、「A単独、B単独、または、AおよびB共に」を意味することを意図されている。類似の解釈が、3つまたはそれより多い項目を含むリストに対しても意図されている。例えば、「A、BおよびCのうちの少なくとも1つ」、「A、BおよびCのうちの1つまたは複数」および「A、Bおよび/またはC」というフレーズは、各々が、「A単独、B単独、C単独、AおよびB共に、AおよびC共に、BおよびC共に、または、AおよびBおよびC共に」を意味することを意図されている。加えて、上における、および特許請求の範囲における「基づいて」という用語の使用は、列挙されていない要素または特徴も許容されるように、「少なくとも部分的に基づいて」を意味することを意図されている。
【0085】
本明細書で説明される主題は、望まれる構成に依存して、システム、装置、方法および/または物品において実施され得る。上記説明に記述されている実施形態は、本明細書で説明される主題と整合的な全ての実施形態を表現しているわけではない。それどころか、上記説明に記述されている実施形態は、単に、説明される主題に関連する側面と整合的ないくつかの例にすぎない。いくつかのバリエーションが上で詳細に説明されているが、他の変更または追加が可能である。特に、さらなる特徴および/またはバリエーションが、本明細書に記述される特徴および/またはバリエーションに加えて提供され得る。例えば、上で説明された実施形態は、開示された特徴の様々な組み合わせおよび部分的組み合わせ、ならびに/または、上で開示されたいくつかのさらなる特徴の組み合わせおよび部分的組み合わせに向けられ得る。加えて、付属の図に描写されている、かつ/または本明細書で説明されるロジックフローは、望ましい結果を達成するためには、示された特定の順序または連続した順序を必ずしも要求しない。他の実装形態は、以下の特許請求の範囲内であり得る。
図1
図2
図3A
図3B
図3C
図3D
図4
図5A
図5B
図5C
図6
図7
図8
図9
図10
図11
図12
図13
図14