特開2023-159390 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ パナソニック　インテレクチュアル　プロパティ　コーポレーション　オブ　アメリカの特許一覧

特開2023-159390符号化装置及び復号装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4A
4B
4C
5A
5B
5C
5D
6
7
8
9A
9B
9C
9D
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2023159390

(43)【公開日】2023-10-31

(54)【発明の名称】符号化装置及び復号装置

(51)【国際特許分類】

H04N 19/52 20140101AFI20231024BHJP

【ＦＩ】

H04N19/52

【審査請求】有

【請求項の数】2

【出願形態】ＯＬ

(21)【出願番号】P 2023137501

(22)【出願日】2023-08-25

(62)【分割の表示】P 2019570713の分割

【原出願日】2019-01-30

(31)【優先権主張番号】62/626,974

(32)【優先日】2018-02-06

(33)【優先権主張国・地域又は機関】US

(71)【出願人】

【識別番号】514136668

【氏名又は名称】パナソニックインテレクチュアルプロパティコーポレーションオブアメリカ

【氏名又は名称原語表記】ＰａｎａｓｏｎｉｃＩｎｔｅｌｌｅｃｔｕａｌＰｒｏｐｅｒｔｙＣｏｒｐｏｒａｔｉｏｎｏｆＡｍｅｒｉｃａ

(74)【代理人】

【識別番号】100109210

【弁理士】

【氏名又は名称】新居広守

(74)【代理人】

【識別番号】100137235

【弁理士】

【氏名又は名称】寺谷英作

(74)【代理人】

【識別番号】100131417

【弁理士】

【氏名又は名称】道坂伸一

(72)【発明者】

【氏名】遠間正真

(72)【発明者】

【氏名】西孝啓

(72)【発明者】

【氏名】安倍清史

(72)【発明者】

【氏名】加納龍一

(57)【要約】（修正有）

【課題】動画像の符号化等において、処理量の増加を抑制しつつ、より細分化された予測処理を行うことができる符号化装置を提供する。
【解決手段】回路と、メモリと、を備える符号化装置において、回路は、動画像におけるブロック単位の動きベクトルに基づき予測処理を行う第１のモード及びブロックを分割したサブブロック単位の動きベクトルに基づき予測処理を行う第２のモードを含む複数のモードのうち、いずれのモードを用いて予測処理を行うかを決定し、第１のモードで予測処理を行う場合は、予測処理を行うことで得られる予測画像における画素値の空間的な勾配を用いて予測画像の補正処理を行うか否かを判定し、補正処理を行うと判定された場合に補正処理を行い、第２のモードで予測処理を行う場合は、補正処理を行わない。第１のモードは、マージモードに含まれる。
【選択図】図１６

【特許請求の範囲】

【請求項1】

予測処理を行って動画像を符号化する符号化装置であって、
回路と、
メモリと、を備え、
前記回路は、前記メモリを用いて、
前記動画像におけるブロック単位の動きベクトルに基づき前記予測処理を行う第１のモード、及び、前記ブロックを分割したサブブロック単位の動きベクトルに基づき前記予測処理を行う第２のモードを含む複数のモードのうち、いずれのモードを用いて前記予測処理を行うかを決定し、
前記第１のモードで前記予測処理を行う場合は、前記予測処理を行うことで得られる予測画像における画素値の空間的な勾配を用いて前記予測画像の補正処理を行うか否かを判定し、前記補正処理を行うと判定された場合に前記補正処理を行い、
前記第２のモードで前記予測処理を行う場合は、前記補正処理を行わず、
前記第１のモードは、前記ブロックに隣接する隣接ブロックの動きベクトルを動きベクトルとして用いるモードであるマージモードに含まれる、
符号化装置。

【請求項2】

予測処理を行って動画像を復号する復号装置であって、
回路と、
メモリと、を備え、
前記回路は、前記メモリを用いて、
前記動画像におけるブロック単位の動きベクトルに基づき前記予測処理を行う第１のモード、及び、前記ブロックを分割したサブブロック単位の動きベクトルに基づき前記予測処理を行う第２のモードを含む複数のモードのうち、いずれのモードを用いて前記予測処理を行うかを決定し、
前記第１のモードで前記予測処理を行う場合は、前記予測処理を行うことで得られる予測画像における画素値の空間的な勾配を用いて前記予測画像の補正処理を行うか否かを判定し、前記補正処理を行うと判定された場合に前記補正処理を行い、
前記第２のモードで前記予測処理を行う場合は、前記補正処理を行わず、
前記第１のモードは、前記ブロックに隣接する隣接ブロックの動きベクトルを動きベクトルとして用いるモードであるマージモードに含まれる、
復号装置。

【発明の詳細な説明】

【技術分野】

【0001】

本開示は、動画像を符号化する符号化装置等に関する。

【背景技術】

【0002】

従来、動画像を符号化するための規格として、ＨＥＶＣ（ＨｉｇｈＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ）とも呼ばれるＨ．２６５が存在する（非特許文献１）。

【先行技術文献】

【非特許文献】

【0003】

【非特許文献1】Ｈ．２６５（ＩＳＯ／ＩＥＣ２３００８－２ＨＥＶＣ）／ＨＥＶＣ（ＨｉｇｈＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ）

【発明の概要】

【発明が解決しようとする課題】

【0004】

しかしながら、動画像の符号化等において、処理量の増加を抑制しつつ、より細分化された予測処理を行うことは容易ではない。

【0005】

そこで、本開示は、動画像の符号化等において、処理量の増加を抑制しつつ、より細分化された予測処理を行うことができる符号化装置等を提供する。

【課題を解決するための手段】

【0006】

本開示の一態様に係る符号化装置は、予測処理を行って動画像を符号化する符号化装置であって、回路と、メモリと、を備え、前記回路は、前記メモリを用いて、前記動画像におけるブロック単位の動きベクトルに基づき前記予測処理を行う第１のモード、及び、前記ブロックを分割したサブブロック単位の動きベクトルに基づき前記予測処理を行う第２のモードを含む複数のモードのうち、いずれのモードを用いて前記予測処理を行うかを決定し、前記第１のモードで前記予測処理を行う場合は、前記予測処理を行うことで得られる予測画像における画素値の空間的な勾配を用いて前記予測画像の補正処理を行うか否かを判定し、前記補正処理を行うと判定された場合に前記補正処理を行い、前記第２のモードで前記予測処理を行う場合は、前記補正処理を行わず、前記第１のモードは、前記ブロックに隣接する隣接ブロックの動きベクトルを動きベクトルとして用いるモードであるマージモードに含まれる。

【0007】

なお、これらの包括的又は具体的な態様は、システム、装置、方法、集積回路、コンピュータプログラム、又は、コンピュータ読み取り可能なＣＤ－ＲＯＭなどの非一時的な記録媒体で実現されてもよく、システム、装置、方法、集積回路、コンピュータプログラム、及び、記録媒体の任意な組み合わせで実現されてもよい。

【発明の効果】

【0008】

本開示の一態様に係る符号化装置等は、動画像の符号化等において、処理量の増加を抑制しつつ、より細分化された予測処理を行うことができる。

【図面の簡単な説明】

【0009】

【図1】図１は、実施の形態１に係る符号化装置の機能構成を示すブロック図である。

【図2】図２は、実施の形態１におけるブロック分割の一例を示す図である。

【図3】図３は、各変換タイプに対応する変換基底関数を示す表である。

【図4A】図４Ａは、ＡＬＦで用いられるフィルタの形状の一例を示す図である。

【図4B】図４Ｂは、ＡＬＦで用いられるフィルタの形状の他の一例を示す図である。

【図4C】図４Ｃは、ＡＬＦで用いられるフィルタの形状の他の一例を示す図である。

【図5A】図５Ａは、イントラ予測における６７個のイントラ予測モードを示す図である。

【図5B】図５Ｂは、ＯＢＭＣ処理による予測画像補正処理の概要を説明するためのフローチャートである。

【図5C】図５Ｃは、ＯＢＭＣ処理による予測画像補正処理の概要を説明するための概念図である。

【図5D】図５Ｄは、ＦＲＵＣの一例を示す図である。

【図6】図６は、動き軌道に沿う２つのブロック間でのパターンマッチング（バイラテラルマッチング）を説明するための図である。

【図7】図７は、カレントピクチャ内のテンプレートと参照ピクチャ内のブロックとの間でのパターンマッチング（テンプレートマッチング）を説明するための図である。

【図8】図８は、等速直線運動を仮定したモデルを説明するための図である。

【図9A】図９Ａは、複数の隣接ブロックの動きベクトルに基づくサブブロック単位の動きベクトルの導出を説明するための図である。

【図9B】図９Ｂは、マージモードによる動きベクトル導出処理の概要を説明するための図である。

【図9C】図９Ｃは、ＤＭＶＲ処理の概要を説明するための概念図である。

【図9D】図９Ｄは、ＬＩＣ処理による輝度補正処理を用いた予測画像生成方法の概要を説明するための図である。

【図10】図１０は、実施の形態１に係る復号装置の機能構成を示すブロック図である。

【図11】図１１は、第１態様において符号化装置及び復号装置が行う動作の一例を示すフローチャートである。

【図12】図１２は、第１態様において符号化装置及び復号装置が行う動作の他の例を示すフローチャートである。

【図13】図１３は、ＡＴＭＶＰモードにおけるサブブロック単位の動きベクトルの決定方法の一例を示す図である。

【図14】図１４は、ＳＴＭＶＰモードにおけるサブブロック単位の動きベクトルの決定方法の一例を示す図である。

【図15】図１５は、実施の形態１に係る符号化装置の実装例を示すブロック図である。

【図16】図１６は、実施の形態１に係る符号化装置の動作例を示すフローチャートである。

【図17】図１７は、実施の形態１に係る復号装置の実装例を示すブロック図である。

【図18】図１８は、実施の形態１に係る復号装置の動作例を示すフローチャートである。

【図19】図１９は、コンテンツ配信サービスを実現するコンテンツ供給システムの全体構成図である。

【図20】図２０は、スケーラブル符号化時の符号化構造の一例を示す図である。

【図21】図２１は、スケーラブル符号化時の符号化構造の一例を示す図である。

【図22】図２２は、ｗｅｂページの表示画面例を示す図である。

【図23】図２３は、ｗｅｂページの表示画面例を示す図である。

【図24】図２４は、スマートフォンの一例を示す図である。

【図25】図２５は、スマートフォンの構成例を示すブロック図である。

【発明を実施するための形態】

【0010】

（本開示の基礎となった知見）
例えば、動画像を符号化する符号化装置は、動画像の符号化等において、処理量の増加を抑制しつつ、より細分化された予測処理を行う動画像を符号化する際、動画像を構成する画像から予測画像を減算することにより予測誤差を導出する。そして、符号化装置は、予測誤差に対して周波数変換及び量子化を行って、その結果を画像のデータとして符号化する。このとき、動画像に含まれるブロック等の符号化対象ユニットの動きをブロック単位又は当該ブロックを構成するサブブロック単位で動き予測処理を行い、さらに微小単位で動き補正処理を行えば、符号化精度が向上する。

【0011】

しかしながら、動画像に含まれるブロックなどの符号化等において、適切に細分化された予測処理を行わなければ、処理量の増加につながり、符号化効率が低下する。

【0012】

そこで、本開示の一態様に係る符号化装置は、予測処理を行って動画像を符号化する符号化装置であって、回路と、メモリと、を備え、前記回路は、前記メモリを用いて、前記動画像におけるブロック単位の動きベクトルに基づき前記予測処理を行う第１のモード、及び、前記ブロックを分割したサブブロック単位の動きベクトルに基づき前記予測処理を行う第２のモードを含む複数のモードのうち、いずれのモードを用いて前記予測処理を行うかを決定し、前記第１のモードで前記予測処理を行う場合は、前記予測処理を行うことで得られる予測画像における画素値の空間的な勾配を用いて前記予測画像の補正処理を行うか否かを判定し、前記補正処理を行うと判定された場合に前記補正処理を行い、前記第２のモードで前記予測処理を行う場合は、前記補正処理を行わない符号化装置であってもよい。

【0013】

これにより、符号化装置は、微小単位の動き補正を、ブロック単位の動き予測と併用するため、符号化効率が向上される。また、サブブロック単位の動き予測は、ブロック単位の動き予測よりも処理量が大きいため、符号化装置は、サブブロック単位の動き予測を行った場合、微小単位の動き補正を行わない。そのため、符号化装置は、微小単位の動き予測をブロック単位の動き予測に対してのみ実行することにより、符号化効率を維持しつつ、処理量を低減することができる。したがって、符号化装置は、処理量の増加を抑制しつつ、より細分化された予測処理を行うことができる。

【0014】

例えば、前記第１のモード及び前記第２のモードは、予測動きベクトルを動きベクトルとして用いるモードであるマージモードに含まれてもよい。

【0015】

これにより、符号化装置は、マージモードにおいて予測サンプルセットを導出するための処理を高速化することができる。

【0016】

また、例えば、前記回路は、前記第１のモードで前記予測処理を行う場合は、前記予測処理を行うか否かの判定結果を示す判定結果情報を符号化し、前記第２のモードで前記予測処理を行う場合は、前記判定結果情報を符号化しなくてもよい。

【0017】

これにより、符号化装置は、符号量を削減することができる。

【0018】

また、例えば、前記補正処理は、ＢＩＯ（ＢＩ－ｄｉｒｅｃｔｉｏｎａｌＯｐｔｉｃａｌｆｌｏｗ）処理であってもよい。

【0019】

これにより、符号化装置は、ブロック単位での動きベクトルを導出して生成された予測画像における微小単位の補正値を使って予測画像を補正することができる。

【0020】

また、例えば、前記第２のモードは、ＡＴＭＶＰ（ＡｄｖａｎｃｅｄＴｅｍｐｏｒａｌＭｏｔｉｏｎＶｅｃｔｏｒＰｒｅｄｉｃｔｉｏｎ）モードであってもよい。

【0021】

これにより、符号化装置は、ＡＴＭＶＰモードにおいて微小単位での動き補正処理を行う必要がないため、処理量が低減される。

【0022】

また、例えば、前記第２のモードは、ＳＴＭＶＰ（Ｓｐａｔｉａｌ－ＴｅｍｐｏｒａｌＭｏｔｉｏｎＶｅｃｔｏｒＰｒｅｄｉｃｔｉｏｎ）モードであってもよい。

【0023】

これにより、符号化装置は、ＳＴＭＶＰモードにおいて微小単位での動き補正処理を行う必要がないため、処理量が低減される。

【0024】

また、例えば、前記第２のモードは、アフィン（ａｆｆｉｎｅｍｏｔｉｏｎｃｏｍｐｅｎｓａｔｉｏｎｐｒｅｄｉｃｔｉｏｎ）モードであってもよい。

【0025】

これにより、符号化装置は、アフィンモードにおいて微小単位での動き補正処理を行う必要がないため、処理量が低減される。

【0026】

また、本開示の一態様に係る復号装置は、予測処理を行って動画像を復号する復号装置であって、回路と、メモリと、を備え、前記回路は、前記メモリを用いて、前記動画像におけるブロック単位の動きベクトルに基づき前記予測処理を行う第１のモード、及び、前記ブロックを分割したサブブロック単位の動きベクトルに基づき前記予測処理を行う第２のモードを含む複数のモードのうち、いずれのモードを用いて前記予測処理を行うかを決定し、前記第１のモードで前記予測処理を行う場合は、前記予測処理を行うことで得られる予測画像における画素値の空間的な勾配を用いて前記予測画像の補正処理を行うか否かを判定し、前記補正処理を行うと判定された場合に前記補正処理を行い、前記第２のモードで前記予測処理を行う場合は、前記補正処理を行わない復号装置であってもよい。

【0027】

これにより、復号装置は、微小単位の動き補正を、ブロック単位の動き予測と併用するため、符号化効率が向上される。また、サブブロック単位の動き予測は、ブロック単位の動き予測よりも処理量が大きいため、復号装置は、サブブロック単位の動き予測を行った場合、微小単位の動き補正を行わない。そのため、復号装置は、微小単位の動き予測をブロック単位の動き予測に対してのみ実行することにより、符号化効率を維持しつつ、処理量を低減することができる。したがって、復号装置は、処理量の増加を抑制しつつ、より細分化された予測処理を行うことができる。

【0028】

例えば、前記第１のモード及び前記第２のモードは、予測動きベクトルを動きベクトルとして用いるモードであるマージモードに含まれてもよい。

【0029】

これにより、復号装置は、マージモードにおいて予測サンプルセットを導出するための処理を高速化することができる。

【0030】

また、例えば、前記第１のモードで前記予測処理を行う場合は、前記補正処理を行うか否かの判定結果を示す判定結果情報を復号化し、前記第２モードで前記予測処理を行う場合は、前記判定結果情報を復号化しなくてもよい。

【0031】

これにより、復号装置は、処理効率を向上させることができる。

【0032】

また、例えば、前記補正処理は、ＢＩＯ処理であってもよい。

【0033】

これにより、復号装置は、ブロック単位での動きベクトルを導出して生成された予測画像における微小単位の補正値を使って予測画像を補正することができる。

【0034】

また、例えば、前記第２のモードは、ＡＴＭＶＰモードであってもよい。

【0035】

これにより、復号装置は、ＡＴＭＶＰモードにおいて微小単位での動き補正処理を行う必要がないため、処理量が低減される。

【0036】

また、例えば、前記第２のモードは、ＳＴＭＶＰモードであってもよい。

【0037】

これにより、復号装置は、ＳＴＭＶＰモードにおいて微小単位での動き補正処理を行う必要がないため、処理量が低減される。

【0038】

また、例えば、前記第２のモードは、アフィンモードであってもよい。

【0039】

これにより、復号装置は、アフィンモードにおいて微小単位での動き補正を行う必要がないため、処理量が低減される。

【0040】

また、本開示の一態様に係る符号化方法は、予測処理を行って動画像を符号化する符号化方法であって、前記動画像におけるブロック単位の動きベクトルに基づき前記予測処理を行う第１のモード、及び、前記ブロックを分割したサブブロック単位の動きベクトルに基づき前記予測処理を行う第２のモードを含む複数のモードのうち、いずれのモードを用いて前記予測処理を行うかを決定し、前記第１のモードで前記予測処理を行う場合は、前記予測処理を行うことで得られる予測画像における画素値の空間的な勾配を用いて前記予測画像の補正処理を行うか否かを判定し、前記補正処理を行うと判定された場合に前記補正処理を行い、前記第２のモードで前記予測処理を行う場合は、前記補正処理を行わない符号化方法であってもよい。

【0041】

これにより、微小単位の動き補正処理を、ブロック単位の動き予測処理と併用するため、符号化効率が向上される。また、サブブロック単位の動き予測は、ブロック単位の動き予測よりも処理量が大きいため、符号化方法では、サブブロック単位の動き予測処理を行った場合、微小単位の動き補正を行わない。そのため、符号化方法によれば、微小単位の動き予測処理を、ブロック単位の動き予測処理を行う場合に対してのみ実行することにより、符号化効率を維持しつつ、処理量を低減することができる。したがって、符号化方法によれば、処理量の増加を抑制しつつ、より細分化された予測処理を行うことができる。

【0042】

また、本開示の一態様に係る復号方法は、予測処理を行って動画像を復号する復号方法であって、前記動画像におけるブロック単位の動きベクトルに基づき前記予測処理を行う第１のモード、及び、前記ブロックを分割したサブブロック単位の動きベクトルに基づき前記予測処理を行う第２のモードを含む複数のモードのうち、いずれのモードを用いて前記予測処理を行うかを決定し、前記第１のモードで前記予測処理を行う場合は、前記予測処理を行うことで得られる予測画像における画素値の空間的な勾配を用いて前記予測画像の補正処理を行うか否かを判定し、前記補正処理を行うと判定された場合に前記補正処理を行い、前記第２のモードで前記予測処理を行う場合は、前記補正処理を行わない復号方法であってもよい。

【0043】

これにより、微小単位の動き補正処理を、ブロック単位の動き予測処理と併用するため、符号化効率が向上される。また、サブブロック単位の動き予測は、ブロック単位の動き予測よりも処理量が大きいため、復号方法では、サブブロック単位の動き予測を行った場合、微小単位の動き補正を行わない。そのため、復号方法によれば、微小単位の動き予測処理を、ブロック単位の動き予測処理を行う場合に対してのみ実行することにより、符号化効率を維持しつつ、処理量を低減することができる。したがって、復号方法によれば、処理量の増加を抑制しつつ、より細分化された予測処理を行うことができる。

【0044】

また、例えば、本開示の一態様に係る符号化装置は、動画像を符号化する符号化装置であって、分割部と、イントラ予測部と、インター予測部と、変換部と、量子化部と、エントロピー符号化部と、ループフィルタ部とを備えてもよい。

【0045】

前記分割部は、前記動画像に含まれるピクチャを複数のブロックに分割してもよい。前記イントラ予測部は、前記複数のブロックに含まれるブロックに対してイントラ予測を行ってもよい。前記インター予測部は、前記ブロックに対してインター予測を行ってもよい。前記変換部は、前記イントラ予測又は前記インター予測によって得られる予測画像と、原画像との予測誤差を変換して変換係数を生成してもよい。前記量子化部は、前記変換係数を量子化して量子化係数を生成してもよい。前記エントロピー符号化部は、前記量子化係数を符号化して符号化ビットストリームを生成してもよい。前記ループフィルタ部は、前記予測画像を用いて生成される再構成画像にフィルタを適用してもよい。

【0046】

そして、例えば、前記インター予測部は、前記動画像におけるブロック単位の動きベクトルに基づき前記予測処理を行う第１のモード、及び、前記ブロックを分割したサブブロック単位の動きベクトルに基づき前記予測処理を行う第２のモードを含む複数のモードのうち、いずれのモードを用いて前記予測処理を行うかを決定し、前記第１のモードで前記予測処理を行う場合は、前記予測処理を行うことで得られる予測画像における画素値の空間的な勾配を用いて前記予測画像の補正処理を行うか否かを判定し、前記補正処理を行うと判定された場合に前記補正処理を行い、前記第２のモードで前記予測処理を行う場合は、前記補正処理を行わない。

【0047】

また、例えば、本開示の一態様に係る復号装置は、動画像を復号する復号装置であって、エントロピー復号部と、逆量子化部と、逆変換部と、イントラ予測部と、インター予測部と、ループフィルタ部とを備えてもよい。

【0048】

前記エントロピー復号部は、符号化ビットストリームからピクチャ内のブロックの量子化係数を復号してもよい。前記逆量子化部は、前記量子化係数を逆量子化して変換係数を取得してもよい。前記逆変換部は、前記変換係数を逆変換して予測誤差を取得してもよい。前記イントラ予測部は、前記ブロックに対してイントラ予測を行ってもよい。前記インター予測部は、前記ブロックに対してインター予測を行ってもよい。前記ループフィルタ部は、前記イントラ予測又は前記インター予測によって得られる予測画像と前記予測誤差とを用いて生成される再構成画像にフィルタを適用してもよい。

【0049】

【0050】

さらに、これらの包括的又は具体的な態様は、システム、装置、方法、集積回路、コンピュータプログラム、又は、コンピュータ読み取り可能なＣＤ－ＲＯＭなどの非一時的な記録媒体で実現されてもよく、システム、装置、方法、集積回路、コンピュータプログラム、及び、記録媒体の任意な組み合わせで実現されてもよい。

【0051】

以下、実施の形態について図面を参照しながら具体的に説明する。

【0052】

なお、以下で説明する実施の形態は、いずれも包括的または具体的な例を示すものである。以下の実施の形態で示される数値、形状、材料、構成要素、構成要素の配置位置及び接続形態、ステップ、ステップの順序などは、一例であり、請求の範囲を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。

【0053】

（実施の形態１）
まず、後述する本開示の各態様で説明する処理および／または構成を適用可能な符号化装置および復号化装置の一例として、実施の形態１の概要を説明する。ただし、実施の形態１は、本開示の各態様で説明する処理および／または構成を適用可能な符号化装置および復号化装置の一例にすぎず、本開示の各態様で説明する処理および／または構成は、実施の形態１とは異なる符号化装置および復号化装置においても実施可能である。

【0054】

実施の形態１に対して本開示の各態様で説明する処理および／または構成を適用する場合、例えば以下のいずれかを行ってもよい。

【0055】

（１）実施の形態１の符号化装置または復号化装置に対して、当該符号化装置または復号化装置を構成する複数の構成要素のうち、本開示の各態様で説明する構成要素に対応する構成要素を、本開示の各態様で説明する構成要素に置き換えること
（２）実施の形態１の符号化装置または復号化装置に対して、当該符号化装置または復号化装置を構成する複数の構成要素のうち一部の構成要素について機能または実施する処理の追加、置き換え、削除などの任意の変更を施した上で、本開示の各態様で説明する構成要素に対応する構成要素を、本開示の各態様で説明する構成要素に置き換えること
（３）実施の形態１の符号化装置または復号化装置が実施する方法に対して、処理の追加、および／または当該方法に含まれる複数の処理のうちの一部の処理について置き換え、削除などの任意の変更を施した上で、本開示の各態様で説明する処理に対応する処理を、本開示の各態様で説明する処理に置き換えること
（４）実施の形態１の符号化装置または復号化装置を構成する複数の構成要素のうちの一部の構成要素を、本開示の各態様で説明する構成要素、本開示の各態様で説明する構成要素が備える機能の一部を備える構成要素、または本開示の各態様で説明する構成要素が実施する処理の一部を実施する構成要素と組み合わせて実施すること
（５）実施の形態１の符号化装置または復号化装置を構成する複数の構成要素のうちの一部の構成要素が備える機能の一部を備える構成要素、または実施の形態１の符号化装置または復号化装置を構成する複数の構成要素のうちの一部の構成要素が実施する処理の一部を実施する構成要素を、本開示の各態様で説明する構成要素、本開示の各態様で説明する構成要素が備える機能の一部を備える構成要素、または本開示の各態様で説明する構成要素が実施する処理の一部を実施する構成要素と組み合わせて実施すること
（６）実施の形態１の符号化装置または復号化装置が実施する方法に対して、当該方法に含まれる複数の処理のうち、本開示の各態様で説明する処理に対応する処理を、本開示の各態様で説明する処理に置き換えること
（７）実施の形態１の符号化装置または復号化装置が実施する方法に含まれる複数の処理のうちの一部の処理を、本開示の各態様で説明する処理と組み合わせて実施すること

【0056】

なお、本開示の各態様で説明する処理および／または構成の実施の仕方は、上記の例に限定されるものではない。例えば、実施の形態１において開示する動画像／画像符号化装置または動画像／画像復号化装置とは異なる目的で利用される装置において実施されてもよいし、各態様において説明した処理および／または構成を単独で実施してもよい。また、異なる態様において説明した処理および／または構成を組み合わせて実施してもよい。

【0057】

［符号化装置の概要］
まず、実施の形態１に係る符号化装置の概要を説明する。図１は、実施の形態１に係る符号化装置１００の機能構成を示すブロック図である。符号化装置１００は、動画像／画像をブロック単位で符号化する動画像／画像符号化装置である。

【0058】

図１に示すように、符号化装置１００は、画像をブロック単位で符号化する装置であって、分割部１０２と、減算部１０４と、変換部１０６と、量子化部１０８と、エントロピー符号化部１１０と、逆量子化部１１２と、逆変換部１１４と、加算部１１６と、ブロックメモリ１１８と、ループフィルタ部１２０と、フレームメモリ１２２と、イントラ予測部１２４と、インター予測部１２６と、予測制御部１２８と、を備える。

【0059】

符号化装置１００は、例えば、汎用プロセッサ及びメモリにより実現される。この場合、メモリに格納されたソフトウェアプログラムがプロセッサにより実行されたときに、プロセッサは、分割部１０２、減算部１０４、変換部１０６、量子化部１０８、エントロピー符号化部１１０、逆量子化部１１２、逆変換部１１４、加算部１１６、ループフィルタ部１２０、イントラ予測部１２４、インター予測部１２６及び予測制御部１２８として機能する。また、符号化装置１００は、分割部１０２、減算部１０４、変換部１０６、量子化部１０８、エントロピー符号化部１１０、逆量子化部１１２、逆変換部１１４、加算部１１６、ループフィルタ部１２０、イントラ予測部１２４、インター予測部１２６及び予測制御部１２８に対応する専用の１以上の電子回路として実現されてもよい。

【0060】

以下に、符号化装置１００に含まれる各構成要素について説明する。

【0061】

［分割部］
分割部１０２は、入力動画像に含まれる各ピクチャを複数のブロックに分割し、各ブロックを減算部１０４に出力する。例えば、分割部１０２は、まず、ピクチャを固定サイズ（例えば１２８ｘ１２８）のブロックに分割する。この固定サイズのブロックは、符号化ツリーユニット（ＣＴＵ）と呼ばれることがある。そして、分割部１０２は、再帰的な四分木（ｑｕａｄｔｒｅｅ）及び／又は二分木（ｂｉｎａｒｙｔｒｅｅ）ブロック分割に基づいて、固定サイズのブロックの各々を可変サイズ（例えば６４ｘ６４以下）のブロックに分割する。この可変サイズのブロックは、符号化ユニット（ＣＵ）、予測ユニット（ＰＵ）あるいは変換ユニット（ＴＵ）と呼ばれることがある。なお、本実施の形態では、ＣＵ、ＰＵ及びＴＵは区別される必要はなく、ピクチャ内の一部又はすべてのブロックがＣＵ、ＰＵ、ＴＵの処理単位となってもよい。

【0062】

図２は、実施の形態１におけるブロック分割の一例を示す図である。図２において、実線は四分木ブロック分割によるブロック境界を表し、破線は二分木ブロック分割によるブロック境界を表す。

【0063】

ここでは、ブロック１０は、１２８ｘ１２８画素の正方形ブロック（１２８ｘ１２８ブロック）である。この１２８ｘ１２８ブロック１０は、まず、４つの正方形の６４ｘ６４ブロックに分割される（四分木ブロック分割）。

【0064】

左上の６４ｘ６４ブロックは、さらに２つの矩形の３２ｘ６４ブロックに垂直に分割され、左の３２ｘ６４ブロックはさらに２つの矩形の１６ｘ６４ブロックに垂直に分割される（二分木ブロック分割）。その結果、左上の６４ｘ６４ブロックは、２つの１６ｘ６４ブロック１１、１２と、３２ｘ６４ブロック１３とに分割される。

【0065】

右上の６４ｘ６４ブロックは、２つの矩形の６４ｘ３２ブロック１４、１５に水平に分割される（二分木ブロック分割）。

【0066】

左下の６４ｘ６４ブロックは、４つの正方形の３２ｘ３２ブロックに分割される（四分木ブロック分割）。４つの３２ｘ３２ブロックのうち左上のブロック及び右下のブロックはさらに分割される。左上の３２ｘ３２ブロックは、２つの矩形の１６ｘ３２ブロックに垂直に分割され、右の１６ｘ３２ブロックはさらに２つの１６ｘ１６ブロックに水平に分割される（二分木ブロック分割）。右下の３２ｘ３２ブロックは、２つの３２ｘ１６ブロックに水平に分割される（二分木ブロック分割）。その結果、左下の６４ｘ６４ブロックは、１６ｘ３２ブロック１６と、２つの１６ｘ１６ブロック１７、１８と、２つの３２ｘ３２ブロック１９、２０と、２つの３２ｘ１６ブロック２１、２２とに分割される。

【0067】

右下の６４ｘ６４ブロック２３は分割されない。

【0068】

以上のように、図２では、ブロック１０は、再帰的な四分木及び二分木ブロック分割に基づいて、１３個の可変サイズのブロック１１～２３に分割される。このような分割は、ＱＴＢＴ（ｑｕａｄ－ｔｒｅｅｐｌｕｓｂｉｎａｒｙｔｒｅｅ）分割と呼ばれることがある。

【0069】

なお、図２では、１つのブロックが４つ又は２つのブロックに分割されていたが（四分木又は二分木ブロック分割）、分割はこれに限定されない。例えば、１つのブロックが３つのブロックに分割されてもよい（三分木ブロック分割）。このような三分木ブロック分割を含む分割は、ＭＢＴ（ｍｕｌｔｉｔｙｐｅｔｒｅｅ）分割と呼ばれることがある。

【0070】

［減算部］
減算部１０４は、分割部１０２によって分割されたブロック単位で原信号（原サンプル）から予測信号（予測サンプル）を減算する。つまり、減算部１０４は、符号化対象ブロック（以下、カレントブロックという）の予測誤差（残差ともいう）を算出する。そして、減算部１０４は、算出された予測誤差を変換部１０６に出力する。

【0071】

原信号は、符号化装置１００の入力信号であり、動画像を構成する各ピクチャの画像を表す信号（例えば輝度（ｌｕｍａ）信号及び２つの色差（ｃｈｒｏｍａ）信号）である。以下において、画像を表す信号をサンプルともいうこともある。

【0072】

［変換部］
変換部１０６は、空間領域の予測誤差を周波数領域の変換係数に変換し、変換係数を量子化部１０８に出力する。具体的には、変換部１０６は、例えば空間領域の予測誤差に対して予め定められた離散コサイン変換（ＤＣＴ）又は離散サイン変換（ＤＳＴ）を行う。

【0073】

なお、変換部１０６は、複数の変換タイプの中から適応的に変換タイプを選択し、選択された変換タイプに対応する変換基底関数（ｔｒａｎｓｆｏｒｍｂａｓｉｓｆｕｎｃｔｉｏｎ）を用いて、予測誤差を変換係数に変換してもよい。このような変換は、ＥＭＴ（ｅｘｐｌｉｃｉｔｍｕｌｔｉｐｌｅｃｏｒｅｔｒａｎｓｆｏｒｍ）又はＡＭＴ（ａｄａｐｔｉｖｅｍｕｌｔｉｐｌｅｔｒａｎｓｆｏｒｍ）と呼ばれることがある。

【0074】

複数の変換タイプは、例えば、ＤＣＴ－ＩＩ、ＤＣＴ－Ｖ、ＤＣＴ－ＶＩＩＩ、ＤＳＴ－Ｉ及びＤＳＴ－ＶＩＩを含む。図３は、各変換タイプに対応する変換基底関数を示す表である。図３においてＮは入力画素の数を示す。これらの複数の変換タイプの中からの変換タイプの選択は、例えば、予測の種類（イントラ予測及びインター予測）に依存してもよいし、イントラ予測モードに依存してもよい。

【0075】

このようなＥＭＴ又はＡＭＴを適用するか否かを示す情報（例えばＡＭＴフラグと呼ばれる）及び選択された変換タイプを示す情報は、ＣＵレベルで信号化される。なお、これらの情報の信号化は、ＣＵレベルに限定される必要はなく、他のレベル（例えば、シーケンスレベル、ピクチャレベル、スライスレベル、タイルレベル又はＣＴＵレベル）であってもよい。

【0076】

また、変換部１０６は、変換係数（変換結果）を再変換してもよい。このような再変換は、ＡＳＴ（ａｄａｐｔｉｖｅｓｅｃｏｎｄａｒｙｔｒａｎｓｆｏｒｍ）又はＮＳＳＴ（ｎｏｎ－ｓｅｐａｒａｂｌｅｓｅｃｏｎｄａｒｙｔｒａｎｓｆｏｒｍ）と呼ばれることがある。例えば、変換部１０６は、イントラ予測誤差に対応する変換係数のブロックに含まれるサブブロック（例えば４ｘ４サブブロック）ごとに再変換を行う。ＮＳＳＴを適用するか否かを示す情報及びＮＳＳＴに用いられる変換行列に関する情報は、ＣＵレベルで信号化される。なお、これらの情報の信号化は、ＣＵレベルに限定される必要はなく、他のレベル（例えば、シーケンスレベル、ピクチャレベル、スライスレベル、タイルレベル又はＣＴＵレベル）であってもよい。

【0077】

ここで、Ｓｅｐａｒａｂｌｅな変換とは、入力の次元の数だけ方向ごとに分離して複数回変換を行う方式であり、Ｎｏｎ－Ｓｅｐａｒａｂｌｅな変換とは、入力が多次元であった際に２つ以上の次元をまとめて１次元とみなして、まとめて変換を行う方式である。

【0078】

例えば、Ｎｏｎ－Ｓｅｐａｒａｂｌｅな変換の１例として、入力が４×４のブロックであった場合にはそれを１６個の要素を持ったひとつの配列とみなし、その配列に対して１６×１６の変換行列で変換処理を行うようなものが挙げられる。

【0079】

また、同様に４×４の入力ブロックを１６個の要素を持ったひとつの配列とみなした後に、その配列に対してＧｉｖｅｎｓ回転を複数回行うようなもの（ＨｙｐｅｒｃｕｂｅＧｉｖｅｎｓＴｒａｎｓｆｏｒｍ）もＮｏｎ－Ｓｅｐａｒａｂｌｅな変換の例である。

【0080】

［量子化部］
量子化部１０８は、変換部１０６から出力された変換係数を量子化する。具体的には、量子化部１０８は、カレントブロックの変換係数を所定の走査順序で走査し、走査された変換係数に対応する量子化パラメータ（ＱＰ）に基づいて当該変換係数を量子化する。そして、量子化部１０８は、カレントブロックの量子化された変換係数（以下、量子化係数という）をエントロピー符号化部１１０及び逆量子化部１１２に出力する。

【0081】

所定の順序は、変換係数の量子化／逆量子化のための順序である。例えば、所定の走査順序は、周波数の昇順（低周波から高周波の順）又は降順（高周波から低周波の順）で定義される。

【0082】

量子化パラメータとは、量子化ステップ（量子化幅）を定義するパラメータである。例えば、量子化パラメータの値が増加すれば量子化ステップも増加する。つまり、量子化パラメータの値が増加すれば量子化誤差が増大する。

【0083】

［エントロピー符号化部］
エントロピー符号化部１１０は、量子化部１０８から入力である量子化係数を可変長符号化することにより符号化信号（符号化ビットストリーム）を生成する。具体的には、エントロピー符号化部１１０は、例えば、量子化係数を二値化し、二値信号を算術符号化する。

【0084】

［逆量子化部］
逆量子化部１１２は、量子化部１０８からの入力である量子化係数を逆量子化する。具体的には、逆量子化部１１２は、カレントブロックの量子化係数を所定の走査順序で逆量子化する。そして、逆量子化部１１２は、カレントブロックの逆量子化された変換係数を逆変換部１１４に出力する。

【0085】

［逆変換部］
逆変換部１１４は、逆量子化部１１２からの入力である変換係数を逆変換することにより予測誤差を復元する。具体的には、逆変換部１１４は、変換係数に対して、変換部１０６による変換に対応する逆変換を行うことにより、カレントブロックの予測誤差を復元する。そして、逆変換部１１４は、復元された予測誤差を加算部１１６に出力する。

【0086】

なお、復元された予測誤差は、量子化により情報が失われているので、減算部１０４が算出した予測誤差と一致しない。すなわち、復元された予測誤差には、量子化誤差が含まれている。

【0087】

［加算部］
加算部１１６は、逆変換部１１４からの入力である予測誤差と予測制御部１２８からの入力である予測サンプルとを加算することによりカレントブロックを再構成する。そして、加算部１１６は、再構成されたブロックをブロックメモリ１１８及びループフィルタ部１２０に出力する。再構成ブロックは、ローカル復号ブロックと呼ばれることもある。

【0088】

［ブロックメモリ］
ブロックメモリ１１８は、イントラ予測で参照されるブロックであって符号化対象ピクチャ（以下、カレントピクチャという）内のブロックを格納するための記憶部である。具体的には、ブロックメモリ１１８は、加算部１１６から出力された再構成ブロックを格納する。

【0089】

［ループフィルタ部］
ループフィルタ部１２０は、加算部１１６によって再構成されたブロックにループフィルタを施し、フィルタされた再構成ブロックをフレームメモリ１２２に出力する。ループフィルタとは、符号化ループ内で用いられるフィルタ（インループフィルタ）であり、例えば、デブロッキング・フィルタ（ＤＦ）、サンプルアダプティブオフセット（ＳＡＯ）及びアダプティブループフィルタ（ＡＬＦ）などを含む。

【0090】

ＡＬＦでは、符号化歪みを除去するための最小二乗誤差フィルタが適用され、例えばカレントブロック内の２ｘ２サブブロックごとに、局所的な勾配（ｇｒａｄｉｅｎｔ）の方向及び活性度（ａｃｔｉｖｉｔｙ）に基づいて複数のフィルタの中から選択された１つのフィルタが適用される。

【0091】

具体的には、まず、サブブロック（例えば２ｘ２サブブロック）が複数のクラス（例えば１５又は２５クラス）に分類される。サブブロックの分類は、勾配の方向及び活性度に基づいて行われる。例えば、勾配の方向値Ｄ（例えば０～２又は０～４）と勾配の活性値Ａ（例えば０～４）とを用いて分類値Ｃ（例えばＣ＝５Ｄ＋Ａ）が算出される。そして、分類値Ｃに基づいて、サブブロックが複数のクラス（例えば１５又は２５クラス）に分類される。

【0092】

勾配の方向値Ｄは、例えば、複数の方向（例えば水平、垂直及び２つの対角方向）の勾配を比較することにより導出される。また、勾配の活性値Ａは、例えば、複数の方向の勾配を加算し、加算結果を量子化することにより導出される。

【0093】

このような分類の結果に基づいて、複数のフィルタの中からサブブロックのためのフィルタが決定される。

【0094】

ＡＬＦで用いられるフィルタの形状としては例えば円対称形状が利用される。図４Ａ～図４Ｃは、ＡＬＦで用いられるフィルタの形状の複数の例を示す図である。図４Ａは、５ｘ５ダイヤモンド形状フィルタを示し、図４Ｂは、７ｘ７ダイヤモンド形状フィルタを示し、図４Ｃは、９ｘ９ダイヤモンド形状フィルタを示す。フィルタの形状を示す情報は、ピクチャレベルで信号化される。なお、フィルタの形状を示す情報の信号化は、ピクチャレベルに限定される必要はなく、他のレベル（例えば、シーケンスレベル、スライスレベル、タイルレベル、ＣＴＵレベル又はＣＵレベル）であってもよい。

【0095】

ＡＬＦのオン／オフは、例えば、ピクチャレベル又はＣＵレベルで決定される。例えば、輝度についてはＣＵレベルでＡＬＦを適用するか否かが決定され、色差についてはピクチャレベルでＡＬＦを適用するか否かが決定される。ＡＬＦのオン／オフを示す情報は、ピクチャレベル又はＣＵレベルで信号化される。なお、ＡＬＦのオン／オフを示す情報の信号化は、ピクチャレベル又はＣＵレベルに限定される必要はなく、他のレベル（例えば、シーケンスレベル、スライスレベル、タイルレベル又はＣＴＵレベル）であってもよい。

【0096】

選択可能な複数のフィルタ（例えば１５又は２５までのフィルタ）の係数セットは、ピクチャレベルで信号化される。なお、係数セットの信号化は、ピクチャレベルに限定される必要はなく、他のレベル（例えば、シーケンスレベル、スライスレベル、タイルレベル、ＣＴＵレベル、ＣＵレベル又はサブブロックレベル）であってもよい。

【0097】

［フレームメモリ］
フレームメモリ１２２は、インター予測に用いられる参照ピクチャを格納するための記憶部であり、フレームバッファと呼ばれることもある。具体的には、フレームメモリ１２２は、ループフィルタ部１２０によってフィルタされた再構成ブロックを格納する。

【0098】

［イントラ予測部］
イントラ予測部１２４は、ブロックメモリ１１８に格納されたカレントピクチャ内のブロックを参照してカレントブロックのイントラ予測（画面内予測ともいう）を行うことで、予測信号（イントラ予測信号）を生成する。具体的には、イントラ予測部１２４は、カレントブロックに隣接するブロックのサンプル（例えば輝度値、色差値）を参照してイントラ予測を行うことでイントラ予測信号を生成し、イントラ予測信号を予測制御部１２８に出力する。

【0099】

例えば、イントラ予測部１２４は、予め規定された複数のイントラ予測モードのうちの１つを用いてイントラ予測を行う。複数のイントラ予測モードは、１以上の非方向性予測モードと、複数の方向性予測モードと、を含む。

【0100】

１以上の非方向性予測モードは、例えばＨ．２６５／ＨＥＶＣ（Ｈｉｇｈ－ＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ）規格（非特許文献１）で規定されたＰｌａｎａｒ予測モード及びＤＣ予測モードを含む。

【0101】

複数の方向性予測モードは、例えばＨ．２６５／ＨＥＶＣ規格で規定された３３方向の予測モードを含む。なお、複数の方向性予測モードは、３３方向に加えてさらに３２方向の予測モード（合計で６５個の方向性予測モード）を含んでもよい。図５Ａは、イントラ予測における６７個のイントラ予測モード（２個の非方向性予測モード及び６５個の方向性予測モード）を示す図である。実線矢印は、Ｈ．２６５／ＨＥＶＣ規格で規定された３３方向を表し、破線矢印は、追加された３２方向を表す。

【0102】

なお、色差ブロックのイントラ予測において、輝度ブロックが参照されてもよい。つまり、カレントブロックの輝度成分に基づいて、カレントブロックの色差成分が予測されてもよい。このようなイントラ予測は、ＣＣＬＭ（ｃｒｏｓｓ－ｃｏｍｐｏｎｅｎｔｌｉｎｅａｒｍｏｄｅｌ）予測と呼ばれることがある。このような輝度ブロックを参照する色差ブロックのイントラ予測モード（例えばＣＣＬＭモードと呼ばれる）は、色差ブロックのイントラ予測モードの１つとして加えられてもよい。

【0103】

イントラ予測部１２４は、水平／垂直方向の参照画素の勾配に基づいてイントラ予測後の画素値を補正してもよい。このような補正をともなうイントラ予測は、ＰＤＰＣ（ｐｏｓｉｔｉｏｎｄｅｐｅｎｄｅｎｔｉｎｔｒａｐｒｅｄｉｃｔｉｏｎｃｏｍｂｉｎａｔｉｏｎ）と呼ばれることがある。ＰＤＰＣの適用の有無を示す情報（例えばＰＤＰＣフラグと呼ばれる）は、例えばＣＵレベルで信号化される。なお、この情報の信号化は、ＣＵレベルに限定される必要はなく、他のレベル（例えば、シーケンスレベル、ピクチャレベル、スライスレベル、タイルレベル又はＣＴＵレベル）であってもよい。

【0104】

［インター予測部］
インター予測部１２６は、フレームメモリ１２２に格納された参照ピクチャであってカレントピクチャとは異なる参照ピクチャを参照してカレントブロックのインター予測（画面間予測ともいう）を行うことで、予測信号（インター予測信号）を生成する。インター予測は、カレントブロック又はカレントブロック内のサブブロック（例えば４ｘ４ブロック）の単位で行われる。例えば、インター予測部１２６は、カレントブロック又はサブブロックについて参照ピクチャ内で動き探索（ｍｏｔｉｏｎｅｓｔｉｍａｔｉｏｎ）を行う。そして、インター予測部１２６は、動き探索により得られた動き情報（例えば動きベクトル）を用いて動き補償を行うことでカレントブロック又はサブブロックのインター予測信号を生成する。そして、インター予測部１２６は、生成されたインター予測信号を予測制御部１２８に出力する。

【0105】

動き補償に用いられた動き情報は信号化される。動きベクトルの信号化には、予測動きベクトル（ｍｏｔｉｏｎｖｅｃｔｏｒｐｒｅｄｉｃｔｏｒ）が用いられてもよい。つまり、動きベクトルと予測動きベクトルとの間の差分が信号化されてもよい。

【0106】

なお、動き探索により得られたカレントブロックの動き情報だけでなく、隣接ブロックの動き情報も用いて、インター予測信号が生成されてもよい。具体的には、動き探索により得られた動き情報に基づく予測信号と、隣接ブロックの動き情報に基づく予測信号と、を重み付け加算することにより、カレントブロック内のサブブロック単位でインター予測信号が生成されてもよい。このようなインター予測（動き補償）は、ＯＢＭＣ（ｏｖｅｒｌａｐｐｅｄｂｌｏｃｋｍｏｔｉｏｎｃｏｍｐｅｎｓａｔｉｏｎ）と呼ばれることがある。

【0107】

このようなＯＢＭＣモードでは、ＯＢＭＣのためのサブブロックのサイズを示す情報（例えばＯＢＭＣブロックサイズと呼ばれる）は、シーケンスレベルで信号化される。また、ＯＢＭＣモードを適用するか否かを示す情報（例えばＯＢＭＣフラグと呼ばれる）は、ＣＵレベルで信号化される。なお、これらの情報の信号化のレベルは、シーケンスレベル及びＣＵレベルに限定される必要はなく、他のレベル（例えばピクチャレベル、スライスレベル、タイルレベル、ＣＴＵレベル又はサブブロックレベル）であってもよい。

【0108】

ＯＢＭＣモードについて、より具体的に説明する。図５Ｂ及び図５Ｃは、ＯＢＭＣ処理による予測画像補正処理の概要を説明するためのフローチャート及び概念図である。

【0109】

まず、符号化対象ブロックに割り当てられた動きベクトル（ＭＶ）を用いて通常の動き補償による予測画像（Ｐｒｅｄ）を取得する。

【0110】

次に、符号化済みの左隣接ブロックの動きベクトル（ＭＶ＿Ｌ）を符号化対象ブロックに適用して予測画像（Ｐｒｅｄ＿Ｌ）を取得し、前記予測画像とＰｒｅｄ＿Ｌとを重みを付けて重ね合わせることで予測画像の１回目の補正を行う。

【0111】

同様に、符号化済みの上隣接ブロックの動きベクトル（ＭＶ＿Ｕ）を符号化対象ブロックに適用して予測画像（Ｐｒｅｄ＿Ｕ）を取得し、前記１回目の補正を行った予測画像とＰｒｅｄ＿Ｕとを重みを付けて重ね合わせることで予測画像の２回目の補正を行い、それを最終的な予測画像とする。

【0112】

なお、ここでは左隣接ブロックと上隣接ブロックを用いた２段階の補正の方法を説明したが、右隣接ブロックや下隣接ブロックを用いて２段階よりも多い回数の補正を行う構成とすることも可能である。

【0113】

なお、重ね合わせを行う領域はブロック全体の画素領域ではなく、ブロック境界近傍の一部の領域のみであってもよい。

【0114】

なお、ここでは１枚の参照ピクチャからの予測画像補正処理について説明したが、複数枚の参照ピクチャから予測画像を補正する場合も同様であり、各々の参照ピクチャから補正した予測画像を取得した後に、得られた予測画像をさらに重ね合わせることで最終的な予測画像とする。

【0115】

なお、前記処理対象ブロックは、予測ブロック単位であっても、予測ブロックをさらに分割したサブブロック単位であってもよい。

【0116】

ＯＢＭＣ処理を適用するかどうかの判定の方法として、例えば、ＯＢＭＣ処理を適用するかどうかを示す信号であるｏｂｍｃ＿ｆｌａｇを用いる方法がある。具体的な一例としては、符号化装置において、符号化対象ブロックが動きの複雑な領域に属しているかどうかを判定し、動きの複雑な領域に属している場合はｏｂｍｃ＿ｆｌａｇとして値１を設定してＯＢＭＣ処理を適用して符号化を行い、動きの複雑な領域に属していない場合はｏｂｍｃ＿ｆｌａｇとして値０を設定してＯＢＭＣ処理を適用せずに符号化を行う。一方、復号化装置では、ストリームに記述されたｏｂｍｃ＿ｆｌａｇを復号化することで、その値に応じてＯＢＭＣ処理を適用するかどうかを切替えて復号化を行う。

【0117】

なお、動き情報は信号化されずに、復号装置側で導出されてもよい。例えば、Ｈ．２６５／ＨＥＶＣ規格で規定されたマージモードが用いられてもよい。また例えば、復号装置側で動き探索を行うことにより動き情報が導出されてもよい。この場合、カレントブロックの画素値を用いずに動き探索が行われる。

【0118】

ここで、復号装置側で動き探索を行うモードについて説明する。この復号装置側で動き探索を行うモードは、ＰＭＭＶＤ（ｐａｔｔｅｒｎｍａｔｃｈｅｄｍｏｔｉｏｎｖｅｃｔｏｒｄｅｒｉｖａｔｉｏｎ）モード又はＦＲＵＣ（ｆｒａｍｅｒａｔｅｕｐ－ｃｏｎｖｅｒｓｉｏｎ）モードと呼ばれることがある。

【0119】

ＦＲＵＣ処理の一例を図５Ｄに示す。まず、カレントブロックに空間的又は時間的に隣接する符号化済みブロックの動きベクトルを参照して、各々が予測動きベクトルを有する複数の候補のリスト（マージリストと共通であってもよい）が生成される。次に、候補リストに登録されている複数の候補ＭＶの中からベスト候補ＭＶを選択する。例えば、候補リストに含まれる各候補の評価値が算出され、評価値に基づいて１つの候補が選択される。

【0120】

そして、選択された候補の動きベクトルに基づいて、カレントブロックのための動きベクトルが導出される。具体的には、例えば、選択された候補の動きベクトル（ベスト候補ＭＶ）がそのままカレントブロックのための動きベクトルとして導出される。また例えば、選択された候補の動きベクトルに対応する参照ピクチャ内の位置の周辺領域において、パターンマッチングを行うことにより、カレントブロックのための動きベクトルが導出されてもよい。すなわち、ベスト候補ＭＶの周辺の領域に対して同様の方法で探索を行い、さらに評価値が良い値となるＭＶがあった場合は、ベスト候補ＭＶを前記ＭＶに更新して、それをカレントブロックの最終的なＭＶとしてもよい。なお、当該処理を実施しない構成とすることも可能である。

【0121】

サブブロック単位で処理を行う場合も全く同様の処理としてもよい。

【0122】

なお、評価値は、動きベクトルに対応する参照ピクチャ内の領域と、所定の領域との間のパターンマッチングによって再構成画像の差分値を求めることにより算出される。なお、差分値に加えてそれ以外の情報を用いて評価値を算出してもよい。

【0123】

パターンマッチングとしては、第１パターンマッチング又は第２パターンマッチングが用いられる。第１パターンマッチング及び第２パターンマッチングは、それぞれ、バイラテラルマッチング（ｂｉｌａｔｅｒａｌｍａｔｃｈｉｎｇ）及びテンプレートマッチング（ｔｅｍｐｌａｔｅｍａｔｃｈｉｎｇ）と呼ばれることがある。

【0124】

第１パターンマッチングでは、異なる２つの参照ピクチャ内の２つのブロックであってカレントブロックの動き軌道（ｍｏｔｉｏｎｔｒａｊｅｃｔｏｒｙ）に沿う２つのブロックの間でパターンマッチングが行われる。したがって、第１パターンマッチングでは、上述した候補の評価値の算出のための所定の領域として、カレントブロックの動き軌道に沿う他の参照ピクチャ内の領域が用いられる。

【0125】

図６は、動き軌道に沿う２つのブロック間でのパターンマッチング（バイラテラルマッチング）の一例を説明するための図である。図６に示すように、第１パターンマッチングでは、カレントブロック（Ｃｕｒｂｌｏｃｋ）の動き軌道に沿う２つのブロックであって異なる２つの参照ピクチャ（Ｒｅｆ０、Ｒｅｆ１）内の２つのブロックのペアの中で最もマッチするペアを探索することにより２つの動きベクトル（ＭＶ０、ＭＶ１）が導出される。具体的には、カレントブロックに対して、候補ＭＶで指定された第１の符号化済み参照ピクチャ（Ｒｅｆ０）内の指定位置における再構成画像と、前記候補ＭＶを表示時間間隔でスケーリングした対称ＭＶで指定された第２の符号化済み参照ピクチャ（Ｒｅｆ１）内の指定位置における再構成画像との差分を導出し、得られた差分値を用いて評価値を算出する。複数の候補ＭＶの中で最も評価値が良い値となる候補ＭＶを最終ＭＶとして選択するとよい。

【0126】

連続的な動き軌道の仮定の下では、２つの参照ブロックを指し示す動きベクトル（ＭＶ０、ＭＶ１）は、カレントピクチャ（ＣｕｒＰｉｃ）と２つの参照ピクチャ（Ｒｅｆ０、Ｒｅｆ１）との間の時間的な距離（ＴＤ０、ＴＤ１）に対して比例する。例えば、カレントピクチャが時間的に２つの参照ピクチャの間に位置し、カレントピクチャから２つの参照ピクチャへの時間的な距離が等しい場合、第１パターンマッチングでは、鏡映対称な双方向の動きベクトルが導出される。

【0127】

第２パターンマッチングでは、カレントピクチャ内のテンプレート（カレントピクチャ内でカレントブロックに隣接するブロック（例えば上及び／又は左隣接ブロック））と参照ピクチャ内のブロックとの間でパターンマッチングが行われる。したがって、第２パターンマッチングでは、上述した候補の評価値の算出のための所定の領域として、カレントピクチャ内のカレントブロックに隣接するブロックが用いられる。

【0128】

図７は、カレントピクチャ内のテンプレートと参照ピクチャ内のブロックとの間でのパターンマッチング（テンプレートマッチング）の一例を説明するための図である。図７に示すように、第２パターンマッチングでは、カレントピクチャ（ＣｕｒＰｉｃ）内でカレントブロック（Ｃｕｒｂｌｏｃｋ）に隣接するブロックと最もマッチするブロックを参照ピクチャ（Ｒｅｆ０）内で探索することによりカレントブロックの動きベクトルが導出される。具体的には、カレントブロックに対して、左隣接および上隣接の両方もしくはどちらか一方の符号化済み領域の再構成画像と、候補ＭＶで指定された符号化済み参照ピクチャ（Ｒｅｆ０）内の同等位置における再構成画像との差分を導出し、得られた差分値を用いて評価値を算出し、複数の候補ＭＶの中で最も評価値が良い値となる候補ＭＶをベスト候補ＭＶとして選択するとよい。

【0129】

このようなＦＲＵＣモードを適用するか否かを示す情報（例えばＦＲＵＣフラグと呼ばれる）は、ＣＵレベルで信号化される。また、ＦＲＵＣモードが適用される場合（例えばＦＲＵＣフラグが真の場合）、パターンマッチングの方法（第１パターンマッチング又は第２パターンマッチング）を示す情報（例えばＦＲＵＣモードフラグと呼ばれる）がＣＵレベルで信号化される。なお、これらの情報の信号化は、ＣＵレベルに限定される必要はなく、他のレベル（例えば、シーケンスレベル、ピクチャレベル、スライスレベル、タイルレベル、ＣＴＵレベル又はサブブロックレベル）であってもよい。

【0130】

ここで、等速直線運動を仮定したモデルに基づいて動きベクトルを導出するモードについて説明する。このモードは、ＢＩＯ（ｂｉ－ｄｉｒｅｃｔｉｏｎａｌｏｐｔｉｃａｌｆｌｏｗ）モードと呼ばれることがある。

【0131】

図８は、等速直線運動を仮定したモデルを説明するための図である。図８において、（ｖ_ｘ，ｖ_ｙ）は、速度ベクトルを示し、τ_０、τ_１は、それぞれ、カレントピクチャ（ＣｕｒＰｉｃ）と２つの参照ピクチャ（Ｒｅｆ_０，Ｒｅｆ_１）との間の時間的な距離を示す。（ＭＶｘ_０，ＭＶｙ_０）は、参照ピクチャＲｅｆ_０に対応する動きベクトルを示し、（ＭＶｘ_１、ＭＶｙ_１）は、参照ピクチャＲｅｆ_１に対応する動きベクトルを示す。

【0132】

このとき速度ベクトル（ｖ_ｘ，ｖ_ｙ）の等速直線運動の仮定の下では、（ＭＶｘ_０，ＭＶｙ_０）及び（ＭＶｘ_１，ＭＶｙ_１）は、それぞれ、（ｖ_ｘτ_０，ｖ_ｙτ_０）及び（－ｖ_ｘτ_１，－ｖ_ｙτ_１）と表され、以下のオプティカルフロー等式（１）が成り立つ。

【0133】

【数1】

【0134】

ここで、Ｉ^（ｋ）は、動き補償後の参照画像ｋ（ｋ＝０，１）の輝度値を示す。このオプティカルフロー等式は、（i）輝度値の時間微分と、（ii）水平方向の速度及び参照画像の空間勾配の水平成分の積と、（iii）垂直方向の速度及び参照画像の空間勾配の垂直成分の積と、の和が、ゼロと等しいことを示す。このオプティカルフロー等式とエルミート補間（Ｈｅｒｍｉｔｅｉｎｔｅｒｐｏｌａｔｉｏｎ）との組み合わせに基づいて、マージリスト等から得られるブロック単位の動きベクトルが画素単位で補正される。

【0135】

なお、等速直線運動を仮定したモデルに基づく動きベクトルの導出とは異なる方法で、復号装置側で動きベクトルが導出されてもよい。例えば、複数の隣接ブロックの動きベクトルに基づいてサブブロック単位で動きベクトルが導出されてもよい。

【0136】

ここで、複数の隣接ブロックの動きベクトルに基づいてサブブロック単位で動きベクトルを導出するモードについて説明する。このモードは、アフィン動き補償予測（ａｆｆｉｎｅｍｏｔｉｏｎｃｏｍｐｅｎｓａｔｉｏｎｐｒｅｄｉｃｔｉｏｎ）モードと呼ばれることがある。

【0137】

図９Ａは、複数の隣接ブロックの動きベクトルに基づくサブブロック単位の動きベクトルの導出を説明するための図である。図９Ａにおいて、カレントブロックは、１６の４ｘ４サブブロックを含む。ここでは、隣接ブロックの動きベクトルに基づいてカレントブロックの左上角制御ポイントの動きベクトルｖ_０が導出され、隣接サブブロックの動きベクトルに基づいてカレントブロックの右上角制御ポイントの動きベクトルｖ_１が導出される。そして、２つの動きベクトルｖ_０及びｖ_１を用いて、以下の式（２）により、カレントブロック内の各サブブロックの動きベクトル（ｖ_ｘ，ｖ_ｙ）が導出される。

【0138】

【数2】

【0139】

ここで、ｘ及びｙは、それぞれ、サブブロックの水平位置及び垂直位置を示し、ｗは、予め定められた重み係数を示す。

【0140】

このようなアフィン動き補償予測モードでは、左上及び右上角制御ポイントの動きベクトルの導出方法が異なるいくつかのモードを含んでもよい。このようなアフィン動き補償予測モードを示す情報（例えばアフィンフラグと呼ばれる）は、ＣＵレベルで信号化される。なお、このアフィン動き補償予測モードを示す情報の信号化は、ＣＵレベルに限定される必要はなく、他のレベル（例えば、シーケンスレベル、ピクチャレベル、スライスレベル、タイルレベル、ＣＴＵレベル又はサブブロックレベル）であってもよい。

【0141】

［予測制御部］
予測制御部１２８は、イントラ予測信号及びインター予測信号のいずれかを選択し、選択した信号を予測信号として減算部１０４及び加算部１１６に出力する。

【0142】

ここで、マージモードにより符号化対象ピクチャの動きベクトルを導出する例を説明する。図９Ｂは、マージモードによる動きベクトル導出処理の概要を説明するための図である。

【0143】

まず、予測ＭＶの候補を登録した予測ＭＶリストを生成する。予測ＭＶの候補としては、符号化対象ブロックの空間的に周辺に位置する複数の符号化済みブロックが持つＭＶである空間隣接予測ＭＶ、符号化済み参照ピクチャにおける符号化対象ブロックの位置を投影した近辺のブロックが持つＭＶである時間隣接予測ＭＶ、空間隣接予測ＭＶと時間隣接予測ＭＶのＭＶ値を組合わせて生成したＭＶである結合予測ＭＶ、および値がゼロのＭＶであるゼロ予測ＭＶ等がある。

【0144】

次に、予測ＭＶリストに登録されている複数の予測ＭＶの中から１つの予測ＭＶを選択することで、符号化対象ブロックのＭＶとして決定する。

【0145】

さらに可変長符号化部では、どの予測ＭＶを選択したかを示す信号であるｍｅｒｇｅ＿ｉｄｘをストリームに記述して符号化する。

【0146】

なお、図９Ｂで説明した予測ＭＶリストに登録する予測ＭＶは一例であり、図中の個数とは異なる個数であったり、図中の予測ＭＶの一部の種類を含まない構成であったり、図中の予測ＭＶの種類以外の予測ＭＶを追加した構成であったりしてもよい。

【0147】

なお、マージモードにより導出した符号化対象ブロックのＭＶを用いて、後述するＤＭＶＲ処理を行うことによって最終的なＭＶを決定してもよい。

【0148】

ここで、ＤＭＶＲ処理を用いてＭＶを決定する例について説明する。

【0149】

図９Ｃは、ＤＭＶＲ処理の概要を説明するための概念図である。

【0150】

まず、処理対象ブロックに設定された最適ＭＶＰを候補ＭＶとして、前記候補ＭＶに従って、Ｌ０方向の処理済みピクチャである第１参照ピクチャ、およびＬ１方向の処理済みピクチャである第２参照ピクチャから参照画素をそれぞれ取得し、各参照画素の平均をとることでテンプレートを生成する。

【0151】

次に、前記テンプレートを用いて、第１参照ピクチャおよび第２参照ピクチャの候補ＭＶの周辺領域をそれぞれ探索し、最もコストが最小となるＭＶを最終的なＭＶとして決定する。なお、コスト値はテンプレートの各画素値と探索領域の各画素値との差分値およびＭＶ値等を用いて算出する。

【0152】

なお、符号化装置および復号化装置では、ここで説明した処理の概要は基本的に共通である。

【0153】

なお、ここで説明した処理そのものでなくても、候補ＭＶの周辺を探索して最終的なＭＶを導出することができる処理であれば、他の処理を用いてもよい。

【0154】

ここで、ＬＩＣ処理を用いて予測画像を生成するモードについて説明する。

【0155】

図９Ｄは、ＬＩＣ処理による輝度補正処理を用いた予測画像生成方法の概要を説明するための図である。

【0156】

まず、符号化済みピクチャである参照ピクチャから符号化対象ブロックに対応する参照画像を取得するためのＭＶを導出する。

【0157】

次に、符号化対象ブロックに対して、左隣接および上隣接の符号化済み周辺参照領域の輝度画素値と、ＭＶで指定された参照ピクチャ内の同等位置における輝度画素値とを用いて、参照ピクチャと符号化対象ピクチャとで輝度値がどのように変化したかを示す情報を抽出して輝度補正パラメータを算出する。

【0158】

ＭＶで指定された参照ピクチャ内の参照画像に対して前記輝度補正パラメータを用いて輝度補正処理を行うことで、符号化対象ブロックに対する予測画像を生成する。

【0159】

なお、図９Ｄにおける前記周辺参照領域の形状は一例であり、これ以外の形状を用いてもよい。

【0160】

また、ここでは１枚の参照ピクチャから予測画像を生成する処理について説明したが、複数枚の参照ピクチャから予測画像を生成する場合も同様であり、各々の参照ピクチャから取得した参照画像に同様の方法で輝度補正処理を行ってから予測画像を生成する。

【0161】

ＬＩＣ処理を適用するかどうかの判定の方法として、例えば、ＬＩＣ処理を適用するかどうかを示す信号であるｌｉｃ＿ｆｌａｇを用いる方法がある。具体的な一例としては、符号化装置において、符号化対象ブロックが輝度変化が発生している領域に属しているかどうかを判定し、輝度変化が発生している領域に属している場合はｌｉｃ＿ｆｌａｇとして値１を設定してＬＩＣ処理を適用して符号化を行い、輝度変化が発生している領域に属していない場合はｌｉｃ＿ｆｌａｇとして値０を設定してＬＩＣ処理を適用せずに符号化を行う。一方、復号化装置では、ストリームに記述されたｌｉｃ＿ｆｌａｇを復号化することで、その値に応じてＬＩＣ処理を適用するかどうかを切替えて復号化を行う。

【0162】

ＬＩＣ処理を適用するかどうかの判定の別の方法として、例えば、周辺ブロックでＬＩＣ処理を適用したかどうかに従って判定する方法もある。具体的な一例としては、符号化対象ブロックがマージモードであった場合、マージモード処理におけるＭＶの導出の際に選択した周辺の符号化済みブロックがＬＩＣ処理を適用して符号化したかどうかを判定し、その結果に応じてＬＩＣ処理を適用するかどうかを切替えて符号化を行う。なお、この例の場合、復号化における処理も全く同様となる。

【0163】

［復号装置の概要］
次に、上記の符号化装置１００から出力された符号化信号（符号化ビットストリーム）を復号可能な復号装置の概要について説明する。図１０は、実施の形態１に係る復号装置２００の機能構成を示すブロック図である。復号装置２００は、動画像／画像をブロック単位で復号する動画像／画像復号装置である。

【0164】

図１０に示すように、復号装置２００は、エントロピー復号部２０２と、逆量子化部２０４と、逆変換部２０６と、加算部２０８と、ブロックメモリ２１０と、ループフィルタ部２１２と、フレームメモリ２１４と、イントラ予測部２１６と、インター予測部２１８と、予測制御部２２０と、を備える。

【0165】

復号装置２００は、例えば、汎用プロセッサ及びメモリにより実現される。この場合、メモリに格納されたソフトウェアプログラムがプロセッサにより実行されたときに、プロセッサは、エントロピー復号部２０２、逆量子化部２０４、逆変換部２０６、加算部２０８、ループフィルタ部２１２、イントラ予測部２１６、インター予測部２１８及び予測制御部２２０として機能する。また、復号装置２００は、エントロピー復号部２０２、逆量子化部２０４、逆変換部２０６、加算部２０８、ループフィルタ部２１２、イントラ予測部２１６、インター予測部２１８及び予測制御部２２０に対応する専用の１以上の電子回路として実現されてもよい。

【0166】

以下に、復号装置２００に含まれる各構成要素について説明する。

【0167】

［エントロピー復号部］
エントロピー復号部２０２は、符号化ビットストリームをエントロピー復号する。具体的には、エントロピー復号部２０２は、例えば、符号化ビットストリームから二値信号に算術復号する。そして、エントロピー復号部２０２は、二値信号を多値化（ｄｅｂｉｎａｒｉｚｅ）する。これにより、エントロピー復号部２０２は、ブロック単位で量子化係数を逆量子化部２０４に出力する。

【0168】

［逆量子化部］
逆量子化部２０４は、エントロピー復号部２０２からの入力である復号対象ブロック（以下、カレントブロックという）の量子化係数を逆量子化する。具体的には、逆量子化部２０４は、カレントブロックの量子化係数の各々について、当該量子化係数に対応する量子化パラメータに基づいて当該量子化係数を逆量子化する。そして、逆量子化部２０４は、カレントブロックの逆量子化された量子化係数（つまり変換係数）を逆変換部２０６に出力する。

【0169】

［逆変換部］
逆変換部２０６は、逆量子化部２０４からの入力である変換係数を逆変換することにより予測誤差を復元する。

【0170】

例えば符号化ビットストリームから読み解かれた情報がＥＭＴ又はＡＭＴを適用することを示す場合（例えばＡＭＴフラグが真）、逆変換部２０６は、読み解かれた変換タイプを示す情報に基づいてカレントブロックの変換係数を逆変換する。

【0171】

また例えば、符号化ビットストリームから読み解かれた情報がＮＳＳＴを適用することを示す場合、逆変換部２０６は、変換係数に逆再変換を適用する。

【0172】

［加算部］
加算部２０８は、逆変換部２０６からの入力である予測誤差と予測制御部２２０からの入力である予測サンプルとを加算することによりカレントブロックを再構成する。そして、加算部２０８は、再構成されたブロックをブロックメモリ２１０及びループフィルタ部２１２に出力する。

【0173】

［ブロックメモリ］
ブロックメモリ２１０は、イントラ予測で参照されるブロックであって復号対象ピクチャ（以下、カレントピクチャという）内のブロックを格納するための記憶部である。具体的には、ブロックメモリ２１０は、加算部２０８から出力された再構成ブロックを格納する。

【0174】

［ループフィルタ部］
ループフィルタ部２１２は、加算部２０８によって再構成されたブロックにループフィルタを施し、フィルタされた再構成ブロックをフレームメモリ２１４及び表示装置等に出力する。

【0175】

符号化ビットストリームから読み解かれたＡＬＦのオン／オフを示す情報がＡＬＦのオンを示す場合、局所的な勾配の方向及び活性度に基づいて複数のフィルタの中から１つのフィルタが選択され、選択されたフィルタが再構成ブロックに適用される。

【0176】

［フレームメモリ］
フレームメモリ２１４は、インター予測に用いられる参照ピクチャを格納するための記憶部であり、フレームバッファと呼ばれることもある。具体的には、フレームメモリ２１４は、ループフィルタ部２１２によってフィルタされた再構成ブロックを格納する。

【0177】

［イントラ予測部］
イントラ予測部２１６は、符号化ビットストリームから読み解かれたイントラ予測モードに基づいて、ブロックメモリ２１０に格納されたカレントピクチャ内のブロックを参照してイントラ予測を行うことで、予測信号（イントラ予測信号）を生成する。具体的には、イントラ予測部２１６は、カレントブロックに隣接するブロックのサンプル（例えば輝度値、色差値）を参照してイントラ予測を行うことでイントラ予測信号を生成し、イントラ予測信号を予測制御部２２０に出力する。

【0178】

なお、色差ブロックのイントラ予測において輝度ブロックを参照するイントラ予測モードが選択されている場合は、イントラ予測部２１６は、カレントブロックの輝度成分に基づいて、カレントブロックの色差成分を予測してもよい。

【0179】

また、符号化ビットストリームから読み解かれた情報がＰＤＰＣの適用を示す場合、イントラ予測部２１６は、水平／垂直方向の参照画素の勾配に基づいてイントラ予測後の画素値を補正する。

【0180】

［インター予測部］
インター予測部２１８は、フレームメモリ２１４に格納された参照ピクチャを参照して、カレントブロックを予測する。予測は、カレントブロック又はカレントブロック内のサブブロック（例えば４ｘ４ブロック）の単位で行われる。例えば、インター予測部２１８は、符号化ビットストリームから読み解かれた動き情報（例えば動きベクトル）を用いて動き補償を行うことでカレントブロック又はサブブロックのインター予測信号を生成し、インター予測信号を予測制御部２２０に出力する。

【0181】

なお、符号化ビットストリームから読み解かれた情報がＯＢＭＣモードを適用することを示す場合、インター予測部２１８は、動き探索により得られたカレントブロックの動き情報だけでなく、隣接ブロックの動き情報も用いて、インター予測信号を生成する。

【0182】

また、符号化ビットストリームから読み解かれた情報がＦＲＵＣモードを適用することを示す場合、インター予測部２１８は、符号化ストリームから読み解かれたパターンマッチングの方法（バイラテラルマッチング又はテンプレートマッチング）に従って動き探索を行うことにより動き情報を導出する。そして、インター予測部２１８は、導出された動き情報を用いて動き補償を行う。

【0183】

また、インター予測部２１８は、ＢＩＯモードが適用される場合に、等速直線運動を仮定したモデルに基づいて動きベクトルを導出する。また、符号化ビットストリームから読み解かれた情報がアフィン動き補償予測モードを適用することを示す場合には、インター予測部２１８は、複数の隣接ブロックの動きベクトルに基づいてサブブロック単位で動きベクトルを導出する。

【0184】

［予測制御部］
予測制御部２２０は、イントラ予測信号及びインター予測信号のいずれかを選択し、選択した信号を予測信号として加算部２０８に出力する。

【0185】

［インター予測処理の詳細］
次に、インター予測処理の詳細を説明する。

【0186】

例えば、符号化装置１００において、インター予測部１２６は、動画像におけるブロック単位の動きベクトルに基づき予測処理を行う第１のモード、及び、ブロックを分割したサブブロック単位の動きベクトルに基づき予測処理を行う第２のモードを含む複数のモードのうち、いずれのモードを用いて予測処理を行うかを決定する。そして、インター予測部１２６は、第１のモードで予測処理を行う場合は、予測処理を行うことで得られる予測画像における画素値の空間的な勾配を用いて予測画像の補正処理を行うか否かを判定し、補正処理を行うと判定された場合に補正処理を行う。一方、インター予測部１２６は、第２のモードで予測処理を行う場合は、補正処理を行わない。

【0187】

そして、インター予測部１２６は、上記の予測処理に基づいて、符号化対象ＣＵの予測サンプルセットを導出する。その後、減算部１０４、変換部１０６、量子化部１０８及びエントロピー符号化部１１０等が、予測サンプルセットを用いて、符号化対象ＣＵを符号化する。

【0188】

また、復号装置２００におけるインター予測処理も符号化装置１００におけるインター予測処理と同様である。例えば、復号装置２００において、インター予測部２１８は、動画像におけるブロック単位の動きベクトルに基づき予測処理を行う第１のモード、及び、ブロックを分割したサブブロック単位の動きベクトルに基づき予測処理を行う第２のモードを含む複数のモードのうち、いずれのモードを用いて予測処理を行うかを決定する。そして、インター予測部１２６は、第１のモードで予測処理を行う場合は、予測処理を行うことで得られる予測画像における画素値の空間的な勾配を用いて予測画像の補正処理を行うか否かを判定し、補正処理を行うと判定された場合に補正処理を行う。一方、インター予測部１２６は、第２のモードで予測処理を行う場合は、補正処理を行わない。なお、復号装置２００において、インター予測部２１８は、第１のモードで予測処理を行う場合は、符号化装置１００において予測処理を行うことで得られる予測画像における画素値の空間的な勾配を用いて予測画像の補正処理を行うか否かの判定結果を示す判定結果情報を用いて、補正処理を行うか否かを判定する。

【0189】

そして、インター予測部２１８は、上記の予測処理に基づいて、符号化対象ＣＵの予測サンプルセットを導出する。その後、エントロピー復号部２０２、逆量子化部２０４、逆変換部２０６及び加算部２０８等が、予測サンプルセットを用いて、符号化対象ＣＵを復号する。

【0190】

以下、インター予測処理の詳細をより具体的に説明する。

【0191】

図１１は、第１態様において符号化装置１００及び復号装置２００が行う動作の一例を示すフローチャートである。

【0192】

以下、符号化装置１００が行う動作として説明を行うが、復号装置２００が行う動作も、符号化装置１００が行う動作と同様である。また、インター予測に関連する処理は、符号化装置１００において主にインター予測部１２６によって行われ、復号装置２００において主にインター予測部２１８によって行われる。

【0193】

図１１に示すように、第１態様における符号化装置のインター予測部１２６の動作は、マージモードの動作に特徴を有する。インター予測では、符号化対象ＣＵに対応する候補ＭＶをＣＵ単位で生成するモード（いわゆる、第１のモード）と、ＣＵをＮｘＮブロック毎に分割したサブＣＵ単位で候補ＭＶを生成するモード（いわゆる、第２のモード）とがある。サブＣＵ単位で候補ＭＶを生成するモード（第２のモード）では、サブＣＵ単位で動き予測を行い、後段で画素単位の動き予測は行わない。言い換えると、第２のモードでは、サブブロック単位でＭＶを導出し、導出したＭＶを用いてサブブロック単位で動き補償処理（ＭＣ処理）を行うことで予測画像を生成した後、当該予測画像を画素単位で補正しない。そのため、第２のモードで符号化対象ＣＵを符号化する場合は、予測画像において画素単位での動き補正処理を行うか否かに関する判定結果情報（例えば、フラグと呼ばれる）を符号化しなくてもよい。

【0194】

一方で、ＣＵ単位で候補ＭＶを生成するモード（第１のモード）では、ＣＵ単位で動き予測を行った後に、画素単位での動き予測を実施してＣＵ単位の動き予測結果を画素単位で補正する。言い換えると、第１のモードでは、ブロック単位でＭＶを導出し、導出したＭＶを用いてブロック単位で動き補償処理（ＭＣ処理）を行うことで予測画像を生成した後、当該予測画像における画素値の空間的な勾配を用いて予測画像の補正処理を行う。ここで、画素単位での動き予測を実施するかどうかは選択可能な構成としてもよい。そのため、第１のモードで符号化対象ＣＵを符号化する場合は、予測画像において画素単位での動き補正処理を行うか否かに関するフラグを符号化してもよい。また、ＣＵはＭｘＮなど非正方形であってもよいし、サブＣＵはＣＵを任意形状に分割した単位であってもよい。画素単位での動き補正処理としては、例えば、ＢＩＯ（Ｂｉ－ｄｉｒｅｃｔｉｏｎａｌｏｐｔｉｃａｌｆｌｏｗ）などの手法を用いることができる。なお、画素単位での動き補正処理は、画素毎に行われてもよく、複数画素単位で補正されてもよい。例えば、複数画素単位は、ブロック単位でもサブブロック単位でもよい。

【0195】

単位画素での動き予測は、ＣＵ単位の動き予測との併用による符号化効率の向上効果が大きい。サブＣＵ単位の動き予測はＣＵ単位の動き予測よりも処理量が大きく、第１態様の符号化装置１００のインター予測処理によれば、画素単位での動き予測をＣＵ単位の動き予測に対してのみ実施可能とすることで、符号化効率を維持しつつ、マージモードの処理量を低減できる可能性がある。

【0196】

以下、図１１を参照しながら、符号化装置１００の動作例について、より具体的に説明する。

【0197】

符号化装置１００は、マージモードを用いて動き予測が行われない場合（Ｓ１００でＮｏ）、マージモードと異なる所定のモードを用いて動き予測を行う（Ｓ１０５）。マージモードと異なるモードは、例えば、候補ＭＶとＭＶとの差分を導出するノーマルインターモードであってもよい。

【0198】

一方、符号化装置１００は、マージモードを用いて動き予測が行われる場合（Ｓ１００でＹｅｓ）、候補ＭＶをサブＣＵ単位で生成するとき（Ｓ１０１でＹｅｓ）、サブＣＵ毎の候補ＭＶに基づきサブＣＵ単位で動き予測を行う（Ｓ１０２）。

【0199】

また、符号化装置１００は、マージモードを用いて動き予測が行われる場合（Ｓ１００でＹｅｓ）、候補ＭＶをサブＣＵ単位で生成しないとき（Ｓ１０１でＮｏ）、ＣＵ毎の候補ＭＶに基づきＣＵ単位で動き予測を行う（Ｓ１０３）。次いで、符号化装置１００は、ＣＵ単位での動き補正を行うか否かを判定する（不図示）。符号化装置１００は、画素単位での動き補正を行うと判定した場合（不図示）、画素単位での動き補正を行う（Ｓ１０４）。一方、符号化装置１００は、画素単位での動き補正を行わないと判定した場合（不図示）、画素単位での動き補正を行わない（不図示）。なお、符号化装置１００は、画素単位での動き補正が行われるか否かに関する判定結果情報を符号化してもよい。

【0200】

図１２は、第１態様において符号化装置１００及び復号装置２００が行う動作の他の例を示すフローチャートである。図１１では、マージモードにおいて画素単位の動き予測を行ってよいかどうかを切り替える方法を説明したが、マージモードに限定されない。例えば、図１２のような動作フローで、符号化装置１００は、画素単位での動き予測処理の実行可否を切り替えてもよい。また、ＦＲＵＣにおいて、ＣＵ単位の動き検索のみ行う場合には、画素単位の動き予測を実施可能とし、サブＣＵ単位の動き検索まで行う場合には、画素単位の動き予測を実施可能としてもよい。また、サブＣＵ単位の動き予測処理の後に、ＣＵ単位の動き予測の後段で実施する画素単位での動き予測処理よりも低処理な動き予測処理を実施して予測画像における動きを補正してもよい。

【0201】

図１２に示すように、符号化装置１００は、候補ＭＶをサブＣＵ単位で生成するか否かを判定する（Ｓ１０１）。符号化装置１００は、候補ＭＶをサブＣＵ単位で生成すると判定された場合（Ｓ１０１でＹｅｓ）、サブＣＵ毎の候補ＭＶに基づきサブＣＵ単位で動き予測を行う（Ｓ１０２）。サブＣＵ単位で動き予測を行う方法として、例えば、マージモードに基づく方法及びアフィンモードに基づく方法などが挙げられる。また、マージモードには、ＡＴＭＶＰモード及びＳＴＭＶＰモードが含まれる。ＡＴＭＶＰモード及びＳＴＭＶＰモードの詳細については、後述する。

【0202】

一方、符号化装置１００は、候補ＭＶをサブＣＵ単位で生成しないと判定された場合（Ｓ１０１でＮｏ）、ＣＵ毎の候補ＭＶに基づきＣＵ単位で動き予測を行う（Ｓ１０３）。ＣＵ単位で動き予測を行う方法としては、例えば、ノーマルインターモードに基づく方法、マージモードに基づく方法、及び、アフィンモードに基づく方法などが挙げられる。

【0203】

次いで、符号化装置１００は、ＣＵ単位での動き補正を行うか否かを判定する（不図示）。符号化装置１００は、画素単位での動き補正を行うと判定した場合（不図示）、画素単位での動き補正を行う（Ｓ１０４）。一方、符号化装置１００は、画素単位での動き補正を行わないと判定した場合（不図示）、画素単位での動き補正を行わない（不図示）。なお、符号化装置１００は、画素単位での動き補正が行われるか否かに関する判定結果情報を符号化してもよい。

【0204】

以上では、符号化方法の動作例を示したが、復号時も同様に動作でき、サブＣＵ毎の候補ＭＶに基づきサブＣＵ単位で動き予測を行う際には、画素単位の動き補正を行わない。言い換えると、候補ＭＶをＣＵ単位で生成する場合（つまり、第１のモードの場合）、動き補正（いわゆる、補正処理）を許容し、候補ＭＶをサブＣＵ単位で生成する場合（つまり、第２のモードの場合）、動き補正（いわゆる、補正処理）を禁止する。復号装置２００は、候補ＭＶをＣＵ単位で生成する場合、符号化装置１００が判定した判定結果情報を用いて画素単位での動き補正を行うか否かを判定する。なお、復号装置２００では、画素単位での動き補正が行われるか否かに関する判定結果情報を復号してもよい。

【0205】

続いて、サブＣＵ単位でＭＶを決定するモードの一例として、ＡＴＭＶＰモード及びＳＴＭＶＰモードにおけるサブＣＵ単位のＭＶ（ｓｕｂ－ＣＵＭＶ：サブブロック単位の動きベクトル）の決定方法について説明する。なお、上述の通り、ＡＴＭＶＰモード及びＳＴＭＶＰモードは、予測動きベクトルを動きベクトルとして用いるモードであるマージモードに含まれる。マージモードでは、処理済みブロックを参照して生成したＭＶ候補リストの中から１つの候補ＭＶを選択して符号化対象ブロックのＭＶを決定する。このＭＶ候補リストに登録するモードとしてＡＴＭＶＰモードとＳＴＭＶＰモードとがある。

【0206】

図１３は、ＡＴＭＶＰモードにおけるサブブロック単位の動きベクトルの決定方法の一例を示す図である。まず、符号化対象ＣＵ（図１３の対象ＣＵ）に隣接するＣＵのＭＶから、符号化対象ＣＵに対する時間ＭＶを選択する。時間ＭＶは、マージ候補となるブロックから選択でき、例えば、インデックス番号が小さいマージ候補から順に検索し、利用可能なマージ候補のブロックのＭＶを、符号化対象ＣＵの時間ＭＶとする。次に、時間ＭＶに従って参照ピクチャ内での参照ＣＵの位置を決定し、参照ＣＵにおけるサブＣＵ単位のＭＶを取得する。そして、取得した参照ＣＵ内のサブＣＵ単位のＭＶを、対象ＣＵにおいて当該サブＣＵに対応するサブＣＵ単位のＭＶ（以下、対象ＣＵのサブＣＵ単位のＭＶともいう）として使用する。参照ＣＵ内のサブＣＵが複数のＭＶ（Ｌ０，Ｌ１）を有する場合には、参照先のピクチャが取得できる場合には、複数のＭＶ（Ｌ０，Ｌ１）を対象ＣＵのサブＣＵ単位のＭＶとして利用する。ここでは、符号化における処理について説明したが、復号化においても同様の処理となる。

【0207】

図１４は、ＳＴＭＶＰモードにおけるサブブロック単位の動きベクトルの決定方法の一例を示す図である。ＳＴＭＶＰモードでは、サブＣＵ単位で、空間的に隣接するＮ×ＮブロックのＭＶと時間的に異なる参照ピクチャから取得したＭＶとを平均化、あるいは、重みづけ加算するなどしてサブブロック単位の動きベクトルを決定する。より具体的には、ＳＴＭＶＰモードでは、まず、符号化済みの参照ピクチャにおいて符号化対象ブロックと同じ位置にある時間ＭＶ参照ブロックを特定する。次に、符号化対象ブロック内における各サブブロックについて、空間的に上に隣接するブロックのＭＶと、空間的に左に隣接するブロックのＭＶと、時間ＭＶ参照ブロックを符号化した際に用いられたＭＶとを特定する。そして、これらのＭＶを時間間隔に応じてスケーリングした値の平均を算出することで、各サブブロックのＭＶを取得する。

【0208】

図１４の例では、ＡのサブＣＵは、空間的に上に隣接するブロック（ｃあるいはｄ）および空間的に左に隣接するブロック（ｂあるいはａ）のＭＶに基づいて空間ＭＶを、参照ピクチャ内でＤのサブＣＵと同一位置にある（Ｃｏ－ｌｏｃａｔｅｄ）Ｎ×ＮブロックのＭＶに基づいて時間ＭＶを、それぞれ決定し、空間ＭＶと時間ＭＶとを平均化してＡのサブＣＵのＭＶとすることができる。ここで、Ｂ、Ｃ、ＤなどのサブＣＵでは、符号化あるいは復号処理済みのサブＣＵのＭＶを用いて空間ＭＶを決定できる。例えば、ＢのサブＣＵでは、空間的に左に隣接するブロックとしてＡのサブＣＵが利用できる。ここでは、符号化における処理について説明したが、復号化においても同様の処理となる。

【0209】

［実装例］
図１５は、符号化装置１００の実装例を示すブロック図である。符号化装置１００は、回路１６０及びメモリ１６２を備える。例えば、図１に示された符号化装置１００の複数の構成要素は、図１５に示された回路１６０及びメモリ１６２によって実装される。

【0210】

回路１６０は、メモリ１６２にアクセス可能な電子回路であって、情報処理を行う。例えば、回路１６０は、メモリ１６２を用いて動画像を符号化する専用又は汎用の電子回路である。回路１６０は、ＣＰＵのようなプロセッサであってもよい。また、回路１６０は、複数の電子回路の集合体であってもよい。

【0211】

また、例えば、回路１６０は、図１に示された符号化装置１００の複数の構成要素のうち、情報を記憶するための構成要素を除く、複数の構成要素の役割を果たしてもよい。すなわち、回路１６０は、これらの構成要素の動作として上述された動作を行ってもよい。

【0212】

メモリ１６２は、回路１６０が動画像を符号化するための情報が記憶される専用又は汎用のメモリである。メモリ１６２は、電子回路であってもよく、回路１６０に接続されていてもよいし、回路１６０に含まれていてもよい。

【0213】

また、メモリ１６２は、複数の電子回路の集合体であってもよいし、複数のサブメモリで構成されていてもよい。また、メモリ１６２は、磁気ディスク又は光ディスク等であってもよいし、ストレージ又は記録媒体等と表現されてもよい。また、メモリ１６２は、不揮発性メモリでもよいし、揮発性メモリでもよい。

【0214】

例えば、メモリ１６２は、図１に示された符号化装置１００の複数の構成要素のうち、情報を記憶するための構成要素の役割を果たしてもよい。具体的には、メモリ１６２は、図１に示されたブロックメモリ１１８及びフレームメモリ１２２の役割を果たしてもよい。

【0215】

また、メモリ１６２には、符号化される動画像が記憶されてもよいし、符号化された動画像に対応するビット列が記憶されてもよい。また、メモリ１６２には、回路１６０が動画像を符号化するためのプログラムが記憶されていてもよい。

【0216】

なお、符号化装置１００において、図１に示された複数の構成要素の全てが実装されなくてもよいし、上述された複数の処理の全てが行われなくてもよい。図１に示された複数の構成要素の一部は、他の装置に含まれていてもよいし、上述された複数の処理の一部は、他の装置によって実行されてもよい。そして、符号化装置１００において、図１に示された複数の構成要素のうちの一部が実装され、上述された複数の処理の一部が行われることによって、処理量の増加を抑制しつつ、より細分化された予測処理を行うことができる。

【0217】

図１６は、図１５に示された符号化装置１００の動作例を示すフローチャートである。例えば、図１５に示された符号化装置１００は、動画像を符号化する際に、図１６に示された動作を行う。具体的には、回路１６０は、メモリ１６２を用いて、以下の動作を行う。

【0218】

まず、回路１６０は、動画像におけるブロック単位の動きベクトルに基づき予測処理を行う第１のモード、及び、ブロックを分割したサブブロック単位の動きベクトルに基づき予測処理を行う第２のモードを含む複数のモードのうち、いずれのモードを用いて予測処理を行うかを決定する（Ｓ２０１）。

【0219】

次に、回路１６０は、第１のモードで予測処理を行う場合は、予測処理を行うことで得られる予測画像における画素値の空間的な勾配を用いて予測画像の補正処理を行うか否かを判定し、補正処理を行うと判定された場合に補正処理を行う（Ｓ２０２）。そして、回路１６０は、第２のモードで予測処理を行う場合は、補正処理を行わない（Ｓ２０３）。

【0220】

これにより、符号化装置１００は、微小単位（例えば、画素単位）の動き補正を、ブロック単位の動き予測と併用するため、符号化効率が向上される。また、サブブロック単位の動き予測は、ブロック単位の動き予測よりも処理量が大きいため、符号化装置は、サブブロック単位の動き予測を行った場合、微小単位の動き補正を行わない。そのため、符号化装置は、微小単位の動き予測をブロック単位の動き予測に対してのみ実行することにより、符号化効率を維持しつつ、処理量を低減することができる。したがって、符号化装置は、処理量の増加を抑制しつつ、より細分化された予測処理を行うことができる。

【0221】

例えば、第１のモード及び第２のモードは、予測動きベクトルを動きベクトルとして用いるモードであるマージモードに含まれる。

【0222】

これにより、符号化装置１００は、マージモードにおいて予測サンプルセットを導出するための処理を高速化することができる。

【0223】

また、例えば、回路１６０は、第１モードで予測処理を行う場合は、補正処理を行うか否かの判定結果を示す判定結果情報を符号化し、第２モードで予測処理を行う場合は、判定結果情報を符号化しない。これにより、符号化装置１００は、符号量を削減することができる。

【0224】

また、例えば、補正処理は、ＢＩＯ（ＢＩ－ｄｉｒｅｃｔｉｏｎａｌＯｐｔｉｃａｌｆｌｏｗ）処理であってもよい。これにより、符号化装置１００は、ブロック単位での動きベクトルを導出して生成された予測画像における微小単位の補正値を使って予測画像を補正することができる。

【0225】

また、例えば、第２のモードは、ＡＴＭＶＰ（ＡｄｖａｎｃｅｄＴｅｍｐｏｒａｌＭｏｔｉｏｎＶｅｃｔｏｒＰｒｅｄｉｃｔｉｏｎ）モードであってもよい。これにより、符号化装置１００は、ＡＴＭＶＰモードにおいて微小単位での動き補正処理を行う必要がないため、処理量が低減される。

【0226】

また、例えば、第２のモードは、ＳＴＭＶＰ（Ｓｐａｔｉａｌ－ＴｅｍｐｏｒａｌＭｏｔｉｏｎＶｅｃｔｏｒＰｒｅｄｉｃｔｉｏｎ）モードであってもよい。これにより、符号化装置１００は、ＳＴＭＶＰモードにおいて微小単位での動き補正処理を行う必要がないため、処理量が低減される。

【0227】

また、例えば、第２のモードは、アフィン（ａｆｆｉｎｅｃｏｍｐｅｎｓａｔｉｏｎｐｒｅｄｉｃｔｉｏｎ）モードであってもよい。これにより、符号化装置１００は、アフィンモードにおいて微小単位での動き補正処理を行う必要がないため、処理量が低減される。

【0228】

図１７は、復号装置２００の実装例を示すブロック図である。復号装置２００は、回路２６０及びメモリ２６２を備える。例えば、図１０に示された復号装置２００の複数の構成要素は、図１７に示された回路２６０及びメモリ２６２によって実装される。

【0229】

回路２６０は、メモリ２６２にアクセス可能な電子回路であって、情報処理を行う。例えば、回路２６０は、メモリ２６２を用いて動画像を復号する専用又は汎用の電子回路である。回路２６０は、ＣＰＵのようなプロセッサであってもよい。また、回路２６０は、複数の電子回路の集合体であってもよい。

【0230】

また、例えば、回路２６０は、図１０に示された復号装置２００の複数の構成要素のうち、情報を記憶するための構成要素を除く、複数の構成要素の役割を果たしてもよい。すなわち、回路２６０は、これらの構成要素の動作として上述された動作を行ってもよい。

【0231】

メモリ２６２は、回路２６０が動画像を復号するための情報が記憶される専用又は汎用のメモリである。メモリ２６２は、電子回路であってもよく、回路２６０に接続されていてもよいし、回路２６０に含まれていてもよい。

【0232】

また、メモリ２６２は、複数の電子回路の集合体であってもよいし、複数のサブメモリで構成されていてもよい。また、メモリ２６２は、磁気ディスク又は光ディスク等であってもよいし、ストレージ又は記録媒体等と表現されてもよい。また、メモリ２６２は、不揮発性メモリでもよいし、揮発性メモリでもよい。

【0233】

例えば、メモリ２６２は、図１０に示された復号装置２００の複数の構成要素のうち、情報を記憶するための構成要素の役割を果たしてもよい。具体的には、メモリ２６２は、図１０に示されたブロックメモリ２１０及びフレームメモリ２１４の役割を果たしてもよい。

【0234】

また、メモリ２６２には、符号化された動画像に対応するビット列が記憶されてもよいし、復号された動画像が記憶されてもよい。また、メモリ２６２には、回路２６０が動画像を復号するためのプログラムが記憶されていてもよい。

【0235】

なお、復号装置２００において、図１０に示された複数の構成要素の全てが実装されなくてもよいし、上述された複数の処理の全てが行われなくてもよい。図１０に示された複数の構成要素の一部は、他の装置に含まれていてもよいし、上述された複数の処理の一部は、他の装置によって実行されてもよい。そして、復号装置２００において、図１０に示された複数の構成要素のうちの一部が実装され、上述された複数の処理の一部が行われることによって、処理量の増加を抑制しつつ、より細分化された予測処理を行うことができる。

【0236】

図１８は、図１７に示された復号装置２００の動作例を示すフローチャートである。例えば、図１７に示された復号装置２００は、動画像を復号する際に、図１８に示された動作を行う。具体的には、回路２６０は、メモリ２６２を用いて、以下の動作を行う。

【0237】

まず、回路２６０は、動画像におけるブロック単位の動きベクトルに基づき前記予測処理を行う第１のモード、及び、前記ブロックを分割したサブブロック単位の動きベクトルに基づき前記予測処理を行う第２のモードを含む複数のモードのうち、いずれのモードを用いて前記予測処理を行うかを決定する（Ｓ３０１）。

【0238】

次に、回路２６０は、第１のモードで前記予測処理を行う場合は、前記予測処理を行うことで得られる予測画像における画素値の空間的な勾配を用いて前記予測画像の補正処理を行うか否かを判定し、前記補正処理を行うと判定された場合に前記補正処理を行う（Ｓ３０２）。そして、回路２６０は、第２のモードで前記予測処理を行う場合は、前記補正処理を行わない（Ｓ３０３）。

【0239】

これにより、復号装置２００は、微小単位（例えば、画素単位）の動き補正を、ブロック単位の動き予測と併用するため、符号化効率が向上される。また、サブブロック単位の動き予測は、ブロック単位の動き予測よりも処理量が大きいため、復号装置は、サブブロック単位の動き予測を行った場合、微小単位の動き補正を行わない。そのため、復号装置は、微小単位の動き予測をブロック単位の動き予測に対してのみ実行することにより、符号化効率を維持しつつ、処理量を低減することができる。したがって、復号装置は、処理量の増加を抑制しつつ、より細分化された予測処理を行うことができる。

【0240】

例えば、回路２６０は、第１のモード及び第２のモードは、予測動きベクトルを動きベクトルとして用いるモードであるマージモードに含まれる。

【0241】

これにより、復号装置２００は、マージモードにおいて予測サンプルセットを導出するための処理を高速化することができる。

【0242】

また、例えば、第１モードで予測処理を行う場合は、予測処理を行うか否かの判定結果を示す判定結果情報を復号化し、第２モードで予測処理を行う場合は、判定結果情報を復号化しない。これにより、復号装置２００は、処理効率を向上させることができる。

【0243】

また、例えば、補正処理は、ＢＩＯ処理であってもよい。これにより、復号装置２００は、ブロック単位での動きベクトルを導出して生成された予測画像における微小単位の補正値を使って予測画像を補正することができる。

【0244】

また、例えば、第２のモードは、ＡＴＭＶＰモードであってもよい。これにより、復号装置２００は、ＡＴＭＶＰモードにおいて微小単位での動き補正処理を行う必要がないため、処理量が低減される。

【0245】

また、例えば、第２のモードは、ＳＴＭＶＰモードであってもよい。これにより、復号装置２００は、ＳＴＭＶＰモードにおいて微小単位での動き補正処理を行う必要がないため、処理量が低減される。

【0246】

また、例えば、第２のモードは、アフィンモードであってもよい。これにより、復号装置２００は、アフィンモードにおいて微小単位での動き補正を行う必要がないため、処理量が低減される。

【0247】

また、本実施の形態における符号化装置１００及び復号装置２００は、それぞれ、画像符号化装置及び画像復号装置として利用されてもよいし、動画像符号化装置及び動画像復号装置として利用されてもよい。

【0248】

あるいは、符号化装置１００及び復号装置２００のそれぞれは、予測装置又はインター予測装置として利用され得る。すなわち、符号化装置１００及び復号装置２００は、それぞれ、インター予測部１２６及びインター予測部２１８のみに対応していてもよい。そして、エントロピー符号化部１１０又はエントロピー復号部２０２等の他の構成要素は、他の装置に含まれていてもよい。

【0249】

また、本実施の形態の少なくとも一部が、符号化方法として利用されてもよいし、復号方法として利用されてもよいし、予測方法として利用されてもよいし、その他の方法として利用されてもよい。

【0250】

また、本実施の形態において、各構成要素は、専用のハードウェアで構成されるか、各構成要素に適したソフトウェアプログラムを実行することによって実現されてもよい。各構成要素は、ＣＰＵ又はプロセッサなどのプログラム実行部が、ハードディスク又は半導体メモリなどの記録媒体に記録されたソフトウェアプログラムを読み出して実行することによって実現されてもよい。

【0251】

具体的には、符号化装置１００及び復号装置２００のそれぞれは、処理回路（ＰｒｏｃｅｓｓｉｎｇＣｉｒｃｕｉｔｒｙ）と、当該処理回路に電気的に接続された、当該処理回路からアクセス可能な記憶装置（Ｓｔｏｒａｇｅ）とを備えていてもよい。例えば、処理回路は回路１６０又は２６０に対応し、記憶装置はメモリ１６２又は２６２に対応する。

【0252】

処理回路は、専用のハードウェア及びプログラム実行部の少なくとも一方を含み、記憶装置を用いて処理を実行する。また、記憶装置は、処理回路がプログラム実行部を含む場合には、当該プログラム実行部により実行されるソフトウェアプログラムを記憶する。

【0253】

ここで、本実施の形態の符号化装置１００又は復号装置２００などを実現するソフトウェアは、次のようなプログラムである。

【0254】

すなわち、このプログラムは、コンピュータに、予測処理を行って動画像を符号化する符号化方法であって、前記動画像におけるブロック単位の動きベクトルに基づき前記予測処理を行う第１のモード、及び、前記ブロックを分割したサブブロック単位の動きベクトルに基づき前記予測処理を行う第２のモードを含む複数のモードのうち、いずれのモードを用いて前記予測処理を行うかを決定し、前記第１のモードで前記予測処理を行う場合は、前記予測処理を行うことで得られる予測画像における画素値の空間的な勾配を用いて前記予測画像の補正処理を行うか否かを判定し、前記補正処理を行うと判定された場合に前記補正処理を行い、前記第２のモードで前記予測処理を行う場合は、前記補正処理を行わない符号化方法を実行させてもよい。

【0255】

あるいは、このプログラムは、コンピュータに、予測処理を行って動画像を復号する復号方法であって、前記動画像におけるブロック単位の動きベクトルに基づき前記予測処理を行う第１のモード、及び、前記ブロックを分割したサブブロック単位の動きベクトルに基づき前記予測処理を行う第２のモードを含む複数のモードのうち、いずれのモードを用いて前記予測処理を行うかを決定し、前記第１のモードで前記予測処理を行う場合は、前記予測処理を行うことで得られる予測画像における画素値の空間的な勾配を用いて前記予測画像の補正処理を行うか否かを判定し、前記補正処理を行うと判定された場合に前記補正処理を行い、前記第２のモードで前記予測処理を行う場合は、前記補正処理を行わない復号方法を実行させてもよい。

【0256】

また、各構成要素は、上述の通り、回路であってもよい。これらの回路は、全体として１つの回路を構成してもよいし、それぞれ別々の回路であってもよい。また、各構成要素は、汎用的なプロセッサで実現されてもよいし、専用のプロセッサで実現されてもよい。

【0257】

また、特定の構成要素が実行する処理を別の構成要素が実行してもよい。また、処理を実行する順番が変更されてもよいし、複数の処理が並行して実行されてもよい。また、符号化復号装置が、符号化装置１００及び復号装置２００を備えていてもよい。

【0258】

また、説明に用いられた第１及び第２等の序数は、適宜、付け替えられてもよい。また、構成要素などに対して、序数が新たに与えられてもよいし、取り除かれてもよい。

【0259】

以上、符号化装置１００及び復号装置２００の態様について、実施の形態に基づいて説明したが、符号化装置１００及び復号装置２００の態様は、この実施の形態に限定されるものではない。本開示の趣旨を逸脱しない限り、当業者が思いつく各種変形を本実施の形態に施したものや、異なる実施の形態における構成要素を組み合わせて構築される形態も、符号化装置１００及び復号装置２００の態様の範囲内に含まれてもよい。

【0260】

本態様を本開示における他の態様の少なくとも一部と組み合わせて実施してもよい。また、本態様のフローチャートに記載の一部の処理、装置の一部の構成、シンタックスの一部などを他の態様と組み合わせて実施してもよい。

【0261】

（実施の形態２）
以上の各実施の形態において、機能ブロックの各々は、通常、ＭＰＵ及びメモリ等によって実現可能である。また、機能ブロックの各々による処理は、通常、プロセッサなどのプログラム実行部が、ＲＯＭ等の記録媒体に記録されたソフトウェア（プログラム）を読み出して実行することで実現される。当該ソフトウェアはダウンロード等により配布されてもよいし、半導体メモリなどの記録媒体に記録して配布されてもよい。なお、各機能ブロックをハードウェア（専用回路）によって実現することも、当然、可能である。

【0262】

また、各実施の形態において説明した処理は、単一の装置（システム）を用いて集中処理することによって実現してもよく、又は、複数の装置を用いて分散処理することによって実現してもよい。また、上記プログラムを実行するプロセッサは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、又は分散処理を行ってもよい。

【0263】

本開示の態様は、以上の実施例に限定されることなく、種々の変更が可能であり、それらも本開示の態様の範囲内に包含される。

【0264】

さらにここで、上記各実施の形態で示した動画像符号化方法（画像符号化方法）又は動画像復号化方法（画像復号方法）の応用例とそれを用いたシステムを説明する。当該システムは、画像符号化方法を用いた画像符号化装置、画像復号方法を用いた画像復号装置、及び両方を備える画像符号化復号装置を有することを特徴とする。システムにおける他の構成について、場合に応じて適切に変更することができる。

【0265】

［使用例］
図１９は、コンテンツ配信サービスを実現するコンテンツ供給システムｅｘ１００の全体構成を示す図である。通信サービスの提供エリアを所望の大きさに分割し、各セル内にそれぞれ固定無線局である基地局ｅｘ１０６、ｅｘ１０７、ｅｘ１０８、ｅｘ１０９、ｅｘ１１０が設置されている。

【0266】

このコンテンツ供給システムｅｘ１００では、インターネットｅｘ１０１に、インターネットサービスプロバイダｅｘ１０２又は通信網ｅｘ１０４、及び基地局ｅｘ１０６～ｅｘ１１０を介して、コンピュータｅｘ１１１、ゲーム機ｅｘ１１２、カメラｅｘ１１３、家電ｅｘ１１４、及びスマートフォンｅｘ１１５などの各機器が接続される。当該コンテンツ供給システムｅｘ１００は、上記のいずれかの要素を組合せて接続するようにしてもよい。固定無線局である基地局ｅｘ１０６～ｅｘ１１０を介さずに、各機器が電話網又は近距離無線等を介して直接的又は間接的に相互に接続されていてもよい。また、ストリーミングサーバｅｘ１０３は、インターネットｅｘ１０１等を介して、コンピュータｅｘ１１１、ゲーム機ｅｘ１１２、カメラｅｘ１１３、家電ｅｘ１１４、及びスマートフォンｅｘ１１５などの各機器と接続される。また、ストリーミングサーバｅｘ１０３は、衛星ｅｘ１１６を介して、飛行機ｅｘ１１７内のホットスポット内の端末等と接続される。

【0267】

なお、基地局ｅｘ１０６～ｅｘ１１０の代わりに、無線アクセスポイント又はホットスポット等が用いられてもよい。また、ストリーミングサーバｅｘ１０３は、インターネットｅｘ１０１又はインターネットサービスプロバイダｅｘ１０２を介さずに直接通信網ｅｘ１０４と接続されてもよいし、衛星ｅｘ１１６を介さず直接飛行機ｅｘ１１７と接続されてもよい。

【0268】

カメラｅｘ１１３はデジタルカメラ等の静止画撮影、及び動画撮影が可能な機器である。また、スマートフォンｅｘ１１５は、一般に２Ｇ、３Ｇ、３．９Ｇ、４Ｇ、そして今後は５Ｇと呼ばれる移動通信システムの方式に対応したスマートフォン機、携帯電話機、又はＰＨＳ（ＰｅｒｓｏｎａｌＨａｎｄｙｐｈｏｎｅＳｙｓｔｅｍ）等である。

【0269】

家電ｅｘ１１８は、冷蔵庫、又は家庭用燃料電池コージェネレーションシステムに含まれる機器等である。

【0270】

コンテンツ供給システムｅｘ１００では、撮影機能を有する端末が基地局ｅｘ１０６等を通じてストリーミングサーバｅｘ１０３に接続されることで、ライブ配信等が可能になる。ライブ配信では、端末（コンピュータｅｘ１１１、ゲーム機ｅｘ１１２、カメラｅｘ１１３、家電ｅｘ１１４、スマートフォンｅｘ１１５、及び飛行機ｅｘ１１７内の端末等）は、ユーザが当該端末を用いて撮影した静止画又は動画コンテンツに対して上記各実施の形態で説明した符号化処理を行い、符号化により得られた映像データと、映像に対応する音を符号化した音データと多重化し、得られたデータをストリーミングサーバｅｘ１０３に送信する。即ち、各端末は、本開示の一態様に係る画像符号化装置として機能する。

【0271】

一方、ストリーミングサーバｅｘ１０３は要求のあったクライアントに対して送信されたコンテンツデータをストリーム配信する。クライアントは、上記符号化処理されたデータを復号化することが可能な、コンピュータｅｘ１１１、ゲーム機ｅｘ１１２、カメラｅｘ１１３、家電ｅｘ１１４、スマートフォンｅｘ１１５、又は飛行機ｅｘ１１７内の端末等である。配信されたデータを受信した各機器は、受信したデータを復号化処理して再生する。即ち、各機器は、本開示の一態様に係る画像復号装置として機能する。

【0272】

［分散処理］
また、ストリーミングサーバｅｘ１０３は複数のサーバ又は複数のコンピュータであって、データを分散して処理したり記録したり配信するものであってもよい。例えば、ストリーミングサーバｅｘ１０３は、ＣＤＮ（ＣｏｎｔｅｎｔｓＤｅｌｉｖｅｒｙＮｅｔｗｏｒｋ）により実現され、世界中に分散された多数のエッジサーバとエッジサーバ間をつなぐネットワークによりコンテンツ配信が実現されていてもよい。ＣＤＮでは、クライアントに応じて物理的に近いエッジサーバが動的に割り当てられる。そして、当該エッジサーバにコンテンツがキャッシュ及び配信されることで遅延を減らすことができる。また、何らかのエラーが発生した場合又はトラフィックの増加などにより通信状態が変わる場合に複数のエッジサーバで処理を分散したり、他のエッジサーバに配信主体を切り替えたり、障害が生じたネットワークの部分を迂回して配信を続けることができるので、高速かつ安定した配信が実現できる。

【0273】

また、配信自体の分散処理にとどまらず、撮影したデータの符号化処理を各端末で行ってもよいし、サーバ側で行ってもよいし、互いに分担して行ってもよい。一例として、一般に符号化処理では、処理ループが２度行われる。１度目のループでフレーム又はシーン単位での画像の複雑さ、又は、符号量が検出される。また、２度目のループでは画質を維持して符号化効率を向上させる処理が行われる。例えば、端末が１度目の符号化処理を行い、コンテンツを受け取ったサーバ側が２度目の符号化処理を行うことで、各端末での処理負荷を減らしつつもコンテンツの質と効率を向上させることができる。この場合、ほぼリアルタイムで受信して復号する要求があれば、端末が行った一度目の符号化済みデータを他の端末で受信して再生することもできるので、より柔軟なリアルタイム配信も可能になる。

【0274】

他の例として、カメラｅｘ１１３等は、画像から特徴量抽出を行い、特徴量に関するデータをメタデータとして圧縮してサーバに送信する。サーバは、例えば特徴量からオブジェクトの重要性を判断して量子化精度を切り替えるなど、画像の意味に応じた圧縮を行う。特徴量データはサーバでの再度の圧縮時の動きベクトル予測の精度及び効率向上に特に有効である。また、端末でＶＬＣ（可変長符号化）などの簡易的な符号化を行い、サーバでＣＡＢＡＣ（コンテキスト適応型二値算術符号化方式）など処理負荷の大きな符号化を行ってもよい。

【0275】

さらに他の例として、スタジアム、ショッピングモール、又は工場などにおいては、複数の端末によりほぼ同一のシーンが撮影された複数の映像データが存在する場合がある。この場合には、撮影を行った複数の端末と、必要に応じて撮影をしていない他の端末及びサーバを用いて、例えばＧＯＰ（ＧｒｏｕｐｏｆＰｉｃｔｕｒｅ）単位、ピクチャ単位、又はピクチャを分割したタイル単位などで符号化処理をそれぞれ割り当てて分散処理を行う。これにより、遅延を減らし、よりリアルタイム性を実現できる。

【0276】

また、複数の映像データはほぼ同一シーンであるため、各端末で撮影された映像データを互いに参照し合えるように、サーバで管理及び／又は指示をしてもよい。または、各端末からの符号化済みデータを、サーバが受信し複数のデータ間で参照関係を変更、又はピクチャ自体を補正或いは差し替えて符号化しなおしてもよい。これにより、一つ一つのデータの質と効率を高めたストリームを生成できる。

【0277】

また、サーバは、映像データの符号化方式を変更するトランスコードを行ったうえで映像データを配信してもよい。例えば、サーバは、ＭＰＥＧ系の符号化方式をＶＰ系に変換してもよいし、Ｈ．２６４をＨ．２６５に変換してもよい。

【0278】

このように、符号化処理は、端末、又は１以上のサーバにより行うことが可能である。よって、以下では、処理を行う主体として「サーバ」又は「端末」等の記載を用いるが、サーバで行われる処理の一部又は全てが端末で行われてもよいし、端末で行われる処理の一部又は全てがサーバで行われてもよい。また、これらに関しては、復号処理についても同様である。

【0279】

［３Ｄ、マルチアングル］
近年では、互いにほぼ同期した複数のカメラｅｘ１１３及び／又はスマートフォンｅｘ１１５などの端末により撮影された異なるシーン、又は、同一シーンを異なるアングルから撮影した画像或いは映像を統合して利用することも増えてきている。各端末で撮影した映像は、別途取得した端末間の相対的な位置関係、又は、映像に含まれる特徴点が一致する領域などに基づいて統合される。

【0280】

サーバは、２次元の動画像を符号化するだけでなく、動画像のシーン解析などに基づいて自動的に、又は、ユーザが指定した時刻において、静止画を符号化し、受信端末に送信してもよい。サーバは、さらに、撮影端末間の相対的な位置関係を取得できる場合には、２次元の動画像だけでなく、同一シーンが異なるアングルから撮影された映像に基づき、当該シーンの３次元形状を生成できる。なお、サーバは、ポイントクラウドなどにより生成した３次元のデータを別途符号化してもよいし、３次元データを用いて人物又はオブジェクトを認識或いは追跡した結果に基づいて、受信端末に送信する映像を、複数の端末で撮影した映像から選択、又は、再構成して生成してもよい。

【0281】

このようにして、ユーザは、各撮影端末に対応する各映像を任意に選択してシーンを楽しむこともできるし、複数画像又は映像を用いて再構成された３次元データから任意視点の映像を切り出したコンテンツを楽しむこともできる。さらに、映像と同様に音も複数の相異なるアングルから収音され、サーバは、映像に合わせて特定のアングル又は空間からの音を映像と多重化して送信してもよい。

【0282】

また、近年ではＶｉｒｔｕａｌＲｅａｌｉｔｙ（ＶＲ）及びＡｕｇｍｅｎｔｅｄＲｅａｌｉｔｙ（ＡＲ）など、現実世界と仮想世界とを対応付けたコンテンツも普及してきている。ＶＲの画像の場合、サーバは、右目用及び左目用の視点画像をそれぞれ作成し、Ｍｕｌｔｉ－ＶｉｅｗＣｏｄｉｎｇ（ＭＶＣ）などにより各視点映像間で参照を許容する符号化を行ってもよいし、互いに参照せずに別ストリームとして符号化してもよい。別ストリームの復号時には、ユーザの視点に応じて仮想的な３次元空間が再現されるように互いに同期させて再生するとよい。

【0283】

ＡＲの画像の場合には、サーバは、現実空間のカメラ情報に、仮想空間上の仮想物体情報を、３次元的位置又はユーザの視点の動きに基づいて重畳する。復号装置は、仮想物体情報及び３次元データを取得又は保持し、ユーザの視点の動きに応じて２次元画像を生成し、スムーズにつなげることで重畳データを作成してもよい。または、復号装置は仮想物体情報の依頼に加えてユーザの視点の動きをサーバに送信し、サーバは、サーバに保持される３次元データから受信した視点の動きに合わせて重畳データを作成し、重畳データを符号化して復号装置に配信してもよい。なお、重畳データは、ＲＧＢ以外に透過度を示すα値を有し、サーバは、３次元データから作成されたオブジェクト以外の部分のα値が０などに設定し、当該部分が透過する状態で、符号化してもよい。もしくは、サーバは、クロマキーのように所定の値のＲＧＢ値を背景に設定し、オブジェクト以外の部分は背景色にしたデータを生成してもよい。

【0284】

同様に配信されたデータの復号処理はクライアントである各端末で行っても、サーバ側で行ってもよいし、互いに分担して行ってもよい。一例として、ある端末が、一旦サーバに受信リクエストを送り、そのリクエストに応じたコンテンツを他の端末で受信し復号処理を行い、ディスプレイを有する装置に復号済みの信号が送信されてもよい。通信可能な端末自体の性能によらず処理を分散して適切なコンテンツを選択することで画質のよいデータを再生することができる。また、他の例として大きなサイズの画像データをＴＶ等で受信しつつ、鑑賞者の個人端末にピクチャが分割されたタイルなど一部の領域が復号されて表示されてもよい。これにより、全体像を共有化しつつ、自身の担当分野又はより詳細に確認したい領域を手元で確認することができる。

【0285】

また今後は、屋内外にかかわらず近距離、中距離、又は長距離の無線通信が複数使用可能な状況下で、ＭＰＥＧ－ＤＡＳＨなどの配信システム規格を利用して、接続中の通信に対して適切なデータを切り替えながらシームレスにコンテンツを受信することが予想される。これにより、ユーザは、自身の端末のみならず屋内外に設置されたディスプレイなどの復号装置又は表示装置を自由に選択しながらリアルタイムで切り替えられる。また、自身の位置情報などに基づいて、復号する端末及び表示する端末を切り替えながら復号を行うことができる。これにより、目的地への移動中に、表示可能なデバイスが埋め込まれた隣の建物の壁面又は地面の一部に地図情報を表示させながら移動することも可能になる。また、符号化データが受信端末から短時間でアクセスできるサーバにキャッシュされている、又は、コンテンツ・デリバリー・サービスにおけるエッジサーバにコピーされている、などの、ネットワーク上での符号化データへのアクセス容易性に基づいて、受信データのビットレートを切り替えることも可能である。

【0286】

［スケーラブル符号化］
コンテンツの切り替えに関して、図２０に示す、上記各実施の形態で示した動画像符号化方法を応用して圧縮符号化されたスケーラブルなストリームを用いて説明する。サーバは、個別のストリームとして内容は同じで質の異なるストリームを複数有していても構わないが、図示するようにレイヤに分けて符号化を行うことで実現される時間的／空間的スケーラブルなストリームの特徴を活かして、コンテンツを切り替える構成であってもよい。つまり、復号側が性能という内的要因と通信帯域の状態などの外的要因とに応じてどのレイヤまで復号するかを決定することで、復号側は、低解像度のコンテンツと高解像度のコンテンツとを自由に切り替えて復号できる。例えば移動中にスマートフォンｅｘ１１５で視聴していた映像の続きを、帰宅後にインターネットＴＶ等の機器で視聴したい場合には、当該機器は、同じストリームを異なるレイヤまで復号すればよいので、サーバ側の負担を軽減できる。

【0287】

さらに、上記のように、レイヤ毎にピクチャが符号化されており、ベースレイヤの上位にエンハンスメントレイヤが存在するスケーラビリティを実現する構成以外に、エンハンスメントレイヤが画像の統計情報などに基づくメタ情報を含み、復号側が、メタ情報に基づきベースレイヤのピクチャを超解像することで高画質化したコンテンツを生成してもよい。超解像とは、同一解像度におけるＳＮ比の向上、及び、解像度の拡大のいずれであってもよい。メタ情報は、超解像処理に用いる線形或いは非線形のフィルタ係数を特定するため情報、又は、超解像処理に用いるフィルタ処理、機械学習或いは最小２乗演算におけるパラメータ値を特定する情報などを含む。

【0288】

または、画像内のオブジェクトなどの意味合いに応じてピクチャがタイル等に分割されており、復号側が、復号するタイルを選択することで一部の領域だけを復号する構成であってもよい。また、オブジェクトの属性（人物、車、ボールなど）と映像内の位置（同一画像における座標位置など）とをメタ情報として格納することで、復号側は、メタ情報に基づいて所望のオブジェクトの位置を特定し、そのオブジェクトを含むタイルを決定できる。例えば、図２１に示すように、メタ情報は、ＨＥＶＣにおけるＳＥＩメッセージなど画素データとは異なるデータ格納構造を用いて格納される。このメタ情報は、例えば、メインオブジェクトの位置、サイズ、又は色彩などを示す。

【0289】

また、ストリーム、シーケンス又はランダムアクセス単位など、複数のピクチャから構成される単位でメタ情報が格納されてもよい。これにより、復号側は、特定人物が映像内に出現する時刻などが取得でき、ピクチャ単位の情報と合わせることで、オブジェクトが存在するピクチャ、及び、ピクチャ内でのオブジェクトの位置を特定できる。

【0290】

［Ｗｅｂページの最適化］
図２２は、コンピュータｅｘ１１１等におけるｗｅｂページの表示画面例を示す図である。図２３は、スマートフォンｅｘ１１５等におけるｗｅｂページの表示画面例を示す図である。図２２及び図２３に示すようにｗｅｂページが、画像コンテンツへのリンクであるリンク画像を複数含む場合があり、閲覧するデバイスによってその見え方は異なる。画面上に複数のリンク画像が見える場合には、ユーザが明示的にリンク画像を選択するまで、又は画面の中央付近にリンク画像が近付く或いはリンク画像の全体が画面内に入るまでは、表示装置（復号装置）は、リンク画像として各コンテンツが有する静止画又はＩピクチャを表示したり、複数の静止画又はＩピクチャ等でｇｉｆアニメのような映像を表示したり、ベースレイヤのみ受信して映像を復号及び表示したりする。

【0291】

ユーザによりリンク画像が選択された場合、表示装置は、ベースレイヤを最優先にして復号する。なお、ｗｅｂページを構成するＨＴＭＬにスケーラブルなコンテンツであることを示す情報があれば、表示装置は、エンハンスメントレイヤまで復号してもよい。また、リアルタイム性を担保するために、選択される前又は通信帯域が非常に厳しい場合には、表示装置は、前方参照のピクチャ（Ｉピクチャ、Ｐピクチャ、前方参照のみのＢピクチャ）のみを復号及び表示することで、先頭ピクチャの復号時刻と表示時刻との間の遅延（コンテンツの復号開始から表示開始までの遅延）を低減できる。また、表示装置は、ピクチャの参照関係を敢えて無視して全てのＢピクチャ及びＰピクチャを前方参照にして粗く復号し、時間が経ち受信したピクチャが増えるにつれて正常の復号を行ってもよい。

【0292】

［自動走行］
また、車の自動走行又は走行支援のため２次元又は３次元の地図情報などの静止画又は映像データを送受信する場合、受信端末は、１以上のレイヤに属する画像データに加えて、メタ情報として天候又は工事の情報なども受信し、これらを対応付けて復号してもよい。なお、メタ情報は、レイヤに属してもよいし、単に画像データと多重化されてもよい。

【0293】

この場合、受信端末を含む車、ドローン又は飛行機などが移動するため、受信端末は、当該受信端末の位置情報を受信要求時に送信することで、基地局ｅｘ１０６～ｅｘ１１０を切り替えながらシームレスな受信及び復号を実現できる。また、受信端末は、ユーザの選択、ユーザの状況又は通信帯域の状態に応じて、メタ情報をどの程度受信するか、又は地図情報をどの程度更新していくかを動的に切り替えることが可能になる。

【0294】

以上のようにして、コンテンツ供給システムｅｘ１００では、ユーザが送信した符号化された情報をリアルタイムでクライアントが受信して復号し、再生することができる。

【0295】

［個人コンテンツの配信］
また、コンテンツ供給システムｅｘ１００では、映像配信業者による高画質で長時間のコンテンツのみならず、個人による低画質で短時間のコンテンツのユニキャスト、又はマルチキャスト配信が可能である。また、このような個人のコンテンツは今後も増加していくと考えられる。個人コンテンツをより優れたコンテンツにするために、サーバは、編集処理を行ってから符号化処理を行ってもよい。これは例えば、以下のような構成で実現できる。

【0296】

撮影時にリアルタイム又は蓄積して撮影後に、サーバは、原画又は符号化済みデータから撮影エラー、シーン探索、意味の解析、及びオブジェクト検出などの認識処理を行う。そして、サーバは、認識結果に基いて手動又は自動で、ピントずれ又は手ブレなどを補正したり、明度が他のピクチャに比べて低い又は焦点が合っていないシーンなどの重要性の低いシーンを削除したり、オブジェクトのエッジを強調したり、色合いを変化させるなどの編集を行う。サーバは、編集結果に基いて編集後のデータを符号化する。また撮影時刻が長すぎると視聴率が下がることも知られており、サーバは、撮影時間に応じて特定の時間範囲内のコンテンツになるように上記のように重要性が低いシーンのみならず動きが少ないシーンなどを、画像処理結果に基き自動でクリップしてもよい。または、サーバは、シーンの意味解析の結果に基づいてダイジェストを生成して符号化してもよい。

【0297】

なお、個人コンテンツには、そのままでは著作権、著作者人格権、又は肖像権等の侵害となるものが写り込んでいるケースもあり、共有する範囲が意図した範囲を超えてしまうなど個人にとって不都合な場合もある。よって、例えば、サーバは、画面の周辺部の人の顔、又は家の中などを敢えて焦点が合わない画像に変更して符号化してもよい。また、サーバは、符号化対象画像内に、予め登録した人物とは異なる人物の顔が映っているかどうかを認識し、映っている場合には、顔の部分にモザイクをかけるなどの処理を行ってもよい。または、符号化の前処理又は後処理として、著作権などの観点からユーザが画像を加工したい人物又は背景領域を指定し、サーバは、指定された領域を別の映像に置き換える、又は焦点をぼかすなどの処理を行うことも可能である。人物であれば、動画像において人物をトラッキングしながら、顔の部分の映像を置き換えることができる。

【0298】

また、データ量の小さい個人コンテンツの視聴はリアルタイム性の要求が強いため、帯域幅にもよるが、復号装置は、まずベースレイヤを最優先で受信して復号及び再生を行う。復号装置は、この間にエンハンスメントレイヤを受信し、再生がループされる場合など２回以上再生される場合に、エンハンスメントレイヤも含めて高画質の映像を再生してもよい。このようにスケーラブルな符号化が行われているストリームであれば、未選択時又は見始めた段階では粗い動画だが、徐々にストリームがスマートになり画像がよくなるような体験を提供することができる。スケーラブル符号化以外にも、１回目に再生される粗いストリームと、１回目の動画を参照して符号化される２回目のストリームとが１つのストリームとして構成されていても同様の体験を提供できる。

【0299】

［その他の使用例］
また、これらの符号化又は復号処理は、一般的に各端末が有するＬＳＩｅｘ５００において処理される。ＬＳＩｅｘ５００は、ワンチップであっても複数チップからなる構成であってもよい。なお、動画像符号化又は復号用のソフトウェアをコンピュータｅｘ１１１等で読み取り可能な何らかの記録メディア（ＣＤ－ＲＯＭ、フレキシブルディスク、又はハードディスクなど）に組み込み、そのソフトウェアを用いて符号化又は復号処理を行ってもよい。さらに、スマートフォンｅｘ１１５がカメラ付きである場合には、そのカメラで取得した動画データを送信してもよい。このときの動画データはスマートフォンｅｘ１１５が有するＬＳＩｅｘ５００で符号化処理されたデータである。

【0300】

なお、ＬＳＩｅｘ５００は、アプリケーションソフトをダウンロードしてアクティベートする構成であってもよい。この場合、端末は、まず、当該端末がコンテンツの符号化方式に対応しているか、又は、特定サービスの実行能力を有するかを判定する。端末がコンテンツの符号化方式に対応していない場合、又は、特定サービスの実行能力を有さない場合、端末は、コーデック又はアプリケーションソフトをダウンロードし、その後、コンテンツ取得及び再生する。

【0301】

また、インターネットｅｘ１０１を介したコンテンツ供給システムｅｘ１００に限らず、デジタル放送用システムにも上記各実施の形態の少なくとも動画像符号化装置（画像符号化装置）又は動画像復号化装置（画像復号装置）のいずれかを組み込むことができる。衛星などを利用して放送用の電波に映像と音が多重化された多重化データを載せて送受信するため、コンテンツ供給システムｅｘ１００のユニキャストがし易い構成に対してマルチキャスト向きであるという違いがあるが符号化処理及び復号処理に関しては同様の応用が可能である。

【0302】

［ハードウェア構成］
図２４は、スマートフォンｅｘ１１５を示す図である。また、図２５は、スマートフォンｅｘ１１５の構成例を示す図である。スマートフォンｅｘ１１５は、基地局ｅｘ１１０との間で電波を送受信するためのアンテナｅｘ４５０と、映像及び静止画を撮ることが可能なカメラ部ｅｘ４６５と、カメラ部ｅｘ４６５で撮像した映像、及びアンテナｅｘ４５０で受信した映像等が復号されたデータを表示する表示部ｅｘ４５８とを備える。スマートフォンｅｘ１１５は、さらに、タッチパネル等である操作部ｅｘ４６６と、音声又は音響を出力するためのスピーカ等である音声出力部ｅｘ４５７と、音声を入力するためのマイク等である音声入力部ｅｘ４５６と、撮影した映像或いは静止画、録音した音声、受信した映像或いは静止画、メール等の符号化されたデータ、又は、復号化されたデータを保存可能なメモリ部ｅｘ４６７と、ユーザを特定し、ネットワークをはじめ各種データへのアクセスの認証をするためのＳＩＭｅｘ４６８とのインタフェース部であるスロット部ｅｘ４６４とを備える。なお、メモリ部ｅｘ４６７の代わりに外付けメモリが用いられてもよい。

【0303】

また、表示部ｅｘ４５８及び操作部ｅｘ４６６等を統括的に制御する主制御部ｅｘ４６０と、電源回路部ｅｘ４６１、操作入力制御部ｅｘ４６２、映像信号処理部ｅｘ４５５、カメラインタフェース部ｅｘ４６３、ディスプレイ制御部ｅｘ４５９、変調／復調部ｅｘ４５２、多重／分離部ｅｘ４５３、音声信号処理部ｅｘ４５４、スロット部ｅｘ４６４、及びメモリ部ｅｘ４６７とがバスｅｘ４７０を介して接続されている。

【0304】

電源回路部ｅｘ４６１は、ユーザの操作により電源キーがオン状態にされると、バッテリパックから各部に対して電力を供給することによりスマートフォンｅｘ１１５を動作可能な状態に起動する。

【0305】

スマートフォンｅｘ１１５は、ＣＰＵ、ＲＯＭ及びＲＡＭ等を有する主制御部ｅｘ４６０の制御に基づいて、通話及データ通信等の処理を行う。通話時は、音声入力部ｅｘ４５６で収音した音声信号を音声信号処理部ｅｘ４５４でデジタル音声信号に変換し、これを変調／復調部ｅｘ４５２でスペクトラム拡散処理し、送信／受信部ｅｘ４５１でデジタルアナログ変換処理及び周波数変換処理を施した後にアンテナｅｘ４５０を介して送信する。また受信データを増幅して周波数変換処理及びアナログデジタル変換処理を施し、変調／復調部ｅｘ４５２でスペクトラム逆拡散処理し、音声信号処理部ｅｘ４５４でアナログ音声信号に変換した後、これを音声出力部ｅｘ４５７から出力する。データ通信モード時は、本体部の操作部ｅｘ４６６等の操作によってテキスト、静止画、又は映像データが操作入力制御部ｅｘ４６２を介して主制御部ｅｘ４６０に送出され、同様に送受信処理が行われる。データ通信モード時に映像、静止画、又は映像と音声を送信する場合、映像信号処理部ｅｘ４５５は、メモリ部ｅｘ４６７に保存されている映像信号又はカメラ部ｅｘ４６５から入力された映像信号を上記各実施の形態で示した動画像符号化方法によって圧縮符号化し、符号化された映像データを多重／分離部ｅｘ４５３に送出する。また、音声信号処理部ｅｘ４５４は、映像又は静止画等をカメラ部ｅｘ４６５で撮像中に音声入力部ｅｘ４５６で収音した音声信号を符号化し、符号化された音声データを多重／分離部ｅｘ４５３に送出する。多重／分離部ｅｘ４５３は、符号化済み映像データと符号化済み音声データを所定の方式で多重化し、変調／復調部（変調／復調回路部）ｅｘ４５２、及び送信／受信部ｅｘ４５１で変調処理及び変換処理を施してアンテナｅｘ４５０を介して送信する。

【0306】

電子メール又はチャットに添付された映像、又はウェブページ等にリンクされた映像を受信した場合、アンテナｅｘ４５０を介して受信された多重化データを復号するために、多重／分離部ｅｘ４５３は、多重化データを分離することにより、多重化データを映像データのビットストリームと音声データのビットストリームとに分け、同期バスｅｘ４７０を介して符号化された映像データを映像信号処理部ｅｘ４５５に供給するとともに、符号化された音声データを音声信号処理部ｅｘ４５４に供給する。映像信号処理部ｅｘ４５５は、上記各実施の形態で示した動画像符号化方法に対応した動画像復号化方法によって映像信号を復号し、ディスプレイ制御部ｅｘ４５９を介して表示部ｅｘ４５８から、リンクされた動画像ファイルに含まれる映像又は静止画が表示される。また音声信号処理部ｅｘ４５４は、音声信号を復号し、音声出力部ｅｘ４５７から音声が出力される。なおリアルタイムストリーミングが普及しているため、ユーザの状況によっては音声の再生が社会的にふさわしくない場も起こりえる。そのため、初期値としては、音声信号は再生せず映像データのみを再生する構成の方が望ましい。ユーザが映像データをクリックするなど操作を行った場合にのみ音声を同期して再生してもよい。

【0307】

またここではスマートフォンｅｘ１１５を例に説明したが、端末としては符号化器及び復号化器を両方持つ送受信型端末の他に、符号化器のみを有する送信端末、及び、復号化器のみを有する受信端末という３通りの実装形式が考えられる。さらに、デジタル放送用システムにおいて、映像データに音声データなどが多重化された多重化データを受信又は送信するとして説明したが、多重化データには、音声データ以外に映像に関連する文字データなどが多重化されてもよいし、多重化データではなく映像データ自体が受信又は送信されてもよい。

【0308】

なお、ＣＰＵを含む主制御部ｅｘ４６０が符号化又は復号処理を制御するとして説明したが、端末はＧＰＵを備えることも多い。よって、ＣＰＵとＧＰＵで共通化されたメモリ、又は共通に使用できるようにアドレスが管理されているメモリにより、ＧＰＵの性能を活かして広い領域を一括して処理する構成でもよい。これにより符号化時間を短縮でき、リアルタイム性を確保し、低遅延を実現できる。特に動き探索、デブロックフィルタ、ＳＡＯ（ＳａｍｐｌｅＡｄａｐｔｉｖｅＯｆｆｓｅｔ）、及び変換・量子化の処理を、ＣＰＵではなく、ＧＰＵでピクチャなどの単位で一括して行うと効率的である。

【産業上の利用可能性】

【0309】

本開示は、例えば、テレビジョン受像機、デジタルビデオレコーダー、カーナビゲーション、携帯電話、デジタルカメラ、デジタルビデオカメラ、テレビ会議システム、又は、電子ミラー等に利用可能である。

【符号の説明】

【0310】

１００符号化装置
１０２分割部
１０４減算部
１０６変換部
１０８量子化部
１１０エントロピー符号化部
１１２、２０４逆量子化部
１１４、２０６逆変換部
１１６、２０８加算部
１１８、２１０ブロックメモリ
１２０、２１２ループフィルタ部
１２２、２１４フレームメモリ
１２４、２１６イントラ予測部
１２６、２１８インター予測部
１２８、２２０予測制御部
１６０、２６０回路
１６２、２６２メモリ
２００復号装置
２０２エントロピー復号部

【図1】