IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヴィド スケール インコーポレイテッドの特許一覧

特許7495433オプティカルフローを用いたブロック境界予測リファインメント
<>
  • 特許-オプティカルフローを用いたブロック境界予測リファインメント 図1A
  • 特許-オプティカルフローを用いたブロック境界予測リファインメント 図1B
  • 特許-オプティカルフローを用いたブロック境界予測リファインメント 図1C
  • 特許-オプティカルフローを用いたブロック境界予測リファインメント 図1D
  • 特許-オプティカルフローを用いたブロック境界予測リファインメント 図2
  • 特許-オプティカルフローを用いたブロック境界予測リファインメント 図3
  • 特許-オプティカルフローを用いたブロック境界予測リファインメント 図4
  • 特許-オプティカルフローを用いたブロック境界予測リファインメント 図5
  • 特許-オプティカルフローを用いたブロック境界予測リファインメント 図6
  • 特許-オプティカルフローを用いたブロック境界予測リファインメント 図7
  • 特許-オプティカルフローを用いたブロック境界予測リファインメント 図8A
  • 特許-オプティカルフローを用いたブロック境界予測リファインメント 図8B
  • 特許-オプティカルフローを用いたブロック境界予測リファインメント 図9
  • 特許-オプティカルフローを用いたブロック境界予測リファインメント 図10
  • 特許-オプティカルフローを用いたブロック境界予測リファインメント 図11
  • 特許-オプティカルフローを用いたブロック境界予測リファインメント 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-05-27
(45)【発行日】2024-06-04
(54)【発明の名称】オプティカルフローを用いたブロック境界予測リファインメント
(51)【国際特許分類】
   H04N 19/513 20140101AFI20240528BHJP
   H04N 19/176 20140101ALI20240528BHJP
【FI】
H04N19/513
H04N19/176
【請求項の数】 15
(21)【出願番号】P 2021570150
(86)(22)【出願日】2020-06-02
(65)【公表番号】
(43)【公表日】2022-08-02
(86)【国際出願番号】 US2020035759
(87)【国際公開番号】W WO2020247394
(87)【国際公開日】2020-12-10
【審査請求日】2023-06-02
(31)【優先権主張番号】62/856,519
(32)【優先日】2019-06-03
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】514041959
【氏名又は名称】ヴィド スケール インコーポレイテッド
(74)【代理人】
【識別番号】110001243
【氏名又は名称】弁理士法人谷・阿部特許事務所
(72)【発明者】
【氏名】チェン、ウェイ
(72)【発明者】
【氏名】ルオ、チャンコン
(72)【発明者】
【氏名】フ、ユーウェン
【審査官】久保 光宏
(56)【参考文献】
【文献】特表2020-511859(JP,A)
【文献】Jiancong (Daniel) Luo, et al.,"CE2-related: Prediction refinement with optical flow for affine mode",Document: JVET-N0236-r5, [online],JVET-N0236 (version 7),Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,2019年03月26日,Pages 1-7,[令和4年7月5日検索], インターネット, <URL: https://jvet-experts.org/doc_end_user/current_document.php?id=5956> and <URL: https://jvet-experts.org/doc_end_user/documents/14_Geneva/wg11/JVET-N0236-v7.zip>.,(See document file "JVET-N0236-r5.docx" in the zip file "JVET-N0236-v7.zip".)
【文献】Jianle Chen, et al.,"Algorithm description for Versatile Video Coding and Test Model 4 (VTM 4)",Document: JVET-M1002-v2, [online],JVET-M1002 (version 2),Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,2019年03月19日,Pages 1,4,5,23-39,48-54,[令和4年12月15日検索], インターネット, <URL: https://jvet-experts.org/doc_end_user/current_document.php?id=5756> and <URL: https://jvet-experts.org/doc_end_user/documents/13_Marrakech/wg11/JVET-M1002-v2.zip>.,(See document file "JVET-M1002-v2.docx" in the zip file "JVET-M1002-v2.zip".)
【文献】Wei Chen, et al.,"Non-CE9: Block Boundary Prediction Refinement with Optical Flow for DMVR",Document: JVET-O0581, [online],JVET-O0581 (version 3),Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,2019年07月06日,Pages 1-3,[令和6年4月15日検索], インターネット, <URL: https://jvet-experts.org/doc_end_user/current_document.php?id=7196> and <URL: https://jvet-experts.org/doc_end_user/documents/15_Gothenburg/wg11/JVET-O0581-v3.zip>.,(See document file "JVET-O0581-v2.DOCX" in the zip file "JVET-O0581-v3.zip".)
【文献】Yu-Ling Hsiao, et al.,"CE4-related: Overlapped block optical flow",Document: JVET-P0153-v2, [online],JVET-P0153 (version 2),Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,2019年09月30日,Pages 1-4,[令和6年4月15日検索], インターネット, <URL: https://jvet-experts.org/doc_end_user/current_document.php?id=7942> and <URL: https://jvet-experts.org/doc_end_user/documents/16_Geneva/wg11/JVET-P0153-v2.zip>.,(See document file "JVET-P0153-v2.docx" in the zip file "JVET-P0153-v2.zip".)
(58)【調査した分野】(Int.Cl.,DB名)
H04N19/00-19/98
CSDB(日本国特許庁)
学術文献等データベース(日本国特許庁)
IEEEXplore(IEEE)
(57)【特許請求の範囲】
【請求項1】
カレントサブブロックに対する動きベクトル(MV)と、前記カレントサブブロックと隣り合ったサブブロックに対するMVと、第1のピクセルと隣り合った第2のピクセルに対するサンプル値とに基づいて前記第1のピクセルに対するサンプル値を取得し、前記第1のピクセルは、前記カレントサブブロックの境界ピクセルであり、
前記第1のピクセルに対して前記取得されたサンプル値に基づいて、前記カレントサブブロックを含むブロックをデコードする
ように構成される1つまたは複数のプロセッサを備えたことを特徴とするビデオデコードのための装置。
【請求項2】
カレントサブブロックに対する動きベクトル(MV)と、前記カレントサブブロックと隣り合ったサブブロックに対するMVと、第1のピクセルと隣り合った第2のピクセルに対するサンプル値とに基づいて前記第1のピクセルに対するサンプル値を取得し、前記第1のピクセルは、前記カレントサブブロックの境界ピクセルであり、
前記第1のピクセルに対して前記取得されたサンプル値に基づいて、前記カレントサブブロックを含むブロックをエンコードする
ように構成される1つまたは複数のプロセッサを備えたことを特徴とするビデオエンコードのための装置。
【請求項3】
カレントサブブロックに対する動きベクトル(MV)と、前記カレントサブブロックと隣り合ったサブブロックに対するMVと、第1のピクセルと隣り合った第2のピクセルに対するサンプル値とに基づいて前記第1のピクセルに対するサンプル値を取得することであって、前記第1のピクセルは、前記カレントサブブロックの境界ピクセルである、ことと、
前記第1のピクセルに対して前記取得されたサンプル値に基づいて、前記カレントサブブロックを含むブロックをデコードすることと
を備えることを特徴とするビデオデコードのための方法。
【請求項4】
カレントサブブロックに対する動きベクトル(MV)と、前記カレントサブブロックと隣り合ったサブブロックに対するMVと、第1のピクセルと隣り合った第2のピクセルに対するサンプル値とに基づいて前記第1のピクセルに対するサンプル値を取得することであって、前記第1のピクセルは、前記カレントサブブロックの境界ピクセルである、ことと、
前記第1のピクセルに対して前記取得されたサンプル値に基づいて、前記カレントサブブロックを含むブロックをエンコードすることと
を備えることを特徴とするビデオエンコードのための方法。
【請求項5】
前記ブロックは、前記第1のピクセルと、前記第2のピクセルと、前記第1のピクセルと隣り合った第3のピクセルとを含み、前記1つまたは複数のプロセッサは、
前記第1のピクセルが前記カレントサブブロックの前記境界ピクセルであると決定し、
前記第1のピクセルが前記カレントサブブロックの前記境界ピクセルであるという決定に基づいて、
前記カレントサブブロックに対する前記MVと、前記カレントサブブロックと隣り合った前記サブブロックに対する前記MVとの差分を決定し、
前記第2のピクセルに対する前記サンプル値と、前記第3のピクセルに対するサンプル値とに基づいて前記第1のピクセルに対する勾配を決定し、
前記決定された勾配に基づいて、および、前記カレントサブブロックに対する前記MVと、前記カレントサブブロックと隣り合った前記サブブロックに対する前記MVとの前記差分に基づいて、サンプル値オフセットを決定し、
前記第1のピクセルに対する前記サンプル値は、前記決定されたサンプル値オフセットに基づいて取得される
ように構成されることを特徴とする請求項1に記載の装置。
【請求項6】
オプティカルフローモデルに対する勾配は、前記第2のピクセルに対する前記サンプル値に少なくとも基づいて決定され、前記第1のピクセルに対する前記サンプル値を取得するために前記オプティカルフローモデルにおいて使用されることを特徴とする請求項1に記載の装置。
【請求項7】
前記カレントサブブロックに対する前記MVと、前記カレントサブブロックと隣り合った前記サブブロックに対する前記MVと、前記第1のピクセルと隣り合った前記第2のピクセルに対する前記サンプル値とに基づいて前記第1のピクセルに対する前記サンプル値を取得することは、前記第1のピクセルと隣り合った前記第2のピクセルに対する前記サンプル値に基づいて、および、前記カレントサブブロックに対する前記MVと、前記カレントサブブロックと隣り合った前記サブブロックに対する前記MVとのMV差分に基づいて、前記第1のピクセルに対する前記サンプル値を取得することを含むことを特徴とする請求項1に記載の装置。
【請求項8】
前記ブロックは、前記第1のピクセルと、前記第2のピクセルと、前記第1のピクセルと隣り合った第3のピクセルとを含み、前記1つまたは複数のプロセッサは、
前記第1のピクセルが前記カレントサブブロックの前記境界ピクセルであると決定し、
前記第1のピクセルが前記カレントサブブロックの前記境界ピクセルであるという決定に基づいて、
前記カレントサブブロックに対する前記MVと、前記カレントサブブロックと隣り合った前記サブブロックに対する前記MVとの差分を決定し、
前記第2のピクセルに対する前記サンプル値と、前記第3のピクセルに対するサンプル値とに基づいて前記第1のピクセルに対する勾配を決定し、
前記決定された勾配に基づいて、および、前記カレントサブブロックに対する前記MVと、前記カレントサブブロックと隣り合った前記サブブロックに対する前記MVとの前記差分に基づいて、サンプル値オフセットを決定し、
前記第1のピクセルに対する前記サンプル値は、前記決定されたサンプル値オフセットに基づいて取得される
ように構成されることを特徴とする請求項2に記載の装置。
【請求項9】
前記カレントサブブロックに対する前記MVと、前記カレントサブブロックと隣り合った前記サブブロックに対する前記MVと、前記第1のピクセルと隣り合った前記第2のピクセルに対する前記サンプル値とに基づいて前記第1のピクセルに対する前記サンプル値を取得することは、前記第1のピクセルと隣り合った前記第2のピクセルに対する前記サンプル値に基づいて、および、前記カレントサブブロックに対する前記MVと、前記カレントサブブロックと隣り合った前記サブブロックに対する前記MVとのMV差分に基づいて、前記第1のピクセルに対する前記サンプル値を取得することを含むことを特徴とする請求項2に記載の装置。
【請求項10】
前記カレントサブブロックと隣り合った前記サブブロックは第1のサブブロックであり、前記ブロックは、前記第1のサブブロックと、前記カレントサブブロックと隣り合った第2のサブブロックとを含み、前記第1のピクセルに対する前記サンプル値は、前記第2のサブブロックに対するMVにさらに基づいて取得されることを特徴とする請求項3に記載の方法。
【請求項11】
前記ブロックは、前記第1のピクセルと、前記第2のピクセルと、前記第1のピクセルと隣り合った第3のピクセルとを含み、前記第1のピクセルに対して前記サンプル値を取得することは、
前記第1のピクセルが前記カレントサブブロックの前記境界ピクセルであると決定することと、
前記第1のピクセルが前記カレントサブブロックの前記境界ピクセルであるという決定に基づいて、
前記カレントサブブロックに対する前記MVと、前記カレントサブブロックと隣り合った前記サブブロックに対する前記MVとの差分を決定することと、
前記第2のピクセルに対する前記サンプル値と、前記第3のピクセルに対するサンプル値とに基づいて前記第1のピクセルに対する勾配を決定することと、
前記決定された勾配に基づいて、および、前記カレントサブブロックに対する前記MVと、前記カレントサブブロックと隣り合った前記サブブロックに対する前記MVとの前記差分に基づいて、サンプル値オフセットを決定することと、
前記決定されたサンプル値オフセットに基づいて前記第1のピクセルに対する前記サンプル値を取得することと
を含むことを特徴とする請求項3に記載の方法。
【請求項12】
前記カレントサブブロックと隣り合った前記サブブロックは第1のサブブロックであり、前記ブロックは、前記第1のサブブロックと、前記カレントサブブロックと隣り合った第2のサブブロックとを含み、前記第1のピクセルに対する前記サンプル値は、前記第2のサブブロックに対するMVにさらに基づいて取得されることを特徴とする請求項4に記載の方法。
【請求項13】
前記ブロックは、前記第1のピクセルと、前記第2のピクセルと、前記第1のピクセルと隣り合った第3のピクセルとを含み、前記第1のピクセルに対して前記サンプル値を取得することは、
前記第1のピクセルが前記カレントサブブロックの前記境界ピクセルであると決定することと、
前記第1のピクセルが前記カレントサブブロックの前記境界ピクセルであるという決定に基づいて、
前記カレントサブブロックに対する前記MVと、前記カレントサブブロックと隣り合った前記サブブロックに対する前記MVとの差分を決定することと、
前記第2のピクセルに対する前記サンプル値と、前記第3のピクセルに対するサンプル値とに基づいて前記第1のピクセルに対する勾配を決定することと、
前記決定された勾配に基づいて、および、前記カレントサブブロックに対する前記MVと、前記カレントサブブロックと隣り合った前記サブブロックに対する前記MVとの前記差分に基づいて、サンプル値オフセットを決定することと、
前記決定されたサンプル値オフセットに基づいて前記第1のピクセルに対する前記サンプル値を取得することと
を含むことを特徴とする請求項4に記載の方法。
【請求項14】
前記第1のピクセルおよび前記第2のピクセルは、前記カレントサブブロックにあることを特徴とする請求項3、4、および11ないし13のいずれか一項に記載の方法。
【請求項15】
前記カレントサブブロックの対応する境界からの前記第1のピクセルの距離に従って変化する重み因子は、前記第1のピクセルに対する前記サンプル値を取得するために使用されることを特徴とする請求項3、4、および11ないし13のいずれか一項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
[関連出願の相互参照]
本出願は、2019年6月3日に出願された、「Block Boundary Prediction Refinement with Optical Flow」という名称の米国特許仮出願第62/856519号明細書に対する優先権を主張し、その全体が、本明細書に完全に記載されているかのように参照により組み込まれている。
【背景技術】
【0002】
デジタルビデオ信号を圧縮し、たとえばそのような信号に必要とされる記憶および/または送信帯域幅を削減するために、ビデオ符号化システムが使用され得る。ビデオ符号化システムは、ブロックベース、ウェーブレットベース、および/またはオブジェクトベースのシステムを含み得る。ブロックベースのハイブリッドビデオ符号化システムが展開され得る。
【発明の概要】
【0003】
オプティカルフローを用いたブロック境界予測リファインメント(block boundary prediction refinement with optical flow:BBPROF)などサブブロック/ブロック境界リファインメントを含む、サブブロック/ブロックリファインメントのためのシステム、方法、および手段が開示される。カレントサブブロック(current sub-block)を含むブロックが、第1のピクセルのために得られたサンプル値に基づいてデコードされ得、このサンプル値は、たとえば、カレントサブブロックのための動きベクトル(MV)、カレントサブブロックと隣り合ったサブブロックのためのMV、および第1のピクセルと隣り合った第2のピクセルのためのサンプル値に基づいて得られ得る。サブブロック/ブロックリファインメントは、デコーダ側動きベクトルリファインメント(DMVR)モード、サブブロックベースの時間的動きベクトル予測(SbTMVP)モード、および/またはアフィンモードにおいて適用され得る。BBPROFは、たとえば、サブブロックベースの予測を生成するためにサブブロックベースの動き補償を含み得る。サブブロックベースの予測の空間的勾配は、1つまたは複数のピクセル/サンプルロケーションにて計算され得る。MV差は、カレントサブブロックと1つまたは複数の隣接したサブブロックとの間で計算され得る。MV差は、1つまたは複数のピクセル/サンプルロケーションにおける動きベクトルオフセットを計算するために使用され得る。カレントサブブロックにおけるピクセル当たりの強度変化が、オプティカルフローに基づいて計算され得る。ピクセル当たりの強度変化を示すために、サンプル値オフセットが使用され得る。たとえば計算された強度変化をサブブロック予測に加えることによって、ピクセルまたはサンプルロケーションのための予測(たとえば、動き補償予測)がリファインメントされ得る。
【0004】
例では、サブブロック/ブロックリファインメントを実施するための方法が実装され得る。方法は、たとえば、装置によって実装され得、装置は、コンピュータ可読媒体またはコンピュータプログラム製品に記憶され得る、1つまたは複数のプロセッサによって実行されたとき方法を実施するコンピュータ実行可能命令を実行するように構成された1つまたは複数のプロセッサを備え得る。したがって、装置は、方法を実施するように構成された1つまたは複数のプロセッサを備え得る。コンピュータ可読媒体またはコンピュータプログラム製品は、命令を実行することによって1つまたは複数のプロセッサに方法を実施させる命令を備え得る。コンピュータ可読媒体は、方法に従って生成されるデータ内容を含み得る。信号は、元の画像ブロックと、方法による第1のピクセルのための得られたサンプル値を使用して予測されるブロックとに基づいて生成される残差を含み得る。装置は、第2の方法を実行するように構成されたアクセシングユニットおよびトランスミッターを備え得、第2の方法は、方法を(たとえば、命令を実行することによって)実装するように構成された1つまたは複数のプロセッサを備え、残差を含むデータを送信する装置による、第1のピクセルのための得られたサンプル値に基づいて生成される残差を含むデータにアクセスすることを含む。テレビジョン、セルラ電話、タブレット、またはセットトップボックスなどデバイスは、方法を(たとえば、命令を実行することによって)実装するように構成された1つまたは複数のプロセッサと、(i)信号を受信するように構成され、信号は画像を表すデータを含む、アンテナ、(ii)受信された信号を、画像を表すデータを含む周波数の帯域に制限するように構成されたバンドリミッタ、または(iii)画像を表示するように構成されたディスプレイのうちの少なくとも1つとを有する装置を備え得る。
【0005】
たとえば、サブブロック/ブロックリファインメントを実施するための方法は、たとえばカレントサブブロックのためのMV、カレントサブブロックと隣り合ったサブブロックのためのMV、および第1のピクセルと隣り合った第2のピクセルのためのサンプル値に基づいて、第1のピクセルのためのサンプル値を得ることと、第1のピクセルのための得られたサンプル値に基づいてカレントサブブロックを含むブロックをデコードすることとを含み得る。
【0006】
たとえば、カレントサブブロックを含むブロックを第1のピクセルのための得られたサンプル値に基づいてエンコードする方法は、たとえばカレントサブブロックのためのMV、カレントサブブロックと隣り合ったサブブロックのためのMV、および第1のピクセルと隣り合った第2のピクセルのためのサンプル値に基づいて、第1のピクセルのためのサンプル値を得ることと、第1のピクセルのための得られたサンプル値に基づいてカレントサブブロックを含むブロックをエンコードすることとを含み得る。
【0007】
ブロックは、たとえば、第1のピクセル、第2のピクセル、および第1のピクセルと隣り合った第3のピクセルを含み得る。第1のピクセルのためのサンプル値を得ることは、たとえば、第1のピクセルがカレントサブブロックの境界と隣り合ったと決定することと、(i)カレントサブブロックのためのMVとカレントサブブロックと隣り合ったサブブロックのためのMVとの間の差、(ii)第2のピクセルのためのサンプル値および第3のピクセルのためのサンプル値に基づく第1のピクセルのための勾配、ならびに(iii)決定された勾配およびカレントサブブロックのためのMVとカレントサブブロックと隣り合ったサブブロックのためのMVとの間の差に基づくサンプル値オフセットを決定することと、決定されたサンプル値オフセットに基づいて第1のピクセルのためのサンプル値を決定することとを含み得る。
【0008】
たとえば少なくとも第2のピクセルのためのサンプル値に基づいて、勾配が決定され得る。第1のピクセルのためのサンプル値は、この勾配を使用して得られ得る。
【0009】
たとえば少なくとも第2のピクセルのためのサンプル値に基づいて、オプティカルフローモデルのための勾配が決定され得る。この勾配は、第1のピクセルのためのサンプル値を得るために、オプティカルフローモデルにおいて使用され得る。
【0010】
カレントサブブロックのためのMVと、カレントサブブロックと隣り合ったサブブロックのためのMVとの差が、第1のピクセルのためのサンプル値を得るために使用され得る。
【0011】
カレントサブブロックと隣り合ったサブブロックは、第1のサブブロックであってよい。このブロックは、第1のサブブロックと、カレントサブブロックと隣り合った第2のサブブロックとを含み得る。第1のピクセルのためのサンプル値は、第2のサブブロックのためのMVに(たとえば、さらに)基づいて得られ得る。
【0012】
第1のピクセルのためのサンプル値は、第1のピクセルがカレントサブブロックの境界と隣り合ったという決定に基づいて得られ得る。
【0013】
第1のピクセルおよび第2のピクセルは、カレントサブブロック内にあり得る。
【0014】
重み係数は、第1のピクセルのためのサンプル値を得るために使用され得る。重み係数は、カレントサブブロックの対応する境界からの第1のピクセルの距離に従って変わり得る。
【0015】
第1のピクセルのためのサンプル値オフセットが、たとえばカレントサブブロックのためのMV、カレントサブブロックと隣り合ったサブブロックのためのMV、および第1のピクセルと隣り合った第2のピクセルのためのサンプル値に基づいて決定され得る。第1のピクセルのためのサンプル値は、決定されたサンプル値オフセットおよび予測される第1のピクセルのためのサンプル値を使用して得られ得る。
【0016】
第1のピクセルのためのサンプル値は、たとえば第1のピクセルがカレントサブブロックの境界と隣り合ったという決定に基づいて得られ得る。カレントサブブロックの境界は、カレントサブブロックと、カレントサブブロックと隣り合ったサブブロックとの間の共通の境界を含み得る。
【0017】
第1のピクセルは、たとえば、カレントサブブロックの上部の境界からのピクセルの4つの行内、カレントサブブロックの下部の境界からのピクセルの4つの行内、カレントサブブロックの左の境界からのピクセルの4つの列内、またはカレントサブブロックの右の境界からのピクセルの4つの列内に位置し得る。
【0018】
本明細書のどこにでも開示される各特徴が、記載されており、別々に/個々に、また本明細書に開示されている任意の他の特徴と、および/あるいは本明細書で暗黙に、もしくは明示的に参照され得る、またはその他の点で本明細書に開示されている主題の範囲内に入り得る、どこかに開示されている任意の特徴との任意の組合せで実装され得る。
【図面の簡単な説明】
【0019】
図1A】1つまたは複数の開示されている実施形態が実装され得る例示的な通信システムを示すシステム図である。
図1B】一実施形態による、図1Aに示されている通信システム内で使用され得る例示的なワイヤレス送信/受信ユニット(WTRU)を示すシステム図である。
図1C】一実施形態による、図1Aに示されている通信システム内で使用され得る例示的な無線アクセスネットワーク(RAN)および例示的なコアネットワーク(CN)を示すシステム図である。
図1D】一実施形態による、図1Aに示されている通信システム内で使用され得るさらなる例示的なRANおよびさらなる例示的なCNを示すシステム図である。
図2】例示的なビデオエンコーダを示す図である。
図3】ビデオデコーダの一例を示す図である。
図4】様々な態様および例が実装され得るシステムの一例を示す図である。
図5】例示的な4パラメータアフィンモードモデルおよびアフィンブロックについてのサブブロックレベルの動き導出の図である。
図6】例示的な6パラメータアフィンモードの図であり、V0、V1、およびV2は制御点であり、(MVx,MVy)は、位置(x,y)を中心とするサブブロックの動きベクトルである。
図7】例示的なデコード側動きベクトル(MV)リファインメントの図である。
図8A】サブブロックベースの時間的動きベクトル予測(SbTMVP)によって使用され得る空間的に隣接したブロックの一例の図である。
図8B】サブ符号化単位(sub-coding unit(CU))動きフィールドの例示的な導出の図である。
図9】オーバーラップブロック動き補償(OBMC)が適用される例示的なサブブロックの図である。
図10】例示的なサブブロックMV(VSB)およびピクセルΔv(i,j)を示す図である。
図11】式(1)~(25)のうちの1つまたは複数による、サブブロック/ブロックリファインメントのための方法の一例の図である。
図12】選択された隣接したサブブロックからの例示的なMV差計算の図である。
【発明を実施するための形態】
【0020】
次に例示的な実施形態の詳細な説明を、様々な図を参照して記載する。この説明は、可能な実装の詳細な例を提供するが、これらの詳細は、例示的なものであることが意図されており、本出願の範囲を決して限定しないことに留意されたい。
【0021】
図1Aは、1つまたは複数の開示されている実施形態が実装され得る例示的な通信システム100を示す図である。通信システム100は、音声、データ、ビデオ、メッセージング、ブロードキャストなどコンテンツを複数のワイヤレスユーザに提供する多元接続システムであってよい。通信システム100は、複数のワイヤレスユーザがワイヤレス帯域幅を含むシステムリソースの共有を通じてそのようなコンテンツにアクセスすることを可能にし得る。たとえば、通信システム100は、符号分割多元接続(CDMA)、時分割多元接続(TDMA)、周波数分割多元接続(FDMA)、直交FDMA(OFDMA)、シングルキャリアFDMA(SC-FDMA)、ZT UW DTS-s OFDM(zero-tail unique-word DFT-Spread OFDM)、UW-OFDM(unique word OFDM)、リソースブロックフィルタされたOFDM(resource block-filtered OFDM)、FBMC(filter bank multicarrier:)など1つまたは複数のチャネルアクセス方法を使用し得る。
【0022】
図1Aに示されているように、通信システム100は、ワイヤレス送信/受信ユニット(WTRU)102a、102b、102c、102d、RAN104/113、CN106/115、公衆交換電話網(PSTN)108、インターネット110、および他のネットワーク112を含み得るが、開示されている実施形態は、任意の数のWTRU、基地局、ネットワーク、および/またはネットワーク要素を企図していることを理解されたい。WTRU102a、102b、102c、102dのそれぞれは、ワイヤレス環境において動作および/または通信するように構成された任意のタイプのデバイスであってよい。例として、そのいずれかが「局」および/または「STA」と称されることがあるWTRU102a、102b、102c、102dは、ワイヤレス信号を送信および/または受信するように構成され得、ユーザ機器(UE)、移動局、固定またはモバイル加入者ユニット、サブスクリプションベースのユニット、ページャ、セルラ電話、パーソナルデジタルアシスタント(PDA)、スマートフォン、ラップトップ、ネットブック、パーソナルコンピュータ、ワイヤレスセンサ、ホットスポットまたはMi-Fiデバイス、モノのインターネット(IoT)デバイス、時計または他のウェアラブル、ヘッドマウントディスプレイ(HMD)、車両、ドローン、医療デバイスおよびアプリケーション(たとえば、遠隔手術)、産業用デバイスおよびアプリケーション(たとえば、産業用および/または自動化処理チェーンの状況で動作するロボットおよび/または他のワイヤレスデバイス)、家庭用電子デバイス、商用および/または産業用ワイヤレスネットワーク上で動作するデバイスなどを含み得る。WTRU102a、102b、102c、および102dのいずれも、UEと交換可能に称されることがある。
【0023】
通信システム100は、基地局114aおよび/または基地局114bをも含み得る。基地局114a、114bのぞれぞれは、CN106/115、インターネット110、および/または他のネットワーク112など1つまたは複数の通信ネットワークへのアクセスを容易にするために、WTRU102a、102b、102c、102dのうちの少なくとも1つとワイヤレスでインターフェースするように構成された任意のタイプのデバイスであってよい。例として、基地局114a、114bは、ベーストランシーバ局(BTS)、Node-B、eNode B、Home Node B、Home eNode B、gNB、NR NodeB、サイトコントローラ、アクセスポイント(AP)、ワイヤレスルータなどであってよい。基地局114a、114bは、それぞれ単一の要素として示されているが、基地局114a、114bは、任意の数の相互接続された基地局および/またはネットワーク要素を含み得ることを理解されたい。
【0024】
基地局114aは、RAN104/113の一部であってよく、RAN104/113は、基地局コントローラ(BSC)、無線ネットワークコントローラ(RNC)、中継ノードなど他の基地局および/またはネットワーク要素(図示せず)をも含み得る。基地局114aおよび/または基地局114bは、セル(図示せず)と称されることがある1つまたは複数のキャリア周波数でワイヤレス信号を送信および/または受信するように構成され得る。これらの周波数は、免許のあるスペクトル、免許不要のスペクトル、または免許のあるスペクトルと免許不要のスペクトルの組合せにあってよい。セルは、比較的固定され得る、または経時的に変化し得る特定の地域にワイヤレスサービスのためのカバレージを提供し得る。セルは、セルセクタにさらに区分され得る。たとえば、基地局114aに関連付けられたセルは、3つのセクタに区分され得る。したがって、一実施形態では、基地局114aは、3つのトランシーバ、すなわちセルの各セクタについて1つのトランシーバを含み得る。一実施形態では、基地局114aは、多入力多出力(MIMO)技術を使用し得、セルの各セクタについて複数のトランシーバを利用し得る。たとえば、所望の空間的方向で信号を送信および/または受信するために、ビームフォーミングが使用され得る。
【0025】
基地局114a、114bは、任意の好適なワイヤレス通信リンク(たとえば、無線周波数(RF)、マイクロ波、センチメートル波、マイクロメートル波、赤外線(IR)、紫外線(UV)、可視光など)であってよいエアインターフェース116を介して、WTRU102a、102b、102c、102dのうちの1つまたは複数と通信し得る。エアインターフェース116は、任意の好適な無線アクセス技術(RAT)を使用して確立され得る。
【0026】
より具体的には、上記のように、通信システム100は、多元接続システムであってよく、CDMA、TDMA、FDMA、OFDMA、SC-FDMAなど1つまたは複数のチャネルアクセス方式を使用し得る。たとえば、RAN104/113内の基地局114a、およびWTRU102a、102b、102cは、広帯域CDMA(WCDMA)を使用してエアインターフェース115/116/117を確立し得るユニバーサル移動体通信システム(UMTS)地上無線アクセス(UTRA)など無線技術を実装し得る。WCDMAは、高速パケットアクセス(HSPA)および/またはイボルブドHSPA(HSPA+)など通信プロトコルを含み得る。HSPAは、高速ダウンリンク(DL)パケットアクセス(HSDPA)および/または高速ULパケットアクセス(HSUPA)を含み得る。
【0027】
一実施形態では、基地局114aおよびWTRU102a、102b、102cは、ロングタームエボリューション(LTE)および/またはLTE-Advanced(LTE-A)および/またはLTE-Advanced Pro(LTE-A Pro)を使用してエアインターフェース116を確立し得るイボルブドUMTS地上無線アクセス(E-UTRA)など無線技術を実装し得る。
【0028】
一実施形態では、基地局114aおよびWTRU102a、102b、102cは、新無線(NR)を使用してエアインターフェース116を確立し得るNR無線アクセスなど無線技術を実装し得る。
【0029】
一実施形態では、基地局114aおよびWTRU102a、102b、102cは、複数の無線アクセス技術を実装し得る。たとえば、基地局114aおよびWTRU102a、102b、102cは、たとえばデュアルコネクティビティ(DC)原理を使用して、LTE無線アクセスとNR無線アクセスを共に実装し得る。したがって、WTRU102a、102b、102cによって利用されるエアインターフェースは、複数のタイプの無線アクセス技術および/または複数のタイプの基地局(たとえば、eNBおよびgNB)へ/から送られる送信によって特徴付けられ得る。
【0030】
他の実施形態では、基地局114aおよびWTRU102a、102b、102cは、IEEE802.11(すなわち、ワイヤレスフィデリティ(WiFi)、IEEE802.16(すなわち、Worldwide Interoperability for Microwave Access(WiMAX))、CDMA2000、CDMA2000 1X、CDMA2000 EV-DO、暫定標準2000(IS-2000)、暫定標準95(IS-95)、暫定標準856(IS-856)、Global System for Mobile communications(GSM)、Enhanced Data rates for GSM Evolution(EDGE)、GSM EDGE(GERAN)など無線技術を実装し得る。
【0031】
図1Aにおける基地局114bは、たとえば、ワイヤレスルータ、Home Node B、Home eNode B、またはアクセスポイントであってよく、職場、家庭、車両、キャンパス、産業施設、空中回廊(たとえば、ドローンによって使用される)、道路など局所的なエリアにおいてワイヤレスコネクティビティを容易にするために任意の好適なRATを利用し得る。一実施形態では、基地局114bおよびWTRU102c、102dは、ワイヤレスローカルエリアネットワーク(WLAN)を確立するためにIEEE802.11など無線技術を実装し得る。一実施形態では、基地局114bおよびWTRU102c、102dは、ワイヤレスパーソナルエリアネットワーク(WPAN)を確立するためにIEEE802.15など無線技術を実装し得る。さらに別の実施形態では、基地局114bおよびWTRU102c、102dは、ピコセルまたはフェムトセルを確立するためにセルラベースのRAT(たとえば、WCDMA、CDMA2000、GSM、LTE、LTE-A、LTE-A Pro、NRなど)を利用し得る。図1Aに示されているように、基地局114bは、インターネット110への直接接続を有し得る。したがって、基地局114bは、CN106/115を介してインターネット110にアクセスすることが必要とされないことがある。
【0032】
RAN104/113は、音声、データ、アプリケーション、および/またはボイスオーバーインターネットプロトコル(VoIP)サービスをWTRU102a、102b、102c、102dのうちの1つまたは複数に提供するように構成された任意のタイプのネットワークであってよいCN106/115と通信状態にあり得る。データは、異なるスループット要件、レイテンシ要件、エラー耐性要件、信頼性要件、データスループット要件、モビリティ要件など変動するサービス品質(QoS)要件を有し得る。CN106/115は、呼制御、課金サービス、モバイルロケーションベースのサービス、プリペイド通話、インターネットコネクティビティ、ビデオ配信などを提供し、および/またはユーザ認証など上位セキュリティ機能を実施し得る。図1Aには示されていないが、RAN104/113および/またはCN106/115は、RAN104/113と同じRAT、または異なるRATを使用する他のRANと直接または間接的な通信状態にあり得ることを理解されたい。たとえば、NR無線技術を利用していることがあるRAN104/113に接続されることに加えて、CN106/115はまた、GSM、UMTS、CDMA 2000、WiMAX、E-UTRA、またはWiFi無線技術を使用する別のRAN(図示せず)と通信状態にあり得る。
【0033】
CN106/115は、WTRU102a、102b、102c、102dがPSTN108、インターネット110、および/または他のネットワーク112にアクセスするためのゲートウェイとしても働き得る。PSTN108は、基本電話サービス(POTS)を提供する回線交換電話ネットワークを含み得る。インターネット110は、TCP/IPインターネットプロトコルスイートにおける伝送制御プロトコル(TCP)、ユーザデータグラムプロトコル(UDP)、および/またはインターネットプロトコル(IP)など共通の通信プロトコルを使用する相互接続されたコンピュータネットワークおよびデバイスのグローバルなシステムを含み得る。ネットワーク112は、他のサービスプロバイダによって所有および/または運用される有線および/またはワイヤレス通信ネットワークを含み得る。たとえば、ネットワーク112は、RAN104/113と同じRAT、または異なるRATを使用し得る1つまたは複数のRANに接続された別のCNを含み得る。
【0034】
通信システム100内のWTRU102a、102b、102c、102dの一部またはすべてが、マルチモード機能を含み得る(たとえば、WTRU102a、102b、102c、102dは、異なるワイヤレスリンクを介して異なるワイヤレスネットワークと通信するために複数のトランシーバを含み得る)。たとえば、図1Aに示されているWTRU102cは、セルラベースの無線技術を使用し得る基地局114aとも、IEEE802無線技術を使用し得る基地局114bとも通信するように構成され得る。
【0035】
図1Bは、例示的なWTRU102を示すシステム図である。図1Bに示されているように、WTRU102は、とりわけ、プロセッサ118、トランシーバ120、送信/受信要素122、スピーカ/マイクロフォン124、キーパッド126、ディスプレイ/タッチパッド128、取外しできないメモリ130、取外し可能メモリ132、電源134、全地球測位システム(GPS)チップセット136、および/または他のペリフェラル138を含み得る。WTRU102は、一実施形態と一貫したまま前述の要素のサブコンビネーションを含み得ることを理解されたい。
【0036】
プロセッサ118は、汎用プロセッサ、専用プロセッサ、従来のプロセッサ、デジタル信号プロセッサ(DSP)、複数のマイクロプロセッサ、DSPコアに関連付けられた1つまたは複数のマイクロプロセッサ、コントローラ、マイクロコントローラ、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)回路、任意の他のタイプの集積回路(IC)、ステートマシンなどであってよい。プロセッサ118は、信号符号化、データ処理、電力制御、入力/出力処理、および/またはWTRU102がワイヤレス環境内で動作することを可能にする任意の他の機能性を実施し得る。プロセッサ118は、トランシーバ120に結合され得、トランシーバ120は、送信/受信要素122に結合され得る。図1Bは、プロセッサ118とトランシーバ120とを別々の構成要素として示しているが、プロセッサ118およびトランシーバ120は、電子パッケージまたはチップ内で共に一体化されてよいことを理解されたい。
【0037】
送信/受信要素122は、エアインターフェース116を介して基地局(たとえば、基地局114a)に信号を送信し、またはそこから信号を受信するように構成され得る。たとえば、一実施形態では、送信/受信要素122は、RF信号を送信および/または受信するように構成されたアンテナであってよい。一実施形態では、送信/受信要素122は、たとえば、IR、UV、または可視光信号を送信および/または受信するように構成されたエミッタ/検出器であってよい。別の実施形態では、送信/受信要素122は、RF信号と光信号を共に送信および/または受信するように構成され得る。送信/受信要素122は、ワイヤレス信号の任意の組合せを送信および/または受信するように構成され得ることを理解されたい。
【0038】
送信/受信要素122は、単一の要素として図1Bに示されているが、WTRU102は、任意の数の送信/受信要素122を含み得る。より具体的には、WTRU102は、MIMO技術を使用し得る。したがって、一実施形態では、WTRU102は、エアインターフェース116を介してワイヤレス信号を送信および受信するために、2つ以上の送信/受信要素122(たとえば、複数のアンテナ)を含み得る。
【0039】
トランシーバ120は、送信/受信要素122によって送信されることになる信号を変調するように、また送信/受信要素122によって受信される信号を復調するように構成され得る。上記のように、WTRU102は、マルチモード機能を有し得る。したがって、トランシーバ120は、たとえばNRおよびIEEE802.11など複数のRATを介してWTRU102が通信することを可能にするために複数のトランシーバを含み得る。
【0040】
WTRU102のプロセッサ118は、スピーカ/マイクロフォン124、キーパッド126、および/またはディスプレイ/タッチパッド128(たとえば、液晶ディスプレイ(LCD)ディスプレイユニットまたは有機発光ダイオード(OLED)ディスプレイユニット)に結合され得、それらからユーザ入力データを受信し得る。また、プロセッサ118は、ユーザデータをスピーカ/マイクロフォン124、キーパッド126、および/またはディスプレイ/タッチパッド128に出力し得る。さらに、プロセッサ118は、取外しできないメモリ130および/または取外し可能メモリ132など任意のタイプの好適なメモリからの情報にアクセスし、それらにデータを記憶し得る。取外しできないメモリ130は、ランダムアクセスメモリ(RAM)、読出し専用メモリ(ROM)、ハードディスク、または任意の他のタイプのメモリストレージデバイスを含み得る。取外し可能メモリ132は、加入者識別モジュール(SIM)カード、メモリスティック、セキュアデジタル(SD)メモリカードなどを含み得る。他の実施形態では、プロセッサ118は、サーバまたは家庭用コンピュータ(図示せず)上などWTRU102上に物理的に位置しないメモリからの情報にアクセスし、それらにデータを記憶し得る。
【0041】
プロセッサ118は、電源134から電力を受信し得、WTRU102内の他の構成要素への電力を分配および/または制御するように構成され得る。電源134は、WTRU102に給電するための任意の好適なデバイスであってよい。たとえば、電源134は、1つまたは複数の乾電池(たとえば、ニッケル・カドミウム(NiCd)、ニッケル亜鉛(NiZn)、ニッケル水素(NiMH)、リチウムイオン(Li-ion)など)、太陽電池、燃料電池などを含み得る。
【0042】
プロセッサ118は、GPSチップセット136にも結合され得、GPSチップセット136は、WTRU102の現在のロケーションに関するロケーション情報(たとえば、経度および緯度)を提供するように構成され得る。GPSチップセット136からの情報に加えて、またはその代わりに、WTRU102は、エアインターフェース116を介して基地局(たとえば、基地局114a、114b)からロケーション情報を受信し、および/または信号が2つ以上の近くの基地局から受信されるタイミングに基づいてそのロケーションを決定し得る。WTRU102は、一実施形態と一貫したまま任意の好適なロケーション決定方法によりロケーション情報を獲得し得ることを理解されたい。
【0043】
プロセッサ118は、追加の特徴、機能性、および/または有線もしくはワイヤレスコネクティビティを提供する1つまたは複数のソフトウェアおよび/またはハードウェアモジュールを含み得る他のペリフェラル138にさらに結合され得る。たとえば、ペリフェラル138は、加速度計、電子コンパス、衛星トランシーバ、デジタルカメラ(写真および/またはビデオ用)、ユニバーサルシリアルバス(USB)ポート、振動デバイス、テレビジョントランシーバ、ハンズフリーヘッドセット、Bluetooth(登録商標)モジュール、周波数変調(FM)無線ユニット、デジタル音楽プレーヤ、メディアプレーヤ、ビデオゲームプレーヤモジュール、インターネットブラウザ、仮想現実および/または拡張現実(VR/AR)デバイス、活動量計(activity tracker)などを含み得る。ペリフェラル138は、1つまたは複数のセンサを含み得、これらのセンサは、ジャイロスコープ、加速度計、ホール効果センサ、磁力計、方位センサ、近接センサ、温度センサ、時間センサ、ジオロケーションセンサ、高度計、光センサ、タッチセンサ、磁力計、気圧計、ジェスチャセンサ、バイオメトリックセンサ、および/または湿度センサのうちの1つまたは複数であってよい。
【0044】
WTRU102は、(たとえば、UL(たとえば、送信用)とダウンリンク(たとえば、受信用)両方のために特定のサブフレームに関連付けられる信号の一部またはすべての送信および受信が同時発生的および/または同時であり得る全二重無線を含み得る。全二重無線は、ハードウェア(たとえば、チョーク)、またはプロセッサを介した(たとえば、別個のプロセッサ(図示せず)またはプロセッサ118を介した)信号処理を介して自己干渉を低減および/または実質的に解消するための干渉管理ユニットを含み得る。一実施形態では、WRTU102は、(たとえば、UL(たとえば、送信用)またはダウンリンク(たとえば、受信用)のための特定のサブフレームに関連付けられる)信号の一部またはすべての送信および受信のための半二重無線を含み得る。
【0045】
図1Cは、一実施形態によるRAN104およびCN106を示すシステム図である。上記のように、RAN104は、エアインターフェース116を介してWTRU102a、102b、102cと通信するために、E-UTRA無線技術を使用し得る。また、RAN104は、CN106と通信状態にあり得る。
【0046】
RAN104は、eNode-B160a、160b、160cを含み得るが、RAN104は、一実施形態と一貫したまま任意の数のeNode-Bを含み得ることを理解されたい。eNode-B160a、160b、160cは、それぞれ、エアインターフェース116を介してWTRU102a、102b、102cと通信するために1つまたは複数のトランシーバを含み得る。一実施形態では、eNode-B160a、160b、160cは、MIMO技術を実装し得る。したがって、たとえばeNode-B160aは、複数のアンテナを使用し、WTRU102aにワイヤレス信号を送信し、および/またはそこからワイヤレス信号を受信し得る。
【0047】
eNode-B160a、160b、160cのそれぞれは、特定のセル(図示せず)に関連付けられ得、無線リソース管理判断、ハンドオーバー判断、ULおよび/またはDLにおけるユーザのスケジューリングなどを扱うように構成され得る。図1Cに示されているように、eNode-B160a、160b、160cは、X2インターフェースを介して互いに通信し得る。
【0048】
図1Cに示されているCN106は、モビリティ管理エンティティ(MME)162、サービングゲートウェイ(SGW)164、およびパケットデータネットワーク(PDN)ゲートウェイ(またはPGW)166を含み得る。前述の要素のそれぞれは、CN106の一部として示されているが、これらの要素のいずれも、CNオペレータ以外のエンティティによって所有および/または運用され得ることを理解されたい。
【0049】
MME162は、S1インターフェースを介してRAN104内のeNode-B162a、162b、162cのそれぞれに接続され得、制御ノードとして働き得る。たとえば、MME162は、WTRU102a、102b、102cのユーザを認証すること、ベアラ活性化/非活性化、WTRU102a、102b、102cの初期アタッチ中に特定のサービングゲートウェイを選択することなどを担い得る。MME162は、RAN104とGSMおよび/またはWCDMAなど他の無線技術を使用する他のRAN(図示せず)との間で切り替えるための制御プレーン機能を提供し得る。
【0050】
SGW164は、S1インターフェースを介してRAN104内のeNode B160a、160b、160cのそれぞれに接続され得る。SGW164は、一般に、ユーザデータパケットをWTRU102a、102b、102cに/からルーティングおよび転送し得る。SGW164は、eNode B間ハンドオーバー中にユーザプレーンをアンカリングすること、DLデータがWTRU102a、102b、102cにとって使用可能であるときページングをトリガすること、WTRU102a、102b、102cのコンテキストを管理および記憶することなど、他の機能を実施し得る。
【0051】
SGW164は、WTRU102a、102b、102cとIP対応デバイスとの間の通信を容易にするために、インターネット110などパケット交換ネットワークへのアクセスをWTRU102a、102b、102cに提供し得るPGW166に接続され得る。
【0052】
CN106は、他のネットワークとの通信を容易にし得る。たとえば、CN106は、WTRU102a、102b、102cと従来の陸線通信デバイスとの間の通信を容易にするために、PSTN108など回線交換ネットワークへのアクセスをWTRU102a、102b、102cに提供し得る。たとえば、CN106は、CN106とPSTN108との間のインターフェースとして働くIPゲートウェイ(たとえば、IPマルチメディアサブシステム(IMS)サーバ)を含み得、またはそれと通信し得る。さらに、CN106は、他のサービスプロバイダによって所有および/または運用される他の有線および/またはワイヤレスネットワークを含み得る他のネットワーク112へのアクセスをWTRU102a、102b、102cに提供し得る。
【0053】
WTRUはワイヤレス端末として図1A図1Dに示されているが、いくつかの代表的な実施形態では、そのような端末は、通信ネットワークとの有線通信インターフェースを(たとえば、一時的または恒久的に)使用し得ることが企図されている。
【0054】
代表的な実施形態では、他のネットワーク112は、WLANであってよい。
【0055】
インフラストラクチャ基本サービスセット(BSS)モードにおけるWLANは、BSSのためのアクセスポイント(AP)と、APに関連付けられた1つまたは複数の局(STA)とを有し得る。APは、BSS内へ、および/またはそこからトラフィックを搬送する分散システム(DS)または別のタイプの有線/ワイヤレスネットワークへのアクセスまたはインターフェースを有し得る。BSSの外から発生するSTAへのトラフィックは、APを通じて到着し得、STAに送達され得る。BSSの外の宛先へのSTAから発生するトラフィックは、それぞれの宛先に送達されるようにAPに送られ得る。BSS内でのSTA間のトラフィックは、APを通じて送られ得、たとえば、送信元STAがトラフィックをAPに送り得、APは、トラフィックを宛先STAに送達し得る。BSS内でのSTA間のトラフィックは、ピアトゥピアトラフィックと考えられ、および/またはそのように称され得る。ピアトゥピアトラフィックは、直接リンクセットアップ(DLS)を用いて送信元STAと宛先STAとの間で(たとえば、その間で直接)送られ得る。いくつかの代表的な実施形態では、DLSは、802.11eDLSまたは802.11zトンネルドDLS(TDLS)を使用し得る。独立BSS(IBSS)モードを使用するWLANは、APを有していないことがあり、IBSS内、またはそれを使用するSTA(たとえば、すべてのSTA)は、互いに直接通信し得る。IBSS通信モードは、本明細書では、「アドホック」通信モードと称されることがある。
【0056】
802.11acインフラストラクチャ動作モードまたは同様の動作モードを使用するとき、APは、プライマリチャネルなど固定チャネル上でビーコンを送信し得る。プライマリチャネルは、固定幅(たとえば、20MHz幅の帯域幅)、またはシグナリングを介して動的に設定された幅であってよい。プライマリチャネルは、BSSの動作チャネルであってよく、STAによって、APとの接続を確立するために使用され得る。いくつかの代表的な実施形態では、搬送波感知多重アクセス/衝突回避方式(CSMA/CA)が、たとえば802.11システムにおいて実装され得る。CSMA/CAの場合、APを含めて、STA(たとえば、あらゆるSTA)はプライマリチャネルを感知し得る。プライマリチャネルが特定のSTAによって感知/検出され、および/またはビジーであると決定された場合、その特定のSTAは、バックオフし得る。1つのSTA(たとえば、1つだけの局)が、所与のBSS内で任意の所与の時間に送信し得る。
【0057】
高スループット(HT)STAは、通信のために40MHz幅チャネルを、たとえば、40MHz幅チャネルを形成するためにプライマリ20MHzチャネルと、隣り合った、または隣り合っていない20MHzチャネルとの組合せを介して使用し得る。
【0058】
超高スループット(VHT)STAは、20MHz、40MHz、80MHz、および/または160MHz幅チャネルをサポートし得る。40MHzおよび/または80MHzチャネルは、連続的な20MHzチャネル同士を組み合わせることによって形成され得る。160MHzチャネルは、8つの連続的な20MHzチャネルを組み合わせることによって、または80+80構成と称されることがある、2つの連続しない80MHzチャネルを組み合わせることによって形成され得る。80+80構成の場合、データは、チャネルエンコード後、セグメントパーサを通過させられ得、セグメントパーサは、データを2つのストリームに区分し得る。逆高速フーリエ変換(IFFT)処理、および時間領域処理が、各ストリームに対して別々に行われ得る。ストリームは、2つの80MHzチャネルにマッピングされ得、データは、送信STAによって送信され得る。受信STAの受信機において、80+80構成のための上記の動作が逆に行われ得、組み合わされたデータは、媒体アクセス制御(MAC)に送られ得る。
【0059】
サブ1GHz動作モードは、802.11afおよび802.11ahによってサポートされる。チャネル動作帯域幅、およびキャリアは、802.11afおよび802.11ahにおいて、802.11nおよび802.11acで使用されるものに対して削減される。802.11afは、TVホワイトスペース(TVWS)スペクトルにおける5MHz、10MHz、および20MHz帯域幅をサポートし、802.11ahは、非TVWSスペクトルを使用して1MHz、2MHz、4MHz、8MHz、および16MHz帯域幅をサポートする。代表的な実施形態によれば、802.11ahは、マクロカバレージエリア内のMTCデバイスなどメータタイプ制御/マシンタイプ通信(Meter Type Control/Machine-Type Communication)をサポートし得る。MTCデバイスは、いくつかの機能、たとえば、いくつかの、および/または限られた帯域幅のサポート(たとえば、それだけのサポート)を含む限られた機能を有し得る。MTCデバイスは、(たとえば、非常に長い電池寿命を維持するために)閾値より高い電池寿命を有する電池を含み得る。
【0060】
802.11n、802.11ac、802.11af、および802.11ahなど、複数のチャネルおよびチャネル帯域幅をサポートし得るWLANシステムは、プライマリチャネルとして指定され得るチャネルを含む。プライマリチャネルは、BSS内のすべてのSTAによってサポートされる最大の共通動作帯域幅に等しい帯域幅を有し得る。プライマリチャネルの帯域幅は、BSS内で動作中のすべてのSTAの中から最小の帯域幅動作モードをサポートするSTAによって設定および/または制限され得る。802.11ahの例では、プライマリチャネルは、APおよびBSS内の他のSTAが2MHz、4MHz、8MHz、16MHz、および/または他のチャネル帯域幅動作モードをサポートする場合でさえ、1MHzモードをサポートする(たとえば、それだけサポートする)STA(たとえば、MTCタイプデバイス)について1MHz幅であり得る。搬送波感知および/またはネットワーク割当てベクトル(NAV)設定は、プライマリチャネルの状況に依存し得る。プライマリチャネルが、たとえばSTA(1MHz動作モードだけをサポートする)がAPに送信しているためにビジーである場合、周波数帯域の大部分がアイドルのままであり使用可能であり得るにもかかわらず、使用可能な周波数帯域全体がビジーと考えられ得る。
【0061】
米国では、802.11ahによって使用され得る使用可能な周波数帯域は、902MHzから928MHzである。韓国では、使用可能な周波数帯域は、917.5MHzから923.5MHzである。日本では、使用可能な周波数帯域は、916.5MHzから927.5MHzである。802.11ahに使用可能な総帯域幅は、国番号に応じて6MHzから26MHzである。
【0062】
図1Dは、一実施形態によるRAN113およびCN115を示すシステム図である。上記のように、RAN113は、エアインターフェース116を介してWTRU102a、102b、102cと通信するために、NR無線技術を使用し得る。また、RAN113は、CN115と通信状態にあり得る。
【0063】
RAN113は、gNB180a、180b、180cを含み得るが、RAN113は、一実施形態と一貫したまま任意の数のgNBを含み得ることを理解されたい。gNB180a、180b、180cは、それぞれ、エアインターフェース116を介してWTRU102a、102b、102cと通信するために、1つまたは複数のトランシーバを含み得る。一実施形態では、gNB180a、180b、180cは、MIMO技術を実装し得る。たとえば、gNB180a、108bは、ビームフォーミングを利用し、信号をgNB180a、180b、180cに送信し、および/またはそれらから信号を受信し得る。したがって、たとえばgNB180aは、複数のアンテナを使用し、WTRU102aにワイヤレス信号を送信し、および/またはそこからワイヤレス信号を受信し得る。一実施形態では、gNB180a、180b、180cは、キャリアアグリゲーション技術を実装し得る。たとえば、gNB180aは、複数のコンポーネントキャリアをWTRU102a(図示せず)に送信し得る。これらのコンポーネントキャリアのサブセットは、免許不要のスペクトル上にあってよく、一方、残りのコンポーネントキャリアは、免許のあるスペクトル上にあり得る。一実施形態では、gNB180a、180b、180cは、協調マルチポイント(CoMP)技術を実装し得る。たとえば、WTRU102aは、gNB180a、およびgNB180b(および/またはgNB180c)から協調送信(coordinated transmission)を受信し得る。
【0064】
WTRU102a、102b、102cは、スケーラブルヌメロロジ(scalable numerology)に関連付けられた送信を使用してgNB180a、180b、180cと通信し得る。たとえば、OFDMシンボル間隔および/またはOFDMサブキャリア間隔は、異なる送信、異なるセル、および/またはワイヤレス送信スペクトルの異なる部分について変わり得る。WTRU102a、102b、102cは、サブフレーム、または様々なもしくはスケーラブルな長さ(たとえば、変動する数のOFDMシンボルを含む、および/または変動する長さの絶対時間の間続く)の送信時間間隔(TTI)を使用してgNB180a、180b、180cと通信し得る。
【0065】
gNB180a、180b、180cは、スタンドアロン構成および/または非スタンドアロン構成でWTRU102a、102b、102cと通信するように構成され得る。スタンドアロン構成では、WTRU102a、102b、102cは、他のRAN(たとえば、eNode-B160a、160b、160cなど)にもアクセスすることなくgNB180a、180b、180cと通信し得る。スタンドアロン構成では、WTRU102a、102b、102cは、gNB180a、180b、180cのうちの1つまたは複数をモビリティアンカポイントとして利用し得る。スタンドアロン構成では、WTRU102a、102b、102cは、免許不要の帯域内の信号を使用してgNB180a、180b、180cと通信し得る。非スタンドアロン構成では、WTRU102a、102b、102cは、gNB180a、180b、180cと通信/接続し得、一方、eNode-B160a、160b、160cなど別のRANとも通信/接続する。たとえば、WTRU102a、102b、102cは、DC原理を実装し、1つまたは複数のgNB180a、180b、180cおよび1つまたは複数のeNode-B160a、160b、160cと実質的に同時に通信し得る。非スタンドアロン構成では、eNode-B160a、160b、160cは、WTRU102a、102b、102cのためのモビリティアンカとして働き得、gNB180a、180b、180cは、WTRU102a、102b、102cにサービスするために追加のカバレージおよび/またはスループットを提供し得る。
【0066】
gNB180a、180b、180cのそれぞれは、特定のセル(図示せず)に関連付けられ得、無線リソース管理判断、ハンドオーバー判断、ULおよび/またはDLにおけるユーザのスケジューリング、ネットワークスライシングのサポート、デュアルコネクティビティ、NRとE-UTRAとの間の相互動作、ユーザプレーン機能(UPF)184a、184bに向けてのユーザプレーンデータのルーティング、アクセスおよびモビリティ管理機能(AMF)182a、182bに向けての制御プレーン情報のルーティングなどを扱うように構成され得る。図1Dに示されているように、gNB180a、180b、180cは、Xnインターフェースを介して互いに通信し得る。
【0067】
図1Dに示されているCN115は、少なくとも1つのAMF182a、182b、少なくとも1つのUPF184a、184b、少なくとも1つのセッション管理機能(SMF)183a、183b、およびおそらくはデータネットワーク(DN)185a、185bを含み得る。前述の要素のそれぞれは、CN115の一部として示されているが、これらの要素のいずれも、CNオペレータ以外のエンティティによって所有および/または運用され得ることを理解されたい。
【0068】
AMF182a、182bは、N2インターフェースを介してRAN113内のgNB180a、180b、180cのうちの1つまたは複数に接続され得、制御ノードとして働き得る。たとえば、AMF182a、182bは、WTRU102a、102b、102cのユーザを認証すること、ネットワークスライシングのためのサポート(たとえば、異なる要件を有する異なるPDUセッションの扱い)、特定のSMF183a、183bを選択すること、登録エリアの管理、NASシグナリングの終了、モビリティ管理などを担い得る。ネットワークスライシングは、WTRU102a、102b、102cによって利用されるサービスのタイプに基づいてWTRU102a、102b、102cのためのCNサポートをカスタマイズするために、AMF182a、182bによって使用され得る。たとえば、超高信頼低遅延(URLLC)アクセスに依拠するサービス、高速大容量(eMBB)アクセスに依拠するサービス、マシンタイプ通信(MTC)アクセスのためのサービス、および/または同様のものなど異なるユースケースのために、異なるネットワークスライスが確立され得る。AMF162は、RAN113と、LTE、LTE-A、LTE-A Pro、および/またはWiFiなど非3GPPアクセス技術など他の無線技術を使用する他のRAN(図示せず)との間で切り替えるための制御プレーン機能を提供し得る。
【0069】
SMF183a、183bは、N11インターフェースを介してCN115内のAMF182a、182bに接続され得る。SMF183a、183bは、N4インターフェースを介してCN115内のUPF184a、184bにも接続され得る。SMF183a、183bは、UPF184a、184bを選択および制御し、UPF184a、184bを通じてトラフィックのルーティングを構成し得る。SMF183a、183bは、UE IPアドレスを管理し割り当てること、PDUセッションを管理すること、ポリシ施行およびQoSを制御すること、ダウンリンクデータ通知を提供することなど他の機能を実施し得る。PDUセッションタイプは、IPベースのもの、非IPベースのもの、イーサネットベースのものなどであってよい。
【0070】
UPF184a、184bは、N3インターフェースを介してRAN113内のgNB180a、180b、180cのうちの1つまたは複数に接続され得、これは、WTRU102a、102b、102cとIP対応デバイスとの間の通信を容易にするように、インターネット110などパケット交換ネットワークへのアクセスをWTRU102a、102b、102cに提供し得る。UPF184、184bは、パケットをルーティングおよび転送すること、ユーザプレーンポリシを施行すること、マルチホームのPDUセッションをサポートすること、ユーザプレーンQoSを扱うこと、ダウンリンクパケットをバッファすること、モビリティアンカリングを提供することなど他の機能を実施し得る。
【0071】
CN115は、他のネットワークとの通信を容易にし得る。たとえば、CN115は、CN115とPSTN108との間のインターフェースとして働くIPゲートウェイ(たとえば、IPマルチメディアサブシステム(IMS)サーバ)を含み得、またはそれと通信し得る。さらに、CN115は、他のサービスプロバイダによって所有および/または運用される他の有線および/またはワイヤレスネットワークを含み得る他のネットワーク112へのアクセスをWTRU102a、102b、102cに提供し得る。一実施形態では、WTRU102a、102b、102cは、N3インターフェースからUPF184a、184b、およびUPF184a、184bとDN185a、185bとの間のN6インターフェースを介して、UPF184a、184bを通じてローカルのデータネットワーク(DN)185a、185bに接続され得る。
【0072】
図1A図1D、および図1A図1Dの対応する説明に鑑みて、WTRU102a~d、基地局114a~b、eNode-B160a~c、MME162、SGW164、PGW166、gNB180a~c、AMF182a~b、UPF184a~b、SMF183a~b、DN185a~b、および/または本明細書に記載の任意の他のデバイスのうちの1つもしくは複数に関して本明細書に記載されている機能の1つもしくは複数またはすべては、1つまたは複数のエミュレーションデバイス(図示せず)によって実施され得る。エミュレーションデバイスは、本明細書に記載の機能の1つもしくは複数またはすべてをエミュレーションするように構成された1つまたは複数のデバイスであってよい。たとえば、エミュレーションデバイスは、他のデバイスをテストする、ならびに/またはネットワークおよび/もしくはWTRU機能をシミュレーションするために使用され得る。
【0073】
エミュレーションデバイスは、ラボ環境において、および/またはオペレータネットワーク環境において他のデバイスの1つまたは複数のテストを実装するように設計され得る。たとえば、1つまたは複数のエミュレーションデバイスは、通信ネットワーク内で他のデバイスをテストするために、有線および/またはワイヤレス通信ネットワークの一部として完全にまたは部分的に実装および/または展開されながら、1つもしくは複数の、またはすべての機能を実施し得る。1つまたは複数のエミュレーションデバイスは、有線および/またはワイヤレス通信ネットワークの一部として一時的に実装/展開されながら、1つもしくは複数の、またはすべての機能を実施し得る。エミュレーションデバイスは、テストのために別のデバイスに直接結合され得、および/またはオーバー・ジ・エアーワイヤレス通信を使用してテストを実施し得る。
【0074】
1つまたは複数のエミュレーションデバイスは、有線および/またはワイヤレス通信ネットワークの一部として実装/展開されていない間に、すべてを含む1つまたは複数の機能を実施し得る。たとえば、エミュレーションデバイスは、1つまたは複数の構成要素のテストを実装するために、テスト研究室および/または非展開の(たとえば、テスト用)有線および/またはワイヤレス通信ネットワーク内でのテストシナリオで利用され得る。1つまたは複数のエミュレーションデバイスは、テスト機器であってよい。RF回路(たとえば、1つまたは複数のアンテナを含み得る)を介した直接RF結合および/またはワイヤレス通信が、データを送信および/または受信するためにエミュレーションデバイスによって使用され得る。
【0075】
本出願は、ツール、特徴、例または実施形態、モデル、手法などを含む様々な態様について記載している。これらの態様の多くは、詳細に記載されており、少なくとも個々の特性を示すために、しばしば限定的に思われるような仕方で記載されている。しかし、これは説明をわかりやすくするためのものであり、本出願またはこれらの態様の範囲を限定しない。実際、異なる態様のすべてが、さらなる態様を提供するために組み合わされ、相互交換され得る。さらに、これらの態様は、先願に記載されている態様とも組み合わされ、相互交換され得る。
【0076】
本出願において記載および企図されている態様は、多数の異なる形態で実装され得る。本明細書に記載の図5図12は、いくつかの実施形態を提供し得るが、他の実施形態が企図されている。図5図12の考察は、それらの実装の広さを限定しない。それらの態様のうちの少なくとも1つは、一般に、ビデオエンコードおよびデコードに関し、少なくとも1つの他の態様は、一般に、生成またはエンコードされたビットストリームを送信することに関する。これらおよび他の態様は、方法、装置、記載の方法のいずれかに従ってビデオデータをエンコードまたはデコードするための命令が記憶されているコンピュータ可読記憶媒体、および/または記載の方法のいずれかに従って生成されるビットストリームが記憶されているコンピュータ可読記憶媒体として実装され得る。
【0077】
本出願では、「再構築」および「デコード」という用語は、相互交換可能に使用され得、「ピクセル」および「サンプル」という用語は、相互交換可能に使用され得、「画像」、「ピクチャ」および「フレーム」は、相互交換可能に使用され得る。
【0078】
様々な方法が本明細書に記載されており、これらの方法のそれぞれは、記載の方法を達成するための1つまたは複数のステップまたはアクションを含む。方法の適正な動作のためにステップまたはアクションの特定の順序が必要とされない限り、特定のステップおよび/またはアクションの順序および/または使用は、修正され、または組み合わされ得る。さらに、「第1の」、「第2の」などの用語は、様々な実施形態において、たとえば、「第1のデコード」および「第2のデコード」など、要素、構成要素、ステップ、動作などを修正するために使用され得る。そのような用語の使用は、特に必要とされない限り、修正された動作に対する順序を暗示しない。したがって、この例では、第1のデコードは、第2のデコードの前に実施されることを必要とせず、たとえば、第2のデコードの前、第2のデコードの間、または第2のデコードと重なり合う期間に行われ得る。
【0079】
本出願に記載の様々な方法および他の態様は、図2および図3に示されているように、ビデオエンコーダ200およびデコーダ300のモジュール、たとえば、イントラ予測およびエントロピーコーディング(entropy coding)および/またはデコードモジュール(260、360、245、330)を修正するために使用され得る。さらに、本明細書に開示されている主題は、VVCまたはHEVCに限定されない態様を提示し、たとえば、既存か将来開発されるかにかかわらず標準または推奨に、また任意のそのような標準および推奨(たとえば、VVCおよびHEVCを含む)の拡張に記載されているかどうかにかかわらず、任意のタイプ、フォーマット、またはバージョンのビデオ符号化に適用され得る。別段示されていない限り、または技術的に除外されない限り、本出願に記載の態様は、個々に、または組合せで使用され得る。
【0080】
本出願に記載の例では、{1/4,1/8,1/16,1/32}または{3/4,7/8,15/16,31/32}などの重み係数、3タップフィルタ[-1,0,1]などのフィルタなど、様々な数値が使用される。これらおよび他の特定の値は、例について記載するためのものであり、記載されている態様は、これらの特定の値に限定されない。
【0081】
図2は、例示的なビデオエンコーダを示す図である。例示的なエンコーダ200の変形形態が企図されているが、エンコーダ200は、すべての予想される変形形態について記載することなく、わかりやすくするために下記に記載されている。
【0082】
エンコードされる前、ビデオシーケンスは、プレエンコード処理(201)、たとえば、色変換を入力カラーピクチャに適用すること(たとえば、RGB4:4:4からYCbCr4:2:0への変換)、または信号分配を圧縮に対してより弾力性のあるものにするために(たとえば、色成分のうちの1つのヒストグラム等化を使用して)入力ピクチャ成分の再マッピングを実施することを受け得る。メタデータがこの前処理に関連付けられ、ビットストリームにアタッチされ得る。
【0083】
エンコーダ200では、ピクチャは、下記のようにエンコーダ要素によってエンコードされる。エンコードされることになるピクチャは、たとえば、符号化単位(CU)の単位で区分(202)および処理される。各単位は、たとえば、イントラモードまたはインターモードを使用してエンコードされる。単位がイントラモードでエンコードされるとき、それはイントラ予測を実施する(260)。インターモードでは、動き推定(275)および補償(270)が実施される。エンコーダは、単位をエンコードするために使用するイントラモードまたはインターモードのどちらか1つを判断(205)し、たとえば、予測モードフラグによってイントラ/インター判断を示す。たとえば、予測ブロックを元の画像ブロックから減算する(210)ことによって予測残差が計算される。
【0084】
次いで、予測残差は、変換(225)および量子化(230)される。量子化された変換係数は、動きベクトルおよび他のシンタックス要素も同様に、ビットストリームを出力するようにエントロピーコーディング(245)される。エンコーダは、変換を飛ばし、量子化を未変換の残差信号に直接適用することができる。エンコーダは、変換と量子化を共にバイパスすることができ、すなわち、残差は、変換または量子化プロセスを適用することなく直接符号化される。
【0085】
エンコーダは、さらなる予測のための参照を提供するために、エンコードされたブロックをデコードする。量子化された変換係数は、予測残差をデコードするために、逆量子化(240)および逆変換(250)される。デコードされた予測残差と予測されたブロックを組み合わせると(255)、画像ブロックが再構築される。たとえば、ブロック解除/SAO(サンプル適応オフセット)フィルタを実施しエンコードアーチファクトを低減するために、インループフィルタ(265)が再構築されたピクチャに適用される。フィルタされた画像は、参照ピクチャバッファ(280)にて記憶される。
【0086】
図3は、ビデオデコーダの一例を示す図である。例示的なデコーダ300では、下記のようにデコーダ要素によってビットストリームがデコードされる。ビデオデコーダ300は、一般に、図2に記載のエンコードパスに対して逆のデコードパスを実施する。エンコーダ200もまた、一般に、ビデオデータをエンコードする一部としてビデオデコードを実施する。たとえば、エンコーダ200は、本明細書に提示されているビデオデコードステップのうちの1つまたは複数を実施し得る。エンコーダは、たとえば、参照ピクチャ、エントロピーコーディングコンテキスト、および他のデコーダ関連の状態変数のうちの1つまたは複数に関して、デコーダと同期を維持するためにデコードされた画像を再構築する。
【0087】
特に、デコーダの入力は、ビデオエンコーダ200によって生成され得るビデオビットストリームを含む。ビットストリームは、最初に、変換係数、動きベクトル、および他の符号化された情報を得るためにエントロピーデコード(330)される。ピクチャ分割情報は、ピクチャがどのように分割されるかを示す。したがって、デコーダは、デコードされたピクチャ分割情報に従ってピクチャを区分(335)する。変換係数は、予測残差をデコードするために逆量子化(340)および逆変換(350)される。デコードされた予測残差と予測されたブロックを組み合わせると(355)、画像ブロックが再構築される。予測ブロックは、イントラ予測(360)または動き補償予測(すなわち、インター予測)(375)から得られ得る(370)。インループフィルタ(365)が再構築された画像に適用される。フィルタされた画像は、参照ピクチャバッファにて記憶される(380)。
【0088】
デコードされたピクチャは、ポストデコード処理(post-decoding processing)(385)、たとえば、逆色変換(たとえば、YCbCr4:2:0からRGB4:4:4への変換)、またはプレエンコード処理(201)において実施された再マッピングプロセスの逆を実施する逆再マッピングをさらに受け得る。ポストデコード処理は、プレエンコード処理において導出されビットストリーム内でシグナリングされたメタデータを使用することができる。
【0089】
図4は、本明細書に記載の様々な態様および実施形態が実装され得るシステムの一例を示す図である。システム400は、下記に記載の様々な構成要素を含むデバイスとして具体化され得、本書に記載の態様のうちの1つまたは複数を実施するように構成される。そのようなデバイスの例は、それだけには限らないが、パーソナルコンピュータ、ラップトップコンピュータ、スマートフォン、タブレットコンピュータ、デジタルマルチメディアセットトップボックス、デジタルテレビジョン受信機、パーソナルビデオ記録システム、コネクテッド家電、およびサーバなど様々な電子デバイスを含む。システム400の要素は、単独または組合せで、単一の集積回路(IC)、複数のIC、および/またはディスクリート構成要素で具体化され得る。たとえば、少なくとも1つの例では、システム400の処理およびエンコーダ/デコーダ要素は、複数のICおよび/またはディスクリート構成要素にわたって分散される。様々な実施形態では、システム400は、たとえば、通信バスを介して、または専用の入力および/または出力ポートを通じて1つまたは複数の他のシステムまたは他の電子デバイスに通信可能に結合される。様々な実施形態では、システム400は、本書に記載の態様のうちの1つまたは複数を実装するように構成される。
【0090】
システム400は、たとえば、本書に記載の様々な態様を実装するためにロードされた命令を実行するように構成された少なくとも1つのプロセッサ410を含む。プロセッサ410は、当技術分野で知られているように、埋込みメモリ、入力出力インターフェース、および様々な他の回路を含むことができる。システム400は、少なくとも1つのメモリ420(たとえば、揮発性メモリデバイスおよび/または不揮発性メモリデバイス)を含む。システム400は、それだけには限らないが、電気的消去可能なプログラマブル読出し専用メモリ(EEPROM)、読出し専用メモリ(ROM)、プログラマブル読出し専用メモリ(PROM)、ランダムアクセスメモリ(RAM)、ダイナミックランダムアクセスメモリ(DRAM)、スタティックランダムアクセスメモリ(SRAM)、フラッシュ、磁気ディスクドライブ、および/または光ディスクドライブを含む不揮発性メモリおよび/または揮発性メモリを含むことができるストレージデバイス440を含む。ストレージデバイス440は、非限定的な例として、内部ストレージデバイス、取付けストレージデバイス(取外し可能および非取外し可能なストレージデバイスを含む)、および/またはネットワークアクセス可能なストレージデバイスを含むことができる。
【0091】
システム400は、たとえば、エンコードされたビデオまたはデコードされたビデオを提供するためにデータを処理するように構成されたエンコーダ/デコーダモジュール430を含み、エンコーダ/デコーダモジュール430は、それ自体のプロセッサおよびメモリを含むことができる。エンコーダ/デコーダモジュール430は、エンコードおよび/またはデコード機能を実施するためにデバイス内に含まれ得るモジュールを表す。知られているように、デバイスは、エンコードモジュールおよびデコードモジュールの一方または両方を含むことができる。さらに、エンコーダ/デコーダモジュール430は、システム400の別個の要素として実装されてよく、または当業者に知られているようにハードウェアとソフトウェアの組合せとしてプロセッサ410内に組み込まれてもよい。
【0092】
本書に記載の様々な態様を実施するためにプロセッサ410またはエンコーダ/デコーダ430上にロードされることになるプログラムコードは、ストレージデバイス440内に記憶され、その後、プロセッサ410によって実行するためにメモリ420上にロードされ得る。様々な実施形態によれば、プロセッサ410、メモリ420、ストレージデバイス440、およびエンコーダ/デコーダモジュール430のうちの1つまたは複数は、本書に記載のプロセスの実行中、様々なアイテムのうちの1つまたは複数を記憶することができる。そのような記憶されるアイテムは、それだけには限らないが、入力ビデオ、デコードされたビデオまたはデコードされたビデオの一部分、ビットストリーム、行列、変数、ならびに式、公式、演算、および動作論理の処理からの中間または最終結果を含むことができる。
【0093】
いくつかの実施形態では、プロセッサ410および/またはエンコーダ/デコーダモジュール430内部のメモリは、命令を記憶し、エンコードまたはデコードの間に必要とされる処理のためのワーキングメモリを提供するために使用される。しかし、他の実施形態では、処理デバイス外部のメモリ(たとえば、処理デバイスは、プロセッサ410またはエンコーダ/デコーダモジュール430であってよい)が、これらの機能のうちの1つまたは複数のために使用される。外部メモリは、メモリ420および/またはストレージデバイス440、たとえば、ダイナミック揮発性メモリおよび/または不揮発性フラッシュメモリであってよい。いくつかの実施形態では、外部不揮発性フラッシュメモリが、たとえば、テレビジョンのオペレーティングシステムを記憶するために使用される。少なくとも1つの実施形態では、RAMなど高速な外部ダイナミック揮発性メモリが、たとえば、MPEG-2(MPEGは動画専門家集団を指し、MPEG-2はISO/IEC13818とも称され、13818-1はH.222としても知られ、13818-2はH.262としても知られる)、HEVC(HEVCは高効率ビデオ符号化を指し、H.265およびMPEG-H Part2としても知られる)、またはVVC(多目的ビデオ符号化、JVET、Joint Video Experts Teamによって開発された新標準)などビデオ符号化およびデコード動作のためのワーキングメモリとして使用される。
【0094】
システム400の要素への入力は、ブロック445に示されている様々な入力デバイスを通じて提供され得る。そのような入力デバイスは、それだけには限らないが、(i)たとえば放送者によって無線で送信されるRF信号を受信する無線周波数(RF)部分、(ii)Component(COMP)入力端子(またはCOMP入力端子のセット)、(iii)ユニバーサルシリアルバス(USB)入力端子、および/または(iv)高精細マルチメディアインターフェース(HDMI)入力端子を含む。図4に示されていない他の例は、コンポジットビデオを含む。
【0095】
様々な実施形態では、ブロック445の入力デバイスは、当技術分野で知られている関連のそれぞれの入力処理要素を有する。たとえば、RF部は、(i)所望の周波数を選択すること(信号を選択すること、または信号を周波数のある帯域に帯域制限することとも称される)、(ii)選択された信号をダウンコンバートすること、(iii)(たとえば)いくつかの実施形態においてチャネルと称されることがある信号周波数帯域を選択するために、周波数のより狭い帯域に再度帯域制限すること、(iv)ダウンコンバートおよび帯域制限された信号を復調すること、(v)誤り訂正を実施すること、および(vi)データパケットの所望のストリームを選択するために逆多重化することに適した要素に関連付けられ得る。様々な実施形態のRF部は、これらの機能を実施するための1つまたは複数の要素、たとえば、周波数セレクタ、信号セレクタ、バンドリミッタ、チャネルセレクタ、フィルタ、ダウンコンバータ、デモジュレータ、誤り訂正器、およびデマルチプレクサを含む。RF部は、たとえば、受信された信号をより低い周波数(たとえば、中間周波数または近ベースバンド周波数)またはベースバンドにダウンコンバートすることを含む様々なこれらの機能を実施するチューナを含むことができる。1つのセットトップボックスの実施形態では、RF部およびその関連の入力処理要素は、有線(たとえば、ケーブル)媒体を介して送信されるRF信号を受信し、フィルタし、ダウンコンバートし、所望の周波数帯域に再度フィルタすることによって周波数選択を実施する。様々な実施形態は、上記の(および他の)要素の順序を並べ替え、これらの要素のいくつかを除去し、および/または同様の、または異なる機能を実施する他の要素を追加する。要素を追加することは、既存の要素間に要素を挿入すること、たとえば、増幅器およびアナログ-デジタルコンバータを挿入することを含むことができる。様々な実施形態では、RF部は、アンテナを含む。
【0096】
さらに、USBおよび/またはHDMI端子は、システム400をUSBおよび/またはHDMI接続をわたって他の電子デバイスに接続するためのそれぞれのインターフェースプロセッサを含むことができる。入力処理の様々な態様、たとえば、リード-ソロモン誤り訂正が、必要に応じてたとえば、別個の入力処理IC内、またはプロセッサ410内に実装され得ることを理解されたい。同様に、USBまたはHDMIインターフェース処理の態様は、必要に応じて別々のインターフェースIC内、またはプロセッサ410内に実装され得る。復調、誤り訂正、および逆多重化されたストリームは、たとえば、出力デバイス上で提示するための必要に応じてデータストリームを処理するためにメモリおよび記憶要素との組合せで動作するプロセッサ410、およびエンコーダ/デコーダ430を含む様々な処理要素に提供される。
【0097】
システム400の様々な要素は、一体化されたハウジング内に設けられ得る。一体化されたハウジング内では、様々な要素は、好適な接続構成425、たとえば、インターIC(I2C)バス、配線、およびプリント回路板を含む、当技術分野で知られている内部バスを使用して相互接続され、それらの間でデータを送信し得る。
【0098】
システム400は、通信チャネル460を介して他のデバイスとの通信を可能にする通信インターフェース450を含む。通信インターフェース450は、それだけには限らないが、通信チャネル460を介してデータを送信し受信するように構成されたトランシーバを含むことができる。通信インターフェース450は、それだけには限らないが、モデムまたはネットワークカードを含むことができ、通信チャネル460は、たとえば、有線および/またはワイヤレス媒体内に実装され得る。
【0099】
データは、様々な実施形態では、Wi-Fiネットワーク、たとえばIEEE802.11(IEEEは、電気電子学会を指す)などワイヤレスネットワークを使用してシステム400にストリーミングされ、または他の方法で提供される。これらの例のWi-Fi信号は、Wi-Fi通信に適合された通信チャネル460および通信インターフェース450を介して受信される。これらの実施形態の通信チャネル460は、典型的には、ストリーミングアプリケーションおよび他のオーバーザトップ通信を可能にするために、インターネットを含む外部ネットワークへのアクセスを提供するアクセスポイントまたはルータに接続される。他の実施形態は、入力ブロック445のHDMI接続を介してデータを送達するセットトップボックスを使用して、ストリーミングされるデータをシステム400に提供する。さらに他の実施形態は、入力ブロック445のRF接続を使用して、ストリーミングされるデータをシステム400に提供する。上記のように、様々な実施形態は、データを非ストリーミング式で提供する。さらに、様々な実施形態は、Wi-Fi以外のワイヤレスネットワーク、たとえばセルラネットワークまたはBluetoothネットワークを使用する。
【0100】
システム400は、出力信号をディスプレイ475、スピーカ485、および他の周辺デバイス495を含む様々な出力デバイスに提供することができる。様々な実施形態のディスプレイ475は、たとえば、タッチスクリーンディスプレイ、有機発光ダイオード(OLED)ディスプレイ、カーブディスプレイ、および/または折り畳み式ディスプレイのうちの1つまたは複数を含む。ディスプレイ475は、テレビジョン、タブレット、ラップトップ、セルフォン(モバイルフォン)または他のデバイス用であってよい。ディスプレイ475は、他の構成要素と一体化されても(たとえば、スマートフォンの場合と同様)、または別々(たとえば、ラップトップ用の外部モニタ)であってもよい。他の周辺デバイス495は、実施形態の様々な例では、スタンドアロンのデジタルビデオディスク(またはデジタル多用途ディスク)(両用語についてDVR)、ディスクプレーヤ、ステレオシステム、および/または照明システムのうちの1つまたは複数を含む。様々な実施形態は、システム400の出力に基づいて機能を提供する1つまたは複数の周辺デバイス495を使用する。たとえば、ディスクプレーヤが、システム400の出力を再生する機能を実施する。
【0101】
様々な実施形態では、AV.Link、コンシューマエレクトロニクスコントロール(CEC)、またはユーザの介在あり、もしくはなしでデバイス間制御を可能にする他の通信プロトコルなどシグナリングを使用して、制御信号がシステム400とディスプレイ475、スピーカ485、または他の周辺デバイス495との間で通信される。出力デバイスは、それぞれのインターフェース470、480、および490を通じた専用の接続を介して、システム400に通信可能に結合され得る。あるいは、出力デバイスは、通信インターフェース450を介した通信チャネル460を使用して、システム400に接続され得る。ディスプレイ475およびスピーカ485は、単一のユニットで、たとえばテレビジョンなど電子デバイス内のシステム400の他の構成要素と一体化されてよい。様々な実施形態では、ディスプレイインターフェース470は、たとえば、タイミングコントローラ(T Con)チップなどディスプレイドライバを含む。
【0102】
ディスプレイ475およびスピーカ485は、代替として、たとえば入力445のRF部が別個のセットトップボックスの一部である場合、他の構成要素のうちの1つまたは複数とは別々とすることができる。ディスプレイ475およびスピーカ485が外部構成要素である様々な実施形態では、出力信号は、たとえば、HDMIポート、USBポート、またはCOMP出力を含む専用の出力接続を介して提供され得る。
【0103】
実施形態は、プロセッサ410によってもしくはハードウェアによって実装されるコンピュータソフトウェアによって、またはハードウェアとソフトウェアの組合せによって実施され得る。非限定的な例として、実施形態は、1つまたは複数の集積回路によって実装され得る。メモリ420は、その技術環境にとって適切な任意のタイプのものであってよく、非限定的な例として、光メモリデバイス、磁気メモリデバイス、半導体ベースのメモリデバイス、固定メモリ、および取外し可能メモリなど任意の適切なデータ記憶技術を使用して実装され得る。プロセッサ410は、その技術環境にとって適切な任意のタイプのものであってよく、非限定的な例として、マイクロプロセッサ、汎用コンピュータ、専用コンピュータ、およびマルチコアアーキテクチャに基づくプロセッサのうちの1つまたは複数を包含することができる。
【0104】
様々な実装は、デコードを含む。「デコード」は、本出願で使用されるとき、たとえば、表示するために適した最終出力を生成するために受信されたエンコードされたシーケンスに対して実施されるプロセスのすべてまたは一部を包含することができる。様々な実施形態では、そのようなプロセスは、典型的にはデコーダによって実施されるプロセス、たとえば、エントロピーデコード、逆量子化、逆変換、および差動復号(differential decoding)のうちの1つまたは複数を含む。様々な実施形態では、そのようなプロセスはやはり、または代替として、本出願に記載の様々な実装のデコーダによって実施されるプロセス、たとえば、第1のピクセルについて得られるサンプル値に基づいてカレントサブブロックを含むブロックをデコードすることを含み、サンプル値は、たとえば、カレントサブブロックのための動きベクトル(MV)、カレントサブブロックと隣り合ったサブブロックのためのMV、および第1のピクセルと隣り合った第2のピクセルのためのサンプル値などに基づいて得られ得る。
【0105】
さらなる実施形態として、一例では、「デコード」は、エントロピーデコードだけを指し、別の実施形態では、「デコード」は、差動復号だけを指し、別の実施形態では、「デコード」は、エントロピーデコードと差動復号の組合せを指す。「デコード処理」という句が動作のサブセットを特に指すことが意図されているか、それとも広いデコード処理を概して指すことが意図されているかは、特定の説明の文脈に基づいて明らかになり、当業者によって十分に理解されると考えられる。
【0106】
様々な実装は、エンコードを含む。「デコード」についての上記の考察と同様に、「エンコード」は、本出願で使用されるとき、たとえば、エンコードされたビットストリームを生成するために入力ビデオシーケンスに対して実施されるプロセスのすべてまたは一部を包含することができる。様々な実施形態では、そのようなプロセスは、典型的にはエンコーダによって実施されるプロセス、たとえば、分割、差動符号化(differential encoding)、変換、量子化、およびエントロピー符号化(entropy encoding)のうちの1つまたは複数を含む。様々な実施形態では、そのようなプロセスはやはり、または代替として、本出願に記載の様々な実装のエンコーダによって実施されるプロセス、たとえば、第1のピクセルについて得られるサンプル値に基づいてカレントサブブロックを含むブロックをエンコードすることを含み、サンプル値は、たとえば、カレントサブブロックのための動きベクトル(MV)、カレントサブブロックと隣り合ったサブブロックのためのMV、および第1のピクセルと隣り合った第2のピクセルのためのサンプル値などに基づいて得られ得る。
【0107】
さらなる例として、一実施形態では、「エンコード」は、エントロピー符号化だけを指し、別の実施形態では、「エンコード」は、差動符号化だけを指し、別の実施形態では、「エンコード」は、差動符号化およびエントロピー符号化の組合せを指す。「エンコード処理」という句が動作のサブセットを特に指すことが意図されているか、それとも広いエンコード処理を概して指すことが意図されているかは、特定の説明の文脈に基づいて明らかになり、当業者によって十分に理解されると考えられる。
【0108】
本明細書で使用されるシンタックス要素は説明的用語であることに留意されたい。したがって、それらは、他のシンタックス要素名の使用を排除しない。
【0109】
図がフロー図として提示されているとき、それは対応する装置のブロック図をも提供することを理解されたい。同様に、図がブロック図として提示されているとき、それは対応する方法/プロセスのフロー図をも提供することを理解されたい。
【0110】
しばしば計算の複雑さの制約を考えると、エンコード処理の間、レートと歪みとの間のバランスまたはトレードオフが通常考慮される。レート歪み最適化は、通常、レートの、および歪みの加重和であるレート歪み関数を最小化することとして公式化される。レート歪み最適化問題を解くために、異なる手法がある。たとえば、これらの手法は、すべてのエンコードオプションの長大なテストに基づき得、すべての考慮されるモードまたは符号化パラメータ値を含み、それらの符号化コストと、符号化およびデコードの後、再構築された信号の関連の歪みとの完全な評価を伴う。エンコードの複雑さを省くために、特に再構築されたものではなく予測または予測残差信号に基づいて近似された歪みの計算と共に、より速い手法も使用され得る。可能なエンコード選択肢のいくつかについてのみ近似された歪みを使用し、他のエンコード選択肢については完全な歪みを使用することによってなど、これらの2つの手法の混合も使用することができる。他の手法は、可能なエンコード選択肢のサブセットのみ評価する。より一般的には、多数の手法が最適化を実施するために様々な技法のいずれかを使用するが、最適化は、必ずしも符号化コストおよび関連の歪みを共に完全評価するものではない。
【0111】
本明細書に記載の実装および態様は、たとえば、方法もしくはプロセス、装置、ソフトウェアプログラム、データストリーム、または信号で実装され得る。単一の形態の実装の状況でのみ論じられている場合でさえ(たとえば、方法としてのみ論じられている)、論じられている特徴の実装は、他の形態(たとえば、装置またはプログラム)で実装することもできる。装置は、たとえば適切なハードウェア、ソフトウェア、およびファームウェアで実装され得る。たとえば、これらの方法は、たとえばコンピュータ、マイクロプロセッサ、集積回路、またはプログラマブル論理デバイスを含む、一般に処理デバイスを指すプロセッサで実装され得る。プロセッサはまた、たとえば、コンピュータ、セルフォン、ポータブル/パーソナルデジタルアシスタント(PDA)、およびエンドユーザ間で情報の通信を容易にする他のデバイスなど、通信デバイスを含む。
【0112】
「一実施形態(one embodiment)」、「一実施形態(an embodiment)」、「一例」、「一実装(one implementation)」または「一実装(an implementation)」、ならびにその他の変形に対する言及は、その実施形態に関連して記載されている特定の特徴、構造、特性などが少なくとも1つの実施形態に含まれることを意味する。したがって、「一実施形態では(in one embodiment)」、「一実施形態では(in an embodiment)」、「一例では」、「一実装では(in one implementation)」、または「一実装では(in an implementation)」という句の出現、ならびに本出願を通して様々な場所に出現する任意の他の変形は、必ずしもすべて同じ実施形態または例を指していない。
【0113】
さらに、本出願は、情報の様々な断片を「決定すること」に言及することがある。情報を決定することは、たとえば、情報を推定すること、情報を計算すること、情報を予測すること、または情報をメモリから取り出すことのうちの1つまたは複数を含むことができる。得ることは、受信すること、取り出すこと、構築すること、生成すること、および/または決定することを含み得る。
【0114】
さらに、本出願は、情報の様々な断片に「アクセスすること」に言及することがある。情報にアクセスすることは、たとえば、情報を受信すること、情報を(たとえば、メモリから)取り出すこと、情報を記憶すること、情報を移動すること、情報をコピーすること、情報を計算すること、情報を決定すること、情報を予測すること、または情報を推定することのうちの1つまたは複数を含むことができる。
【0115】
さらに、本出願は、情報の様々な断片を「受信すること」に言及することがある。受信することは、「アクセスすること」と同様に、広い用語であることが意図されている。情報を受信することは、たとえば、情報にアクセスすること、または情報を(たとえば、メモリから)取り出すことのうちの1つまたは複数を含むことができる。さらに、「受信すること」は、典型的には、いろいろな点で、たとえば情報を記憶すること、情報を処理すること、情報を送信すること、情報を移動すること、情報をコピーすること、情報を消去すること、情報を計算すること、情報を決定すること、情報を予測すること、または情報を推定することなど動作中に含まれる。
【0116】
たとえば、「A/B」、「Aおよび/またはB」、および「AおよびBのうちの少なくとも1つ」の場合における「/」、「および/または」および「のうちの少なくとも1つ」のいずれかの使用は、第1の列挙されている選択肢(A)だけの選択、または第2の列挙されている選択肢(B)だけの選択、または両選択肢(AおよびB)の選択を包含することが意図されていることを理解されたい。さらなる例として、「A、B、および/またはC」および「A、B、およびCのうちの少なくとも1つ」の場合において、そのような句は、第1の列挙されている選択肢(A)だけの選択、または第2の列挙されている選択肢(B)だけの選択、または第3の列挙されている選択肢(C)だけの選択、または第1および第2の列挙されている選択肢(AおよびB)だけの選択、または第1および第3の列挙されている選択肢(AおよびC)だけの選択、または第2および第3の列挙されている選択肢(BおよびC)だけの選択、または3つすべての選択肢(AおよびBおよびC)の選択を包含することが意図されている。これは、当技術分野および関連技術分野における当業者には明らかであるように、列挙されているものと同数の項目に拡張され得る。
【0117】
また、本明細書で使用されるとき、「シグナリング」という語は、とりわけ、対応するデコーダへ何かを示すことを指す。たとえば、いくつかの実施形態では、エンコーダは、(たとえば、デコーダへ)重みインデックスなどをシグナリングする。このようにして、一実施形態では、同じパラメータがエンコーダ側とデコーダ側で共に使用される。したがって、たとえば、エンコーダは、特定のパラメータをデコーダに送信(明示的なシグナリング)することができ、その結果、デコーダは、同じ特定のパラメータを使用することができる。逆に、デコーダが他のものと同様に特定のパラメータをすでに有する場合には、シグナリングは、デコーダが単純に特定のパラメータを知り、選択することができるように、送信することなく(暗黙のシグナリング)使用され得る。何らかの実際の機能の送信を回避することによって、様々な実施形態においてビット節約が実現される。シグナリングは、様々な方法で行われ得ることを理解されたい。たとえば、1つまたは複数のシンタックス要素、フラグなどが、様々な実施形態において情報を対応するデコーダにシグナリングするために使用される。前述は、「シグナリング」という語の動詞形態に関するが、「信号」という語もまた、本明細書では名詞として使用することができる。
【0118】
当業者には明らかとなるように、実装は、たとえば、記憶または送信され得る情報を搬送するようにフォーマットされた様々な信号を生成し得る。情報は、たとえば、方法を実施するための命令、または記載の実装の1つによって生成されるデータを含むことができる。たとえば、信号は、記載の実施形態のビットストリームを搬送するようにフォーマットされ得る。そのような信号は、たとえば、(たとえば、スペクトルの無線周波数部を使用して)電磁波として、またはベースバンド信号としてフォーマットされ得る。フォーマット化は、たとえば、データストリームをエンコードし、エンコードされたデータストリームでキャリアを変調することを含み得る。信号が搬送する情報は、たとえば、アナログまたはデジタル情報であってよい。信号は、知られているように、様々な異なる有線またはワイヤレスリンクを介して送信され得る。信号は、プロセッサ可読媒体上に記憶され得る。
【0119】
双方向動き補償予測(MCP)が実施され得る。MCPは、たとえば、ピクチャ間の時間的相関を利用することによって、時間的冗長性を除去する際に高い効率をもたらし得る。たとえば、2つの片方向予測信号を(たとえば、0.5に等しい重み値を使用して)組み合わせることによって、双方向予測信号が生成され得る。片方向予測信号を組み合わせることは、たとえば、照度が1つの参照ピクチャから別の参照ピクチャへ急速に変化したとき最適に満たないことがある。予測技法は、たとえば、グローバルまたはローカルな重みおよび/またはオフセット値を参照ピクチャ内のサンプル値のうちの1つまたは複数(たとえば、それぞれ)に適用することによって、経時的な照度変動を補償し得る。
【0120】
符号化モジュール(たとえば、時間的予測に関連付けられる)が、拡張および/または強化され得る。アフィン動き補償がインター符号化ツールとして使用され得る。
【0121】
アフィンモードを使用する実装について、本明細書に記載されていることがある。並進運動モデルが動き補償予測のために適用され得る。多くの種類の動きがあり得る(たとえば、ズームインもしくはズームアウト、回転、パースペクティブモーション(perspective motion)、および/または他の不規則な動き)。単純化されたアフィン変換動き補償予測が適用され得る。インター符号化されたCU(たとえば、各インター符号化されたCU)のためのフラグが、たとえば、並進運動またはアフィン運動モデルがインター予測のために適用されるかどうかを示すためにシグナリングされ得る。アフィン運動モデルで使用されるパラメータの数(たとえば、4または6)を示すために、フラグがシグナリングされ得る(たとえば、アフィン運動が使用される場合)。
【0122】
アフィン運動モデルは、4パラメータモデルであってよい。2つのパラメータは、並進移動のために使用され得る(たとえば、水平方向および垂直方向のそれぞれに1つずつ)。1つのパラメータは、ズーム運動のために使用され得る。1つのパラメータは、回転運動のために使用され得る。水平ズームパラメータは、垂直ズームパラメータに等しくなり得る。水平回転パラメータは、垂直回転パラメータに等しくなり得る。4パラメータ運動モデルは、2つの動きベクトル(MV)を、カレントCUの左上隅および右上隅にて定義される2つの制御点位置における(たとえば、1)対として使用して符号化され得る。図5は、例示的な4パラメータアフィンモードモデルおよびアフィンブロックについてのサブブロックレベルの動き導出の図である。図5に示されているように、ブロックのアフィン動きフィールドは、2つの制御点動きベクトル(V0,V1)によって説明され得る。制御点の動きに基づいて、動きフィールド(vx,vy)が、たとえば、式1に従って説明され得る。
【0123】
【数1】
【0124】
ここで、図5に示されているように、(v0x,v0y)は、左上隅の制御点の動きベクトルであり得、(v1x,v1y)は、右上隅の制御点の動きベクトルであり得、wは、CUの幅であり得る。
【0125】
アフィン運動モデルは、6パラメータモデルであってよい。2つのパラメータは、並進移動のために使用され得る(たとえば、水平方向および垂直方向のそれぞれについて1つずつ)。2つのパラメータは、ズーム運動のために使用され得る(たとえば、水平方向および垂直方向のそれぞれについて1つずつ)。2つのパラメータは、回転運動のために使用され得る(たとえば、水平方向および垂直方向のそれぞれについて1つずつ)。6パラメータ運動モデルは、3つの制御点における3つのMVで符号化され得る。図6は、例示的な6パラメータアフィンモードを示し、V0、V1、およびV2は制御点であり、(MVx,MVy)は、位置(x,y)を中心とするサブブロックの動きベクトルである。図6に示されているように、6パラメータアフィン符号化されたCUのための制御点は、CUの左上隅、右上隅、および左下隅にて定義され得る。左上の制御点での動きは、並進運動に関係し得る。右上の制御点での動きは、水平方向での回転およびズーム運動に関係し得る。左下の制御点での動きは、垂直方向での回転およびズーム運動に関係し得る。水平方向での回転およびズーム運動は、垂直方向での動きとは異なり得る。サブブロック(たとえば、各サブブロック)のMV(vx,vy)は、たとえば、式2および式3に従って、制御点における3つのMVを使用して導出され得る。
【0126】
【数2】
【0127】
ここで、(v2x,v2y)は、左下の制御点の動きベクトルであり得、(x,y)は、サブブロックの中心位置であり得、wおよびhは、それぞれCUの幅および高さであり得る。
【0128】
アフィン運動モデルで符号化されたブロックのための動きフィールドは、たとえば、サブブロックの粒度に基づいて導出され得る。(たとえば、各)サブブロックのMVは、たとえば、(たとえば、図5に示されているように)(たとえば、式(1)に従って)サブブロックの中央サンプルのMVを計算することによって導出され得る。計算は、たとえば、1/16ペル(pel)の正確度に丸められ得る。導出されたMVは、カレントブロックの内側のサブブロック(たとえば、各サブブロック)の予測信号を生成するために動き補償段階にて使用され得る。アフィン動き補償に適用されるサブブロックサイズは、たとえば、4×4であってよい。4パラメータアフィンモデルの4つのパラメータは、たとえば、反復的に推定され得る。たとえば、ステップkにおける1つまたは複数のMV対は、
【0129】
【数3】
【0130】
として示され得る。元の輝度信号は、I(i,j)として示され得る。予測輝度信号は、I’k(i,j)として示され得る。空間的勾配gx(i,j)およびgy(i,j)は、たとえば、それぞれ水平方向および垂直方向において、予測信号I’k(i,j)に対して適用されるソーベルフィルタで導出され得る。式(1)の導関数は、たとえば、式4に従って表され得る。
【0131】
【数4】
【0132】
ここで、ステップkにおいて、(a,b)は、デルタ並進パラメータであり得、(c,d)は、デルタズームおよび回転パラメータであり得る。制御点におけるデルタMVは、たとえば、式5および式6による座標で導出され得る。たとえば、(0,0)および(w,0)は、それぞれ左上の制御点および右上の制御点についての座標であり得る。
【0133】
【数5】
【0134】
輝度の変化と、空間的勾配および時間的移動との間の関係は、たとえば、式7に従って公式化され得る。
【0135】
【数6】
【0136】
ここで、
【0137】
【数7】
【0138】
および
【0139】
【数8】
【0140】
は、たとえば、式8に示されているように、たとえば、パラメータ(a,b,c,d)のための式を得るために、式(4)内の値と置き換えられ得る。
I’k(i,j)-I(i,j)=(gx(i,j)*i+gy(i,j)*j)*c+(-gx(i,j)*j+gy(i,j)*i)*d+gx(i,j)*a+gy(i,j)*b (8)
パラメータセット(a,b,c,d)は、たとえば、最小二乗法を使用して導出され得る(たとえば、CU内のサンプルが式8を満たすため)。ステップ(k+1)での制御点におけるMV
【0141】
【数9】
【0142】
は、式5および式6で解かれ得、それらは、特定の精度(たとえば、1/4ペル)に丸められ得る。2つの制御点におけるMVは、パラメータ(a,b,c,d)が(たとえば、すべて)ゼロになる、または反復が実施された回数が(たとえば、事前定義された)限界に達するまで、(たとえば、反復を使用して)リファインメントされ得る。
【0143】
6パラメータアフィンモデルの6つのパラメータが推定され得る。式4は、たとえば、式9に従って変更され得る。
【0144】
【数10】
【0145】
ここで、ステップkにおいて、(a,b)は、デルタ並進パラメータであり得、(c,d)は、水平方向についてのデルタズームおよび回転パラメータであり得、(e,f)は、垂直方向についてのデルタズームおよび回転パラメータであり得る。式8は、たとえば、式10に従って変更され得る。
I’k(i,j)-I(i,j)=(gx(i,j)*i)*c+(gx(i,j)*j)*d+(gy(i,j)*i)*e+(gy(i,j)*j)*f+gx(i,j)*a+gy(i,j)*b (10)
パラメータセット(a,b,c,d,e,f)は、たとえば、CU内のサンプル(たとえば、複数のサンプル)を考慮することによって、たとえば、最小二乗法を使用して導出され得る。左上の制御点のMV
【0146】
【数11】
【0147】

は、式5を使用して計算され得る。右上の制御点のMV
【0148】
【数12】
【0149】
および左下の制御点のMV
【0150】
【数13】
【0151】
は、たとえば、式11および式12に従って計算され得る。
【0152】
【数14】
【0153】
デコーダ側動きベクトルリファインメント(DMVR)が提供され得る。両方向マッチング(BM)ベースのDMVRが、たとえば、マージモードのMVの正確度を高めるために適用され得る。双方向予測動作では、参照ピクチャリストL0および/または参照ピクチャリストL1内の初期MV周りでリファインメントされたMVが探索され得る。BMベースのDMVRは、参照ピクチャリストL0およびリストL1内の2つの候補ブロック間の歪みを計算し得る。図7は、例示的なデコード側動きベクトル(MV)リファインメントを示す。図7に示されているように、同一位置のブロック(collocated block)間の差の絶対値の和(SAD)が、たとえば、初期MV周りの1つまたは複数の(たとえば、各)MV候補に基づいて計算され得る。最も低いSADを有するMV候補はリファインメントされたMVとなり得、双方向予測信号を生成するために使用され得る。
【0154】
DMVRによって導出されたリファインメントされたMVは、たとえば、インター予測サンプルを生成するために使用され得る。DMVRによって導出されたリファインメントされたMVは、たとえば、将来のピクチャ符号化のために時間的動きベクトル予測において使用され得る。初期MVは、たとえば、カレントCUと隣接したCUとの間のMV依存性を回避するために、将来のCU符号化のためのブロック解除および/または空間的動きベクトル予測において使用され得る。
【0155】
図7に示されているように、初期MVおよびMVオフセットを囲む探索点は、MV差分ミラーリング(たとえば、対称)規則を守り得る。候補MV対(MV0,MV1)によって示される、DMVRによってチェックされる点は、式13および/または式14に従うものであり得る。
【0156】
【数15】
【0157】
MVoffsetは、参照ピクチャのうちの1つにおける初期MVとリファインメントされたMVとの間のリファインメントオフセットを表し得る。リファインメント探索レンジは、たとえば、初期MVからの2つの整数輝度サンプルであり得る。早期終了機構を有する高速探索方法が、たとえば、探索の複雑さを低減するために適用され得る。
【0158】
サブブロックベースの時間的動きベクトル予測(SbTMVP)が提供され得る。SbTMVPは、カレントピクチャ内のCUについて、動きベクトル予測およびマージモードを改善するために、同一位置のピクチャ(collocated picture)内の動きフィールドを使用し得る。時間的動きベクトル予測(TMVP)によって使用される同じ同一位置のピクチャが、SbTMVPのために使用されてよい。SbTMVPは、以下の態様のうちの1つまたは複数においてTMVPとは異なり得る。TMVPは、CUレベルで動きを予測し得る。SbTMVPは、サブCUレベルで動きを予測し得る。TMVPは、同一位置のピクチャ内の同一位置のブロックから時間的動きベクトルをフェッチし得る。同一位置のブロックは、カレントCUに対して右下または中央のブロックであり得る。SbTMVPは、たとえば、同一位置のピクチャから時間的動き情報をフェッチする前に、動きシフトを適用し得る。動きシフトは、たとえばカレントCUの空間的に隣接したブロックのうちの1つからの動きベクトルから得られ得る。
【0159】
図8Aおよび図8Bは、例示的なSbTMVPプロセスを示す。図8Aは、SbTMVPにおいて使用され得る例示的な空間的に隣接したブロックを示す。図8Bは、サブ符号化単位(sub-coding unit(CU))動きフィールドの例示的な導出を示す。図8Bに示されているように、サブCU動きフィールドは、空間的な隣接(neighbor)からの動きシフトを適用し、対応する同一位置のサブCU(collocated sub-CU)からの動き情報をスケーリングすることによって導出され得る。SbTMVPは、カレントCU内のサブCUの動きベクトルを予測し得る。空間的な隣接(たとえば、図8AにおけるA1)が調べられ得る。A1のための動きベクトルは、たとえば、A1がその参照ピクチャとして同一位置のピクチャを使用する動きベクトルを有する場合(たとえば、適用されることになる動きシフトのために)、選択され得る。動きシフトは、たとえば、動きが識別されない場合、(0,0)として選択され得る。選択された動きシフトは、たとえば、同一位置のピクチャからサブCUレベルの動き情報(たとえば、動きベクトルおよび/または参照インデックスなど)を得るために適用され得る。たとえば、選択された動きシフトは、カレントブロックの座標に加えられ得る。動きシフトは、ブロックA1の動き(たとえば、図8Bによって示されている例における)に設定され得る。同一位置のピクチャ内の(たとえば、各)サブCUの対応するブロック(たとえば、中央サンプルをカバーする最小の動きグリッド)の動き情報は、サブCUのための動き情報を導出するために使用され得る。同一位置のサブCUの動き情報(たとえば、識別された後)は、カレントのサブCUの動きベクトルおよび参照インデックスに変換され得る。たとえば、時間的動きベクトルの参照ピクチャをカレントCUのものに位置合わせするために、時間的動きスケーリングが適用され得る。
【0160】
SbTMVP候補およびアフィンマージ候補を含む組み合わされたサブブロックベースのマージリストが、サブブロックベースのマージモードのシグナリングのために使用され得る。SbTMVPモードは、シーケンスパラメータセット(SPS)フラグによってイネーブルおよび/またはディセーブルされ得る。SbTMVPモードがイネーブルの場合、SbTMVP予測子がサブブロックベースのマージ候補のリストの(たとえば、第1の)エントリとして追加され得、その後にアフィンマージ候補が続き得る。サブブロックベースのマージリストのサイズは、SPSにおいてシグナリングされ得る。サブブロックベースのマージリストの最大の許容サイズは、たとえば5であり得る。
【0161】
SbTMVPにおいて使用されるサブCUサイズは、たとえば、8×8で固定され得る。SbTMVPモードは、8以上の幅および高さを有するCU(たとえば、それのみ)に適用可能であり得る。
【0162】
追加のSbTMVPマージ候補のエンコード論理は、他のマージ候補のためのエンコード論理と同じであってよい。たとえば、PまたはBスライス内の各CUについて、追加のRDチェックが実施され得る。追加のRDチェックは、SbTMVP候補を使用するかどうか判断するために使用され得る。
【0163】
オーバーラップブロック動き補償(OBMC)が提供され得る。OBMCは、たとえば、CUレベルでのシンタックスを使用してオンおよびオフに切り替えられ得る。OBMCは、動き補償(MC)ブロック境界について実施され得る(たとえば、CUの右および下の境界を除く)。OBMCは、輝度彩度成分について適用され得る。MCブロックは、符号化ブロックに対応し得る。CUは、サブCUモード(たとえば、サブCUマージ、アフィン、およびFRUCモードを含む)で符号化され得る。サブCUモードで符号化されたCUの1つまたは複数のサブブロック(たとえば、各サブブロック)がMCブロックであり得る。OBMCは、たとえば、CU境界を(たとえば、均一に)処理するために、(たとえば、すべての)MCブロック境界についてサブブロックレベルで実施され得る。図9は、OBMCが適用されるサブブロックの一例を示す。サブブロックサイズは、たとえば、図9に示されているように、4×4に等しく設定され得る。
【0164】
OBMCは、カレントサブブロックに適用され得る。4つの接続された隣接したサブブロック(たとえば、使用可能であり、カレントの動きベクトルと同一でない場合)の動きベクトル(たとえば、カレントの動きベクトルの他に)が、カレントサブブロックのための予測ブロックを導出するために使用され得る。1つまたは複数の例では、「隣接した」は、「隣り合った」と相互交換可能に使用され得る。たとえば、カレントサブブロックの最終予測信号を生成するために、複数の動きベクトルに基づく複数の予測ブロックが組み合わされ得る。
【0165】
隣接したサブブロックの動きベクトルに基づく予測ブロックは、PNとして示され得、Nは、カレントサブブロックの上方、下方、左、および右の隣接したサブブロックのためのインデックスを示す。カレントサブブロックの動きベクトルに基づく予測ブロックは、PCとして示され得る。OBMCは、たとえば、PNがカレントサブブロックと同じ動き情報を含む隣接したサブブロックの動き情報に基づく場合、飛ばされてよい。そうでない場合、PNの1つまたは複数の(たとえば、各)サンプルがPCにおける同じサンプルに加えられ得、たとえば、PNの4つの行/列がPCに加えられ得る。例では、重み係数{1/4,1/8,1/16,1/32}がPNのために使用され得、重み係数{3/4,7/8,15/16,31/32}がPCのために使用され得る。たとえば、符号化ブロックの高さまたは幅が4に等しい、またはCUがサブCUモードで符号化される場合、PNの2つの行および/または列が小さいMCブロックについてPCに加えられ得る。小さいMCブロックの場合、重み係数{1/4,1/8}がPNのために使用され得、重み係数{3/4,7/8}がPCのために使用され得る。垂直に(たとえば、および/または水平に)隣接したサブブロックの動きベクトルに基づいて生成されるPNの場合、PNの同じ行(たとえば、および/または列)内のサンプルが同じ重み係数でPCに加えられ得る。たとえば、重なり合うエリアのピクセルは、重なり合わないエリアのピクセルのために使用される重み係数とは異なる重み係数を使用し得る。
【0166】
OBMCがカレントCU、たとえば、256輝度サンプル以下のCUサイズのために適用されるかどうか示すために、CUレベルフラグがシグナリングされ得る。OBMCは、たとえば、256輝度サンプルより大きいサイズを有する、またはAMVPモードで符号化されていないCUについて、デフォルトで適用され得る。OMBCの影響は、たとえば、動き推定段階中に、エンコーダにて考慮され得る。上の隣接したブロックおよび左の隣接したブロックの動き情報を使用してOBMCによって形成された予測信号は、カレントCUの元の信号の上および左の境界を補償するために使用され得る。(たとえば、通常の)動き推定プロセスが、(たとえば、別段)(たとえば、その後)適用されてよい。
【0167】
オプティカルフローを用いた予測リファインメント(PROF)が、アフィンモードに適用され得る。PROFは、たとえば、動き補償のより細かい粒度を達成するために、オプティカルフローを用いてサブブロックベースのアフィン動き補償予測をリファインメントし得る。輝度予測サンプルが、たとえば、オプティカルフロー式によって導出される差を加えることによってリファインメントされ得る(たとえば、サブブロックベースのアフィン動き補償後)。PROFは、以下のうちの1つまたは複数を含み得る。サブブロックベースのアフィン動き補償は、サブブロック予測I(i,j)を生成するために実施され得る。サブブロック予測の空間的勾配gx(i,j)およびgy(i,j)は、1つまたは複数のサンプルロケーション(たとえば、各サンプルロケーション)にて計算され得る。たとえば、空間的勾配は、部分的または全体的に連続的であってもなくてもよい1つまたは複数のピクセルを使用して計算され得る。一例では、第1のピクセルのための勾配は、第2のピクセルのためのサンプル値および第3のピクセルのためのサンプル値に基づき得、ここで、第2のピクセルおよび第3のピクセルは、第1のピクセルと隣り合った。いくつかの例では、勾配が計算される第1のピクセルは、第1のピクセルと隣り合った第2のピクセルまたは第3のピクセルの一方または両方に当接し得る。他の例では、勾配が計算される第1のピクセルは、第1のピクセルと隣り合った第2のピクセルまたは第3のピクセルの一方またはいずれかの近くにあり、当接しないことがある。これらの計算は、たとえば、式15および式16に示されているように、[-1,0,1]など3タップフィルタを使用して実施され得る。
x(i,j)=I(i+1,j)-I(i-1,j) (15)
y(i,j)=I(i,j+1)-I(i,j-1) (16)
サブブロック予測は、(たとえば、各側で1ピクセルだけ)勾配計算のために拡張され得る。拡張された境界上のピクセルは、たとえば参照ピクチャ内の最も近い整数ピクセル位置からコピーされ得る。たとえば、拡張された境界上のピクセルが参照ピクチャ内の最も近い整数ピクセル位置からコピーされる場合、パディング領域のための追加の補間が、回避され得る。図10は、例示的なサブブロックMV VSBおよびピクセルΔv(i,j)を示す。輝度予測リファインメントは、たとえば、式17に示されているように、オプティカルフロー式によって計算され得る。
ΔI(i,j)=gx(i,j)*Δvx(i,j)+gy(i,j)*Δvy(i,j) (17)
ここで、Δv(i,j)は、図10に示されているように、サンプルロケーション(i,j)について計算された、v(i,j)によって示されるピクセルMVと、ピクセル(i,j)が属するサブブロックのサブブロックMVとの差である。
【0168】
アフィンモデルパラメータ、およびサブブロック中心に対するピクセルロケーションは、サブブロック間で変化し得ない。Δv(i,j)は、(たとえば、第1の)サブブロックについて計算され得、(たとえば、同じCU内の)他のサブブロックのために再使用され得る。xおよびyをピクセルロケーションからサブブロックの中心までの水平および垂直オフセットとすると、Δv(x,y)は、たとえば、式18に従って導出され得、
【0169】
【数16】
【0170】
ここで、4パラメータアフィンモデルの場合、cおよびeが式19に従って決定され得、
【0171】
【数17】
【0172】

ここで、6パラメータアフィンモデルの場合、c、d、e、およびfが式20に従って決定され得、
【0173】
【数18】
【0174】
ここで、(v0x,v0y)、(v1x,v1y)、(v2x,v2y)は、それぞれ左上、右上、および左下の制御点動きベクトルであり、wおよびhは、CUの幅および高さである。輝度予測リファインメントは、サブブロック予測I(i,j)に加えられ得る。最終予測I’は、たとえば、式21に従って生成され得る。
I’(i,j)=I(i,j)+ΔI(i,j) (21)
DMVRおよびSbTMVPは、予測されるMVの正確度を高めるために、異なる予測モードで使用され得る。DMVRまたはSbTMVP後のリファインメントされたMVは、その後、サブブロックベースの動き補償を実施するため(たとえば、それのみ)に使用され得る。OBMCは、ピクセルレベルリファインメントを含み得る。OBMCは、CUまたはサブCUのサブブロックにて境界不連続性を低減するために使用され得る。OBMCは、1つまたは複数の(たとえば、各)サブブロックのための複数の動き補償動作を含み得る。たとえば、4つの接続された隣接したサブブロックのMVは、それらが使用可能であり、カレントサブブロックのMVと同一でない場合、カレントサブブロックのための予測ブロックを導出するために使用され得る。
【0175】
サブブロック/ブロックリファインメント、たとえば、ピクセルレベルリファインメントのための方法が提供され得る。たとえば、この方法は、境界不連続性を低減するために使用され得る。図11は、方法の一例を提供する。図11に記載の方法は、デコーダおよび/またはエンコーダにおいて適用され得る。
【0176】
図11は、式(1)~式(25)のうちの1つまたは複数によるサブブロック/ブロックリファインメントのための方法の一例を示す。本明細書に開示されている例、および他の例は、図11に示されている例示的な方法1100に従って動作し得る。方法1100は、1102および1104を含む。1102では、第1のピクセルのためのサンプル値が、たとえば(1)カレントサブブロックのための動きベクトル(MV)、(2)カレントサブブロックと隣り合ったサブブロックのためのMV、および(3)第1のピクセルと隣り合った第2のピクセルのためのサンプル値に基づいて得られ得る。1104では、カレントサブブロックを含むブロックが、得られた第1のピクセルのためのサンプル値に基づいてエンコードまたはデコードされ得る。図11に記載の方法がデコーダに適用されるとき、図11における1104は、デコーダによって実施され得、1104は、得られた第1のピクセルのためのサンプル値に基づいてカレントサブブロックを含むブロックをデコードすることを伴い得る。図11に記載の方法がエンコーダに適用されるとき、図11における1104は、エンコーダによって実施され得、1104は、得られた第1のピクセルのためのサンプル値に基づいてカレントサブブロックを含むブロックをエンコードすることを伴い得る。
【0177】
たとえばエンコードおよびデコードのための、サブブロック/ブロックリファインメントのための方法の例が提供される。例は、「境界」に言及することがあり、これは、ブロック、サブブロック、CU、および/またはPUの境界など異なるタイプの境界を含む。例は、「隣接」に言及することがあり、これは、ブロック、サブブロック、CU、および/またはPUの空間的な隣接および時間的な隣接など異なるタイプの隣接を含み得る。例は、「隣り合った」に言及することがあり、これは、隣り合ったブロック、隣り合ったサブブロック、隣り合ったピクセル、および/または境界と隣り合ったピクセルなど異なるタイプの隣接を含む。空間的な隣接は、同じフレーム内で隣り合っていることがあり、一方、時間的な隣接は、隣り合ったフレーム内の同じロケーションにあり得る。たとえば、隣り合ったサブブロックは、空間的または時間的な隣接であり得るサブブロックである。境界ピクセルは、境界と隣り合ったピクセルであり、境界は、任意のタイプの境界であってよい。たとえば、境界ピクセルは、ブロック、サブブロック、CU、および/またはPUの境界に隣接し得る。
【0178】
サブブロック/ブロックリファインメントは、サブブロック/ブロック境界リファインメントを含み得る。たとえば、カレントブロックおよび/またはサブブロックと隣接したブロックおよび/またはサブブロックとの間のMV差は、オプティカルフロー式によって導出されるサンプル値の差へ計算および変換され得る。カレントブロックおよび/またはサブブロックの境界ピクセルのピクセル強度(たとえば、輝度および/または彩度)は、たとえば、導出される差分値を加えることによってリファインメントされ得る。導出される差分値は、オプティカルフローを用いたブロック境界予測リファインメント(BBPROF)と称されることがある。境界ピクセルのためのサンプル値オフセットは、導出される差分値を示し得る。境界ピクセルのためのサンプル値は、境界ピクセルのピクセル強度を示し得る。BBPROF(たとえば、本明細書に記載のもの)は、サブブロックおよびブロック境界リファインメントのためのピクセルレベル粒度を提供し得る。BBPROF(たとえば、本明細書に記載のもの)は、任意のサブブロックベースのインター予測モードおよび/またはCUベースのインター予測モードに適用され得る。
【0179】
境界ピクセルは、ブロックおよび/またはサブブロックの境界におけるピクセルを含み得る。たとえば、方形のサブブロックは、左、右、上、および下の境界を含む4つの境界を有し得る。境界は、2つのサブブロック間で共有される共通の境界を含み得る。これら2つのサブブロックは、境界にて互いに当接し得る。ピクセルは、ピクセルが境界の近くに位置するとき境界に位置し得る。たとえば、ピクセルは、ピクセルがサブブロックの上の境界からいくつか(たとえば、4、3、2、または1)のピクセルの行、サブブロックの下の境界からその数のピクセルの行、サブブロックの左の境界からその数(たとえば、4、3、2、または1)のピクセルの列、またはサブブロックの右の境界からその数のピクセルの列にあるとき、境界に位置し得る。いくつかの例では、第1のピクセルは、第1のピクセルが第1のサブブロック内側に位置し、第1のサブブロックと共通の境界を共有する第2のサブブロック内側にあるピクセルに当接するとき、第1のサブブロックの共通の境界にあり得るか、または位置し得る。いくつかの例では、ピクセルは、サブブロックの境界に、しかしサブブロックの外側に位置し得る。
【0180】
BBPROFが、たとえば、DMVRモードにおいて適用され得る。BBPROFは、DMVRベースのサブブロックレベル動き補償予測のブロック境界不連続性を低減し得る。ピクセル強度の変化がBBPROFによって適用され得る。ピクセル強度変化は、たとえば、オプティカルフロー式から導出され得る。ピクセルのためのサンプル値オフセットは、ピクセル強度変化を示し得る。BBPROFは、サブブロック当たり1つ(たとえば、1つだけ)の動き補償動作を実施するために使用され得る。DMVRモードでの動き補償は、サブブロック当たり1つの動き補償動作を実施し得る。
【0181】
CU内のサブブロックのためのリファインメントされた動きベクトルは、たとえば、DMVR(たとえば、本明細書に記載のもの)を実施することによって導出され得る。サブブロックベースの動き補償(たとえば、本明細書に記載のもの)は、サブブロックベースの予測を生成するために実施され得る。
【0182】
サブブロック予測の空間的勾配gx(i,j)およびgy(i,j)が、1つまたは複数の(たとえば、各)ピクセル/サンプルロケーション(たとえば、本明細書に記載のもの)にて計算され得る。
【0183】
カレントサブブロックと、検討されている1つまたは複数の隣接したサブブロック(検討中の隣接したサブブロック)との間の動きベクトル差MVdiffが計算され得る。このMV差は、サブブロックレベルであってよい。カレントサブブロックから離れていない(たとえば、近接する、または近い)各候補の隣接したサブブロックが検討され得る。MVdiffを計算するために、サブブロックの様々な量および/またはロケーションが隣接したサブブロックとして選択され得る。例では、DMVRモードにおけるBBPROFは、4つの隣接したサブブロック(たとえば、左、上方、右、および下の隣接したサブブロック)、2つの隣接したサブブロック(たとえば、上および左の隣接したサブブロック)、隅の隣接したサブブロック(たとえば、左上、右下)、または隣接したサブブロックの他の量および位置を、MVdiffを計算するために使用し得る。
【0184】
一例では、4つの隣接したサブブロック(たとえば、カレントサブブロックに当接する上方、下方、左、および右のサブブロック)が検討され得、MVdiffは、4つの異なるMV差値を含むMV差セットであり得る。たとえば、MVdiffは、MVdiff={MVdiff(A),MVdiff(B),MVdiff(L),MVdiff(R)}として計算され得、ここで、A、B、L、Rは、それぞれ、カレントサブブロックと、上方、下方、左、および右のサブブロックとのMV差を表し得る。
【0185】
図12は、たとえば、DMVRモードにおける、選択された隣接したサブブロックからの例示的なMV差計算を示す。図12に示されているように、サブブロックは、DMVR後、それ自体のMV差を有し得る。CU内のカレントサブブロック(たとえば、図12におけるカレントのDMVRサブブロック)は、たとえば、境界に位置するカレントサブブロックを除いて、4つの接続された隣接したサブブロックを有し得る。
【0186】
計算されたサブブロックレベルMV差MVdiffは、たとえば、式21に示されているように、カレントサブブロック内の1つまたは複数の(たとえば、各)ピクセル/サンプルロケーションにて動きベクトルオフセットΔv(i,j)を計算するために使用され得る。
【0187】
【数19】
【0188】
ここで、nは、特定の隣接したサブブロックのためのインデックスであり得、Nは、検討中の隣接したサブブロックの総数であり得、w(i,j,n)は、隣接したMVdiff(n)がロケーション(i,j)における特定のピクセルのために適用されるときの重み係数であり得る。Nは、たとえば、左、上方、右、および下の隣接したサブブロックが検討される場合、4に等しくなり得る。
【0189】
重み係数のセットは、たとえば、{1/4,1/8,1/16,1/32}であり得る。重み係数は、それぞれ、カレントサブブロックの1つまたは複数の(たとえば、各)側におけるピクセルの4つの行/列によって使用され得る。MV差MVdiffは、たとえば、垂直および/または水平に隣接したサブブロックの動きベクトルに基づいて計算され得る。カレントサブブロックの同じ行および/または列内のピクセルは、同じ重み係数を使用し得る。たとえば、カレントサブブロックの左側の第1の列内のピクセルは、同じ重み係数(たとえば、1/4)を使用し得、第2の列内のピクセルは、同じ重み係数(たとえば、1/8)を使用し得る、などである。重み係数は、たとえば、現在の位置から、カレントブロックとその隣接したブロックとの間のブロック境界までの距離に基づいて決定され得る。重み係数は、たとえば、列および/または行がブロック境界から離れているとき、より小さくなり得る。
【0190】
重み係数は、たとえば、ピクセルロケーションに基づいて(たとえば、動的に)調整され得る。一例では、ピクセルは、カレントサブブロックの左上に位置し得る。左および上方の隣接したサブブロックからのMV差は、たとえば、左および上方の隣接したサブブロックが共に存在する場合、ならびに左および上方の隣接したからのMV差が共にゼロでない場合、それらのピクセルにおける最終的なMVオフセットを生成するために共に重み付けられ/組み合わされ得る。たとえば、カレントサブブロックがカレントCUの左または上の境界にある場合、左または上方の隣接したサブブロックが使用可能でないことがある。
【0191】
カレントサブブロック内のピクセル当たりの強度変化が、たとえば、オプティカルフロー式22に従って計算され得る。
ΔI(i,j)=gx(i,j)*Δvx(i,j)+gy(i,j)*Δvy(i,j) (22)
ここで、Δv(i,j)およびg(i,j)は、1つまたは複数の(たとえば、あらゆる)サンプルロケーション(i,j)におけるMVオフセットおよび空間的勾配であり得、これらは、たとえば、前のステップで計算され得る。
【0192】
たとえば計算された強度変化(たとえば、輝度またはクロミナンス)をサブブロック予測に加えることによって、ピクセルまたはサンプルロケーションのための予測がリファインメントされ得る。ピクセルまたはサンプルロケーションのためのリファインメントされた予測は、ある参照ピクチャリスト、たとえば、リストL0またはリストL1に関連付けられ得る。最終予測I’は、たとえば、式23に従って生成され得る。
I’(i,j)=I(i,j)+ΔI(i,j) (23)
BBPROFがDMVRモードにおいて適用されるとき、4つの隣接したサブブロック(たとえば、多くとも)が検討され得る。内部のサブブロックは、隣接したサブブロックのDMVRプロセスが完了するのを待ち得る。例では、BBPROFがDMVRモードにおいて適用されるとき、2つの隣接したサブブロックが検討され得る。例では、たとえば、2つの隣接(たとえば、上および左の隣接のみ)が検討され得、その結果、カレントサブブロックのBBPROFは、2つの隣接したサブブロックについてのDMVRプロセスに依存し得る。
【0193】
BBPROFがSbTMVPモードにおいて適用され得る。たとえば、BBPROFは、SbTMVPベースのサブブロックレベル動き補償予測のサブブロック境界における不連続性を低減し得る。DMVRモードにおいてBBPROFを適用するための本明細書における1つまたは複数の例は、SbTMVPモードにおいてBBPROFを実施することに適用可能であり得る。SbTMVPモードにおいてBBPROFを適用することは、サブブロック当たり1つ(たとえば、1つだけ)の動き補償動作を実施することを含み得る。SbTMVP動き補償は、サブブロック当たり1つの動き補償動作を実施し得る。SbTMVPモードにおいてBBPROFを適用することは、以下のうちの1つまたは複数を含み得る。
【0194】
たとえば、SbTMVP(たとえば、本明細書に記載のもの)を実施することによって、CU内のサブブロックのうちの1つまたは複数(たとえば、それぞれ)のためのリファインメントされた動きベクトルが導出され得る。動き情報が同一位置のサブCUからフェッチされ得る。適切な時間的スケーリングが動き情報に適用され得る。たとえば、サブブロックベースの予測を生成するために、サブブロックベースの動き補償が実施され得る。
【0195】
サブブロック予測の空間的勾配gx(i,j)およびgy(i,j)が1つまたは複数の(たとえば、すべての)ピクセル/サンプルロケーション(たとえば、本明細書に記載のもの)にて計算され得る。
【0196】
カレントサブブロックと、たとえば1つまたは複数の検討中の隣接したサブブロックとの間で、動きベクトル差MVdiffが計算され得る。
【0197】
本明細書に記載の予測リファインメントがATMVPにおいて適用され得る。一例では、予測リファインメントは、図9に示されているカレントサブブロックの4つの隣接したサブブロックの動きベクトルを使用し得る。動きベクトルは、カレントサブブロックと空間的な隣接したサブブロックとの間のMV差MVdiffを導出するために使用され得る。
【0198】
計算されたサブブロックレベルMV差MVdiffは、カレントサブブロック内のピクセル/サンプルロケーションのうちの1つまたは複数(たとえば、それぞれ)にて動きベクトルオフセットΔv(i,j)を計算するために使用され得る。
【0199】
カレントサブブロック内のピクセル当たりの強度変化が、オプティカルフロー式によって(たとえば、式22に基づいて)計算され得る。
【0200】
参照ピクチャリストのうちの1つまたは複数(たとえば、それぞれ)のための予測が、たとえば、強度変化(たとえば、輝度またはクロミナンス)を加えることによってリファインメントされ得る。最終予測I’が、たとえば、式24に従って生成され得る。
I’(i,j)=I(i,j)+ΔI(i,j) (24)
BBPROFがアフィンモードにおいて適用され得る。BBPROFは、アフィン符号化されたCU(たとえば、SbTMVPと同様)に適用され得る。アフィン符号化されたCUは、複数のサブブロックを含み得る。サブブロックのうちの1つまたは複数(たとえば、それぞれ)のためのブロックレベルMVは、アフィン運動モデル(たとえば、本明細書に記載のもの)によって導出され得る。4パラメータアフィンモデルの4つのパラメータ、および/または6パラメータアフィンモデルの6つのパラメータが、たとえば、2つまたは3つの制御点動きベクトルで推定され得る。4つまたは6つの推定されたアフィンモデルパラメータは、たとえば、アフィン符号化されたCU内のサブブロックのブロックレベル動きベクトルを導出するために使用され得る。サブブロック内のピクセル/サンプルロケーションのうちの1つまたは複数(たとえば、それぞれ)におけるサブブロックレベルMV差MVdiffおよび/または動きベクトルオフセットΔv(i,j)は、たとえば、異なるサブブロック動きベクトルで計算され得る。たとえば、サブブロックレベルMV差MVdiffおよび/または動きベクトルオフセットΔv(i,j)が計算され得る(たとえば、BBPROFは、本明細書に記載されているように実施され得る)。
【0201】
BBPROFは、たとえば、本明細書に記載されているように、サブブロックの境界と隣り合ったピクセルについて、CU境界と隣り合ったピクセルに適用され得る。たとえば、BBPROFは、CUレベルにて適用され得る。参照ピクチャは、たとえば、隣り合ったCUについて同じであっても異なってもよい。
【0202】
CUレベルMV差MVdiffは、たとえば、選択された隣接したCU(たとえば、上方、下方、左、および右のCU)がカレントCUと同じ参照ピクチャを有する場合、特定のCUについて計算され得る(たとえば、直接計算される)。特定のCUの境界ピクセルの予測は、たとえば、BBPROFを(たとえば、直接)適用することによってリファインメントされ得る。
【0203】
たとえば(i)選択された隣接したCU(たとえば、上方、下方、左、および右のCU)のうちの1つまたは複数(たとえば、すべて)および(ii)カレントCUが参照ピクチャリスト内の異なる参照ピクチャを有する場合、時間的動きスケーリングが特定のCUに適用され得る。適正な時間的動きスケーリングは、選択された隣接したCUの時間的動きベクトルの参照ピクチャを特定のCUの参照ピクチャに位置合わせし得る。CUレベルMV差MVdiffは、(たとえば、選択された隣接したCUのスケーリングされたMVに基づいて)計算され得、CU境界での予測リファインメントは、たとえば、BBPROFを適用することによって達成され得る。
【0204】
追加の例としてBBPROFの複数の実装変形形態が提供される。サブブロック/ブロック境界リファインメント(たとえば、BBPROF)などサブブロック/ブロックリファインメントのために選択され得る隣接した(たとえば、隣り合った)サブブロックの量および位置は、図12を参照して記載されている例など本明細書に記載の例に限定され得ない。サブブロックの他の量および/またはロケーションが選択され得る。カレントサブブロックから離れていない(たとえば、近接する、または近い)各候補の隣接したサブブロックが検討され得る。たとえば、BBPROFは、MVdiffを計算するために、隅の隣接したサブブロック(たとえば、左上、右下)、図12に示されている4つのサブブロック、または隣接したサブブロックの他の量および位置を使用し得る。
【0205】
検討中の隣接したサブブロックの位置は、カレントサブブロックと同じCU内にあることに限定され得ない。隣り合ったCUからの検討中の隣接したサブブロックのアスペクト比は、カレントサブブロックと同じであることに限定されてもされなくてもよい。異なるアスペクト比がサブブロック/ブロック境界リファインメント(たとえば、BBPROF)などサブブロック/ブロックリファインメントのために可能にされ得る。
【0206】
ピクセル/サンプルロケーションにおけるMVオフセットが、たとえば、サブブロックMV差に基づいて導出され得る。カレントサブブロックの側のうちの1つまたは複数(たとえば、それぞれ)におけるピクセルの行および/または列の数は、たとえば、1つまたは複数の(たとえば、予め定義された)基準に基づいて構成可能である、および/または動的に変更され得る。たとえば、カレントサブブロックの左側におけるピクセルの2つ以上の列は、たとえばピクセルの4つの列など、たとえばピクセルのデフォルト数の列の代わりに、左の隣接したサブブロックからのMV差を含み得る。
【0207】
MV差は、垂直および/または水平に隣接したサブブロックに基づき得る。例では、カレントサブブロックの同じ行および/または列内のピクセルは、同じ重み係数を使用し得る。例では、カレントサブブロックの同じ行および/または列内のピクセルは、異なる重み係数を使用し得る。
【0208】
重み係数は変わり得る。たとえば、重み係数は、ピクセルと垂直または水平境界との間の空間的距離が減少するにつれて増大し得る。
【0209】
強度差(たとえば、式22から導出される)は、たとえば、式25に示されているように、たとえば、強度差が予測に加えられる前に、重み係数wで乗算され得る。
I’(i,j)=I(i,j)+w・ΔI(i,j) (25)
ここで、wは、0から1までの間の値に設定され得る。wは、たとえば、CUレベルまたはピクチャレベルでシグナリングされ得る。たとえば、wは、重みインデックスによってシグナリングされ得る。式25は、式23および/または式24の変形形態であり得る。
【0210】
BBPROFは、たとえば、DMVRベースのL0予測およびL1予測が重みと組み合わされた後、使用され得る。BBPROFは、たとえば、複雑さを低減するために、L0またはL1など、たとえば1つの予測に適用され得る。例では、BBPROFは、たとえば、参照ピクチャが時間領域においてカレントピクチャにより近い場合、1つの予測に適用され得る。例では、BBPROFは、たとえば、参照ピクチャが時間領域においてカレントピクチャから離れている場合、1つの予測に適用され得る。
【0211】
多数の実施形態が本明細書に記載されている。実施形態の特徴は、様々な特許請求の範囲のカテゴリおよびタイプにわたって、単独で、または任意の組合せで提供され得る。さらに、実施形態は、たとえば、以下のいずれかなど、様々な特許請求の範囲のカテゴリおよびタイプにわたって、単独で、または任意の組合せで本明細書に記載の特徴、デバイス、または態様のうちの1つまたは複数を含み得る。
【0212】
図11に記載の方法は、デコーダおよび/またはエンコーダに適用され得る。図11に記載の方法がエンコーダに適用されるとき、図11における1104は、エンコーダによって実施され得、1104は、得られた第1のピクセルのためのサンプル値に基づいてカレントサブブロックを含むブロックをエンコードすることを伴い得る。図11に記載の方法は、式(1)~式(25)のうちの1つまたは複数に基づき得る。たとえば、デコーダは、ピクセルのためのサンプル値に基づいてカレントサブブロックをデコードし得る。ピクセルは、カレントサブブロックの境界の1つに位置し得る。サンプル値は、式(1)~式(25)のうちの1つまたは複数に基づいて得られるリファインメントされたサンプル値であり得る。式(1)~式(25)のうちの1つまたは複数に示されているように、デコーダは、たとえば、カレントサブブロックのためのMV、カレントサブブロックと隣り合ったサブブロックのためのMV、およびそのためのサンプル値が得られるピクセルと隣り合ったピクセルのためのサンプル値に基づいて、ピクセルのためのサンプル値を得てよい。デコーダは、たとえばデコーダがサンプル値の予測をリファインメントする前に、ピクセルのためのサンプル値の予測を得てよい。ピクセルのためのサンプル値の予測は、たとえば、式(23)に示されているように、I(i,j)と称されることがある。式(23)に示されているように、デコーダは、サンプル値オフセットおよびサンプル値の予測、たとえば、サンプル値オフセットとサンプル値の予測の総和に基づいて、ピクセルのためのサンプル値を得てよい。ピクセルのためのサンプル値オフセットは、たとえば、式(23)に示されているように、ΔI(i,j)と称されることがある。1つまたは複数の式(1)~式(25)に示されているように、サンプル値オフセットは、たとえば、カレントサブブロックのためのMV、カレントサブブロックと隣り合ったサブブロックのためのMV、およびそのためのサンプル値が得られるピクセルと隣り合ったピクセルのためのサンプル値に基づいて得られ得る。デコーダは、本明細書に記載されているように、カレントサブブロックのためのMV、およびカレントサブブロックと隣り合ったサブブロックのためのMVを使用して、MV差(たとえば、式(21)におけるMV差)を得てよい。MV差は、たとえば、式21に示されているように、MVdiff(n)、として参照され得る。デコーダは、カレントサブブロックと隣り合った1つまたは複数のそれぞれのサブブロックに関連付けられた1つまたは複数のMVを使用してMV差を得てよい。デコーダは、たとえば、式(15)および式(16)に示されているように、そのためのサンプル値が得られるピクセルと隣り合ったピクセルのためのサンプル値を使用して勾配を得てよい。式(15)および式(16)に示されている例として、デコーダは、そのためのサンプル値が得られるピクセルと隣り合った1つまたは複数のそれぞれのピクセルのための1つまたは複数のサンプル値を使用して勾配を得てよい。デコーダは、勾配およびMV差に基づいてピクセルのためのサンプル値を得てよい。一例では、デコーダは、式(21)に示されているように、MV差に基づいてMVオフセットを得てよい。デコーダは、式(22)および式(23)に示されているように、ピクセルのためのサンプル値を得るためにMVオフセットおよび勾配を使用し得る。デコーダは、勾配およびMV差に基づいてサンプル値オフセットを得、サンプル値オフセットを使用してピクセルのためのサンプル値を得てよい。デコーダは、重み係数を決定し、たとえば、式(21)に示されているように、ピクセルのためのサンプル値を得るために重み係数を使用し得る。デコーダは、ピクセルのための得られたサンプル値に基づいて、カレントサブブロックを含むブロックをデコードし得る。
【0213】
エントロピーデコード、逆量子化、逆変換、および差動復号のうちの1つまたは複数を含むデコードツールおよび技法が、図11に記載の方法をデコーダにおいて可能にするために使用され得る。これらのデコードツールおよび技法は、図11に記載の方法によるサブブロック/ブロックリファインメント、図11に記載の方法によるサブブロック/ブロック境界リファインメント、図11に記載の方法によるBBPROF、DMVRモードでのサブブロック/ブロックリファインメント、SbTMVPモードでのサブブロック/ブロックリファインメント、アフィンモードでのサブブロック/ブロックリファインメント、図11に記載の方法によるサンプル値を得ること、図11に記載の方法によるサンプル値オフセットを得ること、本明細書に記載のように勾配を得ること、本明細書に記載のようにMV差を得ること、サンプル値のための予測を得ること、および上記のいずれかに関係する他のデコーダ挙動のうちの1つまたは複数を可能にするために使用され得る。
【0214】
エンコーダは、ピクセルのためのサンプル値に基づいてカレントサブブロックをエンコードし得る。ピクセルは、カレントサブブロックの境界の1つに位置し得る。サンプル値は、式(1)~式(25)のうちの1つまたは複数に基づいて得られるリファインメントされたサンプル値であり得る。式(1)~式(25)のうちの1つまたは複数に示されているように、エンコーダは、たとえば、カレントサブブロックのためのMV、カレントサブブロックと隣り合ったサブブロックのためのMV、およびそのためのサンプル値が得られるピクセルと隣り合ったピクセルのためのサンプル値に基づいて、ピクセルのためのサンプル値を得てよい。エンコーダは、たとえばエンコーダがサンプル値の予測をリファインメントする前に、ピクセルのためのサンプル値の予測を得てよい。ピクセルのためのサンプル値の予測は、たとえば、式(23)に示されているように、I(i,j)と称されることがある。式(23)に示されているように、エンコーダは、サンプル値オフセットおよびサンプル値の予測、たとえば、サンプル値オフセットとサンプル値の予測の総和に基づいて、ピクセルのためのサンプル値を得てよい。ピクセルのためのサンプル値オフセットは、たとえば、式(23)に示されているように、ΔI(i,j)と称されることがある。1つまたは複数の式(1)~式(25)に示されているように、サンプル値オフセットは、たとえば、カレントサブブロックのためのMV、カレントサブブロックと隣り合ったサブブロックのためのMV、およびそのためのサンプル値が得られるピクセルと隣り合ったピクセルのためのサンプル値に基づいて得られ得る。エンコーダは、本明細書に記載されているように、カレントサブブロックのためのMV、およびカレントサブブロックと隣り合ったサブブロックのためのMVを使用して、MV差(たとえば、式(21)におけるMV差)を得てよい。MV差は、たとえば、式(21)に示されているように、MVdiff(n)として参照され得る。エンコーダは、カレントサブブロックと隣り合った1つまたは複数のそれぞれのサブブロックに関連付けられた1つまたは複数のMVを使用してMV差を得てよい。式(15)および式(16)に示されているように、エンコーダは、そのためのサンプル値が得られるピクセルと隣り合ったピクセルのためのサンプル値を使用して勾配を得てよい。式(15)および式(16)に示されている例として、エンコーダは、そのためのサンプル値が得られるピクセルと隣り合った1つまたは複数のそれぞれのピクセルのための1つまたは複数のサンプル値を使用して勾配を得てよい。エンコーダは、勾配およびMV差に基づいてピクセルのためのサンプル値を得てよい。一例では、エンコーダは、式(21)に示されているように、MV差に基づいてMVオフセットを得てよい。エンコーダは、式(22)および式(23)に示されているように、ピクセルのためのサンプル値を得るためにMVオフセットおよび勾配を使用し得る。エンコーダは、勾配およびMV差に基づいてサンプル値オフセットを得、サンプル値オフセットを使用してピクセルのためのサンプル値を得てよい。エンコーダは、重み係数を決定し、たとえば、式(21)に示されているように、ピクセルのためのサンプル値を得るために重み係数を使用し得る。エンコーダは、ピクセルのための得られたサンプル値に基づいて、カレントサブブロックを含むブロックをエンコードし得る。
【0215】
量子化、エントロピーコーディング、逆量子化、逆変換、および差動符号化のうちの1つまたは複数を含むエンコードツールおよび技法が、図11に記載の方法をエンコーダにおいて可能にするために使用され得る。これらのエンコードツールおよび技法は、図11に記載の方法によるサブブロック/ブロックリファインメント、図11に記載の方法によるサブブロック/ブロック境界リファインメント、図11に記載の方法によるBBPROF、DMVRモードでのサブブロック/ブロックリファインメント、SbTMVPモードでのサブブロック/ブロックリファインメント、アフィンモードでのサブブロック/ブロックリファインメント、図11に記載の方法によるサンプル値を得ること、図11に記載の方法によるサンプル値オフセットを得ること、本明細書に記載のように勾配を得ること、本明細書に記載のようにMV差を得ること、サンプル値のための予測を得ること、および上記のいずれかに関係する他のエンコーダ挙動のうちの1つまたは複数を可能にするために使用され得る。
【0216】
たとえば、デコーダが図11に記載の方法、または使用するための方法を実施することに関連付けられたインジケーションを識別することを可能にするために、シンタックス要素がシグナリングに挿入され得る。たとえば、シンタックス要素は、たとえばそれらのうちの1つまたは複数がイネーブルであるか、それともディセーブルであるかデコーダに示すためにBBPROF、DMVR、SbTMVPモード、アフィンモードのうちの1つまたは複数のインジケーションを含み得る。一例として、シンタックス要素は、本明細書に記載の1つまたは複数の重み係数のインジケーション、および/またはデコーダが本明細書における1つまたは複数の例を実施するために使用するパラメータのインジケーションを含み得る。
【0217】
図11に記載の方法は、デコーダにて適用するために、たとえば、シンタックス要素に基づいて選択および/または適用され得る。たとえば、デコーダは、BBPROFをイネーブルにすることを示すインジケーションを受信し得る。インジケーションに基づいて、デコーダは、サブブロックの境界に、またはその近くに位置するピクセルに対して図11に記載の方法を実施し得る。
【0218】
エンコーダは、本明細書における1つまたは複数の例に基づいて予測残差を調整し得る。残差は、たとえば、予測されるビデオブロックを元の画像ブロックから減算することによって得られ得る。たとえば、エンコーダは、本明細書に記載のように得られるピクセルのためのサンプル値に基づいてビデオブロックを予測し得る。エンコーダは、元の画像ブロックを得、予測残差を生成するために予測されたビデオブロックを元の画像ブロックから減算し得る。
【0219】
ビットストリームまたは信号は、記載のシンタックス要素またはその変形形態のうちの1つまたは複数を含み得る。たとえば、ビットストリームまたは信号は、BBPROF、DMVR、SbTMVPモード、アフィンモードのいずれかがイネーブルまたはディセーブルであることを示すシンタックス要素を含み得る。
【0220】
ビットストリームまたは信号は、本明細書の1つまたは複数の例に従って生成される情報を運ぶシンタックスを含み得る。たとえば、情報またはデータは、図11に示されている例を実施する際に生成され得る。生成された情報またはデータは、ビットストリームまたは信号内に含まれるシンタックス内で運ばれ得る。
【0221】
エンコーダによって使用されるものに対応するようにデコーダが残差を調整することを可能にするシンタックス要素が信号に挿入され得る。たとえば、残差は、本明細書の1つまたは複数の例を使用して生成され得る。
【0222】
記載のシンタックス要素もしくはその変形形態のうちの1つもしくは複数を含むビットストリームもしくは信号を作成および/もしくは送信および/もしくは受信および/もしくはデコードするための方法、プロセス、装置、命令を記憶する媒体、データを記憶する媒体、または信号。
【0223】
記載の例のいずれかによる作成および/もしくは送信および/もしくは受信および/もしくはデコードのための方法、プロセス、装置、命令を記憶する媒体、データを記憶する媒体、または信号。
【0224】
それだけには限らないが以下のうちの1つもしくは複数による方法、プロセス、装置、命令を記憶する媒体、データを記憶する媒体、または信号、すなわち1つまたは複数のピクセル/サンプルロケーションにてサブブロックベースの予測の空間的勾配を決定すること、1つまたは複数のピクセル/サンプルロケーションにて動きベクトルオフセットを計算するためにMV差を使用すること、たとえばオプティカルフローに基づいてカレントサブブロック内のピクセル当たりの強度変化を決定すること、たとえば計算された強度変化をサブブロック予測に加えることによって参照ピクチャリストのための予測をリファインメントすること、第1のピクセルがカレントサブブロックの境界と隣り合ったと決定すること、カレントサブブロックのためのMVとカレントサブブロックと隣り合ったサブブロックのためのMVとの間の差を決定すること、第1のピクセルと隣り合った第2のピクセルのためのサンプル値、および第1のピクセルと隣り合った第3のピクセルのためのサンプル値に基づいて、第1のピクセルのための勾配を決定すること、決定された勾配、およびカレントサブブロックのためのMVとカレントサブブロックと隣り合ったサブブロックのためのMVとの間の差に基づいてサンプル値オフセットを決定すること、決定されたサンプル値オフセットに基づいて第1のピクセルのためのサンプル値を得ること、たとえば少なくとも第2のピクセルのためのサンプル値に基づいて勾配を決定すること、勾配を使用して第1のピクセルのためのサンプル値を決定すること、たとえば少なくとも第2のピクセルのためのサンプル値に基づいてオプティカルフローモデルのための勾配を決定すること、第1のピクセルのためのサンプル値を得るためにオプティカルフローモデルにおける勾配を使用すること、第1のピクセルのためのサンプル値を得るために、カレントサブブロックのためのMVとカレントサブブロックと隣り合ったサブブロックのためのMVとの間の差を使用すること、たとえばさらにカレントサブブロックと隣り合った第2のサブブロックのためのMVに基づいて、第1のピクセルのためのサンプル値を得ること、第1のピクセルがカレントサブブロックの境界と隣り合ったと決定したことに基づいて、第1のピクセルのためのサンプル値を得ること、第1のピクセルのためのサンプル値を得るために重み係数を使用することであって、重み係数は、対応するカレントサブブロックの境界からの第1のピクセルの距離に従って変わることも変わらないこともあること、たとえばカレントサブブロックのためのMV、カレントサブブロックと隣り合ったサブブロックのためのMV、および第1のピクセルと隣り合った第2のピクセルのためのサンプル値に基づいて、第1のピクセルのためのサンプル値オフセットを決定すること、決定されたサンプル値オフセットおよび予測される第1のピクセルのためのサンプル値を使用して第1のピクセルのためのサンプル値を得ること、ならびに、たとえば、カレントサブブロックの境界が、カレントサブブロックと、カレントサブブロックと隣り合ったサブブロックとの間の共通の境界を含み得る場合、第1のピクセルがカレントサブブロックの境界と隣り合ったと決定したことに基づいて第1のピクセルのためのサンプル値を得ること。
【0225】
記載の例のいずれかに従ってブロック/サブブロック/CUリファインメントを実施するTV、セットトップボックス、セルフォン、タブレット、または他の電子デバイス。
【0226】
記載の例のいずれかに従ってブロック/サブブロック/CUリファインメントを実施し、(たとえば、モニタ、画面、または他のタイプのディスプレイを使用して)得られる画像を表示するTV、セットトップボックス、セルフォン、タブレット、または他の電子デバイス。
【0227】
エンコードされた画像を含む信号を受信するために(たとえば、チューナを使用して)チャネルを選択し、記載の例のいずれかに従ってブロック/サブブロック/CUリファインメントを実施するTV、セットトップボックス、セルフォン、タブレット、または他の電子デバイス。
【0228】
エンコードされた画像を含む信号を(たとえば、アンテナを使用して)無線で受信し、記載の例のいずれかに従ってブロック/サブブロック/CUリファインメントを実施するTV、セットトップボックス、セルフォン、タブレット、または他の電子デバイス。
【0229】
上記で特徴および要素について特定の組合せで記載されているが、各特徴または要素は、単独で、または他の特徴および要素との任意の組合せで使用することができることを当業者なら理解するであろう。さらに、本明細書に記載の方法は、コンピュータまたはプロセッサによって実行するためにコンピュータ可読媒体に組み込まれたコンピュータプログラム、ソフトウェア、またはファームウェアで実装され得る。コンピュータ可読媒体の例は、電子信号(有線またはワイヤレス接続を介して送信される)およびコンピュータ可読記憶媒体を含む。コンピュータ可読記憶媒体の例は、それだけには限らないが、読出し専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、レジスタ、キャッシュメモリ、半導体メモリデバイス、内部ハードディスクおよび取外し可能ディスクなど磁気媒体、光磁気媒体、ならびにCD-ROMディスクおよびデジタル多用途ディスク(DVD)など光媒体を含む。ソフトウェアに関連付けられたプロセッサは、WTRU、UE、端末、基地局、RNC、または任意のホストコンピュータにおいて使用するための無線周波数トランシーバを実装するために使用され得る。
図1A
図1B
図1C
図1D
図2
図3
図4
図5
図6
図7
図8A
図8B
図9
図10
図11
図12