2024-161272 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

2024-161272双方向オプティカルフローに対するビット幅制御

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024161272

(43)【公開日】2024-11-15

(54)【発明の名称】双方向オプティカルフローに対するビット幅制御

(51)【国際特許分類】

H04N 19/513 20140101AFI20241108BHJP

H04N 19/577 20140101ALI20241108BHJP

【ＦＩ】

H04N19/513

H04N19/577

【審査請求】有

【請求項の数】13

【出願形態】ＯＬ

【外国語出願】

(21)【出願番号】P 2024154127

(22)【出願日】2024-09-06

(62)【分割の表示】P 2022201624の分割

【原出願日】2020-01-06

(31)【優先権主張番号】62/788,898

(32)【優先日】2019-01-06

(33)【優先権主張国・地域又は機関】US

(71)【出願人】

【識別番号】521024075

【氏名又は名称】ベイジン・ダジア・インターネット・インフォメーション・テクノロジー・カンパニー，リミテッド

(74)【代理人】

【識別番号】100118902

【弁理士】

【氏名又は名称】山本修

(74)【代理人】

【識別番号】100106208

【弁理士】

【氏名又は名称】宮前徹

(74)【代理人】

【識別番号】100196508

【弁理士】

【氏名又は名称】松尾淳一

(74)【代理人】

【識別番号】100138759

【弁理士】

【氏名又は名称】大房直樹

(74)【代理人】

【識別番号】100201743

【弁理士】

【氏名又は名称】井上和真

(72)【発明者】

【氏名】シウ，シヤオユー

(72)【発明者】

【氏名】チェン，イー－ウエン

(72)【発明者】

【氏名】ワーン，シアーンリン

(57)【要約】

【課題】ビデオ符号化のための双方向オプティカルフロー（ＢＤＯＦ）に対するビット幅を制御する方法を提供する。
【解決手段】ビデオ符号化のための双方向オプティカルフロー（ＢＤＯＦ）に対するビット幅を制御する方法が、第１の参照ピクチャおよび第２の参照ピクチャを復号するステップを含み、第２の参照ピクチャは、第１の参照ピクチャとは異なり、第１の参照ピクチャは、現在のピクチャの前に表示され、第２の参照ピクチャは、現在のピクチャの後に表示される。第１の予測Ｌ０と第２の予測Ｌ１との間の差を最小化することによって、符号化単位（ＣＵ）の動き補正が計算される。第１の予測Ｌ０に対する第１の勾配値および第２の予測Ｌ１に対する第２の勾配値が計算される。ＣＵの最終的な双方向予測が計算される。関連する装置および関連する非一時的コンピュータ可読記憶媒体も開示される。
【選択図】図１

【特許請求の範囲】

【請求項1】

１つまたは複数のプロセッサと、前記１つまたは複数のプロセッサによって実行される
べき複数のプログラムを記憶するメモリとを備えたコンピューティングデバイスで実施さ
れ、ビデオ符号化のための双方向オプティカルフロー（ＢＤＯＦ）に対するビット幅を制
御する方法であって、
第１の参照ピクチャおよび第２の参照ピクチャを復号するステップであって、前記第２
の参照ピクチャが前記第１の参照ピクチャとは異なり、前記第１の参照ピクチャが現在の
ピクチャの前に表示され、前記第２の参照ピクチャが前記現在のピクチャの後に表示され
る、ステップと、
前記現在のピクチャの現在のブロックから前記第１の参照ピクチャの第１の予測Ｌ_０へ
の第１の動きベクトル（ＭＶ_０）を決定するステップと、
前記現在のブロックから前記第２の参照ピクチャの第２の予測Ｌ_１への第２の動きベク
トル（ＭＶ_１）を決定するステップと、
前記第１の予測Ｌ_０と前記第２の予測Ｌ_１との間の差を最小化することによって、符号
化単位（ＣＵ）の動き補正（ｖ_ｘ、ｖ_ｙ）を計算するステップと、
前記第１の予測Ｌ_０に対する第１の勾配値

【数1】

ならびに、前記第２の予測Ｌ_１に対する第２の勾配値

【数2】

を計算するステップと、
前記第１の予測Ｌ_０および前記第２の予測Ｌ_１、前記動き補正（ｖ_ｘ、ｖ_ｙ）、前記第
１の勾配値

【数3】

ならびに、前記第２の勾配値

【数4】

に基づいて、前記ＣＵの最終的な双方向予測を計算するステップとを含む方法。

【請求項2】

（ｖ_ｘ、ｖ_ｙ）の値が、次式のように計算される、請求項１に記載の方法。

【数5】

【請求項3】

Ｓ_１、Ｓ_２、Ｓ_３、Ｓ_５、およびＳ_６の値が、

【数6】

のように計算され、Ωが、前記第１の予測Ｌ_０および前記第２の予測Ｌ_１の１つのサブブ
ロックの周りの１組の隣接予測サンプルである、請求項２に記載の方法。

【請求項4】

ｎ_ｃの値が、２に等しく設定される、請求項２に記載の方法。

【請求項5】

ｔｈ_ＢＤＯＦの値が、２に等しく設定される、請求項２に記載の方法。

【請求項6】

複数の変数ψ_ｘ（ｉ，ｊ）、ψ_ｙ（ｉ，ｊ）、およびθ（ｉ，ｊ）の計算に追加のビッ
トシフトｎ_ａｄｊを導入するステップをさらに含み、

【数7】

である、請求項２に記載の方法。

【請求項7】

ｎ_ａｄｊの値が、２に等しく設定される、請求項６に記載の方法。

【請求項8】

第１のクリッピング演算および第２のクリッピング演算を導入することによって、Ｓ_２
およびＳ_６の値を計算するステップをさらに含み、前記第１のクリッピング演算が、

【数8】

のように計算され、
前記第２のクリッピング演算が、

【数9】

のように計算され、
Ｂ_２が、Ｓ_２の出力ダイナミックレンジを制御するためのパラメータであり、Ｂ_６が、
Ｓ_６の出力ダイナミックレンジを制御するためのパラメータである、請求項６に記載の方
法。

【請求項9】

勾配値

【数10】

および、勾配値

【数11】

を計算するステップが、前記第１の予測の第１の予測位置および前記第２の予測の第２の
予測位置の各々で水平勾配および垂直勾配を計算するステップをさらに含む、請求項１に
記載の方法。

【請求項10】

前記水平勾配が、前記第１の予測位置および前記第２の予測位置の各々で、

【数12】

のように計算され、
前記垂直勾配が、前記第１の予測位置および前記第２の予測位置の各々で、

【数13】

のように計算される、請求項９に記載の方法。

【請求項11】

１つまたは複数のプロセッサと、
前記１つまたは複数のプロセッサに結合された非一時的記憶装置と、
前記非一時的記憶装置に記憶された複数のプログラムとを備え、
前記複数のプログラムが、前記１つまたは複数のプロセッサによって実行されたとき、
第１の参照ピクチャおよび第２の参照ピクチャを復号するステップであって、前記第２
の参照ピクチャが前記第１の参照ピクチャとは異なり、前記第１の参照ピクチャが現在の
ピクチャの前に表示され、前記第２の参照ピクチャが前記現在のピクチャの後に表示され
る、ステップと、
前記現在のピクチャの現在のブロックから前記第１の参照ピクチャの第１の予測Ｌ_０へ
の第１の動きベクトル（ＭＶ_０）を決定するステップと、
前記現在のブロックから前記第２の参照ピクチャの第２の予測Ｌ_１への第２の動きベク
トル（ＭＶ_１）を決定するステップと、
前記第１の予測Ｌ_０と前記第２の予測Ｌ_１との間の差を最小化することによって、符号
化単位（ＣＵ）の動き補正（ｖ_ｘ、ｖ_ｙ）を計算するステップと、
前記第１の予測Ｌ_０に対する第１の勾配値

【数14】

ならびに、前記第２の予測Ｌ_１に対する第２の勾配値

【数15】

を計算するステップと、
前記第１の予測Ｌ_０および前記第２の予測Ｌ_１、前記動き補正（ｖ_ｘ、ｖ_ｙ）、前記第
１の勾配値

【数16】

ならびに、前記第２の勾配値

【数17】

に基づいて、前記ＣＵの最終的な双方向予測を計算するステップとを含む演算を、前記コ
ンピューティングデバイスに実行させる、コンピューティングデバイス。

【請求項12】

（ｖ_ｘ、ｖ_ｙ）の値が、次式のように計算される、請求項１１に記載のコンピューティ
ングデバイス。

【数18】

【請求項13】

Ｓ_１、Ｓ_２、Ｓ_３、Ｓ_５、およびＳ_６の値が、

【数19】

のように計算され、Ωが、前記第１の予測Ｌ_０および前記第２の予測Ｌ_１の１つのサブブ
ロックの周りの１組の隣接予測サンプルである、請求項１２に記載のコンピューティング
デバイス。

【請求項14】

ｎ_ｃの値が、２に等しく設定される、請求項１２に記載のコンピューティングデバイス
。

【請求項15】

ｔｈ_ＢＤＯＦの値が、２に等しく設定される、請求項１２に記載のコンピューティング
デバイス。

【請求項16】

複数の変数ψ_ｘ（ｉ，ｊ）、ψ_ｙ（ｉ，ｊ）、およびθ（ｉ，ｊ）の計算に追加のビッ
トシフトｎ_ａｄｊを導入するステップをさらに含み、

【数20】

である、請求項１２に記載のコンピューティングデバイス。

【請求項17】

ｎ_ａｄｊの値が、２に等しく設定される、請求項１６に記載のコンピューティングデバ
イス。

【請求項18】

【数21】

のように計算され、
前記第２のクリッピング演算が、

【数22】

のように計算され、
Ｂ_２が、Ｓ_２の出力ダイナミックレンジを制御するためのパラメータであり、Ｂ_６が、
Ｓ_６の出力ダイナミックレンジを制御するためのパラメータである、請求項１６に記載の
コンピューティングデバイス。

【請求項19】

勾配値

【数23】

および、勾配値

【数24】

を計算するステップが、前記第１の予測の第１の予測位置および前記第２の予測の第２の
予測位置の各々で水平勾配および垂直勾配を計算するステップをさらに含む、請求項１１
に記載のコンピューティングデバイス。

【請求項20】

前記水平勾配が、前記第１の予測位置および前記第２の予測位置の各々で、

【数25】

のように計算され、
前記垂直勾配が、前記第１の予測位置および前記第２の予測位置の各々で、

【数26】

のように計算される、請求項１３に記載のコンピューティングデバイス。

【請求項21】

１つまたは複数のプロセッサを有するコンピューティングデバイスによる実行のための
複数のプログラムを記憶する非一時的コンピュータ可読記憶媒体であって、前記複数のプ
ログラムが、前記１つまたは複数のプロセッサによって実行されたとき、
第１の参照ピクチャおよび第２の参照ピクチャを復号するステップであって、前記第２
の参照ピクチャが前記第１の参照ピクチャとは異なり、前記第１の参照ピクチャが現在の
ピクチャの前に表示され、前記第２の参照ピクチャが前記現在のピクチャの後に表示され
る、ステップと、
前記現在のピクチャの現在のブロックから前記第１の参照ピクチャの第１の予測Ｌ_０へ
の第１の動きベクトル（ＭＶ_０）を決定するステップと、
前記現在のブロックから前記第２の参照ピクチャの第２の予測Ｌ_１への第２の動きベク
トル（ＭＶ_１）を決定するステップと、
前記第１の予測Ｌ_０と前記第２の予測Ｌ_１との間の差を最小化することによって、符号
化単位（ＣＵ）の動き補正（ｖ_ｘ、ｖ_ｙ）を計算するステップと、
前記第１の予測Ｌ_０に対する第１の勾配値

【数27】

ならびに、前記第２の予測Ｌ_１に対する第２の勾配値

【数28】

を計算するステップと、
前記第１の予測Ｌ_０および前記第２の予測Ｌ_１、前記動き補正（ｖ_ｘ、ｖ_ｙ）、前記第
１の勾配値

【数29】

ならびに、前記第２の勾配値

【数30】

に基づいて、前記ＣＵの最終的な双方向予測を計算するステップとを含む演算を、前記コ
ンピューティングデバイスに実行させる、非一時的コンピュータ可読記憶媒体。

【請求項22】

（ｖ_ｘ、ｖ_ｙ）の値が、次式のように計算される、請求項２１に記載の非一時的コンピ
ュータ可読記憶媒体。

【数31】

【請求項23】

Ｓ_１、Ｓ_２、Ｓ_３、Ｓ_５、およびＳ_６の値が、

【数32】

のように計算され、Ωが、前記第１の予測Ｌ_０および前記第２の予測Ｌ_１の１つのサブブ
ロックの周りの１組の隣接予測サンプルである、請求項２２に記載の非一時的コンピュー
タ可読記憶媒体。

【請求項24】

複数の変数ψ_ｘ（ｉ，ｊ）、ψ_ｙ（ｉ，ｊ）、およびθ（ｉ，ｊ）の計算に追加のビッ
トシフトｎ_ａｄｊを導入するステップをさらに含み、

【数33】

である、請求項２２に記載の非一時的コンピュータ可読記憶媒体。

【請求項25】

【数34】

のように計算され、
前記第２のクリッピング演算が、

【数35】

のように計算され、
Ｂ_２が、Ｓ_２の出力ダイナミックレンジを制御するためのパラメータであり、Ｂ_６が、
Ｓ_６の出力ダイナミックレンジを制御するためのパラメータである、請求項２４に記載の
非一時的コンピュータ可読記憶媒体。

【請求項26】

勾配値

【数36】

および、勾配値

【数37】

を計算するステップが、前記第１の予測の第１の予測位置および前記第２の予測の第２の
予測位置の各々で水平勾配および垂直勾配を計算するステップをさらに含む、請求項２１
に記載の非一時的コンピュータ可読記憶媒体。

【請求項27】

前記水平勾配が、前記第１の予測位置および前記第２の予測位置の各々で、

【数38】

のように計算され、
前記垂直勾配が、前記第１の予測位置および前記第２の予測位置の各々で、

【数39】

のように計算される、請求項２６に記載の非一時的コンピュータ可読記憶媒体。

【発明の詳細な説明】

【技術分野】

【0001】

関連出願の相互参照
本出願は、２０１９年１月６日付け出願の米国仮特許出願第６２／７８８，８９８号の
利益を主張する。上記出願の開示全体が、全体として参照により本明細書に組み込まれて
いる。

【0002】

本開示は、一般に、ビデオデータの符号化（たとえば、コード化および復号）に関する
。より詳細には、本開示は、ビデオ符号化のための双方向オプティカルフロー（ＢＤＯＦ
）処理方法を改善する方法および装置に関する。特定の例示的な実施形態では、ＢＤＯＦ
を使用して、現在のピクチャに対して反対の方向に生じる参照ピクチャ（たとえば、現在
のピクチャの前の表示順序を有する第１の参照ピクチャ、および現在のピクチャの後の表
示順序を有する第２の参照ピクチャ）から、ブロックが双方向に予測される方法が記載さ
れる。

【背景技術】

【0003】

本章は、本開示に関係する背景情報を提供する。本章に含まれる情報は、必ずしも従来
技術として解釈されるべきであるとは限らない。

【0004】

ビデオデータを圧縮するために、様々なビデオ符号化技法を使用することができる。ビ
デオ符号化は、１つまたは複数のビデオ符号化規格に従って実行される。たとえば、ビデ
オ符号化規格には、多用途ビデオ符号化（ＶＶＣ）、共同探索試験モデル符号化（ＪＥＭ
）、高効率ビデオ符号化（Ｈ．２６５／ＨＥＶＣ）、高度ビデオ符号化（Ｈ．２６４／Ａ
ＶＣ）、ムービング・ピクチャ・エキスパート・グループ符号化（ＭＰＥＧ）などが含ま
れる。ビデオ符号化は概して、ビデオ画像またはシーケンスに存在する冗長性を利用する
予測方法（たとえば、インター予測、イントラ予測など）を利用する。ビデオ符号化技法
の重要な目標は、ビデオ品質の劣化を回避または最小化しながら、より低いビットレート
を使用する形式にビデオデータを圧縮することである。

【0005】

ＨＥＶＣ規格の最初のバージョンは、２０１３年１０月に完成されたものであり、前の
世代のビデオ符号化規格Ｈ．２６４／ＭＰＥＧＡＶＣと比較すると、約５０％のビット
レートの節約または同等の知覚品質を提供する。ＨＥＶＣ規格は、その前身に比べて大幅
な符号化の改善を提供するが、追加の符号化ツールによって、ＨＥＶＣより優れた符号化
効率を実現することができることが証明されている。それに基づいて、ＶＣＥＧおよびＭ
ＰＥＧはどちらも、将来のビデオ符号化の規格化に向けて、新しい符号化技術の探索作業
を開始した。２０１５年１０月、符号化効率の実質的な強化を可能にし得る高度な技術の
重要な研究を開始するために、ＩＴＵ－ＴＶＥＣＧおよびＩＳＯ／ＩＥＣＭＰＥＧに
よって、１つの共同ビデオ探索チーム（ＪＶＥＴ）が結成された。ＪＶＥＴは、ＨＥＶＣ
試験モデル（ＨＭ）に加えていくつかの追加の符号化ツールを統合することによって、共
同探索モデル（ＪＥＭ）と呼ばれる参照ソフトウェアを開発した。

【0006】

２０１７年１０月、ＩＴＵ－ＴおよびＩＳＯ／ＩＥＣは、ＨＥＶＣを超えた能力を有す
るビデオ圧縮に関する共同のコール・フォー・プロポーザルズ（ＣｆＰ）を発表した。２
０１８年４月、２３件のＣｆＰ応答が受理されて第１０回ＪＶＥＴ会議で評価され、ＨＥ
ＶＣに比べて約４０％の圧縮効率の向上が実証された。そのような評価結果に基づいて、
ＪＶＥＴは、多用途ビデオ符号化（ＶＶＣ）と呼ばれる新世代のビデオ符号化規格を開発
するための新しいプロジェクトに着手した。同月、ＶＶＣ規格の参照実装を実証するため
に、ＶＶＣ試験モデル（ＶＴＭ）と呼ばれる１つの参照ソフトウェアコードベースが確立
された。

【発明の概要】

【0007】

本章は、本開示の概要を提供するものであり、本開示の完全な範囲または本開示のすべ
ての特徴の包括的な開示ではない。

【0008】

本開示の第１の態様によれば、１つまたは複数のプロセッサと、１つまたは複数のプロ
セッサによって実行されるべき複数のプログラムを記憶するメモリとを有するコンピュー
ティングデバイスで実行され、ビデオ符号化のための双方向オプティカルフロー（ＢＤＯ
Ｆ）に対するビット幅を制御する方法は、第１の参照ピクチャおよび第２の参照ピクチャ
を復号するステップを含む。第２の参照ピクチャは、第１の参照ピクチャとは異なり、第
１の参照ピクチャは、現在のピクチャの前に表示され、第２の参照ピクチャは、現在のピ
クチャの後に表示される。現在のピクチャの現在のブロックから第１の参照ピクチャの第
１の予測Ｌ_０への第１の動きベクトル（ＭＶ_０）が決定される。現在のブロックから第２
の参照ピクチャの第２の予測Ｌ_１への第２の動きベクトル（ＭＶ_１）が決定される。現在
のピクチャから第１の参照ピクチャへの第１の時間距離（τ_０）が決定され、現在のピク
チャから第２の参照ピクチャへの第２の時間距離（τ_１）が決定される。第１の予測Ｌ_０
と第２の予測Ｌ_１との間の差を最小化することによって、動き補正が計算される。第１の
勾配値および第２の勾配値が計算され、第１の勾配値および第２の勾配値の内部ビット幅
を減少させるために、追加の右シフトが導入される。第１の勾配値および第２の勾配値の
和が計算され、そのビット幅を減少させるために、この和に追加の右シフトが導入される
。第１の予測サンプルＬ_０と第２の予測サンプルＬ_１との間の差が計算され、この差の内
部ビット幅を減少させるために、第１の予測サンプルＬ_０および第２の予測サンプルＬ_１
に追加の右シフトが導入される。

【0009】

本開示の第２の態様によれば、コンピューティングデバイスは、１つまたは複数のプロ
セッサと、１つまたは複数のプロセッサに結合された非一時的記憶装置と、非一時的記憶
装置に記憶された複数のプログラムとを含む。複数のプログラムが１つまたは複数のプロ
セッサによって実行されたとき、コンピューティングデバイスは、第１の参照ピクチャお
よび第２の参照ピクチャを復号する。第２の参照ピクチャは、第１の参照ピクチャとは異
なり、第１の参照ピクチャは、現在のピクチャの前に表示され、第２の参照ピクチャは、
現在のピクチャの後に表示される。現在のピクチャの現在のブロックから第１の参照ピク
チャの第１の予測Ｌ_０への第１の動きベクトル（ＭＶ_０）が決定される。現在のブロック
から第２の参照ピクチャの第２の予測Ｌ_１への第２の動きベクトル（ＭＶ_１）が決定され
る。現在のピクチャから第１の参照ピクチャへの第１の時間距離（τ_０）が決定され、現
在のピクチャから第２の参照ピクチャへの第２の時間距離（τ_１）が決定される。第１の
予測Ｌ_０と第２の予測Ｌ_１との間の差を最小化することによって、動き補正が計算される
。第１の勾配値および第２の勾配値が計算され、第１の勾配値および第２の勾配値の内部
ビット幅を減少させるために、追加の右シフトが導入される。第１の勾配値および第２の
勾配値の和が計算され、そのビット幅を減少させるために、この和に追加の右シフトが導
入される。第１の予測サンプルＬ_０と第２の予測サンプルＬ_１との間の差が計算され、こ
の差の内部ビット幅を減少させるために、第１の予測サンプルＬ_０および第２の予測サン
プルＬ_１に追加の右シフトが導入される。

【0010】

本開示の第３の態様によれば、非一時的コンピュータ可読記憶媒体が、１つまたは複数
のプロセッサを有するコンピューティングデバイスによる実行のための複数のプログラム
を記憶する。複数のプログラムは、１つまたは複数のプロセッサによって実行されたとき
、コンピューティングデバイスに、第１の参照ピクチャおよび第２の参照ピクチャを復号
させる。第２の参照ピクチャは、第１の参照ピクチャとは異なり、第１の参照ピクチャは
、現在のピクチャの前に表示され、第２の参照ピクチャは、現在のピクチャの後に表示さ
れる。現在のピクチャの現在のブロックから第１の参照ピクチャの第１の予測Ｌ_０への第
１の動きベクトル（ＭＶ_０）が決定される。現在のブロックから第２の参照ピクチャの第
２の予測Ｌ_１への第２の動きベクトル（ＭＶ_１）が決定される。現在のピクチャから第１
の参照ピクチャへの第１の時間距離（τ_０）が決定され、現在のピクチャから第２の参照
ピクチャへの第２の時間距離（τ_１）が決定される。第１の予測Ｌ_０と第２の予測Ｌ_１と
の間の差を最小化することによって、動き補正が計算される。第１の勾配値および第２の
勾配値が計算され、第１の勾配値および第２の勾配値の内部ビット幅を減少させるために
、追加の右シフトが導入される。第１の勾配値および第２の勾配値の和が計算され、その
ビット幅を減少させるために、この和に追加の右シフトが導入される。第１の予測サンプ
ルＬ_０と第２の予測サンプルＬ_１との間の差が計算され、この差の内部ビット幅を減少さ
せるために、第１の予測サンプルＬ_０および第２の予測サンプルＬ_１に追加の右シフトが
導入される。

【0011】

以下、本開示の数組の例示的な限定されない実施形態について、添付の図面とともに説
明する。関連技術の当業者であれば、本明細書に提示する例に基づいて、構造、方法、ま
たは機能の変形例を実施することができ、そのような変形例はすべて、本開示の範囲内に
含有される。矛盾が存在しない場合、必須ではないが、異なる実施形態の教示を互いに組
み合わせることもできる。

【図面の簡単な説明】

【0012】

【図1】図１は、双方向オプティカルフロー（ＢＤＯＦ）方法によって使用するのに好適な例示的なエンコーダを含む例示的な実施形態によるブロックに基づく例示的な混成ビデオコード化システムのブロック図である。

【図2】図２は、双方向オプティカルフロー（ＢＤＯＦ）方法によって使用するのに好適な例示的な実施形態による例示的なデコーダのブロック図である。

【図3】図３Ａは、例示的な実施形態による例示的な分配タイプ、すなわち４分割を示す図であり、図３Ｂは、例示的な実施形態による例示的な分配タイプ、すなわち水平２分割を示す図であり、図３Ｃは、例示的な実施形態による例示的な分配タイプ、すなわち垂直２分割を示す図であり、図３Ｄは、例示的な実施形態による例示的な分配タイプ、すなわち水平３分割を示す図であり、図３Ｅは、例示的な実施形態による例示的な分配タイプ、すなわち垂直３分割を示す図である。

【図4】図４は、例示的な双方向オプティカルフロー（ＢＤＯＦ）モデルを示す図である。

【図5】図５は、例示的な実施形態によるビデオデータのブロックを予測する例示的な方法のフローチャートである。

【発明を実施するための形態】

【0013】

本開示で使用される用語は、本開示を限定することではなく、特定の例を示すことを対
象とする。他の意味が文脈に明確に包含されない限り、本開示ならびに添付の特許請求の
範囲で使用される単数形の「ａ」、「ａｎ」、および「ｔｈｅ」は複数形も指す。本明細
書では、「および／または」という用語は、列挙する１つまたは複数の関連物品のあらゆ
る可能な組合せを指すことを理解されたい。

【0014】

本明細書では、様々な情報について説明するために、「第１」、「第２」、「第３」な
どの用語が使用されることがあるが、この情報は、これらの用語によって限定されるもの
ではないことを理解されたい。これらの用語は、ある情報カテゴリを別の情報カテゴリと
区別するためだけに使用される。たとえば、本開示の範囲から逸脱することなく、第１の
情報を第２の情報と呼ぶことができ、同様に第２の情報を第１の情報と呼ぶこともできる
。本明細書では、「～場合（ｉｆ）」という用語は、文脈に応じて、「～とき（ｗｈｅｎ
）」または「～とき（ｕｐｏｎ）」または「～に応答して（ｉｎｒｅｓｐｏｎｓｅｔ
ｏ）」を意味することが理解されよう。

【0015】

本明細書全体にわたって、単数または複数の「一実施形態」、「実施形態」、「別の実
施形態」などへの言及は、一実施形態に関連して説明する１つまたは複数の特定の特徴、
構造、または特性が、本開示の少なくとも１つの実施形態に含まれることを意味する。し
たがって、本明細書全体にわたって様々な箇所における単数または複数の「一実施形態で
は」、「実施形態では」、または「別の実施形態では」などの語句の記載は、必ずしもす
べて同じ実施形態を参照するものではない。さらに、１つまたは複数の実施形態における
特定の特徴、構造、または特性は、任意の好適な形で組み合わせることができる。

【0016】

【0017】

本明細書に記載する方法は、ＢＤＯＦを改善または強化することに関する。動き補償中
にＢＤＯＦを適用することができ、ＢＤＯＦは、現在のブロックに対する画素ごとに動き
ベクトルを修正するために使用され、したがって動きベクトルに適用された対応するオフ
セット値を使用して、現在のブロックの画素が予測される。例示的な実施形態では、ＢＤ
ＯＦは、動きベクトルを使用して、現在のブロックに対して反対の予測方向における参照
ピクチャ内の参照ブロックに対する現在のピクチャのビデオデータのブロックをインター
予測するときに使用される。ビデオ符号化方法は、ビデオシーケンスに固有の冗長性を低
減または除去するための空間（イントラピクチャ）予測および／または時間（インターピ
クチャ）予測を含む。ブロックに基づくビデオ符号化の場合、ビデオスライス（たとえば
、ビデオフレームまたはビデオフレームの一部分）をビデオブロックに分割することがで
き、ビデオブロックは、ツリーブロック、符号化単位（ＣＵ）、および／または符号化ノ
ードと呼ぶこともできる。同じピクチャ内の隣接ブロックの参照サンプルに対して空間予
測を使用して、ピクチャのイントラ符号化（Ｉ）スライス内のビデオブロックをコード化
することができる。ピクチャのインター符号化（ＰまたはＢ）スライスのビデオブロック
は、同じピクチャ内の隣接ブロックの参照サンプルに対して空間予測、または他の参照ピ
クチャ内の参照サンプルに対して時間予測を使用することができる。ピクチャをフレーム
と呼ぶことができ、参照ピクチャを参照フレームと呼ぶことができる。

【0018】

空間予測または時間予測の結果、ブロックを符号化するための予測ブロックが得られる
。残差データは、符号化するべき元のブロックと予測ブロックとの間の画素差を表す。イ
ンター符号化ブロックは、予測ブロックを形成する参照サンプルのブロックを指す動きベ
クトルと、符号化されたブロックと予測ブロックとの間の差を示す残差データとに従って
コード化される。イントラ符号化ブロックは、イントラ符号化モードおよび残差データに
従ってコード化される。さらなる圧縮のために、残差データを画素ドメインから変換ドメ
インに変換することができ、その結果として残差変換係数が得られ、次いでこれらの残差
変換係数を量子化することができる。最初は２次元アレイで配列されていた、量子化され
た変換係数を走査して、変換係数の１次元ベクトルを生み出すことができ、エントロピー
符号化を適用して、さらなる圧縮を実現することができる。

【0019】

各々のインター予測されたブロックに対して、１組の動き情報が利用可能となり得る。
１組の動き情報は、順方向および逆方向の予測方向に対する動き情報を含むことができる
。本明細書では、順方向または第１の予測方向および逆方向または第２の予測方向は、双
方向予測モードの２つの予測方向であり、「順方向」、「第１」、「逆方向」、および「
第２」という用語は、必ずしも幾何学的な意味を有するものではない。逆に、これらの用
語は概して、参照ピクチャが現在のピクチャの前に表示されるか（「逆方向」）、それと
も現在のピクチャの後に表示されるか（「順方向」）に対応する。例示的な実施形態では
、順方向予測方向は、現在のピクチャの参照ピクチャリスト０（ＲｅｆＰｉｃＬｉｓｔ０
）に対応することができ、逆方向予測方向は、参照ピクチャリスト１（ＲｅｆＰｉｃＬｉ
ｓｔ１）に対応することができる。

【0020】

各予測方向に対して、動き情報は、参照索引および動きベクトルを含む。例示的な実施
形態では、参照索引は、現在の参照ピクチャリスト（ＲｅｆＰｉｃＬｉｓｔ０またはＲｅ
ｆＰｉｃＬｉｓｔ１）内の参照ピクチャを識別するために使用することができる。動きベ
クトルは、水平成分（ｘ）および垂直成分（ｙ）を有する。概して、水平成分は、参照ブ
ロックのｘ座標を特定するために、現在のピクチャ内の現在のブロックの位置に対する参
照ピクチャ内の水平変位を示し、垂直成分は、参照ブロックのｙ座標を特定するために、
現在のブロックの位置に対する参照ピクチャ内の垂直変位を示す。

【0021】

ビデオ符号化規格では、ピクチャの表示順序を識別するために、ピクチャ順序カウント
（ＰＯＣ）値が広く使用されている。いくつかの状況では、１つの符号化されたビデオシ
ーケンス内の２つのピクチャが同じＰＯＣ値を有することもあるが、これは典型的に、符
号化されたビデオシーケンス内では生じない。したがって、ピクチャのＰＯＣ値は概して
一意であり、したがって対応するピクチャを一意に識別することができる。１つのビット
ストリーム内に複数の符号化されたビデオシーケンスが存在するとき、同じＰＯＣ値を有
するピクチャは、復号順序に関して互いに近い可能性がある。ピクチャのＰＯＣ値は、典
型的に、参照ピクチャリストの構成、ＨＥＶＣと同様の参照ピクチャセットの導出、およ
び動きベクトルのスケーリングに使用される。

【0022】

概念上、背景の章ですでに言及したものを含めて、多くのビデオ符号化規格は類似して
いる。たとえば、事実上すべてのビデオ符号化規格は、ビデオ圧縮を実現するために、ブ
ロックに基づく処理を使用し、類似のビデオ符号化ブロック図を共用する。

【0023】

ＨＥＶＣと同様に、ＶＶＣは、ブロックに基づく混成ビデオ符号化の枠組みで構成され
る。図１は、例示的な実施形態による双方向オプティカルフローに対する方法を使用する
ことができる例示的なエンコーダ１００を含むブロックに基づく混成ビデオコード化シス
テムのブロック図である。入力ビデオ信号は、ブロック（ＣＵ）ごとに処理される。ＶＴ
Ｍ－１．０において、ＣＵは最大１２８×１２８画素とすることができる。しかし、４分
木のみに基づいてブロックを分割するＨＥＶＣとは異なり、ＶＶＣでは、４分木／２分木
／３分木に基づいて変動する局所的な特徴に適応するために、１つの符号化ツリー単位（
ＣＴＵ）が複数のＣＵに分割される。加えて、ＨＥＶＣにおける複数の分割単位タイプの
概念は除去され、すなわちＣＵ、予測単位（ＰＵ）、および変換単位（ＴＵ）の分離はＶ
ＶＣには存在しなくなり、代わりに各ＣＵは常に、さらなる分割なく、予測および変換の
両方に対する基本単位として使用される。複数タイプのツリー構造では、１つのＣＴＵが
４分木構造によって分割され、次いで各４分木の葉ノードを、２分木および３分木構造に
よってさらに分割することができる。

【0024】

図１を参照すると、エンコーダ１００において、ビデオフレームが処理のために複数の
ビデオブロックに分割される。所与の各ビデオブロックに対して、インター予測手法また
はイントラ予測手法に基づいて、予測が形成される。インター予測では、以前に再構成さ
れたフレームからの画素に基づいて、動き推定および動き補償によって、１つまたは複数
の予測子が形成される。イントラ予測では、現在のフレーム内の再構成画素に基づいて、
予測子が形成される。モード決定によって、現在のブロックを予測するために最善の予測
子を選択することができる。

【0025】

現在のビデオブロックとその予測子との間の差を表す予測残差が、変換回路１０２へ送
られる。本明細書では、「回路」という用語は、ハードウェアおよびハードウェアを動作
させるためのソフトウェアを含む。変換回路１０２は、離散コサイン変換（ＤＣＴ）また
は概念的に類似している変換などの変換を残差ブロックに適用し、変換係数値を含むビデ
オブロックを生み出す。ＤＣＴの代わりに、ウェーブレット変換、整数変換、サブバンド
変換、離散サイン変換（ＤＳＴ）、または他のタイプの変換を使用することもできる。変
換回路１０２は、残差ブロックに変換を適用して、１群の変換係数を生み出す。変換は、
画素ドメインからの残差情報を周波数ドメインなどの変換ドメインへ転換することができ
る。

【0026】

次いで、その結果得られる変換係数は、エントロピー低減のために変換回路１０２から
量子化回路１０４へ送られる。量子化回路１０４は、ビットレートをさらに低減させるた
めに、変換係数を量子化する。量子化プロセスは、これらの係数のいくつかまたはすべて
に関連するビット深さを低減させることができる。量子化度は、量子化パラメータを調整
するによって修正することができる。次いで、量子化された係数は、圧縮ビデオビットス
トリームを生成するために、エントロピー符号化回路１０６へ送出される。エントロピー
符号化回路１０６は、量子化された変換係数をエントロピー符号化する。たとえば、エン
トロピー符号化回路１０６は、コンテキスト適応型可変長符号化（ＣＡＶＬＣ）、コンテ
キスト適応型２進算術符号化（ＣＡＢＡＣ）、構文に基づくコンテキスト適応型２進算術
符号化（ＳＢＡＣ）、確率間隔分割エントロピー（ＰＩＰＥ）符号化、または別のエント
ロピー符号化技法を実行することができる。コンテキストに基づくエントロピー符号化の
場合、コンテキストは隣接ブロックに基づくことができる。エントロピー符号化回路１０
６によるエントロピー符号化に続いて、コード化されたビットストリームは、別のデバイ
ス（たとえば、ビデオデコーダ）へ伝送することができ、または後の伝送もしくは検索の
ために保管することができる。図１に示すように、ビデオブロック分割情報、動きベクト
ル、参照ピクチャ索引、およびイントラ予測モードなど、インター予測回路および／また
はイントラ予測回路１１２からの予測関係情報１１０がまた、エントロピー符号化回路１
０６を介して送出され、圧縮ビデオビットストリーム１１４内へ保存される。

【0027】

エンコーダ１００では、予測の目的で、画素を再構成するためにデコーダ関係回路も必
要とされる。第１に、逆量子化回路１１６および逆変換回路１１８によって、予測残差が
再構成される。この再構成された予測残差をブロック予測子１２０と組み合わせて、現在
のビデオブロックに対するフィルタリングされていない再構成画素を生成する。逆量子化
回路１１６および逆変換回路１１８は、逆量子化および逆変換をそれぞれ適用して、画素
ドメイン内の残差ブロックを再構成する。特定の実施形態では、加算器が、動き補償回路
１２２またはイントラ予測回路１１２によって先に生み出されている動き補償された予測
ブロックに、再構成された残差ブロックを加えて、参照ピクチャメモリ内での記憶のため
に、再構成されたビデオブロックを生み出す。再構成されたビデオブロックは、次のビデ
オフレーム内のブロックをインター符号化するために、動き推定回路１２４および動き補
償回路１２２によって、参照ブロックとして使用することができる。

【0028】

符号化効率および視覚的品質を改善するために、ループ内フィルタが一般に使用される
。たとえば、ＡＶＣおよびＨＥＶＣ、ならびに現在のバージョンのＶＶＣでは、非ブロッ
ク化フィルタが利用可能である。ＨＥＶＣでは、符号化効率をさらに改善するために、Ｓ
ＡＯ（サンプル適応型オフセット）と呼ばれる追加のループ内フィルタが定義されている
。現在のバージョンのＶＶＣ規格では、最終的な規格に組み込むために、ＡＬＦ（適応型
ループフィルタ）と呼ばれるさらに別のループ内フィルタが積極的に調査されている。こ
れらのループ内フィルタ演算は任意選択である。これらの演算を実行することで、符号化
効率および視覚的品質を改善する手助けをする。これらの演算はまた、計算の複雑さを省
くために、エンコーダ１００によって下された決定としてオフにすることもできる。これ
らのフィルタのオプションがエンコーダ１００によってオンにされた場合、イントラ予測
は通常、フィルタリングされていない再構成画素に基づくのに対して、インター予測は、
フィルタリングされた再構成画素に基づくことに留意されたい。

【0029】

図２は、双方向オプティカルフローに対する方法を使用することができる例示的なデコ
ーダ２００のブロック図である。例示的な実施形態では、デコーダ２００は、図１のエン
コーダ１００に常駐する再構成に関係する部分に類似している。図２を参照すると、デコ
ーダ２００において、第１に、入ってくるビデオビットストリーム２０１を、エントロピ
ー復号回路２０２によって復号し、量子化された係数レベルおよび予測関係情報を導出す
る。次いで、量子化された係数レベルを逆量子化回路２０４および逆変換回路２０６によ
って処理し、再構成された予測残差を得る。逆量子化回路２０４は、ビットストリームに
提供されてエントロピー復号回路２０２によって復号されている量子化された変換係数を
逆量子化、すなわち量子化解除する。逆量子化プロセスは、ビデオスライス内の各ビデオ
ブロックに対してデコーダ２００によって計算される量子化パラメータＱＰｙを使用して
、適用されるべき量子化度、および同様に逆量子化度を決定することを含むことができる
。逆変換回路２０６は、逆変換、たとえば逆ＤＣＴ、逆整数変換、または概念的に類似し
ている逆変換プロセスを変換係数に適用して、画素ドメイン内に残差ブロックを生み出す
。

【0030】

イントラ／インターモードセレクタ回路２０８内に実装することができるブロック予測
子機構は、イントラ予測プロセスを実行するように構成されたイントラ予測回路２１０、
および／または復号された予測情報に基づいて動き補償プロセスを実行するように構成さ
れた動き補償回路２１２を含む。加算器２１４を使用して、逆変換回路２０６からの再構
成された予測残差と、ブロック予測子機構によって生成された予測出力とを加算すること
によって、１組のフィルタリングされていない再構成画素が得られる。ループ内フィルタ
２１６がオンにされている状況では、これらの再構成画素に対してフィルタリング演算を
実行して、出力のための最終的な再構成ビデオを導出する。

【0031】

ビデオスライスがイントラ符号化（Ｉ）スライスとして符号化されているとき、イント
ラ予測回路２１０が、現在のフレームまたはピクチャの以前復号されたブロックからの信
号送信されたイントラ予測モードおよびデータに基づいて、現在のビデオスライスのビデ
オブロックに対する予測データを生成することができる。ビデオフレームがインター符号
化（すなわち、Ｂ、Ｐ、またはＧＰＢ）スライスとして符号化されているとき、動き補償
回路２１２が、エントロピー復号回路２０２から受け取った動きベクトルおよび他の構文
要素に基づいて、現在のビデオスライスのビデオブロックに対する予測ブロックを生み出
す。予測ブロックは、参照ピクチャリストのうちの１つにおける参照ピクチャのうちの１
つから生み出すことができる。デコーダ２００は、デフォルトの構成法を使用して、参照
ピクチャメモリ内に記憶されている参照ピクチャに基づいて、参照フレームリストＬｉｓ
ｔ０およびＬｉｓｔ１を構成することができる。

【0032】

動き補償回路２１２は、動きベクトルおよび他の構文要素を構文解析することによって
、現在のビデオスライスのビデオブロックに対する予測情報を決定し、この予測情報を使
用して、復号されている現在のビデオブロックに対する予測ブロックを生み出す。たとえ
ば、動き補償回路２１２は、ビデオスライスのビデオブロックを符号化するために使用さ
れた予測モード（たとえば、イントラ予測またはインター予測）を決定するために受け取
った構文要素、インター予測スライスタイプ（たとえば、Ｂスライス、Ｐスライス、また
はＧＰＢスライス）、スライスに対する参照ピクチャリストのうちの１つまたは複数に対
する構成情報、スライスのインターコード化された各ビデオブロックに対する動きベクト
ル、スライスのインター符号化された各ビデオブロックに対するインター予測状態、およ
び現在のビデオスライス内のビデオブロックを復号するための他の情報のうちのいくつか
を使用する。

【0033】

動き補償回路２１２はまた、画素未満の精度のための補間フィルタに基づいて、補間を
実行することができる。動き補償回路２１２は、ビデオブロックのコード化中にエンコー
ダ１００によって使用される補間フィルタを使用して、参照ブロックの整数未満の画素に
対する補間された値を計算することができる。例示的な実施形態では、動き補償回路２１
２は、受け取った構文要素から、エンコーダ１００によって使用された補間フィルタを決
定し、補間フィルタを使用して予測ブロックを生み出す。動き補償回路２１２は、本開示
に記載する方法のいずれかまたはすべてを（単独または任意の組合せで）実行するように
構成することができる。たとえば、動き補償回路２１２は、本明細書に論じる例示的なＢ
ＤＯＦ方法を実行するように構成することができる。

【0034】

例示的な実施形態では、動き補償回路２１２は、現在のピクチャより時間的に前の第１
の参照ピクチャ（たとえば、参照ピクチャリスト０内）と、現在のピクチャより時間的に
後の第２の参照ピクチャ（たとえば、参照ピクチャリスト１内）とを有するブロックに、
ＢＤＯＦを適用するように構成される。ブロックにＢＤＯＦを適用することを決定したこ
とに応答して、動き補償回路２１２は、本明細書に論じる方法（たとえば、本明細書に記
載する数式に関する）を適用し、ＢＤＯＦに従ってブロックを予測することができる。

【0035】

図３Ａ～図３Ｅは、５つの例示的な分配タイプ、すなわち４分割（図３Ａ）、水平２分
割（図３Ｂ）、垂直２分割（図３Ｃ）、水平３分割（図３Ｄ）、および垂直３分割（図３
Ｅ）を示す。

【0036】

図１を再び参照して、空間予測および／または時間予測を実行することができる。空間
予測（または「イントラ予測」）は、同じビデオピクチャまたはスライス内のすでに符号
化された隣接ブロックのサンプル（参照サンプルと呼ばれる）からの画素を使用して、現
在のビデオブロックを予測する。空間予測は、ビデオ信号に固有の空間的冗長性を低減さ
せる。時間予測（「インター予測」または「動き補償予測」とも呼ばれる）は、すでに符
号化されたビデオピクチャからの再構成画素を使用して、現在のビデオブロックを予測す
る。時間予測は、ビデオ信号に固有の時間的冗長性を低減させる。所与のＣＵに対する時
間予測信号は通常、現在のＣＵと現在のＣＵの時間参照との間の動きの量および方向を示
す１つまたは複数の動きベクトル（ＭＶ）によって信号送信される。また、複数の参照ピ
クチャに対応する場合、１つの参照ピクチャ索引がさらに送られ、参照ピクチャストア内
のどの参照ピクチャから時間予測信号がくるかを識別するために使用される。空間および
／または時間予測後、エンコーダ内のモード決定ブロックが、たとえばレート歪み最適化
方法に基づいて、最善の予測モードを選ぶ。次いで、現在のビデオブロックから予測ブロ
ックを引き、変換を使用して予測残差の相関を除去し、量子化する。量子化された残差係
数を逆量子化および逆変換して、再構成された残差を形成し、次いで再び予測ブロックに
加えて、ＣＵの再構成信号を形成する。たとえばサンプル適応型オフセット（ＳＡＯ）お
よび適応型ループ内フィルタ（ＡＬＦ）などの非ブロック化フィルタを使用して、さらな
るループ内のフィルタリングを再構成ＣＵに適用することができ、その後、再構成ＣＵは
、参照ピクチャストア内に配置され、将来のビデオブロックを符号化するために使用され
る。出力ビデオビットストリームを形成するために、符号化モード（インターまたはイン
トラ）、予測モード情報、動き情報、および量子化された残差係数をすべてエントロピー
符号化回路１０６へ送り、さらに圧縮およびパックして、ビットストリームを形成する。

【0037】

図４は、例示的な双方向オプティカルフロー（ＢＤＯＦ）モデルを示す。図４に示すよ
うに、第１の参照ブロックＩ_０内の第１の予測Ｌ_０が、予測が実行されている現在のブロ
ックＣｕｒＢｌｋから第１の時間距離τ_０をあけて位置している。動きベクトル成分（Ｖ
_ｘ，Ｖ_ｙ）を有する第１の動きベクトルＡが、第１の参照ブロックＩ_０内で特定される。
同様に、第２の参照ブロックＩ_１内の第２の予測Ｌ_１が、現在のブロックから第２の時間
距離τ_１をあけて位置している。動きベクトル成分（－Ｖ_ｘ，－Ｖ_ｙ）を有する第２の動
きベクトルＢが、第２の参照ブロックＩ_１内で特定される。

【0038】

双方向オプティカルフロー：ビデオ符号化における従来の双方向予測は、すでに再構成
された参照ピクチャから得られる２つの時間予測ブロックの簡単な組合せである。しかし
、ブロックに基づく動き補償の制限により、２つの予測ブロックのサンプル間で観察され
得るわずかな動きが残ることがあり、したがって動き補償予測の効率が低減される。この
問題を解決するために、ＶＶＣでは、１つのブロック内のすべてのサンプルに対するその
ような動きの影響を減少させるために、双方向オプティカルフロー（ＢＤＯＦ）が適用さ
れる。より具体的には、図４に示すように、ＢＤＯＦは、双方向予測が使用されるときに
ブロックに基づく動き補償予測に加えて実行されるサンプルごとの動き補正である。各４
×４サブブロックの動き補正（ｖ_ｘ，ｖ_ｙ）は、サブブロックの周りの１つの６×６の窓
Ω内でＢＤＯＦが適用された後、Ｌ_０予測サンプルとＬ_１予測サンプルとの間の差を最小
化することによって計算される。より具体的には、（ｖ_ｘ，ｖ_ｙ）の値は、次式のように
導出される。

【0039】

【数1】

【0040】

この式で、

【数2】

は床関数であり、ｃｌｉｐ３（ｍｉｎ、ｍａｘ、ｘ）は、［ｍｉｎ，ｍａｘ］の範囲内で
所与の値ｘをクリッピングする関数であり、記号＞＞は、ビットごとの右シフト演算を表
し、記号＜＜は、ビットごとの左シフト演算を表し、ｔｈ_ＢＤＯＦは、不規則な局所的動
きによる伝搬誤差を防止するための動き補正閾値であり、２^{１３－ＢＤ}に等しく、ここで
、ＢＤは、入力ビデオのビット深さである。式（１）においては、次のとおりである。

【数3】

【0041】

Ｓ_１、Ｓ_２、Ｓ_３、Ｓ_５、およびＳ_６の値は、次式のように計算される。

【数4】

【0042】

この式で、Ωは、予測Ｌ_０およびＬ_１の１つのサブブロックの周りの１組の隣接予測サ
ンプルであり、また、次式のとおりである。

【数5】

【0043】

この式で、Ｉ^（ｋ）（ｉ，ｊ）は、中程度の高い精度（すなわち、１６ビット）で生成
されたリストｋ、ｋ＝０，１内の予測信号のサンプル位置（ｉ，ｊ）における予測サンプ
ルであり、

【数6】

は、その２つの隣接サンプル間の差を直接計算することによって得られるサンプルのそれ
ぞれ水平勾配および垂直勾配である。すなわち、次式のとおりである。

【数7】

【0044】

式（１）で導出された動き補正に基づいて、オプティカルフローモデルに基づいた動き
軌道に沿ってＬ_０予測およびＬ_１予測を補間することによって、ＣＵの最終的な双方向予
測サンプルが、次式（５）に示すように計算される。

【数8】

【0045】

この式で、ｓｈｉｆｔおよびο_{ｏｆｆｓｅｔ}は、双方向予測のためにＬ_０予測信号およ
びＬ_１予測信号を組み合わせるために適用される右シフト値およびオフセット値であり、
それぞれ、１５－ＢＤおよび１＜＜（１４－ＢＤ）＋２・（１＜＜１３）に等しい。テー
ブル１は、ＢＤＯＦプロセスに含まれる中間パラメータの特有のビット幅を示す。テーブ
ル１に示すように、全ＢＤＯＦプロセスの内部ビット幅は、３２ビットを超えない。加え
て、式（１）において、考え得る最悪の入力による乗算が、ｖ_ｘＳ_２，ｍの積で生じ、入
力ビット幅は、Ｓ_２，ｍおよびｖ_ｘに対してそれぞれ１５ビットおよび４ビットである。
したがって、１５ビットの乗算器が、ＢＤＯＦにとって十分である。

【0046】

【表1】

【表2】

【0047】

ＢＤＯＦは、双方向予測の効率を強化することができるが、ＢＤＯＦの設計をさらに改
善する機会がある。より具体的には、中間パラメータのビット幅を制御するためのＶＶＣ
における既存のＢＤＯＦ設計の以下の問題が、本開示で特定されている。

【0048】

第１に、テーブル１に示すように、パラメータθ（ｉ，ｊ）（すなわち、Ｌ_０予測とＬ
_１予測との間の差）、ならびにパラメータψ_ｘ（ｉ，ｊ）およびψ_ｙ（ｉ，ｊ）（すなわ
ち、Ｌ_０およびＬ_１に対する水平勾配値および垂直勾配値の和）が、１１ビットの同じビ
ット幅で表されている。そのような方法は、ＢＤＯＦに対する内部ビット幅の全体的な制
御を容易にすることができるが、この方法は、導出される動き補正の精度に関して最適と
は言えない可能性がある。これは、式（４）に示すように、これらの勾配値が隣接予測間
の差として計算されるからである。そのようなプロセスのハイパス特性により、導出され
た勾配は、ノイズ、たとえば元のビデオに捕捉されていたノイズおよび符号化プロセス中
に生成される符号化ノイズの存在下で、信頼性が低くなる。これは、この方法が高ビット
幅で勾配値を表すのに常に有益であるとは限らないことを意味する。

【0049】

加えて、テーブル１に示すように、全ＢＤＯＦプロセスの最大ビット幅の使用は、垂直
動き補正ｖ_ｙの計算によって行われ、第１にＳ_６（２７ビット）が３ビットだけ左シフト
され、次いで、（（ｖ_ｘＳ_２，ｍ）＜＜１２＋ｖ_ｘＳ_２，ｓ）／２（３０ビット）が減算
される。したがって、現在の設計の最大ビット幅は、３１ビットに等しい。実際的なハー
ドウェア実装では、通常、１６ビットより大きい最大内部ビット幅による符号化プロセス
が、３２ビットの実装によって実施される。したがって、既存の設計は、３２ビット実装
の有効ダイナミックレンジを完全に利用しない。これは、ＢＤＯＦによって導出される動
き補正の不必要な精度損失を招く可能性がある。

【0050】

図５に示す例示的な方法など、例示的な実施形態では、例示的なビット幅制御方法が、
従来のＢＤＯＦ設計に対するビット幅制御方法の上記の問題に対処する。

【0051】

第１に、勾配推定誤差の負の影響を克服するために、例示的な実施形態では、式（４）
における次の勾配値

【数9】

を計算するとき、すなわち勾配値の内部ビット幅を減少させるために、追加の右シフトｎ
_ｇｒａｄが導入される。より具体的には、次の第１の予測位置

【数10】

における第１の勾配値、すなわち水平勾配および垂直勾配、ならびに、次の第２の予測位
置

【数11】

における第２の勾配値、すなわち水平勾配および垂直勾配は、次式のように計算される。

【数12】

【0052】

さらに、ＢＤＯＦプロセスが適当な内部ビット幅で演算するようにＢＤＯＦプロセス全
体を制御するために、変数ψ_ｘ（ｉ，ｊ）、ψ_ｙ（ｉ，ｊ）、およびθ（ｉ，ｊ）の計算
に追加のビットシフトｎ_ａｄｊが、次に示すように導入される。

【数13】

【0053】

以下のテーブル２は、例示的なビット幅制御方法がＢＤＯＦに適用されるときの各中間
パラメータの対応するビット幅を示す。テーブル２は、ＶＶＣにおける従来のＢＤＯＦ設
計と比較して、例示的なビット幅制御方法で適用される変化を示す。テーブル２に見るこ
とができるように、例示的なビット幅制御方法を用いると、全ＢＤＯＦプロセスの内部ビ
ット幅は、３２ビットを超えない。加えて、この例示的な方法によって、最大ビット幅は
ちょうど３２ビットになり、これは、３２ビットのハードウェア実装の利用可能なダイナ
ミックレンジを完全に利用することができる。さらに、テーブル２に示すように、考え得
る最悪の入力による乗算が、ｖ_ｘＳ_２，ｍの積で生じ、入力Ｓ_２，ｍは１４ビットであり
、入力ｖ_ｘは６ビットである。したがって、従来のＢＤＯＦ方法と同様に、例示的な方法
が適用されるときも、１つの１６ビット乗算器は十分に大きい。

【0054】

テーブル２を参照すると、式（６）および式（７）で適用される右シフトされるビット
の数に対する修正により、テーブル１に示す従来のＢＤＯＦ方法と比較して、パラメータ
ψ_ｘ（ｉ，ｊ）、ψ_ｙ（ｉ，ｊ）、およびθ（ｉ，ｊ）のダイナミックレンジが異なり、
３つのパラメータは、同じダイナミックレンジ（すなわち、２１ビット）で表される。そ
のような変化は、内部パラメータＳ_１、Ｓ_２、Ｓ_３、Ｓ_５、およびＳ_６のビット幅を増大
させることができ、したがって場合により、内部ＢＤＯＦプロセスの最大ビット幅を３２
ビットより大きく増大させることができる。したがって、３２ビット実装を確実にするた
めに、Ｓ_２およびＳ_６の値を計算する際に、２つの追加のクリッピング演算が導入される
。より具体的には、例示的な方法において、２つのパラメータの値が、次に示すように計
算される。

【数14】

【0055】

この式で、Ｂ_２およびＢ_６は、それぞれＳ_２およびＳ_６の出力ダイナミックレンジを制
御するためのパラメータである。勾配計算とは異なり、式（８）のクリッピング演算は、
１つのＢＤＯＦのＣＵ内の各４×４サブブロックの動き補正を計算するために１度だけ適
用され、すなわち４×４単位で呼び出されることに留意されたい。したがって、提案する
方法で導入されるクリッピング演算による対応する複雑さの増大は、非常にわずかである
。

【0056】

例示的な実施形態では、ＣＵの最終的な双方向予測は、第１の予測Ｌ_０および第２の予
測Ｌ_１、動き補正（ｖ_ｘ，ｖ_ｙ）、ならびに、次の第１の勾配値

【数15】

と、次の第２の勾配値

【数16】

とに基づいて計算される。実際には、中間ビット幅と内部ＢＤＯＦ導出の精度との間で異
なるトレードオフを実現するために、ｎ_ｇｒａｄ、ｎ_ａｄｊ、Ｂ_２、およびＢ_６の異なる
値を適用することもできる。１つの例示的な実施形態では、ｎ_ｇｒａｄおよびｎ_ａｄｊは
２に設定され、Ｂ_２は２５に設定され、Ｂ_６は２７に設定される。特定の例示的な実施形
態では、たとえば、ｎ_ｃの値は２に等しく設定され、かつ／またはｔｈ_ＢＤＯＦは２に等
しく設定される（式（１）参照）。

【0057】

【表3】

【表4】

【0058】

図５は、例示的な実施形態によるビデオデータのブロックを予測する例示的な方法３０
０に対するフローチャートである。図５に示す方法について、図１のエンコーダ１００お
よび／または図２のデコーダ２００に関して説明する。しかし、他の例では、図５に示す
方法を実行するように、他のデバイスを構成することもできる。

【0059】

例示的な実施形態では、エンコーダ１００が最初に、参照ピクチャメモリ内に記憶され
ているピクチャをコード化し、次いで参照ピクチャとして使用するために復号するが、こ
れらのステップは、図５の例示的な方法には示されていない。次いで、エンコーダ１００
は、ビデオデータのブロックを受け取る。ブロックは、たとえば、ビデオデータの現在の
ピクチャ（またはピクチャのスライス）の符号化単位（ＣＵ）の予測単位（ＰＵ）とする
ことができる。エンコーダ１００は、イントラ予測またはインター予測など、様々な予測
モードのうちのどのブロックを予測するために使用するかどうかを判定し、インター予測
が判定された場合、単方向インター予測を使用するか、それとも双方向インター予測を使
用するかどうかを判定することができる。図５の例示的な方法では、エンコーダ１００は
、双方向予測を使用してブロックを予測すると判定する。たとえば、エンコーダ１００は
、様々な可能な予測モード（たとえば、１つまたは複数のイントラ予測モード、および参
照ピクチャメモリ内に記憶されている様々な復号された参照ピクチャからの単方向または
双方向予測）に対するレート歪みメトリクスを計算し、双方向予測がそのブロックに対し
て最善のレート歪みメトリクスを与えると判定することができる。

【0060】

エンコーダ１００、たとえば動き推定回路１２４は、双方向予測によって、そのブロッ
クに対する動きベクトルをさらに計算することができる。そのような動きベクトルは、現
在のピクチャの前に表示されるべき第１の参照ピクチャと、現在のピクチャの後に表示さ
れるべき第２の参照ピクチャとを指すことができる。たとえば、第１の参照ピクチャは、
参照ピクチャリスト０（ＲｅｆＰｉｃＬｉｓｔ０）内で生じることができ、第２の参照ピ
クチャは、参照ピクチャリスト１（ＲｅｆＰｉｃＬｉｓｔ１）内で生じることができる。

【0061】

一実施形態では、エンコーダ１００は、第１の動きベクトル（ＭＶ_０）が第１の時間距
離τ_０で参照する現在のピクチャに対するＰＯＣ値と第１の参照ピクチャに対するＰＯＣ
値との間の第１のＰＯＣ差と、第２の動きベクトル（ＭＶ_１）が第２の時間距離τ_１で参
照する現在のピクチャに対するＰＯＣ値と第２の参照ピクチャに対するＰＯＣ値との間の
第２のＰＯＣ差とを決定する。ＭＶ_０およびＭＶ_１は、それぞれのｘ成分およびｙ成分を
含むことができる。たとえば、ＭＶ_０は、ＭＶ_ｘ０およびＭＶ_ｙ０成分を含むことができ
、ここでＭＶ_ｘ０は、第１の参照ピクチャ内の参照ブロックを特定する位置を決定するよ
うに、現在のピクチャ内のブロックの位置に対する水平オフセットを示し、ＭＶ_ｙ０は、
垂直オフセットを示す。同様に、ＭＶ_１は、ＭＶ_ｘ１およびＭＶ_ｙ１成分を含むことがで
き、ここでＭＶ_ｘ１は、第２の参照ピクチャ内の参照ブロックを特定する位置を決定する
ように、現在のピクチャ内のブロックの位置に対する水平オフセットを示し、ＭＶ_ｙ１は
、垂直オフセットを示す。

【0062】

例示的な実施形態では、第１の参照ピクチャおよび第２の参照ピクチャが復号される（
３０２）。第２の参照ピクチャは、第１の参照ピクチャとは異なり、第１の参照ピクチャ
は、現在のピクチャの前に表示され、第２の参照ピクチャは、現在のピクチャの後に表示
される。例示的な実施形態では、現在のピクチャの現在のブロックから第１の参照ピクチ
ャの第１の予測Ｌ_０への第１の動きベクトル（ＭＶ_０）が決定され（３０４）、現在のブ
ロックから第２の参照ピクチャの第２の予測Ｌ_１への第２の動きベクトル（ＭＶ_１）が決
定される（３０６）。特定の例示的な実施形態では、現在のピクチャから第１の参照ピク
チャへの第１の時間距離（τ_０）における現在のピクチャの現在のブロックから第１の参
照ピクチャの第１の予測Ｌ_０への第１の動きベクトル（ＭＶ_０）が決定され、現在のピク
チャから第２の参照ピクチャへの第２の時間距離（τ_１）における現在のブロックから第
２の参照ピクチャの第２の予測Ｌ_１への第２の動きベクトル（ＭＶ_１）が決定される。

【0063】

次いで、エンコーダ１００は、これらの値を使用して、第１の予測Ｌ_０と第２の予測Ｌ
_１との間の差を最小化することによって、符号化単位（ＣＵ）の動き補正（ｖ_ｘ，ｖ_ｙ）
を計算する（３０８）。例示的な実施形態では、第１の予測Ｌ_０に対する次の第１の勾配
値

【数17】

ならびに、第２の予測Ｌ_１に対する次の第２の勾配値

【数18】

が計算される（３１０）。例示的な実施形態では、次いで、式（６）に示すように、追加
の右シフトｎ_ｇｒａｄを導入して第１の勾配値および第２の勾配値の内部ビット幅を減少
させることによって、第１の勾配値および第２の勾配値を計算することができる。例示的
な実施形態では、第１の勾配値および第２の勾配値を計算するステップ（３１０）は、第
１の予測の第１の予測位置および第２の予測の第２の予測位置の各々で水平勾配および垂
直勾配を計算するステップを含む。式（６）を参照すると、水平勾配は、第１の予測位置
および第２の予測位置の各々で計算され、垂直勾配は、第１の予測位置および第２の予測
位置の各々で計算される。

【0064】

例示的な実施形態では、（ｖ_ｘ，ｖ_ｙ）の値は、式（１）を使用して計算され、式（７
）に示すように、Ｓ_１、Ｓ_２、Ｓ_３、Ｓ_５、およびＳ_６の値を計算するために、追加のビ
ットシフトｎ_ａｄｊが、複数の変数ψ_ｘ（ｉ，ｊ）、ψ_ｙ（ｉ，ｊ）、およびθ（ｉ，ｊ
）の計算に導入される。たとえば、Ｓ_２およびＳ_６の値は、式（８）を使用して計算され
る。例示的な実施形態では、Ｓ_２およびＳ_６値は、式（８）に示すように、第１のクリッ
ピング演算および第２のクリッピング演算を導入することによって計算され、ここで、Ｂ
_２は、Ｓ_２の出力ダイナミックレンジを制御するためのパラメータであり、Ｂ_６は、Ｓ_６
の出力ダイナミックレンジを制御するためのパラメータである。次いで、第１の予測Ｌ_０
および第２の予測Ｌ_１、動き補正（ｖ_ｘ、ｖ_ｙ）、次の第１の勾配値

【数19】

ならびに、次の第２の勾配値

【数20】

に基づいて、ＣＵの最終的な双方向予測を計算することができる（３１２）。特定の例示
的な実施形態では、次いで、式（５）に示すように、動き軌道に沿って第１の予測Ｌ_０お
よび／または第２の予測Ｌ_１を補間することによって、動き補正に基づいて、ＣＵの最終
的な双方向予測サンプルを計算することができる。例示的な実施形態では、第１の勾配値
および第２の勾配値の和が計算され、そのビット幅を減少させるために、この和に追加の
右シフトが導入される。第１の予測サンプルＬ_０と第２の予測サンプルＬ_１との間の差が
計算され、この差の内部ビット幅を減少させるために、第１の予測サンプルＬ_０および第
２の予測サンプルＬ_１に追加の右シフトが導入される。

【0065】

図５に示す例示的な方法は、ビデオデータをコード化する方法の一例を表し、この方法
は、第１の参照ピクチャおよび第２の参照ピクチャを復号するステップであって、第２の
参照ピクチャが第１の参照ピクチャとは異なり第１の参照ピクチャが現在のピクチャの前
に表示され、第２の参照ピクチャが現在のピクチャの後に表示される、ステップと、現在
のピクチャの現在のブロックから第１の参照ピクチャの第１の参照ブロックへの第１の動
きベクトル（ＭＶ_０）を決定するステップと、現在のブロックから第２の参照ピクチャの
第２の参照ブロックへの第２の動きベクトル（ＭＶ_１）を決定するステップと、双方向オ
プティカルフロー（ＢＤＯＦ）に従って現在のブロックをコード化するステップとを含む
。

【0066】

１つまたは複数の例では、記載の機能は、ハードウェア、ソフトウェア、ファームウェ
ア、またはこれらの任意の組合せで実施することができる。ソフトウェアで実施された場
合、これらの機能は、１つまたは複数の命令またはコードとして、コンピュータ可読媒体
に記憶し、またはコンピュータ可読媒体を介して伝送することができ、ハードウェアに基
づく処理単位によって実行することができる。コンピュータ可読媒体は、データ記憶媒体
などの有形の媒体に対応するコンピュータ可読記憶媒体、またはたとえば通信プロトコル
に従った１つの場所から別の場所へのコンピュータプログラムの伝達を容易にする任意の
媒体を含む通信媒体を含むことができる。このようにして、コンピュータ可読媒体は、概
して、（１）非一時的な有形のコンピュータ可読記憶媒体、または（２）信号もしくは搬
送波などの通信媒体に対応することができる。データ記憶媒体は、本出願に記載する実装
例の実装のために命令、コード、および／またはデータ構造を取り出すために、１つもし
くは複数のコンピュータまたは１つもしくは複数のプロセッサによってアクセスすること
ができる利用可能な任意の媒体とすることができる。コンピュータプログラム製品は、コ
ンピュータ可読媒体を含むことができる。

【0067】

さらに、上記の方法は、１つまたは複数の回路を含む装置を使用して実施することがで
き、そのような回路には、特定用途向け集積回路（ＡＳＩＣ）、デジタル信号プロセッサ
（ＤＳＰ）、デジタル信号処理デバイス（ＤＳＰＤ）、プログラマブル論理デバイス（Ｐ
ＬＤ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、コントローラ、マイクロ
コントローラ、マイクロプロセッサ、または他の電子構成要素が含まれる。この装置は、
上述した方法を実行するために、他のハードウェアまたはソフトウェア構成要素と組み合
わせて、これらの回路を使用することができる。上記で開示した各モジュール、サブモジ
ュール、ユニット、またはサブユニットは、１つまたは複数の回路を少なくとも部分的に
使用して実施することができる。

【0068】

本発明の他の実施形態は、本明細書の考察および上記で開示した本発明の実施から、当
業者には明らかになる。本出願は、本発明の一般原理に準拠し、当技術分野で周知または
通例の慣行範囲に入る本開示からの逸脱を含めて、本発明のあらゆる変形例、使用例、ま
たは適用例を包含することが意図される。本明細書および例は、例示としてのみ考慮され
るべきであり、本発明の本当の範囲および精神は、以下の特許請求の範囲によって示され
ることが意図される。

【0069】

本発明は、上記に説明および添付の図面に図示した厳密な例に限定されるものではなく
、本発明の範囲から逸脱することなく、様々な修正および変更を加えることができること
が理解されよう。本発明の範囲は、添付の特許請求の範囲によってのみ限定されることが
意図される。

【図1】

【図2】

【図3】

【図4】

【図5】

【手続補正書】

【提出日】2024-09-06

【手続補正1】

【補正対象書類名】特許請求の範囲

【補正対象項目名】全文

【補正方法】変更

【補正の内容】

【特許請求の範囲】

【請求項1】

ビデオを復号するための方法であって、
現在のピクチャの現在のブロックについて、第１の参照ピクチャに対応する第１の予測を決定するステップであって、前記第１の参照ピクチャが前記現在のピクチャの前に表示される、ステップと、
前記現在のブロックについて、第２の参照ピクチャに対応する第２の予測を決定するステップであって、前記第２の参照ピクチャが前記現在のピクチャの後に表示される、ステップと、
前記第１の予測に対する第１の勾配値と前記第２の予測に対する第２の勾配値とを計算するステップと、
前記第１の予測と前記第２の予測との間の差を最小化することによって、前記現在のブロックの各サブブロックのそれぞれの動き補正を計算するステップであって、前記差の計算のために、固定値４の第１の右シフトにより前記第１予測および前記第２の予測を右シフトする、ステップと、
前記第１の予測、前記第２の予測、それぞれの動き補正、前記第１の勾配値および前記第２の勾配値に基づいて、前記現在のブロックの最終的な双方向予測を計算するステップと
を含み、
前記それぞれの動き補正は、水平方向の動き補正および垂直方向の動き補正を含み、
前記第１の予測と前記第２予測とオフセット値とそれぞれの値との和が算出され、前記現在のブロックの最終的な双方向予測の計算のために、前記第１の予測と前記第２予測と前記オフセット値と前記それぞれの値との当該和が、当該ビデオのビット深さに応じた第２の右シフトにより右シフトされ、
前記それぞれの値は、前記第２の勾配値と前記第１の勾配値との間の差分に前記水平方向の動き補正を乗算した値と、前記第２の勾配値と前記第１の勾配値との間の差分に前記垂直方向の動き補正を乗算した値とに基づいて計算される、方法。

【請求項2】

前記第１の予測と前記第２の予測との間の差を最小化することによって、前記現在のブロックの各サブブロックのそれぞれの動き補正を計算するステップは、
第１の水平勾配と第２の水平勾配とを加算することにより水平方向の和を計算するとともに、第１の垂直勾配と第２の垂直勾配と加算することにより垂直方向の和を計算するステップであって、前記水平方向の和および前記垂直方向の和の各々のビット幅を減少させるために、前記水平方向の和および前記垂直方向の和に第１の右シフト値が導入される、ステップと、
前記水平方向の和および前記垂直方向の和に基づいて前記現在のブロックの各サブブロックのそれぞれの動き補正を計算するステップと
を含む、請求項１に記載の方法。

【請求項3】

前記第１の予測に対する前記第１の勾配値の計算と前記第２予測に対する前記第２の勾配値の計算とに第２の右シフト値が導入される、請求項１に記載の方法。

【請求項4】

前記第１の予測と前記第２の予測との間の差を最小化することによって、前記現在のブロックの各サブブロックのそれぞれの動き補正を計算するステップは、前記それぞれの動き補正における前記水平方向の動き補正および前記垂直方向の動き補正を、［－ｔｈ _ＢＤＯＦ，ｔｈ _ＢＤＯＦ］の範囲内にクリッピングするステップを含み、ｔｈ _ＢＤＯＦは、動き補正閾値である、請求項１に記載の方法。

【請求項5】

前記第１の予測と前記第２の予測との間の当該差の計算に第３の右シフト値が導入される、請求項４に記載の方法。

【請求項6】

前記第１の予測に対する前記第１の勾配値および前記第２の予測に対する前記第２の勾配値を計算するステップが、前記第１の予測の第１の予測位置および前記第２の予測の第２の予測位置の各々で水平勾配および垂直勾配を計算するステップをさらに含む、請求項１に記載の方法。

【請求項7】

前記現在のブロックの最終的な双方向予測を計算するステップは、さらに前記第１の予測および前記第２の予測を組み合わせるための第４の右シフト値に基づいて、前記現在のブロックの当該最終的な双方向予測を計算するステップを含む、請求項１に記載の方法。

【請求項8】

前記第４の右シフト値は追加の右シフト値を含み、前記追加の右シフト値が、復号用のビデオのビット深さに等しくなるように設定されている、請求項７に記載の方法。

【請求項9】

前記第１の予測が、前記現在のブロックから前記第１の参照ピクチャへの第１の動きベクトルに基づいて決定され、前記第２の予測が、前記現在のブロックから前記第２の参照ピクチャへの第２の動きベクトルに基づいて決定される、請求項１に記載の方法。

【請求項10】

ビデオを復号するためのコンピューティングデバイスであって、
１つまたは複数のプロセッサと、
前記１つまたは複数のプロセッサに結合された非一時的記憶装置と、
前記非一時的記憶装置に記憶された複数のプログラムとを備え、
前記複数のプログラムが、前記１つまたは複数のプロセッサによって実行されると、ビットストリームに対して請求項１から９のうちのいずれか１項に記載の方法を前記コンピューティングデバイスに実行させる、コンピューティングデバイス。

【請求項11】

コンピュータで実行可能な命令とビットストリームとを記憶するための非一時的コンピュータ可読記憶媒体であって、前記コンピュータで実行可能な命令が、１つまたは複数のプロセッサによって実行されたとき、前記ビットストリームに対して請求項１から９のうちのいずれか１項に記載の方法を前記１つまたは複数のプロセッサに実行させる、非一時的コンピュータ可読記憶媒体。

【請求項12】

ビデオ復号方法によって用いられるビットストリームを記憶するための方法であって、前記ビデオ復号方法が、
現在のピクチャの現在のブロックについて、第１の参照ピクチャに対応する第１の予測を決定するステップであって、前記第１の参照ピクチャが前記現在のピクチャの前に表示される、ステップと、
前記現在のブロックについて、第２の参照ピクチャに対応する第２の予測を決定するステップであって、前記第２の参照ピクチャが前記現在のピクチャの後に表示される、ステップと、
前記第１の予測に対する第１の勾配値と前記第２の予測に対する第２の勾配値とを計算するステップと、
前記第１の予測と前記第２の予測との間の差を最小化することによって、前記現在のブロックの各サブブロックのそれぞれの動き補正を計算するステップであって、前記差の計算のために、固定値４の第１の右シフトにより前記第１予測および前記第２の予測を右シフトする、ステップと、
前記第１の予測、前記第２の予測、それぞれの動き補正、前記第１の勾配値および前記第２の勾配値に基づいて、前記現在のブロックの最終的な双方向予測を計算するステップと
を含み、
前記それぞれの動き補正は、水平方向の動き補正および垂直方向の動き補正を含み、
前記第１の予測と前記第２予測とオフセット値とそれぞれの値との和が算出され、前記現在のブロックの最終的な双方向予測の計算のために、前記第１の予測と前記第２予測と前記オフセット値と前記それぞれの値との当該和が、当該ビデオのビット深さに応じた第２の右シフトにより右シフトされ、
前記それぞれの値は、前記第２の勾配値と前記第１の勾配値との間の差分に前記水平方向の動き補正を乗算した値と、前記第２の勾配値と前記第１の勾配値との間の差分に前記垂直方向の動き補正を乗算した値とに基づいて計算される、方法。

【請求項13】

複数の命令を含むコンピュータプログラムであって、前記複数の命令は、コンピュータによって実行されると、請求項１から９のうちのいずれか１項に記載の方法をコンピュータに実行させる、コンピュータプログラム。

【外国語明細書】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版