(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-08-18
(45)【発行日】2023-08-28
(54)【発明の名称】フレームレートアップコンバージョンツールを使用する改善された圧縮/解凍のための方法および装置
(51)【国際特許分類】
H04N 19/109 20140101AFI20230821BHJP
H04N 19/159 20140101ALI20230821BHJP
H04N 19/52 20140101ALI20230821BHJP
H04N 19/577 20140101ALI20230821BHJP
H04N 19/587 20140101ALI20230821BHJP
H04N 19/70 20140101ALI20230821BHJP
【FI】
H04N19/109
H04N19/159
H04N19/52
H04N19/577
H04N19/587
H04N19/70
(21)【出願番号】P 2020508521
(86)(22)【出願日】2018-08-29
(86)【国際出願番号】 US2018048427
(87)【国際公開番号】W WO2019046356
(87)【国際公開日】2019-03-07
【審査請求日】2021-08-17
(32)【優先日】2017-08-29
(33)【優先権主張国・地域又は機関】EP
(73)【特許権者】
【識別番号】319002876
【氏名又は名称】インターデジタル マディソン パテント ホールディングス, エスアーエス
(74)【代理人】
【識別番号】100079108
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【氏名又は名称】内藤 和彦
(74)【代理人】
【識別番号】100108213
【氏名又は名称】阿部 豊隆
(72)【発明者】
【氏名】ロベール,アントワーヌ
(72)【発明者】
【氏名】ルリアネック,ファブリス
(72)【発明者】
【氏名】アーバン,ファブリス
【審査官】久保 光宏
(56)【参考文献】
【文献】米国特許出願公開第2016/0286229(US,A1)
【文献】Jianle Chen, et al.,"Algorithm Description of Joint Exploration Test Model 6 (JEM 6)",JVET-F1001 (version 2),[online], Joint Video Exploration Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,2017年05月31日,Pages 21-24,[令和4年9月2日検索], インターネット, <URL: https://jvet-experts.org/doc_end_user/current_document.php?id=3147> and <URL: https://jvet-experts.org/doc_end_user/documents/6_Hobart/wg11/JVET-F1001-v2.zip>.
【文献】Xiang Li, et al.,"Frame Rate Up-Conversion based Motion Vector Derivation for Hybrid Video Coding",Proceedings of 2017 Data Compression Conference (DCC),IEEE,2017年04月07日,Pages 390-399,ISBN: 978-1-5090-6721-3, <DOI: 10.1109/DCC.2017.8>.
【文献】Shen Songwei, et al.,"Deformable Motion Model For Frame Rate Up-Conversion in Video Coding",Proceedings of 2016 IEEE Region 10 Conference (TENCON),IEEE,2016年11月25日,Pages 3748-3751,ISBN: 978-1-5090-2597-8, <DOI: 10.1109/TENCON.2016.7848761>.
(58)【調査した分野】(Int.Cl.,DB名)
H04N19/00-19/98
CSDB(日本国特許庁)
学術文献等データベース(日本国特許庁)
IEEEXplore(IEEE)
(57)【特許請求の範囲】
【請求項1】
エンコーダにより実行される方法であって、
ビデオ画像の部分に対してフレームレートアップコンバージョン(FRUC)を実行することと、
ビデオビットストリームに第1のフラグを含めることと、
前記ビデオビットストリームに第2のフラグを含めることと、
前記ビデオビットストリームに第3のフラグを含めることと、
を含み、
前記第1のフラグは、初期FRUCツールからFRUCマージサブツールを有効にするために前記ビデオビットストリームのデコーダに信号で伝え、
前記第2のフラグは、前記デコーダで前記ビデオ画像の部分について、有効にされた前記FRUCマージサブツールのサブパートを有効にするために前記ビデオビットストリームの前記デコーダに信号で伝え、
前記第3のフラグは、有効にされた前記FRUCマージサブツールのバイラテラルテンプレートマッチングコスト関数を有効にするために前記ビデオビットストリームのデコーダに信号で伝える、方法。
【請求項2】
デコーダにより実行される方法であって、
ビデオビットストリームを解析して第1のフラグが設定されているかどうかを特定することと、
前記ビデオビットストリームを解析して第2のフラグが設定されているかどうかを特定することと、
前記ビデオビットストリームを解析して第3のフラグが設定されているかどうかを特定することと、
前記第1のフラグが設定されているという条件で、初期FRUCツールからFRUCマージサブツールを用いて、ビデオ画像の部分に対して、フレームレートアップコンバージョン(FRUC)を実行することと、
前記第1のフラグ及び前記第2のフラグが設定されているという条件で、前記初期FRUCツールから有効化された前記FRUCマージサブツール及び有効にされた前記FRUCマージサブツールのサブパートを用いて、前記ビデオ画像の部分に対して、FRUCを実行することと、
前記第1のフラグ及び前記第3のフラグが設定されているという条件で、前記初期FRUCツールから有効化された前記FRUCマージサブツール及び有効にされた前記FRUCマージサブツールのバイラテラルテンプレートマッチングコスト関数を用いて、前記ビデオ画像の部分に対して、FRUCを実行することと、
を含む方法。
【請求項3】
装置であって、
メモリと、
プロセッサであって、
ビデオ画像の部分に対してフレームレートアップコンバージョン(FRUC)を実行することと、
ビデオビットストリームに第1のフラグを含めることと、
前記ビデオビットストリームに第2のフラグを含めることと、
前記ビデオビットストリームに第3のフラグを含めることと、
を実行するように構成されたプロセッサと、
含み、
前記第1のフラグは、初期FRUCツールからFRUCマージサブツールを有効にするために前記ビデオビットストリームのデコーダに信号で伝え、
前記第2のフラグは、前記デコーダで前記ビデオ画像の部分について、有効にされた前記FRUCマージサブツールのサブパートを有効にするために前記ビデオビットストリームの前記デコーダに信号で伝え、
前記第3のフラグは、有効にされた前記FRUCマージサブツールのバイラテラルテンプレートマッチングコスト関数を有効にするために前記ビデオビットストリームのデコーダに信号で伝える、装置。
【請求項4】
装置であって、
メモリと、
プロセッサであって、
ビデオビットストリームを解析して第1のフラグが設定されているかどうかを特定することと、
前記ビデオビットストリームを解析して第2のフラグが設定されているかどうかを特定することと、
前記ビデオビットストリームを解析して第3のフラグが設定されているかどうかを特定することと、
初期FRUCツールから有効化されたFRUCマージサブツールを用いて、ビデオ画像の部分に対して、フレームレートアップコンバージョン(FRUC)を実行することと、
前記第1のフラグ及び前記第2のフラグが設定されているという条件で、前記初期FRUCツールから有効化された前記FRUCマージサブツール及び有効にされた前記FRUCマージサブツールのサブパートを用いて、前記ビデオ画像の部分に対して、FRUCを実行することと、
前記第1のフラグ及び前記第3のフラグが設定されているという条件で、前記初期FRUCツールから有効化された前記FRUCマージサブツール及び有効にされた前記FRUCマージサブツールのバイラテラルテンプレートマッチングコスト関数を用いて、前記ビデオ画像の部分に対して、FRUCを実行することと、
を行うように構成されている、プロセッサと、
を含む、装置。
【請求項5】
前記ビデオ画像の部分は、符号化単位(CU)であり、マージブロックのサブパートは、CUのサブブロックである、請求項1又は2に記載の方法。
【請求項6】
初期FRUCツールから適応動きベクトル予測(AMVP)サブツールを有効にするために前記ビデオビットストリームのデコーダに信号で伝える第4のフラグを前記ビデオビットストリームに含めることを更に含む、請求項1に記載の方法。
【請求項7】
前記ビデオビットストリームを解析して第4のフラグが設定されているかどうかを特定することと、
前記第1のフラグ及び前記第4のフラグが設定されているという条件で、前記初期FRUCツールから有効化された前記FRUCマージサブツール及び前記初期FRUCツールから有効化された適応動きベクトル予測(AMVP)サブツールを用いて、前記ビデオ画像の部分に対して、FRUCを実行することと、
を更に含む、請求項2に記載の方法。
【請求項8】
前記フラグのうちのいずれかは、ビデオパラメータセット内に位置する、請求項1又は2に記載の方法。
【請求項9】
前記フラグのうちのいずれかは、シーケンスパラメータセット内に位置する、請求項1又は2に記載の方法。
【請求項10】
前記フラグのうちのいずれかは、ピクチャパラメータセット内に位置する、請求項1又は2に記載の方法。
【請求項11】
命令を備えるコンピュータプログラムプロダクトであって、前記プログラムがコンピュータにより実行されたときに、前記コンピュータに、請求項1,2,5~10の何れか1項に記載の方法を実行させる、コンピュータプログラムプロダクト。
【請求項12】
前記ビデオ画像の部分は、符号化単位(CU)であり、マージブロックのサブパートは、CUのサブブロックである、請求項3又は4に記載の装置。
【請求項13】
前記プロセッサは、初期FRUCツールから適応動きベクトル予測(AMVP)サブツールを有効にするために前記ビデオビットストリームのデコーダに信号で伝える第4のフラグを前記ビデオビットストリームに含めるように更に構成されている、請求項3に記載の装置。
【請求項14】
前記プロセッサは、
前記ビデオビットストリームを解析して第4のフラグが設定されているかどうかを特定することと、
前記第1のフラグ及び前記第4のフラグが設定されているという条件で、前記初期FRUCツールから有効化された前記FRUCマージサブツール及び前記初期FRUCツールから有効化された適応動きベクトル予測(AMVP)サブツールを用いて、前記ビデオ画像の部分に対して、FRUCを実行することと、
を行うように更に構成されている、請求項4に記載の装置。
【請求項15】
前記フラグのうちのいずれかは、ビデオパラメータセット内に位置する、請求項3又は4に記載の装置。
【請求項16】
前記フラグのうちのいずれかは、シーケンスパラメータセット内に位置する、請求項3又は4に記載の装置。
【請求項17】
前記フラグのうちのいずれかは、ピクチャパラメータセット内に位置する、請求項3又は4に記載の装置。
【発明の詳細な説明】
【技術分野】
【0001】
本原理は、ビデオ圧縮に関し、より具体的には、ビデオ符号化およびビデオ復号化を実行することに関する。
【背景技術】
【0002】
ブロックベースのコーデックの符号化効率を改善するための多くの試みがなされてきた。フレームレートアップコンバージョン(FRUC)は、いずれの情報も伴わずに、すなわち追加の構文を伴わずに、動きベクトル予測子の導出を可能にするツールである。FRUCプロセスは、符号化側と同じ操作が復号化側で実行されるという点で、完全に対称的である。
【0003】
このツールは、いくつかのサブツールを使用しながら、1つのフラグでのみ完全にオンまたはオフにすることができる(表2に示す)。
AMVP(高度動きベクトル予測)ブロックは、1つのテンプレートマッチングコスト関数を使用し、シグナリングは使用しない。
【0004】
マージブロックは、同じプロセス、2つの異なるテンプレートマッチングコスト関数、および何らかのシグナリング(オフ/オンテンプレート/バイラテラル)を用いてサブパートの絞り込みを使用することができる。
【0005】
共同ビデオ探査チーム(ITU-T VCEG(Q6/16)およびISO/IEC MPEG(JTC1/SC29/WG11)の共同探査モデル4(JEM4)を介したFRUCツール、ならびに異なるサブツールの全体的な性能は、表1に提供されている。
【表1】
【0006】
さらに、これらのサブツールのいくつかは、パラメータを使用する。表2に示すように構文に既にあるものもあるが、存在しないものもある。
【0007】
表2では、sps_use_FRUC_modeは、FRUCツール全体に対するオン/オフフラグであり、FRUC_refine_filterは、サブペル補間フィルタの変更を許可し、FRUC_refine_range_in_pelは、絞り込みのための最大整数ペル範囲を定義し、FRUC_small_blk_refine_depthは、FRUCマージブロックのサブパートについての最大深度(すなわち、最小サイズ)を定義する。
【表2】
【発明の概要】
【0008】
従来技術のこれらおよび他の欠点および短所は、FRUCツールによって提供される符号化効率とその複雑さとの間のトレードオフを管理するための方法および装置を対象とする記載された本実施形態によって対処される。
【0009】
記載された実施形態の一態様によれば、方法が提供される。方法は、ビデオ画像の一部分に対してフレームレートアップコンバージョンを実行することと、ビデオビットストリームに第1のフラグを含めることであって、第1のフラグは、フレームレートアップコンバージョンを示す、含めることと、ビデオビットストリームに第2のフラグを含めることであって、第2のフラグは、フレームレートアップコンバージョンをさらに示す、含めることと、を含む、ビデオ画像の一部分を符号化するためのステップを含む。
【0010】
記載された実施形態の別の態様によれば、方法が提供される。方法は、ビデオビットストリームを解析して第1のフラグを特定することと、ビデオビットストリームを解析して第2のフラグを特定することと、第1のフラグおよび第2のフラグに基づいて、ビデオ画像の一部分に対してフレームレートアップコンバージョンを実行することと、を含む、ビデオ画像の一部分を復号化するためのステップを含む。
【0011】
記載される実施形態の別の態様によれば、装置が提供される。装置は、メモリと、プロセッサと、を含む。プロセッサは、ビデオ画像の一部分に対してフレームレートアップコンバージョンを実行することと、ビデオビットストリームに第1のフラグを含めることであって、第1のフラグは、フレームレートアップコンバージョンを示す、含めることと、ビデオビットストリームに第2のフラグを含めることであって、第2のフラグは、フレームレートアップコンバージョンをさらに示す、含めることと、によって、ビデオ信号の一部分を符号化するように構成され得る。
【0012】
記載される実施形態の別の態様によれば、装置が提供される。装置は、メモリと、プロセッサと、を含む。プロセッサは、ビデオビットストリームを解析して第1のフラグを特定することと、ビデオビットストリームを解析して第2のフラグを特定することと、第1のフラグおよび第2のフラグに基づいて、ビデオ画像の一部分に対してフレームレートアップコンバージョンを実行することと、によって、ビデオ信号の一部分を復号化するように構成され得る。
【0013】
本原理のこれらおよび他の態様、特徴、および利点は、添付の図面に関連して読まれる、例示的な実施形態の以下の詳細な説明から明らかになるであろう。
【図面の簡単な説明】
【0014】
【
図1】提案された実施形態を適用することができる典型的なビデオエンコーダのブロック図を例解する。
【
図2】提案された実施形態を適用することができる典型的なビデオデコーダのブロック図を例解する。
【
図3】記載された実施形態を使用する符号化のための方法の一実施形態を例解する。
【
図4】記載された実施形態を使用する復号化のための方法の一実施形態を例解する。
【
図5】記載された実施形態を使用する符号化または復号化のための装置の一実施形態を例解する。
【発明を実施するための形態】
【0015】
本明細書に記載の実施形態の領域は、最先端のビデオ符号化方式のビデオ圧縮効率を改善することを意図したビデオ圧縮である。
【0016】
共同探査モデル(JEM)において最近導入された代表的な符号化ツールは、FRUC(フレームレートアップコンバージョン)と呼ばれ、またはパターンマッチ動き導出とも呼ばれ、デコーダ側動きブロックベースの動きベクトル予測子導出を目的としている。
【0017】
フレームレートアップコンバージョン(FRUC)ツールは、テンプレートマッチングコストに関して、候補のセットの中から最適な動きベクトル予測子(MVP)を見出すことを目的としている。次に、最適に特定された候補は、最小テンプレートマッチングコストに向けて絞り込まれる。
【0018】
FRUCプロセスは、すべての種類のブロックに対して類似しており、1つのプロセスは、ブロック全体に対して実行され、次いで、いくつかの特定のブロックに対して、サブパートについての第2のプロセスも実現することができる。これらのプロセス間の主な相違は、候補の初期リスト、および使用可能なテンプレートマッチングコスト関数である。
【0019】
このFRUCツールの性能とその複雑さとの間のトレードオフを管理するために、どのFRUCプロセス(またはサブプロセス、すなわちプロセスの一部)が許可されているか否かをデコーダに通知することができる。
【0020】
本明細書に記載の実施形態によって解決される問題は、例えばJEMビデオコーデックにおけるように、FRUCツールによって提供される符号化効率とその複雑さとの間のトレードオフを管理することである。
【0021】
FRUCツールは、すべてのブロック(マージおよびAMVP)に適用され、マージブロックのサブパートレベルまたはサブブロックレベルで絞り込まれる。AMVPブロックの場合、1つのテンプレートマッチングコスト関数「テンプレート」のみが使用可能である。マージブロックおよびそのサブパートの場合、2つの異なるテンプレートマッチングコスト関数、「テンプレート」および「バイラテラル」がテストされる。
【0022】
テンプレートマッチングは、現在のピクチャ内のテンプレート(現在の符号化単位の上部および/または左の隣接ブロック)と、参照ピクチャ内の同じサイズのテンプレートを有するブロックとの間の最適な一致を見出すことにより、現在の符号化単位の動き情報を導出する。
【0023】
バイラテラルマッチングは、2つの参照ピクチャ内の現在の符号化単位の動き軌跡に沿った2つのブロック間の最適な一致を見出すことにより、現在の符号化単位の動き情報を導出する。
【0024】
マージブロックのサブパートは、サブブロックである。FRUCマージのでは、FRUCツールは、最初にCU(符号化単位)レベルで適用され、次いで、このCUは、サブブロックに分割され、FRUCツールは、CUの場合と同じテンプレートマッチングコスト関数を用いてサブブロックの各々に再度適用される。
【0025】
SPS(シーケンスパラメータセット)FRUCフラグがオンである場合、FRUCツールは、符号化側で使用/テストされ、復号化側で有効である。
【0026】
AMVPの場合、FRUCツールによって、シグナリングを伴わずに符号化および復号化において同じ方法で導出されたAMVP候補を見出すことができる。
【0027】
マージの場合、FRUCマージモードは、符号化側でテストされ、FRUCを使用すべきするか否か、使用する場合はどのテンプレートマッチングコスト関数(3つの状態:オフ/テンプレート/バイラテラルがある)を用いるかを示す何らかのシグナリングがある。
【0028】
マージCUの場合、FRUCツールが(SPSレベルで)起動されると、第1のフラグは、マージモードを信号で示し、次いで第2のフラグは、FRUC状態を信号で示す。デコーダは、これらのフラグを読み取り、このCUにFRUCツールを使用しなければならないか否かを認識する。
CU->マージフラグ=0=>AMVP(FRUC使用)
=1=>マージ+FRUCモード=オフ=>古典的なマージ
=テンプレート/バイラテラル=>FRUCマージ+テンプレートマッチングコスト関数
【0029】
すなわち、現在、SPS(シーケンスパラメータセット)レベルのフラグは、FRUCツールを使用するか否かを可能にする。起動されると、あらゆるAMVPブロックは、符号化側および復号化側において、シグナリングを伴わずにFRUCツールに送られ、あらゆるマージブロックは、符号化側であるが何らかのシグナリング(オフ/オンテンプレート/バイラテラル)を伴ってFRUCツールに送られる。
【0030】
本明細書の態様によって提案される解決策は、FRUCツールによって提供される符号化効率とその複雑さとの間のトレードオフの管理を可能にする何らかの高レベル構文を追加することを含む。
【0031】
表1に示すように、FRUCツールの全体的な性能は、非常に大きく、JEM4では、RA(ランダムアクセス)で3.60%のBDレート利得、LDB(低遅延B)で2.41%、LDP(低遅延P)で1.38%をもたらすが、符号化時および復号化時のいずれかにおいて、RAで約40%、LDBで60%、LDPで30%の膨大な量の複雑さも有する。
【0032】
このFRUCツールには、各々が符号化利得をもたらすだけでなく複雑さを追加するいくつかのサブプロセスがあるが、それらはすべてSPSレベルの固有のフラグで起動される。
【0033】
どのサブツールを使用すべきか、どのパラメータを用いるかを示すための、またはサブブロックまたはサブパートベースの特定のツールを起動するためのある種の新しい高レベル構文を使用することにより、符号化利得と複雑さとの間のトレードオフを管理することができることは有利である。例えば、FRUCマージブロックのサブパートを無効にすることにより、0.5%未満のBDレート損失に対して10~15%の符号化時間(RA/LDB)および20%近くの復号化時間を節約することを可能にする。
【0034】
第1の実施形態では、FRUC AMVPサブツールを、表3の構文を使用して1つのフラグで初期FRUCツールから有効/無効にすることができる。
【表3】
【0035】
第2の実施形態では、サブパートおよび両方のテンプレートマッチングコスト関数を有するFRUCマージサブツール全体を、表4の構文を使用して1つのフラグで初期FRUCツールから有効/無効にすることができる。
【表4】
【0036】
第3の実施形態では、FRUCマージサブツールのサブパートを、表5の構文を使用して1つのフラグで初期FRUCツールから有効/無効にすることができる。
【表5】
【0037】
第4の実施形態では、FRUCマージサブツールのバイラテラルテンプレートマッチングコスト関数を、表6の構文を使用して1つのフラグで初期FRUCツールから有効/無効にすることができる。
【表6】
【0038】
第5の実施形態では、FRUCマージサブツール全体を、1つのフラグで初期FRUCツールから有効/無効にすることができ、次いで、FRUCマージサブツールのサブパートまたはバイラテラルテンプレートマッチングコスト関数のいずれかを、FRUCマージサブツールが有効である場合にのみ、1つのフラグで有効/無効にすることもできる。
【0039】
その目的のために、構文は、FRUC_merge_xxxがFRUC_merge_subblockもしくはFRUC_merge_bilateral、または両方を表す表7または表8のいずれかに従うべきである。
【表7】
【表8】
【0040】
第6の実施形態では、FRUC AMVPおよびFRUCマージサブツール全体を、各々、1つのフラグで初期FRUCツールから有効/無効にすることができる。次に、FRUCマージサブツールのサブパートおよびバイラテラルテンプレートマッチングコスト関数を、表9または表10の構文を使用して1つのフラグで有効/無効にすることもできる。
【表9】
【表10】
【0041】
FRUC_amvpフラグおよびFRUC_mergeフラグを共に使用する場合、少なくとも1つは「true」でなければならない(それ以外の場合、両方のフラグが「false」である場合、すべてのFRUCツールをオフにすることと同じである(sps_use_FRUC_mode==“false”)。
【0042】
さらに、最初の4つの実施形態の任意の他の組み合わせを観察することができる。
【0043】
第7の実施形態では、符号化利得と複雑さとの間のトレードオフをより細かく管理するために、まだ構文にないパラメータのいくつかを追加することもできる。
【0044】
これらのパラメータは、絞り込み検索パターン(ダイヤモンド、六角形、十字など)、絞り込みループ数、テンプレート関数に対するテンプレートマッチングサイズ、絞り込み中に動きベクトルコストに適用される重み、評価される候補の最大数、テンプレートマッチングコストの最大値、または他のかかるパラメータであるが、これらに限定されない。
【0045】
これらのパラメータの各々は、すべてのプロセス、あるいは例示的な表11に示すように各種のブロック(AMVP、マージ)もしくはサブパート、または任意の組み合わせに対して指定することができる。
【表11】
【0046】
第8の実施形態では、実施形態1~6から導入された任意のフラグを、実施形態7からの任意のパラメータと結合することができる。
【0047】
第9の実施形態では、かかる高レベルの構文は、一般情報としての「プロファイル、ティア、レベル」のVPS(ビデオパラメータセット)、SPS(シーケンスパラメータセット)、PPS(ピクチャパラメータセット)、またはSH(スライスヘッダ)のような異なるNALユニットで行われることができる。
【0048】
使用される構文のロケーションは、必要とされる粒度に依存し、すなわち、シーケンス全体に対してはVPSおよびSPSレベルで、フレームのセットに対してはPPSレベルで、各フレームに対してはSHで独立してアクティブにされる。
【0049】
実施形態1、2、3、4、実施形態5の表7、実施形態6の表9、および実施形態7からの構文は、ビットストリーム内の任意のロケーションを取ることができる。実施形態5の表8および実施形態6の表10からの構文の第1の部分は、任意のロケーションに現れることもできるが、同じレベルまたはより深いレベルのいずれかで、第2の部分が続くべきである。例えば、AMVP/マージは、シーケンス全体に対してSPSレベルで定義され、サブブロック/バイラテラルは、各フレームに対してSHレベルで定義され得る。
【0050】
ビデオ画像の一部分に対してエンコーダにおいてフレームレートアップコンバージョンを実行するための方法300の一実施形態を
図3に示す。方法は、開始ブロック301から始まり、ビデオ画像の一部分に対してフレームレートアップコンバージョンを実行するためのブロック310に進む。制御は、ブロック310から、ビデオビットストリームに第1のフラグを含めるためのブロック320に進み、第1のフラグは、フレームレートアップコンバージョンを示す。制御は、ブロック320から、ビデオビットストリームに第2のフラグを含めるためのブロック330に進み、第2のフラグは、フレームレートアップコンバージョンをさらに示す。第2のフラグは、ブロックまたは符号化単位のサブパートについての性能など、フレームレートコンバージョンプロセスの追加の特徴を示すか、またはフレームレートアップコンバージョンプロセスの1つ以上のサブプロセスを実装するために使用され得る。
【0051】
ビデオ画像の一部分に対してデコーダにおいてフレームレートアップコンバージョンを実行するための方法400の一実施形態を
図4に示す。方法は、開始ブロック401から始まり、ビデオビットストリームを解析して第1のフラグを特定するためのブロック410に始まる。制御は、ブロック410から、ビデオビットストリームを解析して第2のフラグを特定するためのブロック420に進む。制御は、ブロック420から、第1のフラグおよび第2のフラグに基づいて、ビデオ画像の一部分に対してフレームレートアップコンバージョンを実行するためのブロック430に進む。
【0052】
ビデオ画像内のブロックを符号化または復号化するための装置500の一実施形態を
図5に示す。装置は、プロセッサ510と、メモリ520と、を含む。プロセッサ510は、符号化のために、
図3のステップ、すなわち、ビデオ画像の一部分に対してフレームレートアップコンバージョンを実行することと、ビデオビットストリームに第1のフラグを含めることであって、第1のフラグは、フレームレートアップコンバージョンを示す、含めることと、ビデオビットストリームに第2のフラグを含めることであって、第2のフラグは、フレームレートアップコンバージョンをさらに示す、含めることと、を実行するように構成されている。
【0053】
プロセッサ510は、復号化のために構成されている場合、
図4のステップ、すなわちビデオビットストリームを解析して第1のフラグを特定することと、ビデオビットストリームを解析して第2のフラグを特定することと、第1のフラグと第2のフラグに基づいてビデオ画像の一部分に対してフレームレートアップコンバージョンを実行することにより、ビデオビットストリームを復号化することを実行する。
【0054】
図に示す様々な要素の機能は、専用のハードウェアだけでなく、適切なソフトウェアに関連してソフトウェアを実行することができるハードウェアを使用して提供され得る。機能は、プロセッサによって提供される場合、単一の専用プロセッサ、単一の共有プロセッサ、または複数の個別のプロセッサによって提供され得、そのうちのいくつかは共有され得る。さらに、「プロセッサ」または「コントローラ」という用語の明示的な使用は、ソフトウェアを実行することができるハードウェアを専ら指すと解釈されるべきではなく、デジタルシグナルプロセッサ(「DSP」)ハードウェア、ソフトウェアを記憶するための読み取り専用メモリ(「ROM」)、ランダムアクセスメモリ(「RAM」)、および不揮発性記憶装置を黙示的に含み得るが、それらに限定されない。
【0055】
他の従来および/またはカスタムハードウェアもまた、含まれ得る。同様に、図に示すいずれのスイッチも、単に概念的なものである。それらの機能は、プログラムロジックの操作、専用ロジック、プログラム制御と専用ロジックとの相互作用を通して、または手動であっても、文脈からより具体的に理解されるように実装者によって選択可能な特定の技術を通して、実行され得る。
【0056】
本明細書は、本原理を例解する。したがって、当業者は、本明細書で明示的に説明または示されていないが、本原理を具現化し、その範囲内に含まれる様々な構成を考案することができることを理解されよう。
【0057】
本明細書に列挙されるすべての例および条件付き言語は、当技術分野を進展させるために発明者(複数可)が寄与した本原理および概念を読者が理解するのを支援する教育的目的を意図しており、かかる具体的に列挙した例および条件に限定されないものとして解釈されるべきである。
【0058】
さらに、本原理の原理、態様、および実施形態、ならびにその具体的な例を列挙する本明細書のすべての言及は、それらの構造的均等物および機能的均等物の両方を包含することを意図している。さらに、かかる均等物は、現在既知の均等物だけでなく、将来開発される均等物、すなわち構造に関係なく同じ機能を実施する開発される任意の要素の両方を含むことを意図している。
【0059】
したがって、例えば、本明細書で提示するブロック図は、本原理を具現化する例示的な回路の概念図を表すことは、当業者には理解されよう。同様に、任意のフローチャート、フロー図、状態遷移図、擬似コードなどは、コンピュータ可読媒体において実質的に表され、コンピュータまたはプロセッサが明示的に示されているか否かに関わらず、かかるコンピュータまたはプロセッサによって実質的に実行され得る様々なプロセスを表すことは理解されよう。
【0060】
特許請求の範囲において、指定された機能を実行するための手段として表現されるいずれの要素も、例えば、a)その機能を実行する回路要素の組み合わせ、またはb)任意の形態のソフトウェア、したがって、そのソフトウェアを実行して機能を実行するための適切な回路と結合されるファームウェア、マイクロコードなどを含むソフトウェアを含む、その機能を実行する任意の方法を包含することを意図している。かかる特許請求の範囲によって定義される本原理は、列挙された様々な手段によって提供される機能が、特許請求の範囲が要求するように組み合わされ、まとめられるという事実に存する。したがって、これらの機能を提供することができる任意の手段は、本明細書に示すものと等価であると見なされる。
【0061】
本明細書における本原理の「一実施形態」または「実施形態」、および他のその変形形態に対する言及は、その実施形態に関して説明する特定の特徴、構造、特性などが本原理の少なくとも1つの実施形態に含まれることを意味する。したがって、本明細書全体の様々な場所に現れる「一実施形態では」または「実施形態では」、さらに、他の変形形態という語句の出現は、必ずしもすべて同じ実施形態を指すものではない。
【0062】
結論として、ビデオ画像の一部分に対してフレームレートアップコンバージョンを実行する改善された方法および装置は、前述の実施形態によって示される。少なくとも1つの実施形態では、エンコーダは、ビデオ画像の一部分のみまたは符号化単位のサブパートのみに対してフレームレートアップコンバージョンを使用するか否かをデコーダに信号で伝えることができる。また、エンコーダまたはデコーダにおいてフレームレートアップコンバージョンプロセスのサブプロセスを使用するためのフラグが提供される。
なお、上述の実施形態の一部又は全部は、以下の付記のように記載され得るが、以下には限定されない。
(付記1)
方法であって、
ビデオ画像の一部分に対してフレームレートアップコンバージョンを実行することと、
ビデオビットストリームに第1のフラグを含めることであって、前記第1のフラグは、前記フレームレートアップコンバージョンを示す、含めることと、
前記ビデオビットストリームに第2のフラグを含めることであって、前記第2のフラグは、前記フレームレートアップコンバージョンをさらに示す、含めることと、
を含む、方法。
(付記2)
方法であって、
ビデオビットストリームを解析して、第1のフラグを特定することと、
ビデオビットストリームを解析して、第2のフラグを特定することと、
前記第1のフラグおよび前記第2のフラグに基づいて、ビデオ画像の一部分に対してフレームレートアップコンバージョンを実行することと、
を含む、方法。
(付記3)
装置であって、
メモリと、
プロセッサであって、
ビデオ画像の一部分に対してフレームレートアップコンバージョンを実行することと、
ビデオビットストリームに第1のフラグを含めることであって、前記第1のフラグは、前記フレームレートアップコンバージョンを示す、含めることと、
前記ビデオビットストリームに第2のフラグを含めることであって、前記第2のフラグは、前記フレームレートアップコンバージョンをさらに示す、含めることと、
を実行するように構成されている、プロセッサと、
を含む、装置。
(付記4)
装置であって、
メモリと、
プロセッサであって、
ビデオビットストリームを解析して、第1のフラグを特定することと、
ビデオビットストリームを解析して、第2のフラグを特定することと、
前記第1のフラグおよび前記第2のフラグに基づいて、ビデオ画像の一部分に対してフレームレートアップコンバージョンを実行することと、を行うように構成されている、プロセッサと、
を含む、装置。
(付記5)
前記第2のフラグは、マージモードを使用してサブブロックにおけるフレームレートアップコンバージョンを可能にする、付記1もしくは2に記載の方法、または付記3もしくは4に記載の装置。
(付記6)
前記第2のフラグは、マージモードにおいてバイラテラルマッチングを使用してサブブロックにおけるフレームレートアップコンバージョンを可能にする、付記1もしくは2に記載の方法、または付記3もしくは4に記載の装置。
(付記7)
第3のフラグは、前記ビデオ画像のサブブロック上で実行されるバイラテラルマッチングまたはテンプレートマッチングを可能にする、付記5に記載の方法または装置。
(付記8)
前記第2のフラグは、ビデオ画像の一部分における適応動きベクトル予測を可能にし、
第3のフラグおよび第4のフラグと一致するビデオ画像の一部分に対してマージモードを実行することと、
第3のフラグおよび第5のフラグと一致する前記ビデオ画像の一部分について、バイラテラルテンプレートマッチングを実行することと、をさらに含む、付記1もしくは2に記載の方法、または付記3もしくは4に記載の装置。
(付記9)
絞り込み検索パターン、絞り込みループ数、テンプレートマッチングサイズ、動きベクトルコストの重み、評価される候補の最大数、およびテンプレートマッチングコストの最大値を含む、フレームレートアップコンバージョンを実行するための、前記ビットストリーム内の構文要素を使用することをさらに含む、付記1もしくは2に記載の方法、または付記3もしくは4に記載の装置。
(付記10)
前記フラグのうちのいずれかは、ビデオパラメータセット内に位置する、付記1もしくは2に記載の方法、または付記3もしくは4に記載の装置。
(付記11)
前記フラグのうちのいずれかは、シーケンスパラメータセット内に位置する、付記1もしくは2に記載の方法、または付記3もしくは4に記載の装置。
(付記12)
前記フラグのうちのいずれかは、ピクチャパラメータセット内に位置する、付記1もしくは2に記載の方法、または付記3もしくは4に記載の装置。
(付記13)
プロセッサを使用した再生のための、付記1および5~12のいずれか一項に記載の方法に従って、または付記3および5~12のいずれか一項に記載の装置によって生成されたデータ内容を含む、非一時的コンピュータ可読媒体。
(付記14)
プロセッサを使用した再生のための、付記1および5~12のいずれか一項の方法に従って、または付記3および5~12のいずれか一項の装置によって生成されたビデオデータを含む、信号。
(付記15)
命令を含む、コンピュータプログラム製品であって、前記命令は、前記プログラムがコンピュータによって実行されると、前記コンピュータに、付記2および5~12のいずれか一項に記載の方法を実行させる、コンピュータプログラム製品。