IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ インターデジタル ヴイシー ホールディングス, インコーポレイテッドの特許一覧

特開2024-174900オプティカルフローによる動き補償のための精度精緻化
<>
  • 特開-オプティカルフローによる動き補償のための精度精緻化 図1A
  • 特開-オプティカルフローによる動き補償のための精度精緻化 図1B
  • 特開-オプティカルフローによる動き補償のための精度精緻化 図1C
  • 特開-オプティカルフローによる動き補償のための精度精緻化 図2A
  • 特開-オプティカルフローによる動き補償のための精度精緻化 図2B
  • 特開-オプティカルフローによる動き補償のための精度精緻化 図3A
  • 特開-オプティカルフローによる動き補償のための精度精緻化 図3B
  • 特開-オプティカルフローによる動き補償のための精度精緻化 図4A
  • 特開-オプティカルフローによる動き補償のための精度精緻化 図4B
  • 特開-オプティカルフローによる動き補償のための精度精緻化 図5
  • 特開-オプティカルフローによる動き補償のための精度精緻化 図6
  • 特開-オプティカルフローによる動き補償のための精度精緻化 図7
  • 特開-オプティカルフローによる動き補償のための精度精緻化 図8
  • 特開-オプティカルフローによる動き補償のための精度精緻化 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024174900
(43)【公開日】2024-12-17
(54)【発明の名称】オプティカルフローによる動き補償のための精度精緻化
(51)【国際特許分類】
   H04N 19/513 20140101AFI20241210BHJP
   H04N 19/46 20140101ALI20241210BHJP
【FI】
H04N19/513
H04N19/46
【審査請求】有
【請求項の数】20
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2024141925
(22)【出願日】2024-08-23
(62)【分割の表示】P 2021575392の分割
【原出願日】2020-06-18
(31)【優先権主張番号】62/864,825
(32)【優先日】2019-06-21
(33)【優先権主張国・地域又は機関】US
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.WCDMA
2.HDMI
(71)【出願人】
【識別番号】518338149
【氏名又は名称】インターデジタル ヴイシー ホールディングス, インコーポレイテッド
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【弁理士】
【氏名又は名称】内藤 和彦
(74)【代理人】
【識別番号】100108213
【弁理士】
【氏名又は名称】阿部 豊隆
(72)【発明者】
【氏名】チェン、ウェイ
(72)【発明者】
【氏名】フ、ユーウェン
(57)【要約】      (修正有)
【課題】ブロックベースのビデオコーディングにおける動き補償された予測を精緻化するためのシステム及び方法を提供する。
【解決手段】ビデオ符号化方法は、サンプルの現在のブロック又はサブブロックにおける複数のサンプル位置のそれぞれについて、動き補償された予測に基づいて、初期の予測されたサンプル値を取得することと、動きベクトルの精緻化を判定することと、複数のサンプル位置の各々において、サンプル値の空間的勾配を判定することと、複数のサンプル位置の各々について、空間的勾配と動きベクトルの精緻化とのスカラー積に基づいて、サンプル差値を判定することと、サンプル差値に基づいて初期の予測されたサンプル値を修正することと、を含む。
【選択図】図8
【特許請求の範囲】
【請求項1】
ビデオコーディング方法であって、
サンプルの現在のブロックでの少なくとも第1のサンプル位置について、動き補償された予測に基づいて、初期の予測されたサンプル値を取得することと、
少なくとも前記第1のサンプル位置に関連する動きベクトルの精緻化を判定することと、
前記第1のサンプル位置で、サンプル値の空間的勾配を判定することと、
前記空間的勾配と前記動きベクトルの精緻化とのスカラー積に基づいてサンプル差値を判定することと、
前記サンプル差値に基づいて前記初期の予測されたサンプル値を修正することと、を含む、方法。
【請求項2】
前記動きベクトルの精緻化を判定することが、ビットストリームから前記動きベクトルの精緻化を復号化することを含む、復号化器によって実行される、請求項1に記載の方法。
【請求項3】
前記ビットストリームからの精緻化精度情報を復号化することをさらに含み、前記サンプル差値を判定することが、前記精度情報によって示される量だけ前記スカラー積をスケーリングすることを含む、請求項2に記載の方法。
【請求項4】
前記スカラー積をスケーリングすることが、前記精度情報によって示される量だけ前記スカラー積をビットシフトすることを含む、請求項3に記載の方法。
【請求項5】
前記動き補償された予測が、初期の精度を有する少なくとも1つの動きベクトルを使用して実行され、前記精緻化精度情報が、前記初期の精度と前記精緻化精度との間の差を表す精度差値を含む、請求項3または4に記載の方法。
【請求項6】
前記スカラー積をスケーリングすることが、前記精度差値と前記初期の精度の合計に等しいビット数だけ前記スカラー積を右シフトすることを含む、請求項3~5のいずれか一項に記載の方法。
【請求項7】
動きベクトルの精緻化を判定することが、前記動きベクトルの精緻化を選択して、入力ビデオブロックに関する予測誤差を実質的に最小化することを含み、かつ前記方法が、ビットストリームでの前記動きベクトルの精緻化を符号化することをさらに含む、符号化器によって実行される、請求項1に記載の方法。
【請求項8】
前記動きベクトルの精緻化がインデックスとして前記ビットストリームで信号伝達される、請求項2~7のいずれか一項に記載の方法。
【請求項9】
前記インデックスが、(0,-1)、(1,0)、(0,1)、および(-1,0)からなる群からの複数の動きベクトルの精緻化のうちの1つを識別する、請求項8に記載の方法。
【請求項10】
前記インデックスが、(0,-1)、(1,0)、(0,1)、(-1,0)、(-1,-1)、(1,-1)、(1,1)、および(-1,1)からなる群からの複数の動きベクトルの精緻化のうちの1つを識別する、請求項8に記載の方法。
【請求項11】
前記動きベクトルの精緻化が、前記現在のブロックでのすべてのサンプル位置に関連付けられている、請求項1~10のいずれか一項に記載の方法。
【請求項12】
プロセッサを備える装置であって、前記プロセッサが、少なくとも、
サンプルの現在のブロックでの少なくとも第1のサンプル位置について、動き補償された予測に基づいて、初期の予測されたサンプル値を取得することと、
少なくとも前記第1のサンプル位置に関連する動きベクトルの精緻化を判定することと、
前記第1のサンプル位置で、サンプル値の空間的勾配を判定することと、
前記空間的勾配と前記動きベクトルの精緻化とのスカラー積に基づいてサンプル差値を判定することと、
前記サンプル差値に基づいて前記初期の予測されたサンプル値を修正することと、を実行するように構成されている、装置。
【請求項13】
前記装置が、復号化器を含み、動きベクトルの精緻化を判定することが、ビットストリームからの前記動きベクトルの精緻化を復号化することを含む、請求項12に記載の装置。
【請求項14】
前記プロセッサが、前記ビットストリームからの精緻化精度情報を復号化するようにさらに構成され、前記サンプル差値を判定することが、前記精度情報によって示される量だけ前記スカラー積をスケーリングすることを含む、請求項13に記載の装置。
【請求項15】
前記装置が符号化器を備え、動きベクトルの精緻化を判定することが、前記動きベクトルの精緻化を選択して、前記精緻化されたサンプル値と入力ビデオブロックの対応するサンプル値との間の誤差を実質的に最小化することを含み、前記方法が、ビットストリームでの前記動きベクトルの精緻化を符号化することをさらに含む、請求項12に記載の装置。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2019年、6月21日に出願された「Precision Refinement for Motion Compensation with Optical Flow」と題された米国仮特許出願第62/864,825号からの、米国特許法119条(e)下での利益を主張する非仮出願であり、この出願は参照によりその全体が本明細書に援用される。
【背景技術】
【0002】
ビデオコーディングシステムは、デジタルビデオ信号を圧縮して、そのような信号のストレージの必要性および/または伝送帯域幅を削減するために広く使用されている。ブロックベース、ウェーブレットベース、およびオブジェクトベースのシステムなどの様々なタイプのビデオコーディングシステムの中で、今日、ブロックベースのハイブリッドビデオコーディングシステムが最も広く使用され、配備されている。ブロックベースのビデオコーディングシステムの例には、MPEG-1/2/4パート2、H.264/MPEG-4パート10 AVC、VC-1、および高効率ビデオコーディング(HEVC)などの国際ビデオコーディング規格が含まれ、これは、ITU-T/SG16/Q.6/VCEGおよびISO/IEC/MPEGのJCT-VC(ビデオコーディングに関する合同協力チーム)によって開発されたものである。
【0003】
2017年10月には、ITU-TおよびISO/IECにより、HEVCを超える機能を備えたビデオ圧縮に関する共同提案募集(CfP)が発行された。2018年4月には、標準ダイナミックレンジカテゴリについての22のCfP回答が受理され、第10回JVET会議で評価され、HEVCに対する圧縮率の向上が約40%であることが実証された。このような評価結果に基づいて、合同ビデオ専門家チーム(JVET)は、バーサタイルビデオコーディング(VVC)という新世代のビデオコーディング規格を開発するための新しいプロジェクトを立ち上げた。同月には、VVC規格の参照実装を実証するために、VVCテストモデル(VTM)と呼ばれる参照ソフトウェアコードベースが確立された。初期のVTM-1.0では、マルチタイプツリーベースのブロック分割構造がVTMで使用されることを除いて、イントラ予測、インター予測、変換/逆変換、量子化/逆量子化、ならびにループ内フィルタを含むほとんどのコーディングモジュールは、既存のHEVC設計に従う。一方、新しいコーディングツールの評価を容易にするために、ベンチマークセット(BMS)と呼ばれる別の参照ソフトウェアベースも生成された。BMSコードベースでは、より高いコーディング効率および適度な実装の複雑さを提供する、Joint Exploration Model(JEM)から継承された、コーディングツールのリストが、VTMの上に含まれ、VVC規格化の過程で同様のコーディング技術を評価する際のベンチマークとして使用される。具体的には、BMS-1.0に統合された9つのJEMコーディングツールがあり、これには、65の角度イントラ予測方向、修正された係数コーディング、高度な多重変換(AMT)+4×4非分離型二次変換(NSST)、アフィン動きモデル、一般化された適応ループフィルタ(GALF)、高度な時間的動きベクトル予測(ATMVP)、適応型動きベクトル精度、復号化器側動きベクトル精緻化(DMVR)、および線形モデル(LM)クロマモードが含まれる。
【発明の概要】
【0004】
本明細書で説明される実施形態は、ビデオの符号化および復号化(総称して「コーディング」)で使用される方法を含む。ブロックベースのビデオコーディングにおける動き補償された予測を精緻化するためのシステムおよび方法が説明されている。いくつかの実施形態によるビデオコーディング方法は、動き補償された予測を使用して、サンプルの現在のブロックにおける少なくとも第1のサンプル位置について初期の予測されたサンプル値を生成することと、少なくとも第1のサンプル位置に関連する動きベクトルの精緻化を判定することと、第1のサンプル位置で、サンプル値の空間的勾配を判定することと、空間的勾配と動きベクトルの精緻化とのスカラー積を計算することによって、サンプル差値を判定することと、サンプル差値を初期の予測されたサンプル値に追加して、精緻化されたサンプル値を生成することと、を含む。
【0005】
いくつかの実施形態では、方法は、復号化器によって実行され、動きベクトルの精緻化を判定することは、ビットストリームから動きベクトルの精緻化を復号化することを含む。
【0006】
いくつかの実施形態は、ビットストリームからの精緻化精度情報を復号化することをさらに含み、サンプル差値を判定することは、精度情報によって示される量によってスカラー積をスケーリングすることを含む。スカラー積をスケーリングすることは、精度情報によって示される量だけスカラー積をビットシフトすることを含み得る。
【0007】
いくつかの実施形態では、動き補償された予測は、初期の精度を有する少なくとも1つの動きベクトルを使用して実行され、精緻化精度情報は、初期の精度と精緻化精度との間の差を表す精度差値を含む。
【0008】
いくつかの実施形態では、スカラー積をスケーリングすることは、精度差値と初期の精度の合計に等しいビット数だけスカラー積を右シフトすることを含む。
【0009】
いくつかの実施形態では、この方法は、符号化器によって実行され、動きベクトルの精緻化を判定することは、動きベクトルの精緻化を選択して、入力ビデオブロックに関する予測誤差を実質的に最小化することを含み、かつ方法は、ビットストリームでの動きベクトルの精緻化を符号化することをさらに含む。
【0010】
いくつかの実施形態では、動きベクトルの精緻化は、インデックスとしてビットストリームで信号伝達される。いくつかの実施形態では、インデックスは、(0,-1)、(1,0)、(0,1)、および(-1,0)からなる群からの複数の動きベクトルの精緻化のうちの1つを識別し得る。いくつかの他の実施形態では、インデックスは、(0,-1)、(1,0)、(0,1)、(-1,0)、(-1,-1)、(1,-1)、(1,1)、および(-1,1)からなる群からの複数の動きベクトルの精緻化のうちの1つを識別し得る。
【0011】
いくつかの実施形態では、動きベクトルの精緻化は、現在のブロック(または現在のサブブロック)内のすべてのサンプル位置に関連付けられている。いくつかの他の実施形態では、動きベクトルの精緻化は、サンプルごとに判定され、異なるサンプルに対して異なり得る。
【0012】
いくつかの実施形態は、本明細書に記載の方法のいずれかを実行するように構成された少なくとも1つのプロセッサを含む。いくつかのそのような実施形態では、本明細書に記載の方法のいずれかを実行するように動作する命令を格納するコンピュータ可読媒体(例えば、非一時的媒体)が提供される。
【0013】
いくつかの実施形態は、本明細書に開示される1つ以上の方法を使用して符号化されたビデオを記憶するコンピュータ可読媒体(例えば、非一時的媒体)を含む。
【0014】
符号化器または復号化器システムは、本明細書に記載の方法を実行するための命令を格納するプロセッサおよび非一時的なコンピュータ可読媒体を含み得る。
【0015】
また、本実施形態のうちの1つ以上は、上で説明される方法のいずれかに従ってビデオデータを符号化または復号化するための命令が記憶されたコンピュータ可読記憶媒体を提供する。また、本実施形態は、上で説明される方法に従って生成されたビットストリームが記憶されたコンピュータ可読記憶媒体(例えば、非一時的な媒体)を提供する。また、本実施形態は、上で説明される方法に従って生成されたビットストリームを送信するための方法および装置を提供する。また、本実施形態は、説明された方法のいずれかを実行するための命令を含むコンピュータプログラム製品を提供する。
【図面の簡単な説明】
【0016】
図1A】1つ以上の開示された実施形態が実装され得る例示的な通信システムを示すシステム図である。
図1B】一実施形態による、図1Aに示す通信システム内で使用され得る無線送受信ユニット(WTRU)の例を示すシステム図である。
図1C】本明細書に記載のいくつかの実施形態で使用されるシステムの機能ブロック図である。
図2A】VVCに使用される符号化器などのブロックベースのビデオ符号化器の機能ブロック図である。
図2B】VVCに使用される復号化器などのブロックベースのビデオ復号化器の機能ブロック図である。
図3A-3B】動き補償された予測を示す。
図4A】4パラメータのアフィン動きモデルを示す。
図4B】アフィンブロックのサブブロックレベルの動き導出を示す。
図5】6パラメータアフィンモード示し、V、VおよびVは、制御点の動きベクトルであり、(MVx,MVy)は、位置(x,y)を中心とするサブブロックの動きベクトルである。
図6】サブブロックの動きベクトルVSBおよび画素の精緻化Δv(i,j)を示す。
図7】追加の動きベクトルを信号伝達するための隣接位置の使用を示す。
図8】符号化器と復号化器の両方で実行できるコーディング機能を含む、いくつかの実施形態で実行される符号化および復号化方法を示すフローチャートである。
図9】通信システムの例を示す図である。
【0017】
実施形態を実装するための例示のデバイスおよびネットワーク
図1Aは、1つ以上の開示された実施形態が実装され得る例示的な通信システム100を示す図である。通信システム100は、音声、データ、ビデオ、メッセージング、ブロードキャストなどのコンテンツを複数の無線ユーザに提供するマルチアクセスシステムであり得る。通信システム100は、複数の無線ユーザが、無線帯域幅を含むシステムリソースの共有を通じてそのようなコンテンツにアクセスすることを可能にし得る。例えば、通信システム100は、符号分割多重アクセス(CDMA)、時分割多重アクセス(TDMA)、周波数分割多重アクセス(FDMA)、直交FDMA(OFDMA)、シングルキャリアFDMA(SC-FDMA)、ゼロテールユニークワードDFT-スプレッドOFDM(ZT UW DTS-s OFDM)、ユニークワードOFDM(UW-OFDM)、リソースブロックフィルタリングOFDM、フィルタバンクマルチキャリア(FBMC)などの1つ以上のチャネルアクセス方式を採用し得る。
【0018】
図1Aに示すように、通信システム100は、無線送受信ユニット(WTRU)102a、102b、102c、102d、RAN104/113、CN106/115、公衆交換電話網(PSTN)108、インターネット110、および他のネットワーク112を含み得るが、開示された実施形態は、任意の数のWTRU、基地局、ネットワーク、および/またはネットワーク要素を想定することが理解されよう。WTRU 102a、102b、102c、102dのそれぞれは、無線環境で動作および/または通信するように構成された任意の種類のデバイスであり得る。例として、WTRU 102a、102b、102c、102d(これらのいずれも「ステーション」および/または「STA」と称され得る)は、無線信号を送信および/または受信するように構成され得、ユーザ機器(UE)、モバイルステーション、固定もしくはモバイルサブスクライバーユニット、サブスクリプションベースのユニット、ページャー、携帯電話、パーソナルデジタルアシスタント(PDA)、スマートフォン、ラップトップ、ネットブック、パーソナルコンピュータ、無線センサ、ホットスポットもしくはMi-Fiデバイス、モノのインターネット(IoT)デバイス、時計もしくは他のウェアラブル、ヘッドマウントディスプレイ(HMD)、車両、ドローン、医療機器およびアプリケーション(例えば、遠隔手術)、産業用デバイスおよびアプリケーション(例えば、産業用および/または自動処理チェーンのコンテキストで動作するロボットおよび/または他の無線デバイス)、家庭用電化製品デバイス、商用および/または産業用無線で動作するデバイスネットワークなどを含み得る。WTRU 102a、102b、102c、および102dのいずれも、同義的にUEと称され得る。
【0019】
通信システム100はまた、基地局114aおよび/または基地局114bを含み得る。基地局114a、114bのそれぞれは、CN106/115、インターネット110、および/または他のネットワーク112などの、1つ以上の通信ネットワークへのアクセスを容易にするために、WTRU 102a、102b、102c、102dのうちの少なくとも1つと無線インターフェースするように構成された任意の種類のデバイスであり得る。例として、基地局114a、114bは、基地トランシーバ局(BTS)、Node-B、eNode B、ホームNode B、ホームeNode B、gNB、NR NodeB、サイトコントローラ、アクセスポイント(AP)、無線ルータなどであり得る。基地局114a、114bは、それぞれ、単一の要素として示されているが、基地局114a、114bは、任意の数の相互接続された基地局および/またはネットワーク要素を含み得ることが理解されよう。
【0020】
基地局114aは、RAN104/113の一部であり得、これはまた、基地局コントローラ(BSC)、無線ネットワークコントローラ(RNC)、リレーノード等などの他の基地局および/またはネットワーク要素(図示せず)を含み得る。基地局114aおよび/または基地局114bは、セル(図示せず)と称され得る1つ以上のキャリア周波数で無線信号を送信および/または受信するように構成され得る。これらの周波数は、ライセンススペクトル、非ライセンススペクトル、またはライセンススペクトルと非ライセンススペクトルの組み合わせであり得る。セルは、比較的固定されているか、時間の経過とともに変化する可能性がある特定の地理的領域に無線サービスのカバレッジを提供し得る。セルは、さらにセルセクタに分割され得る。例えば、基地局114aに関連するセルは、3つのセクタに分割され得る。したがって、一実施形態では、基地局114aは、3つのトランシーバ、すなわち、セルの各セクタに1つを含み得る。一実施形態では、基地局114aは、多入力多出力(MIMO)技術を採用し得、セルの各セクタに対して複数のトランシーバを利用し得る。例えば、ビームフォーミングが使用されて、所望の空間方向に信号を送信および/または受信し得る。
【0021】
基地局114a、114bは、任意の好適な無線通信リンク(例えば、無線周波数(RF)、マイクロ波、センチメートル波、マイクロ波、赤外線(IR)、紫外線(UV)、可視光など)であり得るエアインターフェース116を介して、1つ以上のWTRU 102a、102b、102c、102dと通信し得る。エアインターフェース116は、任意の好適な無線アクセス技術(RAT)を使用して確立され得る。
【0022】
より具体的には、上記のように、通信システム100は、多元接続システムであり得、CDMA、TDMA、FDMA、OFDMA、SC-FDMAなどのような1つ以上のチャネルアクセス方式を採用し得る。例えば、RAN104/113の基地局114aおよびWTRU 102a、102b、102cは、ユニバーサルモバイルテレコミュニケーションシステム(UMTS)地上無線アクセス(UTRA)などの無線技術を実装し得、これは、広帯域CDMA(WCDMA)を使用して、エアインターフェース115/116/117を確立し得る。WCDMAは、高速パケットアクセス(HSPA)および/または発展型HSPA(HSPA+)などの通信プロトコルを含み得る。HSPAは、高速ダウンリンク(DL)パケットアクセス(HSDPA)および/または高速ULパケットアクセス(HSUPA)を含み得る。
【0023】
一実施形態では、基地局114aおよびWTRU 102a、102b、102cは、発展型UMTS地上無線アクセス(E-UTRA)などの無線技術を実装し得、これは、ロングタームエボリューション(LTE)および/またはLTE-アドバンスト(LTE-A)および/またはLTE-アドバンストプロ(LTE-A Pro)を使用してエアインターフェース116を確立し得る。
【0024】
一実施形態では、基地局114aおよびWTRU 102a、102b、102cは、NR無線アクセスなどの無線技術を実装し得、これは、新しい無線(NR)を使用してエアインターフェース116を確立し得る。
【0025】
一実施形態では、基地局114aおよびWTRU 102a、102b、102cは、複数の無線アクセス技術を実装し得る。例えば、基地局114aおよびWTRU 102a、102b、102cは、例えば、二重接続(DC)原理を使用して、LTE無線アクセスおよびNR無線アクセスを一緒に実装し得る。したがって、WTRU 102a、102b、102cによって利用されるエアインターフェースは、複数のタイプの無線アクセス技術および/または複数のタイプの基地局(例えば、eNBおよびgNB)との間で送信される送信によって特徴付けられ得る。
【0026】
他の実施形態では、基地局114aおよびWTRU 102a、102b、102cは、IEEE802.11(すなわち、無線フィデリティ(WiFi)、IEEE802.16(すなわち、マイクロ波アクセスのための世界的相互運用性(WiMAX))、CDMA2000、CDMA2000 1X、CDMA2000 EV-DO、暫定規格2000(IS-2000)、暫定規格95(IS-95)、暫定規格856(IS-856)、グローバルシステムフォーモバイルコミュニケーションズ(GSM)、GSMエボリューションの拡張データレート(EDGE)、GSM EDGE(GERAN)などの無線技術を実装し得る。
【0027】
図1Aの基地局114bは、例えば、無線ルータ、ホームNode B、ホームeNode B、またはアクセスポイントであり得、事業所、家庭、車両、キャンパス、産業施設、(例えば、ドローンが使用するための)空中回廊、道路などの局所領域における無線接続を容易にするために任意の好適なRATを利用し得る。一実施形態では、基地局114bおよびWTRU 102c、102dは、無線ローカルエリアネットワーク(WLAN)を確立するために、IEEE802.11などの無線技術を実装し得る。一実施形態では、基地局114bおよびWTRU 102c、102dは、無線パーソナルエリアネットワーク(WPAN)を確立するために、IEEE802.15などの無線技術を実装し得る。さらに別の実施形態では、基地局114bおよびWTRU 102c、102dは、セルラーベースのRAT(例えば、WCDMA、CDMA2000、GSM、LTE、LTE-A、LTE-A Pro、NRなど)を利用して、ピコセルまたはフェムトセルを確立し得る。図1Aに示されるように、基地局114bは、インターネット110への直接接続を有し得る。したがって、基地局114bは、CN106/115を介してインターネット110にアクセスする必要がない場合がある。
【0028】
RAN104/113は、CN106/115と通信し得、CN106/115は、1つ以上のWTRU 102a、102b、102c、102dに音声、データ、アプリケーション、および/またはボイスオーバーインターネットプロトコル(VoIP)サービスを提供するように構成された任意の種類のネットワークであり得る。データは、異なるスループット要件、遅延要件、誤差許容要件、信頼性要件、データスループット要件、モビリティ要件など、様々なサービス品質(QoS)要件を有し得る。CN106/115は、呼制御、課金サービス、モバイル位置ベースのサービス、プリペイド通話、インターネット接続、ビデオ配信などを提供し、および/またはユーザ認証などの高レベルのセキュリティ機能を実行し得る。図1Aには示されていないが、RAN104/113および/またはCN106/115は、RAN104/113と同じRATまたは異なるRATを使用する他のRANと直接または間接的に通信し得ることが理解されよう。例えば、NR無線技術を利用し得るRAN104/113に接続されることに加えて、CN106/115はまた、GSM、UMTS、CDMA2000、WiMAX、E-UTRA、またはWiFi無線テクノロジーを使用する別のRAN(図示せず)と通信し得る。
【0029】
CN106/115はまた、WTRU 102a、102b、102c、102dがPSTN108、インターネット110、および/または他のネットワーク112にアクセスするためのゲートウェイとして機能し得る。PSTN108は、一般電話サービス(POTS)を提供する回線交換電話網を含み得る。インターネット110は、伝送制御プロトコル(TCP)、ユーザデータグラムプロトコル(UDP)、および/またはTCP/IPインターネットプロトコルスイートのインターネットプロトコル(IP)などの共通の通信プロトコルを使用する相互接続されたコンピュータネットワークおよびデバイスのグローバルシステムを含み得る。ネットワーク112は、他のサービスプロバイダによって所有および/または運用される有線および/または無線通信ネットワークを含み得る。例えば、ネットワーク112は、1つ以上のRANに接続された別のCNを含み得、これは、RAN104/113と同じRATまたは異なるRATを使用し得る。
【0030】
通信システム100内のWTRU 102a、102b、102c、102dの一部またはすべては、マルチモード機能を含み得る(例えば、WTRU 102a、102b、102c、102dは、異なる無線リンクを介して異なる無線ネットワークと通信するための複数のトランシーバを含み得る)。例えば、図1Aに示されるWTRU 102cは、セルラーベースの無線技術を採用し得る基地局114aと、およびIEEE802無線技術を採用し得る基地局114bとを通信するように構成され得る。
【0031】
図1Bは、例示的なWTRU 102を示すシステム図である。図1Bに示されるように、WTRU 102は、とりわけプロセッサ118、トランシーバ120、送信/受信要素122、スピーカ/マイクロフォン124、キーパッド126、ディスプレイ/タッチパッド128、非リムーバブルメモリ130、リムーバブルメモリ132、電源134、グローバルポジショニングシステム(GPS)チップセット136、および/または他の周辺機器138を含み得る。WTRU 102は、一実施形態と一致性を保ちながら、前述の要素の任意のサブコンビネーションを含み得ることが理解されよう。
【0032】
プロセッサ118は、汎用プロセッサ、専用プロセッサ、従来のプロセッサ、デジタル信号プロセッサ(DSP)、複数のマイクロプロセッサ、DSPコアに関連する1つ以上のマイクロプロセッサ、コントローラ、マイクロコントローラ、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)回路、その任意の他の種類の集積回路(IC)、ステートマシンなどであり得る。プロセッサ118は、信号符号化、データ処理、電力制御、入力/出力処理、および/またはWTRU 102が無線環境で動作することを可能にする他の任意の機能を実行し得る。プロセッサ118は、トランシーバ120に結合され得、トランシーバ120は、送信/受信要素122に結合され得る。図1Bは、プロセッサ118およびトランシーバ120を別個の構成要素として示しているが、プロセッサ118およびトランシーバ120は、電子パッケージまたはチップに一緒に集積され得ることが理解されよう。
【0033】
送信/受信要素122は、エアインターフェース116を介して基地局(例えば、基地局114a)に信号を送信するか、または基地局から信号を受信するように構成され得る。例えば、一実施形態では、送信/受信要素122は、RF信号を送信および/または受信するように構成されたアンテナであり得る。一実施形態では、送信/受信要素122は、例えば、IR、UV、または可視光信号を送信および/または受信するように構成されたエミッタ/検出器であり得る。さらに別の実施形態では、送信/受信要素122は、RF信号および光信号の両方を送信および/または受信するように構成され得る。送信/受信要素122は、無線信号の任意の組み合わせを送信および/または受信するように構成され得ることが理解されよう。
【0034】
送信/受信要素122は、単一の要素として図1Bに示されているが、WTRU 102は、任意の数の送信/受信要素122を含み得る。より具体的には、WTRU 102は、MIMO技術を採用し得る。したがって、一実施形態では、WTRU 102は、エアインターフェース116を介して無線信号を送受信するための2つ以上の送信/受信要素122(例えば、複数のアンテナ)を含み得る。
【0035】
トランシーバ120は、送信/受信要素122によって送信される信号を変調し、送信/受信要素122によって受信される信号を復調するように構成され得る。上記のように、WTRU 102はマルチモード機能を有し得る。したがって、トランシーバ120は、WTRU 102が、例えば、NRおよびIEEE802.11などの複数のRATを介して通信することを可能にするための複数のトランシーバを含み得る。
【0036】
WTRU 102のプロセッサ118は、スピーカ/マイクロフォン124、キーパッド126、および/またはディスプレイ/タッチパッド128(例えば、液晶ディスプレイ(LCD)ディスプレイユニットまたは有機発光ダイオード(OLED)ディスプレイユニット)に結合され得、そしてそれらからユーザ入力データを受信し得る。プロセッサ118はまた、ユーザデータをスピーカ/マイクロフォン124、キーパッド126、および/またはディスプレイ/タッチパッド128に出力し得る。加えて、プロセッサ118は、非リムーバブルメモリ130および/またはリムーバブルメモリ132などの任意の種類の好適なメモリからの情報にアクセスし、データを記憶し得る。非リムーバブルメモリ130は、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、ハードディスク、または任意の他の種類のメモリストレージデバイスを含み得る。リムーバブルメモリ132は、加入者識別モジュール(SIM)カード、メモリスティック、セキュアデジタル(SD)メモリカードなどを含み得る。他の実施形態では、プロセッサ118は、サーバまたはホームコンピュータ(図示せず)など、WTRU 102上に物理的に配置されていないメモリから情報にアクセスし、メモリにデータを記憶し得る。
【0037】
プロセッサ118は、電源134から電力を受け取ることができ、WTRU 102内の他の構成要素に電力を分配および/または制御するように構成され得る。電源134は、WTRU 102に電力を供給するための任意の好適なデバイスであり得る。例えば、電源134は、1つ以上の乾電池(例えば、ニッケルカドミウム(NiCd)、ニッケル亜鉛(NiZn)、ニッケル金属水素化物(NiMH)、リチウムイオン(Liイオン)など)、太陽電池、燃料電池などを含み得る。
【0038】
プロセッサ118はまた、GPSチップセット136に結合され得、これは、WTRU 102の現在の位置に関する位置情報(例えば、経度および緯度)を提供するように構成され得る。GPSチップセット136からの情報に加えて、またはその代わりに、WTRU 102は、基地局(例えば、基地局114a、114b)からエアインターフェース116を介して位置情報を受信し得、および/または2つ以上の近くの基地局から受信される信号のタイミングに基づいてその位置を判定し得る。WTRU 102は、一実施形態と一致性を保ちながら、任意の好適な位置判定方法によって位置情報を取得し得ることが理解されよう。
【0039】
プロセッサ118は、追加の特徴、機能、および/または有線または無線接続を提供する1つ以上のソフトウェアおよび/またはハードウェアモジュールを含み得る他の周辺機器138にさらに結合され得る。例えば、周辺機器138は、加速度計、eコンパス、衛星トランシーバ、デジタルカメラ(写真および/またはビデオ用)、ユニバーサルシリアルバス(USB)ポート、振動装置、テレビトランシーバ、ハンズフリーヘッドセット、ブルートゥース(登録商標)モジュール、周波数変調(FM)無線ユニット、デジタル音楽プレーヤー、メディアプレーヤー、ビデオゲームプレーヤーモジュール、インターネットブラウザ、仮想現実および/または拡張現実(VR/AR)デバイス、アクティビティトラッカなどを含み得る。周辺機器138は、1つ以上のセンサを含み得、センサは、ジャイロスコープ、加速度計、ホール効果センサ、磁力計、方向センサ、近接センサ、温度センサ、時間センサ、地理的位置情報センサ、高度計、光センサ、タッチセンサ、磁力計、気圧計、ジェスチャセンサ、生体認証センサ、および/または湿度センサのうちの1つ以上であり得る。
【0040】
WTRU 102は、UL(例えば、送信用)およびダウンリンク(例えば、受信用)の双方の信号の一部またはすべて(例えば、特定のサブフレームに関連付けられる)の送信および受信が並列および/または同時に行われ得る全二重無線を含み得る。全二重無線は、ハードウェア(例えば、チョーク)またはプロセッサ(例えば、別個のプロセッサ(図示せず)またはプロセッサ118を介した)を介した信号処理のいずれかを介した自己干渉を低減および/または実質的に排除するための干渉管理ユニットを含み得る。一実施形態では、WRTU102は、信号の一部またはすべての送信および受信(例えば、UL(例えば、送信用)またはダウンリンク(例えば、受信用)のいずれかの特定のサブフレームに関連付けられる)のための半二重無線を含み得る。
【0041】
WTRUは、無線端末として図1A図1Bに記載されているが、特定の代表的な実施形態では、そのような端末が、通信ネットワークとの有線通信インターフェースを(例えば、一時的または恒久的に)使用し得ることが想定される。
【0042】
代表的な実施形態では、他のネットワーク112は、WLANであり得る。
【0043】
図1A図1Bの概観において、および対応する説明を考慮して、本明細書に記載の機能の1つ以上、またはすべては、1つ以上のエミュレーションデバイス(図示せず)によって実行され得る。エミュレーションデバイスは、本明細書に記載の機能のうちの1つ以上、またはすべてをエミュレートするように構成された1つ以上のデバイスであり得る。例えば、エミュレーションデバイスは、他のデバイスをテストするために、および/またはネットワークおよび/またはWTRU機能をシミュレートするために使用され得る。
【0044】
エミュレーションデバイスは、ラボ環境および/またはオペレータネットワーク環境で他のデバイスの1つ以上のテストを実装するように設計され得る。例えば、1つ以上のエミュレーションデバイスは、通信ネットワーク内の他のデバイスをテストするために、有線および/または無線通信ネットワークの一部として完全にまたは部分的に実装および/または展開されている間に、1つ以上またはすべての機能を実行し得る。1つ以上のエミュレーションデバイスは、有線および/または無線通信ネットワークの一部として一時的に実装/展開されている間に、1つ以上、またはすべての機能を実行し得る。エミュレーションデバイスは、テストの目的で別のデバイスに直接結合し得、および/または無線経由(over-the-air)無線通信を使用してテストを実行し得る。
【0045】
1つ以上のエミュレーションデバイスは、有線および/または無線通信ネットワークの一部として実装/展開されていない間に、すべてを含む1つ以上の機能を実行し得る。例えば、エミュレーションデバイスは、1つ以上の構成要素のテストを実装するために、テストラボでのテストシナリオおよび/または展開されていない(例えば、テスト)有線および/または無線通信ネットワークで利用され得る。1つ以上のエミュレーションデバイスは、テスト機器であり得る。RF回路(例えば、1つ以上のアンテナを含み得る)を介した直接RF結合および/または無線通信は、データを送信および/または受信するためにエミュレーションデバイスによって使用され得る。
【0046】
例示的なシステム。
いくつかの実施形態は、図1Cのシステムなどのシステムを使用して実施される。図1Cは、様々な態様および実施形態が実装されるシステムの例のブロック図を示す。システム1000は、以下で説明される様々な構成要素を含むデバイスとして具現化することができ、本文献で説明される態様の1つ以上を実行するように構成されている。そのようなデバイスの例は、これらに限定されるものではないが、パーソナルコンピュータ、ラップトップコンピュータ、スマートフォン、タブレットコンピュータ、デジタルマルチメディアセットトップボックス、デジタルテレビ受像機、パーソナルビデオ録画システム、コネクテッド家電、およびサーバなどの様々な電子デバイスを含む。システム1000の要素は、単独でも組み合わせでも、単一の集積回路、複数のIC、および/または個別の構成要素で具現化され得る。例えば、少なくとも1つの実施形態において、システム1000の処理および符号化器/復号化器要素は、複数のICおよび/または個別の構成要素にわたって分散している。様々な実施形態において、システム1000は、1つ以上の他のシステムに、または他の電子デバイスに、例えば、通信バスを介して、または専用の入力および/もしくは出力ポートを通して、通信可能に結合される。様々な実施形態において、システム1000は、本文献に記載の態様のうちの1つ以上を実装するように構成される。
【0047】
システム1000は、例えば、本文献に記載の様々な態様を実装するために、読み込まれた命令を実行するように構成された少なくとも1つのプロセッサ1010を含む。プロセッサ1010は、当技術分野で既知であるように、埋め込みメモリ、入出力インターフェース、および他の様々な回路を含み得る。システム1000は、少なくとも1つのメモリ1020(例えば、揮発性メモリデバイス、および/または不揮発性メモリデバイス)を含む。システム1000は、不揮発性メモリおよび/または揮発性メモリを含むことができるストレージデバイス1040を含み、電気的に消去可能なプログラム可能な読み取り専用メモリ(EEPROM)、読み取り専用メモリ(ROM)、プログラム可能な読み取り専用メモリ(PROM)、ランダムアクセスメモリ(RAM)、ダイナミックランダムアクセスメモリ(DRAM)、スタティックランダムアクセスメモリ(SRAM)、フラッシュ、磁気ディスクドライブ、および/または光ディスクドライブを含むが、これらに限定されない。ストレージデバイス1040は、非限定的な例として、内部ストレージデバイス、付属のストレージデバイス(取り外し可能および取り外し不可能なストレージデバイスを含む)、ならびに/またはネットワークアクセス可能なストレージデバイスを含み得る。
【0048】
システム1000は、例えば、符号化されたビデオまたは復号化されたビデオを提供するためにデータを処理するように構成された符号化器/復号化器モジュール1030を含み、符号化器/復号化器モジュール1030は、独自のプロセッサおよびメモリを含み得る。符号化器/復号化器モジュール1030は、符号化機能および/または復号化機能を実行するデバイスに含まれ得るモジュールを表す。既知であるように、デバイスは、符号化および復号化モジュールの一方または両方を含み得る。さらに、符号化器/復号化器モジュール1030は、システム1000の別個の要素として実装することができ、または、当業者には既知であるように、ハードウェアとソフトウェアとの組み合わせとして、プロセッサ1010内に組み込むことができる。
【0049】
本文献に記載の様々な態様を実行するためにプロセッサ1010または符号化器/復号化器1030に読み込まれるプログラムコードは、ストレージデバイス1040に記憶され、続いて、プロセッサ1010による実行のためにメモリ1020に読み込まれ得る。様々な実施形態によれば、プロセッサ1010、メモリ1020、ストレージデバイス1040、および符号化器/復号化器モジュール1030のうちの1つ以上は、本文献に記載のプロセスの実行中、様々な項目のうちの1つ以上を記憶することができる。このような記憶される項目には、入力ビデオ、復号化されたビデオまたは復号化されたビデオの一部、ビットストリーム、マトリックス、変数、ならびに方程式、式、演算、および演算ロジックの処理からの中間結果または最終結果が含まれ得るが、これらに限定されない。
【0050】
いくつかの実施形態において、プロセッサ1010および/または符号化器/復号化器モジュール1030の内部のメモリを使用して、命令を記憶し、符号化または復号化中に必要とされる処理のために、ワーキングメモリを提供する。しかしながら、他の実施形態において、処理デバイス(例えば、処理デバイスは、プロセッサ1010または符号化器/復号化器モジュール1030のいずれかであり得る)の外部のメモリは、これらの機能のうちの1つ以上に使用される。外部メモリは、メモリ1020および/またはストレージデバイス1040、例えば、ダイナミック揮発性メモリおよび/または不揮発性フラッシュメモリであり得る。いくつかの実施形態において、例えば、テレビのオペレーティングシステムを記憶するために外部不揮発性フラッシュメモリが使用される。少なくとも1つの実施形態では、RAMなどの高速外部ダイナミック揮発性メモリが、MPEG-2(MPEGはMoving Picture Experts Groupを指し、MPEG-2は、ISO/IEC 13818とも称され、13818-1はH.222としても既知であり、13818-2はH.262としても既知である)、HEVC(HEVCはHigh Efficiency Video Codingを指し、H.265およびMPEG-H Part2としても既知である)、またはVVC(Versatile Video Codingであり、JVET、すなわちJoint Video Experts Teamによって開発された新標準規格)などのビデオコード化および復号化動作のためのワーキングメモリとして使用される。
【0051】
システム1000の要素への入力は、ブロック1130に示されるような様々な入力デバイスを通して提供され得る。このような入力デバイスは、(i)例えば、放送局によって無線で送信されたRF信号を受信する無線周波数(RF)部分、(ii)構成要素(COMP)入力端子(またはCOMP入力端子のセット)、(iii)ユニバーサルシリアルバス(USB)入力端子、および/または(iv)高品位マルチメディアインターフェース(HDMI)入力端子を含むが、これらに限定されない。図1Cに示されていない他の実施例には、コンポジットビデオが含まれる。
【0052】
様々な実施形態において、ブロック1130の入力デバイスは、当技術分野で既知であるような関連するそれぞれの入力処理要素を有する。例えば、RF部は、(i)所望の周波数を選択する(信号を選択する、またはある周波数帯域に信号を帯域制限する、とも称される)、(ii)選択された信号をダウンコンバートする、(iii)(例えば)ある特定の実施形態ではチャネルと称され得る信号周波数帯域を選択するために、より狭い周波数帯域に再び帯域制限する、(iv)ダウンコンバートされ、帯域制限された信号を復調する、(v)誤り訂正を実行する、および(vi)逆多重化して、所望のデータパケットストリームを選択するのに好適な要素に関連付けられ得る。様々な実施形態のRF部は、これらの機能、例えば、周波数セレクタ、信号セレクタ、帯域リミッタ、チャネルセレクタ、フィルタ、ダウンコンバータ、復調器、誤り訂正器、および逆多重化器を実行する1つ以上の要素を含む。RF部は、例えば、受信された信号をより低い周波数に(例えば、中間周波数またはベースバンドに近い周波数)、またはベースバンドにダウンコンバートすることを含む、様々なこれらの機能を実行するチューナを含むことができる。1つのセットトップボックスの実施形態において、RF部およびその関連付けられた入力処理要素は、有線(例えば、ケーブル)媒体経由で送信されたRF信号を受信し、フィルタリングし、ダウンコンバートし、所望の周波数帯域に再びフィルタリングすることによって、周波数選択を実行する。様々な実施形態では、上記(および他の)要素の順番が並べ替えられ、これらの要素のうちのいくつかが取り除かれ、かつ/または同様もしくは異なる機能を実行する他の要素が追加される。要素を追加することは、既存の要素間に要素を挿入すること、例えば、増幅器およびアナログ-デジタル変換器を挿入することなどを含むことができる。様々な実施形態において、RF部は、アンテナを含む。
【0053】
さらに、USBおよび/またはHDMI端子は、USBおよび/またはHDMI接続を介して、他の電子デバイスにシステム1000を接続するためのそれぞれのインターフェースプロセッサを含み得る。入力処理の様々な態様、例えば、リードソロモン誤り訂正が、例えば、必要に応じて、別個の入力処理IC内、またはプロセッサ1010内に実装され得ることを理解されたい。同様に、USBまたはHDMIインターフェース処理の態様は、必要に応じて、別個のインターフェースIC内またはプロセッサ1010内に実装され得る。復調され、誤り訂正され、かつ逆多重化されたストリームは、例えば、プロセッサ1010と、出力デバイス上での表示用に、必要に応じてデータストリームを処理するためにメモリおよびストレージ要素と組み合わせて動作する符号化器/復号化器1030と、を含む様々な処理要素に提供される。
【0054】
システム1000の様々な要素は、一体型ハウジング内に提供され得、一体型ハウジング内で、様々な要素は、相互接続され、好適な接続構成1140、例えば、Inter-IC(I2C)バス、配線、およびプリント回路基板を含む、当技術分野で周知であるような内部バスを使用して、それらの間でデータを送信することができる。
【0055】
システム1000は、通信チャネル1060を介して他のデバイスとの通信を可能にする通信インターフェース1050を含む。通信インターフェース1050は、通信チャネル1060経由でデータを送受信するように構成されたトランシーバを含むことができるが、これに限定されない。通信インターフェース1050は、モデムまたはネットワークカードを含むことができるが、これらに限定されず、通信チャネル1060は、例えば、有線および/または無線媒体内に実装され得る。
【0056】
データは、様々な実施形態において、Wi-Fiネットワーク、例えば、IEEE802.11(IEEEは、電気電子技術者協会を指す)などの無線ネットワークを使用して、システム1000にストリーミングされるか、または別様に提供される。これらの実施形態のWi-Fi信号は、Wi-Fi通信に適合された通信チャネル1060および通信インターフェース1050を介して受信される。これらの実施形態の通信チャネル1060は、典型的には、ストリーミングアプリケーションおよび他のオーバーザトップ通信を可能にするインターネットを含む外部ネットワークへのアクセスを提供するアクセスポイントまたはルータに接続される。他の実施形態は、入力ブロック1130のHDMI接続経由でデータを配信するセットトップボックスを使用して、ストリーミングされたデータをシステム1000に提供する。さらに他の実施形態は、入力ブロック1130のRF接続を使用して、ストリーミングされたデータをシステム1000に提供する。上記のように、様々な実施形態は、非ストリーミング方式でデータを提供する。さらに、様々な実施形態は、Wi-Fi以外の無線ネットワーク、例えば、セルラーネットワークまたはブルートゥースネットワークを使用する。
【0057】
システム1000は、ディスプレイ1100、スピーカ1110、および他の周辺デバイス1120を含む、様々な出力デバイスに出力信号を提供することができる。様々な実施形態のディスプレイ1100は、例えば、タッチスクリーンディスプレイ、有機発光ダイオード(OLED)ディスプレイ、湾曲ディスプレイ、および/または折り畳み式ディスプレイのうちの1つ以上を含む。ディスプレイ1100は、テレビ、タブレット、ラップトップ、携帯電話(モバイルフォン)、または他のデバイス用であり得る。ディスプレイ1100はまた、他の構成要素(例えば、スマートフォンのように)と統合され得るか、または別個(例えば、ラップトップ用の外部モニタ)であり得る。他の周辺デバイス1120は、実施形態の様々な例において、スタンドアロンデジタルビデオディスク(もしくはデジタル多用途ディスク)(両用語ともDVR)、ディスクプレーヤ、ステレオシステム、および/または照明システムのうちの1つ以上を含む。様々な実施形態は、システム1000の出力に基づく機能を提供する1つ以上の周辺デバイス1120を使用する。例えば、ディスクプレーヤは、システム1000の出力を再生する機能を実行する。
【0058】
様々な実施形態において、システム1000と、ディスプレイ1100、スピーカ1110、または他の周辺デバイス1120との間で、AV.Link、コンシューマエレクトロニクス制御(CEC)、またはユーザの介入の有無に関わらず、デバイス間制御を可能にする他の通信プロトコルなどの信号伝達を使用して、制御信号が通信される。出力デバイスは、それぞれのインターフェース1070、1080、および1090を通して専用接続を介してシステム1000に通信可能に結合され得る。代替的に、出力デバイスは、通信インターフェース1050を介して、通信チャネル1060を使用してシステム1000に接続され得る。ディスプレイ1100およびスピーカ1110は、例えば、テレビなどの電子デバイス内のシステム1000の他の構成要素と、単一のユニット内に統合され得る。様々な実施形態において、ディスプレイインタフェース1070は、例えば、タイミングコントローラ(T Con)チップなどのディスプレイドライバを含む。
【0059】
ディスプレイ1100およびスピーカ1110は、代替的に、例えば、入力1130のRF部が別個のセットトップボックスの一部である場合、他の構成要素のうちの1つ以上とは別個であり得る。ディスプレイ1100およびスピーカ1110が外部構成要素である様々な実施形態において、例えば、HDMIポート、USBポート、またはCOMP出力部を含む専用出力接続を介して、出力信号が提供され得る。
【0060】
実施形態は、プロセッサ1010によって、またはハードウェアによって、またはハードウェアとソフトウェアとの組み合わせによって実装されるコンピュータソフトウェアによって、実行され得る。非限定的な例として、実施形態は、1つ以上の集積回路によって実装され得る。メモリ1020は、技術的環境に適切な任意のタイプのものであり得、非限定的な例として、光メモリデバイス、磁気メモリデバイス、半導体ベースのメモリデバイス、固定メモリ、およびリムーバブルメモリなどの任意の適切なデータストレージ技術を使用して実装され得る。プロセッサ1010は、技術的環境に適切な任意のタイプのものであり得、非限定的な例として、マイクロプロセッサ、汎用コンピュータ、専用コンピュータ、およびマルチコアアーキテクチャに基づくプロセッサのうちの1つ以上を包含し得る。
【発明を実施するための形態】
【0061】
ブロックベースのビデオコーディング。
HEVCと同様に、VVCはブロックベースのハイブリッドビデオコーディングフレームワークに基づいて構築される。図2Aは、ブロックベースのハイブリッドビデオ符号化システム200のブロック図を与える。この符号化器200の変形が企図されるが、符号化器200は、明確にするためにすべての予想される変形を説明することなく、以下に説明される。
【0062】
符号化される前に、ビデオシーケンスは事前符号化処理(204)、例えば、入力色画像に色変換(例えば、RGB4:4:4からYCbCr 4:2:0への変換)を適用すること、または、圧縮に対してより復元力のある信号分布を得るために、入力画像成分の再マッピングを実行することを経る場合がある(例えば、色成分のうちの1つのヒストグラム等化を使用して)。メタデータは、前処理に関連付けてビットストリームに添付することができる。
【0063】
符号化される画像を含む入力ビデオ信号202は、分割され(206)、ブロックごとに処理される。いくつかのブロックは、コーディングユニット(CU)と称され得る。CUが異なれば、サイズも異なり得る。VTM-1.0では、CUは最大128×128ピクセルにすることができる。ただし、クアッドツリーのみに基づいてブロックを分割するHEVCとは異なり、VTM-1.0では、コーディングツリーユニット(CTU)がCUに分割され、クアッド/バイナリ/ターナリーツリーに基づいて様々なローカル特性に適応する。追加的に、HEVCの複数パーティションユニットタイプの概念が削除され、CU、予測ユニット(PU)、および変換ユニット(TU)の分離がVVC-1.0にもはや存在しなくなり、代わりに、各CUは常に、追加のパーティションなしで予測と変換の両方の基本単位として使用される。マルチタイプツリー構造では、CTUは、最初にクアッドツリー構造によって分割される。次に、各クアッドツリーリーフノードをバイナリおよびターナリーツリー構造でさらに分割することができる。4分割、垂直2分割、水平2分割、垂直3分割、水平3分割の5つのスプリッティングタイプがある。
【0064】
図2Aの符号化器では、空間予測(208)および/または時間予測(210)を実行し得る。空間予測(または「イントラ予測」)は、同じビデオ画像/スライス内の既にコード化された隣接ブロックのサンプル(参照サンプルと称される)からのピクセルを使用して、現在のビデオブロックを予測する。空間予測は、ビデオ信号に固有の空間冗長性を低減する。時間的予測(「インター予測」または「動き補償された予測」とも称される)は、既にコード化されたビデオ画像から再構築されたピクセルを使用して、現在のビデオブロックを予測する。時間的予測は、ビデオ信号に固有の時間的冗長性を低減する。所与のCUの時間的予測信号は、現在のCUとその時間基準との間の動きの量および方向を示す1つ以上の動きベクトル(MV)によって信号伝達されることができる。また、複数の参照画像がサポートされている場合、参照画像インデックスは、追加で送信され得、これを使用して、参照画像ストア(212)内のどの参照画像から時間予測信号が来るかを識別する。
【0065】
符号化器でのモード決定ブロック(214)は、例えば、レート歪み最適化方法に基づいて、最良の予測モードを選択する。この選択は、空間的および/または時間的予測が実行された後に行うことができる。イントラ/インター決定は、例えば、予測モードフラグによって示され得る。予測ブロックは、現在のビデオブロック(216)から差し引かれ、予測残差を生成する。予測残差は、変換(218)および量子化(220)を使用して相関が解除される。(いくつかのブロックでは、符号化器は、変換と量子化の両方をバイパスする場合があり、その場合、残差は変換または量子化プロセスを適用せずに直接コード化され得る。)量子化された残差係数は、逆量子化(222)および逆変換(224)されて、再構成された残差を形成し、それは次に予測ブロック(226)に戻されて、CUの再構成された信号を形成する。非ブロック化/SAO(サンプル適応オフセット)フィルタリングなどの、さらなるインループフィルタリングは、それが参照画像ストアに配置され(212)、将来のビデオブロックをコード化するために使用される前に、再構築されたCUに適用され得て(228)符号化アーティファクトを低減する。出力ビデオビットストリーム230を形成するために、コーディングモード(インターまたはイントラ)、予測モード情報、モーション情報、および量子化された残差係数は、すべてエントロピーコーディングユニット(108)に送信され、さらに圧縮およびパックされてビットストリームを形成する。
【0066】
図2Bは、ブロックベースのビデオ復号化器250のブロック図を与える。復号化器250では、以下に説明されているように、ビットストリームが、復号化器要素によって復号化される。ビデオ復号化器250は、概して、図2Aで説明したような符号化パスの逆の復号化パスを実行する。符号化器200はまた、概して、ビデオデータの符号化の一部としてビデオ復号化を実行する。
【0067】
特に、復号化器の入力は、ビデオ符号化器200によって生成され得るビデオビットストリーム252を含む。ビデオビットストリーム252は、最初にアンパックされ、エントロピー復号化ユニット254でエントロピー復号化されて、変換係数、動きベクトル、および他のコード化情報を取得する。画像分割情報は、画像がどのように分割されているかを示す。したがって、復号化器は、復号化された画像分割情報に従って画像を分割し得る(256)。コーディングモードおよび予測情報は、空間予測ユニット258(イントラコード化されている場合)または時間予測ユニット260(インターコード化されている場合)のいずれかに送信されて、予測ブロックを形成する。残差変換係数は、逆量子化ユニット262および逆変換ユニット264に送られて、残差ブロックを再構築する。次に、予測ブロックおよび残差ブロックが266で一緒に加算されて、再構築ブロックを生成する。再構築されたブロックは、将来のビデオブロックの予測に使用されるため、参照画像ストア270に記憶される前に、ループ内フィルタリング268をさらに通過し得る。
【0068】
復号化された画像272は、復号化後処理(274)、例えば、逆色変換(例えば、YCbCr 4:2:0からRGB4:4:4への変換)または事前符号化処理(204)で行われる再マッピングプロセスの逆を行う逆再マッピングをさらに経ることができる。復号化後処理では、事前符号化処理で導出され、かつビットストリームで信号伝達されるメタデータを使用することができる。復号化され、処理されたビデオは、ディスプレイデバイス276に送信され得る。ディスプレイデバイス276は、復号化器250とは別個のデバイスであり得るか、または復号化器250およびディスプレイデバイス276は、同じデバイスの構成要素であり得る。
【0069】
本開示に記載されている様々な方法および他の態様を使用して、ビデオ符号化器200または復号化器250のモジュールを修正することができる。さらに、本明細書に開示されているシステムおよび方法は、VVCまたはHEVCに限定されず、例えば、既存かまたは将来開発されるかどうかにかかわらず、他の規格および推奨事項、ならびに任意のそのような規格および推奨事項(VVCおよびHEVCを含む)の拡張版に適用することができる。特に指示されていない限り、または技術的に除外されていない限り、本開示に説明される態様は、個別にまたは組み合わせて使用することができる。
【0070】
インター予測。
図3Aおよび図3Bは、ビデオブロックの動き予測の例を示す図である(例えば、インター予測モジュール210または260を使用する)。画像内のブロックレベルの動きの例を示す図3Bは、例えば、参照画像「Ref pic 0」、「Ref pic 1」、および「Ref pic2」を含む例示的な復号化された画像バッファを示す図である。現在の画像のブロックB0、B1、およびB2は、それぞれ参照画像「Ref pic 0」、「Ref pic 1」、および「Ref pic2」のブロックから予測し得る。動き予測は、隣接するビデオフレームからのビデオブロックを使用して、現在のビデオブロックを予測し得る。動き予測は、時間的相関を利用し得、および/またはビデオ信号に固有の時間的冗長性を取り除き得る。例えば、H.264/AVCおよびHEVCでは、時間的予測は、様々なサイズのビデオブロックで実行し得る(例えば、輝度成分の場合、時間的予測ブロックサイズは、H.264/AVCでは16×16から4×4に、およびHEVCでは64×64から4×4に変化し得る)。(mvx,mvy)の動きベクトルによれば、次の式で提供されるように時間的予測を実行され得る。
P(x,y)=ref(x-mvx,y-mvy)
ここで、ref(x,y)は、参照画像での位置(x,y)におけるピクセル値であり得、P(x,y)は、予測されたブロックであり得る。ビデオコーディングシステムは、小数ピクセル精度でのインター予測をサポートし得る。動きベクトル(mvx,mvy)が小数ピクセル値を有する場合、1つ以上の補間フィルタを適用し得、小数ピクセル位置でのピクセル値を取得し得る。ブロックベースのビデオコーディングシステムは、マルチ仮説予測を使用して、時間的予測を改善し得、例えば、予測信号は、異なる参照画像からの多数の予測信号を組み合わせることによって形成され得る。例えば、H.264/AVCおよび/またはHEVCは、2つの予測信号を組み合わせることができる二重予測を使用する場合がある。二重予測は、それぞれが参照画像からの2つの予測信号を組み合わせて、次の方程式のような予測を形成する場合がある。
【数1】
ここで、P(x,y)およびP(x,y)は、それぞれ第1と第2の予測ブロックであり得る。2つの予測ブロックは、2つの動きベクトル(mvx,mvy)および(mvx,mvy)をそれぞれ使用して、2つの参照画像ref(x,y)およびref(x,y)から動き補償された予測を実行することによって取得され得る。予測ブロックP(x,y)は、ソースビデオブロックから差し引かれ(例えば、216にて)、予測残差ブロックが形成され得る。予測残差ブロックは、変換され(例えば、変換ユニット218にて)、および/または量子化され得る(例えば、量子化ユニット220にて)。量子化された残差変換係数ブロックは、エントロピー符号化ユニット(例えば、エントロピー符号化ユニット232)に送られ、ビットレートを低減するためにエントロピー符号化され得る。エントロピー符号化された残差係数は、出力ビデオビットストリーム(例えば、ビットストリーム230)の一部を形成するためにパックされ得る。復号化器側では、同じ動き補償された予測プロセスを実行し得(例えば、インター予測モジュール260によって)、結果として生じる予測ブロックを、復号化された残差ブロックに追加し得る(例えば、266にて)。
【0071】
アフィンモード。
HEVCでは、並進動きモデルのみが動き補償された予測に適用される。現実の世界では、ズームイン/ズームアウト、回転、遠近的な動き、および他の不規則な動きなど、様々な種類の動きがある。VTM-2.0では、アフィン動き補償された予測が適用される。アフィン動きモデルは、4パラメータまたは6パラメータのいずれかである。相互にコード化された各ブロックの第1のフラグは、並進動きモデルまたはアフィン動きモデルのどちらがインター予測に適用されるかを示すために信号伝達される。アフィン動きモデルの場合、第2のフラグが送信され、4パラメータモデルと6パラメータモデルのどちらが使用されているかが示される。
【0072】
4つのパラメータを持つアフィン動きモデルには、水平方向と垂直方向の並進動き用の2つのパラメータ、両方向のズームモーション用の1つのパラメータ、および両方向の回転動き用の1つのパラメータという、パラメータがあり得る。水平ズームパラメータは垂直ズームパラメータと等しいため、単一のズームパラメータが使用される。水平回転パラメータは垂直回転パラメータと等しいため、単一の回転パラメータが使用される。4パラメータのアフィン動きモデルは、現在のブロックの左上隅と右上隅で定義された2つの制御点位置で2つの動きベクトルを使用してVTMでコード化される。図4Aに示されるように、ブロックのアフィン動きフィールドは、2つの制御点動きベクトル(V,V)によって記述される。制御点の動きに基づいて、アフィンコード化されたブロックの動きフィールド(v,v)は次のように記述される。
【数2】
【0073】
方程式(1)では、(v0x,v0y)は、図4Aに示すように、左上隅の制御点の動きベクトルであり、(v1x,v1y)は、右上隅の制御点の動きベクトルであり、wは、ブロックの幅である。VTM-2.0では、アフィンコード化ブロックの動きフィールドは、4×4サブブロックレベルで導出され、現在のブロック内の4×4サブブロック(図4B)ごとに(v,v)が導出され、対応する4×4サブブロックに適用される。(いくつかのコンテキストではブロックと称されるサンプルのセットは、他のコンテキストではサブブロックと称される場合があることに留意されたい。分かりやすくするために、様々な用語がコンテキストで使用され得る。)
【0074】
4パラメータアフィンモデルのこれらの4つのパラメータは、反復的に推定できる。ステップkでのMVペアを
【数3】
とし、元の入力輝度信号をI(i,j)として、予測輝度信号をI′(i,j)として示す。空間的勾配g(i,j)およびg(i,j)は、ソーベルフィルタを用いて導出され、それぞれ水平方向および垂直方向のI′(i,j)は、予測信号に適用される。方程式(1)の導関数は次のように表すことができる。
【数4】
【0075】
方程式(2)において、ステップkで、(a,b)は、デルタ並進パラメータであり、(c,d)は、デルタズームおよび回転パラメータである。制御点でのデルタMVは、方程式(3)および(4)に示すようにその座標を用いて導出することができる。例えば、(0,0)、(w,0)は、それぞれ左上と右上の制御点の座標である。
【数5】
【数6】
【0076】
オプティカルフロー方程式に基づいて、輝度の変化と空間的勾配および時間的動きとの関係は次のように定式化される。
【数7】
【0077】
方程式(2)に
【数8】
を代入すると、パラメータ(a,b,c,d)についての方程式が得られる。
I’(i,j)-I(i,j)=(g(i,j)*i+g(i,j)*j)*c+(-g(i,j)*j+g(i,j)*i)*d+g(i,j)*a+g(i,j)*b (6)
【0078】
ブロック内のすべてのサンプルは、方程式(6)を満たすため、パラメータセット(a,b,c,d)は、最小二乗誤差法を使用して解くことができる。ステップ(k+1)での2つの制御点
【数9】
におけるMVは、方程式(3)および(4)を使用して解くことができ、特定の精度(例えば、1/4pel)に丸められる。反復を使用すると、パラメータ(a,b,c,d)がすべてゼロになるか、または反復時間が事前定義された制限に達すると収束するまで、2つの制御点のMVを精緻化することができる。
【0079】
6つのパラメータを持つアフィン動きモデルには、水平方向と垂直方向の並進動き用の2つのパラメータ、ズーム動き用の1つのパラメータおよび水平方向の回転動き用の1つのパラメータ、さらにズーム動き用の1つのパラメータおよび垂直方向の回転動き用の1つのパラメータがあり得る。6パラメータのアフィン動きモデルは、3つの制御点で3つのMVを使用してコード化される。図5の例に示すように、6パラメータのアフィンコード化ブロックの3つの制御点は、ブロックの左上隅、右上隅、および左下隅に画定されている。左上の制御点での動きは、並進モーションに関連し、右上の制御点での動きは、水平方向の回転とズーム動きに関連し、左下の制御点での動きは、回転と垂直方向のズームモーションに関連する。6パラメータのアフィン動きモデルの場合、水平方向の回転とズームの動きは、垂直方向の動きと同じではない場合がある。各サブブロック(v,v)の動きベクトルは、次のように制御点で3つのMVを使用して導出され得る。
【数10】
【0080】
方程式(7)において、(v2x,v2y)は、左下の制御点の動きベクトル、(x,y)はサブブロックの中心位置、ならびにwおよびhはブロックの幅および高さである。
【0081】
6パラメータのアフィンモデルの6つのパラメータは、4パラメータモデルで使用されるのと同様の方法で推定され得る。方程式(2)は、次のように方程式(8)に修正され得る。
【数11】
【0082】
方程式(8)において、ステップkで、(a,b)は、デルタ平行移動パラメータ、(c,d)は水平方向のデルタズームおよび回転パラメータ、(e,f)は、垂直方向のデルタズームおよび回転パラメータである。方程式(6)はそれに応じて変更され、方程式(9)が得られる。
I’(i,j)-I(i,j)=(g(i,j)*i)*c+g(i,j)*j)*d+g(i,j)*i)*e+(g(i,j)*j)*f+g(i,j)*a+g(i,j)*b (9)
【0083】
パラメータセット(a,b,c,d,e,f)は、ブロック内のすべてのサンプルを考慮することにより、最小二乗法を使用して解くことができる。左上の制御点
【数12】
のMVは、方程式(3)で計算される。右上の制御点
【数13】
のMVは、方程式(10)で計算される。右上の制御点
【数14】
のMVは、方程式(11)で計算される。
【数15】
【数16】
【0084】
アフィンモードのオプティカルフロー(PROF)による予測の精緻化
動き補償のより細かい粒度を達成するために、Jiancong(Daniel)Luo,Yuwen He,”CE2-related:Prediction refinement with optical flow for affine mode”,JVET-N0236,March 2019,Geneva,Switzerlandに記載されているように、オプティカルフローによる、サブブロックベースのアフィン動き補償された予測を精緻化する方法が提案されている。サブブロックベースのアフィン動き補償が実行された後、オプティカルフロー方程式によって導出された差を追加することによって、各輝度予測サンプルが精緻化される。提案されたPROFは、次のステップを含むものとして説明されている。
【0085】
第1のステップでは、サブブロックベースのアフィン動き補償が実行されて、サブブロック予測I(i,j)を生成する。
【0086】
第2のステップでは、サブブロック予測の空間的勾配g(i,j)およびg(i,j)が、3タップフィルタ[-1,0,1]を使用して各サンプル位置で計算される。
(i,j)=I(i+1,j)-I(i-1,j)
(i,j)=I(i,j+1)-I(i,j-1)
サブブロック予測は、勾配計算のために各側で1ピクセルずつ拡張される。メモリ帯域幅と複雑さを軽減するために、拡張された境界上のピクセルは、参照画像の最も近い整数ピクセル位置からコピーされる。したがって、パディング領域の追加の補間は回避される。
【0087】
第3のステップでは、オプティカルフロー方程式によって輝度予測の精緻化が計算される。
ΔI(i,j)=g(i,j)*Δv(i,j)+g(i,j)*Δv(i,j) (12)
ここで、Δv(i,j)は、b v(i,j)yで表されるサンプル位置(i,j)に対して計算されたピクセルMVと、図6に示されるように、ピクセル(i,j)が属するサブブロックのサブブロックMVとの間の差である。
アフィンモデルのパラメータとサブブロックの中心に対するピクセル位置はサブブロックごとに変更されないため、第1のサブブロックに対してΔv(i,j)を計算し、同じブロック内の他のサブブロックに再利用できる。xおよびyをピクセル位置からサブブロックの中心までの水平および垂直オフセットとすると、Δv(x,y)は次の方程式で導出され得る。
【数17】
4パラメータのアフィンモデルの場合、
【数18】
6パラメータのアフィンモデルの場合、
【数19】
ここで、(v0x,v0y)、(v1x,v1y)、(v2x,v2y)は左上、右上、左下の制御点の動きベクトルであり、wおよびhはブロックの幅および高さである。
【0088】
第4のステップでは、輝度予測の精緻化がサブブロック予測I(i,j)に追加される。最終的な予測I’は、次の方程式を使用して生成され得る。
I’(i,j)=I(i,j)+ΔI(i,j) (13)
【0089】
いくつかの実施形態で対処される問題
現在の動き補償プロセスは、通常、動きベクトルの精度によって制限される。例えば、復号化器側で示された動きベクトルは、サンプルレベル、サブブロックレベル、またはブロックレベルでの動き補償された予測に使用され、これにより、整数の参照サンプル位置と、分数位置にある補間フィルタが判定され得る。関連する動きベクトルの精度は、各サンプルでの動き補償された予測の精度の要因である。動きベクトルの小数部分に4つの追加ビットを使用すると、1/16のPEL精度が達成され得る。ただし、この精度の制限により、潜在的な問題が発生する。1つの問題は、動き補償された予測が既に十分に正確である場合、余分なビットが信号伝達オーバーヘッドの無駄になることである。別の問題は、場合によっては、提供される追加ビットの数がまだ十分でない可能性があり、さらに高い精度が望ましい場合があることである。より効率的な精度の表現を提供するために、より柔軟で正確な方法は、動き補償された精度を改善するのに有益である可能性がある。
【0090】
VTM-5.0では、特定の精度の粒度が必要な場合、その精度以上の精度で対応する補間フィルタが事前に定義されているため、任意精度の使用を妨げる。例えば、復号化器が1/32PELの精度を達成する場合、これはVTM-5.0の1/16PELの精度よりも細かいが、1/32PEL精度以上(例えば、1/64PEL)の補間フィルタは所定の補間フィルタ(例えば、ビデオ標準仕様で定義されたフィルタ)であり得る。
【0091】
いくつかの実施形態の概要。
本開示は、精度精緻化とともに使用するための柔軟な方式でオプティカルフローを用いた動き補償(MC)予測プロセスの予測精度を改善するためのシステムおよび方法を説明する。いくつかの実施形態では、動き補償が実行された後、オプティカルフロー方程式によって導出された差の値を加算することによって、各サンプルでの予測が精緻化される。このような精緻化は、オプティカルフローによる動き補償精度精緻化(MCPROF)と称され得る。オプティカルフローは、ブロックレベル(CUレベルまたはサブCUレベルなどの予測ユニットレベルであり得る)での動きベクトルの精緻化として信号伝達され得る。オプティカルフロー方程式によって導き出された差の値は、異なる精度を表す可能性があるため、より精緻化精度が達成され得る。本明細書で説明するいくつかの実施形態は、複雑さを大幅に増加させることなくピクセルレベルの粒度を達成でき、最悪の場合のメモリアクセス帯域幅を通常のブロックレベルの動き補償と同じに保つことができる。本明細書で説明される様々な実施形態は、任意のサブブロックベースのインター予測モードおよび/またはブロックベースのインター予測モードに適用され得る。本明細書に記載の実施形態は、単一予測と二重予測の両方に適用することができ、それらは、インターマージモードと非マージモードの両方に適用することができる。いくつかの実施形態の1つの潜在的な利点は、追加の補間フィルタを必要とせずに精度の精緻化を提供することである。
【0092】
オプティカルフローによる動き補償の精度精緻化(MCPROF)
動き補償のより精緻な精度を達成するために、いくつかの実施形態では、オプティカルフローを使用して動き補償された予測を精緻化するための方法が採用されている。動き補償プロセスが実行された後、各サンプルでの輝度または/および彩度の予測は、オプティカルフロー方程式によって導出された差を追加することによって精緻化される。MCPROFを使用した符号化方法の例は以下のとおりである。
【0093】
例示的な方法では、動き補償プロセスを使用して、インター非マージモードの動き推定の後に、各サンプル位置(i,j)で予測I(i,j)を生成する。動き補償プロセスは、既存のインター予測プロセス(単一予測、二重予測、およびアフィン予測を含む)を使用して実行し得る。このステップで実行される1つ以上の動き補償プロセス(例えば、複数の動きベクトル候補が利用可能である)があり得る。複数の動き補償プロセスの場合、VTM5.0で行われるように、複数の動き補償プロセスの1つを事前定義された基準(例えば、最小のレート歪みコストでの動き補償プロセス)に従って選択し得る。
【0094】
1つまたは選択された動き補償プロセスは、精度精緻化を使用するかどうかを判定するために評価される。例えば、MCプロセス後に提供される既存の精度(例えば、1/4PEL)が十分に正確である場合、精度精緻化を進めないという判定が下される場合がある。そのような判定は、例えば、残差値が現在の動き補償精度で0に近い(例えば、所定の大きさの閾値未満)場合に行われ得る。
【0095】
ただし、状況によっては、精度精緻化を進めることが判定される。この場合、精緻化の程度を伝えるために使用される精度差Nを判定し得る。例えば、実質的に最適な(または正確な)残差値が約9/16PELであるという判定は、動き補償プロセスを通してなされ得る。最適な精度に対応するには、1/16PELの動き補償精度が望ましい場合がある。ただし、現在の動き補償プロセスで1/4PELの精度(例えば、既存の定義済み補間フィルタによって提供される)を使用する場合、現在の精度と所望の精度との間の精度差Nは2である。
【0096】
いくつかの実施形態では、動き補償された予測の精緻化は、以下のようにオプティカルフローを使用して判定される。既存の動きベクトル(複数可)をMCP(i,j)とし、非圧縮の元の入力サンプル値をO(i,j)とし、MCP(i,j)の水平空間的勾配をg(i)とし、MCP(i,j)の垂直空間的勾配をg(i,j)とした動き補償された予測を示す。追加の動きベクトルの精緻化(Δmv,Δmv)がオプティカルフローに使用される。動きベクトルの精緻化(Δmv,Δmv)は、方程式14を実質的に満たすように選択され得る。
O(i,j)=MCP(i,j)+g(i,j)*Δmv+g(i,j)*Δmv (14)
【0097】
いくつかの実施形態では、動きベクトルの精緻化(Δmv,Δmv)は、方程式(15)のように最小二乗法で推定される。
【数20】
【0098】
より精緻な精度(例えば、ビット深度に関して)を使用することが判定された場合、動きベクトルの精緻化値Δmv(i,j)(すなわち、(Δmv(i,j),Δmv(i,j)))は、ビットストリームで信号伝達され得る。いくつかの実施形態では、関連する精度差Nもビットストリームで信号伝達され得る。信号伝達オーバーヘッドを節約するために、Nは、スライス/画像レベル、CTUレベル、またはCU(または他のブロック)レベルなどの異なるレベルで信号伝達され得る。同様に、動きベクトルの精緻化値は、スライス/画像レベル、CTUレベル、CU(または他のブロック)レベル、またはサンプルレベルなどの異なるレベルで信号伝達され得る。動きベクトルの精緻化値がサンプルレベルで信号伝達されない場合、ブロックまたはサブブロック内の動きベクトルの精緻化値は、そのブロックまたはサブブロック内の各サンプルで同じであり得る。
【0099】
いくつかの実施形態では、追加の動きベクトル精緻化値は、特定の隣接するサンプル位置の形式で信号伝達され得る。図7に示されるように、隣接位置は、動きベクトルの精緻化値を示すために使用され得、これは、4つの最も近い隣接位置または8つの最も近い隣接位置(例えば、1ピクセル距離)またはさらに隣接する位置(例えば、1ピクセル距離を超える)の1つによって表され得る。図7に示す例では、隣接するサンプル位置(i,j-1)が信号伝達される場合、それは、動きベクトルの精緻化値Δmv(i,j)=(0,-1)を信号伝達する効果があり、ここで、Δmv(i,j)=0、Δmv(i,j)=-1である。隣接するサンプル位置(i-1,j-1)が信号伝達される場合、それは、動きベクトルの精緻化値Δmv(i,j)=(-1,-1)を信号伝達する効果があり、ここで、Δmv(i,j)=-1、Δmv(i,j)=-1である。
【0100】
いくつかの実施形態では、動きベクトルの精緻化値は、インデックス値の形式で信号伝達され得る。例えば、4つの最も近い隣接位置が使用される場合、対応する上、下、左、および右の隣接位置は、一例として0,1,2,3としてインデックス付けされる。インデックスは、可変長のコードワードで2値化され得る。例えば、8つの最も近い隣接位置が許可されている場合、4つの最も近い隣接位置のインデックスは、2つの対角線方向にある他の4つの隣接位置のインデックスよりも短いコードワードを使用してコード化され得る。
【0101】
いくつかの実施形態では、関連する精度差Nは、現在の精度と所望の精度との間のビット深度差に等しい整数値であり得る。例えば、動き補償された予測プロセスの現在の精度が1/4PELであり、必要な精度が1/16PELである場合、信号伝達される精度は、N=2であり得る。いくつかの実施形態では、符号化器は、MCPROFが使用されているかどうかを示すフラグを信号伝達する。
【0102】
オプティカルフローによる精度精緻化を使用した予測。
精度差Nおよび動きベクトルの精緻化値は、ブロックまたはサブブロックの予測の生成において、符号化器(例えば、モジュール210にて)または復号化器(例えば、モジュール260にて)によって使用され得る。MCPROFが使用される場合(例えば、有効化フラグがビットストリームで信号伝達される場合)、信号伝達されたΔmv(i,j)およびNの値が取得される。空間的勾配g(i,j)およびg(i,j)は、各サンプル位置(i,j)のために計算される。空間的勾配の判定は、上記のように3タップフィルタを使用して、または他の技術を使用して実行し得る。
【0103】
初期の動き補償された予測I(i,j)は、例えば、単一予測、二重予測、および/またはアフィン予測を使用して、現在のブロックに対して生成される。精度精緻化は、方程式16に従って、動きベクトルの精緻化と空間的勾配とのスカラー積を使用して計算される。
ΔI(i,j)=(gx(i,j)*Δmv(i,j)+g(i,j)*Δmv(i,j))≫(N+existing MC precision) (16)
ここで、Δmv(i,j)は、信号伝達された動きベクトルの精緻化値(例えば、符号化器から受信された)、Nは、現在の精度と所望の精度の間の信号伝達されたビット深度の差、およびg(i,j)は、上述のように計算された空間的勾配である。
【0104】
各サンプルでの動き補償された予測は、強度の変化(例えば、輝度または色度)を追加することによって精緻化される。最終的な予測I’は、次の方程式に従って生成され得る。
I’(i,j)=I(i,j)+ΔI(i,j) (17)
【0105】
上記の例示的な実施形態では、4つの隣接位置または8つの隣接位置が考慮されている。選択された各隣接位置は、精度の向上の方向を示すために使用され、隣接するサンプルの動き補償プロセスが完了するのを待つことに依存しない。
【0106】
方法の例を図8に示す。ビデオ符号化器では、動き補償された予測に基づいて、サンプルの現在のブロック内の少なくとも最初のサンプル位置について、初期の予測されたサンプル値が取得される(802)。少なくとも第1のサンプル位置について、動きベクトルの精緻化が判定される(804)。動きベクトルの精緻化は、例えば、ストレージまたは送信のために、ビットストリームに符号化され得る(806)。
【0107】
サンプル値の空間的勾配は、第1のサンプル位置で判定される(808)。サンプル差値は、空間的勾配と動きベクトルの精緻化とのスカラー積に基づいて判定される(810)。いくつかの実施形態では、サンプル差値の判定は、サンプル差値のスケーリング(例えば、ビットシフト)を含み得、スケーリングの量を示す精度情報は、ビットストリームに符号化され得る。初期の予測されたサンプル値は、サンプル差値に基づいて修正され(812)、例えば、サンプル差値を初期の予測されたサンプル値に追加して、精緻化されたサンプル値を生成する。
【0108】
いくつかの実施形態では、動きベクトルの精緻化の判定(804)は、入力ビデオブロックに関する予測誤差を実質的に最小化するために動きベクトルの精緻化を選択することを含み得る。動きベクトルの精緻化がサンプルごとに選択される実施形態では、予測誤差は、精緻化されたサンプル値と入力ビデオブロックの対応するサンプル値との間の差(例えば、絶対差または二乗差)に基づくことができる。動きベクトルの精緻化がブロックごと(またはサブブロックごと)に基づいて選択される実施形態では、予測誤差は、精緻化されたサンプル値とブロック(またはサブブロック)内の複数のサンプル位置にわたる対応する入力ビデオブロックのサンプル値との間の差の合計(例えば、絶対差または二乗差の合計)に基づくことができる。
【0109】
いくつかの実施形態では、符号化器は、予測残差を判定する際に812で生成された精緻化されたサンプル値を使用し得、その予測残差もビットストリームに符号化し得る。
【0110】
ビデオ復号化器によって実行される方法では、復号化器は、動き補償された予測に基づいて、サンプルの現在のブロック内の少なくとも第1のサンプル位置についての初期の予測されたサンプル値を取得する(814)。動きベクトルの精緻化は、例えばビットストリームから動きベクトルの精緻化を復号化することによって、少なくとも第1のサンプル位置について判定される(816)。サンプル値の空間的勾配は、第1のサンプル位置で判定される(818)。サンプル差値は、空間的勾配と動きベクトルの精緻化とのスカラー積を計算することによって判定される(820)。いくつかの実施形態では、サンプル差値の判定は、ビットストリームから復号化された精度情報に基づいてサンプル差値をスケーリングすることをさらに含み得る。初期の予測されたサンプル値は、サンプル差値に基づいて修正される(822)。例えば、サンプル差値を初期の予測されたサンプル値に追加して、精緻化されたサンプル値を生成し得る。
【0111】
いくつかの実施形態では、復号化器は、ビットストリームからの予測残差をさらに復号化し得、予測残差は、第1のサンプル位置で再構成されたサンプル値を判定する際に使用され得る。再構成されたサンプル値は、表示されるか、または表示のために別のディスプレイデバイスに通信され得る。
【0112】
例示的な通信システム。
図9は、通信システムの一例を示す図である。通信システム900は、符号化器902、通信ネットワーク904、および復号化器906を備え得る。符号化器902は、有線接続または無線接続であり得る接続908を介してネットワーク904と通信し得る。符号化器902は、図2Aのブロックベースのビデオ符号化器と同様であり得る。符号化器902は、単層コーデックまたは多層コーデックを含み得る。復号化器906は、有線接続または無線接続であり得る接続910を介してネットワーク904と通信し得る。復号化器906は、図2Bのブロックベースのビデオ復号化器と同様であり得る。復号化器906は、単層コーデックまたは多層コーデックを含み得る。
【0113】
符号化器902および/または復号化器906は、限定されるものではないが、デジタルテレビ、無線放送システム、ネットワーク要素/端末、コンテンツまたはウェブサーバなどのサーバ(ハイパーテキスト転送プロトコル(HTTP)サーバなど)、パーソナルデジタルアシスタント(PDA)、ラップトップまたはデスクトップコンピュータ、タブレットコンピュータ、デジタルカメラ、デジタル記録デバイス、ビデオゲームデバイス、ビデオゲームコンソール、携帯電話または衛星無線電話、デジタルメディアプレーヤなどの多種多様な有線通信デバイスおよび/または無線送信/受信ユニット(WTRU)に組み込まれ得る。
【0114】
通信ネットワーク904は、好適なタイプの通信ネットワークであり得る。例えば、通信ネットワーク904は、例えば、音声、データ、ビデオ、メッセージング、ブロードキャストなどのコンテンツを複数の無線ユーザに提供するマルチアクセスシステムであり得る。通信ネットワーク904は、複数の無線ユーザが、無線帯域幅を含むシステムリソースの共有を通じてそのようなコンテンツにアクセスすることを可能にし得る。例えば、通信ネットワーク904は、符号分割多重アクセス(CDMA)、時分割多重アクセス(TDMA)、周波数分割多重アクセス(FDMA)、直交FDMA(OFDMA)、シングルキャリアFDMA(SC-FDMA)などの1つ以上のチャネルアクセス方法を採用し得る。通信ネットワーク904は、複数の接続された通信ネットワークを含み得る。通信ネットワーク904は、インターネットおよび/または例えばセルラーネットワーク、WiFiホットスポット、インターネットサービスプロバイダ(ISP)ネットワークなどのような1つ以上のプライベート商用ネットワークを含み得る。
【0115】
追加の実施形態。
いくつかの実施形態によるブロックベースのビデオコーディング方法は、復号化器において、サンプルの現在のブロックでのサンプル値の動き補償された予測を生成することと、ビットストリームから、精度差値と現在のブロックについての動きベクトルの精緻化を復号化することと、現在のブロック内の予測されたサンプルごとに、サンプルでの空間的勾配を判定することと、空間的勾配と動きベクトルの精緻化とのスカラー積を計算することと、精度差値で示される量でスカラー積をスケーリングして、サンプル差値を生成することと、予測されたサンプル値にサンプル差値を追加して、精緻化されたサンプル値を生成することと、を含む。
【0116】
いくつかの実施形態では、現在のブロック内のサンプル値の動き補償された予測は、単一予測で生成される。
【0117】
いくつかの実施形態では、現在のブロック内のサンプル値の動き補償された予測は、二重予測を用いて生成される。
【0118】
いくつかの実施形態では、動きベクトルの精緻化は、インデックスとしてビットストリームで信号伝達される。インデックスは、(i,j)の形式の複数の動きベクトルの精緻化の1つを識別でき、ここで、iおよびjは整数である。インデックスは、(0,-1)、(1,0)、(0,1)および(-1,0)からなる群から複数の動きベクトルの精緻化の1つを識別できる。インデックスは、(0,-1)、(1,0)、(0,1)、(-1,0)、(-1,-1)、(1,-1)、(1,1)および(-1,1)からなる群から複数の動きベクトルの精緻化の1つを識別できる。
【0119】
いくつかの実施形態では、スカラー積のスケーリングは、スカラー積のビットシフトを含む。
【0120】
いくつかの実施形態では、精度差値はNであり、スカラー積のスケーリングは、信号伝達された精度差値Nと既存のMC精度の合計に等しいビット数だけスカラー積を右シフトすることを含む。
【0121】
いくつかの実施形態によるブロックベースのビデオコーディング方法は、符号化器で、入力ビデオブロックについて、サンプルの現在のブロックでのサンプル値の動き補償された予測を生成することと、精度差値を選択することと、サンプルでそれぞれの空間的勾配を判定することと、現在のブロックについての動きベクトルの精緻化を判定することであって、動きベクトルの精緻化が、(i)空間的勾配と動きベクトルの精緻化とのスカラー積と、(ii)入力ビデオブロックと動き補償された予測との間の差との間の誤差を実質的に最小化するように選択されている、判定することと、ビットストリームで、現在のブロックの精度差値と動きベクトルの精緻化を信号伝達することと、を含む。
【0122】
いくつかの実施形態では、現在のブロック内のサンプル値の動き補償された予測は、単一予測で生成される。
【0123】
いくつかの実施形態では、現在のブロック内のサンプル値の動き補償された予測は、二重予測を用いて生成される。
【0124】
いくつかの実施形態では、動きベクトルの精緻化は、インデックスとしてビットストリームで信号伝達される。インデックスは、(I,j)の形式の複数の動きベクトルの精緻化の1つを識別でき、ここで、iおよびjは整数である。インデックスは、(0,-1)、(1,0)、(0,1)および(-1,0)からなる群から複数の動きベクトルの精緻化の1つを識別できる。インデックスは、(0,-1)、(1,0)、(0,1)、(-1,0)、(-1,-1)、(1,-1)、(1,1)および(-1,1)からなる群から複数の動きベクトルの精緻化の1つを識別できる。
【0125】
いくつかの実施形態では、動きベクトルの精緻化は、(i)空間的勾配と動きベクトルの精緻化とのスカラー積と、(ii)入力ビデオブロックと動き補償された予測との間の差の間の二乗差の合計を実質的に最小化するように選択される。
【0126】
いくつかの実施形態は、本明細書に記載の機能のいずれかを実行するように動作するプロセッサおよび非一時的なコンピュータ可読媒体を備える。
【0127】
この開示では、ツール、特徴、実施形態、モデル、アプローチなどを含む多種多様な態様について説明する。これらの態様の多くは、特異的に説明されており、少なくとも個々の特性を示すために、限定的に聞こえ得るように説明されることがある。ただし、これは説明を明確にするためのものであり、これらの態様の開示または範囲を限定するものではない。実際、異なる態様のすべてを組み合わせ、かつ交換して、さらなる態様を提供することができる。さらに、これらの態様は、以前の出願で説明された態様と組み合わせ、かつ交換することもできる。
【0128】
本出願で説明および企図される態様は、多くの異なるフォーマットで実装することができる。いくつかの実施形態が具体的に示されているが、他の実施形態が企図されており、特定の実施形態の考察は、実装の幅を制限するものではない。これらの態様のうちの少なくとも1つは、概して、ビデオ符号化および復号化に関し、少なくとも1つの他の態様は、概して、生成または符号化されたビットストリームを送信することに関する。これらおよび他の態様は、方法、装置、説明された方法のいずれかに従ってビデオデータを符号化または復号化するための命令を記憶したコンピュータ可読記憶媒体、および/または説明された方法のいずれかに従って生成されるビットストリームを記憶したコンピュータ可読記憶媒体として実装することができる。
【0129】
本開示では、「再構築された」および「復号化された」という用語は同義的に使用され得、「ピクセル」および「サンプル」という用語は同義的に使用され得、「イメージ」、「画像」、および「フレーム」という用語は同義的に使用され得る。
【0130】
様々な方法が、本明細書に記載されており、それらの方法の各々は、説明された方法を達成するための1つ以上のステップまたは行為を含む。本方法の正しい動作のために特定の順序のステップまたは行為が必要でない限り、特定のステップおよび/または行為の順序および/または使用は、修正され得るか、または組み合わされ得る。さらに、「第1の」、「第2の」などの用語は、例えば「第1の復号化」および「第2の復号化」など、要素、構成要素、ステップ、動作などを修正するために様々な実施形態において使用されることができる。そのような用語の使用は、特に必要な場合を除き、修正された動作の順序を意味するものではない。したがって、この例では、第1の復号化は、第2の復号化の前に実行される必要はなく、例えば、第2の復号化との重複期間の前、最中、または重複する期間に発生し得る。
【0131】
例えば、本開示では、様々な数値が使用され得る。特定の値は、例示的な目的のためであり、記載された態様は、これらの特定の値に限定されるものではない。
【0132】
本明細書に記載の実施形態は、プロセッサまたは他のハードウェアによって実装されるコンピュータソフトウェアによって、またはハードウェアとソフトウェアの組み合わせによって実行され得る。非限定的な例として、実施形態は、1つ以上の集積回路によって実装され得る。プロセッサは、技術的環境に適切な任意のタイプのものであり得、非限定的な例として、マイクロプロセッサ、汎用コンピュータ、専用コンピュータ、およびマルチコアアーキテクチャに基づくプロセッサのうちの1つ以上を包含し得る。
【0133】
様々な実装形態は、復号化を伴う。本出願で使用される「復号化」は、例えば、受信された符号化されたシーケンスで実行されるプロセスのすべてまたは一部を包含して、表示に好適な最終出力を生成することができる。様々な実施形態では、そのようなプロセスは、復号化器によって通常実行されるプロセスのうちの1つ以上、例えば、エントロピー復号化、逆量子化、逆変換、および差分復号化を含む。様々な実施形態では、かかるプロセスはまた、または代替的に、本出願に記載の様々な実装形態の復号化器によって実行されるプロセス、例えば、タイル化された(パックされた)画像から画像を抽出することと、使用するアップサンプルフィルタを判定することと、次いで画像をアップサンプリングすることと、画像を意図した向きにフリップバックすることと、を含む。
【0134】
さらなる例として、一実施形態では、「復号化」は、エントロピー復号化のみを指し、別の実施形態では、「復号化」は、差分復号化のみを指し、別の実施形態では、「復号化」は、エントロピー復号化および差分復号化の組み合わせを指す。「復号化処理」という句が、具体的に動作のサブセットを指すことを意図しているか、または概してより広い復号化処理を指すことを意図しているかは、特定の説明の文脈に基づいて明確になり、当業者によって十分に理解されると考えられる。
【0135】
様々な実装形態は、符号化を伴う。「復号化」に関する上記の考察と同様に、本出願で使用される「符号化」は、例えば、符号化されたビットストリームを生成するために入力ビデオシーケンスで実行されるプロセスのすべてまたは一部を包含することができる。様々な実施形態では、そのようなプロセスは、典型的には、符号化器によって実行される1つ以上のプロセス、例えば、分割、差分符号化、変換、量子化、およびエントロピー符号化を含む。様々な実施形態では、このようなプロセスはまた、または代替的に、本出願で説明される様々な実装形態の符号化器によって実行されるプロセスを含む。
【0136】
さらなる例として、一実施形態では、「符号化」は、エントロピー符号化のみを指し、別の実施形態では、「符号化」は、差分符号化のみを指し、別の実施形態では、「符号化」は、差分符号化およびエントロピー符号化の組み合わせを指す。「符号化プロセス」という句が、具体的に動作のサブセットを指すことを意図しているか、または概してより広い符号化プロセスを指すことを意図しているかは、特定の説明の文脈に基づいて明確になり、当業者によって十分に理解されると考えられる。
【0137】
図がフロー図として提示されている場合、それは、対応する装置のブロック図も提供することを理解されたい。同様に、図がブロック図として提示されている場合、それは、対応する方法/プロセスのフロー図も提供することを理解されたい。
【0138】
様々な実施形態は、レート歪み最適化について言及する。特に、符号化プロセスの間、多くの場合に計算の複雑さの制約を考えて、レートと歪みとの間のバランスまたはトレードオフが、通常、考慮される。レート歪みの最適化は、通常、レートと歪みの加重和であるレート歪み関数を最小化するように定式化される。レート歪みの最適化問題を解決するには、様々なアプローチがある。例えば、アプローチは、考慮されるすべてのモードまたはコード化パラメータ値を含む、すべての符号化オプションの広範なテストに基づき得、コード化および復号化後の再構築された信号のコード化コストおよび関連する歪みの完全な評価を伴う。特に、再構築された信号ではなく、予測または予測残差信号に基づいて近似歪みを計算することによって、符号化の複雑さを軽減するために、より高速なアプローチを使用することもできる。可能な符号化オプションの一部にのみ近似歪みを使用し、他の符号化オプションに完全な歪みを使用することなどによって、これら2つのアプローチを組み合わせて使用することもできる。他のアプローチでは、可能な符号化オプションのサブセットのみを評価する。より一般的には、多くのアプローチが、最適化を実行するための様々な技術のうちのいずれかを採用するが、最適化は、必ずしもコード化コストおよび関連する歪みの両方の完全な評価ではない。
【0139】
本明細書で説明された実装形態および態様は、例えば、方法もしくはプロセス、装置、ソフトウェアプログラム、データストリーム、または信号に実装され得る。単一の実装形態の文脈でのみ考察された(例えば、方法としてのみ考察された)としても、考察された特徴の実装形態はまた、他の形態(例えば、装置またはプログラム)で実装することもできる。装置は、例えば、適切なハードウェア、ソフトウェア、およびファームウェアで実装することができる。それらの方法は、例えば、プロセッサ内に実装することができ、このプロセッサは、例えば、コンピュータ、マイクロプロセッサ、集積回路、またはプログラマブルロジックデバイスを含む処理デバイス全般を指す。プロセッサは、通信デバイス、例えば、コンピュータ、携帯電話、ポータブル/パーソナルデジタルアシスタンス(「PDA」)、およびエンドユーザ間の情報の通信を容易にする他のデバイスなども含む。
【0140】
「1つの実施形態」もしくは「一実施形態」、または「1つの実装形態」もしくは「一実装形態」、ならびにそれらの他の変形への言及は、実施形態に関連して説明された特定の特徴、構造、特性などが、少なくとも1つの実施形態に含まれることを意味する。したがって、本出願全体にわたって様々な箇所においてみられる、「1つの実施形態では」もしくは「一実施形態では」または「1つの実装形態では」もしくは「一実装形態では」という句、ならびに任意の他の変形の出現は、必ずしもすべてが同じ実施形態を指しているわけではない。
【0141】
さらに、本開示は、情報の様々な部分を「判定する」ことに言及する場合がある。情報の判定には、例えば、情報の評価、情報の計算、情報の予測、またはメモリからの情報の検索のうちの1つ以上が含まれ得る。
【0142】
さらに、本出願は、情報の様々な部分に「アクセスする」ことに言及し得る。情報のアクセスには、例えば、情報の受信、(例えば、メモリからの)情報の検索、情報の記憶、情報の移動、情報のコピー、情報の計算、情報の判定、情報の予測、または情報の評価のうちの1つ以上が含まれ得る。
【0143】
さらに、本出願は、情報の様々な部分を「受信すること」に言及し得る。受信することは、「アクセスすること」と同様に、広義の用語であることが意図されている。情報の受信には、例えば、情報へのアクセス、または(例えば、メモリからの)情報の検索のうちの1つ以上が含まれ得る。さらに、「受信すること」は、典型的には、何らかの方法で、例えば、情報の記憶、情報の処理、情報の送信、情報の移動、情報のコピー、情報の消去、情報の計算、情報の判定、情報の予測、または情報の評価などの動作中に伴う。
【0144】
例えば、「A/B」、「Aおよび/またはB」、ならびに「AおよびBのうちの少なくとも1つ」の場合、次の「/」、「および/または」、ならびに「のうちの少なくとも1つ」のいずれかの使用は、1番目に列記されたオプション(A)のみの選択、または2番目に列記されたオプション(B)のみの選択、または両方のオプション(AおよびB)の選択を網羅することを意図していることが分かるはずである。さらなる例として、「A、B、および/またはC」ならびに「A、B、およびCのうちの少なくとも1つ」の場合、そのような言い回しは、1番目に列記されたオプション(A)のみの選択、または2番目に列記されたオプション(B)のみの選択、または3番目に列記されたオプション(C)のみの選択、または1番目および2番目に列記されたオプション(AおよびB)のみの選択、または1番目および3番目に列記されたオプション(AおよびC)のみの選択、または2番目および3番目に列記されたオプション(BおよびC)のみの選択、または3つすべてのオプション(AおよびBおよびC)の選択、を網羅することを意図している。これは、リストされている多くのアイテムに拡張され得る。
【0145】
また、本明細書で使用される場合、「信号伝達する」という単語は、とりわけ、対応する復号化器に何かを指示することを指す。例えば、特定の実施形態では、符号化器は、リファインメントのための複数のパラメータのうちの特定の1つを信号伝達する。このようにして、実施形態では、同じパラメータが、符号化器側および復号化器側の両方で使用される。したがって、例えば、符号化器は、特定のパラメータを復号化器に送信することができ(明示的な信号伝達)、その結果、復号化器は、同じ特定のパラメータを使用することができる。逆に、復号化器が既に特定のパラメータならびに他のパラメータを有する場合、信号伝達は、送信(暗黙的な信号伝達)を行わずに使用されて、復号化器が簡単に特定のパラメータを認識および選択することを可能にすることができる。いかなる実際の機能の送信も回避することによって、ビットの節約が、様々な実施形態で実現される。信号伝達は、様々な方法で達成できることが分かるはずである。例えば、1つ以上の構文要素、フラグなどが、様々な実施形態で、対応する復号化器に情報を信号伝達するために使用される。上記は、「信号伝達する」という単語の動詞形に関するものであるが、「信号伝達」という単語はまた、本明細書では、名詞として使用することもできる。
【0146】
実装形態は、例えば、記憶または送信され得る情報を搬送するようにフォーマットされる様々な信号を生成することができる。情報は、例えば、方法を実行するための命令、または説明される実装形態のうちの1つにより生成されたデータを含むことができる。例えば、信号は、説明された実施形態のビットストリームを搬送するようにフォーマットされ得る。このような信号は、例えば、(例えば、スペクトルの無線周波数部分を使用する)、電磁波として、またはベースバンド信号としてフォーマットすることができる。フォーマットすることは、例えば、データストリームを符号化することと、搬送波を符号化データストリームで変調することと、を含むことができる。信号が搬送する情報は、例えば、アナログまたはデジタル情報であり得る。信号は、既知であるように、様々な異なる有線または無線リンクを介して送信することができる。信号は、プロセッサ可読媒体上に記憶することができる。
【0147】
いくつかの実施形態について説明する。これらの実施形態の特徴は、様々な請求項のカテゴリおよびタイプにわたって、単独で、または任意の組み合わせで提供することができる。さらに、実施形態は、様々な請求項のカテゴリおよびタイプにわたって、単独でまたは任意の組み合わせで、以下の特徴、デバイス、または態様のうちの1つ以上を含むことができる。
・記載された実施形態のいずれかに従って生成された情報を伝達する構文を含むビットストリームまたは信号。
・記載された実施形態のいずれかに従って作成および/または送信および/または受信および/または復号化。
・記載された実施形態のいずれかに従って、方法、プロセス、装置、命令を記憶する媒体、データを記憶する媒体、または信号。
・記載された実施形態のうちのいずれかに従って、符号化または復号化方法を実行するTV、セットトップボックス、携帯電話、タブレット、または他の電子デバイス。
・記載された実施形態のうちのいずれかに従って、復号化方法を実行し、かつ結果として得られるイメージを(例えば、モニタ、スクリーン、または他のタイプのディスプレイを使用して)表示するTV、セットトップボックス、携帯電話、タブレット、または他の電子デバイス。
・記載された実施形態のうちのいずれかに従って、符号化されたイメージを含む信号を受信するためにチャネルを選択し(例えば、チューナを使用して)、かつ復号化を実行するTV、セットトップボックス、携帯電話、タブレット、または他の電子デバイス。
・記載された実施形態のうちのいずれかに従って、符号化されたイメージを含む信号を無線で(例えば、アンテナを使用して)受信し、かつ復号化を実行するTV、セットトップボックス、携帯電話、タブレット、または他の電子デバイス。
【0148】
説明された実施形態のうちの1つ以上の様々なハードウェア要素は、それぞれのモジュールに関連して本明細書で説明される様々な機能を実行する(すなわち、行う、実施など)「モジュール」と称されることに留意されたい。本明細書で使用される場合、モジュールは、所与の実装に対して関連技術の当業者によって好適であると見なされるハードウェア(例えば、1つ以上のプロセッサ、1つ以上のマイクロプロセッサ、1つ以上のマイクロコントローラ、1つ以上のマイクロチップ、1つ以上の特定用途向け集積回路(ASIC)、1つ以上のフィールドプログラマブルゲートアレイ(FPGA)、1つ以上のメモリデバイス)を含む。記載された各モジュールはまた、それぞれのモジュールによって実行されると記載された1つ以上の機能を実行するために実行可能な命令を含み得、これらの命令は、ハードウェア(すなわち、ハードワイヤード)命令、ファームウェア命令、ソフトウェア命令などの形態を採り得るか、一般にRAM、ROMなどと称される任意の好適な非一時的なコンピュータ可読媒体(複数可)に格納され得ることに留意されたい。
【0149】
特徴および要素が特定の組み合わせで上記に説明されているが、当業者は、各特徴または要素が単独で、または他の特徴および要素と任意の組み合わせで使用され得ることを理解するであろう。さらに、本明細書に記載の方法は、コンピュータまたはプロセッサによって実行するために、コンピュータ可読媒体に組み込まれたコンピュータプログラム、ソフトウェア、またはファームウェアに実装され得る。コンピュータ可読記憶媒体の例は、読み取り専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、レジスタ、キャッシュメモリ、半導体メモリデバイス、内蔵ハードディスクおよび取り外し可能なディスクなどの磁気媒体、磁気光学媒体、CD-ROMディスクなどの光学媒体、ならびにデジタル多用途ディスク(DVD)を含むが、これらに限定されるものではない。ソフトウェアに関連するプロセッサを使用して、WTRU、UE、端末、基地局、RNC、または任意のホストコンピュータで使用するための無線周波数トランシーバを実装し得る。
図1A
図1B
図1C
図2A
図2B
図3A
図3B
図4A
図4B
図5
図6
図7
図8
図9
【手続補正書】
【提出日】2024-09-13
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
ビデオ符号化方法であって、
サンプルの現在のブロック又はサブブロックにおける複数のサンプル位置のそれぞれについて、動き補償された予測に基づいて、初期の予測されたサンプル値を取得することと、
動きベクトルの精緻化を判定することであって、前記動きベクトルの精緻化は、前記サンプルの現在のブロック又はサブブロックにおける前記複数のサンプル位置の全てについて、同じ値を有する、ことと、
前記複数のサンプル位置の各々において、サンプル値の空間的勾配を判定することと、
前記複数のサンプル位置の各々について、前記空間的勾配と前記動きベクトルの精緻化とのスカラー積に基づいて、サンプル差値を判定することと、
前記サンプル差値に基づいて前記初期の予測されたサンプル値を修正することと、
を含む、方法。
【請求項2】
前記動きベクトルの精緻化を判定することは、前記動きベクトルの精緻化を選択して、入力ビデオブロックに関する予測誤差を実質的に最小化することを含み、
前記方法は、前記動きベクトルの精緻化をビットストリームで信号伝達することを更に含む、請求項1に記載の方法。
【請求項3】
前記動きベクトルの精緻化を判定することは、前記動きベクトルの精緻化を選択して、入力ビデオブロックに関する予測誤差を実質的に最小化することを含み、
前記方法は、前記動きベクトルの精緻化をビットストリームで信号伝達することを更に含み、
前記動きベクトルの精緻化がインデックスとして前記ビットストリームで信号伝達される、請求項1に記載の方法。
【請求項4】
ビデオ復号化方法であって、
サンプルの現在のブロック又はサブブロックにおける複数のサンプル位置のそれぞれについて、動き補償された予測に基づいて、初期の予測されたサンプル値を取得することと、
動きベクトルの精緻化を判定することであって、前記動きベクトルの精緻化は、前記サンプルの現在のブロック又はサブブロックにおける前記複数のサンプル位置の全てについて、同じ値を有する、ことと、
前記複数のサンプル位置の各々において、サンプル値の空間的勾配を判定することと、
前記複数のサンプル位置の各々について、前記空間的勾配と前記動きベクトルの精緻化とのスカラー積に基づいて、サンプル差値を判定することと、
前記サンプル差値に基づいて前記初期の予測されたサンプル値を修正することと、
を含む、方法。
【請求項5】
前記動きベクトルの精緻化を判定することは、ビットストリームから前記動きベクトルの精緻化を復号化することを含む、請求項4に記載の方法。
【請求項6】
前記動きベクトルの精緻化を判定することは、ビットストリームから前記動きベクトルの精緻化を復号化することを含み、前記動きベクトルの精緻化がインデックスとしてビットストリームで信号伝達される、請求項4に記載の方法。
【請求項7】
ビットストリームからの精緻化精度情報を復号化することをさらに含み、サンプル差値を判定することは、精度情報によって示される量によってスカラー積をスケーリングすることを含む、請求項4に記載の方法。
【請求項8】
ビットストリームからの精緻化精度情報を復号化することをさらに含み、サンプル差値を判定することは、精度情報によって示される量だけスカラー積をビットシフトすることを含む、請求項4に記載の方法。
【請求項9】
ビットストリームからの精緻化精度情報を復号化することをさらに含み、動き補償された予測は、初期の精度を有する少なくとも1つの動きベクトルを使用して実行され、精緻化精度情報は、初期の精度と精緻化精度との間の差を表す精度差値を含み、サンプル差値を判定することは、精度情報によって示される量によってスカラー積をスケーリングすることを含む、請求項4に記載の方法。
【請求項10】
ビデオ符号化装置であって、
サンプルの現在のブロック又はサブブロックにおける複数のサンプル位置のそれぞれについて、動き補償された予測に基づいて、初期の予測されたサンプル値を取得することと、
動きベクトルの精緻化を判定することであって、前記動きベクトルの精緻化は、前記サンプルの現在のブロック又はサブブロックにおける前記複数のサンプル位置の全てについて、同じ値を有する、ことと、
前記複数のサンプル位置の各々において、サンプル値の空間的勾配を判定することと、
前記複数のサンプル位置の各々について、前記空間的勾配と前記動きベクトルの精緻化とのスカラー積に基づいて、サンプル差値を判定することと、
前記サンプル差値に基づいて前記初期の予測されたサンプル値を修正することと、
を行うように構成されたプロセッサを備える、ビデオ符号化装置。
【請求項11】
前記動きベクトルの精緻化を判定することは、前記動きベクトルの精緻化を選択して、入力ビデオブロックに関する予測誤差を実質的に最小化することを含み、
前記動きベクトルの精緻化をビットストリームで信号伝達することを更に含む、請求項10に記載のビデオ符号化装置。
【請求項12】
前記動きベクトルの精緻化を判定することは、前記動きベクトルの精緻化を選択して、入力ビデオブロックに関する予測誤差を実質的に最小化することを含み、
前記動きベクトルの精緻化をビットストリームで信号伝達することを更に含み、
前記動きベクトルの精緻化がインデックスとして前記ビットストリームで信号伝達される、請求項10に記載のビデオ符号化装置。
【請求項13】
ビットストリームからの精緻化精度情報を復号化することをさらに含み、動き補償された予測は、初期の精度を有する少なくとも1つの動きベクトルを使用して実行され、精緻化精度情報は、初期の精度と精緻化精度との間の差を表す精度差値を含み、サンプル差値を判定することは、精度情報によって示される量によってスカラー積をスケーリングすることを含む、請求項10に記載のビデオ符号化装置。
【請求項14】
ビデオ復号化装置であって、
サンプルの現在のブロック又はサブブロックにおける複数のサンプル位置のそれぞれについて、動き補償された予測に基づいて、初期の予測されたサンプル値を取得することと、
動きベクトルの精緻化を判定することであって、前記動きベクトルの精緻化は、前記サンプルの現在のブロック又はサブブロックにおける前記複数のサンプル位置の全てについて、同じ値を有する、ことと、
前記複数のサンプル位置の各々において、サンプル値の空間的勾配を判定することと、
前記複数のサンプル位置の各々について、前記空間的勾配と前記動きベクトルの精緻化とのスカラー積に基づいて、サンプル差値を判定することと、
前記サンプル差値に基づいて前記初期の予測されたサンプル値を修正することと、
を行うように構成されたプロセッサを備える、ビデオ復号化装置。
【請求項15】
前記動きベクトルの精緻化を判定することは、ビットストリームから前記動きベクトルの精緻化を復号化することを含む、請求項14に記載のビデオ復号化装置。
【請求項16】
前記動きベクトルの精緻化を判定することは、ビットストリームから前記動きベクトルの精緻化を復号化することを含み、前記動きベクトルの精緻化がインデックスとしてビットストリームで信号伝達される、請求項14に記載のビデオ復号化装置。
【請求項17】
ビットストリームからの精緻化精度情報を復号化することをさらに含み、サンプル差値を判定することは、精度情報によって示される量によってスカラー積をスケーリングすることを含む、請求項14に記載のビデオ復号化装置。
【請求項18】
ビットストリームからの精緻化精度情報を復号化することをさらに含み、サンプル差値を判定することは、精度情報によって示される量だけスカラー積をビットシフトすることを含む、請求項14に記載のビデオ復号化装置。
【請求項19】
ビットストリームからの精緻化精度情報を復号化することをさらに含み、動き補償された予測は、初期の精度を有する少なくとも1つの動きベクトルを使用して実行され、精緻化精度情報は、初期の精度と精緻化精度との間の差を表す精度差値を含み、サンプル差値を判定することは、精度情報によって示される量によってスカラー積をスケーリングすることを含む、請求項14に記載のビデオ復号化装置。
【請求項20】
サンプルの現在のブロック又はサブブロックにおける複数のサンプル位置のそれぞれについて、動き補償された予測に基づいて、初期の予測されたサンプル値を取得することと、
動きベクトルの精緻化を判定することであって、前記動きベクトルの精緻化は、前記サンプルの現在のブロック又はサブブロックにおける前記複数のサンプル位置の全てについて、同じ値を有する、ことと、
前記複数のサンプル位置の各々において、サンプル値の空間的勾配を判定することと、
前記複数のサンプル位置の各々について、前記空間的勾配と前記動きベクトルの精緻化とのスカラー積に基づいて、サンプル差値を判定することと、
前記サンプル差値に基づいて前記初期の予測されたサンプル値を修正することと、
を一つ以上のプロセッサに実行させるための命令を含む、コンピュータ読み取り可能な記録媒体。
【外国語明細書】