IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ オーピー ソリューションズ, エルエルシーの特許一覧

特許7498502延長された長期参照ピクチャ保持の明示的信号伝達
<>
  • 特許-延長された長期参照ピクチャ保持の明示的信号伝達 図1
  • 特許-延長された長期参照ピクチャ保持の明示的信号伝達 図2
  • 特許-延長された長期参照ピクチャ保持の明示的信号伝達 図3
  • 特許-延長された長期参照ピクチャ保持の明示的信号伝達 図4
  • 特許-延長された長期参照ピクチャ保持の明示的信号伝達 図5
  • 特許-延長された長期参照ピクチャ保持の明示的信号伝達 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-06-04
(45)【発行日】2024-06-12
(54)【発明の名称】延長された長期参照ピクチャ保持の明示的信号伝達
(51)【国際特許分類】
   H04N 19/52 20140101AFI20240605BHJP
【FI】
H04N19/52
【請求項の数】 22
(21)【出願番号】P 2021543479
(86)(22)【出願日】2020-01-28
(65)【公表番号】
(43)【公表日】2022-05-11
(86)【国際出願番号】 US2020015414
(87)【国際公開番号】W WO2020159993
(87)【国際公開日】2020-08-06
【審査請求日】2022-01-11
(31)【優先権主張番号】62/797,806
(32)【優先日】2019-01-28
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】521328755
【氏名又は名称】オーピー ソリューションズ, エルエルシー
(74)【代理人】
【識別番号】100078282
【弁理士】
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【弁理士】
【氏名又は名称】森下 夏樹
(74)【代理人】
【識別番号】100181674
【弁理士】
【氏名又は名称】飯田 貴敏
(74)【代理人】
【識別番号】100181641
【弁理士】
【氏名又は名称】石川 大輔
(74)【代理人】
【識別番号】230113332
【弁護士】
【氏名又は名称】山本 健策
(72)【発明者】
【氏名】ファート, ボリヴォイェ
(72)【発明者】
【氏名】カルバ, ハリ
(72)【発明者】
【氏名】アジッチ, ヴェリボール
【審査官】田部井 和彦
(56)【参考文献】
【文献】特表2015-526026(JP,A)
【文献】特表2015-501098(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 19/52
(57)【特許請求の範囲】
【請求項1】
デコーダであって、前記デコーダは、回路を備え、前記回路は、
ビットストリームを受信することと、
参照リスト内に複数の長期参照フレームを記憶することと、
保持時間に基づく時間の長さにわたって前記参照リスト内に長期参照フレームを保持することと、
前記参照リスト内に保持されている前記長期参照フレームを使用して、ビデオの少なくとも一部をデコードすることと
を行うように構成され、前記記憶されている長期参照フレーム内の各長期参照フレームは、関連付けられる保持時間を含む、デコーダ。
【請求項2】
前記長期参照フレームが少なくとも前記保持時間にわたって前記参照リスト内に常駐した後、前記長期参照フレームを利用不可能としてマーキングするようにさらに構成される、請求項1に記載のデコーダ。
【請求項3】
前記ビットストリーム内の信号に基づいて、前記長期参照フレームを利用可能としてマーキングするようにさらに構成される、請求項2に記載のデコーダ。
【請求項4】
前記ビットストリームは、メモリから前記長期参照フレームを除去するための信号を含む、請求項1に記載のデコーダ。
【請求項5】
前記信号に基づいて前記参照リストから前記長期参照フレームを除去するようにさらに構成される、請求項4に記載のデコーダ。
【請求項6】
前記ビットストリームを受信し、前記ビットストリームを量子化された係数にデコードするように構成されるエントロピーデコーダプロセッサと、
逆離散コサインを実施することを含め、前記量子化された係数を処理するように構成される逆量子化および逆変換プロセッサと、
デブロッキングフィルタと、
フレームバッファと、
イントラ予測プロセッサと
をさらに備える、請求項1に記載のデコーダ。
【請求項7】
コーディングされたブロックを受信することと、
インター予測モードが前記コーディングされたブロックに関して有効化されると決定することと、
参照フレームとして前記長期参照フレームを使用して、かつ前記インター予測モードに従って、デコードされたブロックを決定することと
を行うようにさらに構成される、請求項1に記載のデコーダ。
【請求項8】
前記デコードされたブロックは、クアッドツリープラスバイナリディシジョンツリーの一部を形成する、請求項7に記載のデコーダ。
【請求項9】
前記デコードされたブロックは、前記クアッドツリープラスバイナリディシジョンツリーの非リーフノードである、請求項8に記載のデコーダ。
【請求項10】
方法であって、前記方法は、
デコーダが、ビットストリームを受信することと、
前記デコーダが、参照リスト内に複数の長期参照フレームを記憶することと、
前記デコーダが、保持時間に基づく時間の長さにわたって前記参照リスト内に長期参照フレームを保持することと、
前記デコーダが、前記参照リスト内に保持されている前記長期参照フレームを使用して、ビデオの少なくとも一部をデコードすることと
を含み、前記記憶されている長期参照フレーム内の各長期参照フレームは、関連付けられる保持時間を含む、方法。
【請求項11】
前記長期参照フレームが少なくとも前記保持時間にわたって前記参照リスト内に常駐した後、前記長期参照フレームを利用不可能としてマーキングすることをさらに含む、請求項10に記載の方法。
【請求項12】
前記ビットストリーム内の信号に基づいて、前記長期参照フレームを利用可能としてマーキングすることをさらに含む、請求項11に記載の方法。
【請求項13】
前記ビットストリームは、メモリから前記長期参照フレームを除去するための信号を含む、請求項10に記載の方法。
【請求項14】
前記信号に基づいて、前記参照リストから前記長期参照フレームを除去することをさらに含む、請求項13に記載の方法。
【請求項15】
前記デコーダはさらに、
前記ビットストリームを受信し、前記ビットストリームを量子化された係数にデコードするように構成されるエントロピーデコーダプロセッサと、
逆離散コサインを実施することを含め、前記量子化された係数を処理するように構成される逆量子化および逆変換プロセッサと、
デブロッキングフィルタと、
フレームバッファと、
イントラ予測プロセッサと
を備える、請求項10に記載の方法。
【請求項16】
コーディングされたブロックを受信することと、
インター予測モードが前記コーディングされたブロックに関して有効化されることを決定することと、
参照フレームとして前記長期参照フレームを使用して、かつ前記インター予測モードに従って、デコードされたブロックを決定することと
をさらに含む、請求項10に記載の方法。
【請求項17】
前記デコードされたブロックは、クアッドツリープラスバイナリディシジョンツリーの一部を形成する、請求項16に記載の方法。
【請求項18】
前記デコードされたブロックは、前記クアッドツリープラスバイナリディシジョンツリーの非リーフノードである、請求項17に記載の方法。
【請求項19】
デコーダであって、前記デコーダは、
信号伝達情報と複数のコーディングされたピクチャとを含むビットストリームを受信することであって、前記複数のコーディングされたピクチャは、長期参照ピクチャとして使用されるピクチャと、第1のコーディングされたピクチャと、第2のコーディングされたピクチャと、後続のコーディングされたピクチャとを含み、前記長期参照ピクチャとして使用されるピクチャは、IDRピクチャとしてマーキングされている、ことと、
前記長期参照ピクチャとして使用されるピクチャと、前記第1のコーディングされたピクチャと前記第2のコーディングされたピクチャと、前記後続のコーディングされたピクチャを含む前記複数のコーディングされたピクチャをデコードし、前記デコードされた複数のコーディングされたピクチャをデコード済ピクチャバッファに記憶することであって、前記デコードすることは、
前記デコード済ピクチャバッファ内の前記デコードされた複数のコーディングされたピクチャから照ピクチャの第1のリストを形成することによって、前記第1のコーディングされたピクチャをデコードすることであって、前記照ピクチャの第1のリスト内の1つのピクチャが前記長期参照ピクチャであることと、前記長期参照クチャを使用して前記第1のコーディングされたピクチャのブロックをデコードすることと、
前記信号伝達情報内の少なくとも1つのパラメータに応答して、前記長期参照ピクチャを前記デコード済ピクチャバッファ内に記憶し続けながら、前記長期参照ピクチャが参照ピクチャとして利用不可能であることを示すことと、
参照ピクチャとして利用不可能であると示された前記長期参照ピクチャを使用することなく、前記第2のコーディングされたピクチャをデコードすること
前記信号伝達情報内の少なくとも1つのパラメータに応答して、参照ピクチャの後続のリスト内の前記長期参照ピクチャのインジケーションを参照ピクチャとして利用不可能から利用可能に変更することと、
記長期参照クチャを使用して前記後続のコーディングされたピクチャからのブロックをデコードすることと
を含む、ことと
を行うように構成されている、デコーダ。
【請求項20】
前記長期参照ピクチャを参照のために未使用としてマーキングし、前記長期参照ピクチャを前記デコード済ピクチャバッファから除去するようにさらに構成されている、請求項19に記載のデコーダ。
【請求項21】
前記パラメータは、時間関連パラメータである、請求項19に記載のデコーダ。
【請求項22】
前記ビットストリームは、シングルビュービットストリームである、請求項19に記載のデコーダ。
【発明の詳細な説明】
【技術分野】
【0001】
本願は、2019年1月28日に出願され「EXPLICIT SIGNALING OF EXTENDED LONG TERM REFERENCE PICTURE RETENTION」と題された米国仮特許出願第62/797,806号の優先権の利益を主張し、これは、参照することによってその全体として本明細書に援用される。
【0002】
本発明は、概して、ビデオ圧縮の分野に関する。具体的には、本発明は、延長された長期参照ピクチャ保持の明示的信号伝達を対象とする。
【背景技術】
【0003】
ビデオコーデックは、デジタルビデオを圧縮または解凍する電子回路またはソフトウェアを含み得る。それは、圧縮されていないビデオを圧縮されたフォーマットに変換することができ、逆もまた同様である。ビデオ圧縮の文脈において、ビデオを圧縮する(および/またはそのうちのいくつかの機能を実施する)デバイスは、典型的には、エンコーダと呼ばれ得、ビデオを解凍する(および/またはそのうちのいくつかの機能を実施する)デバイスは、デコーダと呼ばれ得る。
【0004】
圧縮されたデータのフォーマットは、標準的なビデオ圧縮仕様に適合することができる。圧縮は、圧縮されたビデオが元のビデオの中に存在するある情報を欠く点で非可逆的であり得る。この結果は、元のビデオを正確に再構築するために不十分な情報しか存在しないので、解凍されたビデオが元の圧縮されていないビデオより低い品質を有し得ることを含み得る。
【0005】
ビデオ品質と、ビデオを表現するために使用される(例えば、ビットレートによって決定される)データ量と、エンコーディングアルゴリズムおよびデコーディングアルゴリズムの複雑性と、データ損失ならびに誤差に対する感度と、編集のし易さと、ランダムアクセスと、エンドツーエンド遅延(例えば、待機時間)と、同等物との間に、複雑な関係が存在し得る。
【0006】
動き補償は、ビデオにおけるカメラおよび/またはオブジェクトの動きを考慮することによって、以前および/または将来のフレーム等の参照フレームを前提として、ビデオフレームまたはその一部を予測するためのアプローチを含み得る。これは、ビデオ圧縮のためのビデオデータのエンコーディングおよびデコーディングにおいて、例えば、動画専門家集団(MPEG)-2(アドバンスドビデオコーディング(AVC)およびH.264とも称される)規格を使用するエンコーディングおよびデコーディングにおいて採用されることができる。動き補償は、参照ピクチャの現在のピクチャへの変換の観点からピクチャを記述することができる。参照ピクチャは、現在のピクチャと比較すると時間的に以前のものであるか、現在のピクチャと比較すると将来からのものであるか、または長期参照(LTR)フレームを含むことができる。画像が、以前に伝送され、かつ/または記憶されている画像から正確に合成されることができるとき、圧縮効率は、改良されることができる。
【0007】
長期参照(LTR)フレームは、MPEG-2、H.264(AVCまたはMPEG-4 Part10とも称される)、およびH.265(高効率ビデオコーディング(HEVC)とも称される)等のビデオコーディング規格において使用されている。ビデオビットストリーム内のLTRフレームとしてマーキングされるフレームは、これがビットストリーム信号伝達によって明示的に除去されるまで、参照としての使用のために利用可能である。LTRフレームは、長い周期にわたって静的背景(例えば、ビデオ会議における背景または駐車場監視のビデオ)を有する場面における予測および圧縮効率を改良する。しかしながら、経時的に、場面の背景は、徐々に変化する(例えば、空いたスポットに自動車が駐車されると、自動車が背景場面の一部になる)。したがって、LTRフレームを更新することは、より良好な予測を可能にすることによって圧縮性能を改良する。
【0008】
H.264およびH.265等の現在の規格は、新たにデコードされたフレームを信号伝達することによるLTRフレームの更新が、保存され、参照フレームとして利用可能にされることを可能にする。そのような更新は、エンコーダによって信号伝達され、フレーム全体が更新される。しかし、フレーム全体を更新することは、コストがかかり得る。また、LTRフレームが更新されるとき、前のLTRフレームは破棄される。前の破棄されたLTRフレームと関連付けられる静的背景がビデオ内で再び生じる場合(例えば、第1の場面から第2の場面に、次いで、第1の場面に戻るように切り替わるビデオ内等)、前のLTRフレームは、ビットストリーム内で再びエンコードされなければならず、これは、圧縮効率を低減させる。
【発明の概要】
【課題を解決するための手段】
【0009】
ある側面では、デコーダは、回路を含み、回路は、ビットストリームを受信することと、参照リスト内に複数の長期参照フレームを記憶することと、保持時間に基づく時間の長さにわたって参照リスト内に長期参照フレームを保持することと、参照リスト内に保持される長期参照フレームを使用して、ビデオの少なくとも一部をデコードすることとを行うように構成される。
【0010】
別の側面では、方法は、デコーダがビットストリームを受信することを含む。方法は、デコーダが参照リスト内に複数の長期参照フレームを記憶することを含む。方法は、デコーダが保持時間に基づく時間の長さにわたって参照リスト内に長期参照フレームを保持することを含む。方法は、デコーダが参照リスト内に保持される長期参照フレームを使用してビデオの少なくとも一部をデコードすることを含む。
【0011】
本明細書に説明される主題の1つ以上の変形例の詳細が、付随の図面および下記の説明に記載される。本明細書に説明される主題の他の特徴および利点が、説明および図面から、ならびに請求項から明白となるであろう。
本発明は、例えば、以下の項目を提供する。
(項目1)
デコーダであって、前記デコーダは、回路を備え、前記回路は、
ビットストリームを受信することと、
参照リスト内に複数の長期参照フレームを記憶することと、
保持時間に基づく時間の長さにわたって前記参照リスト内に長期参照フレームを保持することと、
前記参照リスト内に保持されている前記長期参照フレームを使用して、ビデオの少なくとも一部をデコードすることと
を行うように構成される、デコーダ。
(項目2)
前記記憶されている長期参照フレーム内の各長期参照フレームは、関連付けられる保持時間を含む、項目1に記載のデコーダ。
(項目3)
前記長期参照フレームが少なくとも前記保持時間にわたって前記参照リスト内に常駐した後、前記長期参照フレームを利用不可能としてマーキングするようにさらに構成される、項目1に記載のデコーダ。
(項目4)
前記ビットストリーム内の信号に基づいて、前記長期参照フレームを利用可能としてマーキングするようにさらに構成される、項目3に記載のデコーダ。
(項目5)
前記ビットストリームは、メモリから前記長期参照フレームを除去するための信号を含む、項目1に記載のデコーダ。
(項目6)
前記信号に基づいて前記参照リストから前記長期参照フレームを除去するようにさらに構成される、項目5に記載のデコーダ。
(項目7)
前記ビットストリームを受信し、前記ビットストリームを量子化された係数にデコードするように構成されるエントロピーデコーダプロセッサと、
逆離散コサインを実施することを含め、前記量子化された係数を処理するように構成される逆量子化および逆変換プロセッサと、
デブロッキングフィルタと、
フレームバッファと、
イントラ予測プロセッサと
をさらに備える、項目1に記載のデコーダ。
(項目8)
コーディングされたブロックを受信することと、
インター予測モードが前記コーディングされたブロックに関して有効化されると決定することと、
参照フレームとして前記長期参照フレームを使用して、かつ前記インター予測モードに従って、デコードされたブロックを決定することと
を行うようにさらに構成される、項目1に記載のデコーダ。
(項目9)
前記デコードされたブロックは、クアッドツリープラスバイナリディシジョンツリーの一部を形成する、項目8に記載のデコーダ。
(項目10)
前記デコードされたブロックは、前記クアッドツリープラスバイナリディシジョンツリーの非リーフノードである、項目8に記載のデコーダ。
(項目11)
方法であって、前記方法は、
デコーダが、ビットストリームを受信することと、
前記デコーダが、参照リスト内に複数の長期参照フレームを記憶することと、
前記デコーダが、保持時間に基づく時間の長さにわたって前記参照リスト内に長期参照フレームを保持することと、
前記デコーダが、前記参照リスト内に保持されている前記長期参照フレームを使用して、ビデオの少なくとも一部をデコードすることと
を含む、方法。
(項目12)
前記記憶されている長期参照フレーム内の各長期参照フレームは、関連付けられる保持時間を含む、項目11に記載の方法。
(項目13)
前記長期参照フレームが少なくとも前記保持時間にわたって前記参照リスト内に常駐した後、前記長期参照フレームを利用不可能としてマーキングすることをさらに含む、項目11に記載の方法。
(項目14)
前記ビットストリーム内の信号に基づいて、前記長期参照フレームを利用可能としてマーキングすることをさらに含む、項目13に記載の方法。
(項目15)
前記ビットストリームは、メモリから前記長期参照フレームを除去するための信号を含む、項目11に記載の方法。
(項目16)
前記信号に基づいて、前記参照リストから前記長期参照フレームを除去することをさらに含む、項目15に記載の方法。
(項目17)
前記デコーダはさらに、
前記ビットストリームを受信し、前記ビットストリームを量子化された係数にデコードするように構成されるエントロピーデコーダプロセッサと、
逆離散コサインを実施することを含め、前記量子化された係数を処理するように構成される逆量子化および逆変換プロセッサと、
デブロッキングフィルタと、
フレームバッファと、
イントラ予測プロセッサと
を備える、項目11に記載の方法。
(項目18)
コーディングされたブロックを受信することと、
インター予測モードが前記コーディングされたブロックに関して有効化されることを決定することと、
参照フレームとして前記長期参照フレームを使用して、かつ前記インター予測モードに従って、デコードされたブロックを決定することと
をさらに含む、項目11に記載の方法。
(項目19)
前記デコードされたブロックは、クアッドツリープラスバイナリディシジョンツリーの一部を形成する、項目18に記載の方法。
(項目20)
前記デコードされたブロックは、前記クアッドツリープラスバイナリディシジョンツリーの非リーフノードである、項目18に記載の方法。
【図面の簡単な説明】
【0012】
本発明を例証する目的のために、図面は、本発明の1つ以上の実施形態の側面を示す。しかしながら、本発明が図面に示される精密な配列および手段に限定されないことを理解されたい。
図1図1は、長い期間にわたるフレーム予測に関するある例示的参照リストを例証する。
【0013】
図2図2は、eLTRフレームが参照リスト内に保持される延長された長期参照(eLTR)フレーム保持のある例示的プロセスを例証するプロセスフロー図である。
【0014】
図3図3は、参照リスト内に保持されるeLTRフレームを伴うビットストリームをデコードすることが可能なある例示的デコーダを例証するシステムブロック図である。
【0015】
図4図4は、いくつかの既存のアプローチと比較した圧縮効率改良を可能にすることができる、本主題のいくつかの側面による参照リスト内に保持されるeLTRフレームを伴うビデオをエンコードするある例示的プロセスを例証するプロセスフロー図である。
【0016】
図5図5は、参照リスト内のeLTR保持のために信号伝達することが可能なある例示的ビデオエンコーダを例証するシステムブロック図である。
【0017】
図6図6は、本明細書に開示される方法のいずれか1つ以上およびそのいずれか1つ以上の部分を実装するために使用されることができるコンピューティングシステムのブロック図である。
【0018】
図面は、必ずしも縮尺通りではなく、想像線、図式表現、および部分図によって例証され得る。ある事例では、実施形態の理解のためには必要ではない詳細、または他の詳細を知覚困難にする詳細が、省略されている場合がある。種々の図面内の同様の参照記号は、同様の要素を示す。
【発明を実施するための形態】
【0019】
長期参照ピクチャ(LTR)は、フレームのある部分が経時的に繰り返し塞がれ、次いで露見された状態になる場合において、ビデオフレームのより良好な予測のために使用され得る。従来的に、LTRは、場面またはピクチャ群の持続時間にわたって使用され、その後、これは、置換または破棄される。本主題のいくつかの実装は、参照リスト内での保持のために最良の候補LTRを選択することによって、LTR使用の有用性を拡張する。いくつかの実装では、明示的に信号伝達される延長された長期参照(eLTR)フレームが、明示的に信号伝達される時間の長さにわたって参照リスト内に保持され得る。本主題のいくつかの実装は、いくつかの既存のアプローチと比較して、有意な圧縮効率利得を提供し得る。
【0020】
本主題のいくつかの実装は、ビデオコーディングにおけるeLTRフレームの選択および保持を達成し得る。eLTRが、ピクチャ参照リスト内に保持され得、これは、予測のために現在のフレームまたはフレームの群によって使用され得る。リスト内の全ての他のフレームは、比較的に短い期間にわたって変化するが、eLTRは、参照リスト内に保持されることができる。例えば、図1は、長い期間にわたるフレーム予測のためのある例示的参照リストを例証する。非限定的かつ例証的な例として、影付きで示されるビデオフレームが、参照フレームを使用して再構築され得る。参照リストは、経時的に変化するフレームおよび保持されるeLTRを含有し得る。
【0021】
いくつかの実装では、引き続き図1を参照すると、エンコーダが、eLTR選択および保持計算の動作を実行する。選択されたフレームおよび保持の時間は、例えば、フレームnに関するeLTR(eLTRn)および保持時間(TRn)のためのインデックスを示す対(eLTRn、TRn)を使用して、デコーダに信号伝達され得る。デコーダは、参照リスト内にTRnの期間にわたってフレームeLTRnを保持し得る。eLTRnフレームが少なくともTRnにわたって参照リスト内に常駐した後、eLTRnフレームは、さらなる使用のためには利用不可能としてマーキングされ得る。いくつかの実装では、eLTRnフレームは、メモリ内に維持されるが、利用不可能な状態にあり得る。いくつかの実装では、エンコーダは、利用可能として、または利用不可能として、eLTRnフレームをマーキングするようにデコーダに明示的に信号伝達し得る。例えば、保持時間TRnの経過後に利用不可能として以前にマーキングされたeLTRnフレームが、利用可能としてマーキングされ得る。そのような特徴は、前後に切り替わる場面を含有するビデオ等のために、eLTRnが将来再び使用されることを可能にし得る。いくつかの実装では、エンコーダは、デコーダがメモリからeLTRnフレームを除去するための信号をビットストリーム内に含み得る。デコーダは、そのような信号に基づいて、参照リストおよびメモリからeLTRnフレームを除去し得る。
【0022】
図2は、eLTRフレームが参照リスト内に保持されるeLTRフレーム保持のプロセス200の非限定的な例を例証するプロセスフロー図である。そのようなeLTR保持は、ビデオエンコーディングおよびデコーディングに対するいくつかの既存のアプローチと比較して、圧縮効率改良を可能にし得る。
【0023】
ステップ210において、引き続き図2を参照すると、ビットストリームが、デコーダによって受信される。ビットストリームは、例えば、データ圧縮を使用するときにデコーダへの入力であるビットのストリーム内に見出されるデータを含み得る。ビットストリームは、ビデオをデコードするために必要な情報を含み得る。受信することは、ビットストリームからブロックおよび関連付けられる信号伝達情報を抽出および/または解析することを含み得る。いくつかの実装では、ビットストリームを受信することは、eLTRフレーム、そのようなフレーム(eLTRn)へのインデックス、および関連付けられる保持時間(TRn)を解析することを含み得、保持時間は、ビデオ内のデコードされるフレームおよび/または時間に基づく。
【0024】
継続して図2を参照すると、ステップ220において、eLTRフレームが、参照ピクチャリスト内に記憶され得る。
【0025】
ステップ230において、引き続き図2を参照すると、記憶されているeLTRフレームが、関連付けられる保持時間(TRn)に基づく時間の長さにわたって参照リスト内に保持(例えば、維持)され得る。
【0026】
ステップ240において、引き続き図2を参照すると、ビデオの少なくとも一部が、ビットストリームからデコードされ得る。デコーディングは、カレントブロックをデコードすることを含み得る。例えば、ビットストリーム内に含有される受信された現在のコーディングされたブロックが、例えば、インター予測を使用することによってデコードされ得る。インター予測を介したデコーディングは、予測を算出するための参照として以前のフレーム、将来のフレーム、および/またはeLTRフレームを使用することを含み得、予測は、ビットストリーム内に含有される残差と組み合わせられ得る。
【0027】
さらに図2を参照すると、後続のカレントブロックに関して、eLTRフレームが、インター予測のための参照フレームとして利用され得る。例えば、第2のコーディングされたブロックが受信され得る。インター予測モードが第2のコーディングされたブロックに関して有効化されるかどうかが決定され得、決定は、ビットストリームから、インター予測モードが有効化されるかどうかを示す明示的信号を受信することを含み得る。第2のデコードされたブロックが、参照フレームとしてeLTRフレームを使用して、かつインター予測モードに従って、決定され得る。例えば、インター予測を介したデコーディングは、予測を算出するための参照としてeLTRフレームを使用することを含み得、予測は、ビットストリーム内に含有される残差と組み合わせられ得る。
【0028】
図3は、参照リスト内に保持されたeLTRフレームを伴うビットストリーム370をデコードすることが可能なデコーダ300の非限定的な例を例証するシステムブロック図である。デコーダ300は、エントロピーデコーダプロセッサ310と、逆量子化および逆変換プロセッサ320と、デブロッキングフィルタ330と、フレームバッファ340と、動き補償プロセッサ350と、イントラ予測プロセッサ360とを含み得る。いくつかの実装では、ビットストリーム370は、eLTRインデックス(eLTRn)および保持時間(TRn)を信号伝達するパラメータ(例えば、ビットストリームのヘッダ内のフィールド)を含み得る。動き補償プロセッサ350は、eLTRフレームを使用して、ピクセル情報を再構築し、eLTRフレームの関連付けられる保持時間(TRn)に従って、eLTRフレームを保持し得る。例えば、eLTRフレーム(eLTRn)が、受信され、少なくとも関連付けられる保持時間にわたって参照リスト内に保持されるとき、eLTRフレーム(eLTRn)は、少なくとも関連付けられる参照時間の間、インター予測モードのための参照として使用され得る。
【0029】
動作時、引き続き図3を参照すると、ビットストリーム370が、デコーダ300によって受信され、エントロピーデコーダプロセッサ310に入力され得、エントロピーデコーダプロセッサ310は、ビットストリームを量子化された係数にエントロピーデコードし得る。量子化された係数は、逆量子化および逆変換プロセッサ320に提供され得、逆量子化および逆変換プロセッサ320は、逆量子化および逆変換を実施して、残差信号を作成し得、残差信号は、処理モードに従って、動き補償プロセッサ350またはイントラ予測プロセッサ360の出力に追加され得る。動き補償プロセッサ350およびイントラ予測プロセッサ360の出力は、以前にデコードされたブロックおよび/または参照リスト内に維持されるeLTRフレームに基づくブロック予測を含み得る。予測および残差の合計が、デブロッキングフィルタ630によって処理され、フレームバッファ640内に記憶され得る。
【0030】
図4は、いくつかの既存のアプローチと比較して圧縮効率改良を可能にし得る、本主題のいくつかの側面による参照リスト内に保持されるeLTRフレームを伴うビデオをエンコードするプロセス400の非限定的な例を例証するプロセスフロー図である。ステップ410において、ビデオフレームのシーケンスが、エンコードされ、これは、1つ以上のeLTRフレームを決定することを含み得る。ステップ420において、eLTRフレーム保持時間(TRn)が、例えば、eLTRフレームがエンコーダ/デコーダによって利用される時間の長さに基づいて決定され得、例えば、時間は、ビデオ内のデコードされているフレームに基づく。
【0031】
ステップ430において、引き続き図4を参照すると、付加的信号伝達パラメータが決定され得る。例えば、利用不可能または利用可能としてeLTRフレームをマーキングするかどうか、およびその時間が、決定され得、各eLTRフレームがメモリから除去されるべきであるかどうか、およびその時間が、決定され得る。
【0032】
ステップ440において、引き続き図4を参照すると、eLTR保持時間および付加的信号伝達パラメータが、ビットストリーム内に含まれ得る。
【0033】
図5は、参照リスト内のeLTR保持のために信号伝達することが可能なビデオエンコーダ500の非限定的な例を例証するシステムブロック図である。例示的ビデオエンコーダ500は、入力ビデオ505を受信し、入力ビデオ505は、最初に、ツリー構造化マクロブロック分割スキーム(例えば、クアッドツリープラスバイナリツリー)等の処理スキームに従って、セグメント化されるかまたは分けられ得る。ツリー構造化マクロブロック分割スキームの例は、ピクチャフレームを大きいブロック要素に分割する分割スキームを含み得、大きいブロック要素は、本開示の目的のために、コーディングツリーユニット(CTU)と称され得る。いくつかの実装では、各CTUは、コーディングユニット(CU)と呼ばれるいくつかのサブブロックに1回以上さらに分割され得る。この分割の結果は、本開示の目的のために、予測ユニット(PU)と称され得るサブブロックの群を含み得る。変換ユニット(TU)もまた、利用され得る。
【0034】
引き続き図5を参照すると、例示的ビデオエンコーダ500は、イントラ予測プロセッサ515と、eLTRフレーム保持を支援することが可能な動き推定/補償プロセッサ520(インター予測プロセッサとも称される)と、変換/量子化プロセッサ525と、逆量子化/逆変換プロセッサ530と、ループ内フィルタ535と、デコード済ピクチャバッファ540と、エントロピーコーディングプロセッサ545とを含み得る。いくつかの実装では、動き推定/補償プロセッサ520は、eLTR保持時間および付加的信号伝達パラメータを決定し得る。eLTRフレーム保持および付加的パラメータを信号伝達するビットストリームパラメータが、出力ビットストリーム550内での包含のために、エントロピーコーディングプロセッサ545に入力され得る。
【0035】
動作時、継続して図5を参照すると、入力ビデオ505のフレームのブロック毎に、イントラピクチャ予測を介して、または動き推定/補償を使用して、ブロックを処理すべきかどうかが決定され得る。ブロックは、イントラ予測プロセッサ510または動き推定/補償プロセッサ520に提供され得る。ブロックがイントラ予測を介して処理されるべきである場合、イントラ予測プロセッサ510は、処理を実施し、予測子を出力し得る。ブロックが動き推定/補償を介して処理されるべきである場合、動き推定/補償プロセッサ520は、適用可能である場合、インター予測のための参照としてeLTRフレームを使用することを含む処理を実施し得る。
【0036】
継続して図5を参照すると、残差が、入力ビデオから予測子を減算することによって形成され得る。残差は、変換/量子化プロセッサ525によって受信され得、変換/量子化プロセッサ525は、変換処理(例えば、離散コサイン変換(DCT))を実施して、係数を生成し得、係数は、量子化され得る。量子化された係数および任意の関連付けられる信号伝達情報が、エントロピーエンコーディングおよび出力ビットストリーム550内での包含のために、エントロピーコーディングプロセッサ545に提供され得る。エントロピーエンコーディングプロセッサ545は、eLTRフレーム保持に関連する信号伝達情報のエンコーディングを支援し得る。加えて、量子化された係数は、逆量子化/逆変換プロセッサ530に提供され得、逆量子化/逆変換プロセッサ530は、ピクセルを再現し得、ピクセルは、予測子と組み合わせられ、ループ内フィルタ535によって処理され得、その出力は、eLTRフレーム保持を支援することが可能である、動き推定/補償プロセッサ520による使用のために、デコード済ピクチャバッファ540内に記憶され得る。
【0037】
引き続き図5を参照すると、いくつかの変形例が、上記に詳細に説明されたが、他の修正または追加が可能である。例えば、いくつかの実装では、カレントブロックは、任意の対称ブロック(8×8、16×16、32×32、64×64、128×128等)および任意の非対称ブロック(8×4、16×8等)を含み得る。
【0038】
いくつかの実装では、継続して図5を参照すると、クアッドツリープラスバイナリディシジョンツリー(QTBT)が実装され得る。QTBTでは、コーディングツリーユニットレベルにおいて、QTBTの分割パラメータが、いかなるオーバーヘッドも伝送することなく、局所的特性に適合するように動的に導出され得る。続けて、コーディングユニットレベルにおいて、ジョイント分類器ディシジョンツリー構造が、不必要な反復を排除し、誤った予測のリスクを制御し得る。
【0039】
いくつかの実装では、デコーダは、eLTRフレーム保持プロセッサ(図示せず)を含み得、eLTRフレーム保持プロセッサは、eLTRフレームを利用不可能としてマーキングするか、または参照リストから除去するかということと、それらの時間とを決定する。
【0040】
いくつかの実装では、本主題は、保持期間の途中でデコーダが同調するブロードキャスト(および同様の)シナリオに適用されることができる。標準的再生を支援するために、エンコーダが、瞬時デコーディングリフレッシュ(IDR)タイプフレームとして(e)LTRフレームをマーキングし得る。この場合では、ストリーミングは、次の利用可能なLTR(IDR)フレームの後に再開し得る。そのようなアプローチは、IDRフレームとしてフレーム間を規定するいくつかの現在のブロードキャスト規格と同様であり得る。
【0041】
本明細書に説明される主題は、多くの技術的利点を提供する。例えば、本主題のいくつかの実装は、参照リスト内に保持されるeLTRフレームを使用してブロックをデコードすることを提供し得る。そのようなアプローチは、圧縮効率を改良し得る。
【0042】
本明細書に説明される側面および実施形態のうちの任意の1つ以上のものが、コンピュータ技術分野の当業者に明白であるように、本明細書の教示に従ってプログラムされた1つ以上の機械(例えば、電子ドキュメントのためのユーザコンピューティングデバイスとして利用される1つ以上のコンピューティングデバイス、ドキュメントサーバ等の1つ以上のサーバデバイス等)において実現および/または実装されるデジタル電子回路、集積回路、専用に設計された特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)コンピュータハードウェア、ファームウェア、ソフトウェア、および/またはそれらの組み合わせを使用して、便宜的に実装され得ることに留意されたい。これらの種々の側面または特徴は、少なくとも1つのプログラム可能なプロセッサを含むプログラム可能なシステム上で実行可能かつ/または解読可能である1つ以上のコンピュータプログラムおよび/またはソフトウェア内での実装を含み得、少なくとも1つのプログラム可能なプロセッサは、専用目的もしくは汎用目的であり得、専用目的もしくは汎用目的であり得、データおよび命令を、ストレージシステム、少なくとも1つの入力デバイス、および少なくとも1つの出力デバイスから受信し、データおよび命令をそれらに伝送するように結合される。適切なソフトウェアコーディングが、ソフトウェア技術分野の当業者に明白であるように、本開示の教示に基づいて、熟練のプログラマによって容易に準備され得る。ソフトウェアおよび/またはソフトウェアモジュールを採用する上記に議論される側面および実装もまた、ソフトウェアおよび/またはソフトウェアモジュールの機械実行可能命令の実装を補助するために適切なハードウェアを含み得る。
【0043】
そのようなソフトウェアは、機械可読記憶媒体を採用するコンピュータプログラム製品であり得る。機械可読記憶媒体は、機械(例えば、コンピューティングデバイス)による実行のための命令のシーケンスを記憶および/またはエンコードすることが可能であり、かつ機械に本明細書に説明される方法および/または実施形態の任意の1つを実施させる任意の媒体であり得る。機械可読記憶媒体の例は、限定ではないが、磁気ディスク、光ディスク(例えば、CD、CD-R、DVD、DVD-R等)、光磁気ディスク、読取専用メモリ「ROM」デバイス、ランダムアクセスメモリ「RAM」デバイス、磁気カード、光学カード、ソリッドステートメモリデバイス、EPROM、EEPROM、プログラマブル論理デバイス(PLD)、および/またはそれらの任意の組み合わせを含む。機械可読媒体は、本明細書で使用される場合、単一の媒体、ならびに、例えばコンピュータメモリとの組み合わされたコンパクトディスクもしくは1つ以上のハードディスクドライブの集合等の物理的に分離した媒体の集合を含むように意図されている。本明細書で使用される場合、機械可読記憶媒体は、信号伝送の一過性形態を含まない。
【0044】
そのようなソフトウェアはまた、搬送波等のデータキャリア上のデータ信号として搬送される情報(例えば、データ)を含み得る。例えば、機械実行可能情報は、信号が機械(例えば、コンピューティングデバイス)による実行のために命令のシーケンスまたはその一部をエンコードするデータキャリアにおいて具現化されるデータ搬送信号、ならびに機械に本明細書に説明される方法および/または実施形態の任意の1つを実施させる任意の関連する情報(例えば、データ構造およびデータ)として含まれ得る。
【0045】
コンピューティングデバイスの例は、限定ではないが、電子書籍読書デバイス、コンピュータワークステーション、端末コンピュータ、サーバコンピュータ、ハンドヘルドデバイス(例えば、タブレット型コンピュータ、スマートフォン等)、ウェブ装置、ネットワークルータ、ネットワークスイッチ、ネットワークブリッジ、機械よってとられるべきアクションを規定する命令のシーケンスを実行することが可能である任意の機械、およびそれらの任意の組み合わせを含む。一例では、コンピューティングデバイスは、キオスクを含み、かつ/またはその中に含まれ得る。
【0046】
図6は、コントロールシステムに本開示の側面および/または方法のうちの任意の1つ以上のものを実施させるための命令のセットが実行され得るコンピュータシステム600の例示的形態としてのコンピューティングデバイスの一実施形態の図式表現を示す。複数のコンピューティングデバイスが、デバイスのうちの1つ以上に、本開示の側面および/または方法のうちの任意の1つ以上を実施させるために専用に構成された命令のセットを実装するために利用され得ることも、考えられる。コンピュータシステム600は、プロセッサ604と、メモリ608とを含み、プロセッサ604およびメモリ608は、バス612を介して相互に、および他の構成要素と通信する。バス612は、限定ではないが、種々のバスアーキテクチャのうちのいずれかを使用するメモリバス、メモリコントローラ、周辺バス、ローカルバス、およびそれらの任意の組み合わせを含むいくつかのタイプのバス構造のうちのいずれかを含み得る。
【0047】
メモリ608は、限定ではないが、ランダムアクセスメモリ構成要素、読取専用構成要素、およびそれらの任意の組み合わせを含む種々の構成要素(例えば、機械可読媒体)を含み得る。一例では、起動中等にコンピュータシステム600内の要素間で情報を転送することに役立つ基本ルーチンを含む基本入力/出力システム616(BIOS)が、メモリ608の中に記憶され得る。メモリ608はまた、本開示の側面および/または方法のうちの任意の1つ以上を具現化する命令(例えば、ソフトウェア)620を含み得る(例えば、1つ以上の機械可読媒体上に記憶されている)。別の例では、メモリ608はさらに、限定ではないが、オペレーティングシステム、1つ以上のアプリケーションプログラム、他のプログラムモジュール、プログラムデータ、およびそれらの任意の組み合わせを含む任意の数のプログラムモジュールを含み得る。
【0048】
コンピュータシステム600はまた、記憶デバイス624を含み得る。記憶デバイス(例えば、記憶デバイス624)の例は、限定ではないが、ハードディスクドライブ、磁気ディスクドライブ、光学媒体と組み合わせられた光ディスクドライブ、ソリッドステートメモリデバイス、およびそれらの任意の組み合わせを含む。記憶デバイス624は、適切なインターフェース(例証せず)によってバス612に接続され得る。例示的インターフェースは、限定ではないが、SCSI、アドバンスト・テクノロジー・アタッチメント(ATA)、シリアルATA、ユニバーサルシリアルバス(USB)、IEEE1394(FIREWIRE(登録商標))、およびそれらの任意の組み合わせを含む。一例では、記憶デバイス624(または1つ以上のその構成要素)は、(例えば、外部ポートコネクタ(例証せず)を介して)コンピュータシステム600と除去可能にインターフェース接続され得る。特に、記憶デバイス624および関連付けられた機械可読媒体628は、コンピュータシステム600のための機械可読命令、データ構造、プログラムモジュール、ならびに/または、他のデータの不揮発性記憶装置および/または揮発性記憶装置を提供し得る。一例では、ソフトウェア620は、完全に、または部分的に、機械可読媒体628内に常駐し得る。別の例では、ソフトウェア620は、完全に、または部分的に、プロセッサ604内に常駐し得る。
【0049】
コンピュータシステム600はまた、入力デバイス632を含み得る。一例では、コンピュータシステム600のユーザは、入力デバイス632を介してコンピュータシステム600内にコマンドおよび/または他の情報を打ち込み得る。入力デバイス632の例は、限定ではないが、英数字入力デバイス(例えば、キーボード)、ポインティングデバイス、ジョイスティック、ゲームパッド、オーディオ入力デバイス(例えば、マイクロホン、音声応答システム等)、カーソル制御デバイス(例えば、マウス)、タッチパッド、光学スキャナ、ビデオ捕捉デバイス(例えば、静止カメラ、ビデオカメラ)、タッチスクリーン、およびそれらの任意の組み合わせを含む。入力デバイス632は、限定ではないが、シリアルインターフェース、パラレルインターフェース、ゲームポート、USBインターフェース、FIREWIRE(登録商標)インターフェース、バス612への直接的インターフェース、およびそれらの任意の組み合わせを含む種々のインターフェース(例証せず)のうちのいずれかを介して、バス612にインターフェース接続され得る。入力デバイス632は、タッチスクリーンインターフェースを含み得、タッチスクリーンインターフェースは、さらに下記に議論されるディスプレイ636の一部であるか、またはそれと別個であり得る。入力デバイス632は、上記に説明されるようなグラフィカルインターフェースにおいて1つ以上のグラフィック表現を選択するためのユーザ選択デバイスとして利用され得る。
【0050】
ユーザはまた、記憶デバイス624(例えば、リムーバブルディスクドライブ、フラッシュドライブ等)および/またはネットワークインターフェースデバイス640を介してコマンドおよび/または他の情報をコンピュータシステム600に入力し得る。ネットワークインターフェースデバイス640等のネットワークインターフェースデバイスは、ネットワーク644等の種々のネットワークのうちの1つ以上、およびそれに接続される1つ以上の遠隔デバイス648にコンピュータシステム600を接続するために利用され得る。ネットワークインターフェースデバイスの例は、限定ではないが、ネットワークインターフェースカード(例えば、モバイルネットワークインターフェースカード、LANカード)、モデム、およびそれらの任意の組み合わせを含む。ネットワークの例は、限定ではないが、ワイドエリアネットワーク(例えば、インターネット、企業ネットワーク)、ローカルエリアネットワーク(例えば、オフィス、建物、キャンパス、または他の比較的小さい地理的空間に関連付けられたネットワーク)、電話ネットワーク、電話/音声プロバイダと関連付けられたデータネットワーク(例えば、モバイル通信プロバイダのデータおよび/または音声ネットワーク)、2つのコンピューティングデバイス間の直接的接続、ならびにそれらの任意の組み合わせを含む。ネットワーク644等のネットワークは、有線モードおよび/または無線のモードの通信を採用し得る。概して、任意のネットワークトポロジが使用され得る。情報(例えば、データ、ソフトウェア620等)が、ネットワークインターフェースデバイス640を介して、コンピュータシステム600に、および/またはコンピュータシステム600から通信され得る。
【0051】
コンピュータシステム600はさらに、ディスプレイデバイス636等のディスプレイデバイスに表示可能な画像を通信するためのビデオディスプレイアダプタ652を含み得る。ディスプレイデバイスの例は、限定ではないが、液晶ディスプレイ(LCD)、陰極線管(CRT)、プラズマディスプレイ、発光ダイオード(LED)ディスプレイ、およびそれらの任意の組み合わせを含む。ディスプレイアダプタ652およびディスプレイデバイス636は、本開示の側面のグラフィック表現を提供するためにプロセッサ604と組み合わせて利用され得る。ディスプレイデバイスに加えて、コンピュータシステム600は、限定ではないが、オーディオスピーカ、プリンタ、およびそれらの任意の組み合わせを含む1つ以上の他の周辺出力デバイスを含み得る。そのような周辺出力デバイスは、周辺インターフェース656を介してバス612に接続され得る。周辺インターフェースの例は、限定ではないが、シリアルポート、USB接続、FIREWIRE(登録商標)接続、パラレル接続、およびそれらの任意の組み合わせを含む。
【0052】
前述は、本発明の例証的実施形態の詳細な説明である。種々の修正および追加が、本発明の精神および範囲から逸脱することなく成され得る。上記に説明される種々の実施形態の各々の特徴が、関連付けられた新しい実施形態において複数の特徴の組み合わせを提供するために、適宜、他の説明される実施形態の特徴と組み合わせられ得る。さらに、前述は、いくつかの別個の実施形態を説明するが、本明細書に説明されているものは、本発明の原理の適用を例証するにすぎない。加えて、本明細書における特定の方法は、具体的な順序で実施されるものとして例証および/または説明され得るが、順序は、本明細書に開示されるような実施形態を達成するために、通常の技術内で大いに変更可能である。故に、本説明は、例としてのみ捉えられることを意図されており、別様に本発明の範囲を限定するようには意図されていない。
【0053】
上記の説明において、および請求項において、「~のうちの少なくとも1つ」または「~のうちの1つ以上」等の語句が生じ、要素または特徴の接続的列挙が後に続き得る。用語「および/または」もまた、2つ以上の要素または特徴の列挙内に生じ得る。そのような語句が使用される文脈によって別様に暗示的または明示的に否定されない限り、これは、個々に列挙される要素もしくは特徴のいずれか、または他の記載される要素もしくは特徴のいずれかと組み合わせて記載される要素もしくは特徴のいずれかを意味することが意図されている。例えば、語句「AおよびBのうちの少なくとも一方」、「AおよびBのうちの1つ以上」、ならびに「Aおよび/またはB」は、各々、「Aのみ、Bのみ、またはAおよびBともに」を意味することが意図されている。同様の解釈が、3つ以上のアイテムを含む列挙に関しても意図されている。例えば、語句「A、B、およびCのうちの少なくとも1つ」、「A、B、およびCのうちの1つ以上」、ならびに「A、B、および/またはC」は、各々、「Aのみ、Bのみ、Cのみ、AおよびBともに、AおよびCともに、BおよびCともに、またはAおよびBおよびCともに」を意味することが意図されている。加えて、上記および請求項内での用語「~に基づいて」の使用は、記載されていない特徴または要素も許容可能であるように、「少なくとも、~に基づいて」を意味することが意図されている。
【0054】
本明細書に説明される主題は、所望の構成に応じて、システム、装置、方法、および/または物品として具現化されることができる。前述の説明に記載される実装は、本明細書に説明される主題と一貫した全実装を表すわけではない。代わりに、それらは、単に説明される主題に関連する側面と一貫するいくつかの例にすぎない。いくつかの変更が、上記で詳細に説明されているが、他の修正または追加も、可能である。特に、さらなる特徴および/または変更が、本明細書に記載されるものに加えて提供され得る。例えば、上記で説明される実装は、開示される特徴の種々の組み合わせおよび副次的組み合わせおよび/または上記に開示されるいくつかのさらなる特徴の組み合わせおよび副次的組み合わせを対象とし得る。加えて、付随の図に描写され、かつ/または本明細書に説明される論理フローは、望ましい結果を達成するために、必ずしも、示される特定の順序または連続的順序を要求しない。他の実装も、以下の請求項の範囲内にあり得る。
図1
図2
図3
図4
図5
図6