IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ テレフオンアクチーボラゲット エル エム エリクソン(パブル)の特許一覧

<>
  • 特表-ブロック重要性マッピング 図1
  • 特表-ブロック重要性マッピング 図2
  • 特表-ブロック重要性マッピング 図3
  • 特表-ブロック重要性マッピング 図4
  • 特表-ブロック重要性マッピング 図5
  • 特表-ブロック重要性マッピング 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-04-15
(54)【発明の名称】ブロック重要性マッピング
(51)【国際特許分類】
   H04N 19/126 20140101AFI20240408BHJP
   H04N 19/137 20140101ALI20240408BHJP
   H04N 19/176 20140101ALI20240408BHJP
【FI】
H04N19/126
H04N19/137
H04N19/176
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2023562655
(86)(22)【出願日】2022-04-07
(85)【翻訳文提出日】2023-12-08
(86)【国際出願番号】 SE2022050353
(87)【国際公開番号】W WO2022220722
(87)【国際公開日】2022-10-20
(31)【優先権主張番号】63/174,080
(32)【優先日】2021-04-13
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】598036300
【氏名又は名称】テレフオンアクチーボラゲット エルエム エリクソン(パブル)
(74)【代理人】
【識別番号】100109726
【弁理士】
【氏名又は名称】園田 吉隆
(74)【代理人】
【識別番号】100150670
【弁理士】
【氏名又は名称】小梶 晴美
(74)【代理人】
【識別番号】100199705
【弁理士】
【氏名又は名称】仙波 和之
(74)【代理人】
【識別番号】100194294
【弁理士】
【氏名又は名称】石岡 利康
(72)【発明者】
【氏名】ウェナーストン, ペール
(72)【発明者】
【氏名】ホルマン, クリストファー
(72)【発明者】
【氏名】ストレム, ヤコブ
【テーマコード(参考)】
5C159
【Fターム(参考)】
5C159MA04
5C159MA05
5C159MC11
5C159PP04
5C159TA46
5C159TB08
5C159TC03
5C159TD04
5C159TD06
5C159UA02
5C159UA05
5C159UA16
(57)【要約】
ピクチャを符号化するための方法が提供される。本方法は、現在ピクチャから1または2離れた距離をもつ、現在ピクチャの両側の各ピクチャについて、第1の誤差値Eを算出することであって、第1の誤差値Eが、現在ピクチャの第1のブロックサイズのブロックのセットのうちの各ブロックについて算出され、現在ピクチャのそれぞれのブロックとピクチャ中の対応するブロックとに基づく、第1の誤差値Eを算出することを含む。本方法は、現在ピクチャから1または2離れた距離をもつ、現在ピクチャの両側の各ピクチャについて、ピクチャに対応する第2の誤差値E’を生成するために、第2のブロックサイズのブロック中に含まれている第1のブロックサイズのブロックのセットのうちの各ブロックについて第2のブロックサイズのブロックにわたって第1の誤差値Eをアグリゲートすることを含む。本方法は、現在ピクチャから1または2離れた距離をもつ、現在ピクチャの両側のピクチャのうちの1つまたは複数に対応する第2の誤差値E’に少なくとも部分的に基づいて、現在ピクチャ中の第2のブロックサイズのブロックについて重要性スコアを算出することをさらに含む。本方法は、重要性スコアに基づいて、現在ピクチャ中の第2のブロックサイズのブロックについて量子化パラメータ(QP)値の変化を算出することを含む。本方法は、QP値の変化をエンコーダにシグナリングすることを含む。
【選択図】図5
【特許請求の範囲】
【請求項1】
ピクチャを符号化するための方法であって、前記方法は、
現在ピクチャから1または2離れた距離をもつ、前記現在ピクチャの両側の各ピクチャについて、第1の誤差値Eを算出することであって、前記第1の誤差値Eが、前記現在ピクチャの第1のブロックサイズのブロックのセットのうちの各ブロックについて算出され、前記現在ピクチャのそれぞれのブロックと前記ピクチャ中の対応するブロックとに基づく、第1の誤差値Eを算出することと、
前記現在ピクチャから1または2離れた距離をもつ、前記現在ピクチャの両側の各ピクチャについて、前記ピクチャに対応する第2の誤差値E’を生成するために、第2のブロックサイズのブロック中に含まれている前記第1のブロックサイズのブロックの前記セットのうちの各ブロックについて前記第2のブロックサイズの前記ブロックにわたって前記第1の誤差値Eをアグリゲートすることと、
前記現在ピクチャから1または2離れた距離をもつ、前記現在ピクチャの両側の前記ピクチャのうちの1つまたは複数に対応する前記第2の誤差値E’に少なくとも部分的に基づいて、前記現在ピクチャ中の前記第2のブロックサイズの前記ブロックについて重要性スコアを算出することと、
前記重要性スコアに基づいて、前記現在ピクチャ中の前記第2のブロックサイズの前記ブロックについて量子化パラメータ(QP)値の変化を算出することと、
QP値の前記変化をエンコーダにシグナリングすることと
を含む、方法。
【請求項2】
前記第1の誤差値Eを算出することが、時間フィルタ処理中に実施される、請求項1に記載の方法。
【請求項3】
前記ピクチャに対応する第2の誤差値E’を生成するために、前記第2のブロックサイズの前記ブロック中に含まれている前記第1のブロックサイズの各ブロックについて前記第2のブロックサイズの前記ブロックにわたって前記第1の誤差値Eをアグリゲートすることが、前記第2のブロックサイズの前記ブロック中に含まれている前記第1のブロックサイズの各ブロックについて前記第1の誤差値Eを平均化することを含む、請求項1または2に記載の方法。
【請求項4】
前記第2のブロックサイズの前記ブロックが、コーディングツリーユニット(CTU)を含む、請求項1から3のいずれか一項に記載の方法。
【請求項5】
前記第1のブロックサイズのブロックについての前記第1の誤差値Eが、前記ブロックの分散V、および前記ブロックと前記ピクチャ中の前記対応するブロックとの間の2乗差分和(SSD)に基づく、請求項1から4のいずれか一項に記載の方法。
【請求項6】
前記第1のブロックサイズのブロックについての前記第1の誤差値Eが、
によって計算され、ここで、a、b、c、およびdがパラメータである、請求項5に記載の方法。
【請求項7】
第3の誤差値E1を生成するために、前記現在ピクチャから1の距離離れたピクチャに対応する前記第2の誤差値E’をアグリゲートすることと、
第4の誤差値E2を生成するために、前記現在ピクチャから2の距離離れたピクチャに対応する前記第2の誤差値E’をアグリゲートすることと、
前記第3の誤差値E1と前記第4の誤差値E2とに基づいて、第5の誤差値E4を計算することと
をさらに含み、
前記現在ピクチャ中の前記第2のブロックサイズの前記ブロックについて重要性スコアを算出することが、前記第5の誤差値E4に少なくとも部分的に基づく、請求項1から6のいずれか一項に記載の方法。
【請求項8】
第3の誤差値E1を生成するために、前記現在ピクチャから1の距離離れたピクチャに対応する前記第2の誤差値E’をアグリゲートすることが、第3の誤差値E1を生成するために、前記現在ピクチャから1の距離離れたピクチャに対応する前記第2の誤差値E’を平均化することを含み、第4の誤差値E2を生成するために、前記現在ピクチャから2の距離離れたピクチャに対応する前記第2の誤差値E’をアグリゲートすることが、第4の誤差値E2を生成するために、前記現在ピクチャから2の距離離れたピクチャに対応する前記第2の誤差値E’を平均化することを含む、請求項7に記載の方法。
【請求項9】
第2の誤差値E1と前記第4の誤差値E2とに基づいて第5の誤差値E4を計算することが、
E4=max(E1,E2)+abs(E2-E1)*A
を算出することを含み、ここで、Aがパラメータである、請求項7または8に記載の方法。
【請求項10】
前記第5の誤差値E4が、時間フィルタ処理のレイヤに基づいて修正される、請求項7から9のいずれか一項に記載の方法。
【請求項11】
時間フィルタ処理の最上位レイヤについて、前記第5の誤差値E4が、E4=x*E4+yとして修正され、ここで、xおよびyがパラメータである、請求項10に記載の方法。
【請求項12】
QP値の前記変化が、{-2,-1,0,+1,+2}のうちの1つである、請求項1から11のいずれか一項に記載の方法。
【請求項13】
エンコーダの処理回路によって実行されたとき、前記エンコーダに、請求項1から12のいずれか一項に記載の方法を実施させる命令を含む、コンピュータプログラム。
【請求項14】
請求項13に記載のコンピュータプログラムを含んでいるキャリアであって、前記キャリアが、電子信号、光信号、無線信号、およびコンピュータ可読記憶媒体のうちの1つである、キャリア。
【請求項15】
エンコーダであって、前記エンコーダが、
処理回路と、
メモリと
を備え、前記メモリが、前記処理回路によって実行可能な命令を含んでおり、それにより、前記エンコーダが、請求項1から12のいずれか一項に記載の方法を実施するように設定された、エンコーダ。
【請求項16】
ピクチャを符号化するように設定されたエンコーダであって、前記エンコーダは、
現在ピクチャから1または2離れた距離をもつ、前記現在ピクチャの両側の各ピクチャについて、第1の誤差値Eを算出することであって、前記第1の誤差値Eが、前記現在ピクチャの第1のブロックサイズのブロックのセットのうちの各ブロックについて算出され、前記現在ピクチャのそれぞれのブロックと前記ピクチャ中の対応するブロックとに基づく、第1の誤差値Eを算出することと、
前記現在ピクチャから1または2離れた距離をもつ、前記現在ピクチャの両側の各ピクチャについて、前記ピクチャに対応する第2の誤差値E’を生成するために、第2のブロックサイズのブロック中に含まれている前記第1のブロックサイズのブロックの前記セットのうちの各ブロックについて前記第2のブロックサイズの前記ブロックにわたって前記第1の誤差値Eをアグリゲートすることと、
前記現在ピクチャから1または2離れた距離をもつ、前記現在ピクチャの両側の前記ピクチャのうちの1つまたは複数に対応する前記第2の誤差値E’に少なくとも部分的に基づいて、前記現在ピクチャ中の前記第2のブロックサイズの前記ブロックについて重要性スコアを算出することと、
前記重要性スコアに基づいて、前記現在ピクチャ中の前記第2のブロックサイズの前記ブロックについて量子化パラメータ(QP)値の変化を算出することと、
QP値の前記変化をエンコーダにシグナリングすることと
を行うように設定された、エンコーダ。
【請求項17】
前記エンコーダが、請求項2から12のいずれか一項に記載の方法を実施するようにさらに設定された、請求項16に記載のエンコーダ。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、ビデオシーケンスおよび/または静止画像のコーディングおよび復号に関し、より詳細には、ブロック重要性マッピングに関する。
【背景技術】
【0002】
ビデオをコーディングするときの第1のステップは、静止ピクチャをコーディングすることである。次いで、予測のためにそのピクチャを使用することができる将来のピクチャがコーディングされる。次に、予測のために前にコーディングされたピクチャのいずれかを使用することができるピクチャがコーディングされる。この種類の階層的コーディングは、現代のビデオコーデックの基本的特徴である。
【0003】
階層的コーディングのために、高品質でいくつかのピクチャをコーディングすることは、これらが、いくつかの将来のピクチャを予測するために使用され、それにより、依存するピクチャの品質にも影響を及ぼすことになるので、より重要である。
【0004】
旧来、これは、異なる階層レベルにおけるピクチャについて異なる量子化パラメータ(QP)値をセットすることによって行われる。低いQPは、高品質および高ビットレートを与え、高いQPは、低ビットレートおよび低品質を与える。
【0005】
実際には、最適なQP値は、異なるピクチャがどのくらい互いに類似しているかに依存することになる。ビデオがほとんど同等のピクチャからなる場合、第1のピクチャについて(高品質を生じる)極めて低いQPを使用することが最良である。他方で、ピクチャ間の類似性がない場合、それらは、すべて、同じQPを有するべきである。これのために、コーディングされるピクチャに基づいて良好なQP値を見つけることを試みるアルゴリズムが存在する。実際は、各ピクチャについて単一のQP値を単にセットするのではなく、ピクチャの異なる部分が異なるQP値を有することがある。これは、たとえば、迅速に変化する前景よりも低いQPにおいて静的背景をコーディングするために有用である。
【0006】
1つのそのようなアルゴリズムは、「A novel macroblock-tree algorithm for high-performance optimization of dependent video coding in H.264/AVC」、Jason Garret-Glaserにおいて説明される。手短に言えば、第1のステップは、ビデオ中のすべてのピクチャを通り、それらが、もしあれば、前のピクチャ中のどのエリアから予測することになるかを推定することである。その後、アルゴリズムは、本質的に、すべてのブロックの重要性を1にセットし、次いで、逆方向にビデオを通り、各ブロックの重要性を、それがそこから予測するブロックに加算する。したがって、重要性は、階層に沿って累積し、第1のフレームが最も重要なものとして残ることになる。その後、重要性をQPに変換するために式が使用される。
【発明の概要】
【0007】
いくつかの現実のエンコーダは、QP値を動的に選択するための良好なソリューションを有しない。それらのエンコーダが行うとき、QP値を動的に選択するためのアルゴリズムのいくつかは、現在ピクチャからの情報が使用される可能性があるすべての将来のピクチャを決定することを試みる、遅いプリエンコーディングパスに依拠する。
【0008】
本明細書の実施形態は、エンコーダの時間フィルタ中ですでに行われている計算に基づいて良好なQP値を選択するためのアルゴリズムを提供する。現在ピクチャを参照し得るすべての将来のピクチャを考慮するのではなく、実施形態は、隣接するピクチャのサブセット、たとえば、4つの隣接するピクチャのみに基づいて将来の重要性を推定する。
【0009】
本開示の第1の態様によれば、ピクチャを符号化するための方法が提供される。本方法は、現在ピクチャから1または2離れた距離をもつ、現在ピクチャの両側の各ピクチャについて、第1の誤差値Eを算出することであって、第1の誤差値Eが、現在ピクチャの第1のブロックサイズのブロックのセットのうちの各ブロックについて算出され、現在ピクチャのそれぞれのブロックとピクチャ中の対応するブロックとに基づく、第1の誤差値Eを算出することを含む。本方法は、現在ピクチャから1または2離れた距離をもつ、現在ピクチャの両側の各ピクチャについて、ピクチャに対応する第2の誤差値E’を生成するために、第2のブロックサイズのブロック中に含まれている第1のブロックサイズのブロックのセットのうちの各ブロックについて第2のブロックサイズのブロックにわたって第1の誤差値Eをアグリゲートすることを含む。本方法は、現在ピクチャから1または2離れた距離をもつ、現在ピクチャの両側のピクチャのうちの1つまたは複数に対応する第2の誤差値E’に少なくとも部分的に基づいて、現在ピクチャ中の第2のブロックサイズのブロックについて重要性スコアを算出することをさらに含む。本方法は、重要性スコアに基づいて、現在ピクチャ中の第2のブロックサイズのブロックについて量子化パラメータ(QP)値の変化を算出することを含む。本方法は、QP値の変化をエンコーダにシグナリングすることを含む。
【0010】
本開示の第2の態様によれば、エンコーダの処理回路によって実行されたとき、エンコーダに、第1の態様による方法を実施させる命令を含むコンピュータプログラムが提供される。
【0011】
本開示の第3の態様によれば、第2の態様によるコンピュータプログラムを含んでいるキャリアが提供され、キャリアは、電子信号、光信号、無線信号、およびコンピュータ可読記憶媒体のうちの1つである。
【0012】
第4の態様によれば、第1の態様によるピクチャを符号化するように設定されたエンコーダが提供される。
【0013】
実施形態は、時間フィルタと計算を共有することと、それらの計算に基づいてQPを変化させることを決めることとを行い、その両方が、現況技術に対する改善である。実施形態は、既存の時間フィルタからの算出を再使用するので、開示される適応QPアルゴリズムの複雑さの影響は無視できる。同時に、コーディングされたビデオのビットレートは、同じ視覚的品質を維持しながら、いくつかの実施形態では、平均してほぼ2%だけ低減され得る。
【0014】
本明細書に組み込まれ、明細書の一部をなす添付の図面は、様々な実施形態を示している。
【図面の簡単な説明】
【0015】
図1】一実施形態による、エンコーダの例示的なアーキテクチャを示す図である。
図2】一実施形態による、デコーダの例示的なアーキテクチャを示す図である。
図3】一実施形態によるフローチャートである。
図4】一実施形態による、誤差計算を示す図である。
図5】一実施形態によるフローチャートである。
図6】一実施形態による、エンコーダのブロック図である。
【発明を実施するための形態】
【0016】
実施形態は、ピクチャ間の差分を計算することを伴う、QPを決定するためのアルゴリズムを提供する。いくつかの実施形態では、これは、時間フィルタ中ですでに実施された差分計算に基づく。階層的コーディングでは、ピクチャは、一般に、時間レイヤに分割され、ここで、最下位時間レイヤがイントラピクチャを含み、最上位時間レイヤが、一般に、参照のために使用されないピクチャのみを含んでいる。実施形態は、時間フィルタがアクティブであるピクチャについてのみQPを修正し得、これは、概して、時間階層の最下位の3つのレイヤである。
【0017】
例示的なエンコーダが図1に示されている。例示的なデコーダが図2に示されている。
【0018】
図3は、一実施形態による、例示的なアルゴリズムを示す。
【0019】
図1のステップ1に示されているものなど、所与のブロック(たとえば、8×8ブロック)についての動き補償の後に、時間フィルタは、動き補償の後の、元のブロックの分散、および元のブロックと参照ピクチャ中の対応するブロックとの間の2乗差分和(SSD)を算出する。これに基づいて、図3のステップ2に示されているものなど、誤差Eが算出される。誤差Eは、実施形態では、
として算出され得、ここで、Vは、算出された分散を指し、SSDは、算出されたSSDを指す。
【0020】
この式は、低いSSD値ならびに低い相対誤差(SSD/分散)を有するブロックに低いE値(すなわち、高い重要性)を与えることになる。
【0021】
E値は、時間フィルタ中で各参照ピクチャについてブロック(たとえば、8×8ブロック)ごとに算出される。
【0022】
次に、ここではE’と示された、コーディングツリーユニット(CTU)(たとえば、128×128ピクセル)中の平均E値が、図3のステップ3に示されているように、現在ピクチャの直前および直後のピクチャ(たとえば、現在ピクチャの両側の2つのピクチャ)について計算される。平均E値、すなわち、E’値が、たとえば、CTU中のサブブロックにわたる(たとえば、CTU中の256個の8×8ブロックにわたる)単純な平均化によって算出され得る。
【0023】
所与のCTUについて、図3のステップ4に示されているものなど、値E1を形成するために現在ピクチャの両側の1の距離をもつピクチャについての2つのE’値が平均化され、値E2を形成するために現在ピクチャの両側の2の距離をもつピクチャについての2つのE値が平均化される。これらの誤差値(E1およびE2)は、図3のステップ5に示されているものなど、各CTUについてE4値を生じるために外挿され得る。実施形態では、E4は、次のように算出され得る。
E4=max(E1,E2)+abs(E2-E1)*3
【0024】
E4値は、重要性がどのくらい急速に減衰するかを考慮に入れるように設計される。E1が高い重要性を示すがE2が低い重要性を示す場合、重要性は急速になくなり、ブロックは、うまく符号化するためにはあまり重要でない。しかしながら、E1とE2の両方が、同じレベルの重要性をシグナリングする場合、これは、重要性がより長くとどまることを示し、ブロックをうまくコーディングすることがより重要である。
【0025】
時間フィルタは、一般に、すべてのフレームをフィルタ処理するのではなく、最下位時間レイヤに属するフレームのみをフィルタ処理する。これらのうちの最上位時間レイヤについて、すなわち、フィルタ処理される最上位時間レイヤについて、E4は、図3のステップ6に示されているように修正され得る。たとえば、E4は、次のように修正され得る。
E4=0.6*E4+0.4*66
これは、重要性を、より少数の将来のピクチャのための参照として使用されているこれらのピクチャを補償するために、中間の重要性のより近くにセットする。
【0026】
最終的に、図3のステップ7に示されているように、各CTUについてデルタQPを決めるためにしきい値処理が実施される。たとえば、以下のものなど、表に基づいてデルタQPが算出され得る。
【0027】
上記のデルタQPは、CTUについて最終QPを決定するためにピクチャQPに単に加算される。デルタQP値は、規格内の既存の機構を使用してシグナリングされ得る。
【0028】
図4は、一実施形態による、誤差計算を示す。誤差E’が、ブロックレベルにおいて(たとえば、各CTUについて)現在ピクチャおよび近くのピクチャに関して、たとえば、時間フィルタ処理の一部として計算される。図示のように、現在ピクチャから±1および±2離れたピクチャの各々についての誤差Eがあり、現在ピクチャから±1離れたピクチャについての誤差E’の平均E1があり、現在ピクチャから±2離れたピクチャについての誤差E’の別の平均E2がある。
【0029】
図5は、一実施形態によるフローチャートを示す。プロセス500は、ピクチャを符号化するための方法である。方法は、ステップs502から始まり得る。
【0030】
ステップs502は、現在ピクチャに隣接するピクチャのセットの各隣接するピクチャについて、第1の誤差値(E)を算出することであって、第1の誤差値(E)が、現在ピクチャの第1のブロックサイズのブロックのセットのうちの各ブロックについて算出され、現在ピクチャのそれぞれのブロックと、隣接するピクチャ中の対応するブロックとに基づく、第1の誤差値Eを算出することを含む。
【0031】
ステップs504は、現在ピクチャに隣接するピクチャのセットの各隣接するピクチャについて、隣接するピクチャに対応する第2の誤差値(E’)を生成するために、第2のブロックサイズのブロック中に含まれている第1のブロックサイズのブロックのセットのうちの各ブロックについて第2のブロックサイズのブロックにわたって第1の誤差値(E)をアグリゲートすることを含む。
【0032】
ステップs506は、現在ピクチャに隣接するピクチャのうちの1つまたは複数に対応する第2の誤差値(E’)に少なくとも部分的に基づいて、現在ピクチャ中の第2のブロックサイズのブロックについて重要性スコアを算出することを含む。
【0033】
ステップs508は、重要性スコアに基づいて、現在ピクチャ中の第2のブロックサイズのブロックについて量子化パラメータ(QP)値の変化を算出することを含む。
【0034】
ステップs510は、QP値の変化をエンコーダにシグナリングすることを含む。
【0035】
いくつかの実施形態では、第1の誤差値(E)を算出することは、時間フィルタ処理中に実施される。いくつかの実施形態では、隣接するピクチャに対応する第2の誤差値(E’)を生成するために、第2のブロックサイズのブロック中に含まれている第1のブロックサイズの各ブロックについて第2のブロックサイズのブロックにわたって第1の誤差値(E)をアグリゲートすることは、第2のブロックサイズのブロック中に含まれている第1のブロックサイズの各ブロックについて第1の誤差値(E)を平均化することを含む。いくつかの実施形態では、第2のブロックサイズのブロックは、コーディングツリーユニット(CTU)を含む。いくつかの実施形態では、第1のブロックサイズのブロックについての第1の誤差値(E)は、ブロックの分散V、およびブロックと隣接するピクチャ中の対応するブロックとの間の2乗差分和(SSD)に基づく。いくつかの実施形態では、第1のブロックサイズのブロックについての第1の誤差値(E)は、
によって計算され、ここで、a、b、c、およびdはパラメータである。
【0036】
いくつかの実施形態では、方法は、第3の誤差値(E1)を生成するために、現在ピクチャから1の距離離れた隣接するピクチャに対応する第2の誤差値(E’)をアグリゲートすることをさらに含む。方法は、第4の誤差値(E2)を生成するために、現在ピクチャから2の距離離れた隣接するピクチャに対応する第2の誤差値(E’)をアグリゲートすることをさらに含む。方法は、第3の誤差値(E1)と第4の誤差値(E2)とに基づいて、第5の誤差値(E4)を計算することをさらに含む。現在ピクチャ中の第2のブロックサイズのブロックについて重要性スコアを算出することが、第5の誤差値(E4)に少なくとも部分的に基づく。いくつかの実施形態では、第3の誤差値(E1)を生成するために、現在ピクチャから1の距離離れた隣接するピクチャに対応する第2の誤差値(E’)をアグリゲートすることが、第3の誤差値(E1)を生成するために、現在ピクチャから1の距離離れた隣接するピクチャに対応する第2の誤差値(E’)を平均化することを含み、第4の誤差値(E2)を生成するために、現在ピクチャから2の距離離れた隣接するピクチャに対応する第2の誤差値(E’)をアグリゲートすることが、第4の誤差値(E2)を生成するために、現在ピクチャから2の距離離れた隣接するピクチャに対応する第2の誤差値(E’)を平均化することを含む。
【0037】
いくつかの実施形態では、第3の誤差値(E1)と第4の誤差値(E2)とに基づいて、第5の誤差値(E4)を計算することが、
E4=max(E1,E2)+abs(E2-E1)*A
を算出することを含み、ここで、Aはパラメータである。いくつかの実施形態では、第5の誤差値(E4)は、時間フィルタ処理のレイヤに基づいて修正される。いくつかの実施形態では、時間フィルタ処理を受けるピクチャを含んでいる最上位時間レイヤについて、第5の誤差値(E4)は、E4=x*E4+yとして修正され、ここで、xおよびyはパラメータである。いくつかの実施形態では、QP値の変化は、{-2,-1,0,+1,+2}のうちの1つである。
【0038】
図6は、いくつかの実施形態による、ノード600(たとえば、エンコーダまたはデコーダ)のブロック図である。図6に示されているように、ノード600は、1つまたは複数のプロセッサ(P)655(たとえば、1つまたは複数の汎用マイクロプロセッサ、および/または、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)など、1つまたは複数の他のプロセッサなど)を含み得る処理回路(PC)602であって、そのプロセッサが、単一のハウジングにおいてまたは単一のデータセンタにおいて共同サイト式であり得るかあるいは地理的に分散され得る(すなわち、ノード600が分散コンピューティング装置であり得る)、処理回路(PC)602と、少なくとも1つのネットワークインターフェース648(たとえば、物理インターフェースまたはエアインターフェース)であって、ノード600が、ネットワークインターフェース648が(物理的にまたは無線で)接続されるネットワーク610(たとえば、インターネットプロトコル(IP)ネットワーク)に接続された他のノードにデータを送信し、他のノードからデータを受信することを可能にするための送信機(Tx)645および受信機(Rx)647を備える(たとえば、ネットワークインターフェース648は、ノード600が無線でデータを送信/受信することを可能にするための1つまたは複数のアンテナを備えるアンテナ構成に結合され得る)、少なくとも1つのネットワークインターフェース648と、1つまたは複数の不揮発性記憶デバイスおよび/または1つまたは複数の揮発性記憶デバイスを含み得るローカル記憶ユニット(別名「データ記憶システム」)608とを備え得る。PC602がプログラマブルプロセッサを含む実施形態では、コンピュータプログラム製品(CPP)641が提供され得る。CPP641はコンピュータ可読媒体(CRM)642を含み、CRM642は、コンピュータ可読命令(CRI)644を含むコンピュータプログラム(CP)643を記憶する。CRM642は、磁気媒体(たとえば、ハードディスク)、光媒体、メモリデバイス(たとえば、ランダムアクセスメモリ、フラッシュメモリ)など、非一時的コンピュータ可読媒体であり得る。いくつかの実施形態では、コンピュータプログラム643のCRI644は、PC602によって実行されたとき、CRIが、ノード600に、本明細書で説明されるステップ(たとえば、フローチャートを参照しながら本明細書で説明されるステップ)を実施させるように設定される。他の実施形態では、ノード600は、コードの必要なしに本明細書で説明されるステップを実施するように設定され得る。すなわち、たとえば、PC602は、単に1つまたは複数のASICからなり得る。したがって、本明細書で説明される実施形態の特徴は、ハードウェアおよび/またはソフトウェアで実装され得る。
【0039】
本明細書で使用される、ネットワークエレメント、ノード、またはサブシステム(たとえば、エンコーダまたはデコーダ)は、ハードウェアおよびソフトウェアを含む、1つまたは複数のサービスネットワーク機器からなり得、それらは、ネットワーク上の他の機器(たとえば、他のネットワークエレメント、エンドステーションなど)を通信可能に相互接続し、ストリームベースまたはファイルベース機構を使用してメディアコンテンツアセットが分散および配信され得るメディア分散ネットワークにおいてコンテンツを受信/消費するように動作可能である複数のサブスクライバおよび関連するユーザ機器(UE)ノードに関して、仮想化環境/非仮想化環境のいずれかにおいて、1つまたは複数のアプリケーションまたはサービスをホストするように適応される。したがって、いくつかのネットワークエレメントは、ワイヤレス無線ネットワーク環境中に配設され得、他のネットワークエレメントは、パブリックコンテンツ配信ネットワーク(CDN)、プライベートCDN、または混合CDNを備え得る、好適なCDNインフラストラクチャを含むかまたはさもなければ伴う、バプリックパケット交換ネットワークインフラストラクチャ中に配設され得る。さらに、本明細書に記載される1つまたは複数の実施形態を含む好適なネットワークエレメントは、地上波および/または衛星ブロードバンド配信インフラストラクチャ、たとえば、デジタル加入者回線(DSL)ネットワークアーキテクチャ、データオーバケーブルサービスインターフェース仕様(DOCSIS)準拠ケーブルモデム終端システム(CMTS)アーキテクチャ、交換デジタルビデオ(SDV)ネットワークアーキテクチャ、ハイブリッドファイバー同軸(HFC)ネットワークアーキテクチャ、好適な衛星アクセスネットワークアーキテクチャ、あるいはセルラおよび/またはWiFiコネクティビティを介したブロードバンド無線アクセスネットワークアーキテクチャを伴い得る。したがって、いくつかのネットワークエレメントは、複数のアプリケーションサービス(たとえば、様々な品質または規定における(360度ビデオアセットまたは単に360ビデオアセットとも呼ばれる)360°没入型ビデオアセットを含むデータおよびマルチメディアアプリケーション)のサポートを提供することに加えて、複数のネットワークベース機能(たとえば、360°没入型A/Vメディア準備配信ポリシ管理、セッション制御、QoSポリシ施行、帯域幅スケジューリング管理、コンテンツプロバイダ優先度ポリシ管理、ストリーミングポリシ管理など)のサポートを提供する、「複数サービスネットワークエレメント」を備え得る。例示的なサブスクライバエンドステーションまたはクライアントデバイスは、いくつかの実施形態において、あるタイプのレート適応を伴い得る、ストリーミングおよび/またはファイルベースのダウンロード技術を使用して、メディアコンテンツアセットを消費または配信し得る、テザリングされるまたはテザリングされない様々なデバイスを備え得る。したがって、例示的なクライアントデバイスまたはUEデバイスは、とりわけ、HTTP、HTTPS、RTPなどを使用して、たとえば、ブロードバンドアクセスネットワークを介して、1つまたは複数のコンテンツプロバイダからの、仮想現実(VR)メディア、拡張現実(AR)メディア、複合現実(MR)メディアを備え得る、360ビデオコンテンツ、ライブメディアおよび/または静的/オンデマンドメディアを受信、記録、記憶、および/または復号/レンダリングするための1つまたは複数のクライアントアプリケーションを実行するように設定された任意のデバイスを含み得る。したがって、そのようなクライアントデバイスは、次世代IPベースSTB、ネットワーク化されたTV、パーソナル/デジタルビデオレコーダ(PVR/DVR)、ネットワーク化されたメディアプロジェクタ、ポータブルラップトップコンピュータ、ネットブック、パームトップ、タブレット、スマートフォン、マルチメディア/ビデオフォン、モバイル/無線ユーザ機器、ポータブルメディアプレーヤ、3Dディスプレイデバイスと協働して動作する(Wii(登録商標)、Play Station 3(登録商標)などの)ポータブルゲーミングシステムまたはコンソールなどを含み得、これらは、本明細書に記載される1つまたは複数の実施形態に従って帯域幅および体感品質(QoE)方式が提供され得る、好適なメディア分散ネットワークを介して提供される360度コンテンツ/サービスにアクセスするかまたはそれを消費し得る。
【0040】
本特許開示の1つまたは複数の実施形態は、ソフトウェア、ファームウェア、および/またはハードウェアの異なる組合せを使用して実装され得る。したがって、図(たとえば、フローチャート)に示されている技法のうちの1つまたは複数が、1つまたは複数の電子デバイスまたはノード(たとえば、サブスクライバクライアントデバイスまたはエンドステーション、ネットワークエレメントなど)に記憶され、その上で実行される、コードおよびデータを使用して実装され得る。そのような電子デバイスは、非一時的コンピュータ可読記憶媒体(たとえば、磁気ディスク、光ディスク、ランダムアクセスメモリ、読取り専用メモリ、フラッシュメモリデバイス、相変化メモリなど)、一時的コンピュータ可読伝送媒体(たとえば、搬送波、赤外線信号、デジタル信号など、伝搬信号の電気、光学、音響または他の形態)など、コンピュータ可読媒体を使用して、コードおよびデータを記憶および(内部でおよび/またはネットワークを介して他の電子デバイスとともに)通信し得る。さらに、そのようなネットワークエレメントは、一般に、1つまたは複数の記憶デバイス(たとえば、非一時的機械可読記憶媒体)ならびに(1つまたは複数の)記憶データベース、ユーザ入出力デバイス(たとえば、キーボード、タッチスクリーン、ポインティングデバイス、および/またはディスプレイ)、ならびにシグナリングおよび/またはベアラメディア送信を実現するためのネットワーク接続など、1つまたは複数の他の構成要素に結合された1つまたは複数のプロセッサのセットを含み得る。プロセッサのセットと他の構成要素との結合は、一般に、任意の知られている(たとえば、対称的/共有多重処理)またはこれまで知られていないアーキテクチャにおいて構成された、1つまたは複数のバスおよび(バスコントローラとも呼ばれる)ブリッジを通したものであり得る。したがって、所与の電子デバイスまたはネットワークエレメントの記憶デバイスまたは構成要素は、本開示の1つまたは複数の技法を実装する目的で、そのエレメント、ノードまたは電子デバイスの1つまたは複数のプロセッサ上での実行のためのコードおよび/またはデータを記憶するように設定され得る。
【0041】
当業者は、上記の一般化された例示的なネットワーク環境が、たとえば、ソースストリームスティッチング、プロジェクションマッピング、ソースメディア圧縮、タイル/ABRエンコーディング/トランスコーディング、パッケージングなど、ならびに、1つまたは複数のオペレータ、コンテンツ配信ネットワーク(CDN)、エッジネットワークなどを伴う、異なる階層レベルにおいて配設された異なるネットワーク部分において行われる分散/アップローディングおよびエッジノードプロセスを含む、メディアキャプチャおよび準備の様々な態様とともに、階層ネットワークアーキテクチャにおいて実装され得ることを、認識されよう。さらに、いくつかの実装形態では、上記の装置およびプロセスのうちの少なくともいくつかが、クラウドベースであり得る。いくつかの構成では、CDNは、インターネットまたは他のパブリック/プライベート通信ネットワークに接続された複数のデータセンタにおいて展開されるサーバの大きい分散システムであり得る。CDNは、管理されたまたは管理されないネットワークであり得、管理されたまたは管理されないネットワークの連合でもあり得る。
【0042】
上記の例示的なネットワーク環境内に動作可能に関連するメディアサーバ/ソースシステムの例示的な一実施形態は、したがって、ライブソースおよび/または静的ファイルソース、たとえば、Hulu(登録商標)、Netflix(登録商標)、YouTube(登録商標)、またはAmazon(登録商標)Primeなどのオンラインコンテンツプロバイダ、ならびに、たとえば、Disney、Warner、Sonyなど、VODカタログまたはコンテンツプロバイダまたはスタジオなどから、メディアコンテンツを受け取るように、たとえば、グローバルヘッドエンドとして、設定され得る。ライブソースからのメディアコンテンツは、任意のタイプのイベント、たとえば、スポーツ/エンターテインメント/ゲーミングイベント、コンサート、ライブTVショー、たとえば、全国放送事業者(たとえば、NBC、ABCなど)などのライブニュース放送ソース、ならびに、広告メディアチャネルなどの任意の2次メディア挿入物を含む、CNN、ESPN、CNBCなど、およびローカル放送事業者などの、Time Warnerチャネルのようなケーブル放送事業者チャネルに関してキャプチャされたライブプログラミングを備え得る。
【0043】
様々な実施形態が、本明細書で(および任意の付属書類において)説明されたが、それらの実施形態は、限定ではなく、例として提示されたにすぎないことを理解されたい。したがって、本開示の広さおよび範囲は、上記で説明された例示的な実施形態のいずれによっても限定されるべきでない。その上、本明細書で別段に示されていない限り、またはコンテキストによって明確に否定されていない限り、上記で説明されたエレメントのそれらのすべての考えられる変形形態における任意の組合せが、本開示によって包含される。
【0044】
さらに、上記で説明され、図面に示されたプロセスは、ステップのシーケンスとして示されたが、これは、説明のためにのみ行われた。したがって、いくつかのステップが追加され得、いくつかのステップが省略され得、ステップの順序が並べ替えられ得、いくつかのステップが並行して実施され得ることが企図される。
図1
図2
図3
図4
図5
図6
【手続補正書】
【提出日】2024-01-16
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
ピクチャを符号化するための方法であって、前記方法は、
現在ピクチャから1または2離れた距離をもつ、前記現在ピクチャの両側の各ピクチャについて、第1の誤差値Eを算出することであって、前記第1の誤差値Eが、前記現在ピクチャの第1のブロックサイズのブロックのセットのうちの各ブロックについて算出され、前記現在ピクチャのそれぞれのブロックと前記ピクチャ中の対応するブロックとに基づく、第1の誤差値Eを算出することと、
前記現在ピクチャから1または2離れた距離をもつ、前記現在ピクチャの両側の各ピクチャについて、前記ピクチャに対応する第2の誤差値E’を生成するために、第2のブロックサイズのブロック中に含まれている前記第1のブロックサイズのブロックの前記セットのうちの各ブロックについて前記第2のブロックサイズの前記ブロックにわたって前記第1の誤差値Eをアグリゲートすることと、
前記現在ピクチャから1または2離れた距離をもつ、前記現在ピクチャの両側の前記ピクチャのうちの1つまたは複数に対応する前記第2の誤差値E’に少なくとも部分的に基づいて、前記現在ピクチャ中の前記第2のブロックサイズの前記ブロックについて重要性スコアを算出することと、
前記重要性スコアに基づいて、前記現在ピクチャ中の前記第2のブロックサイズの前記ブロックについて量子化パラメータ(QP)値の変化を算出することと、
QP値の前記変化をエンコーダにシグナリングすることと
を含む、方法。
【請求項2】
前記第1の誤差値Eを算出することが、時間フィルタ処理中に実施される、請求項1に記載の方法。
【請求項3】
前記ピクチャに対応する第2の誤差値E’を生成するために、前記第2のブロックサイズの前記ブロック中に含まれている前記第1のブロックサイズの各ブロックについて前記第2のブロックサイズの前記ブロックにわたって前記第1の誤差値Eをアグリゲートすることが、前記第2のブロックサイズの前記ブロック中に含まれている前記第1のブロックサイズの各ブロックについて前記第1の誤差値Eを平均化することを含む、請求項1に記載の方法。
【請求項4】
前記第2のブロックサイズの前記ブロックが、コーディングツリーユニット(CTU)を含む、請求項1に記載の方法。
【請求項5】
前記第1のブロックサイズのブロックについての前記第1の誤差値Eが、前記ブロックの分散V、および前記ブロックと前記ピクチャ中の前記対応するブロックとの間の2乗差分和(SSD)に基づく、請求項1に記載の方法。
【請求項6】
前記第1のブロックサイズのブロックについての前記第1の誤差値Eが、
によって計算され、ここで、a、b、c、およびdがパラメータである、請求項5に記載の方法。
【請求項7】
第3の誤差値E1を生成するために、前記現在ピクチャから1の距離離れたピクチャに対応する前記第2の誤差値E’をアグリゲートすることと、
第4の誤差値E2を生成するために、前記現在ピクチャから2の距離離れたピクチャに対応する前記第2の誤差値E’をアグリゲートすることと、
前記第3の誤差値E1と前記第4の誤差値E2とに基づいて、第5の誤差値E4を計算することと
をさらに含み、
前記現在ピクチャ中の前記第2のブロックサイズの前記ブロックについて重要性スコアを算出することが、前記第5の誤差値E4に少なくとも部分的に基づく、請求項1に記載の方法。
【請求項8】
第3の誤差値E1を生成するために、前記現在ピクチャから1の距離離れたピクチャに対応する前記第2の誤差値E’をアグリゲートすることが、第3の誤差値E1を生成するために、前記現在ピクチャから1の距離離れたピクチャに対応する前記第2の誤差値E’を平均化することを含み、第4の誤差値E2を生成するために、前記現在ピクチャから2の距離離れたピクチャに対応する前記第2の誤差値E’をアグリゲートすることが、第4の誤差値E2を生成するために、前記現在ピクチャから2の距離離れたピクチャに対応する前記第2の誤差値E’を平均化することを含む、請求項7に記載の方法。
【請求項9】
の誤差値E1と前記第4の誤差値E2とに基づいて第5の誤差値E4を計算することが、
E4=max(E1,E2)+abs(E2-E1)*A
を算出することを含み、ここで、Aがパラメータである、請求項7に記載の方法。
【請求項10】
前記第5の誤差値E4が、時間フィルタ処理のレイヤに基づいて修正される、請求項7に記載の方法。
【請求項11】
時間フィルタ処理の最上位レイヤについて、前記第5の誤差値E4が、E4=x*E4+yとして修正され、ここで、xおよびyがパラメータである、請求項10に記載の方法。
【請求項12】
QP値の前記変化が、{-2,-1,0,+1,+2}のうちの1つである、請求項1に記載の方法。
【請求項13】
エンコーダの処理回路によって実行されたとき、前記エンコーダに、請求項1から12のいずれか一項に記載の方法を実施させる命令を含む、コンピュータプログラム。
【請求項14】
請求項13に記載のコンピュータプログラムを記憶する、コンピュータ可読記憶媒体
【請求項15】
エンコーダであって、前記エンコーダが、
処理回路と、
メモリと
を備え、前記メモリが、前記処理回路によって実行可能な命令を含んでおり、それにより、前記エンコーダが、請求項1から12のいずれか一項に記載の方法を実施するように設定された、エンコーダ。
【請求項16】
ピクチャを符号化するように設定されたエンコーダであって、前記エンコーダは、
現在ピクチャから1または2離れた距離をもつ、前記現在ピクチャの両側の各ピクチャについて、第1の誤差値Eを算出することであって、前記第1の誤差値Eが、前記現在ピクチャの第1のブロックサイズのブロックのセットのうちの各ブロックについて算出され、前記現在ピクチャのそれぞれのブロックと前記ピクチャ中の対応するブロックとに基づく、第1の誤差値Eを算出することと、
前記現在ピクチャから1または2離れた距離をもつ、前記現在ピクチャの両側の各ピクチャについて、前記ピクチャに対応する第2の誤差値E’を生成するために、第2のブロックサイズのブロック中に含まれている前記第1のブロックサイズのブロックの前記セットのうちの各ブロックについて前記第2のブロックサイズの前記ブロックにわたって前記第1の誤差値Eをアグリゲートすることと、
前記現在ピクチャから1または2離れた距離をもつ、前記現在ピクチャの両側の前記ピクチャのうちの1つまたは複数に対応する前記第2の誤差値E’に少なくとも部分的に基づいて、前記現在ピクチャ中の前記第2のブロックサイズの前記ブロックについて重要性スコアを算出することと、
前記重要性スコアに基づいて、前記現在ピクチャ中の前記第2のブロックサイズの前記ブロックについて量子化パラメータ(QP)値の変化を算出することと、
QP値の前記変化をエンコーダにシグナリングすることと
を行うように設定された、エンコーダ。
【請求項17】
前記エンコーダが、請求項2から12のいずれか一項に記載の方法を実施するようにさらに設定された、請求項16に記載のエンコーダ。
【国際調査報告】