【実施例】
【0014】
本発明の明細書及び特許請求の範囲では、バイナリ・ラージ・オブジェクト又はブラブ(blob)の語は、画素などのビデオ・ピクチャ要素が接触しており、同じ論理状態を有する、ビデオ・ピクチャの領域を表すために使用される。ブラブ解析の同様な使用は、色、色相等などの要素に共通の特性に基づいた、連続領域を形成するビデオ・ピクチャの要素の識別を必要とする。ブラブ及びブラブ解析という語の前述の例は、本明細書及び特許請求の範囲記載の例に限定されず、本発明の原理と一貫して施すものとする。
【0015】
更に、本明細書及び特許請求の範囲記載のビデオ・ピクチャの語は、動くビデオ・ピクチャの系列からのビデオ情報を表すものとする。ビデオ・ピクチャにおけるバンディング・アーチファクトを識別するための、本明細書及び特許請求の範囲記載の種々の手法はビデオ・フレームに適用することが可能である。ビデオ・フレーム、ビデオ・ピクチャ及びビデオ画像は、別々のビデオ符号化標準に対して特有の意味を有し得るが、ビデオ・フレーム、ビデオ・ピクチャ及びビデオ画像の語は本明細書中、同義で使用されているからである。
【0016】
図1は、バンディング・アーチファクト検出器150を一体化した、本願の原理とともに使用することが可能な例示的なビデオ符号化器100を示す。前述の符号化器の仕組みの説明は、当業者に知られており、ここでは反復して説明しないものとする。この例では、バンディング・アーチファクト検出器150は、入力ビデオ源及び参照ピクチャ・バッファ152からの入力を受け取る。
【0017】
図2は、バンディング・アーチファクト検出器250が、バンディング・アーチファクト検出処理の参照として元のビデオ源を使用しないか、又は前述の元のビデオ源へのアクセスを有せず、参照ピクチャ・バッファ152にのみ接続される別の例示的なビデオ符号化器200を示す。
【0018】
マルチパス・ビデオ符号化器の場合、本願の原理のバンディング・アーチファクト検出方法を使用して、先行符号化パスによってもたらされたバンディング・アーチファクトを検出することが可能である。
図3a及び
図3bは、マルチパス・ビデオ符号化器300及び350それぞれの例示的な実施例を開示している。ここで、バンディング・アーチファクト検出器320は、参照ビデオ情報として元のビデオ源のコンテンツを使用するか、又は使用しない。
図3aは、元のビデオ源が、利用可能であり、バンディング・アーチファクト検出320への参照として使用されるシナリオを示し、
図3bは、元のビデオ源が、利用可能でなく、前述のビデオ情報は参照として使用することが可能でない場合を示す。
【0019】
本発明の原理の実現形態によれば、バンディング・アーチファクト検出の入力は、ビット深度の削減などの特定の処理後のビデオ・コンテンツ、圧縮後の再構成ビデオ・コンテンツ等を含む。前述の通り、元のビデオ・コンテンツが利用可能な場合、前述の情報を、ビデオ処理動作の参照として使用することが可能である。しかし、元のビデオ源コンテンツが利用可能でなくても、本発明の原理は、元のビデオ源コンテンツにおいてバンディング・アーチファクトが存在しないという前提でなお動作し得る。
【0020】
本発明の原理の一部は、バンディング・アーチファクトの場所を表す出力をもたらす。本発明の原理の各種実現形態によれば、バンディング・アーチファクトの前述の出力場所を規定するための代替案がいくつか存在する。例えば、バンディング・アーチファクトは、マクロブロック位置又は画素位置に位置し得る。あるいは、アーチファクトの空間的場所についての更なる詳細を提供することなく、どのピクチャがバンディング・アーチファクトによって影響を受けているかについての表示を提供することが可能である。
【0021】
本発明の他の局面によれば、バンディング・アーチファクトが検出された、ビデオ処理動作の結果として生じる出力ビデオの領域にマーキングすることが可能である。前述のマーキングはメタデータとして保存し、バンディング・アーチファクトを除去するために手作業の再符号化処理を行うために操作者によって使用することが可能である。前述のマーキング・データは、ビデオ・データ・ビットストリームにおいて伝えられず、復号化器によって影響を受けず、又は、復号化器によって使用されない。最終的には、前述のマーキング情報を補助拡充情報として伝えて、表示装置が、ある特定の後処理を行うことを可能にすることができる。
【0022】
本願の原理の方法及び装置をビデオ・データの輝度成分及び色成分に適用することが可能であるということを当業者は認識するであろう。しかし、以下の例示的な説明では、本願の原理の方法は、輝度成分にのみ、適用される。
【0023】
図4aに示すバンディング・アーチファクト検出方法400aの一実現形態によれば、3つの主工程が存在している。
【0024】
1)マスク画像(402)を生成して、バンディング・アーチファクトを含む潜在的な領域を検出する。例示的な実現形態では、大局的なグラディエントの変化に基づいてマスク画像を生成することが可能である。
【0025】
2)マスク画像(404)のスケーリング。この工程は、スケーリング値が1に等しい場合、任意である。1と異なるスケーリング値を使用して検出を容易にすることが可能である。
【0026】
3)バンディング・アーチファクト(406)の検出。例示的な実現形態では、この検出工程は、局所グラディエントの計算に依拠する。
【0027】
この例示的な実施例から始めて、マスク画像が作成される(402)。この作成は、バンディング・アーチファクトを含む潜在的な領域を検出するために、求められた大局的なグラディエントの変化に基づく。前述の通り、平滑であるか、又は緩徐なグラディエントの変化の領域においてバンディング・アーチファクトが生じる傾向にあり、非常に目立つ。前述の領域が、本願の原理の範囲から逸脱しない限り、(正則又は非正則の多角形等などの)何れの形状を有していてもよいということを当業者は認識することになるというものであっても、本発明の本願の原理は、前述の領域が、(例えば、矩形又は方形の)画素のブロックを有しているとみなす。マスク画像が作成されると、マスク画像に関連付けられた値がスケーリングされ(404)、それにより、バンディング・アーチファクトが次いで検出される(406)。
図4aに示す一実現形態によれば、どの領域がバンディング効果を有しているかについての表示をユーザ及び/又は別のアプリケーションに提供する(407)。
【0028】
図4bに示す別の実現形態によれば、マスク画像を作成する(402)前に、ビデオ・ストリーム(又はビデオ・ピクチャ系列)から得られたビデオ・ピクチャをブロックに分割すること(401)が可能である。本願の原理の別の実現形態による方法の更に詳細なフロー図を
図4cに示す。
図4cは、本願の原理の方法400cの修正された実現形態を示す。ここで、ブロックへのビデオ・ピクチャの分割/セグメント化(401)の後、グラディエント・フィールドが、ブロックに関連付けられた属性を使用して生成される(410)。前述のグラディエント・フィールドが生成されると、複数のブラブが、グラディエント・フィールド内の要素から生成される(412)。ブラブが生成されると、工程414は、ブラブに対応するピクチャの領域が、バンディング・アーチファクトを含む領域にあるか否かを確認する。
【0029】
図5乃至
図8は、ビデオ・ピクチャ系列に対応する元のビデオ・コンテンツが参照として利用可能である場合に、ビット深度削減及びビデオ圧縮のアプリケーションにおけるバンディング・アーチファクト検出方法のブロック図を示す。例として、
図5は、元のビデオ源がビット深度削減回路502及び仮想画素修正回路508に入力される方法500を示す。ビット深度が削減されたビデオ源は、大局的なグラディエント計算504、テクスチャ検出506及び仮想画素修正508を経る。仮想画素修正ブロックの出力は、修正されたビット深度削減ビデオ源及び修正されたビデオ源である。前述の2つの入力は、画素ベースのグラディエント計算回路510によって受信され、その出力を使用してバンディング・アーチファクト512を求める。出力は、識別されたバンディング・アーチファクトの場所を提供する。
【0030】
図6は、
図5に示す方法500の修正された方法600を示す。この実現形態では、元のビデオ源は仮想画素修正608に供給されない。そういうものとして、画素ベースのグラディエント計算610は、仮想画素修正回路608の単一の入力(すなわち、修正されたビット深度削減ビデオ源)のみを使用してグラディエントを計算する。前述の通り、バンディング・アーチファクト検出612は、元のビデオ源コンテンツにおいてバンディング・アーチファクトがないという前提で動作する。
【0031】
図7及び
図8は更なる修正方法700及び800を示す。前述の方法では、ビット深度削減の代わりに、ビデオ源はまず、ビデオ圧縮回路(702、802)によって圧縮され、再構成ビデオが大局的なグラディエント計算回路(704、804)に入力される。
図5及び
図6に示す例と同様に、
図7は、やはり、仮想画素修正回路708に入力されるビデオ源情報の使用を示す。
図8は、元のビデオ源情報が仮想画素修正回路808の参照として供給されないシナリオを示す。
【0032】
マスク画像の生成
図9及び
図10を参照すれば、マスク画像(402)を生成するために、新たなビデオ・ピクチャ/フレーム(902)及びアルゴリズム設定(904)の開始後に、特定のピクチャの画像領域は、前述の領域がバンディング・アーチファクトを含むか否かについてカテゴリ化される。この目的で、画素値の大局的なグラディエントが計算される(906)。
【0033】
画像領域カテゴリ化処理の例は、
図10に示す方法1000によって示す。画素値の大局的なグラディエントの変化を追跡するために、例として、画像全体の4×4の画素ブロック・サイドが形成される(1002)。小さな画素ブロックの画素値の平均が計算される(1004)。更に一般的な場合、k
1×k
2のブロック・サイズからの平均画素値が計算される(
図11を参照されたい)。平均値は、単に、画素を平均化するか、又は、離散コサイン変換(DCT)などのブロック変換のDC値を得ることによって取得することが可能である。k
1及びk
2の値は、変動し得、互いに等しくなくてよい。この例では、k
1=k
2=4である。k
1×k
2ブロックそれぞれの平均画素値で、平均画素値の平面(層)を、
図11に示すように、形成する(1006)ことが可能である。平均画素値の平面は「DC平面」として表される。DC平面は、そのk
1×k
2ブロックに対して同じ位置を有する平均画素値の組として定義される。例えば、第1のk
1×k
2ブロックの平均画素値は、DC平面の位置(1,1)になる。ビデオ・フレームが、1920画素及び1080画素それぞれに等しい、輝度(Y)成分の幅及び長さを有すると仮定する。その場合、
DC平面のサイズは、1920/k
1 × 1080/k
2に等しい。
【0034】
次に、DC平面における各要素のグラディエントが計算される(1008)。前述の作業を行うための別々の方法が多く存在している。例として、ゼロ交差演算子や、Marr−Hildreth演算子などの2次演算子、又は、Roberts Cross、Prewitt、Sobelや、Cannyなどの1次演算子を使用することが可能である。ここで、この概念はSobel演算子を使用して例証する。ここで、x方向及びy方向における畳込みカーネルを(1)及び(2)それぞれにおいて示す。
【0035】
【数1】
【0036】
【数2】
DC平面における何れかの位置(i,j)におけるグラディエントのおおよその大きさは、
【数3】
として計算することが可能である。ここで、
【数4】
はDC平面の位置(i,j)におけるグラディエント、x方向のグラディエント、及びy方向のグラディエントのおおよその大きさである。
【0037】
次に、DC平面におけるブロックのI
1×I
2サンプルの平均及び分散が計算される。例示的な実施例では、この計算はブラブとして表す(1010)。
【0038】
この例では、I
1=I
2=10である。k
1×k
2のブロック・サイズの画素がDC平面の生成に使用される場合、ブラブ・サイズは幅がI
1×k
1画素、及び高さがI
2×k
2画素に対応する。すなわち、ブラブ・サイズは画素数で、この例では40×40に等しい。各ブラブにおけるグラディエントの平均及び分散が、算出され(1012)、画像領域のカテゴリ化を行うために使用される。画像のカテゴリ化における基準は、例示的な実現形態に応じて以下のように表すことが可能である。ブラブ・グラディエントの平均及び分散が、それぞれの閾値(Th1,Th2)よりも大きい場合、対応するブラブは、テクスチャ領域として表されるか、又はマーキングされる。
【0039】
閾値/値は、アプリケーション及び/又はコンテンツ・タイプに応じて、ユーザによって供給されるか、又はテーブルから読み出され得る。閾値の値における増加は、平滑な領域としてカテゴリ化された領域の数における増加になり、(アルゴリズムは、平滑な領域において走査するので)検出バンディング・アーチファクトの数における増加になる。さもなければ、ブラブは、(平滑な変化、又は平坦な領域などの)非テクスチャ領域として表されるか、又はマーキングされ(1018)、マーキングされた平滑な変化、又は平坦な領域はそれにより、バンディング・アーチファクトを含む潜在的な領域として示される。
【0040】
マスク画像の値のスケーリング
この第2の工程では、例示的な方法は、グラディエント演算子を使用してバンディング・アーチファクトの検出を可能にするようマスク画像の値をスケーリングする選択肢を導入する。この工程は、ビット深度削減又はビデオ圧縮が使用されるか否かに応じて、処理されたビデオ・ピクチャ/フレーム、又は再構成されたビデオ・ピクチャ/フレームに施される。このスケーリング工程は、元のビデオが参照として利用可能である(
図5及び
図7参照)場合、元のビデオ・ピクチャ/フレームに施すことも可能である。この処理は好ましいが、それは、バンディング・アーチファクト間の、画素値の差がわずかであり、さもなければ検出が難しいことがあり得るからである。本願の原理によれば、非線形スケーリング処理を使用して、平滑な領域における画素差を増加させる。前述の変換は、以下に説明するように、グラディエント演算子を使用してバンディング・アーチファクトを検出することを可能にする。
【0041】
図12は、本発明の現在の原理の実現形態による画素値の非線形スケーリングの方法1200の例を示す。当初、画像内部のブラブは全て、考慮に入れる(1202)ことが可能である。次いで、ブラブ領域がどのようにしてマーキングされるかに影響を及ぼす、テクスチャあり、又はテクスチャなしの領域をブラブが表すか否かについて判定が行われる(1204)。ブラブ領域がテクスチャ領域としてマーキングされている場合、領域内の画素は全て、一定の値(1206)に設定され、処理は終了する。ブラブ領域が非テクスチャ領域としてマーキングされている場合、画素は全て、次いで、正の値によってスケーリングされ(1208)、処理は終了する(1210)。その結果、この処理のうち、グラディエント演算子が、スケーリングされたビデオ・フレームに施された場合、テクスチャ領域におけるグラディエントはゼロに等しくなり、前述の領域は、バンディング・アーチファクトの検出の処理から自動的に排除されることになる。したがって、非テクスチャ領域における画素のスケーリングは、既存のバンディング・アーチファクトを更によく識別できるようにし、周囲画素に対して目立つ可能性が高くなるようにしている。
【0042】
局所グラディエントに基づいたバンディング・アーチファクトの検出。
【0043】
図9をもう一度参照すれば、画素レベルのグラディエント計算(916)は、再構成画像及び元の画像(前述の元の画像が利用可能な場合)の先行スケーリング・データに施される。前述の通り、Prewitt演算子、Canny演算子やSobel演算子などの考えられるグラディエント検出演算子が多く存在している。本願の例では、上記(1)及び(2)に示すようなSobel演算子はグラディエント検出演算子として使用される。この時点で、元の画像データが利用可能な否かについての判定が行われる(918)。肯定の場合、グラディエント画像が元の画像と比較され(920)、結果が入力としてアーチファクト検出処理に供給される(922)。元のビデオ・コンテンツ・デ―タが利用可能でない場合、この工程におけるグラディエント検出演算子からの結果を閾値と比較して、画像領域がバンディング・アーチファクトを含んでいるかを判定する(922)。輪郭をバンディング・アーチファクトとしてマーキングすべきか否かを判定するために使用される閾値は、この工程前にユーザによって供給することが可能であるか、又はルックアップ・テーブルから読み出すことが可能である。閾値の増加は、アーチファクトの検出の減少になる。閾値の減少は、アーチファクトの検出の増加になる。特定の閾値の選択は、コンテンツ・タイプ及び/又は何れかの他の利用可能な情報に基づき得る。
【0044】
グラディエント検出演算子が所定の閾値を超える場合、対応する画素は、バンディング・アーチファクトの一部として表され、前述の領域は、そういうものとしてマーキングされる(924)。さもなければ、対応する領域は、バンディング・アーチファクトの一部でないとして識別され、そういうものとしてマーキングされる(910)。この時点で、この領域が、ビデオ・ピクチャ/フレームにおける最後の領域であるか否かについての判定が行われる(926)。肯定の場合、これが、ピクチャのビデオ系列の最後のピクチャ/フレームであるか否かについての別の判定が行われる(928)。工程926における結果が否定の場合、処理は、工程904で、始めからやり直す。工程928における結果が否定の場合、新たなピクチャが工程902で解析され、処理が繰り返される。ビデオ系列にもうピクチャが存在しない場合、処理は工程930で終了する。
【0045】
前述の通り、元のビデオ情報が利用可能な場合、前述の情報を参照として使用することが可能である。この処理は、元のビデオ情報の圧縮処理によってもたらされるアーチファクトを、元のビデオ・コンテンツの一部であるアーチファクトと区別することを可能にする。したがって、元々存在する輪郭を、ビデオ圧縮処理によって生じる輪郭と分離することが重要である。再構成されたもの及び元のものの画素レベルのグラディエントが比較される(工程918、920(
図9))。本明細書及び特許請求の範囲では、「グラディエント歪み」は、再構成されたビデオ・データの画素のグラディエントが元のものに対して歪んでいるかを決定するための尺度として定義される。グラディエント歪み計算の例では、
【数5】
として計算することが可能である。ここで、G
x,p.org(i,j)及びG
y,p.org(i,j)は、位置(i,j)における元のビデオ・データのマスク画像からのx方向及びy方向それぞれの画素レベルにおけるグラディエントである。G
x,p(i,j)及びG
y,p(i,j)は、位置(i,j)における再構成ビデオ・データのマスク画像からのx方向及びy方向それぞれの画素レベルにおけるグラディエントである。D
G(i,j)が1に近い場合、処理されたか、又は再構成されたビデオ・フレームにおける位置(i,j)のグラディエントが、元のものと比較して、あまり変わらないということを前述の判定は意味する。D
G(i,j)は、ゼロに達すると、この値は、処理されたか、又は再構成されたビデオ・フレームと、元のビデオ・フレームとの間にかなりの差が存在していることを意味し、D
G(i,j)は閾値と比較される(922)。D
G(i,j)が閾値を超える場合、画素は、バンディング・アーチファクトの一部と表される。バンディング・アーチファクトの一部として表された画素を含む画像領域は、バンディング・アーチファクトを含む領域としてマーキングされる(924)。例として、バンディング・アーチファクトの一部として表された画素を含むマクロブロックは、検出領域としてマーキングされる。
【0046】
本明細書及び特許請求の範囲記載の実現形態は、例えば、方法若しくは処理、装置、又はソフトウェア・プログラムで実現することが可能である。単一の形式の実現形態の意味合いでしか(例えば、方法としてしか)記載されてない場合でも、記載された構成の実現形態は、他の形式(例えば、装置又はプログラム)で実現することも可能である。装置は例えば、適切なハードウェア、ソフトウェア及びファームウェアで実現することが可能である。方法は例えば、コンピュータ、マイクロプロセッサ、集積回路や、プログラマブ論理装置を含む、一般に処理装置を表す装置(例えば、プロセッサ)で実現することが可能である。処理装置は、エンドユーザ間の情報の通信を容易にする通信装置(例えば、コンピュータ、携帯電話機、ポータブル/パーソナル携帯情報端末(「PDA」)や他の装置も含む。
【0047】
本明細書及び特許請求の範囲記載の種々の処理及び構成の実現形態は、例えば、各種機器又はアプリケーションにおいて、特に、データ送信及び受信に関連付けられた機器又はアプリケーションについて実施することが可能である。機器の例には、ビデオ符号化器、ビデオ復号化器、ビデオ・コデック、ウェブ・サーバ、セットトップ・ボックス、ラップトップ、パソコン、他の通信装置、及びモバイル装置が含まれる。
【0048】
更に、方法は、プロセッサによって行われる命令によって実現することが可能であり、前述の命令は、プロセッサ読み取り可能な媒体(例えば、集積回路、ソフトウェア担体や他の記憶装置(例えば、ハード・ディスク、コンパクト・ディスケット(登録商標)、ランダム・アクセス・メモリ(「RAM」)やリードオンリー・メモリ「ROM」))上に記憶することが可能である。命令は、プロセッサ読み取り可能な媒体上に有形に実施されたアプリケーション・プログラムを構成することが可能である。プロセッサは明らかに、例えば、処理を行うための命令を有するプロセッサ読み取り可能な媒体を含み得る。
【0049】
当業者に分かるように、実現形態は、例えば、記憶又は伝送することが可能な情報を搬送するようフォーマッティングされた信号を生成することも可能である。情報は例えば、前述の実現形態のうちの1つによって生成されるデータ、又は方法を行うための命令であり得る。前述の信号は例えば、電磁波(例えば、スペクトルの無線周波数部分を使用して)として、又はベースバンド信号としてフォーマッティングすることが可能である。フォーマッティングは例えば、データ・ストリームの符号化、符号化ストリームのパケット化、及びパケット化ストリームによる搬送波の変調を含み得る。信号が搬送する情報は例えば、アナログ情報又はディジタル情報であり得る。信号は、知られているように、各種有線リンク又は無線リンクを介して伝送することが可能である。
【0050】
いくつかの実現形態を説明してきた。しかし、種々の修正を行うことができることが理解されるであろう。例えば、種々の実現形態の構成要素を組合せ、補完し、修正し、又は除外して、他の実現形態をもたらすことが可能である。更に、他の構造及び処理を、開示されたものと置き換えることが可能であり、結果として生じる実現形態は少なくとも実質的に同じ機能を少なくとも実質的に同じやり方で行って、開示された実現形態と、少なくとも実質的に同じ結果を達成することを当業者は理解するであろう。よって、前述及び他の実現形態は、特許請求の範囲記載の範囲内に収まる。