特許6067737 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ トムソン　ライセンシングの特許一覧

特許6067737ビデオ品質測定のための方法、装置、コンピュータプログラム、及び記憶媒体

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

2
4
5
6
1A
1B
1C
3A
3B
3C

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】6067737

(24)【登録日】2017年1月6日

(45)【発行日】2017年1月25日

(54)【発明の名称】ビデオ品質測定のための方法、装置、コンピュータプログラム、及び記憶媒体

(51)【国際特許分類】

H04N 17/00 20060101AFI20170116BHJP

H04N 17/02 20060101ALI20170116BHJP

G06T 5/20 20060101ALI20170116BHJP

H04N 1/409 20060101ALI20170116BHJP

G06T 7/00 20170101ALI20170116BHJP

【ＦＩ】

H04N17/00 Z

H04N17/02 A

G06T5/20

H04N1/40 101D

G06T7/00 Q

【請求項の数】16

【全頁数】18

(21)【出願番号】特願2014-543751(P2014-543751)

(86)(22)【出願日】2012年4月23日

(65)【公表番号】特表2015-500581(P2015-500581A)

(43)【公表日】2015年1月5日

(86)【国際出願番号】CN2012074522

(87)【国際公開番号】WO2013078822

(87)【国際公開日】20130606

【審査請求日】2015年4月23日

(31)【優先権主張番号】PCT/CN2011/083154

(32)【優先日】2011年11月29日

(33)【優先権主張国】CN

(73)【特許権者】

【識別番号】501263810

【氏名又は名称】トムソンライセンシング

【氏名又は名称原語表記】ＴｈｏｍｓｏｎＬｉｃｅｎｓｉｎｇ

(74)【代理人】

【識別番号】100107766

【弁理士】

【氏名又は名称】伊東忠重

(74)【代理人】

【識別番号】100070150

【弁理士】

【氏名又は名称】伊東忠彦

(74)【代理人】

【識別番号】100091214

【弁理士】

【氏名又は名称】大貫進介

(72)【発明者】

【氏名】ジャンファン

(72)【発明者】

【氏名】シエカイ

(72)【発明者】

【氏名】ジアンウェンフェイ

(72)【発明者】

【氏名】チェンジーボー

【審査官】秦野孝一郎

(56)【参考文献】

【文献】特表２０１１−５１０５６２（ＪＰ，Ａ）

【文献】特開２０１１−１３４２０４（ＪＰ，Ａ）

【文献】特表２０１１−５０７４０４（ＪＰ，Ａ）

【文献】特開２００８−２７８１８５（ＪＰ，Ａ）

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｈ０４Ｎ１７／００

Ｈ０４Ｎ１７／０２

Ｇ０６Ｔ５／２０

Ｈ０４Ｎ１／４０９

Ｇ０６Ｔ７／００

(57)【特許請求の範囲】

【請求項1】

ビデオ品質を推定するための方法であって、
少なくとも１つの画像領域を有する画像データにアクセスするステップと、
前記画像領域をストラクチャ成分およびテクスチャ成分に分解するステップと、
前記画像領域の前記ストラクチャ成分のエッジ強度を判断するステップと、
前記エッジ強度に応じてテクスチャマスキング重みを判断するステップと、
前記テクスチャマスキング重みに応じて品質メトリックを判断するステップと、
を含む、前記方法。

【請求項2】

双方向フィルタを使用して、前記画像領域を前記ストラクチャ成分および前記テクスチャ成分に分解する、請求項１に記載の方法。

【請求項3】

前記エッジ強度が閾値を超える場合、前記画像領域にエッジが存在すると判断するステップであって、前記エッジが前記画像領域に存在すると判断したとき、テクスチャマスキング特性が使用されないように前記テクスチャマスキング重みを設定する、ステップ
をさらに含む、請求項１に記載の方法。

【請求項4】

前記画像領域の前記テクスチャ成分に対してテクスチャ強度を判断するステップであって、前記テクスチャマスキング重みを前記判断するステップは、前記エッジ強度および前記テクスチャ強度に応じたものである、ステップ
をさらに含む、請求項１に記載の方法。

【請求項5】

前記テクスチャ強度は、前記画像領域の前記テクスチャ成分の分散として判断される、請求項４に記載の方法。

【請求項6】

前記テクスチャ強度が閾値を超えない場合、前記画像領域が滑らかであると判断するステップであって、前記画像領域が滑らかであると判断したとき、テクスチャマスキング特性が使用されないように前記テクスチャマスキング重みを設定する、ステップ
をさらに含む、請求項４に記載の方法。

【請求項7】

前記画像データは、重複しない複数の画像領域を含み、前記分解するステップ、前記エッジ強度を判断するステップ、および前記テクスチャマスキング重みを判断するステップは、前記複数の画像領域の各々に対して実行され、前記品質メトリックは局所歪みの重み付けされた組合せに応じて判断され、前記局所歪みは前記テクスチャマスキング重みによって重み付けされる、請求項１に記載の方法。

【請求項8】

ビデオ品質を推定するための装置であって、
画像領域をストラクチャ成分およびテクスチャ成分に分解する画像分解器と、
前記画像領域の前記ストラクチャ成分のエッジ強度を判断するエッジ検出器と、
前記エッジ強度に応じてテクスチャマスキング重みを判断するテクスチャマスキング計算機と、
前記テクスチャマスキング重みに応じて品質メトリックを判断する品質予測器と、
を含む、前記装置。

【請求項9】

前記画像分解器において双方向フィルタが使用される、請求項８に記載の装置。

【請求項10】

前記エッジ検出器は、前記エッジ強度が閾値を超える場合、前記画像領域にエッジが存在すると判断し、前記テクスチャマスキング計算機は、前記エッジが前記画像領域に存在すると判断したとき、テクスチャマスキング特性が使用されないように前記テクスチャマスキング重みを設定する、請求項８に記載の装置。

【請求項11】

前記画像領域の前記テクスチャ成分に対してテクスチャ強度を判断するテクスチャ強度計算機をさらに含み、前記テクスチャマスキング計算機は前記エッジ強度および前記テクスチャ強度に応じて前記テクスチャマスキング重みを判断する、請求項８に記載の装置。

【請求項12】

前記テクスチャ強度は、前記画像領域の前記テクスチャ成分の分散として判断される、請求項１１に記載の装置。

【請求項13】

前記テクスチャ強度計算機は、前記テクスチャ強度が閾値を超えない場合、前記画像領域が滑らかであると判断し、前記テクスチャマスキング計算機は、前記画像領域が滑らかであると判断されるときテクスチャマスキング特性が使用されないように前記テクスチャマスキング重みを設定する、請求項１１に記載の装置。

【請求項14】

前記装置によりアクセスされる画像データは、重複しない複数の画像領域を含み、前記画像分解器における分解、前記エッジ検出器におけるエッジ強度の判断、および前記テクスチャマスキング計算機におけるテクスチャマスキング重みの判断が、前記複数の画像領域の各々に対して実行され、前記品質予測器は局所歪みの重み付けされた組合せに応じて前記品質メトリックを判断し、前記局所歪みは前記テクスチャマスキング重みによって重み付けされる、請求項８に記載の装置。

【請求項15】

請求項１ないし７のうち何れか１項に記載の方法を装置のプロセッサに実行させる命令を有するコンピュータプログラム。

【請求項16】

請求項１５に記載のコンピュータプログラムを格納した記憶媒体。

【発明の詳細な説明】

【技術分野】

【0001】

関連出願
本出願は、参照により組み込まれる、２０１１年１１月２９日に出願された国際特許出願第ＰＣＴ／ＣＮ２０１１／０８３１５４号の利益を主張する。

【0002】

本発明は、ビデオ品質測定に関し、より詳細には、人間の視覚系のテクスチャマスキング特性に応じたビデオ品質測定法を判断するための方法および装置に関する。

【背景技術】

【0003】

ビデオ符号化、ネットワークスケジューリング、およびマルチメディアサービスの提案において、ビデオ品質メトリックが使用されることがある。一般に、ビデオコンテンツがよりテクスチャのあるものであるほど、ビデオコンテンツ中のより多くのアーチファクトは、人間の目に許容される可能性がある。すなわち、ビデオコンテンツが人間の目によって見られるとき、視覚アーチファクトが、ビデオコンテンツ自体によってマスクされることがある。人間の目のこの特性は、テクスチャマスキング特性（ｔｅｘｔｕｒｅｍａｓｋｉｎｇｐｒｏｐｅｒｔｙ）として知られている。

【発明の概要】

【課題を解決するための手段】

【0004】

一般的な態様によれば、少なくとも１つの画像領域を有する画像データがアクセスされる。画像領域は、ストラクチャ成分およびテクスチャ成分に分解される。画像領域のストラクチャ成分について、エッジ強度が判断され、画像領域のエッジ強度に応じて、テクスチャマスキング重みが判断される。次にテクスチャマスキング重みに応じて、品質メトリックが判断される。

【0005】

別の一般的な態様によれば、複数の画像領域を有する画像データがアクセスされる。画像データは、ストラクチャ成分およびテクスチャ成分に分解される。各画像領域のストラクチャ成分について、エッジ強度が判断され、各画像領域のエッジ強度に応じて、テクスチャマスキング重みが判断される。テクスチャマスキング重みで重み付けされた局所歪みの、重み付けされた組合せに応じて、品質メトリックが判断される。

【0006】

１つまたは複数の実装の詳細について、添付の図面および以下の説明で示す。１つの特定の方法で説明される場合でも、実装は様々な方法で構成される、または具体化されることがあることは明らかであろう。例えば、実装は、方法として行われる、例えば一連の動作を行うように構成された装置、もしくは一連の動作を行うための命令を格納する装置のような、装置として具体化されるか、または信号で具体化される場合がある。添付の図面および特許請求の範囲と併せて検討される次の詳細な説明から、他の態様および特徴が明らかになるであろう。

【図面の簡単な説明】

【0007】

【図1A】ピクチャを示す画像の例である。

【図1B】ピクチャのストラクチャ成分を示す画像の例である。

【図1C】ピクチャのテクスチャ成分を示す画像の例である。

【図2】本原理の一実施形態による、ビデオ品質メトリックを計算するための例を示す流れ図である。

【図3A】エッジマップを示す画像の例である。

【図3B】分散マップを示す画像の例である。

【図3C】本原理の一実施形態によるマスクされた分散マップを示す画像の例である。

【図4】本原理の１つまたは複数の実装とともに使用することができるテクスチャマスキング重み計算装置の例を示すブロック図である。

【図5】本原理の１つまたは複数の実装とともに使用されることがあるビデオ品質測定装置の例を示すブロック図である。

【図6】本原理の１つまたは複数の実装とともに使用されることがあるビデオ処理システムの例を示すブロック図である。

【発明を実施するための形態】

【0008】

ビデオ符号化、ネットワークスケジューリング、およびマルチメディアサービスにおいて、ビデオ品質メトリックが使用されることがある。基準ビデオの可用度によって、ビデオ品質メトリックは、フルリファレンスメトリック（ｆｕｌｌ−ｒｅｆｅｒｅｎｃｅｍｅｔｒｉｃ）またはノーリファレンスメトリック（ｎｏ−ｒｅｆｅｒｅｎｃｅｍｅｔｒｉｃ）として分類することができる。フルリファレンス品質メトリックについては、基準画像／ビデオと劣化画像／ビデオとの差が、画質に影響を与える主要な要因であるとすることができる。ノーリファレンス品質メトリックについては、量子化パラメータ（ＱＰ）またはブロック誤り率のような構成パラメータが、主要な要因となり得る。

【0009】

主要な要因に加えて、人間の視覚系のテクスチャマスキング特性もまた、認識される画質に影響を与える。したがって、多くの場合テクスチャマスキング特性は、ビデオ品質メトリックを設計するときシミュレートされる。例えば、ピクチャ中の領域は、視覚アーチファクトがマスクされる可能性があるテクスチャのある範囲とみなされることがあり、認識されるビデオ品質にあまり影響を与えないと考えられることがある。別の例では、ピクチャ中の領域は、テクスチャのない範囲（例えば、滑らかな範囲もしくはエッジを有する範囲）とみなされることがあり、認識される画質により多くの影響を与えると考えられることがある。

【0010】

テクスチャマスキング特性を活用するために、ピクチャ中の領域が、テクスチャのある領域、またはテクスチャのない領域として識別される必要がある。領域は、詳細なパターンおよび／または不規則なパターンを含んでいる場合、テクスチャのある領域と呼ばれる。そうでなければ、それはテクスチャのない領域と呼ばれ、通常、例えばエッジおよび輪郭のような構造（すなわち、重要な視覚情報を有する、広域的および規則的なパターン）を含む。

【0011】

領域がテクスチャのある領域またはテクスチャのない領域であるかどうかを識別するには、一般的な手法は、空間周波数または信号特異点を使用することになる。例えば、いくつかの既存の方法は、変換係数（例えば、ＤＣＴ係数）の分布を使用して、画像ブロックを平滑領域、テクスチャのある領域、およびエッジ領域に分類する。しかしながら、テクスチャのある領域またはテクスチャのない領域は、ともに低空間周波数サブバンドおよび高空間周波数サブバンドを含み、滑らかでない視覚信号を含む可能性がある。したがって、空間周波数または信号特異点を使用してテクスチャのある領域を識別することは、あまり正確ではない可能性がある。別の一般的な手法は、局所信号分散を使用することになる。しかしながら、テクスチャのある領域またはテクスチャのない領域は、ともに高い信号の分散を有し、したがって分散によって適切に識別されることは不可能である。

【0012】

テクスチャのある領域が識別された後には、テクスチャマスキング特性をシミュレートする方法、すなわち、領域がテクスチャのあるものか、テクスチャのないものかに従ってビデオ品質メトリックを調整する方法が、さらなる困難な問題となる。いくつかの既存の方法は、視覚心理実験で観測される感度定数（例えば、Ｗａｔｓｏｎの視覚マスク）を使用して、歪みを重み付けし、品質メトリックを取得する。しかしながら、このような視覚心理実験は、簡略化された観察条件下での人工的な視覚刺激を用いて設計されており、画質評価のために実際の条件を正確にシミュレートすることができない可能性がある。

【0013】

本原理は、フルリファレンス画質メトリックおよびノーリファレンス画質メトリックの精度を上げることができるテクスチャマスキング関数の推定を目的とするものである。

【0014】

図２は、テクスチャマスキング関数を使用してビデオ品質メトリックを推定するための例示的方法２００を示す。ステップ２１０において、画像が、例えば双方向フィルタ、異方性フィルタ、またはトータルバリエーション（ｔｏｔａｌｖａｒｉａｔｉｏｎ）の調整により、ストラクチャ成分およびテクスチャ成分に分解される。ストラクチャ成分については、ステップ２２０においてエッジ検出が行われて、エッジマップを取得する。例えば、ＳｏｂｅｌフィルタまたはＣａｎｎｙエッジ検出器により、エッジ検出からエッジ強度を判断することができる。エッジ強度は、２値化することができる、すなわち、エッジが存在するかどうかを判断する。テクスチャ成分については、例えば分散によって測定されるテクスチャ強度が、ステップ２２５において計算されて、テクスチャ強度マップを取得する。より一般的には、テクスチャ強度は、画素値の局所統計量モーメント、または自己回帰の残差の局所統計量モーメントによって測定することができる。

【0015】

次にテクスチャマスキング重みが、ステップ２３０においてエッジ情報およびテクスチャ強度に基づいて推定される。以下に述べる例示的実施形態では、テクスチャマスキング重みは、０と１との間の値に設定され、ここで１は、「変化なし」を意味し、したがって「マスキングなし」を意味する。しかしながら、テクスチャマスキング重みの値は、他の領域に容易に拡張することができる。テクスチャマスキング重み付け関数を使用して、局所歪みはステップ２４０において品質全般のメトリックに変換することができる。

【0016】

以下において、画像をストラクチャ成分およびテクスチャ成分に分解するステップ（２１０）、テクスチャマスキング重みを計算するステップ（２３０）、およびビデオ品質メトリックを生成するステップ（２４０）は、さらに詳細に説明される。
画像をストラクチャ成分およびテクスチャ成分に分解する
例として双方向フィルタを使用して、画像がどのようにしてストラクチャ成分およびテクスチャ成分に分解されるかについて説明する。分解に他の方法が使用されるとき、本原理は容易に拡張することができる。

【0017】

画像Ｉを分解するために、双方向フィルタが繰り返し使用されて、スライディングウィンドウ内の画素を処理する。画像のサイズがｍ×ｍであり、スライディングウィンドウのサイズが（２ｎ＋１）×（２ｎ＋１）であると仮定すると、画素Ｉ（ｘ，ｙ）のフィルタリング処理は、次のように行われる：
ａ）ウィンドウ中の各隣接画素Ｉ（ｉ，ｊ）の近接度（ｃｌｏｓｅｎｅｓｓ）パラメータを計算する：

【0018】

【数1】

【0019】

ここで、σ_ｄが近接度の影響を抑制する。
ｂ）ウィンドウ中の各隣接画素Ｉ（ｉ，ｊ）の類似度パラメータを計算する：

【0020】

【数2】

【0021】

一方、σ_ｒが類似度の影響に作用する。
ｃ）各隣接画素のフィルタリング係数を計算する：

【0022】

【数3】

【0023】

ｄ）画像をフィルタリングすることによってストラクチャ成分Ｓ（ｘ，ｙ）を計算する：

【0024】

【数4】

【0025】

ｅ）画像とストラクチャ成分との差としてテクスチャ成分Ｔ（ｘ，ｙ）を計算する：
Ｔ（ｘ，ｙ）＝Ｉ（ｘ，ｙ）−Ｓ（ｘ，ｙ）
一実施形態では、ｎ＝３、σ_ｄ＝３、およびσ_ｒ＝０．０３である。パラメータの値は、用途によって異なる可能性があり、例えばσ_ｄは、ビデオの解像度に適合されることがあり、σ_ｒは、ビデオのビット深度に適合されることがある。

【0026】

図１Ａ〜１Ｃは、３つの例示的ピクチャを提供し、図１Ａが画像を表示し、図１Ｂが図１Ａの画像のストラクチャ成分を示し、図１Ｃが図１Ａの画像のテクスチャ成分を示す。

【0027】

テクスチャマスキング重みを計算する
テクスチャマスキング重みを計算するために、入力されたピクチャは、重複しないブロックに分けられることが可能である。ほとんどの既存のビデオ圧縮規格、例えばＨ．２６４およびＭＰＥＧ−２は、基本符号化単位として１６×１６のマクロブロック（ＭＢ）を使用する。したがって、次の実施形態は、基本処理単位として１６×１６のブロックを使用する。しかしながら、本原理は、例えば８×８のブロック、１６×８のブロック、３２×３２のブロック、および６４×６４のブロックのような、異なるサイズのブロックを使用するように適合されることも可能である。本原理は、重複するブロックを使用するように拡張されることも可能である。

【0028】

テクスチャ成分のブロックについては、テクスチャ強度を推定するために信号の分散を計算することができる。一実施形態では、テクスチャ強度は、（０，１）の範囲にマップされる。輝度チャンネルおよび／またはクロミナンスチャンネルは、分散を計算するために使用することができる。個々のブロックの分散を使用して、テクスチャ強度マップを生成することができ、ブロックの分散が、テクスチャ強度マップのサンプルに対応する。分散に基づいたこのようなテクスチャ強度マップは、分散マップとも呼ばれる。前述のように、テクスチャ強度の測定に他の方法が使用されることがある。

【0029】

テクスチャ強度は、閾値と比較することによって２値化することができる。テクスチャ強度が閾値を超えない場合、対応するブロックは、滑らかであるとみなすことができ、そうでなければ、ブロックは滑らかではない可能性がある。

【0030】

ストラクチャ成分については、エッジマップを生成することができる。一実施形態では、ストラクチャ成分は、エッジ検出の前に、例えば縦横に１６分の１にダウンサンプルされることがある。ダウンサンプルされたストラクチャ成分から、エッジマップが推定される。エッジ検出に３×３のＳｏｂｅｌフィルタが使用されると仮定すると、フィルタリングされた画素の絶対応答が加算されてエッジ強度を表すことができる。原ピクチャ中のブロックのエッジ強度は、エッジマップ中のサンプルに対応する。エッジ強度は、（０，１）の範囲にマップすることができる。

【0031】

エッジ強度もまた、閾値と比較することによって２値化することができる。エッジ強度が閾値を超える場合、広域的なエッジが現れる可能性が高く、対応する領域がエッジとして分類され、そうでなければ、領域はエッジなしと分類される。

【0032】

別の実施形態では、エッジ検出は、ダウンサンプリングの前に行われることがある。通常、ダウンサンプリングを用いて、エッジマップは、テクスチャ強度マップと同じサイズを有するべきである。したがって、テクスチャ強度を計算するためのブロックサイズが変われば、エッジマップを計算するためのダウンサンプリング比は、それに応じて変わるべきである。

【0033】

テクスチャ強度は、次にエッジ強度によって調整することができる。すなわち、テクスチャ強度およびエッジ強度は連帯的に考慮されて、テクスチャマスキング重みを推定する。テクスチャ強度マップ中のサンプルを、Ｔ_ｓ（ｕ，ｖ）、およびエッジマップ中のサンプルをＥ（ｕ，ｖ）と示し、ここでｕおよびｖは、入力ピクチャ中の各ブロックの左右のインデックスおよび上下のインデックスである。

【0034】

テクスチャ強度マップが２値のテクスチャ強度情報を含むとき、

【0035】

【数5】

【0036】

エッジマップが２値のエッジ強度情報を含むとき、

【0037】

【数6】

【0038】

エッジ強度を用いて、調整されるテクスチャ強度、Ｒ（ｕ，ｖ）は、次のように計算することができる：
Ｒ（ｕ，ｖ）＝Ｔ_ｓ（ｕ，ｖ）×［１−Ｅ（ｕ，ｖ）］（２）
すなわち、テクスチャ強度が低くなるほど、またはエッジ強度が高くなるほど、調整されるテクスチャ強度は低くなる。式（２）では、Ｔ_ｓ（ｕ，ｖ）およびＥ（ｕ，ｖ）が、（０，１）の範囲内であると仮定されることに注意されたい。Ｔ_ｓ（ｕ，ｖ）およびＥ（ｕ，ｖ）が他の数値範囲にあると設定されるとき、式（２）はこれに応じて調整されるべきである。

【0039】

図３Ａは、例示的な２値エッジマップを示し、白いサンプルがエッジを表し、黒いサンプルがエッジなしを表す。図３Ｂは、例示的な分散マップを示し、より明るいサンプルがより強い分散に対応する。図３Ｃは、例示的なマスクされた分散マップを示し、エッジマップにエッジがあるとき、分散は０に設定される。

【0040】

次に、ブロック単位のテクスチャマスキング重み、Ｗ（ｕ，ｖ）が、例えば調整されたテクスチャ強度Ｒ（ｕ，ｖ）の対数ロジスティック関数として、計算することができる。

【0041】

【数7】

【0042】

ここで、パラメータｃは、正の実数であり、主観データベースを使用してトレーニングすることができる。対数ロジスティック関数は、正の独立変数を（０，１）の範囲内となるようにマップする。例えば、画像領域がエッジマップ中のエッジと分類される（ｌａｂｅｌｅｄ）とき、テクスチャマスキング重みは１に設定される。シグモイド形状の関数（例えば、ゴンペルツ（Ｇｏｍｐｅｒｔｚ）関数、反曲線（Ｏｇｅｅｃｕｒｖｅ）、一般化ロジスティック関数（ｇｅｎｅｒａｌｉｚｅｄｌｏｇｉｓｔｉｃｆｕｎｃｔｉｏｎ）、代数曲線、逆正接関数、または誤差関数）のような、他の関数が使用されて、調整されたテクスチャ強度をテクスチャマスキング重みにマップすることができる。

【0043】

結果として、テクスチャ強度が低くなるほど、またはエッジ強度が高くなるほど、テクスチャマスキング重みは高くなる（すなわち、ビデオ品質メトリックを判断する際にマスクされていると考えられるアーチファクトがより少ない）。これは、人間の目のテクスチャマスキング特性と一致する。

【0044】

２値テクスチャ強度マップおよび２値エッジマップを考慮しながら、テクスチャマスキング重みが画像内容にどのように関連しているかをさらに詳細に述べる。個々のブロックは、以下を有する：
（１）滑らかなテクスチャ成分、およびストラクチャ成分にエッジなし（Ｔ_ｓ（ｕ，ｖ）＝０，Ｅ（ｕ，ｖ）＝０）、
（２）滑らかなテクスチャ成分、およびストラクチャ成分にエッジ（Ｔ_ｓ（ｕ，ｖ）＝０，Ｅ（ｕ，ｖ）＝１）、
（３）滑らかでないテクスチャ成分、およびストラクチャ成分にエッジなし（Ｔ_ｓ（ｕ，ｖ）＝１，Ｅ（ｕ，ｖ）＝０）、あるいは
（４）滑らかでないテクスチャ成分、およびストラクチャ成分にエッジ（Ｔ_ｓ（ｕ，ｖ）＝１，Ｅ（ｕ，ｖ）＝１）。

【0045】

対応するテクスチャマスキング重みＷ（ｕ，ｖ）が表１に示されている。すなわち、テクスチャ成分が滑らかである、またはストラクチャ成分がエッジを含むとき、テクスチャマスキング重みは、１である（すなわち、マスキングなし）と計算され、テクスチャ成分が滑らかではなく、ストラクチャ成分にエッジがないとき、テクスチャマスキング重みは０であると計算される。上述のように、アーチファクトが、テクスチャのある範囲ではマスクされる可能性があるが、テクスチャのない範囲（例えば、滑らかな範囲、またはエッジのある範囲）でマスクされる可能性がない。したがって、ブロックに対して計算されたテクスチャマスキング重みは、対応する画像内容に一致し、したがって人間の視覚系のテクスチャマスキング特性に一致する。

【0046】

【表1】

【0047】

画像をテクスチャ成分およびストラクチャ成分に分解することによって、本原理は、領域をテクスチャのある領域、またはテクスチャのない領域としてより正確に分類し、したがって人間の目のテクスチャマスキング特性をより綿密にシミュレートすることができる。画質の測定に加えて、推定されたテクスチャマスキング重みは、他の用途に、例えばビデオ圧縮のレート制御アルゴリズムを設計する際に、使用することが可能である。

【0048】

ビデオ品質メトリックを生成する
Ｄ（ｕ，ｖ）において局所歪みが測定されると仮定すると、全体的な品質メトリックＱは、局所歪みの重み付けされた和として計算することができる。
Ｑ＝Σ_ｕ，ｖ［Ｗ（ｕ，ｖ）・Ｄ（ｕ，ｖ）］（４）
次に、損失の大きいネットワークを通じて伝送されるビデオに対してビデオ品質メトリックを推定する際に、テクスチャマスキング重みが使用可能である例示的実施形態について述べる。

【0049】

伝送中に画像ブロックが失われるとき、ブロックは適切に再構成できず、視覚アーチファクトを引き起こす可能性がある。一方、破損したブロックを指す、正確に受信されたインター予測された（ｉｎｔｅｒｐｒｅｄｉｃｔｅｄ）ブロックもまた、適切に再構成できず、したがって、エラー伝播として知られる別のタイプの視覚アーチファクトを引き起こす可能性がある。知覚されるアーチファクトを低減するために、復号器がエラー隠蔽技術によって、損なわれたブロックを回復しようと試みることができる。エラー隠蔽後のピクチャには、目に見えるアーチファクトが残っていることがある。

【0050】

一部の失われたブロックは、エラー隠蔽によって適切に回復され、したがって、知覚されるビデオ品質にほとんど影響を及ぼさないことがある。失われたブロックが十分に高い品質で（すなわち、あたかもブロックが正確に受信されるかのように）回復されたかどうかをチェックするために、ピクチャはビットストリームから画素に復号され、復号されたピクチャ上でモザイクアーチファクトが検出される。ブロック境界に沿ってモザイクアーチファクトが検出されるとき、ブロックのモザイクアーチファクト強度は１に設定される。そうでなければ、それは０に設定され、ブロックは適切に回復されたと考えられる。

【0051】

視覚アーチファクトを測定するために、テクスチャマスキング効果を考慮しないメトリックは、次のように計算可能である：
Ｄ_{ｕ，ｖ，ｔ}＝ＭＡ_{ｕ，ｖ，ｔ}（ＥＣ_{ｕ，ｖ，ｔ}＋ＥＰ_{ｕ，ｖ，ｔ}）（５）
Ｑ＝Σ_{ｕ，ｖ，ｔ}Ｄ_{ｕ，ｖ，ｔ}＝Σ_{ｕ，ｖ，ｔ}［ＭＡ_{ｕ，ｖ，ｔ}（ＥＣ_{ｕ，ｖ，ｔ}＋ＥＰ_{ｕ，ｖ，ｔ}）］（６）
ここで、Ｄ_{ｕ，ｖ，ｔ}は、ブロック（ｕ，ｖ）の時間ｔにおける歪みであり、ＥＣ_{ｕ，ｖ，ｔ}は、ブロックが失われているかどうかを示す２値であり、ＥＰ_{ｕ，ｖ，ｔ}は、ブロックが伝播されたブロックであるかどうか、すなわちブロックが予測のために失われたブロックを直接的もしくは間接的に使用するかどうかを示す２値であり、ＭＡ_{ｕ，ｖ，ｔ}は、ブロックがその境界に沿ってモザイクアーチファクトを含んでいるかどうかを示す２値である。

【0052】

局所歪み測定は、他の方法を使用して、例えば原画像が利用できるとき、原画像と損なわれた画像との差として、計算されることも可能であることに注意されたい。

【0053】

テクスチャマスキング特性を考慮して、式（６）で定義されたメトリックを改善することが可能である。詳細には、式（３）に記載するテクスチャマスキング関数が使用されて、式（５）に記載する局所歪みを重み付けし、重み付けされた局所歪みがまとめてプールされて、最終的な品質スコアを形成する：

【0054】

【数8】

【0055】

ここで、Ｗ（ｕ，ｖ，ｔ）は、ブロック（ｕ，ｖ）の時間ｔにおけるテクスチャマスキング重みである。主観データベース上でトレーニングした後、例示的パラメータｃが０．５〜１の間となるように設定される。

【0056】

テクスチャマスキング重みは、さらに複雑なプーリング戦略を有する品質測定で結合することも可能である。例えば、次のようにメトリックが計算可能である：
Ｑ＝Σ_ｔ［Σ_ｕ，ｖＷ（ｕ，ｖ，ｔ）ＭＡ_{ｕ，ｖ，ｔ}（ＥＣ_{ｕ，ｖ，ｔ}＋ＥＰ_{ｕ，ｖ，ｔ}）］^γ
ここで、局所歪みは２つのレベルの総和によってプールされる。内部の総和（ｉｎｎｅｒｓｕｍｍａｔｉｏｎ）では、各ピクチャ内の局所歪みが空間的にプールされ、外部の総和（ｏｕｔｅｒｓｕｍｍａｔｉｏｎ）では、γまでの各ピクチャ電力の歪みが時間的にプールされ、γは時間的プーリング戦略に影響を与えるパラメータであり、例示的γは０．６〜１の間である。

【0057】

図４は、例えば方法２００により、テクスチャマスキング重みを計算するために使用可能である例示的装置４００のブロック図を示す。装置４００の入力は、画像またはビデオを含む。

【0058】

画像は、画像分解器（４１０）によって、ストラクチャ成分およびテクスチャ成分に分解される。ストラクチャ成分は、ダウンサンプリングモジュール（４２０）によってダウンサンプルされ、そのエッジ強度は、エッジ検出器（４３０）によって計算される。テクスチャ成分については、局所テクスチャ強度が、テクスチャ強度計算機（４４０）によって、例えば分散計算機によって、計算される。エッジ強度およびテクスチャ強度を使用して、テクスチャマスキング重みは、テクスチャマスキング計算機（４５０）によって、例えば式（３）を使用して、計算することができる。

【0059】

図５は、画像のビデオ品質メトリックを生成するために使用することが可能な例示的ビデオ品質測定装置５００のブロック図である。装置５００の入力は、ビットストリームを含んだトランスポートストリームを含む。入力は、ビットストリームを含んだ他の方式であることもある。システムレベルにおける受信機が、受信されたビットストリーム中のパケット損失を判断する。

【0060】

デマルチプレクサ５１０が、入力されたストリームをパースして、例示的ストリームまたはビットストリームを取得する。それはまた、パケット損失に関する情報を復号器５２０に渡す。復号器５２０は、ビデオの品質を推定するためのパラメータを生成するために、各ブロックもしくはマクロブロックに対して、ＱＰ、変換係数、および動きベクトルなどの、必要な情報をパースする。復号器はまた、パケット損失に関する情報を使用して、ビデオ中のどのマクロブロックが失われたかを判断する。復号器５２０は、完全な復号が行われない、すなわちビデオは再構成されないことを強調するために、部分的な復号器として示されている。

【0061】

復号器５２０からパースされたＭＢレベルのＱＰを使用して、ＱＰパーサ５３３がピクチャの、およびビデオクリップ全体の、平均ＱＰを取得する。復号器５２０から取得された変換係数を使用して、変換係数パーサ５３２が、係数をパースし、内容予測不能性パラメータ計算機５３４が、個々のピクチャの、およびビデオクリップ全体の、内容予測不能性パラメータを計算する。どのマクロブロックが失われているかに関する情報を使用して、失われたＭＢのタガー５３１がどのＭＢが失われているかをマーク付けする。動き情報をさらに使用して、伝播されたＭＢのタガー５３５が、予測のために、どのＭＢが失われたブロックを直接的または間接的に使用しているか（すなわち、どのブロックがエラー伝播によって影響を受けているか）をマーク付けする。ブロックの動きベクトルを使用して、ＭＶパーサ５３６が、ＭＢ、ピクチャ、およびビデオクリップ全体の平均動きベクトルを計算する。エラー隠蔽間隔、フリーズの継続時間、およびフレームレートを判断するために、他のモジュール（図示せず）を使用することができる。

【0062】

圧縮歪み予測器５４０が圧縮歪み率を推定し、スライシング歪み予測器５４２がスライシング歪み率を推定し、フリージング歪み予測器５４４がフリージング歪み率を推定する。推定された歪み率に基づいて、品質予測器５５０が、ビデオ全体の品質メトリックを推定する。

【0063】

追加の計算が可能であるとき、復号器５７０はピクチャを復号する。復号器５７０は、完全な復号器として示され、これはピクチャを再構成し、必要であればエラー隠蔽を行う。モザイク検出器５８０は、再構成されたビデオ上でモザイク検出を行う。モザイク検出の結果を使用して、失われたＭＢのタガー５３１および伝播されたＭＢのタガー５３５は、関連するパラメータ、例えば失われたブロックのフラグおよび伝播されたブロックのフラグを更新する。

【0064】

テクスチャマスキング推定器５８５が、テクスチャマスキング重みを計算する。装置４００は、テクスチャマスキング推定器として使用することができる。テクスチャマスキング重みは、歪みを重み付けするために使用することができる。

【0065】

図６を参照すると、上述の特徴および原理が適用可能であるビデオ伝送システムまたは装置６００が示されている。プロセッサ６０５がビデオを処理し、符号器６１０はビデオを符号化する。符号器から生成されたビットストリームは、配信ネットワーク６２０を介して復号器６３０に伝送される。ビデオ品質モニタまたはビデオ品質測定装置、例えば装置５００を、様々な段階で使用することができる。

【0066】

一実施形態では、ビデオ品質モニタ６４０が、コンテンツクリエータによって使用されることができる。例えば、推定されたビデオ品質は、モード決定またはビットレートの割当てのような符号化パラメータを決定する際に符号器によって使用されることができる。別の例では、ビデオが符号化された後に、コンテンツクリエータは、ビデオ品質モニタを使用して、符号化されたビデオの品質を監視する。品質メトリックがあらかじめ定められた品質レベルを満たさない場合、コンテンツクリエータは、ビデオ品質を向上させるためにビデオを再符号化することを選択することができる。コンテンツクリエータはまた、品質に基づいて符号化されたビデオをランク付けすることもでき、それに応じてコンテンツをチャージする。

【0067】

別の実施形態では、ビデオ品質モニタ６５０が、コンテンツ配信業者によって使用されることができる。ビデオ品質モニタは、配信ネットワークに配置することができる。ビデオ品質モニタは、品質メトリックを計算し、これらをコンテンツ配信業者に報告する。ビデオ品質モニタからのフィードバックに基づいて、コンテンツ配信業者が、帯域幅の割当ておよびアクセス制御を調整することにより、そのサービスを向上させることができる。

【0068】

コンテンツ配信業者はまた、フィードバックをコンテンツクリエータに送信して、符号化を調整することも可能である。高品質符号化ビデオは、通常より多くの帯域幅を必要とし、伝送保護用の帯域幅はより少なくなるので、符号器における符号化品質を向上させることが、必ずしも復号器側における品質を向上させるわけではないことに注意されたい。したがって、復号器において最適な品質を得るために、符号化ビットレートと、チャネル保護用の帯域幅とのバランスが考慮されるべきである。

【0069】

別の実施形態では、ビデオ品質モニタ６６０が、ユーザデバイスによって使用されることができる。例えば、ユーザデバイスがインターネットでビデオを検索するとき、検索結果が多くのビデオまたはリクエストされたビデオコンテンツに対応するビデオへの多くのリンクを返すことができる。検索結果中のビデオは、様々な品質レベルを有することがある。ビデオ品質モニタが、これらのビデオの品質メトリックを計算し、どのビデオを格納すべきかの選択を決定することができる。別の例では、復号器は、様々なエラー隠蔽モードに関して隠蔽されたビデオの品質を推定する。推定に基づいて、よりよい隠蔽品質を提供するエラー隠蔽が、復号器によって選択されることが可能である。

【0070】

本明細書に記載する実装は、例えば、方法もしくはプロセス、装置、ソフトウェアプログラム、データストリーム、または信号において実装することができる。単一の形態の実装の状況で説明される（例えば、単に１つの方法として説明される）としても、記載した特徴の実装は、他の形態（例えば、装置、またはプログラム）で実装することも可能である。装置は、例えば、適切なハードウェア、ソフトウェア、およびファームウェアで実装することができる。方法は、例えばコンピュータ、マイクロプロセッサ、集積回路、またはプログラマブル論理デバイスなどの、一般に処理装置を指す、例えばプロセッサのような、例えば装置に実装することができる。また、プロセッサは、例えばコンピュータ、携帯電話、携帯／個人情報端末（ｐｏｒｔａｂｌｅ／ｐｅｒｓｏｎａｌｄｉｇｉｔａｌａｓｓｉｓｔａｎｔｓ、「ＰＤＡ」）、およびエンドユーザ間の情報の通信を容易にするその他のデバイスのような、通信デバイスを含む。

【0071】

本原理の「一実施形態」または「実施形態」または「１つの実装」または「実装」への言及、ならびにその他の変形は、実施形態に関連して説明した特定の特徴、構造、特性、その他が、本原理の少なくとも一実施形態に含まれることを意味する。したがって、本明細書にわたって様々な箇所で現れる「一実施形態では」または「実施形態では」または「１つの実装では」または「実装では」という語句、ならびにその他の変形の出現は、必ずしもすべて同じ実施形態を指しているとは限らない。

【0072】

さらに、この出願またはその特許請求の範囲は、情報の様々な部分を「判断すること（ｄｅｔｅｒｍｉｎｉｎｇ）」に言及することがある。情報を判断することは、例えば、情報を推定すること、情報を計算すること、情報を予測すること、またはメモリから情報を検索することのうちの１つまたは複数を含むことがある。

【0073】

さらに、この出願またはその特許請求の範囲は、情報の様々な部分に「アクセスすること」に言及することがある。情報にアクセスすることは、例えば、情報を受信すること、（例えばメモリから）情報を検索すること、情報を格納すること、情報を処理すること、情報を伝送すること、情報を移動させること、情報をコピーすること、情報を消去すること、情報を計算すること、情報を判断すること、情報を予測すること、または情報を推定することのうちの１つまたは複数を含むことがある。

【0074】

さらに、この出願またはその特許請求の範囲は、情報の様々な部分を「受信すること」に言及することがある。受信することは、「アクセスすること」と同様に、広義の用語とするものである。情報を受信することは、例えば、情報にアクセスすること、または（例えばメモリから）情報を検索することのうちの１つまたは複数を含むことがある。さらに、「受信すること」は一般的に、例えば、情報を格納すること、情報を処理すること、情報を伝送すること、情報を移動させること、情報をコピーすること、情報を消去すること、情報を計算すること、情報を判断すること、情報を予測すること、または情報を推定することのような動作中に様々な方法で含まれる。

【0075】

当業者には明らかであるように、実装は、例えば格納するかまたは伝送することができる情報を搬送するようにフォーマットされた様々な信号を生成することができる。情報は、例えば方法を行うための命令、または記載した実装の１つによって作成されるデータを含むことができる。例えば、信号は、記載した実施形態のビットストリームを搬送するようにフォーマットすることができる。このような信号は、例えば電磁波（例えば、スペクトルの無線周波数部分を使用する）として、またはベースバンド信号として、フォーマットすることができる。フォーマットすることは、例えばデータストリームを符号化すること、および符号化されたデータストリームを用いて搬送波を変調することを含むことができる。信号が搬送する情報は、例えばアナログ情報、またはディジタル情報とすることができる。信号は、知られているように、様々な異なる有線リンクまたは無線リンクを通じて伝送することができる。信号は、プロセッサ読取可能媒体に格納することができる。
以下、本願により教示される手段を例示的に列挙する。
（付記１）
ビデオ品質を推定するための方法であって、
少なくとも１つの画像領域を有する画像データにアクセスするステップと、
前記画像領域をストラクチャ成分およびテクスチャ成分に分解するステップ（２１０）と、
前記画像領域の前記ストラクチャ成分のエッジ強度を判断するステップ（２２０）と、
前記エッジ強度に応じてテクスチャマスキング重みを判断するステップ（２３０）と、
前記テクスチャマスキング重みに応じて品質メトリックを判断するステップ（２４０）と、
を含む、前記方法。
（付記２）
双方向フィルタを使用して、前記画像領域を前記ストラクチャ成分および前記テクスチャ成分に分解する、付記１に記載の方法。
（付記３）
前記エッジ強度が閾値を超える場合、前記画像領域にエッジが存在すると判断するステップであって、前記エッジが前記画像領域に存在すると判断したとき、テクスチャマスキングを行わないように前記テクスチャマスキング重みを設定する、ステップ
をさらに含む、付記１に記載の方法。
（付記４）
前記画像領域の前記テクスチャ成分に対してテクスチャ強度を判断するステップ（２２５）であって、前記テクスチャマスキング重みを前記判断するステップは、前記エッジ強度および前記テクスチャ強度に応じたものである、ステップ
をさらに含む、付記１に記載の方法。
（付記５）
前記テクスチャ強度は、前記画像領域の前記テクスチャ成分の分散として判断される、付記４に記載の方法。
（付記６）
前記テクスチャ強度が閾値を超えない場合、前記画像領域が滑らかであると判断するステップであって、前記画像領域が滑らかであると判断したとき、テクスチャマスキングを行わないように前記テクスチャマスキング重みを設定する、ステップ
をさらに含む、付記４に記載の方法。
（付記７）
前記画像データは、複数の画像領域を含み、前記分解するステップ、前記エッジ強度を判断するステップ、および前記テクスチャマスキング重みを判断するステップは、前記複数の画像領域に対し、分解するステップ、それぞれのエッジ強度を判断するステップ、およびそれぞれのテクスチャマスキング重みを判断するステップを含み、前記品質メトリックは局所歪みの重み付けされた組合せに応じて判断され、前記局所歪みは前記テクスチャマスキング重みによって重み付けされる、付記１に記載の方法。
（付記８）
ビデオ品質を推定するための装置であって、
画像領域をストラクチャ成分およびテクスチャ成分に分解する画像分解器（４１０）と、
前記画像領域の前記ストラクチャ成分のエッジ強度を判断するエッジ検出器（４３０）と、
前記エッジ強度に応じてテクスチャマスキング重みを判断するテクスチャマスキング計算機（４５０）と、
前記テクスチャマスキング重みに応じて品質メトリックを判断する品質予測器（５００）と、
を含む、前記装置。
（付記９）
前記画像分解器（４１０）において双方向フィルタが使用される、付記８に記載の装置。
（付記１０）
前記エッジ検出器（４３０）は、前記エッジ強度が閾値を超える場合、前記画像領域にエッジが存在すると判断し、前記テクスチャマスキング計算機（４５０）は、前記エッジが前記画像領域に存在すると判断したとき、テクスチャマスキングを行わないように前記テクスチャマスキング重みを設定する、付記８に記載の装置。
（付記１１）
前記画像領域の前記テクスチャ成分に対してテクスチャ強度を判断するテクスチャ強度計算機（４４０）をさらに含み、前記テクスチャマスキング計算機（４５０）は前記エッジ強度および前記テクスチャ強度に応じて前記テクスチャマスキング重みを判断する、付記８に記載の装置。
（付記１２）
前記テクスチャ強度は、前記画像領域の前記テクスチャ成分の分散として判断される、付記１１に記載の装置。
（付記１３）
前記テクスチャ強度計算機（４４０）は、前記テクスチャ強度が閾値を超えない場合、前記画像領域が滑らかであると判断し、前記テクスチャマスキング計算機（４５０）は、前記画像領域が滑らかであると判断されるときテクスチャマスキングを行わないように前記テクスチャマスキング重みを設定する、付記１１に記載の装置。
（付記１４）
前記画像データは、複数の画像領域を含み、前記複数の画像領域に対して、前記画像分解器（４１０）、前記エッジ検出器（４３０）および前記テクスチャマスキング計算機（４５０）は、それぞれ分解し、それぞれのエッジ強度を判断し、およびそれぞれのテクスチャマスキング重みを判断し、ならびに前記品質予測器（５００）は局所歪みの重み付けされた組合せに応じて前記品質メトリックを判断し、前記局所歪みは前記テクスチャマスキング重みによって重み付けされる、付記８に記載の装置。
（付記１５）
画像領域をストラクチャ成分およびテクスチャ成分に分解するステップ（２１０）と、
前記画像領域の前記ストラクチャ成分に対してエッジ強度を判断するステップ（２２０）と、
前記エッジ強度に応じてテクスチャマスキング重みを判断するステップ（２３０）と、
前記テクスチャマスキング重みに応じて品質メトリックを判断するステップ（２４０）と、
を１つまたは複数のプロセッサに一括して実行させるための命令を格納した、プロセッサ読取可能媒体。

【図2】