IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ネットフリックス・インコーポレイテッドの特許一覧

特許7191492相補的知覚品質モデルに基づいて知覚映像品質を予測するための手法
<>
  • 特許-相補的知覚品質モデルに基づいて知覚映像品質を予測するための手法 図1
  • 特許-相補的知覚品質モデルに基づいて知覚映像品質を予測するための手法 図2
  • 特許-相補的知覚品質モデルに基づいて知覚映像品質を予測するための手法 図3
  • 特許-相補的知覚品質モデルに基づいて知覚映像品質を予測するための手法 図4
  • 特許-相補的知覚品質モデルに基づいて知覚映像品質を予測するための手法 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-12-09
(45)【発行日】2022-12-19
(54)【発明の名称】相補的知覚品質モデルに基づいて知覚映像品質を予測するための手法
(51)【国際特許分類】
   G06T 7/00 20170101AFI20221212BHJP
【FI】
G06T7/00 Q
G06T7/00 350B
【請求項の数】 10
(21)【出願番号】P 2020541479
(86)(22)【出願日】2019-02-07
(65)【公表番号】
(43)【公表日】2021-05-20
(86)【国際出願番号】 US2019017134
(87)【国際公開番号】W WO2019157235
(87)【国際公開日】2019-08-15
【審査請求日】2021-04-09
(31)【優先権主張番号】15/890,710
(32)【優先日】2018-02-07
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】506267178
【氏名又は名称】ネットフリックス・インコーポレイテッド
【氏名又は名称原語表記】NETFLIX, INC.
(74)【代理人】
【識別番号】100073184
【弁理士】
【氏名又は名称】柳田 征史
(74)【代理人】
【識別番号】100123652
【弁理士】
【氏名又は名称】坂野 博行
(74)【代理人】
【識別番号】100175042
【弁理士】
【氏名又は名称】高橋 秀明
(72)【発明者】
【氏名】リー,ジー
(72)【発明者】
【氏名】バンピス,クリストス
【審査官】小池 正彦
(56)【参考文献】
【文献】Aladine Chetouani et al,A universal Full Reference image Quality Metric based on a neural fusion approach,2010 IEEE International Conference on Image Processing,米国,IEEE,2010年09月29日,2517-2520,https://ieeexplore.ieee.org/document/5652855
【文献】杉本 修 他3名,マルチメディアアプリケーションにおける知覚映像品質の客観評価方式,電子情報通信学会論文誌,日本,社団法人電子情報通信学会,2010年12月01日,2620-2632
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00
(57)【特許請求の範囲】
【請求項1】
コンピュータ実行方法であって、
復元映像内容の第1品質評点を第1組の特徴の第1組の値及び前記第1組の値を前記第1品質評点と関連付ける第1モデルに基づいて計算するステップであって、前記第1モデルは第1機械学習アルゴリズムにより生成される、ステップと、
前記復元映像内容の第2品質評点を第2組の特徴の第2組の値及び前記第2組の値を前記第2品質評点と関連付ける第2モデルに基づいて計算するステップと、
前記復元映像内容の全体品質評点を前記第1品質評点及び前記第2品質評点に基づいて算出するステップであって、前記全体品質評点は配信される映像内容に関連する視覚品質のレベルを示す、ステップと
を含み、
前記第1組の特徴は、前記第2組の特徴に含まれていない第1特徴を含み、前記第2組の特徴は、前記第1組の特徴に含まれていない第2特徴を含むコンピュータ実行方法。
【請求項2】
前記第1品質評点及び前記第2品質評点は前記復元映像内容に含まれる第1フレームに関連し、前記全体品質評点を算出するステップは、
前記第1フレームに関連する第1総計品質評点を前記第1品質評点及び前記第2品質評点に基づいて算出するステップと、
1つ以上の時間プーリング操作を前記第1総計品質評点及び前記復元映像内容に含まれる第2フレームに関連する第2総計品質評点に実行して前記全体品質評点を計算するステップと
を含む、請求項1記載のコンピュータ実行方法。
【請求項3】
前記第1総計品質評点を算出するステップは、前記第1品質評点及び前記第2品質評点の平均又は加重平均を計算するステップを含む、請求項2記載のコンピュータ実行方法。
【請求項4】
前記第1総計品質評点を算出するステップは、2機械学習アルゴリズムにより生成される第3モデルに基づいて前記第1品質評点及び前記第2品質評点を前記第1総計品質評点と関連付けるステップを含む、請求項2記載のコンピュータ実行方法。
【請求項5】
前記第1組の特徴は、1つの時間的特徴と1つの空間的特徴とを含む、請求項1記載のコンピュータ実行方法。
【請求項6】
前記空間的特徴は、付加欠陥計測特徴、ブラインド又は基準なし画像空間的品質評価器特徴、及び視覚情報忠実度特徴のうち少なくとも1つを含む、請求項記載のコンピュータ実行方法。
【請求項7】
前記第1モデルを前記第1機械学習アルゴリズム及び複数の主観的評点に基づいて生成するステップを更に含み、前記複数の主観的評点に含まれる各主観的評点は異なる復元試験映像内容と関連する、請求項1記載のコンピュータ実行方法。
【請求項8】
前記第2モデルを前記複数の主観的評点に基づいて生成するステップを更に含む請求項記載のコンピュータ実行方法。
【請求項9】
命令群を含むコンピュータ読取可能記憶媒体であって、プロセッサにより実行される時に前記命令群は前記プロセッサに、
復元映像内容の第1品質評点を第1組の特徴の第1組の値及び前記第1組の値を前記第1品質評点と関連付ける第1モデルに基づいて計算するステップであって、前記第1モデルは第1機械学習アルゴリズムにより生成される、ステップと、
前記復元映像内容の第2品質評点を第2組の特徴の第2組の値及び前記第2組の値を前記第2品質評点と関連付ける第2モデルに基づいて計算するステップであって、前記第2モデルは前記第1機械学習アルゴリズム又は第2機械学習アルゴリズムにより生成される、ステップと、
前記復元映像内容の全体品質評点を前記第1品質評点及び前記第2品質評点に基づいて算出するステップであって、前記全体品質評点は配信される映像内容に関連する視覚品質のレベルを示す、ステップと
を実行させ
前記第1組の特徴は、前記第2組の特徴に含まれていない第1特徴を含み、前記第2組の特徴は、前記第1組の特徴に含まれていない第2特徴を含む、コンピュータ読取可能記憶媒体。
【請求項10】
命令群を記憶するメモリと、
前記メモリに結合されたプロセッサと
を備えたシステムであって、前記プロセッサは前記命令群を実行する時、
復元映像内容の第1品質評点を第1組の特徴の第1組の値及び前記第1組の値を前記第1品質評点と関連付ける第1モデルに基づいて計算するステップであって、前記第1モデルは複数の主観的評点に基づいて生成される、ステップと、
前記復元映像内容の第2品質評点を第2組の特徴の第2組の値及び前記第2組の値を前記第2品質評点と関連付ける第2モデルに基づいて計算するステップであって、前記第2モデルは前記複数の主観的評点に基づいて生成される、ステップと、
前記復元映像内容の全体品質評点を前記第1品質評点及び前記第2品質評点に基づいて算出するステップであって、前記全体品質評点は配信される映像内容に関連する視覚品質のレベルを示す、ステップと
を実行するように構成され
前記第1組の特徴は、前記第2組の特徴に含まれていない第1特徴を含み、前記第2組の特徴は、前記第1組の特徴に含まれていない第2特徴を含む、システム。
【発明の詳細な説明】
【関連出願】
【0001】
本出願は、2018年2月7日に出願された米国特許出願第15/890710号の優先権の利益を主張するものであり、この特許出願を本明細書に引用する。
【技術分野】
【0002】
本発明の実施形態は概ね、映像技術より具体的には相補的知覚品質モデルに基づいて知覚映像品質を予測するための手法に関する。
【背景技術】
【0003】
ソース映像内容を効率良く正確に符号化することは高品質映像内容をリアルタイム配信のために極めて重要である。符号化された映像内容品質の変動のために、符号化されたソース映像内容から復号された復元映像内容の視覚品質が許容できることを保証するために品質制御を行うことが望ましい。復元映像内容の視覚品質を人手で検査することは途方もなく時間がかかる。従って、自動化された映像内容品質評価はしばしば符号化及び配信基盤の必須の要素である。例えば、自動化された映像品質評価は、符号器及び微調整配信ビットレートを評価する時に使用され配信される映像内容を最適化できる。
【0004】
復元映像内容の品質を自動的に評価する幾つかの手法は、視覚品質の人による評価に基づいて訓練される知覚品質モデルに基づいて品質評点を計算することを含む。通常、知覚品質モデルは復元映像内容の特徴の値を異なる品質評点と関連付ける。知覚品質モデルにより復元映像内容の品質を予測することの限界は、知覚品質モデルは通常確実さを欠くことである。例えば、知覚品質モデルに関連する特徴のどれもあるタイプの歪みを反映しない場合、知覚品質モデルはそのような歪みを含む復元映像内容の品質の人による知覚を正確に予測できない。
【0005】
特に、知覚品質モデルは、公有LIVE映像品質データベースに含まれる復元映像内容の知覚される視覚品質を通常確実には予測できない。LIVE映像品質データベースに関する知覚品質モデルの不全の分析は、知覚品質モデルに関連する特徴のどれも多くのタイプの複雑な時間的映像歪みに起因する知覚される品質劣化を正確にはモデル化しないことを示す。複雑な時間的映像歪みの例は、限定されないが、動き推定不適合、ちらつき、及び多重画像である。
【発明の概要】
【発明が解決しようとする課題】
【0006】
上記のように、当分野で必要なものは、復元映像内容の知覚品質を予測するためのより効果的な手法である。
【課題を解決するための手段】
【0007】
本発明の1つの実施形態は、復元映像内容の知覚映像品質を予測するためのコンピュータ実行方法を明らかにする。この方法は復元映像内容の第1品質評点を第1組の特徴の第1組の値及び前記第1組の値を前記第1品質評点と関連付ける第1モデルに基づいて計算するステップであって、前記第1モデルは第1機械学習アルゴリズムにより生成される、ステップと、前記復元映像内容の第2品質評点を第2組の特徴の第2組の値及び前記第2組の値を前記第2品質評点と関連付ける第2モデルに基づいて計算するステップと、前記復元映像内容の全体品質評点を前記第1品質評点及び前記第2品質評点に基づいて算出するステップであって、前記全体品質評点は配信される映像内容に関連する視覚品質のレベルを示す、ステップとを含む。
【0008】
知覚映像品質を予測するための開示された手法の少なくとも1つの利点は、全体品質評点は様々な復元映像内容に亘って知覚映像品質を正確に予測するということである。特に、従来技術に対する少なくとも1つの技術的改善は、開示された手法は異なる組の特徴に関連する異なる知覚品質モデルにより得られた品質評点を総計して全体品質評点を算出することである。特徴は知覚品質モデル間で分配されるので、開示された手法は特徴の総数を増加させることが過剰適合に起因する不正確さを引き起こす可能性を減少させる。
【図面の簡単な説明】
【0009】
本発明の上記の特徴が詳細に理解されうるために、一部が添付の図面に例示された複数の実施形態を参照することで、上記に簡潔に要約された本発明のより明確な説明を得られるかもしれない。しかし、添付の図面は本発明の典型的な実施形態のみを例示し、従って、本発明の範囲を限定すると考えられるべきではないことは留意されるべきである、本発明は他の同様に効果的な実施形態を認めているのだから。
図1】本発明の1つ以上の態様を実施するように構成されたシステムの概念図である。
図2】本発明の様々な実施形態に係る図1の時間抽出器のより詳細な図である。
図3】本発明の様々な実施形態に係る復元映像内容の品質評点を計算するための方法ステップのフロー図である。
図4】本発明の1つ以上の態様を実施するように構成された集合システムの概念図である。
図5】本発明の様々な実施形態に係る2つの異なる組の特徴に基づいて復元映像内容の全体品質評点を計算するための方法ステップのフロー図である。
【発明を実施するための形態】
【0010】
以下の説明において、本発明のより完全な理解を提供するために多数の具体的詳細が明らかにされる。しかし、これらの具体的詳細の1つ以上を欠いて本発明を実施してもよいことは当業者には明白であろう。
【0011】
開示された手法は、特徴の値を品質評点と関連付ける知覚品質モデルにより復元映像内容の品質評点を効率的にかつ確実に予測する。特に、知覚品質モデルは複数の時間的特徴と関連し、各時間的特徴は異なる縮尺と関連する。動作時、時間抽出器は特定の時間的特徴のフレーム当たりの値を復元映像内容、関連する映像内容、及びその時間的特徴に関連する縮尺に基づいて計算する。特定のフレームについて、時間抽出器はそのフレームと隣接フレーム間の輝度の差を明示するフレーム差マトリックスを計算する。次に時間抽出器はフレーム差マトリックスを縮尺に基づいてダウンサンプリングし、縮減されたフレーム差マトリックスを生成する。次に時間抽出器は縮減フレーム差マトリックスに時間フィルタリング操作及び局所平均減算操作を実行して局所平均減算されたマトリックスを計算する。次に時間抽出器は縮減フレーム差マトリックスに調整操作を実行して復元映像内容のそのフレームに関連する第1重み付きエントロピーマトリックスを生成する。
【0012】
同様に、時間抽出器は映像内容及び縮尺に基づいて第2重み付きエントロピーマトリックスを得る。時間抽出器は第1重み付きエントロピーマトリックスと第2重み付きエントロピーマトリックスの間の減算操作を実行してエントロピー差マトリックスを計算する。最後に、時間抽出器はエントロピー差マトリックスに空間プーリング操作を実行して復元映像内容のフレームの時間的特徴の単一値を生成する。エントロピー差マトリックスを複数の縮尺で計算することは人の視覚システムがどのように視覚情報を処理するかの面を模倣するので、知覚品質モデルは多くのタイプの複雑な時間的映像歪みに起因する知覚される品質劣化を正確にモデル化する。
【0013】
幾つかの実施形態では、集合予測エンジンは復元映像内容の集合品質評点を2つの知覚品質モデルに基づいて計算する。各知覚品質モデルは異なる組の特徴の値を異なる品質評点と関連付ける。集合予測エンジンは2つの知覚品質モデルにより得られた品質評点を合成して集合品質評点を得る。有利にも、2つの予測品質モデル間で特徴を分配することは、特徴の総数の増加が過剰適合に起因する不正確さをもたらす可能性を減少させる。
【0014】
システム概要
図1は本発明の1つ以上の態様を実施するように構成されたシステム100の概念図である。図示のように、システム100は、限定されないが、任意の数の計算インスタンス110、訓練データベース120、客観的データベース150、主観的データベース182、及びターゲット特徴データベース170を含む。説明の目的のために、類似の対象物の複数のインスタンスが対象物を特定する符号と必要な場合、インスタンスを特定する括弧付き数字とで示される。様々な実施形態では、システム100の全構成要素が任意の数、複数の地理的位置に亘って分散されるか又は任意の組合せで1つ以上のクラウド計算環境(即ち、閉じた共有資源、ソフトウェア、データなど)に含まれている。
【0015】
図示のように、各計算インスタンス110は、限定されないが、プロセッサ112及びメモリ116を含む。プロセッサ112は命令群を実行できる任意の命令実行システム、装置、又はデバイスであってもよい。例えば、プロセッサ112は中央処理ユニット(CPU)、グラフィック処理ユニット(GPU)、コントローラ、マイクロコントローラ、状態マシン、又はそれらの任意の組合せから成りうる。メモリ116は計算インスタンス110のプロセッサ112による使用のためにソフトウェア・アプリケーション及びデータなどのコンテンツを記憶する。
【0016】
メモリ116は、1つ以上の容易に入手可能なメモリ、例えばランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、フロッピー(登録商標)ディスク、ハードディスク、又は任意の他の形態のデジタル記憶装置、局所又は遠隔の、であってもよい。幾つかの実施形態では、記憶装置(不図示)がメモリ116を補っても又は置き換えてもよい。その記憶装置は、プロセッサ112にとってアクセス可能な任意の数及び種類の外部メモリを含んでもよい。例えば、その記憶装置は、限定されないが、セキュア・デジタル・カード、外部フラッシュメモリ、携帯コンパクトディスク読み出し専用メモリ(CD-ROM)、光学記憶装置、磁気記憶装置、又はそれらの任意の適切な組合せを含んでもよい。
【0017】
通常、計算インスタンス110は1つ以上のアプリケーションを実行するように構成される。説明の目的だけのために、各アプリケーションは、単一の計算インスタンス110のメモリ116に存在しその単一の計算インスタンス110のプロセッサ112上で動作するとして描かれている。しかし、当業者は認識するように、各アプリケーションの機能は、任意の数の計算インスタンス110のメモリ116に存在する任意の数の他のアプリケーションに亘って分散され、任意の組合せで任意の数の計算インスタンス110のプロセッサ112上で動作してもよい。また、任意の数のアプリケーションの機能は単一のアプリケーション又はサブシステムに統合されてもよい。
【0018】
特に、計算インスタンス110は復元映像内容のための自動映像内容品質評価を提供するように構成されている。映像内容品質評価は符号化及び配信基盤に関連する品質制御を実行するために使用されてもよい。例えば、許容できる見る体験を保証するために、復元映像内容の品質及び、間接的に、符号化及び配信基盤に含まれる構成要素の能力が通常、設計及び配信プロセスの様々な時点で視覚品質評点に基づいて評価される。次に視覚品質評点はアプリケーション(例えば、符号器)及びコンテンツ配信のリアルタイム最適化、例えば品質を認識するストリーム切替えアルゴリズムの開発を導くために使用される。
【0019】
図示のように、訓練特徴エンジン130、訓練エンジン180、予測エンジン192、特徴抽出器140の1つのインスタンス、及び時間プーリングエンジン194がメモリ116内に存在し、異なる計算インスタンス110のプロセッサ112上で実行される。他の実施形態では、訓練特徴エンジン130、訓練エンジン180、特徴抽出器140、予測エンジン192、時間プーリングエンジン194、訓練特徴エンジン130、及び訓練エンジン180の任意の数のインスタンスが、任意の数及び種類のメモリに存在し、任意の組合せで任意の数及び種類の処理装置上で実行されてもよい。
【0020】
破線で描かれた学習段階の間、訓練特徴エンジン130及び訓練エンジン180は共同し知覚品質モデル190を生成する。復元映像内容に対して、知覚品質モデル190は1組の特徴の1組の値を、復元映像内容を見た時の主観的人視覚体験と相互に関係する品質評点184と関連付ける。
【0021】
動作時、訓練特徴エンジン130は訓練データベース120を取得し客観的データベース150を生成する。訓練データベース120は、限定されないが、任意の数のソース122と任意の数の復元されたソース124とを含む。各ソース122は、限定されないが、任意の量及び種類の映像内容を含む。映像内容の例は、限定されないが、幾つか挙げると長編映画の任意の部分(全部も含む)、テレビプログラムの一話、及び音楽ビデオを含む。各復元ソース124は、限定されないが、1つのソース122に含まれる映像内容から得られる復元映像内容を含む。
【0022】
一般的事柄として、各復元ソース124は見る人に配信基盤及び表示装置を介して伝えられる関連するソース122に含まれる映像内容を複製する。復元ソース124を任意の数の符号化パラメータに基づいて任意の技術的に可能なやり方でソース122から得てもよい。例えば、幾つかの実施形態では、3つの異なる復元ソース124が各ソース122から得られる。符号化パラメータの3つの異なる組のそれぞれについて、符号化エンジン(図1に不図示)はソース122(x)を独立に符号化する。3つの結果の符号化されたソースのそれぞれについて、復号エンジン(図1に不図示)は符号化されたソースを独立に復号してソース122(x)から得た復元ソース124の1つを生成する。
【0023】
図示のように、訓練特徴エンジン130は、限定されないが、特徴抽出器140を含む。特徴抽出器140は特徴の値を計算する。各特徴は空間的映像歪みを測る「空間的特徴」か又は時間的視覚歪みを測る「時間的特徴」である。空間的映像歪みの例は、限定されないが、圧縮アーティファクト、拡大縮小アーティファクト、及びフィルム粒子ノイズである。時間的映像歪みの例は、限定されないが、動き推定不適合、ちらつき、及び多重画像である。
【0024】
特徴抽出器140は、限定されないが、空間抽出器148及び時間抽出器146を含む。各復元ソース124(x)及び各空間的特徴について、空間抽出器148は復元ソース124(x)及び随意に復元ソース124(x)に関連するソース122に基づいて空間配列172(x)を計算する。空間配列172(x)は、限定されないが、復元ソース124(x)に含まれる各フレームの異なるフレーム値を含む。
【0025】
同様に、各復元ソース124(x)及び各時間的特徴について、時間抽出器146は復元ソース124(x)及び復元ソース124(x)に関連するソース122に基づいて時間配列174(x)を計算する。時間配列174(x)は、限定されないが、復元ソース124(x)に含まれる各フレームの異なるフレームペア値を含む。本書で呼ばれるように、「フレームペア」は2つの連続したフレームから成り、フレームペア値は2つの連続したフレームの1番目と関連する。他の実施形態では、特徴抽出器140は特定の復元ソース124の特定の特徴に対して任意の数の値を任意の技術的に可能なやり方で計算してもよい。
【0026】
各空間的特徴及び各復元ソース124(x)について、訓練特徴エンジン130はその空間的特徴に関連する空間配列172(x)に時間プーリング操作を実行して、復元ソース124(x)の特徴の空間値162を算出する。訓練特徴エンジン130は任意の量及び種類の時間プーリング操作を任意の技術的に可能なやり方で実行してもよい。例えば、幾つかの実施形態では、訓練特徴エンジン130は復元ソース124(x)の特定の空間的特徴の空間値162をその特徴と関連する空間配列172(x)に含まれるフレーム値の平均に等しく設定できる。同様に、各時間的特徴及び各復元ソース124(x)について、訓練特徴エンジン130は復元ソース124(x)の特定の時間的特徴の時間値164をその特徴と関連する時間配列174(x)に含まれるフレームペア値の平均に等しく設定できる。
【0027】
各復元ソース124について、訓練特徴エンジン130は、限定されないが復元ソース124のそれら特徴の空間値162及び時間値164を含む訓練特徴データベース152を生成する。訓練特徴エンジン130は次に、限定されないが訓練特徴データベース152を含む客観的データベース150を生成する。結果として、訓練データベース120はN個の復元ソース124を含む場合、客観的データベース150はN個の訓練特徴データベース152を含む。また、特徴抽出器140がS個の空間的特徴のS個の空間配列172とT個の時間的特徴のT個の時間配列174とを計算する場合、各訓練特徴データベース152はS個の空間値162及びT個の時間値164を含む。
【0028】
訓練エンジン180は知覚品質モデル190を客観的データベース150及び主観的データベース182に基づいて生成する。主観的データベース182は、限定されないが、各復元ソース124の品質評点184を含む。復元ソース124(x)の品質評点184(x)は復元ソース124(x)の人による観察に基づいて生成される。より具体的には、観察者は表示装置上の復元ソース124(x)を注視しながら、視覚品質を個人的に評価し個人的評点を付ける。次に個人的評点は総計され品質評点184(x)を生成する。
【0029】
訓練エンジン180は任意の数及び種類の機械学習アルゴリズムを任意の技術的に可能なやり方で実行して知覚品質モデル190を客観的データベース150及び主観的データベース182に基づいて生成する。機械学習アルゴリズムの例は、限定されないが、幾つか挙げると、サポートベクトル機械アルゴリズム、人工神経ネットワークアルゴリズム、及びランダムフォレストアルゴリズムを含む。通常、復元ソース124(x)毎に、知覚品質モデル190は客観的データベース150(x)に含まれた空間値162及び時間値164と主観的データベース182に含まれた品質評点184(x)との関連に基づいて訓練される。他の実施形態では、訓練エンジン180は知覚品質モデル190を任意の技術的に可能な細かさのレベルで(例えば、特徴のフレーム値をフレーム品質評点と関連付けることに基づいて)訓練してもよい。
【0030】
特に、訓練エンジン180が知覚品質モデル190を訓練する細かさに拘らず、知覚品質モデル190は1組の特徴の任意の特定の細かさの1組の値を同じ細かさの1つの評点と関連付ける。より正確には、知覚品質モデル190は1組のS個の空間的特徴の1組のS個の値及び1組のT個の時間特徴の1組のT個の値を関連し知覚される視覚品質を予測する1つの評点と関連付ける。例えば、知覚品質モデル190は第1フレームの空間的特徴の1組のS個のフレーム値及び第1フレームの時間特徴の1組のT個のフレームペア値を第1フレームの知覚される視覚品質を表すフレーム評点と関連付ける。
【0031】
実線で描かれた予測段階の間、特徴抽出器140、予測エンジン192、及び時間プーリングエンジン194は共同し復元されたターゲット144の品質評点184を知覚品質モデル190、復元されたターゲット144、及びターゲット142に基づいて予測する。特徴抽出器140、予測エンジン192、及び時間プーリングエンジン194は本書で「予測アプリケーション」と総称される。復元ターゲット144は、限定されないが、ターゲット142に含まれる映像内容から得られる復元映像内容を含む。ターゲット142は、限定されないが、任意の量及び種類の映像内容を含む。
【0032】
復元ターゲット144は、見る人に配信基盤及び表示装置を介して伝えられる関連ソース122に含まれた映像内容を複製する。復元ターゲット144は任意の技術的に可能なやり方で生成されてもよい。例えば、幾つかの実施形態では、符号器はターゲット142を一定速度符号化手順に基づいて符号化し符号化されたターゲットを生成する。次に、復号器はその符号化されたターゲットを復号して復元ターゲット144を生成する。
【0033】
知覚品質モデル190と関連する各空間的特徴について、空間抽出器148は空間配列172を復元ターゲット144及び随意にターゲット142に基づいて計算する。知覚品質モデル190に関連する各時間的特徴について、時間抽出器146は時間配列174を復元ターゲット144及びターゲット142に基づいて計算する。このようにして、復元ターゲット144に含まれた各フレームについて、特徴抽出器140は各空間的特徴の異なるフレーム値及び各時間的特徴の異なるフレームペア値を計算する。
【0034】
復元ターゲット144に含まれた各フレームについて、予測エンジン192はそのフレームと関連するフレーム値、そのフレームと関連するフレームペア値、及び知覚品質モデル190に基づいてフレーム評点を生成する。例えば、復元ターゲット144に含まれた第1フレームについて、予測エンジン192はそれらの特徴の第1組の値を空間配列172の第1要素及び時間配列174の第1要素に基づいて計算する。次に予測エンジン192は第1フレームのフレーム評点をそれらの特徴の第1組の値及び知覚品質モデル190に基づいて算出する。他の実施形態では、予測エンジン192は知覚される視覚品質の評点を任意のレベルの細かさでそれらの特徴の同じ細かさレベルの値及び知覚品質モデル190に基づいて計算してもよい。
【0035】
次に、時間プーリングエンジン194は復元ターゲット144の品質評点184をフレーム評点の算術平均に基づいて算出する。より具体的には、時間プーリングエンジン194はフレーム評点の全てを合計しその合計をフレームの総数で割って品質評点184を計算する。従って、品質評点184は復元ターゲット144に含まれた全てのフレームに亘る平均視覚品質を表す。最後に時間プーリングエンジン194は復元ターゲット144の品質評点184を配信映像内容の評価のために送信又は表示する。
【0036】
他の実施形態では、時間プーリングエンジン194は復元ターゲット144の品質評点184をフレーム評点に基づいて任意の技術的に可能なやり方で算出してもよい。例えば、幾つかの実施形態では、時間プーリングエンジン194は人意見評点の比較的滑らかな分散によく似たヒステリシスプーリング操作を映像品質の変化に応答して実行してもよい。より正確には、時間プーリングエンジン194は線形ローパス操作及び非線形(順位)重み付け操作両方をフレーム評点に実行し復元ターゲット144の品質評点184を生成できる。
【0037】
幾つかの他の実施形態では、時間プーリングエンジン194は復元ターゲット144の単一品質評点184の代わりに復元ターゲット144の各チャンクの異なる品質評点184を算出する。ここで呼ばれるように、「チャンク」は場面に通常対応し、場面は、時空特性がほぼ一定の一連のフレームである。復元ターゲット144の特定のチャンクの品質評点184を計算するために、時間プーリングエンジン194はそのチャンクに含まれたフレームの小さい組のフレーム評点の算術平均を計算する。
【0038】
復元映像内容の品質を従来の知覚品質モデルにより予測することの1つの限界は、従来の知覚品質モデルは通常確実さを欠くことである。例えば、従来の知覚品質モデルに関連する特徴のどれもあるタイプの歪みを反映しない場合、従来の知覚品質モデルはこのような歪みを含む復元映像内容の品質の人知覚を正確に予測できない。
【0039】
従来の知覚品質モデルは通常複数の空間的特徴及び単一の時間的特徴と関連する。空間的特徴は、限定されないが、幾つか例を挙げると、任意の数の付加欠陥計測(ADM)特徴、ブラインド又は基準なし画像空間的品質評価器特徴、及び視覚情報忠実度(VIF)特徴を含んでよい。時間的特徴はフレーム差特徴である。特定のフレームペアについて、従来の時間抽出器はそれら2つのフレーム間の画素単位の輝度差を計算する。次に時間抽出器はフレーム差特徴のフレームペア値を画素単位の輝度差の平均に等しく設定する。
【0040】
しかし、公有LIVE映像品質データベースを使って実行されたベンチマーク試験により示されたように、フレーム差特徴は多くのタイプの複雑な時間的映像歪みに起因する知覚される品質劣化を正確に測ることはない。複雑な時間的映像歪みの例は、限定されないが、動き推定不適合、ちらつき、及び多重画像を含む。フレーム差特徴は複雑な時間的映像歪みの信頼できない尺度であるので、従来の知覚品質モデルは復元映像内容の知覚される視覚品質を確実には予想できない。
【0041】
正確な時間的特徴の実現
上記問題に対処するために、システム100は人の視覚システムがどのように視覚情報を処理するかの面を模倣する複数の時間的特徴を確立する。例えば、図2と共に説明したように、人の視覚システムは視覚情報を複数の縮尺で処理するので、時間抽出器146は複数の時間的特徴のフレームペア値を計算する。ここで、各時間的特徴は異なる縮尺と関連する。他の実施形態では、時間抽出器146は任意の数の時間的特徴のフレームペア値を複数の縮尺が表されることを保証する任意の技術的に可能なやり方で計算してもよい。通常、時間抽出器146は知覚的に関連する複数の時間的特徴であって、複雑な時間的映像歪みに起因する知覚される品質劣化を一緒に正確に測る複数の時間的特徴のフレームペア値を計算する。
【0042】
本書に示したシステム100は例示であり変形及び部分変更が可能であることは理解されるであろう。例えば、本書に説明した訓練特徴エンジン130、訓練エンジン180、特徴抽出器140、空間抽出器148、時間抽出器146、予測エンジン192、及び時間プーリングエンジン194により提供される機能は1つを含む任意の数のソフトウェア・アプリケーション及びシステム100の任意の数の構成要素に統合されても又はに亘って分散されてもよい。また、図1内の様々なユニット間の接続形態は望むように変更されてもよい。
【0043】
図2は本発明の様々な実施形態に係る図1の時間抽出器146のより詳細な図である。図示のように、時間抽出器146は、限定されないが、フレーム比較エンジン220、ダウンサンプリングエンジン240、空間フィルタリングエンジン250、エントロピーエンジン270、エントロピー比較エンジン280、及び空間プーリングエンジン290を含む。
【0044】
通常、時間抽出器146は復元映像内容の時間的特徴の値を復元映像内容及びその復元映像内容がそれから得られる映像内容に基づいて生成する。特に、各時間的特徴は異なる縮尺250と関連する。復元映像内容は復元ソース124又は復元ターゲット144のどちらでもよい。説明目的だけのために、時間抽出器146は、復元ターゲット144の第1時間的特徴の時間配列174(1)を生成する文脈で図2に描かれている。
【0045】
図示のように、復元ターゲット144は、限定されないが、フレーム210(1)~210(F)を含み、Fは1より大きい任意の整数である。相補的に、ターゲット142は、限定されないが、フレーム210’(1)~210’(F)を含む。説明目的だけのために、ターゲット142に関連する対象物は、符号を飾るプライム記号(即ち、’)で復元ターゲット144に関連する相当する対象物と区別される。図1と共に説明したように、復元ターゲット144及びターゲット142のそれぞれはF個のフレーム210及びF個のフレームペアと関連する。
【0046】
動作時、フレーム比較エンジン220(1)はフレーム差マトリックス230(1)~230(F)を復元ターゲット144に基づいて計算する。各フレーム差マトリックス230は差フレームペアと関連する。通常、フレーム差マトリックス230(x)を計算するために、フレーム比較エンジン220(1)はフレーム210(x)と210(x+1)の間の画素単位比較操作を実行し画素単位輝度差を算出する。従って、フレーム差マップ230(x)に含まれる各画素位置は異なる画素単位輝度差を指定する。同様に、フレーム比較エンジン220(2)はフレーム差マトリックス230’(1)~230’(F)をターゲット142に基づいて独立に計算する。
【0047】
ダウンサンプリングエンジン240(1)はダウンサンプリング操作をフレーム差マトリックス230(1)~230(F)のそれぞれに第1時間的特徴に関連する縮尺250(1)に基づいて独立に実行して縮減フレーム差(FD)マトリックス242(1)~242(F)を生成する。図示のように、縮尺250(1)は2に等しい。他の実施形態では、第1時間的特徴は任意の縮尺250と任意の技術的に可能なやり方で関連してよい。ダウンサンプリングエンジン240(1)は縮尺250(1)に基づく任意の数及び種類のダウンサンプリング操作を行ってもよい。通常、各フレーム差マトリックス230がN×M画素を含み縮尺250(1)がQである場合、各縮減フレーム差マトリックス242は(N/Q)×M/Q個の画素を含む。同様に、ダウンサンプリングエンジン240(2)はダウンサンプリング操作をフレーム差マトリックス230’(1)~230’(F)のそれぞれに縮尺250(1)に基づいて独立に実行して縮減フレーム差マトリックス242’(1)~242’(F)を生成する。
【0048】
空間フィルタリングエンジン250(1)は、縮減フレーム差マトリックス242(1)~242(F)のそれぞれを独立に処理して局所平均減算マトリックス262(1)~262(F)を生成する。縮減フレーム差マトリックス242(x)を処理するために、空間フィルタリングエンジン250(1)は帯域通過フィルタリングに類似した2段局所空間フィルタリング処理を縮減フレーム差マトリックス242(x)に実行する。先ず、空間フィルタリングエンジン250(1)は縮減フレーム差マトリックス242(x)を空間等方性ガウスフィルターでフィルタリングして局所平均縮減フレーム差マトリックス(不図示)を生成する。次に空間フィルタリングエンジン250(1)は縮減フレーム差マトリックス242(x)から局所平均縮減フレーム差マトリックスを減算して局所平均減算マトリックス262(x)を生成する。同様に、空間フィルタリングエンジン250(2)は、縮減フレーム差マトリックス242’(1)~242’(F)のそれぞれを独立に処理して局所平均減算マトリックス262’(1)~262’(F)を生成する。
【0049】
エントロピーエンジン270(1)は、局所平均減算マトリックス262(1)~262(F)のそれぞれに調整操作を独立に実行して重み付きエントロピーマトリックス272(1)~272(F)を生成する。特に、調整操作は一次視覚野(領域V1)に生じると知られているdivisive normalization(神経系における正規化)処理に関係する。局所平均減算マトリックス262(x)を処理するために、空間フィルタリングエンジン250(1)は局所平均減算マトリックス262(x)に含まれるサンプルを複数の重なるブロックに割り当て、各ブロックは1つのbxb組の隣接するサンプルを含む。次に空間フィルタリングエンジン250(1)はそれらの重なるブロックに基づいてbxb共分散マトリックスを推定する。空間フィルタリングエンジン250(1)はまた、局所平均減算マトリックス262(x)に含まれる複数のサンプルを複数の重ならないbxbブロックに分割する。各重ならないブロックについて、空間フィルタリングエンジン250(1)はその重ならないブロックの分散を計算する。
【0050】
次に、各重ならないブロックについて、空間フィルタリングエンジン250(1)は重ならないブロックのエントロピー値を共分散マトリックスに基づいて計算する。最後に、各重ならないブロックについて、空間フィルタリングエンジン250(1)はその重ならないブロックのエントロピー値を重ならないブロックの分散で対数関数により重み付けして重み付きエントロピー値を計算する。従って、重み付きエントロピーマトリックス272(x)は、限定されないが、各重ならないブロックの重み付きエントロピー値を含む。同様に、空間フィルタリングエンジン250(2)は局所平均減算マトリックス262’(1)~262’(F)のそれぞれを独立に処理して重み付きエントロピーマトリックス272’(1)~272’(F)を生成する。
【0051】
エントロピー差エンジン280はエントロピー差マトリックス282(1)~282(F)を復元ターゲット144と関連する重み付きエントロピーマトリックス272(1)~272(F)及びターゲット142と関連する重み付きエントロピーマトリックス272’(1)~272’(F)に基づいて計算する。より具体的には、エントロピー差マトリックス282(x)を計算するために、エントロピー差エンジン280は重み付きエントロピーマトリックス272(x)に含まれた各重み付きエントロピー値と重み付きエントロピーマトリックス272’(x)に含まれた対応する重み付きエントロピー値の差を計算する。従って、エントロピー差マトリックス282(x)は、限定されないが、各重ならないブロックの「エントロピー差値」を含む。
【0052】
空間プーリングエンジン290は空間プーリング操作を実行して時間配列174(1)をそれらのエントロピー差マトリックス282に基づいて生成する。図示のように、時間配列174(1)は、限定されないが、フレームペア値264(1)~264(x)を含む。時間配列174(1)に含まれる各フレームペア値264は復元ターゲット144に含まれるフレームペアのうち異なる1つのフレームペアの第1時間的特徴の値を指定する。フレームペア値264(x)を計算するために、空間プーリングエンジン290はエントロピー差値をエントロピー差マトリックス282(x)に含まれる全ての重ならないブロックに亘って平均する。
【0053】
他の実施形態では、空間プーリングエンジン290はエントロピー差マトリックス282(x)に含まれるエントロピー差値を任意の技術的に可能なやり方で総計しフレームペア値264(x)を生成してもよい。有利にも、復元映像内容とその復元映像内容がそれから得られる映像内容のエントロピー差は復元映像内容の品質の主観的人評価と相互に関連する。
【0054】
特に、第2時間的特徴は3である縮尺250(2)と関連し、第3時間的特徴は4である縮尺250(3)と関連する。時間配列174(2)を計算する時、ダウンサンプリングエンジン240(1)及び240(2)は3である縮尺250(2)に基づくダウンサンプリング操作を実行する。時間配列174(3)を計算する時、ダウンサンプリングエンジン240(1)及び240(2)は4である縮尺250(3)に基づくダウンサンプリング操作を実行する。フレーム比較エンジン220、空間フィルタリングエンジン250、エントロピーエンジン270、エントロピー比較エンジン280、及び空間プーリングエンジン290の動作は縮尺250に基づいて変更されない。有利にも、複数の縮尺で時間的特徴を計算することは、人視覚システムに本質的な多縮尺処理を反映する。
【0055】
本書に記載された手法は制限ではなく例示であり、本発明のより広い要旨及び範囲から逸脱することなく変更されてもよいことに留意すべきである。時間抽出器146、フレーム比較エンジン220、ダウンサンプリングエンジン240、空間フィルタリングエンジン250、エントロピーエンジン270、エントロピー比較エンジン280、及び空間プーリングエンジン290により提供される機能の多くの部分変更及び変形は、記載された実施形態の範囲及び要旨から逸脱することなく、当業者には明らかであろう。
【0056】
例えば、様々な実施形態では、時間抽出器146は任意の数の時間的特徴の値を任意の数の縮尺250でマトリックスのいずれかに基づいて計算するように構成されてもよい。例えば、時間抽出器146は第1フレーム差特徴のフレームペア値をフレーム差マトリックス230及び230’に基づいて計算できる。時間抽出器146は第2フレーム差特徴のフレームペア値を2である縮尺250と関連するフレーム差マトリックス242及び242’に基づいて計算できる。時間抽出器は第1エントロピー特徴のフレームペア値を2である縮尺250と関連するエントロピー差マトリックス282に基づいて計算できる。最後に、時間抽出器は第2エントロピー特徴のフレームペア値を3である縮尺250と関連するエントロピー差マトリックス282に基づいて計算できる。
【0057】
図3は本発明の様々な実施形態に係る復元映像内容の品質評点を計算するための方法ステップのフロー図である。方法ステップは図1~2のシステムを参照して説明されるが、当業者は方法ステップをいずれかの順序で実行するように構成されたどんなシステムも本発明の範囲に入ることを理解するであろう。
【0058】
図示のように、方法300は、フレーム比較エンジン220は復元ターゲット144に基づいてフレーム差マトリックス230を、ターゲット142に基づいてフレーム差マトリックス230’を生成するステップ302から始まる。ステップ304では、時間抽出器146は第1時間的特徴及び第1時間的特徴に関連する縮尺250(1)を選択する。ステップ306では、ダウンサンプリングエンジン240はフレーム差マトリックス230及びフレーム差マトリックス230’を選択された縮尺250に基づいてダウンサンプリングして縮減されたフレーム差マトリックス242及び縮減されたフレーム差マトリックス242’を生成する。
【0059】
ステップ308では、各縮減フレーム差マトリックス242について、空間フィルタリングエンジン250は局所空間フィルタリング操作をその縮減フレーム差マトリックス242に独立に実行して対応する局所平均減算マトリックス262を生成する。同様に、各縮減フレーム差マトリックス242’ について、空間フィルタリングエンジン250は局所空間フィルタリング操作をその縮減フレーム差マトリックス242’に独立に実行して対応する局所平均減算マトリックス262’を生成する。
【0060】
ステップ310では、各局所平均減算マトリックス262について、エントロピーエンジン270は調整操作をその局所平均減算マトリックス262に実行して重み付きエントロピーマトリックス272を計算する。同様に、各局所平均減算マトリックス262’について、エントロピーエンジン270は調整操作をその局所平均減算マトリックス262’に実行して重み付きエントロピーマトリックス272’を計算する。
【0061】
ステップ312では、エントロピー差エンジン280は復元ターゲット144に関連する重み付きエントロピーマトリックス272をターゲット142に関連する重み付きエントロピーマトリックス272’と比較しエントロピー差マトリックス282を計算する。より具体的には、エントロピー差マトリックス282(x)を計算するために、エントロピー差エンジン280は重み付きエントロピーマトリックス272(x)に含まれる各重み付きエントロピー値と重み付きエントロピーマトリックス272’(x)に含まれる対応する重み付きエントロピー値の差を計算する。ステップ314では、各エントロピー差マトリックス282に対して、空間プーリングエンジン290は空間プーリング操作を実行して選択された時間的特徴に関連する時間配列174に含まれるフレームペア値264(x)を計算する。
【0062】
ステップ316では、時間抽出器146は選択された時間的特徴が最後の時間的特徴か否かを判断する。ステップ316で時間抽出器146が選択された時間的特徴が最後の時間的特徴でないと判断すると、方法300はステップ318へ進む。ステップ318では、時間抽出器146は次の特徴及び関連する縮尺250を選択し、方法300はステップ306へ戻り、ダウンサンプリングエンジン240がフレーム差マトリックス230及びフレーム差マトリックス230’を選択された縮尺250に基づいてダウンサンプリングする。
【0063】
しかし、ステップ316で時間抽出器146が選択された時間的特徴が最後の時間的特徴であると判断すると、方法300は直接ステップ320へ進む。ステップ320では、各空間的特徴に対して、空間抽出器146はフレーム値を復元ターゲット144及び随意にターゲット142に基づいて計算する。ステップ322では、各フレーム210に対して、予測エンジン192はフレーム評点をそのフレームに関連するフレーム値、そのフレームに関連するフレームペア値、及び知覚品質モデル190に基づいて生成する。
【0064】
ステップ324では、時間プーリングエンジン194は時間プーリング操作をフレーム評点に実行して復元ターゲット144の品質評点184を算出する。時間プーリングエンジン194は任意の数及び種類の時間プーリング操作を実行しフレーム評点を総計してもよい。例えば、幾つかの実施形態では、時間プーリングエンジン194は復元ターゲット144の品質評点184をフレーム評点の算術平均に基づいて算出する。次に時間プーリングエンジン194は復元ターゲット144の品質評点184を配信される映像内容の評価のために送信又は表示する。そして方法300は終了する。
【0065】
有利なことに、任意の数の品質評点184を総計して配信されるメディアコンテンツの視覚品質を評価することの一部として総計品質評点を生成してもよい。例えば、配信サービスを毎日監視する計器盤アプリケーションは配信サービスの健全さを総計品質評点に基づいて示しうる。通常、配信サービスに変化が起こらなければ、総計品質評点は安定したままである。結果として、特定の日とその前日の間の総計品質評点のずれは、配信メディアコンテンツの視覚品質に影響する配信サービスの変化(例えば、問題又は改善)を示す。一方、配信サービスの変化が配信メディアコンテンツの視覚品質に影響するよう意図されていない場合、総計品質評点は配信メディアコンテンツの視覚品質は影響されていないことの確認を提供できる。例えば、スマートフォン用の新しい符号化が視覚品質を保ったまま帯域幅を節約するならば、時間加重ビットレートは減少するが総計品質評点は安定したままである。
【0066】
別の例では、A/B試験アプリケーションは対照群の配信セッションを1つ以上の処置群の配信セッションと比較する。処置群は対照群と厳密に1つの重要パラメータにおいて異なる。総計品質評点は配信メディアコンテンツの視覚品質がその重要パラメータの違いにより影響されるか否かを示す。例えば、処置群が新しい符号化を使用し、対照群が現在の符号化を使用する場合、A/B試験アプリケーションは対照群の総計品質評点と処置群の総計品質評点を比較できる。比較結果は新しい符号化が処置群の配信メディアコンテンツの視覚品質に影響するか否かを示す。
【0067】
相補知覚品質モデルに基づく視覚品質の予測
当業者は認識するであろうように、知覚品質モデル190に関連する特徴の数が増加すると、知覚品質モデル190を過剰適合させる可能性も増加する。知覚品質モデル190が過剰適合されると、知覚品質モデル190は訓練データ(例えば、客観的データベース150及び主観的データベース184)内の特異性をモデル化する。その結果、過剰適合知覚品質モデル190は訓練データベース120に含まれていない復元映像内容の品質評点184をしばしば正確には予測できない。単一知覚品質モデル190を過剰適合させる可能性を減らすために、本発明の幾つかの実施形態は複数の相補知覚品質モデル190を実施する。
【0068】
図4は本発明の1つ以上の態様を実施するように構成された集合システム400の概念図である。図示のように、集合システム400は、限定されないが、任意の数の計算インスタンス110を含む。図示のように、集合訓練エンジン410はメモリ116に存在し計算インスタンス110の1つのプロセッサ上で実行される。集合予測エンジン490はメモリ116に存在し別の計算インスタンス110のプロセッサ112上で実行される。他の実施形態では、集合訓練エンジン410及び集合予測エンジン490は任意の数及び種類のメモリに存在し任意の数及び種類の処理装置上で任意の組合せで実行されてもよい。集合予測エンジン490は本書で「集合予測アプリケーション」とも呼ばれる。
【0069】
集合訓練エンジン410は、限定されないが、特徴割り当て部420及び訓練エンジン180の2つのインスタンスを含む。特徴割り当て部420は任意の数の特徴を含む全体特徴セット412を受信し2つの特徴セット422(1)及び422(2)を生成する。より正確には、特徴割り当て部420は全体特徴セット412に含まれる各特徴を特徴セット422の少なくとも1つに割り当てる。
【0070】
特徴割り当て部420は任意の技術的に可能なやり方で全体特徴セット412に含まれる各特徴を特徴セット422の少なくとも1つに割り当てるように構成されてもよい。例えば、幾つかの実施形態では、特徴割り当て部420は特徴セット422をグラフィカルユーザーインターフェース(不図示)を介して受信したユーザー入力に基づいて生成する。他の実施形態では、特徴割り当て部420は特徴セット422を任意の数及び種類の基準を最適化する任意の数の発見的教授法に基づいて生成する。
【0071】
説明目的だけのために、図4に描かれた全体特徴セット412は5つの空間的特徴及び4つの時間的特徴を含む。5つの空間的特徴は1つのVIF特徴と4つのADM特徴(4つの異なる縮尺250に関連する)を含む。4つの時間的特徴は1つのフレーム差特徴と3つのエントロピー特徴(3つの異なる縮尺250に関連する)を含む。特徴割り当て部420は5つの空間的特徴を特徴セット422(1)及び特徴セット422(2)両方に、フレーム差特徴を特徴セット422(1)に、3つのエントロピー特徴を特徴セット422(2)に割り当てる。
【0072】
次に、集合訓練エンジン410は、主観的データベース182及び特徴セット422(1)に含まれる特徴の値を指定する客観的データベース150の部分に基づいて知覚品質モデル190(1)を生成するように訓練エンジン180(1)を構成する。一方、集合訓練エンジン410は、主観的データベース182及び特徴セット422(2)に含まれる特徴の値を指定する客観的データベース150の部分に基づいて知覚品質モデル190(2)を生成するように訓練エンジン180(2)を構成する。
【0073】
他の実施形態では、集合訓練エンジン410は異なる機械学習アルゴリズムを実行する2つの異なる訓練エンジンを含む。集合訓練エンジン410は、主観的データベース182及び特徴セット422(1)に含まれる特徴の値を指定する客観的データベース150の部分に基づいて知覚品質モデル190(1)を生成するように第1訓練エンジンを構成する。集合訓練エンジン410は、主観的データベース182及び特徴セット422(2)に含まれる特徴の値を指定する客観的データベース150の部分に基づいて知覚品質モデル190(2)を生成するように第2訓練エンジンを構成する。
【0074】
通常、知覚品質モデル190(1)は特徴セット422(1)の1組の値を第1品質評点と関連付け、知覚品質モデル190(2)は特徴セット422(2)の1組の値を第2品質評点と関連付ける。有利にも、知覚品質モデル190のどちらも全体特徴セット412に含まれる特徴の全てとは関連しないので、集合訓練エンジン410が過剰適合した知覚品質モデル190を生成する可能性は減少する。
【0075】
集合予測エンジン490は、限定されないが、予測エンジンの2つのインスタンス192(1)及び192(2)、総計エンジン440、及び時間プーリングエンジン194を含む。集合予測エンジン490は知覚品質モデル190(1)、知覚品質モデル190(2)、及び復元ターゲット144に関連するターゲット特徴データベース170を受信する。他の実施形態では、集合予測エンジン490はターゲット特徴データベース170を計算するように特徴抽出器140を構成する。
【0076】
集合予測エンジン490は知覚品質モデル190(1)及び特徴セット422(1)に含まれる特徴に関連するターゲット特徴データベース170の部分に基づいてフレーム予測データベース430(1)を計算するように予測エンジン192(1)を構成する。復元ターゲット144に含まれる各フレーム210(x)について、フレーム予測データベース430(1)は、限定されないが、フレーム210の予測された知覚視覚品質を表すフレーム評点434(x)を含む。動作時、フレーム210(x)について、集合予測エンジン490はターゲット特徴データベース170に基づいて特徴セット422(1)の1組の値を算出する。次に集合予測エンジン490はフレーム予測データベース430(1)に含まれるフレーム評点434(x)を特徴セット422(1)のその1組の値及び知覚品質モデル190(1)に基づいて計算するように予測エンジン192(1)を構成する。
【0077】
相補的やり方で、集合予測エンジン490は知覚品質モデル190(2)及び特徴セット422(2)に含まれる特徴に関連するターゲット特徴データベース170の部分に基づいてフレーム予測データベース430(2)を計算するように予測エンジン192(2)を構成する。動作時、フレーム210(x)について、集合予測エンジン490はターゲット特徴データベース170に基づいて特徴セット422(2)の1組の値を算出する。次に集合予測エンジン490はフレーム予測データベース430(2)に含まれるフレーム評点434(x)を特徴セット422(2)のその1組の値及び知覚品質モデル190(2)に基づいて計算するように予測エンジン192(2)を構成する。
【0078】
フレーム予測データベース430(1)及びフレーム予測データベース430(2)を受信すると、総計エンジン440は各フレーム210について異なる総計フレーム評点454を含む総計予測データベース450を生成する。より正確には、総計エンジン440は任意の数の総計操作をフレーム予測データベース430(1)に含まれるフレーム評点434(x)及びフレーム予測データベース430(2)に含まれるフレーム評点434(x)に実行してフレーム210(x)に対する総計フレーム評点454(x)を生成する。
【0079】
総計エンジン440は任意の技術的に可能なやり方で総計フレーム評点454を計算してもよい。例えば、幾つかの実施形態では、総計エンジン440はフレーム予測データベース430(1)に含まれるフレーム評点434(x)及びフレーム予測データベース430(2)に含まれるフレーム評点434(x)の平均値を計算してフレーム210(x)の総計フレーム評点454(x)を生成する。他の実施形態では、総計エンジン440はフレーム予測データベース430(1)に含まれるフレーム評点434(x)及びフレーム予測データベース430(2)に含まれるフレーム評点434(x)の加重平均値を計算してフレーム210(x)の総計フレーム評点454(x)を生成する。
【0080】
更に他の実施形態では、総計エンジン440は任意の数の機械学習アルゴリズムを実行して、特徴セット422(1)に関連するフレーム評点434及び特徴セット422(2)に関連する対応するフレーム評点434を総計フレーム品質評点454と関連付ける集合モデルを生成してもよい。総計エンジン440が実行してよい機械学習アルゴリズムの例は、限定されないが、ベイズ系方法、バギング、ブースティング、ベイズパラメータ平均化、ベイズモデル組合せ、bucket of models、積み重ねなどを含む。集合モデルは、訓練エンジン180が知覚品質モデル190を生成するために実行する同じ機械学習アルゴリズムを実行する場合としない場合がある。次に、総計エンジン440は総計フレーム評点454を含む総計予測データベース450を集合モデル、フレーム予測データベース430(1)、及びフレーム予測データベース430(2)に基づいて計算してもよい。
【0081】
総計エンジン440が総計予測データベース450を生成した後、時間プーリングエンジン194は任意の数の時間プーリング操作を総計予測データベース450に実行し復元ターゲット144の品質評点184を計算する。図1と共に詳細に説明したように、時間プーリング操作の幾つかの例は算術平均操作及びヒステリシスプーリング操作を含む。また、図1と共に詳細に説明したように、他の実施形態では、時間プーリングエンジン194は復元ターゲット144の各チャンクの異なる品質評点184を生成してもよい。
【0082】
特に、品質評点184の信頼性は知覚品質モデル190(1)の信頼性、知覚品質モデル190(2)の信頼性、及びこれらの知覚品質モデル190が互いに補完する度合に相互関連する。従って、特徴割り当て部420は、特徴セット422を品質評点184の精度及び/又は確実さを最適化する任意の数の発見的教授法に基づいて生成するように構成されてもよい。
【0083】
例えば、幾つかの実施形態では、特徴割り当て部420は各特徴セット422に含まれる特徴を最適化して知覚視覚品質の時空的面を捕え、正確で確実な知覚品質モデル190を生じさせ、複数の特徴セット422に亘ってかつ特徴セット422内で多様である発見的教授法を実行する。
【0084】
本書に記載された手法は制限ではなく例示であり、本発明のより広い要旨及び範囲から逸脱することなく変更されてもよいことに留意すべきである。集合訓練エンジン410、特徴割り当て部420、訓練エンジン180、集合予測エンジン490、予測エンジン192、総計エンジン440、及び時間プーリングエンジン194により提供される機能の多くの部分変更及び変形は、記載された実施形態の範囲及び要旨から逸脱することなく、当業者には明らかであろう。
【0085】
図5は本発明の様々な実施形態に係る2つの異なる組の特徴に基づいて復元映像内容の全体品質評点を計算するための方法ステップのフロー図である。方法ステップは図1、2、及び4のシステムを参照して説明されるが、当業者は方法ステップをいずれかの順序で実行するように構成されたどんなシステムも本発明の範囲に入ることを理解するであろう。
【0086】
図示のように、方法500は全体特徴セット412に含まれる各特徴について、特徴割り当て部420がその特徴を特徴セット422(1)及び特徴セット422(2)の少なくとも1つに割り当てるステップ502から始まる。特に、各特徴セット422に含まれる少なくとも1つの特徴は他方の特徴セット422には含まれない。ステップ504では、集合訓練エンジン410は主観的データベース182及び特徴セット422(1)に関連する客観的データベース150の部分に基づいて知覚品質モデル190(1)を生成するように訓練エンジン180(1)を構成する。ステップ506では、集合訓練エンジン410は主観的データベース182及び特徴セット422(2)に関連する客観的データベース150の部分に基づいて知覚品質モデル190(2)を生成するように訓練エンジン180(2)を構成する。
【0087】
ステップ508では、集合予測エンジン490はターゲット142及び復元ターゲット144を受信する。ステップ510では、復元ターゲット144に含まれる各フレーム210について、集合予測エンジン490は特徴セット422(1)の第1組の値及び特徴セット422(2)の第2組の値を計算する。より正確には、集合予測エンジン490は復元ターゲット144及びターゲット142に基づいてターゲット特徴データベース170を計算するように特徴抽出器140を構成する。各フレーム210について、集合予測エンジン490は次に特徴セット422(1)の第1組の値及び特徴セット422(2)の第2組の値をターゲット特徴データベース170に基づいて特定する。他の実施形態では、各フレーム210について、集合予測エンジン490は特徴セット422(1)の第1組の値及び特徴セット422(2)の第2組の値を任意の技術的に可能なやり方で計算してもよい。
【0088】
ステップ512では、各フレーム210(x)について、集合予測エンジン490は特徴セット422(1)の関連する組の値及び知覚品質モデル190(1)に基づいて第1フレーム評点434(x)を計算するように予測エンジン192(1)を構成する。ステップ514では、各フレーム210(x)について、集合予測エンジン490は特徴セット422(2)の関連する組の値及び知覚品質モデル190(2)に基づいて第2フレーム評点434(x)を計算するように予測エンジン192(2)を構成する。
【0089】
ステップ516では、各フレーム210(x)について、総計エンジン440は第1フレーム評点434(x)及び第2フレーム評点434(x)に基づいて総計フレーム評点454を計算する。ステップ518では、時間プーリングエンジン194はフレーム210の総計フレーム評点454に基づいて復元ターゲット144の品質評点184を計算する。時間プーリングエンジン194は任意の数及び種類の時間プーリング操作を実行してフレーム評点434を総計してもよい。例えば、幾つかの実施形態では、時間プーリングエンジン194は復元ターゲット144に含まれるフレーム210のフレーム評点434の算術平均に基づいて復元ターゲット144の品質評点184を算出する。
【0090】
次に時間プーリングエンジン194は復元ターゲット144の品質評点184を配信される映像内容の評価のために送信又は表示する。そして方法500は終了する。有利にも、図3と共に更に詳細に説明したように、任意の数の品質評点184を総計して配信メディアコンテンツの視覚品質を評価することの一部として総計品質評点を生成してもよい。
【0091】
要約すると、開示の手法は復元映像内容の品質評点を効率的に確実に予測するために使用されてよい。訓練段階の間、訓練エンジンは特徴の値を品質評点に対応付ける知覚品質モデルを生成する。次に、予測段階の間、予測エンジンは復元映像内容のフレーム単位の品質評点を知覚品質モデル及び復元映像内容の特徴の値に基づいて計算する。時間プーリングエンジンは次にこれらのフレーム単位の品質評点を単一の品質評点に合成する。特に、訓練段階及び予測段階両方の間、時間抽出器は複数の時間的特徴のフレーム単位の値を計算する。ここで各時間的特徴は異なる縮尺に関連する。
【0092】
時間抽出器は特定の時間的特徴のフレーム単位の値を復元映像内容、映像内容、及び時間的特徴に関連する縮尺に基づいて計算する。特定のフレームのフレーム単位の値を計算するために、時間抽出器はそのフレームと隣接フレームの輝度の差を指定するフレーム差マトリックスを計算する。次に時間抽出器はフレーム差マトリックスを縮尺に基づいてダウンサンプリングして縮減されたフレーム差マトリックスを生成する。次に、時間抽出器は時間フィルタリング操作及び局所平均減算操作を縮減されたフレーム差マトリックスに実行して復元映像内容のそのフレームに関連する第1重み付きエントロピーマトリックスを計算する。同様に、時間抽出器は映像内容及び縮尺に基づいて映像内容の対応するフレームに関連する第2重み付きエントロピーマトリックスを得る。時間抽出器は第1重み付きエントロピーマトリックスと第2重み付きエントロピーマトリックスの間の減算操作を実行してエントロピー差マトリックスを計算する。最後に、時間抽出器は空間プーリング操作をエントロピー差マトリックスに実行してその特徴の単一のフレーム特定の値を生成する。
【0093】
幾つかの実施形態では、集合予測エンジンは復元映像内容の品質評点を2つの知覚品質モデルに基づいて計算する。各知覚品質モデルは1つの異なる組の特徴の値を1つの異なる品質評点に対応付ける。復元映像内容に含まれる各フレームについて、集合予測エンジンは第1フレーム評点を第1知覚品質モデル及び第1組の特徴の第1組の値に基づいて計算する。復元映像内容に含まれる各フレームについて、集合予測エンジンは第2フレーム評点を第2知覚品質モデル及び第2組の特徴の第2組の値に基づいて計算する。各フレームについて、集合予測エンジンは次に第1フレーム評点と第2フレーム評点を総計して総計フレーム評点を生成する。最後に、時間プーリングエンジンは復元映像内容に含まれる全てのフレームの総計フレーム評点に基づいて単一の品質評点を生成する。
【0094】
従来技術に対する少なくとも1つの技術的改善は、エントロピー差マトリックスを複数の縮尺で計算することは人の視覚システムがどのように視覚情報を処理するかの面を模倣することである。結果として、時間的特徴は多くのタイプの複雑な時間的映像歪みに起因する知覚される品質劣化を正確にモデル化する。また、異なる組の特徴に関連する異なる複数の知覚品質モデルに基づいて品質評点を計算することは、特徴の総数を増加させることが過剰適合に起因する不正確さを引き起こす可能性を減少させる。
【0095】
1.幾つかの実施形態では、コンピュータ実行方法は、復元映像内容の第1品質評点を第1組の特徴の第1組の値及び前記第1組の値を前記第1品質評点と関連付ける第1モデルに基づいて計算するステップであって、前記第1モデルは第1機械学習アルゴリズムにより生成される、ステップと、前記復元映像内容の第2品質評点を第2組の特徴の第2組の値及び前記第2組の値を前記第2品質評点と関連付ける第2モデルに基づいて計算するステップと、前記復元映像内容の全体品質評点を前記第1品質評点及び前記第2品質評点に基づいて算出するステップであって、前記全体品質評点は配信される映像内容に関連する視覚品質のレベルを示す、ステップとを含む。
【0096】
2.前記第1品質評点及び前記第2品質評点は前記復元映像内容に含まれる第1フレームに関連し、前記全体品質評点を算出するステップは、前記第1フレームに関連する第1総計品質評点を前記第1品質評点及び前記第2品質評点に基づいて算出するステップと、1つ以上の時間プーリング操作を前記第1総計品質評点及び前記復元映像内容に含まれる第2フレームに関連する第2総計品質評点に実行して前記全体品質評点を計算するステップとを含む、項1記載のコンピュータ実行方法。
【0097】
3.前記第1総計品質評点を算出するステップは、前記第1品質評点及び前記第2品質評点の平均又は加重平均を計算するステップを含む、項1又は2記載のコンピュータ実行方法。
【0098】
4.前記第1総計品質評点を算出するステップは、前記第1機械学習アルゴリズム又は第2機械学習アルゴリズムにより生成される第3モデルに基づいて前記第1品質評点及び前記第2品質評点を前記第1総計品質評点と関連付けるステップを含む、項1~3のいずれかに記載のコンピュータ実行方法。
【0099】
5.前記第1組の特徴は、前記第2組の特徴に含まれていない第1特徴を含み、前記第2組の特徴は、前記第1組の特徴に含まれていない第2特徴を含む、項1~4のいずれかに記載のコンピュータ実行方法。
【0100】
6.前記第1組の特徴は、1つの時間的特徴と1つの空間的特徴とを含む、項1~5のいずれかに記載のコンピュータ実行方法。
【0101】
7.前記第1組の特徴は、付加欠陥計測特徴、ブラインド又は基準なし画像空間的品質評価器特徴、及び視覚情報忠実度特徴のうち少なくとも1つを含む、項1~6のいずれかに記載のコンピュータ実行方法。
【0102】
8.前記第1モデルを前記第1機械学習アルゴリズム及び複数の主観的評点に基づいて生成するステップを更に含み、前記複数の主観的評点に含まれる各主観的評点は異なる復元試験映像内容と関連する、項1~7のいずれかに記載のコンピュータ実行方法。
【0103】
9.前記第2モデルを前記複数の主観的評点に基づいて生成するステップを更に含む項1~8のいずれかに記載のコンピュータ実行方法。
【0104】
10.幾つかの実施形態では、コンピュータ読取可能記憶媒体は命令群を含み、プロセッサにより実行される時に前記命令群は前記プロセッサに、復元映像内容の第1品質評点を第1組の特徴の第1組の値及び前記第1組の値を前記第1品質評点と関連付ける第1モデルに基づいて計算するステップであって、前記第1モデルは第1機械学習アルゴリズムにより生成される、ステップと、前記復元映像内容の第2品質評点を第2組の特徴の第2組の値及び前記第2組の値を前記第2品質評点と関連付ける第2モデルに基づいて計算するステップであって、前記第2モデルは前記第1機械学習アルゴリズム又は第2機械学習アルゴリズムにより生成される、ステップと、前記復元映像内容の全体品質評点を前記第1品質評点及び前記第2品質評点に基づいて算出するステップであって、前記全体品質評点は配信される映像内容に関連する視覚品質のレベルを示す、ステップとを実行させる。
【0105】
11.前記第1品質評点及び前記第2品質評点は前記復元映像内容に含まれる第1フレームに関連し、前記全体品質評点を算出するステップは、前記第1フレームに関連する第1総計品質評点を前記第1品質評点及び前記第2品質評点に基づいて算出するステップと、1つ以上の時間プーリング操作を前記第1総計品質評点及び前記復元映像内容に含まれる第2フレームに関連する第2総計品質評点に実行して前記全体品質評点を計算するステップとを含む、項10記載のコンピュータ読取可能記憶媒体。
【0106】
12.前記第1総計品質評点を算出するステップは、前記第1品質評点及び前記第2品質評点の平均又は加重平均を計算するステップを含む、項10又は11記載のコンピュータ読取可能記憶媒体。
【0107】
13.前記1つ以上の時間プーリング操作を実行するステップは、線形ローパス操作、非線形順位重み付け操作、及び算術平均操作のうち少なくとも1つを前記第1総計品質評点及び第2総計品質評点に実行するステップを含む、項10~12のいずれかに記載のコンピュータ読取可能記憶媒体。
【0108】
14.前記第1組の特徴は、前記第2組の特徴に含まれていない第1特徴を含み、前記第2組の特徴は、前記第1組の特徴に含まれていない第2特徴を含む、項10~13のいずれかに記載のコンピュータ読取可能記憶媒体。
【0109】
15.前記第1組の特徴は、1つの時間的特徴と1つの空間的特徴とを含む、項10~14のいずれかに記載のコンピュータ読取可能記憶媒体。
【0110】
16.前記第1組の特徴は、複数の時間的特徴を含み、前記複数の時間的特徴に含まれる各時間的特徴は異なる縮尺と関連する、項10~15のいずれかに記載のコンピュータ読取可能記憶媒体。
【0111】
17.前記第1品質評点を計算する前に、全体組の特徴に含まれる各特徴を特徴の前記第1組及び特徴の前記第2組のうち少なくとも1つに割り当てるステップを更に含む項10~16のいずれかに記載のコンピュータ読取可能記憶媒体。
【0112】
18.前記第1モデルを前記第1機械学習アルゴリズム及び複数の主観的評点に基づいて生成するステップを更に含み、前記複数の主観的評点に含まれる各主観的評点は異なる復元試験映像内容と関連する、項10~17のいずれかに記載のコンピュータ読取可能記憶媒体。
【0113】
19.幾つかの実施形態では、システムは命令群を記憶するメモリと、前記メモリに結合されたプロセッサとを備え、前記プロセッサは前記命令群を実行する時、復元映像内容の第1品質評点を第1組の特徴の第1組の値及び前記第1組の値を前記第1品質評点と関連付ける第1モデルに基づいて計算するステップであって、前記第1モデルは複数の主観的評点に基づいて生成される、ステップと、前記復元映像内容の第2品質評点を第2組の特徴の第2組の値及び前記第2組の値を前記第2品質評点と関連付ける第2モデルに基づいて計算するステップであって、前記第2モデルは前記複数の主観的評点に基づいて生成される、ステップと、前記復元映像内容の全体品質評点を前記第1品質評点及び前記第2品質評点に基づいて算出するステップであって、前記全体品質評点は配信される映像内容に関連する視覚品質のレベルを示す、ステップとを実行するように構成される。
【0114】
20.前記第1品質評点及び前記第2品質評点は前記復元映像内容に含まれる第1フレームに関連し、前記プロセッサは、前記第1フレームに関連する第1総計品質評点を前記第1品質評点及び前記第2品質評点に基づいて算出するステップと、1つ以上の時間プーリング操作を前記第1総計品質評点及び前記復元映像内容に含まれる第2フレームに関連する第2総計品質評点に実行して前記全体品質評点を計算するステップとを実行することで前記全体品質評点を算出するように構成される、項19記載のシステム。
【0115】
請求項のいずれかに記述された請求項要素のいずれか及び/又は本出願に記載されたいずれの要素の任意の及び全ての組み合わせは、どんなやり方でも、本発明及び保護の熟考された範囲内に入る。
【0116】
様々な実施形態の説明が例示の目的のために提示されているが、網羅的であるようにも開示された実施形態に限定されることも意図されていない。説明した実施形態の範囲及び要旨から逸脱することなく多くの改良や変更は当業者にとって明らかであろう。
【0117】
本実施形態の態様はシステム、方法、又はコンピュータプログラム製品として具体化されてよい。従って、本開示の態様は、完全にハードウェア実施形態、完全にソフトウェア実施形態(ファームウェア、常駐ソフトウェア、マイクロコードなどを含む)、又は本明細書において通常「モジュール」又は「システム」と呼ばれうるソフトウェア態様とハードウェア態様を組み合わせた実施形態の形をとってもよい。また、本開示の態様は、コンピュータ読取可能プログラムコードが組み込まれた1つ以上のコンピュータ読取可能媒体に具体化されたコンピュータプログラム製品の形をとってもよい。
【0118】
1つ以上のコンピュータ読取可能媒体のいずれの組み合わせを利用してよい。コンピュータ読取可能媒体は、コンピュータ読取可能信号媒体又はコンピュータ読取可能記憶媒体であってもよい。コンピュータ読取可能記憶媒体は、例えば、これらに限定されないが、電子、磁気、光学、電磁気、赤外線、又は半導体システム、装置、又はデバイス、又はそれらの任意の適切な組み合わせであってよい。コンピュータ読取可能記憶媒体のより具体的な例(非網羅的リスト)は、1つ以上のワイヤーを有する電気的接続、携帯型コンピュータディスケット、ハードディスク、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、消去・プログラム可能読み出し専用メモリ(EPROM又はフラッシュメモリ)、光ファイバー、携帯型コンパクトディスク読み出し専用メモリ(CD-ROM)、光学式記憶装置、磁気記憶装置、又はそれらの任意の適切な組み合わせを含むであろう。本明細書の文脈では、コンピュータ読取可能記憶媒体は、命令実行システム、装置、又はデバイスによる又はに関連した使用のためのプログラムを含み又は記憶しうる任意の有形の媒体であってよい。
【0119】
本開示の態様は、本開示の実施形態に係るフローチャート図及び/又は方法、装置(システム)、及びコンピュータプログラム製品のブロック図を参照して上記で説明されている。フローチャート図及び/又はブロック図の各ブロックと、フローチャート図及び/又はブロック図内のブロックの組み合わせとはコンピュータプログラム命令群により実施されうることは理解されよう。これらのコンピュータプログラム命令は汎用コンピュータ、特殊用途コンピュータ、又は機械を製造する他のプログラム可能データ処理装置のプロセッサに提供されてもよい。コンピュータ又は他のプログラム可能データ処理装置のプロセッサにより実行される時、それらの命令はフローチャート及び/又はブロック図内ブロックに明記された機能/動作の実行を可能にする。このようなプロセッサは、限定されないが、汎用プロセッサ、特殊用途プロセッサ、特定用途向けプロセッサ、又はフィールド・プログラム可能ゲートアレイであってもよい。
【0120】
図のフローチャート及びブロック図は、本開示の様々な実施形態に係る、システム、方法、及びコンピュータプログラム製品の可能な実施形態のアーキテクチャ、機能、及び動作を例示する。これに関して、フローチャート又はブロック図の各ブロックは、指定された論理機能を実行するための1つ以上の実行可能命令を含むコードのモジュール、セグメント、又は部分を表す場合がある。なお、幾つかの別の実施形態では、ブロックに記された機能は、図に記された順番から外れて発生してもよい。例えば、続けて示された2つのブロックは、実際には概ね同時に実行されるか、又は係る機能に依って、時には逆の順番に実行されるかもしれない。また、ブロック図及び/又はフローチャート図の各ブロックと、ブロック図及び/又はフローチャート図内のブロックの組み合わせとは、指定の機能又は動作を実行する特殊用途ハードウェアベースシステム又は特殊用途ハードウェア及びコンピュータ命令群の組み合わせにより実施されうる。
【0121】
上記は本開示の実施形態に向けられているが、本開示の他の及び追加の実施形態を本開示の基本的な範囲から逸脱することなく思い付くかもしれない。本開示の範囲は添付の請求項により決定される。
以下、本発明の好ましい実施形態を項分け記載する。
実施形態1
コンピュータ実行方法であって、
復元映像内容の第1品質評点を第1組の特徴の第1組の値及び前記第1組の値を前記第1品質評点と関連付ける第1モデルに基づいて計算するステップであって、前記第1モデルは第1機械学習アルゴリズムにより生成される、ステップと、
前記復元映像内容の第2品質評点を第2組の特徴の第2組の値及び前記第2組の値を前記第2品質評点と関連付ける第2モデルに基づいて計算するステップと、
前記復元映像内容の全体品質評点を前記第1品質評点及び前記第2品質評点に基づいて算出するステップであって、前記全体品質評点は配信される映像内容に関連する視覚品質のレベルを示す、ステップと
を含むコンピュータ実行方法。
実施形態2
前記第1品質評点及び前記第2品質評点は前記復元映像内容に含まれる第1フレームに関連し、前記全体品質評点を算出するステップは、
前記第1フレームに関連する第1総計品質評点を前記第1品質評点及び前記第2品質評点に基づいて算出するステップと、
1つ以上の時間プーリング操作を前記第1総計品質評点及び前記復元映像内容に含まれる第2フレームに関連する第2総計品質評点に実行して前記全体品質評点を計算するステップと
を含む、実施形態1に記載のコンピュータ実行方法。
実施形態3
前記第1総計品質評点を算出するステップは、前記第1品質評点及び前記第2品質評点の平均又は加重平均を計算するステップを含む、実施形態2に記載のコンピュータ実行方法。
実施形態4
前記第1総計品質評点を算出するステップは、前記第1機械学習アルゴリズム又は第2機械学習アルゴリズムにより生成される第3モデルに基づいて前記第1品質評点及び前記第2品質評点を前記第1総計品質評点と関連付けるステップを含む、実施形態2に記載のコンピュータ実行方法。
実施形態5
前記第1組の特徴は、前記第2組の特徴に含まれていない第1特徴を含み、前記第2組の特徴は、前記第1組の特徴に含まれていない第2特徴を含む、実施形態1に記載のコンピュータ実行方法。
実施形態6
前記第1組の特徴は、1つの時間的特徴と1つの空間的特徴とを含む、実施形態1に記載のコンピュータ実行方法。
実施形態7
前記第1組の特徴は、付加欠陥計測特徴、ブラインド又は基準なし画像空間的品質評価器特徴、及び視覚情報忠実度特徴のうち少なくとも1つを含む、実施形態1に記載のコンピュータ実行方法。
実施形態8
前記第1モデルを前記第1機械学習アルゴリズム及び複数の主観的評点に基づいて生成するステップを更に含み、前記複数の主観的評点に含まれる各主観的評点は異なる復元試験映像内容と関連する、実施形態1に記載のコンピュータ実行方法。
実施形態9
前記第2モデルを前記複数の主観的評点に基づいて生成するステップを更に含む実施形態8に記載のコンピュータ実行方法。
実施形態10
命令群を含むコンピュータ読取可能記憶媒体であって、プロセッサにより実行される時に前記命令群は前記プロセッサに、
復元映像内容の第1品質評点を第1組の特徴の第1組の値及び前記第1組の値を前記第1品質評点と関連付ける第1モデルに基づいて計算するステップであって、前記第1モデルは第1機械学習アルゴリズムにより生成される、ステップと、
前記復元映像内容の第2品質評点を第2組の特徴の第2組の値及び前記第2組の値を前記第2品質評点と関連付ける第2モデルに基づいて計算するステップであって、前記第2モデルは前記第1機械学習アルゴリズム又は第2機械学習アルゴリズムにより生成される、ステップと、
前記復元映像内容の全体品質評点を前記第1品質評点及び前記第2品質評点に基づいて算出するステップであって、前記全体品質評点は配信される映像内容に関連する視覚品質のレベルを示す、ステップと
を実行させる、コンピュータ読取可能記憶媒体。
実施形態11
前記第1品質評点及び前記第2品質評点は前記復元映像内容に含まれる第1フレームに関連し、前記全体品質評点を算出するステップは、
前記第1フレームに関連する第1総計品質評点を前記第1品質評点及び前記第2品質評点に基づいて算出するステップと、
1つ以上の時間プーリング操作を前記第1総計品質評点及び前記復元映像内容に含まれる第2フレームに関連する第2総計品質評点に実行して前記全体品質評点を計算するステップと
を含む、実施形態10に記載のコンピュータ読取可能記憶媒体。
実施形態12
前記第1総計品質評点を算出するステップは、前記第1品質評点及び前記第2品質評点の平均又は加重平均を計算するステップを含む、実施形態11に記載のコンピュータ読取可能記憶媒体。
実施形態13
前記1つ以上の時間プーリング操作を実行するステップは、線形ローパス操作、非線形順位重み付け操作、及び算術平均操作のうち少なくとも1つを前記第1総計品質評点及び第2総計品質評点に実行するステップを含む、実施形態11に記載のコンピュータ読取可能記憶媒体。
実施形態14
前記第1組の特徴は、前記第2組の特徴に含まれていない第1特徴を含み、前記第2組の特徴は、前記第1組の特徴に含まれていない第2特徴を含む、実施形態10に記載のコンピュータ読取可能記憶媒体。
実施形態15
前記第1組の特徴は、1つの時間的特徴と1つの空間的特徴とを含む、実施形態10に記載のコンピュータ読取可能記憶媒体。
実施形態16
前記第1組の特徴は、複数の時間的特徴を含み、前記複数の時間的特徴に含まれる各時間的特徴は異なる縮尺と関連する、実施形態10に記載のコンピュータ読取可能記憶媒体。
実施形態17
前記第1品質評点を計算する前に、全体組の特徴に含まれる各特徴を特徴の前記第1組及び特徴の前記第2組のうち少なくとも1つに割り当てるステップを更に含む実施形態10に記載のコンピュータ読取可能記憶媒体。
実施形態18
前記第1モデルを前記第1機械学習アルゴリズム及び複数の主観的評点に基づいて生成するステップを更に含み、前記複数の主観的評点に含まれる各主観的評点は異なる復元試験映像内容と関連する、実施形態10に記載のコンピュータ読取可能記憶媒体。
実施形態19
命令群を記憶するメモリと、
前記メモリに結合されたプロセッサと
を備えたシステムであって、前記プロセッサは前記命令群を実行する時、
復元映像内容の第1品質評点を第1組の特徴の第1組の値及び前記第1組の値を前記第1品質評点と関連付ける第1モデルに基づいて計算するステップであって、前記第1モデルは複数の主観的評点に基づいて生成される、ステップと、
前記復元映像内容の第2品質評点を第2組の特徴の第2組の値及び前記第2組の値を前記第2品質評点と関連付ける第2モデルに基づいて計算するステップであって、前記第2モデルは前記複数の主観的評点に基づいて生成される、ステップと、
前記復元映像内容の全体品質評点を前記第1品質評点及び前記第2品質評点に基づいて算出するステップであって、前記全体品質評点は配信される映像内容に関連する視覚品質のレベルを示す、ステップと
を実行するように構成される、システム。
実施形態20
前記第1品質評点及び前記第2品質評点は前記復元映像内容に含まれる第1フレームに関連し、前記プロセッサは、
前記第1フレームに関連する第1総計品質評点を前記第1品質評点及び前記第2品質評点に基づいて算出するステップと、
1つ以上の時間プーリング操作を前記第1総計品質評点及び前記復元映像内容に含まれる第2フレームに関連する第2総計品質評点に実行して前記全体品質評点を計算するステップと
を実行することで前記全体品質評点を算出するように構成される、実施形態19に記載のシステム。

【符号の説明】
【0122】
100 システム
110 計算インスタンス
112 プロセッサ
114 特徴抽出器
116 メモリ
120 訓練データベース
122 ソース
124 復元ソース
130 訓練特徴エンジン
140 特徴抽出器
142 ターゲット
144 復元ターゲット
146 時間抽出器
148 空間抽出器
150 客観的データベース
152 訓練特徴データベース
162 空間値
164 時間値
170 ターゲット特徴データベース
172 空間配列
174 時間配列
180 訓練エンジン
182 主観的データベース
184 品質評点
190 知覚品質モデル
192 予測エンジン
194 時間プーリングエンジン
210 フレーム
220 フレーム比較エンジン
230 フレーム差マトリックス
240 ダウンサンプリングエンジン
242 縮減FDマトリックス
250 空間フィルタリングエンジン
262 局所平均減算マトリックス
264 フレームペア値
270 エントロピーエンジン
272 重み付きエントロピーマトリックス
280 エントロピー差エンジン
282 エントロピー差マトリックス
290 空間プーリングエンジン
400 集合システム
410 集合訓練エンジン
420 特徴割り当て部
430 フレーム予測データベース
434 フレーム評点
440 総計エンジン
450 総計予測データベース
454 総計フレーム評点
490 集合予測エンジン
図1
図2
図3
図4
図5