特許第5746432号(P5746432)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ トムソン ライセンシングの特許一覧

特許5746432メディアデータの品質を評価するユーザ端末デバイス、サーバデバイス、システム、および方法
<>
  • 特許5746432-メディアデータの品質を評価するユーザ端末デバイス、サーバデバイス、システム、および方法 図000002
  • 特許5746432-メディアデータの品質を評価するユーザ端末デバイス、サーバデバイス、システム、および方法 図000003
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5746432
(24)【登録日】2015年5月15日
(45)【発行日】2015年7月8日
(54)【発明の名称】メディアデータの品質を評価するユーザ端末デバイス、サーバデバイス、システム、および方法
(51)【国際特許分類】
   G06Q 50/10 20120101AFI20150618BHJP
   H04N 17/00 20060101ALI20150618BHJP
【FI】
   G06Q50/10 100
   H04N17/00 A
【請求項の数】8
【全頁数】8
(21)【出願番号】特願2014-516150(P2014-516150)
(86)(22)【出願日】2011年6月21日
(65)【公表番号】特表2014-520331(P2014-520331A)
(43)【公表日】2014年8月21日
(86)【国際出願番号】CN2011076047
(87)【国際公開番号】WO2012174711
(87)【国際公開日】20121227
【審査請求日】2014年6月17日
(73)【特許権者】
【識別番号】501263810
【氏名又は名称】トムソン ライセンシング
【氏名又は名称原語表記】Thomson Licensing
(74)【代理人】
【識別番号】110001243
【氏名又は名称】特許業務法人 谷・阿部特許事務所
(72)【発明者】
【氏名】シエ カイ
(72)【発明者】
【氏名】グー シアオドン
(72)【発明者】
【氏名】チェン ジーボー
【審査官】 佐田 宏史
(56)【参考文献】
【文献】 特開2007−221765(JP,A)
【文献】 特開2003−199127(JP,A)
【文献】 特表2005−533424(JP,A)
【文献】 特表2011−504042(JP,A)
【文献】 特表2011−510562(JP,A)
【文献】 特表2004−520752(JP,A)
【文献】 特表2004−521580(JP,A)
【文献】 国際公開第2009/110238(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 50/10
H04N 17/00
H04L 12/26
(57)【特許請求の範囲】
【請求項1】
メディアデータからアーチファクト特徴を抽出する手段と、
前記抽出した特徴をサーバデバイスに送信する手段と、
前記サーバデバイスから、前記メディアデータについての品質スコアを受信する手段と、
受信した品質スコアをユーザに提示する手段と、
前記ユーザから、主観的な品質スコアおよび前記品質スコアの再決定の要求を受信する手段と、
を備え、
前記送信する手段は、前記品質スコアの再決定の要求と前記主観的な品質スコアとを前記サーバデバイスに通信するよう適合されている、ユーザ端末デバイス。
【請求項2】
ユーザ端末デバイスから、メディアデータから抽出したアーチファクト特徴を受信する手段と、
前記受信したアーチファクトを使用して前記メディアデータについての品質スコアを決定する手段と、
前記ユーザ端末デバイスに前記決定された品質スコアを送信する手段と、
前記ユーザ端末デバイスから、前記品質スコアの再決定の要求および主観的な品質スコアを受信する手段と、
を備え、
前記品質スコアを決定する手段は、前記受信した主観的品質スコアをさらに使用して、前記メディアデータについての品質スコアを再決定するよう適合されている、サーバデバイス。
【請求項3】
前記品質スコアを決定する手段は、アーチファクト/品質スコアデータベースを使用してトレーニングされ、前記デバイスは品質スコアを決定する手段を再トレーニングするために、少なくとも受信したアーチファクトおよび受信した主観的スコアを使用するようにさらに適合される、請求項2に記載のデバイス。
【請求項4】
前記品質スコアを決定する手段を再トレーニングする前記アーチファクト/品質スコアデータベースを使用する、請求項3に記載のデバイス。
【請求項5】
前記請求項1に記載のユーザ端末デバイスと請求項2から4のいずれか1つに記載のサーバデバイスとを備えた、システム。
【請求項6】
メディアデータの品質を評価する方法であって、
前記メディアデータからアーチファクト特徴を抽出するため、およびサーバデバイスに前記抽出した特徴を通信するために前記ユーザ端末デバイスを使用するステップと、
前記メディアデータについての品質スコアを決定するために前記サーバデバイスを使用するステップであって、前記メディアデータについての前記品質スコアは、前記受信したアーチファクトを使用して決定される、前記サーバデバイスを使用するステップと、
前記決定された品質スコアを前記ユーザ端末デバイスに送信するためにサーバデバイスを使用するステップと、
ユーザに前記受信した品質スコアを提示するため、および前記ユーザから、主観的品質スコアおよび前記品質スコアの再決定の要求を受信するために、前記ユーザ端末デバイスを使用するステップと、
前記品質スコアを前記再決定する要求および前記主観的な品質スコアを前記サーバデバイスに通信する前記ユーザ端末デバイスを使用するステップと、
前記メディアデータについての前記品質スコアを再決定するために前記サーバデバイスを使用するステップであって、前記メディアデータについての前記品質スコアは前記受信された主観的な品質スコアをさらに使用して再決定される、前記再決定するために前記サーバデバイスを使用するステップと、
前記再決定された品質スコアを前記ユーザ端末デバイスに送信するために前記サーバデバイスを使用するステップと、
を含む、前記方法。
【請求項7】
前記サーバデバイスは、アーチファクト/品質スコアデータベースを使用してトレーニングされ、前記方法はさらに、少なくとも受信されたアーチファクトおよび前記サーバデバイスを再トレーニングするために前記受信された主観的なスコアを使用するステップをさらに含む、請求項6に記載の方法。
【請求項8】
再トレーニングのために前記アーチファクト/品質スコアデータベースを使用するステップをさらに含む、請求項7に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明はメディアデータ品質評価の分野においてなされたものである。
【背景技術】
【0002】
メディアデータ(例えばグラフィックス、静止画像、ビデオ、またはオーディオファイル)の品質評価は、記録デバイスの評価および/または制御、圧縮方法、または伝送チャネルについて有用である。品質評価は、メディアの品質に依存して、メディアコンテンツを異なって収益化するためにさらに使用され得る。
【0003】
ビデオ品質を評価する最も正確および直接的な方法は、主観的な(subjective)品質スコア評価である。しかし、主観的な評価は、高いし時間もかかる。それゆえ目的のビデオ品質測定(VQM)は代替の方法として提案されており、その方法で、観察者によって割り当てられる平均の主観的なスコアにできる限り近い計算されたスコアを提供することが期待されている。
【0004】
ソースメディアデータ情報がVQMについて利用可能でない、いわゆる不参照の方法では、アーチファクト特徴や主観的スコアの予測などの客観的に検出可能な特徴の間にマッピングすることは、きわめて重要である。このようなマッピングを確立するための技術における方法をとりまとめたもの(bouquet)がある。例えば、人工神経回路網(ANN:Arftificial Neural Networks)は、トレーニングされて、客観的に検出可能なアーチファクト特徴から平均観察者スコア(MOS:mean observer scores)を予測する。人工神経回路網はトレーニングとテストデータとが似たコンテンツに関連している、問題となるテストデータについてよい結果を達成したとしても、コンテンツの広い範囲にまたがる場合は安定したパフォーマンスを達成するのは容易ではない。
【0005】
さらに、ラベル付けされた少量およびラベル付けされていない多量のデータがよりよいパフォーマンスを達成するためにトレーニングに一緒に関与し得る、半教師付き学習方法がある。
【0006】
これらの根本的な技術の複雑さのために、例えば現時点で未公開の特許文献1、2に記載されている、現在のビデオ品質評価(VQA)の使用は、高いコンピュータコストおよび対応する高い費用のために業務用に限定されている。
【0007】
しかし、個々のメディア製品および消費は、ますます人気が出てきている。つまり、顧客は、音楽、オーディオテイク、画像、及びビデオなどのメディアコンテンツを、どこでも、いつでも、キャプチャし、処理し、圧縮し、アクセスし、シェアすることができる。
【0008】
アマチュアおよびセミプロのユーザがコンテンツを広めれば広めるほど、プロがやるように、メディアデータの品質評価することが可能になることに関心が増す。
【0009】
しかしながら、プロの(VQA)のコストは、アマチュアにとって依然としてとても高すぎる。
【先行技術文献】
【特許文献】
【0010】
【特許文献1】PCT/CN2010/000600明細書
【特許文献2】PCT/CN2010/001630明細書
【発明の概要】
【0011】
それにもかかわらず、アマチュアおよびセミプロフェッショナルなユーザの高い品質のメディアデータコンテンツを生成するように適合されたCEメディアデバイスの発展およびソーシャルネットワークを経由したそのようなコンテンツの共有の増加に伴って、共通の顧客が、ユーザ生成のコンテンツの処理、ストレージ、共有化のための画像またはビデオの品質を、収益化し、スキャンし、監視するのを助けるために画像ビデオ品質評価の解決の必要が存在する。
【0012】
それゆえ、クレーム1に従ったユーザ端末デバイス、クレーム2に従ったサーバデバイス、およびクレーム4に従ったシステムが提案される。さらに、クレーム5に従ったメディアデータの品質を評価する方法が提案される。
【0013】
上記方法では、ユーザ端末デバイスがメディアデータからアーチファクト特徴を抽出するために使用され、抽出した特徴をサーバデバイスに通信するために使用される。サーバデバイスは、そして、メディアデータの品質スコアを決定するために使用される。メディアデータの品質スコアは、受信されたアーチファクトを使用して決定される。サーバデバイスは、ユーザ端末デバイスに決定された品質スコアを送信するためにさらに使用され、ユーザ端末デバイスは、受信した品質スコアをユーザに提示し、ユーザから、主観的な品質スコアおよび品質スコアの再決定の要求を受け取るために使用される。そして、この要求及び品質スコアはサーバデバイスに通信するために使用され、ユーザ端末デバイスは、品質スコアの再決定の要求および主観的な品質スコアを、メディアデータの品質スコアの再決定および再決定された品質スコアをユーザ端末デバイスに送信するために交互に使用される。メディアデータの品質スコアは受信された主観的な品質スコアをさらに使用して再決定される。
【0014】
実施形態では、本発明は、分散サービス、例えばウェブサービス、を、ユーザに提供して、ユーザのメディア(画像/ビデオ)データセットの認識された品質を、低コスト、ソフトウェアインストールの必要なく、大きいメディアコンテンツの転送の必要がなく低バンド帯域の消費ですみ、かつユーザメディアコンテンツの漏えいのリスクが低いという特徴で、スキャンおよび監視する、サービスシステムを意図している。ユーザフィードバックを伴うインタフェースはメディア品質評価システムのパフォーマンスを向上させるために提供される。
【0015】
すなわち、発明の実施形態は、ウェブアプリケーションとして実現されることができ、かつ共通のエンドユーザが、好都合なことにユーザのプライバシーを保護したままおよび必要とされる帯域幅が限定されたままでそれらの画像および/またはビデオの認識された品質を測定することを可能にする、クライアント−サーバサービスモデルの供給に焦点を当てる。
【0016】
ユーザの画像/ビデオデータセットからのアーチファクト特徴がクライアント側で抽出されるので、ユーザのコンテンツを完全にアップロードする必要がなく、大きなバンド帯域の消費と共にユーザのコンテンツの漏洩を防止する。さらに、本発明は、ユーザフィードバックの収集のインタフェースを提供するので、システムの例示的な実施形態は根本的なアーチファクト/品質スコアデータベースをアップデートすることによって、品質測定アルゴリズムの効果を向上させることを許容している。
【0017】
さらに有利な実施形態の特徴は従属クレームで具体的に述べられる。
【0018】
発明の例示的な実施形態は、図面に図示され、かつ以下の記載でさらに詳細に説明される。例示的な実施形態は、発明を明確化させるためにだけ説明され、発明の開示、範囲、または特許請求の範囲に記載された精神を限定しない。
【図面の簡単な説明】
【0019】
図1】最新のシステム発明の例示的実施形態を図示するブロック図である。
図2】最新の方法発明の例示的実施形態を図示するフローチャートである。
【発明を実施するための形態】
【0020】
本発明のクライアントエンドは、同様に適合された処理デバイスを有する任意の電子デバイスに実現され得る。網羅的でないが、例えば、モバイルフォン、パーソナルコンピュータ、デジタルスチルイメージカメラ、デジタルビデオカメラ、オーディオレコーディングデバイス、すなわちmp3プレーヤの形態で実現され得る。本発明のサービスセンタは任意の商業上の利用可能なサーバハードウェア上に実現され得る。
【0021】
このイノベーションは、ユーザが、ユーザ自身のメディア(例えば、画像、ビデオまたはオーディオ)コンテンツの認識された品質をスキャンし、評価することを可能にする新しいウェブサービスを開発しようとしている。つまり、スコア、例えば観察者スコア、平均観察者スコア、または平均観察者スコアがコンテンツについて自動的に予測される。
【0022】
意図されるサービスモデルにおいて、2つの部分がある。それはクライアントエンドおよびサービスセンタである。
【0023】
クライアントエンドはスコアに相関する特徴を抽出する責任がある。画像またはビデオについて、例えば、ブロックネス、ぼやけおよびノイズなどのアーチファクト特徴は平均観察者スコアとの相関が見出されている。本発明の実施形態に焦点を絞ったビジュアルデータは、それゆえ、クライアントエンドにおける視覚的なアーチファクトを抽出することを含んでいる。オーディオについて、例示的に抽出されたアーチファクトは、リンギング、プリエコー(pre-echo)、ドロップアウト(drop-oputs)、ウォブリング(warbling)、メタリックリンギング(metallic ringing)、水面下の音波(underwater acoustics)およびヒッシング(hissing)を含んでいる。
【0024】
クライアントエンドは、PC、タブレット、またはモバイルデバイス、例えば静止画またはビデオカメラスタンドアロンデバイスまたはビデオまたは静止画カメラ電話、などのユーザの端末で動作する。クライアントエンドは、ブラウザのジャバアプレットまたはマイクロソフトウインドウズメディアプレーヤ、マイクロソフトウインドウズライブフォトギャラリーおよびグーグルピカサなどの共通のオーディオ/画像/ビデオマネジメントソフトウエア/ツールのプラグインとして実現されることができる。
【0025】
クライアントエンドの他の機能は、ユーザフィードバックを収集することである。ユーザが、サービスセンタによって決定された品質スコアについて満足しない場合、レスポンスで、ユーザは、主観的品質スコアを与えることができ、その主観的品質スコアは、決定を調整するためにサービスセンタに送信され、および/またはアーチファクト/品質スコアデータベースおよび決定に使用されるアルゴリズムのうちの少なくとも1つを向上させるだろう。半教師付き学習がサーバにおけるスコア予測のために使用される実施形態において、抽出されたアーチファクトおよびユーザの主観スコアが他のラベル付けされたトレーニングデータセットとして提供されることができる。同様に、ユーザの主観スコアをANNを調整するために使用することができる。
【0026】
サービスセンタは、クライアントエンドによって抽出されたアーチファクト特徴に基づいた画像/ビデオの認識された品質を決定または予測することに責任がある。サービスセンタは、リモートサイドで共通的に動作する。例示的な実施形態では、サービスセンタは、画像/ビデオデータセットを、クライアントから収集されたアーチファクト特徴および主観的品質スコアのユーザフィードバックに基づいて拡張および/または修正するように適合され、かついくつかの自己学習メカニズムを有する品質測定アルゴリズムのパフォーマンスを向上させるように適合される。
【0027】
例示的な実施形態では、図1および図2で図示される以下のステップが、品質スコアを決定することにより、画像またはビデオの品質を評価するために実行される。
【0028】
第1に、ユーザは、ステップ10で、ユーザ端末UTを使用してブラウザによりウェブサーバWSに接続し、ステップ20でエンベッドされたウェブページにQMアプレットをフェッチする。
【0029】
ステップ30で、ユーザは、ユーザ端末UTで動作するアプレットUIの中のそのユーザのローカルディスクで画像/ビデオを開ける。QMアプレットは、ステップ30で、ユーザの画像/ビデオから、いくらかのまたは全てのアーチファクト特徴を抽出する。
【0030】
次に、QMアプレットは、ステップ40において、アーチファクト特徴をサーバセンタSCにウェブサーバWSを経由して送る。サーバセンタSCはウェブサーバWSの不可欠な部分であってもよい。
【0031】
QMサーバセンタSCは、アーチファクト特徴を伴う認識された品質スコアを算出し、ステップ50で、品質スコアが表示されたクライアントのエンドに算出されたスコアを返信する。
【0032】
ユーザが、決定ステップD1において、受信されたスコアが満足できないと決定した場合、彼/彼女はユーザ端末UTのクライアントUIで彼のフィードバックを入力することができる。そしてステップ60において、ユーザフィードバックは、サーバセンタSCに転送され、QMアルゴリズムを向上させる。品質スコアの再決定の要求は、ステップ60において、ユーザが最初に算出された品質スコアにとても満足しない場合、フィードバックと一緒に、クライアントエンドUTからサーバセンタSCに送信される。そのような再計算の結果は、ステップ50の繰り返しで、サーバセンタSCからユーザ端末UTに返信される。
【0033】
再決定の要求は、ステップ70においてユーザのフィードバックを使用してデータベースを修正する場合に考慮に入れられることができる。そのような要求は、予測結果についてかなり期待はずれであることを知らしめ、それゆえ、そのような要求がサーバセンタSCで受信されない場合よりも、データベースでのユーザのフィードバックのより高いインパクトをトリガするために使用され得る。
図1
図2