IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ドルビー ラボラトリーズ ライセンシング コーポレイションの特許一覧

特許7665592適応的で且つパーソナル化されたメディア符号化及び配信のためのパーソナル化された感度測定及び再生要因
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-04-11
(45)【発行日】2025-04-21
(54)【発明の名称】適応的で且つパーソナル化されたメディア符号化及び配信のためのパーソナル化された感度測定及び再生要因
(51)【国際特許分類】
   H04N 21/475 20110101AFI20250414BHJP
   H04N 21/462 20110101ALI20250414BHJP
【FI】
H04N21/475
H04N21/462
【請求項の数】 13
(21)【出願番号】P 2022506701
(86)(22)【出願日】2020-07-30
(65)【公表番号】
(43)【公表日】2022-11-02
(86)【国際出願番号】 US2020044241
(87)【国際公開番号】W WO2021025946
(87)【国際公開日】2021-02-11
【審査請求日】2023-07-26
(31)【優先権主張番号】62/882,068
(32)【優先日】2019-08-02
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】63/056,942
(32)【優先日】2020-07-27
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】507236292
【氏名又は名称】ドルビー ラボラトリーズ ライセンシング コーポレイション
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100135079
【弁理士】
【氏名又は名称】宮崎 修
(72)【発明者】
【氏名】キム,ドー-スク
(72)【発明者】
【氏名】マッカーシー,ショーン トーマス
(72)【発明者】
【氏名】ダリー,スコット
(72)【発明者】
【氏名】リードミラー,ジェフリー
(72)【発明者】
【氏名】マルフェ,リュドヴィチ クリストーフ
(72)【発明者】
【氏名】ウルマン,ラファエル マルク
(72)【発明者】
【氏名】クラウド,ジェイソン マイケル
【審査官】富樫 明
(56)【参考文献】
【文献】国際公開第2016/205697(WO,A1)
【文献】特開2011-065652(JP,A)
【文献】大島 正太、秋吉 政徳,2視点用ハイブリッド画像生成の検討,電気学会研究会資料,日本,一般社団法人電気学会,2018年11月10日,IS-18-058,41-44
【文献】Aude Olivia,外2名,Hybrid images,ACM Transactions on Graphics,Issue 3, Volume 25,Association for Computing Machinery,2006年07月01日,527-532,https://doi.org/10.1145/1141911.1141919
(58)【調査した分野】(Int.Cl.,DB名)
H04N 21/00 - 21/858
(57)【特許請求の範囲】
【請求項1】
再生装置にメディアを配信するための方法であって、当該方法は、
第1の再生装置により、第1のテスト測定セッションの間に、第1のユーザによって視聴される第1のテストメディアを出力することと、
前記第1のユーザから第1のユーザ入力を受信することであって、該第1のユーザ入力は前記第1のユーザによる前記第1のテストメディアの第1の知覚に関連し、前記第1のテストメディアに関する前記第1のユーザの第1のパーソナル化された体感品質を示す、ことと、
1つ以上の電子プロセッサを用いて、前記第1のユーザ入力に基づいて、前記第1のユーザの及び/又は前記第1のユーザが前記第1の再生装置を視聴している環境の1つ以上の視聴特性を含む第1のパーソナル化された感度プロファイルを生成することと、
前記1つ以上の電子プロセッサを用いて、前記第1のパーソナル化された感度プロファイルに少なくとも部分的に基づいて、前記第1のユーザの第1のパーソナル化された体感品質を保ちながら、ネットワークを介した前記第1の再生装置へのメディア配信の効率を高めるための第1のメディアパラメータを決定することと、
メディアサーバにより、前記ネットワークを介して、前記第1のメディアパラメータに従って、前記第1の再生装置に第1の出力メディアを提供することであって、該第1の出力メディアは前記第1の再生装置を用いて出力されるように構成されている、ことと、
を含み、
前記第1のテストメディアは複数のハイブリッド画像を含み、前記第1のユーザ入力は複数のユーザ入力を含み、前記第1のユーザ入力のそれぞれは前記複数のハイブリッド画像のそれぞれのハイブリッド画像に応答して受信され、前記複数のハイブリッド画像のそれぞれは、前記第1のユーザの視聴能力及び環境要因に依存して異なる解釈を有する傾向がある静止画像又は空間周波数範囲及び/又は視聴距離の関数として変化する、前記第1のユーザに対して2つ以上の異なる解釈をもたらす静止画像であり
前記第1のメディアパラメータを決定することは、
前記1つ以上の電子プロセッサを用いて、メモリから、前記ネットワークのリソース可用性及び再生システムパラメータのうちの少なくとも1つに基づいて、メディアストリーミングを制御するように構成された一般的オブジェクティブモデルを読み出すことと、
前記1つ以上の電子プロセッサを用いて、前記一般的オブジェクティブモデルを、前記第1のパーソナル化された感度プロファイルを用いてパーソナル化されたオブジェクティブモデルに変換することと、
前記メディアサーバにより、前記ネットワークを介して、前記パーソナル化されたオブジェクティブモデルに従って、前記第1の再生装置に前記第1の出力メディアを提供することと、
を含む、方法。
【請求項2】
前記第1のメディアパラメータに従って、前記第1の再生装置に前記第1の出力メディアを提供することは、前記第1のユーザの第1のパーソナル化された体感品質を低下させることなく、前記第1の出力メディアを前記第1の再生装置に提供するために前記ネットワークが低減された帯域幅を用いることをもたらす、請求項1に記載の方法。
【請求項3】
第2の再生装置により、第2のテスト測定セッションの間に、第2のユーザによって視聴される第2のテストメディアを出力することと、
前記第2のユーザから第2のユーザ入力を受信することであって、該第2のユーザ入力は前記第2のユーザによる前記第2のテストメディアの第2の知覚に関連し、前記第2のテストメディアに関する前記第2のユーザの第2のパーソナル化された体感品質を示し、該第2のパーソナル化された体感品質は、前記第2のユーザが、前記第1の再生装置の前記第1のユーザよりもメディアの品質の低下に敏感であることを示す、ことと、
前記1つ以上の電子プロセッサを用いて、前記第2のユーザ入力に基づいて、前記第2のユーザの及び/又は前記第2のユーザが前記第2の再生装置を視聴している環境の1つ以上の視聴特性を含む第2のパーソナル化された感度プロファイルを生成することと、
前記1つ以上の電子プロセッサを用いて、前記第2のパーソナル化された感度プロファイルに少なくとも部分的に基づいて、前記第2の再生装置のための第2のメディアパラメータを特定することと、
前記1つ以上の電子プロセッサを用いて、前記ネットワークを介して、前記第2のメディアパラメータに従って、前記第2の再生装置に第2の出力メディアを提供することと、
をさらに含み、
前記第1のメディアパラメータ及び前記第2のメディアパラメータは、前記第1の再生装置への前記第1の出力メディアの提供が、前記ネットワークのリソースの第1の使用量が前記第2の再生装置への前記第2の出力メディアの提供に関する前記ネットワークのリソースの第2の使用量よりも低くなるように決定され、
前記第1のユーザの第1のパーソナル化された体感品質の第1のパーセンテージは、前記第2のユーザの第2のパーソナル化された体感品質の第2のパーセンテージと略同じレベルで維持される、請求項1又は2に記載の方法。
【請求項4】
前記1つ以上の電子プロセッサは、前記第1の再生装置の第1の電子プロセッサ、前記第2の再生装置の第2の電子プロセッサ及び前記ネットワーク又は前記メディアサーバに関連する第3の電子プロセッサのうちの少なくとも1つを含む、請求項3に記載の方法。
【請求項5】
前記1つ以上の電子プロセッサを用いて、
第1のソース画像をローパスフィルタ処理してローパスフィルタ処理されたソース画像を作成することと、
第2のソース画像をハイパスフィルタ処理してハイパスフィルタ処理されたソース画像を作成することと、
前記ローパスフィルタ処理されたソース画像と、前記ハイパスフィルタ処理されたソース画像とを互いに重ね合わせて前記ハイブリッド画像を作成することと、
により、各ハイブリッド画像を生成すること、をさらに含み、
前記ローパスフィルタ処理されたソース画像又は前記ハイパスフィルタ処理されたソース画像のいずれかが、前記第1のユーザの及び/又は前記環境の前記1つ以上の視聴特性に依存して、前記第1のユーザによって優勢であると知覚される、請求項1乃至4のいずれか一項に記載の方法。
【請求項6】
前記第1のテストメディアを出力することは、
前記第1の再生装置により、前記第1のユーザによって視聴される第1のハイブリッド画像を出力することと、
前記第1のユーザからの前記第1のユーザ入力を受信することであって、前記第1のユーザ入力は前記第1のユーザによる前記第1のハイブリッド画像の第1の知覚に関する、ことと、
前記第1の再生装置により、前記第1のユーザによって視聴される第2のハイブリッド画像を出力することであって、前記第2のハイブリッド画像を作成するために用いられる前記ローパスフィルタ処理及び前記ハイパスフィルタ処理のうちの少なくとも一方の遮断周波数は、前記第1のユーザによる前記第1のハイブリッド画像の前記第1の知覚に関連する前記第1のユーザ入力に基づく、ことと、
を含む、請求項5に記載の方法。
【請求項7】
前記第1のテストメディアを出力することは、
前記1つ以上の電子プロセッサを用いて、メモリから、前に記憶されたパーソナル化された感度プロファイルを読み出すことと、
前記1つ以上の電子プロセッサを用いて、前記前に記憶されたパーソナル化された感度プロファイルに含まれる1つ以上の視聴特性に基づいて、前記第1のテストメディアを生成することと、
を含む、請求項1乃至6のいずれか一項に記載の方法。
【請求項8】
前記前に記憶されたパーソナル化された感度プロファイルを読み出すことは、
前記1つ以上の電子プロセッサを用いて、前記第1のユーザの特性、前記第1の再生装置の特性及び前記第1のユーザが前記第1の再生装置を見ている環境の特性のうちの少なくとも1つを含む前記第1のテスト測定セッションの特性を特定することと、
前記1つ以上の電子プロセッサを用いて、複数の前に記憶されたパーソナル化された感度プロファイルから、前記前に記憶されたパーソナル化された感度プロファイルを、前記第1のテスト測定セッションの特性と同じ特性のうちの1つ以上を含む、前記前に記憶されたパーソナル化された感度プロファイルに基づいて識別することと、
を含む、請求項7に記載の方法。
【請求項9】
前記一般的オブジェクティブモデルを前記パーソナル化されたオブジェクティブモデルに変換することは、前記第1のパーソナル化された感度プロファイルに基づいてパーソナル化されたコントラスト感度関数(CSF)を作成するために、前記一般的オブジェクティブモデルによって用いられる理想的なCSFを変換すること及びスケーリングすることのうちの少なくとも一方を含む、請求項1乃至8のいずれか一項に記載の方法。
【請求項10】
前記第1のユーザの及び/又は前記環境の前記1つ以上の視聴特性は、前記第1のユーザと前記第1の再生装置のディスプレイとの間の視聴距離、前記第1のユーザが前記ディスプレイを見ている環境における照明及び前記第1のユーザの眼の視覚感度のうちの少なくとも1つを含む、請求項1乃至9のいずれか一項に記載の方法。
【請求項11】
前記再生装置が位置する前記環境内の環境センサを用いて、環境条件を特定すること、をさらに含み、
前記第1のユーザの及び/又は前記環境の前記1つ以上の視聴特性を含む前記第1のパーソナル化された感度プロファイルを生成することは、前記1つ以上の電子プロセッサを用いて、前記第1のパーソナル化された感度プロファイルが前記環境条件を含むように前記第1のパーソナル化された感度プロファイルを生成することを含む、請求項1乃至10のいずれか一項に記載の方法。
【請求項12】
電子コンピュータ装置であって、
ディスプレイを含む第1の再生装置であって、該ディスプレイは第1のユーザにメディアを出力するように構成されている、第1の再生装置と、
前記ディスプレイに通信可能に連結された1つ以上の電子プロセッサと、
を含み、
前記1つ以上の電子プロセッサは、
前記第1の再生装置により、第1のテスト測定セッションの間に、前記第1のユーザによって視聴される第1のテストメディアを出力することと、
前記第1のユーザから第1のユーザ入力を受信することであって、該第1のユーザ入力は前記第1のユーザによる前記第1のテストメディアの第1の知覚に関連し、前記第1のテストメディアに関する前記第1のユーザの第1のパーソナル化された体感品質を示す、ことと、
前記第1のユーザ入力に基づいて、前記第1のユーザの及び/又は前記第1のユーザが前記第1の再生装置を視聴している環境の1つ以上の視聴特性を含む第1のパーソナル化された感度プロファイルを生成することと、
前記第1のパーソナル化された感度プロファイルに少なくとも部分的に基づいて、前記第1のユーザの第1のパーソナル化された体感品質を保ちながら、ネットワークを介した前記第1の再生装置へのメディア配信の効率を高めるための第1のメディアパラメータを決定することと、
メディアサーバにより、前記ネットワークを介して、前記第1のメディアパラメータに従って、前記第1の再生装置に第1の出力メディアを提供することであって、該第1の出力メディアは前記第1の再生装置を用いて出力されるように構成されている、ことと、
を行うように構成され、
前記第1のテストメディアは複数のハイブリッド画像を含み、前記第1のユーザ入力は複数のユーザ入力を含み、前記第1のユーザ入力のそれぞれは前記複数のハイブリッド画像のそれぞれのハイブリッド画像に応答して受信され、前記複数のハイブリッド画像のそれぞれは、前記第1のユーザの視聴能力及び環境要因に依存して異なる解釈を有する傾向がある静止画像又は空間周波数範囲及び/又は視聴距離の関数として変化する、前記第1のユーザに対して2つ以上の異なる解釈をもたらす静止画像であり
前記第1のメディアパラメータを決定することは、
前記1つ以上の電子プロセッサを用いて、メモリから、前記ネットワークのリソース可用性及び再生システムパラメータのうちの少なくとも1つに基づいて、メディアストリーミングを制御するように構成された一般的オブジェクティブモデルを読み出すことと、
前記1つ以上の電子プロセッサを用いて、前記一般的オブジェクティブモデルを、前記第1のパーソナル化された感度プロファイルを用いてパーソナル化されたオブジェクティブモデルに変換することと、
前記メディアサーバにより、前記ネットワークを介して、前記パーソナル化されたオブジェクティブモデルに従って、前記第1の再生装置に前記第1の出力メディアを提供することと、
を含む、電子コンピュータ装置。
【請求項13】
前記1つ以上の電子プロセッサは、前記第1の再生装置の第1の電子プロセッサ及び前記ネットワーク又は前記メディアサーバに関連する第2の電子プロセッサのうちの少なくとも1つを含む、請求項12に記載の電子コンピュータ装置。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本願は、2020年7月27日に出願された米国仮特許出願第63/056942号及び2019年8月2日に出願された米国仮特許出願第62/882068号の利益を主張し、双方の出願はその全体が参照により本願に組み込まれる。
【0002】
本願は、概して、ユーザによる視聴のためにユーザ装置によってビジュアルメディアを表示するために、該ユーザ装置にネットワークを介してビジュアルメディアを配信することに関する。
【発明の概要】
【課題を解決するための手段】
【0003】
本開示の様々な態様は、個別のセンサなしで多くの場合収集される再生側の情報に基づいて、パーソナル化されたアダプティブなメディア符号化及び配信を提供する装置、システム及び方法に関する。
【0004】
本開示の一態様では、再生装置にメディアを配信するための方法が提供される。当該方法は、第1の再生装置を用いて、第1のテスト測定セッションの間に、第1のユーザによって視聴される第1のテストメディアを出力することを含み得る。当該方法は、前記第1のユーザから第1のユーザ入力を受信することをさらに含み得る。該第1のユーザ入力は前記第1のユーザによる前記第1のテストメディアの第1の知覚に関連し、前記第1のテストメディアに関する前記第1のユーザの第1のパーソナル化された体感品質を示し得る。当該方法は、1つ以上の電子プロセッサを用いて、前記第1のユーザ入力に基づいて、前記第1のユーザの1つ以上の視聴特性を含む第1のパーソナル化された感度プロファイルを生成することをさらに含み得る。当該方法は、前記1つ以上の電子プロセッサを用いて、前記第1のパーソナル化された感度プロファイルに少なくとも部分的に基づいて、第1のメディアパラメータを決定することをさらに含み得る。該第1のメディアパラメータは、前記第1のユーザの第1のパーソナル化された体感品質を保ちながら、ネットワークを介した前記第1の再生装置へのメディア配信の効率を高めるために決定され得る。当該方法は、前記ネットワークを介して、前記第1のメディアパラメータに従って、前記第1の再生装置に第1の出力メディアを提供することをさらに含み得る。該第1の出力メディアは前記第1の再生装置を用いて出力されるように構成され得る。
【0005】
本開示の別の態様では、ディスプレイを含む第1の再生装置を含み得る電子コンピュータ装置が提供される。該ディスプレイは第1のユーザにメディアを出力するように構成され得る。当該電子コンピュータ装置は前記ディスプレイに通信可能に連結された1つ以上の電子プロセッサも含み得る。前記1つ以上の電子プロセッサは、前記第1の再生装置を用いて、第1のテスト測定セッションの間に、前記第1のユーザによって視聴される第1のテストメディアを出力するように構成されうる。前記1つ以上の電子プロセッサは、前記第1のユーザから第1のユーザ入力を受信するようにさらに構成され得る。該第1のユーザ入力は前記第1のユーザによる前記第1のテストメディアの第1の知覚に関連し、前記第1のテストメディアに関する前記第1のユーザの第1のパーソナル化された体感品質を示し得る。前記1つ以上の電子プロセッサは、前記第1のユーザ入力に基づいて、前記第1のユーザの1つ以上の視聴特性を含む第1のパーソナル化された感度プロファイルを生成するようにさらに構成され得る。前記1つ以上の電子プロセッサは、前記第1のパーソナル化された感度プロファイルに少なくとも部分的に基づいて、第1のメディアパラメータを決定するようにさらに構成され得る。該第1のメディアパラメータは、前記第1のユーザの第1のパーソナル化された体感品質を保ちながら、ネットワークを介した前記第1の再生装置へのメディア配信の効率を高めるために決定され得る。前記1つ以上の電子プロセッサは、前記ネットワークを介して、前記第1のメディアパラメータに従って、前記第1の再生装置に第1の出力メディアを提供するようさらに構成され得る。該第1の出力メディアは前記第1の再生装置を用いて出力されるように構成され得る。
【0006】
本開示の別の態様では、再生装置にハイブリッド画像を表示するための方法が提供される。当該方法は、電子コンピュータ装置の1つ以上の電子プロセッサを用いて、メディアをストリーミングするように構成されたメディアサーバ及びネットワークによってサポートされるメディアパラメータの第1の値を決定することを含み得る。当該方法は、前記1つ以上の電子プロセッサを用いて、前記メディアサーバ及び前記ネットワークによってサポートされる前記メディアパラメータの第2の値を決定することをさらに含み得る。当該方法は、前記1つ以上の電子プロセッサを用いて、前記メディアパラメータの第1の値及び前記メディアパラメータの第2の値に基づいて、前記ハイブリッド画像が前記メディアパラメータの第1の値に対応する第1の解釈及び前記メディアパラメータの第2の値に対応する第2の解釈を含むように前記ハイブリッド画像を生成すること及び選択することの少なくとも一方をさらに含み得る。当該方法は、前記再生装置のディスプレイに前記ハイブリッド画像を表示することをさらに含み得る。
【0007】
実施形態の他の態様は、詳細な説明及び添付の図面を考慮することにより明らかになる。
【図面の簡単な説明】
【0008】
図1図1は、本明細書で説明する実施形態に係る、例示のアダプティブビットレート(ABR)ベースのメディア符号化及び配信システムを示す。
図2図2は、本明細書で説明する一部の実施形態に係る、テスト測定セッションの間に個別化/パーソナル化された視聴特性を特定するように構成された、アダプティブビットレート(ABR)ベースのメディア符号化及び配信システムの一部を示す。
図3図3は、本明細書で説明する一部の実施形態に係る、テスト測定セッションの間に個別化/パーソナル化された視聴特性を特定するように構成された、アダプティブビットレート(ABR)ベースのメディア符号化及び配信システムの一部を示す。
図4図4は、本明細書で説明する実施形態に係る、モデル変換を介してパーソナル化されたオブジェクティブモデルに変換されている一般的オブジェクティブモデルのブロック図を示す。
図5図5は、本明細書で説明する実施形態に係る、コントラスト感度と空間周波数との例示の関係を示す、2つの異なるコントラスト感度関数(CSF)を含むグラフを示す。
図6図6は、本明細書で説明する実施形態による、変更されたアダプティブビットレート(ABR)ベースのメディア符号化及び配信システムを示す。
図7図7は、本明細書で説明する実施形態に係る、図6の再生システムのハードウェアブロック図である。
図8図8は、本明細書で説明する実施形態に係る、図6のメディアサーバのブロック図である。
図9図9は、本明細書で説明する実施形態に係る、図6の再生システムにメディアを配信するための方法のフローチャートを示す。
図10ABC図10A図10Cは、本明細書で説明する実施形態に係る、3つの異なるサイズの例示のハイブリッド画像を示す。
図10DE図10D図10Eは、本明細書で説明する実施形態に係る、3つの異なるサイズの例示のハイブリッド画像を示す。
図11図11A及び図11Bは、本明細書で説明する実施形態に係るテスト測定セッションの間の多段階バイナリツリー探索におけるハイブリッド画像をテストメディアとして用いる例示の最適ABRラダー推定のグラフを示す。
図12図12A及び図12Bは、本明細書で説明する実施形態に係る、メディアをストリーミングするために既存のストリーミング方法を用いる場合対図9の方法を用いる場合のネットワークの例示の帯域幅を示す。
図13A図13Aは、本明細書で説明する実施形態に係る、図9の方法がQoEに悪影響を及ぼすことなくどのように固定容量ネットワーク上でより多くのユーザ/加入者がメディアをストリーミングできるようにするかの別の例を示す。
図13B図13Bは、本明細書で説明する実施形態に係る、図9の方法がQoEに悪影響を及ぼすことなくどのように固定容量ネットワーク上でより多くのユーザ/加入者がメディアをストリーミングできるようにするかの別の例を示す。
【発明を実施するための形態】
【0009】
ビジュアルメディア(例えば、画像、ビデオなど)は、ユーザによって視聴されるために、1つ以上の通信ネットワークを介して多くの異なる種類の再生システム/装置(例えば、テレビ、コンピュータ、タブレット、スマートフォン等)に配信可能である。ビジュアルメディア配信チェーンにおいて、アダプティブビットレート(ABR)ストリーミングは、ネットワーク条件、再生バッファ状態、共有ネットワーク容量及びネットワークの影響を受ける他の要因に基づくメディアラダー上のビットレート及び解像度を適応的に選択することを通して、改善されたネットワークリソース管理を可能にする。ABRストリーミングの他に、ビットレート、フレームレート、解像度等の上流のビデオエンコーダ/トランスコーダ/トランスレータの1つ以上のメディアパラメータを制御するために、(符号化方法又はソース符号化方法も含み得る)他のメディア配信方法も同様に用いられ得る。
【0010】
しかしながら、これまで、ABRストリーミング等のメディア配信方法は、ネットワークリソース管理をさらに改善するために、再生システム/装置に関連する要因、ユーザの視聴能力に関連する要因及びユーザがビジュアルメディアを視聴する環境に関連する要因等の追加の要因を考慮してこなかった。むしろ、視聴者の実際の体感品質(QoE)に大きく影響を及ぼす多様な視聴条件及び人間の視覚性能の変動が存在するにもかかわらず、コンテンツ処理、符号化、配信、復号化及び後処理を行う場合に、これらの要因は、異なるユーザ/環境にわたって理想的で且つ一様であると通常仮定されている。
【0011】
例えば、短距離視聴は、低解像度と高解像度のビデオコンテンツを区別することにおいて、ユーザをより敏感にすることがある。また、異なる視聴者は、限定されないが、屈折異常(矯正用レンズを装着している場合であっても)、硝子体液中の浮遊物の蓄積、加齢に関連する水晶体による色吸収の変化、白内障又は黄斑変性等を含む要因のために、異なる視覚感度を有し得る。例えば、ユーザ/視聴者のコントラスト感度は、屈折誤差の増加、疾患の増加及び/又は加齢によって低下し得る。加えて、個人の個人的なQoEは、特にモバイル環境において、場所によって、また時によって変化し得る。
【0012】
各ユーザ/視聴者に対するこれらの視覚感度要因の検出は、実世界のエンドツーエンドシステムにおけるパーソナル化されたQoEを推定するのに役立ち、QoEを改善し且つメディア配信効率をさらに改善する機会を提供する。例えば、メディア配信システムは、各ユーザ/視聴者のパーソナル化されたQoEを維持しながら、ユーザ/視聴者の視力又はテレビからの視聴距離にマッチするように、同じビデオのカスタムフィルタ処理されたバージョンを送信することによって帯域幅を節約できる。
【0013】
いくつかの研究では、メディアストリーミングにおける最適なビットレート及び解像度を選択すること又はメディア前処理、コード化及び後処理に情報をフィードバックすることを目的として、様々なセンサを用いて再生側の要因を収集することが提案されている。しかしながら、再生側の情報を収集するために様々なセンサを用いるアプローチは、多くの再生システム(例えば、テレビ)では不十分で且つ非現実的である。そのようなセンサは、ユーザの固有の視力又は感度を測定しないため不十分である。これは、必要なセンサ及びメタデータプロトコルをテレビに備えるために、消費者ディスプレイ業界全体にわたってテレビ製造業者を動機付け、協調することは過度な負担であるため非現実的である。既に多くの利用可能なセンサを有するモバイル装置の場合、この負担は少ないが、特にセンサがユーザについてのビジュアル情報を収集する場合にユーザのプライバシーが依然懸念となる。再生側の情報を収集するのにセンサを利用する既存のアプローチの別の問題は、異なるモデル/ブランドのテレビは、それら独自のアップスケーリング及び後処理アルゴリズムを有し、ユーザは、自分の好みに合わせて、輝度、コントラスト又は動きの平滑化等の様々なテレビ設定を調整し得ることである。
【0014】
上記の技術的課題に対処するために、本明細書で説明する方法、装置及びシステムは、再生装置の特性及びパーソナル化された視覚感度要因に関連するパラメータを、再生装置へのビジュアルメディアの送信を制御するように構成された上流装置と共有するための新たなメカニズム又はプロトコルを含む。本明細書で説明する方法、装置及びシステムは、多くの場合個別のセンサを用いることなく収集された再生側の情報に基づく、パーソナル化された適応的なメディア配信を提供する。加えて、収集された再生側の情報は、異なるユーザ及び/又は異なる視聴環境のためのパーソナル化されたQoEを示し得る。本明細書で説明する方法、装置及びシステムは、各ユーザのためのパーソナル化されたQoEを維持しながら、ネットワークリソース管理/メディア配信効率をさらに改善する。
【0015】
図1は、例示のアダプティブビットレート(ABR)ベースのメディア符号化及び配信システム100を示す。システム100は、ネットワーク115を介して再生システム110(すなわち、再生装置)にメディアを提供するメディアサーバ105を含む。図1は単一の再生システム110を示しているが、メディアサーバ105は、追加の再生システム110に同じ又は異なるメディアを同時にストリーミングするように構成され得る。
【0016】
再生システム110は、テレビ、タブレット、スマートフォン、コンピュータ等の多くの異なる種類の再生システムを含み得る。一部の実施形態では、再生システム110は、バッファ/デコーダ120及び再生レンダラ125を含む。バッファ/デコーダ120は、ネットワーク115を介してサーバ105からメディアを受信し得る。バッファ/デコーダ120は受信したメディアをバッファし、受信したメディアが再生レンダラ125によって出力されるように復号化し得る。バッファ/デコーダ120は、図7に関して以下でさらに詳細に説明するように、再生システム110の電子プロセッサ(例えば、マイクロプロセッサ、マイクロコントローラ又は他の好適な処理装置)を含み得る。再生レンダラ125は、画像及び/又はビデオを表示するように構成された出力装置を含み得る。例えば、再生レンダラ125は、図7に関して以下でさらに詳細に説明するように、発光ダイオード(LED)ディスプレイ及び/又はタッチスクリーンディスプレイを含む。再生システム110は環境130内に位置する。ユーザ135も環境130内に位置し、再生システム110によって出力されるメディアを視聴し得る。
【0017】
図1に示すように、一部の実施形態では、メディアサーバ105は、メディアサーバ105の電子プロセッサによって実施されるABRラダー137を含む。一部の実施形態では、メディアサーバ105は、再生システム110から1つ以上のABR要求140を受信し、ネットワーク115を介したメディアサーバ105から再生システム110へのメディアのABRストリーミングのビットレート/品質決定を調整する。例えば、再生システム110は、記憶された一般的オブジェクティブモデル(generic objective model)145(例えば、装置種類、表示解像度、GEOベースのスタートアップ解像度又はITU-T P.1203等のより包括的なモデル)をメモリから読み出し及び/又は利用して、一般的オブジェクティブモデル145を用い、ネットワーク接続性メトリック、メディアプレーヤバッファ状態、コーデック、ビットレート、初期ロード遅延及び失速イベント等のストリーミングセッション及び再生に関連する性能情報を、ディスプレイ解像度、スクリーンサイズ、再生装置の種類等の再生装置110の情報と共に観察/測定する。一部の実施形態では、ストリーミングセッション及び再生関連性能情報を収集するために、パケットヘッダ情報及び部分的/完全なビットストリーム構文解析も用いられ得る。ストリーミング及び再生情報は、メディアストリーミング及びメディアの再生の一般的体感品質(QoE)推定を生成するために用いられる。このQoE推定は、ABR要求140に影響を与えるために再生システム110によって用いられ得る。例えば、再生システム110は、シームレスな再生を維持することを目的として、ローカルに生成された帯域幅推定、バッファサイズ、ラウンドトリップ時間等に基づいて、メディアセグメントに対する各ABR要求140を周期的に決定する。つまり、一般的オブジェクティブモデル145は、再生システム210が、ネットワーク115のリソースの利用可能性及び再生システムパラメータのうちの少なくとも1つに基づいてメディアストリーミングを制御できるようにするように構成され得る。
【0018】
一部の場合では、再生システム110は、メディア内の同じ期間を表すが、ABRラダー137の異なるビットレートで符号化された2つ以上のセグメントを同時に要求する。そのような戦略は非効率的な場合があり、再生システム110がシームレスな再生のために必要とする以上のデータを要求することをしばしばもたらす。そのような戦略は、ユーザ135によって知覚することができない高品質なメディアを提供する解像度/ビットレート/フレームレートの組み合わせを再生システム110がABRラダー137に要求することにもつながる。つまり、配信される解像度/ビットレート/フレームレートをユーザ135の感度閾値を超えて増やすことを試みる既存のABR選択ロジックは、ユーザ135のQoEの増大に変換されない。ユーザ135のためのQoE増大に変換されないことに加えて、要求された解像度/ビットレート/フレームレートの組み合わせは、より多くのネットワークリソース(例えば、より多くの帯域幅)を使うことがあり、及び/又は追加の費用をユーザ135が負担することになり得る(例えば、再生システム110に提供されるデータ量に基づいてメディアサーバ105のサービスプロバイダが課金する場合)。
【0019】
既存のABR選択ロジックの上述の問題は、ABR要求140を決定する際に一般的オブジェクティブモデル145がパーソナル化されたQoEを考慮しないことによってもたらされる。例えば、一般的オブジェクティブモデル145は、環境130内の照明、ユーザ135の視聴距離(すなわち、ユーザ135と再生レンダラ125との間の距離)、例えば空間周波数に基づくユーザ135の目の視覚感度及び能力等の個別化/パーソナル化された視覚特性を考慮しないことがある。むしろ、既存のABR選択技術は、これらの特性が、実際には、環境及び/又はユーザ間で大きく変化し、再生システム110によって表示されているメディアを知覚するためにユーザ135のQoEに影響を与え得る場合、各環境130及び各ユーザ135に対して同じであると仮定する。
【0020】
図1及びその対応する説明は、ABRラダー137及びABR選択技術を参照するが、ABR関連メディア配信は、メディアサーバ105及びネットワーク115等の上流装置によって実施され得る一般的なメディア配信方法を表すことを意図した例にすぎない。ABRラダー137及びABR選択技術も、本願全体を通して、追加の図に関して例示のメディア配信方法として用いられる(例えば、図2図3及び図11A図11B参照)。しかしながら、本明細書で開示する特徴は、ABRラダー137又はABR選択技術に基づかない多数の異なるメディア配信方法(符号化方法又はソース符号化方法も含み得る)のいずれか1つに適用され得る。つまり、本明細書で説明する特徴は、ビットレート、フレームレート、解像度等の上流のビデオエンコーダ/トランスコーダ/トランスレータの任意のメディアパラメータを制御するために同様に用いられ得るABRストリーミング以外の他のメディア配信方法と共に用いられ得る。さらに又は代替的に、本明細書で説明する特徴は、メディアがストリーミングされる前にメディアを符号化/処理するために用いられる符号化方法又はソース符号化方法と共に用いられ得る。本明細書では、これらの符号化方法及びソース符号化方法を概してメディア配信方法と呼び得る。一部の実施形態では、メディアパラメータは、ネットワーク115を介したメディアサーバ105から再生システム210へのメディア配信に影響するパラメータ(すなわち、上流メディアパラメータ)を含む(図2図3及び図6参照)。一部の実施形態では、メディアパラメータは、再生システム210の輝度設定及び/又はコントラスト設定等の再生システムパラメータ(すなわち、下流パラメータ)をさらに又は代替的に含む。
【0021】
図2及び図3は、一部の実施形態に係る、テスト測定セッションの間に個別化/パーソナ化された視聴特性を特定するように構成された、アダプティブビットレート(ABR)ベースのメディア符号化及び配信システム200及び300の一部を示す。テスト測定セッションは、追加の情報を収集するために別個のセンサを用いて(図3参照)または用いることなしに(図2参照)パーソナル化された視聴特性をさらに考慮することによりABR選択ロジック(及び/又は他のメディア配信方法)の上記の課題に対処するために用いられ得る。
【0022】
図2は、図1の再生システム110と同様のいくつかのコンポーネントを含む再生システム210を含む。例えば、再生システム210は、バッファ/デコーダ120及び再生レンダラ125を含む。図2に示していないが、再生システム210は、図1に示すメディアサーバ105及びネットワーク115と同様に、ネットワークを介してメディアサーバに通信可能に連結され得る。しかしながら、図1に示す一般的オブジェクティブモデル145を含む代わりに、再生システム210は、多数の異なるユーザ135及び/又は環境130のためにパーソナル化された(すなわち、個別化された)感度プロファイル(PSP)215を生成し得る。これらのパーソナル化された感度プロファイル215は、再生システム210にメディアをストリーミングするメディアサーバにABR要求(又は他のメディア配信方法に関する他の要求)を提供するために用いられ得る。以下では、パーソナル化された感度プロファイル215は再生システム210(例えば、再生システム210の電子プロセッサ)によって生成されるものとして説明するが、一部の実施形態では、パーソナル化された感度プロファイル215の生成及び記憶は、本明細書でさらに詳細に説明するように、メディアサーバにおける電子プロセッサ、遠隔クラウドコンピューティングクラスタの電子プロセッサ又はそれらの組み合わせによってさらに又は代替的に行われ得る。
【0023】
パーソナル化された感度プロファイル215を生成するために、再生システム210は、テストメディア225に対するユーザ応答220がユーザ135から収集されるテスト測定セッションを実施する。テスト測定セッションの間、ユーザ135の感度は、それらの典型的な視聴条件及び環境を前提として測定される。一例として、ユーザ135は、典型的な視聴位置(例えば、リビングルーム内のソファー(これは、視聴距離、視聴角度、周囲の輝度及び再生システムの特性及び設定の点で典型的な視聴条件を表す。))に座り得る。次に、再生システム210は、再生システム210によって提供される命令に従うことで環境130内でのユーザ135のオーディオビジュアル感度を測定するテスト測定セッションを通じてユーザ135を案内する。セッションでは、ユーザ135は、再生システム210によって提示される一連の画像及び/又はビデオに従って、リモコン装置を用いて1つ以上の選択を行うように要求され得る。例えば、再生システム210は複数の画像を表示し、ユーザ135にとって最も鮮明な/最もピントが合った画像を選択するようユーザに要求し得る。別の例として、再生システム210は、ユーザ135の視覚能力及びユーザの視覚距離に依存する複数の解釈を有する画像を表示し、ユーザにとって最も優勢な/明白な解釈を選択するようにユーザに要求し得る。
【0024】
テスト測定セッションから、再生システム210及び/又はメディアサーバ105は、ユーザ135及び/又は環境130のパーソナル化された視聴特性を特定し得る。例えば、テスト測定セッションの間に受信されたユーザ応答220は、再生システムの特性、再生パラメータの設定、(通常、デバイスメーカが所有する)再生システム210の後処理アルゴリズム等のシステム要因を示し得る。別の例として、テスト測定セッションの間に受信されるユーザ応答220は、視聴距離、視聴角度、周囲輝度、周囲ノイズ、ユーザの期待等の環境要因を示し得る。一部の実施形態では、ユーザの期待は、ユーザの知覚されるQoEに影響を与え得るユーザ135の意識的な又は潜在的な心理学的側面を意味する。例えば、ユーザ135の期待レベルは、有料サブスクリプションに関連するメディアの方が無料のビデオオンデマンドサービス等の他のメディアよりも高い場合がある。ユーザ135及び/又は環境130のパーソナル化された視聴特性のさらに別の例として、テスト測定セッションの間に受信されるユーザ応答220は、ユーザ135の感覚/視覚感受性及び能力、年齢、性別等の人的要因を示し得る。図2に示すように、一部の実施形態では、再生システム210は、図1のシステム100に関して上述したのと同様な形で、再生システム情報230(例えば、装置種類、表示解像度等)をさらに提供し得る。再生システム210は、特定のユーザ135及び/又は環境130についてのパーソナル化された感度プロファイル215を特定するために、再生システム情報230と、テストメディア225に対するユーザ応答220とを含む集約された情報235を用いり得る。
【0025】
図2に示すように、パーソナル化された感度プロファイル215は、ユーザ識別、他の個人情報(すなわち、ユーザ応答220によって特定されるユーザ135の個別化された視聴特性)、再生システム情報230及び1つ以上の測定セッションの間にテストメディア225がユーザ135に表示された地理的位置、天気情報、日付及び時間のうちの1つ以上を含み得る。図2に示す例示のパーソナル化された感度プロファイル215では、パーソナル化された感度プロファイル215のそれぞれはユーザと関連し、ユーザ135がテスト測定セッションに参加した異なる環境(例えば、ユーザの自宅の異なる部屋、異なる時間帯、異なる天気情報(例えば、晴れ対曇り)等)についての複数のサブプロファイルを含み得る。他の実施形態では、パーソナル化された感度プロファイル215のそれぞれは、ユーザ135がテスト測定セッションに参加した異なる環境にそれぞれ対応する複数のパーソナル化された感度プロファイル215を各ユーザが有し得るように、ユーザ及び特定の環境に関連し得る。
【0026】
上述のパーソナル化された視聴特性は、別個のセンサ(例えば、再生装置210とユーザ135との間の距離を測定するセンサ)によって明示的には収集されないが、システム200は、テスト測定セッションの間に、テストメディア225に対するユーザ応答220に基づいて、これらの特性のうちの1つ以上を特定/推定することができる。そのため、一部の実施形態では、別個の明示的センサを用いることなく、ユーザ135及び環境130からパーソナル化された視聴特性情報を収集できる。他の実施形態では、追加情報を提供するために別個の明示的なセンサが用いられ得る(例えば、図3を参照)。
【0027】
図3は、図2のシステム200の一部と同様な、アダプティブビットレート(ABR)ベースのメディア符号化及び配信システム300の一部を示す。しかしながら、システム300は1つ以上の環境センサ305をさらに含む。例えば、再生システム210は、環境130内の周囲光を測定する明るさ/輝度センサ(例えば、統合センサ、再生システム210に通信可能に連結されたスマートホームセンサ等)を含み得るか又は通信可能に連結され得る。環境センサ305は、例えば、照明がオン/オフかどうか、窓を覆うカーテンが開けられている/閉められているかどうか等を示す、環境130内に位置する他のスマートホームセンサを含み得る。環境センサ305は、例えば、昼間時間を特定する目的で、時刻及び再生システム210の地理的位置を特定するように構成され得る。環境センサ305からの環境感知データ310は集約された情報235に含まれてもいいし、図3に示すように、パーソナル化された感度プロファイル215に含まれてもよい。一部の実施形態では、集約された情報235に含まれる環境感知データ310は、環境130における社会活動のレベル及び/又は視聴距離等のユーザ提供情報を含む。
【0028】
テスト測定セッションの間にテストメディア225に対するユーザ応答220を収集することは、さもなければセンサを用いて明示的に収集するのが困難、非現実的及び/又は押し付けがましくなり得る多くのパーソナル化された視聴特性を暗黙的に考慮する。加えて、一部の状況では、センサを用いて明示的に収集されたデータは、ユーザ135のQoEの正確な特定を可能にしないことがある。したがって、システム200及び300は、数多くの潜在的な利点及び恩恵を提供する。
【0029】
1つの例示の恩恵はユーザの多様性に関するものである。2人の異なるユーザは環境特性(例えば、視聴距離、輝度、スクリーンサイズ等)が同一であり得る。しかしながら、これらの2人の異なるユーザは、例えば、屈折異常、年齢及び/又は眼疾患による差異により、視聴能力が大きく異なり得る。そのため、ABR要求(又は他のメディア配信方法に関する要求)を決定するために物理的な文脈/環境特性のみを用いることで、これらの異なるユーザにとって異なるレベルのQoEがもたらされ得る。一部の実施形態では、システム200、300のパーソナル化された感度プロファイル215は、各ユーザのパーソナル化されたQoEの低下を防止及び/又は軽減するために、ABR要求を決定する際にパーソナル化された視聴能力におけるこれらの差異を考慮する。
【0030】
別の例示の恩恵は、システム200及び300の実施の容易さであり得る。一部の実施形態では、再生システム210に追加のセンサを加える必要がない。同様に、一部の実施形態では、ユーザの環境の特定の詳細が明示的に測定されず且つ記録されないことがあるため、ユーザのプライバシーが保護される。むしろ、一部の実施形態では、(ユーザの視聴距離及び視聴能力等の)より詳細な要因のみを暗黙に含むユーザ応答220の全体的な評価が、メディアサーバ105に対するABR要求を生成するために用いられる。つまり、ABR要求は、別個のセンサからの独立した属性測定値の収集に基づくものではない複合測定に基づく。むしろ、システム200及び300におけるABR要求は、明示的に収集するのが困難であるか又は不可能ですらある多くの要因の複合効果を反映するユーザのQoEの全体的且つ暗黙の測定である。
【0031】
さらに別の例示の恩恵は、ユーザ135のためのパーソナル化されたコンテンツの強化に関する。エンドユーザのQoEのより全体的で正確な推定を可能にすることに加えて、システム200及び300は、ユーザ135に再生されるメディア/コンテンツの改善を可能にする。具体的には、ユーザによって知覚されるにはコントラストが小さすぎるか又は低すぎる(すなわち、ユーザの測定したコントラスト感度関数(CSF)を越える空間周波数又はコントラストの)ビデオフレームの部分は、再生システム210によって高めることができる。そのような改善の例としては、フレームのクロッピング及び拡大及び/又は局所コントラスト調整を適用して、シーンの顕著な部分が確実にユーザ135に見えるようにする(すなわち、ユーザの測定したCSF内になる)ことを含み得る。そのような改善は、ユーザ135がメディア/コンテンツを追って、視聴されているメディア/コンテンツとの関わりを維持するのを助けることにより、ユーザの視聴体験を向上し得る。
【0032】
再度図1を参照して、ABR要求140を生成するための一般的オブジェクティブモデル145は、QoEを推定するために多数のモデルのうちのいずれか1つを含み得る。例えば、ABRラダー137(又は別のメディア配信方法)を構築するために、典型的には、オーディオ/ビデオ信号を分析し、符号化効率を最適化することによる、参照ソースメディアのメディアセグメントのビットレート/品質の複数のバージョンを含む1つの一般的モデルが用いられる。別のモデルは、ネットワーク状態及び再生装置のローディングに基づいて、ABRストリーミングの適切なビットレート/品質決定を選択するために用いられる。しかしながら、例示の種類のモデルのいずれも、ユーザのパーソナル化された視聴特性を考慮しない。パーソナル化された感度プロファイル215は、一般的オブジェクティブモデル145からパーソナル化されたオブジェクティブモデル405を構築するために、任意の種類の一般的モデル145に適用され得る。
【0033】
図4は、モデル変換410を介してパーソナル化されたオブジェクティブモデル405に変換されている一般的オブジェクティブモデル145のブロック図を示す。変換は、メディア配送の制御及び管理において実現することが望ましい1つ以上の目標に従って起こり得る。例えば、各ユーザ135のためのパーソナル化されたQoEを劣化させることなく、ABRラダー137における最小ビットレートを選択することによりメディアストリーミングの帯域幅を節約することが目標である場合、システム200、300は、解像度-ビットレートグリッド空間内の画像/ビデオのJND(丁度可知差異)を特定し得る。次に、システム200、300は、一般的オブジェクティブモデル145を、ユーザ135が再生システム210を用いている環境130内でのユーザ135のパーソナル化された感度プロファイル215に基づいて特定されたユーザ135のパーソナル化されたJNDに基づいて、各ユーザ135/再生システム210のためのパーソナル化されたオブジェクティブモデル405に変換し得る。
【0034】
別の例として、ループにおけるリアルタイム又は非リアルタイムの前処理、復号化、トランスコーディング又はトランスレーティングを包含するより洗練されたストリーミング管理のために、システム200、300は、パーソナル化されたオブジェクティブモデル405を構築するために、無彩色及び色対立刺激のための空間コントラスト感度、時間コントラスト感度及び空間時間コントラスト感度等のパーソナル化された精神測定関数を推定し得る。例えば、図5は、コントラスト感度505と空間周波数510との例示の関係を示す2つの異なるコントラスト感度関数(CFS)を含むグラフを示す。実線の曲線は理想的なCSF515を示す。破線の曲線は、所与のテスト測定セッションの間のテストメディア225に対するユーザ応答220に基づいて特定された、ユーザ135の例示のユーザCSF520を示す。図5に示すように、ユーザCSF520は、例えば、理想的な視聴環境よりも環境130内の視聴距離が長いこと、理想的な視聴環境よりもテレビの画面の輝度が低いこと及びユーザ135が近視/近眼であることにより、理想的なCSF515と比べて変換及びスケーリングされている。また、図5に示すように、理想的なCSF515と比べて、ユーザ135は、空間周波数510に対するコントラスト感度505の知覚可能な差異の範囲が小さい。つまり、ユーザ135の視覚能力は、例えば、上述の環境及び個人的な条件により、理想的なユーザのものほどには敏感ではない。例えば、ユーザ135は、空間周波数510が第2の値530を上回る場合にコントラストの差を区別できないことがある。
【0035】
したがって、理想的なコントラスト感度を有する理想的なユーザが理想的な環境において向上されたQoEを経験することを可能にし得るより高い品質のメディアのストリーミングを提供することは、実際には、図5に示すユーザCSF520を有する例示のユーザ135のQoEの向上をもたらさないことがある。そのため、このより高品質のストリーミングを提供することは、システム200、300に犠牲を強いることになり(例えば、メディアはより高いビットレートを用いてストリーミングされるため、より多くの帯域幅が用いられる)、ストリーミングされたメディアを視聴するユーザ135にとってQoEの改善がもたらされないため、システム200、300が経験するこの犠牲は本質的に無駄になる。
【0036】
システム200、300がメディアサーバ105からのメディアのストリーミングを制御するのを支援するために、ユーザCSF520は、一般的オブジェクティブモデル145をパーソナル化されたオブジェクティブモデル405に変換するために用いられるパーソナル化された感度プロファイル215に含まれるデータの一例である(図4参照)。例えば、一般的オブジェクティブモデル145は、理想的なCSF515に対応するデータ又はユーザの視覚環境及び個人的な視覚能力にパーソナル化されていない別の一般的CSFに対応するデータを用いり得る。他方、パーソナル化されたオブジェクティブモデル405は、ユーザの視聴環境及び個人視覚能力にパーソナル化されるようにスケーリング及び変換されたユーザCSF520を用いり得る。ユーザCSF520は、パーソナル化されたオブジェクティブモデル405を作成するために、一般的オブジェクティブモデル145に含まれる他の要因及び/又はアルゴリズムとの組み合わせで用いられ得る。ユーザ135が知覚できるよりも高い品質のメディアをストリーミングする上記の例で指摘したように、ユーザ135のパーソナル化されたQoEに影響を与えることなく、パーソナル化されたオブジェクティブモデル405が符号化効率を改善し、ネットワーク効率を改善するために(例えば、帯域幅を減らすことにより)ビデオ符号化、トランスコーディング及び/又はトランスレーティングの間に利用され得る。例えば、より高品質のメディアは、より高品質のメディアを知覚することができるより敏感なユーザ135にストリーミングされ得る一方で、より低品質のメディアとより高品質のメディアとの間の品質の差を知覚することができないあまり敏感でないユーザ135に対してはより低品質なメディアがストリーミングされ得る。
【0037】
図5に示す例示のグラフは、ユーザ135のコントラスト感度を参照するが、一般的オブジェクティブモデル145は、テストメディア225に対するユーザ応答220に基づいてパーソナル化され得る、他の種類の視聴特性に関する値及び/又は関数(例えば、ビデオフレームレートに関連する時間的な劣化、量子化劣化等)を含み得る。例えば、一般的な時間的劣化モデルを特徴付ける一般的なメディアパラメータ値及び/又は関数は、パーソナル化されたオブジェクティブモデル405においてパーソナル化された値及び/又は関数を生成するために置き換えられ得るか又は再訓練され得る。さらに又は代替的に、ABR要求140(又は他のメディア配信方法に関する要求)等のメディアパラメータを特定するために用いられる汎用アルゴリズムは、パーソナル化されたオブジェクティブモデル(POM)405を生成するように調整された係数を有し得る。
【0038】
図6は、変更されたアダプティブビットレート(ABR)ベースのメディアコーディング及び配信システム600を示す。システム600は図1のシステム100と同様であるが、一般的オブジェクティブモデル145の代わりに、ABR要求140(又は他のメディア配信方法に関する要求)を生成するために用いられるパーソナル化されたオブジェクティブモデル(POM)405を含む。一部の実施形態では、システム600は、図2及び図3に示すシステム200、300の部分のうちの少なくとも1つを含む。例えば、図6に示すように、パーソナル化されたオブジェクティブモデル405は、上述したようにテストメディア225に対するユーザ応答220に基づいて特定される、再生システム情報230、環境感知情報310及びPSP215からのパーソナル化された視聴特性情報を考慮する。
【0039】
ABR要求140(又は他のメディア配信方法に関する要求)を生成するためにPOM405によって用いられ得る追加のデータソースは、限定されないが、バッファサイズ、再生状態、プレーヤパフォーマンス特性等を含むリアルタイムメディアプレーヤ状態情報を含む。POM405によって用いられ得る別のデータソースは、再生システム210によって測定されるスループット、ネットワーク115内に位置するセンサから測定されるスループット、輻輳通知、遅延、パケット損失率等のリアルタイムネットワーク性能推定を含む。POM405によって用いられ得る別のデータソースは、ビットレート、解像度、フレームレート、サンプル当たりのビット深度、クロマサンプリング、(レベル及びプロファイルを含む)ソース符号化方法、色空間、補足エンハンスメントメッセージ(SEI)、組成プレイリスト、ピクチャ群(GOP)サイズ、瞬間復号化リフレッシュ(IDR)フレーム、最大フレーム平均光レベル(MaxFALL)、最大コンテンツ光レベル(MaxCLL)、電子光学伝達関数(EOTF)、言語、サービスタイプ、シーン記述(境界情報を含む)、オーディオチャネルの数、オーディオサンプルレート、オーディオサンプルビット深度、オーディオサービスタイプ、デジタル署名方法、SCTE35メッセージ、キャプションデータ、プログラム音量、規制情報、レーティング情報等を含むコンテンツメタデータを含む。一部の実施形態では、本明細書で説明する追加のデータソースは、メディアパラメータと呼ばれ得る。
【0040】
POM405によって用いられ得る別のデータソースは、下流及び/又は上流チャネル又はチャネル等価物毎の最大許容ビットレート、空間解像度、フレームレート等を含むネットワークオペレータポリシーパラメータを含む。この例示のデータソースは、ネットワーク全体及びセッション間の最適化を可能にし得る。POM405によって用いられ得る別のデータソースは、上述したように再生環境センサ情報310を含む(例えば、周囲の輝度レベル、周囲のオーディオノイズレベル、ストリーミングされたコンテンツを視聴する人の数、各視聴者のスクリーンからの距離等)。POM405によって用いられ得る別のデータソースは、主再生システム210からの距離、モバイル装置センサ情報等の補助的なモバイル装置情報を含む。POM405によって用いられ得る別のデータソースは、ユーザ135によって入力され、システム600に含まれる装置のうちの1つのメモリによって記憶され得るリアルタイムユーザ/視聴者アプリファレンスを含む。
【0041】
図7は、1つの例示の実施形態に係る再生システム210(すなわち、再生装置)のハードウェアブロック図である。上述したように、再生システム210は、テレビ、タブレット、スマートフォン、コンピュータ等の多くの異なる種類の再生システムを含み得る。図示の実施形態では、再生システム210は、第1の電子プロセッサ705(例えば、マイクロプロセッサ又は他の電子装置)を含む。第1の電子プロセッサ705は入出力インターフェイス(図示せず)を含み、第1のメモリ710、第1のネットワークインターフェイス715、任意のマイクロホン720、スピーカ725及びディスプレイ730に電気的に連結されている。一部の実施形態では、再生システム210は、図7に示すものとは異なって、構成においてより少ないか又は追加のコンポーネントを含む。例えば、再生システム210はマイクロホン720を含まなくてもよい。別の例として、再生システム210は、再生システム210のユーザからの入力を受け取るコンピュータマウス及び/又はキーボード等の1つ以上の追加の入力装置を含み得る。さらに別の例として、再生システム210は、周囲光センサ及び/又は位置追跡装置(例えば、全地球測位システム(GPS)受信器)等の環境センサを含み得る。一部の実施形態では、再生システム210は、以下で説明する機能以外の機能を行う。
【0042】
第1のメモリ710は、読み出し専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、他の非一時的コンピュータ読み取り可能媒体又はそれらの組み合わせを含み得る。第1の電子プロセッサ705は、第1のメモリ710から命令及びデータを受信し、とりわけ命令を実行するように構成されている。特に、第1の電子プロセッサ705は、本明細書で説明する方法を行うために、第1のメモリ710に記憶された命令を実行する。
【0043】
第1のネットワークインターフェイス715は、ネットワーク115を介してメディアサーバ105との間でデータを送受信する。一部の実施形態では、第1のネットワークインターフェイス715は、メディアサーバ105及び/又はネットワーク115と無線通信するために1つ以上のトランシーバを含む。あるいは又はそれに加えて、第1のネットワークインターフェイス715は、イーサネットケーブル等のメディアサーバ105及び/又はネットワーク115への有線接続を受信するためのコネクタ又はポートを含み得る。第1の電子プロセッサ705は、第1のネットワークインターフェイス715を通じて、ネットワーク115を介して1つ以上のデータストリーム(例えば、ビデオストリーム、オーディオストリーム、イメージストリーム等)を受信し得る。第1の電子プロセッサ705は、第1のネットワークインターフェイス715を介してメディアサーバ105から受信した1つ以上のデータストリームを、スピーカ725、ディスプレイ730又はそれらの組み合わせを介して出力し得る。加えて、第1の電子プロセッサ705は、第1のネットワークインターフェイス715を介して、再生システム210によって生成されたデータをネットワーク115を介してメディアサーバ105に戻し得る。例えば、第1の電子プロセッサ705は、本明細書において前に言及したABR要求140を特定し、メディアサーバ105に送信し得る。次いで、メディアサーバ105は、再生システム210からのABR要求140に従って、1つ以上のメディアストリームを再生システム210に送信し得る。
【0044】
ディスプレイ730は、画像、ビデオ、テキスト及び/又はデータをユーザ135に表示するように構成されている。ディスプレイ730は液晶ディスプレイ(LCD)スクリーン又は有機発光ディスプレイ(OLED)スクリーンであり得る。一部の実施形態では、タッチセンシティブ入力インターフェイスをディスプレイ730に組み込んでもよく、ユーザ135はディスプレイ730上に提供されたコンテンツと関わることができる。一部の実施形態では、ディスプレイ730は、プロジェクタ又は将来開発されるディスプレイ技術を含む。一部の実施形態では、スピーカ725及びディスプレイ730は、再生システム210のユーザ135にメディアストリーム及び他の情報を提供する出力装置と呼ばれる。一部の実施形態では、マイクロホン720、コンピュータマウス及び/又はキーボード又はタッチセンシティブディスプレイは、再生システム210のユーザ135からの入力を受信する入力装置と呼ばれる。
【0045】
図8は、1つの例示の実施形態に係るメディアサーバ105のブロック図である。図示の例では、メディアサーバ105は、第2のメモリ810及び第2のネットワークインターフェイス815に電気的に接続された第2の電子プロセッサ805を含む。これらのコンポーネントは、図7に関して上記で説明した再生システム210の同じような名称のコンポーネントと同様であり、上述したものと同様に機能する。一部の実施形態では、第2のネットワークインターフェイス815は、ネットワーク115を介して再生システム210との間でデータを送受信する。一部の実施形態では、メディアサーバ105は、図8に示すものとは異なって、構成においてより少ないか又は追加のコンポーネントを含む。例えば、メディアサーバ105は、バックエンドユーザがメディアサーバ105の設定又はルールを再プログラムできるように、タッチスクリーン等のディスプレイを追加で含み得る。一部の実施形態では、メディアサーバ105は以下で説明する機能以外の機能を行う。
【0046】
図7及び図8は、再生システム210及びメディアサーバ105の別々のブロック図を示すが、一部の実施形態では、メディアサーバ105、1つ以上の再生システム210、ネットワーク115を介して通信するか又はネットワーク115の一部を形成する遠隔クラウドコンピューティングクラスタ又はそれらの組み合わせが、本明細書で説明する機能を行う電子コンピュータ装置と呼ばれる。例えば、電子コンピュータ装置は単一の電子プロセッサ(例えば、メディアサーバ105の第2の電子プロセッサ805)又はメディアサーバ105内に位置する複数の電子プロセッサであり得る。他の実施形態では、電子コンピュータ装置は、異なる装置に分散された複数の電子プロセッサを含む。例えば、電子コンピュータ装置は、再生システム210の第1の電子プロセッサ705、メディアサーバ105の第2の電子プロセッサ805及びネットワーク115を介して通信するか又はネットワーク115の一部を形成する遠隔クラウドコンピューティングクラスタに又は遠隔地に位置する1つ以上の他の装置内に位置する1つ以上の電子プロセッサのうちの1つ以上で実施される。一部の実施形態では、リモートクラウドコンピューティングクラスタは、ソフトウェア定義ネットワーク(SDN)/ネットワーク機能仮想化(NFV)対応アクセスネットワークを含む。
【0047】
一部の実施形態では、POM405を実施する装置は、POM405の目標及び機能を決定し得る。例えば、再生システム210内のPOM405の実施は、ネットワークオペレータ又は他の制御信号がない場合に分散動作を可能にする。他方、メディアサーバ105及び/又はネットワーク115内のPOM405の実施(例えば、ソフトウェア定義ネットワーク(SDN)ノード上に位置するネットワーク仮想化機能(NVF)として)は、ネットワーク全体のQoE最適化及び他のネットワークオペレータポリシー(例えば、所望の加入者QoE、エッジ/アクセスネットワーク容量目標又は両方の組み合わせへのネットワークサービスの最適化)の配備を簡素化し得る。
【0048】
図7に示す再生システム210のハードウェアコンポーネントのうちの1つ以上は、図2図3及び図6に示す再生システム210の機能コンポーネントを実施する及び/又は構成する。例えば、第1の電子プロセッサ705(又は再生システム210の複数の第1の電子プロセッサ705)は、バッファ/デコーダ120及び再生レンダラ125のうちの1つ以上として機能し得る。第1の電子プロセッサ705は、また、パーソナル化された感度プロファイル215、パーソナル化されたオブジェクティブモデル405及びABR要求140も決定し得る。
【0049】
一部の実施形態では、1人以上のユーザ及び環境の1つ以上のパーソナル化された感度プロファイル(PSP)215が再生システム210の第1のメモリ710に記憶される。第1のメモリ710は、再生システム210の一般的な再生システム情報230等の追加情報(例えば、スクリーンサイズ、製品識別番号等)を記憶し得る。一部の実施形態では、さらに又は代替的に、1人以上のユーザ及び環境の1つ以上のパーソナル化された感度プロファイル(PSP)215がメディアサーバ105の第2のメモリ810及び/又はネットワーク115を介して通信するか又はネットワーク115の一部を形成する遠隔クラウドコンピューティングクラスタのメモリに記憶される。一部の実施形態では、ユーザのPSP215のクラウド記憶装置は、ユーザの有線/無線インターネットサービスプロバイダ(ISP)又はネットワーク配信メディアアカウント(例えば、ケーブルテレビ)への安全なリンクを可能にする。このようなリンクは、ネットワークオペレータが、本明細書でより詳細に説明するように、それらのアカウントに関連するPSP215でそれらの加入者ベースの一部にわたってより効率的なメディア配信を生成するために、個々のPSP215を利用するのに有用であり得る。
【0050】
図9は、1つの例示の実施形態に係る、再生システム210にメディアを配信するための方法900のフローチャートを示す。方法900は、本明細書で先に説明した電子プロセッサのうちの1つ以上を含む電子コンピュータ装置によって行われるものとして説明される。特定の動作は、特定の装置の電子プロセッサによって行われるものとして説明されるが、他の実施形態では、他の装置の電子プロセッサが同じ動作を行い得る。処理ステップ、メッセージ受信及び/又はメッセージ送信の特定の順序を図9に例として示しているが、このようなステップ、受信及び送信のタイミング及び順序は、本開示の残りの部分の全体を通して詳細に説明される例の目的及び利点を否定することなく、適宜変化し得る。
【0051】
ブロック905で、メディア配信方法900が開始される。一部の実施形態では、メディア配信方法900は、ユーザ135が再生システム210をオンにする及び/又は再生システム210によりデータストリームが出力されるべきことを要求するのに応答して、再生システム210の第1の電子プロセッサ705によって開始される。
【0052】
メディア配信方法900が開始されることに応答して、ブロック910で、電子コンピュータ装置の1つ以上の電子プロセッサが、ユーザ135、再生システム210及び再生システム210が位置する環境130のうちの少なくとも1つに関連する、記憶されたパーソナル化された感度プロファイル(PSP)215を読み出す。例えば、記憶されたPSP215は、再生システム210の以前のテスト測定セッションに基づいて生成されていてもよい。一部の実施形態では、記憶されたPSP215は、新たなテスト測定セッションを行うことなく、再生システム210に出力メディアを提供するために電子コンピュータ装置によって用いられ得る。例えば、再生システム210が、同じユーザ135によってテスト測定セッションを既に受けている環境130で用いられている場合、電子コンピュータ装置は、環境130及びユーザ135に対応する記憶されたPSP215を用いり得る。一部の実施形態では、電子コンピュータ装置は、再生システム情報、環境情報及び/又はユーザ情報(例えば、再生システム210によって受信されたユーザログイン情報)をPSP215の記憶された情報と比較することにより、現在の環境及びユーザは既にテスト測定セッションを受けていると判定する。例えば、電子コンピュータ装置は、再生システム210の識別番号、環境130の1つ以上の特性(例えば、時刻、周囲光の量、再生システム210の位置等)及びユーザ135の身元を特定し得る。この識別情報が、電子コンピュータ装置のメモリのうちの1つに既に記憶されているPSP215と一致する場合、電子コンピュータ装置は、新たなテスト測定セッションを行うためにブロック915に進むことなく、対応する前に記憶されたPSP215に従って、再生システム210への出力メディアの提供及び出力メディアの表示を制御し得る。
【0053】
他方、方法900は、再生システム210が新たなテスト測定セッションを行うように制御されるブロック915に続き得る。ここでは、新たなテスト測定セッションは完全版のセッションであり得るか又は1つ以上の記憶されたPSP215の事前知識に基づく短縮版のセッションであり得る。例えば、上述した種類の識別情報のうちの1つ以上が記憶されたPSP215と一致しない場合、電子コンピュータ装置は、以下でさらに詳細に説明するように、新たなテスト測定セッションを行い、新たなPSP215を生成し得る。一部の実施形態では、新たなテスト測定セッションはユーザ135によって(例えば、再生システム210の入力装置に対するユーザ入力を介して)開始される。一部の実施形態では、電子コンピュータ装置は、前に記憶されたPSP215の少なくとも1つの特性が変化したと判定し得る(例えば、停電、インターネットプロトコル(IP)アドレスの変化、WiFi信号強度の変化、再生システム210に新たに検出された周辺装置が連結されること、検出された周辺光の変化、再生システム210の検出された位置の変化等)。これに応答して、電子コンピュータ装置は、ユーザ135が新たなテスト測定セッションに参加することを推奨するよう再生システム210に指示し得る。例えば、再生システム210は、(例えば、環境センサ305から受信したデータに基づく時刻測定等に基づいて)ユーザ135が昼間ではなく夜間に再生システム210を見ていると判定し得る。別の例として、メディアサーバ105は、前に記憶されたPSP215に関連していない新たな再生システム210がネットワーク115に接続されていると判定し得る。これに応答して、メディアサーバ105は、PSP215を生成するためにユーザ135がテスト測定セッションに参加することを推奨するよう再生システム210に要求を送信し得る。
【0054】
テスト測定セッションを実施する方法は、セットトップボックス(STB)、デジタルメディアアダプタ(DMA)、モバイル装置又は他の再生システム210の初期セットアップステップ、再生システム210上で実行されるサードパーティアプリケーションとして又はテストメディア225及び/又はPSP215の両方をホストするクラウドサービスとしての統合を含み得る。本明細書で前述したように、テスト測定セッションの結果は再生システム210上でローカルに及び/又は、クロスプラットフォーム及びクロスサービス互換性を可能にするクラウドサービスの一部として遠隔的に保存され得る。
【0055】
ブロック915で、電子コンピュータ装置は、ユーザ135によって視聴されるテストメディア225を出力する。テストメディア225は、再生システム210の第1の電子プロセッサ705によって生成され得るか又はメディアサーバ105によって生成された後に再生システム210によって受信され得る。一部の実施形態では、テストメディア225は、ユーザの感度/体感品質(QoE)を測定するために生成される。例えば、ブロック920で、電子コンピュータ装置は、ユーザ135からユーザ入力(すなわち、ユーザ応答220)を受信する。ユーザ入力は、ユーザ135によるテストメディア225の知覚に関連し、テストメディア225に関するユーザ135の第1のパーソナル化されたQoEを示す。
【0056】
一部の実施形態では、電子コンピュータ装置は、スネレンチャート又はオープンリングパターンを含むテストメディア225を用いてオプトタイプ視力測定を生成することにより、ユーザ135のユーザ感度/QoEを特定する。一部の実施形態では、さらに又は代替的に、電子コンピュータ装置は、異なる向きの正弦波格子(例えば、図5参照)を用いてコントラスト感度関数(CSF)測定を生成することにより、ユーザ135のユーザ感度/QoEを特定する。一部の実施形態では、CSF測定は、バンドパスフィルタ処理されたスローン文字を含むテストメディア225を用いる迅速CSF法を含み得る。一部の実施形態では、さらに又は代替的に、電子コンピュータ装置は、ユーザ135によってプレイされる対話型ゲームの形態でテストメディア225を表示することにより、ユーザ135のユーザ感度/QoEを特定する。一部の実施形態では、さらに又は代替的に、電子コンピュータ装置は、テストメディア225として表示される一連の画像又はビデオ材料に基づいてユーザ感度測定を行うことによって、ユーザ135のユーザ感度/QoEを特定する。
【0057】
一部の実施形態では、電子コンピュータ装置は、ハイブリッド画像の形態でテストメディア225を表示し得る。一部の実施形態では、ハイブリッド画像は、ユーザの視聴能力及び環境要因に依存して異なる解釈を有する傾向がある静止画像である。例えば、人間の視聴者は、視聴距離が長くなるにつれて画像の細部を見る能力を失い、その結果、高解像度ビデオと低解像度ビデオとを区別できなくなる。一部の実施形態では、ハイブリッド画像は、空間周波数範囲及び/又は視聴距離の関数として変化する、人間のユーザに対して2つ以上の異なる解釈をもたらす静止画像である。表示されたハイブリッド画像に対するユーザ応答220に基づいて、電子コンピュータ装置は、明示的センサを用いることなく、メディア視聴環境130内のユーザ135の優勢な及び非優勢な空間周波数範囲を推定し得る。
【0058】
ハイブリッド画像を作成するために、2つの異なるソース画像は、各画像に関して特定の空間周波数範囲が優勢になるように異なる形で処理され得る。例えば、第1のソース画像はローパスフィルタ処理され、第2のソース画像はハイパスフィルタ処理され得る。次に、ローパスフィルタ処理されたソース画像がハイパスフィルタ処理されたソース画像と組み合わせられて(即ち、その上に重ね合わせて)、ハイブリッド画像が作成され得る。空間周波数における所与の画像の感知領域は、ユーザ135の視聴距離が減少するにつれて、より低い周波数からより高い周波数に移動するため、人間のユーザは、ハイパスフィルタ処理されたソース画像をより長い視聴距離よりもより短い視聴距離でより容易に知覚する。反対に、人間のユーザは、ローパスフィルタ処理されたソース画像をより短い視聴距離よりもより長い視聴距離でより容易に知覚する。つまり、ローパスフィルタ処理されたソース画像又はハイパスフィルタ処理されたソース画像のいずれかが、ユーザ135の1つ以上の視聴特性に応じてユーザ135によって支配的として知覚される。
【0059】
図10A図10Cは、3つの異なるサイズのハイブリッド画像1000の例を示し、図10Aは、最もサイズが大きい画像1000を示し、図10Cは、最もサイズが小さい画像1000を示す。図示の例では、犬の顔1005を含む第1のソース画像はローパスフィルタ処理されており(図10Dのローパスフィルタ処理されたソース画像1050参照)、猫の顔1010を含む、ハイパスフィルタ処理された第2のソース画像1010(図10Eのハイパスフィルタ処理されたソース画像1060を参照)と組み合わされている。図10A図10Cに示すように、第2のソース画像のハイパスフィルタ処理により、人間のユーザにとって猫の顔1010は図10B及び図10Cのより小さいものよりも図10Aのより大きいものの方が知覚するのが容易である。つまり、ハイパスフィルタ処理(図10E参照)により、ハイブリッド画像1000は、画像1000が大きい場合に(すなわち、視聴距離が近い/短い)知覚するのが容易な、ネコ1010の顔を含む第2のソース画像の微細な細部のみを含む。反対に、人間のユーザにとって犬の顔1005は図10Cよりも図10A及び図10Bの方が知覚するのが容易である。つまり、ローパスフィルタ処理(図10D参照)により、ハイブリッド画像1000は、画像1000が小さい場合に(すなわち、視聴距離が長い)知覚するのが容易な、犬1005の顔を含む第1のソース画像の粗い細部のみを含む。視聴者の図10A図10Cの視覚的解釈を支援するために、図10A図10Eは、各図で猫1010の鼻1015がラベル付けされ、各図で犬1005の鼻1020がラベル付けされている。
【0060】
ハイブリッド画像の生成は、ローパスフィルタ処理及びハイパスフィルタ処理された異なるソース画像を含むものとして上記で説明したが、一部の実施形態では、さらに又は代替的に、ハイブリッド画像は異なるバンドパスフィルタを用いて生成される。一部の実施形態では、ソース画像のサイズを変化させることで、空間周波数ドメインにおける拡大又は縮小がもたらされる。したがって、フィルタ処理と組み合わせて、ソース画像のサイズを変化させることはハイブリッド画像を生成するための別の方法である。
【0061】
ブロック915で、テスト測定セッションの間に一連の/複数のハイブリッド画像をテストメディア225として表示することにより、電子コンピュータ装置は、ユーザ135の視聴特性及び再生システム210に関連する環境要因を特定することができ得る。一部の実施形態では、電子コンピュータ装置は、再生システム210によって表示されたハイブリッド画像のサイズを変更し得る。例えば、ハイブリッド画像のユーザの知覚が第1のソース画像の第1の知覚から第2のソース画像の第2の知覚に変化したことをユーザ応答220が示すまで、電子コンピュータ装置はハイブリッド画像のサイズを変化させ得る。ユーザ応答220が受信された時点に表示されていたハイブリッド画像のサイズに基づいて及び再生システム210の解像度及びスクリーンサイズに基づいて、電子コンピュータ装置は、ユーザ135の推定視聴距離、ユーザ135の推定CSF等を特定することができ得る。
【0062】
一部の実施形態では、電子コンピュータ装置は、ハイブリッド画像を作成するために用いられている各ソース画像のローパスフィルタ及びハイパスフィルタ(又はバンドパスフィルタ)の遮断周波数を変化させ得る。例えば、電子コンピュータ装置は、ユーザによる第1のハイブリッド画像の第1の知覚に関連する第1のユーザ入力を受信し得る。これに応答して、電子コンピュータ装置は、少なくとも1つのフィルタの遮断周波数が、第1のハイブリッド画像の第1の知覚に関連する第1のユーザ入力に基づくフィルタを用いて第2のハイブリッド画像を生成し得る(例えば、図11A及び図11Bを参照)。次いで、電子コンピュータ装置は、ユーザ135によって見られる第2のハイブリッド画像を出力するよう再生システム210を制御する。
【0063】
一部の実施形態では、電子コンピュータ装置は、メディアサーバ及びネットワーク115によってサポートされるメディアパラメータ及び/又は再生システムパラメータに基づいて、空間フィルタの遮断周波数(及び/又は表示されているハイブリッド画像のサイズ等のハイブリッド画像を生成するために用いられる他の特性)を決定し得る。例えば、電子コンピュータ装置は、メディアサーバ105のABRラダー137における利用可能なビデオ解像度と共に(又は、メディアサーバ105によって利用されている別のメディア配信方法に基づく他のメディアパラメータの利用可能な値と共に)、空間フィルタの遮断周波数を決定し得る。別の例として、電子コンピュータ装置は、メディアサーバ105/ネットワーク115の利用可能なビットレート、メディアサーバ105/ネットワーク115の利用可能なフレームレート、再生システム210の装置種類、再生システム210のディスプレイ730のスクリーンサイズ及び/又は本明細書で前述した他のパラメータ/属性に基づいてカットオフ周波数を決定し得る。
【0064】
一部の実施形態では、電子コンピュータ装置は、メディアサーバ105及びネットワーク115によってサポートされるメディアパラメータの第1の値を特定する。電子コンピュータ装置は、メディアサーバ105及びネットワーク115によってサポートされるメディアパラメータの第2の値も特定し得る。次いで、電子コンピュータ装置は、ハイブリッド画像が、メディアパラメータの第1の値に対応する第1の解釈及びメディアパラメータの第2の値に対応する第2の解釈(例えば、図11A及び図11B参照)を含むように、メディアパラメータの第1の値及びメディアパラメータの第2の値に基づいて、ハイブリッド画像の生成及び選択のうちの少なくとも一方を行い得る。次いで、電子コンピュータ装置は、ハイブリッド画像をディスプレイ730に表示するよう再生システム210を制御し得る。
【0065】
一部の実施形態では、電子コンピュータ装置は、本明細書で前述したように、前に表示されたハイブリッド画像に対するユーザ応答220に基づいて、追加のハイブリッド画像を表示する。例えば、電子コンピュータ装置は、第2のハイブリッド画像が、メディアパラメータの第3の値に対応する第3の解釈及びメディアパラメータの第1の値に対応する第4の解釈を含むように、(メディアサーバ105及びネットワーク115によってサポートされていると判定された)メディアパラメータの第1の値及びメディアパラメータの第3の値に基づいて、第2のハイブリッド画像の生成及び選択のうちの少なくとも一方を行い得る。
【0066】
一部の実施形態では、上述の例で説明したハイブリッド画像は、本明細書で上述したようにソース画像を重ね合わせることにより、電子コンピュータ装置によって生成される。他の実施形態では、電子コンピュータ装置は、メディアサーバ105及びネットワーク115によってサポートされると判定されたメディアパラメータの値に対応する特性を有する、前に生成され記憶されたハイブリッド画像を読み出し得る。
【0067】
テスト測定セッションの間に、電子コンピュータ装置は、再生装置の入力装置を用いて、ユーザ135からのユーザ入力を受信し得る。ユーザ入力は、ハイブリッド画像がディスプレイ730に表示される場合に、ハイブリッド画像の第1の解釈がユーザ135によって知覚されていることを示す。ユーザ入力に基づいて、電子コンピュータ装置は、ユーザ135が、メディアパラメータの第2の値(例えば、第2の空間周波数範囲、視聴距離、解像度及び/又は等)よりも、メディアパラメータの第1の値(例えば、第1の空間周波数範囲、視聴距離、解像度及び/又は等)により敏感であると判定し得る。一部の実施形態では、電子コンピュータ装置は、ユーザ135がメディアパラメータの第1の値により敏感であるとの判定に基づいて、ユーザ135の視聴特性のパーソナル化された感度プロファイル215を生成する。パーソナル化された感度プロファイル215は、メディアパラメータの第1の値を含み得る。一部の実施形態では、メディアサーバ105は、ネットワーク115を介して、本明細書で前述したように、パーソナル化された感度プロファイル215に従って、ユーザ135の再生システムに出力メディアを提供し得る。
【0068】
直ぐ上の例の続きで、電子コンピュータ装置は、ユーザ入力に基づいて、ユーザ135が最も敏感なハイブリッド画像の空間周波数のサブセット(すなわち、ハイブリッド画像のコントラスト)及びユーザ135が最も敏感なハイブリッド画像のサイジングのうちの少なくとも1つを決定し得る。一部の実施形態では、電子コンピュータ装置によって生成されたパーソナル化された感度プロファイル215の視聴特性は、ユーザが最も敏感なハイブリッド画像の空間周波数のサブセットと、ユーザが最も敏感なハイブリッド画像のサイジングのうちの少なくとも1つを含む。
【0069】
上記の例で示したように、テスト測定セッションの間に、メディアパラメータ及び/又は再生システムパラメータに基づいて生成又は選択されたハイブリッド画像を用いることで、電子コンピュータ装置は、例えば、異なるメディア中心のパラメータがユーザのパーソナル化されたQoEにどのように影響するかを特定できる。例えば、電子コンピュータ装置は、ABRラダー137の異なるビデオ解像度が、ユーザのパーソナル化されたQoEにどのように影響するかを特定し得る。つまり、テストメディア225に対するユーザ応答220に基づいて、電子コンピュータ装置は、ユーザの知覚及び不可視の空間周波数に影響を与える優勢な空間周波数の範囲を推定する。この知覚情報は、本明細書で説明するように、メディアコーディング及び配信の効率を改善するために用いることができる。例えば、ABRラダー137における最も低いビデオ解像度は、ユーザ135がフル解像度のビデオと比べて品質劣化を経験し始めるものよりも下であると識別できる。
【0070】
図11A及び図11Bは、テスト測定セッションの間に多段階2分木探索においてテストメディア225としてハイブリッド画像を用いた、最適ABRラダー推定の例のグラフを示す。一部の実施形態では、電子コンピュータ装置は、マニフェストファイルから、メディアサーバ105及びネットワーク115のメディアストリーミングの利用可能なビデオ解像度(例えば、360p、540p、720p及び1080p)を得る。ビデオ解像度にしたがって、電子コンピュータ装置は、ハイブリッド画像を作成するためにソース画像A及びBに適用されるローパスフィルタ及びハイパスフィルタの遮断周波数を決定する。行に沿って描かれた図11A及び図11Bに示す垂直の点線は、ABRラダー137における対応するビデオ解像度の周波数の上限を表す。例えば、540pのビデオのスペクトルコンテンツは、左から2番目の垂直な点線までしか使用できない。図11A及び図11Bのそれぞれの上のグラフ1105、1155は、特定の視聴距離にあるユーザ135のための空間周波数[ピクセル毎のサイクル]の関数として、推定されるコントラスト感度関数(CSF)を示す。図11Aに示すように、ユーザ135の感度のピーク1110は、540pの点と720pの点との間にある。
【0071】
図11Aの真ん中のグラフ1115は、フィルタリングされたソース画像A及びBから作成された第1のハイブリッド画像の感度を示す。グラフ1115によって示されるように、電子コンピュータ装置は、先ず、第1のハイブリッド画像のソース画像A及びBの人の知覚の変化が起こり得る空間周波数を540pに設定し得る。第1のハイブリッド画像(すなわち、テストメディア225)に対するユーザ応答220に基づいて、電子コンピュータ装置は、ソース画像A又はBのどちらがユーザ135にとって知覚的により優勢かを特定する。ソース画像Bがより優勢であることをユーザ応答220が示す場合、電子コンピュータ装置は、図11Aの下のグラフ1120によって表される第2のハイブリッド画像を生成し得る。下のグラフ1120によって示されるように、電子コンピュータ装置は、真ん中のグラフ1115によって表される第1のハイブリッド画像の表示からソース画像Bを選択するユーザ応答220に基づいて、第2のハイブリッド画像の第2のソース画像A及びBの人間の知覚の変化が起こり得る空間周波数を720pに設定し得る。ユーザ応答220に基づいて動的/適応的に調整された複数のハイブリッド画像の表示を通じて、電子コンピュータ装置は、ユーザ135が知覚可能な優勢な周波数範囲を狭めるように構成されている。電子コンピュータ装置は、テスト測定セッションの全体を通して受信したユーザ応答220に基づいて、図11Aの上のグラフ1105に示すように、推定CSF1125を特定するように構成され得る。図11Aには、表示されたハイブリッド画像を表すグラフの2つの反復のみが示されているが、一部の実施形態では、電子コンピュータ装置は、テスト測定セッションの間に、追加のハイブリッド画像(即ち、テストメディア225)を表示し、対応する追加のユーザ応答220を受信する。
【0072】
図11Bは、図11Aと同様の例であるが、異なるユーザ135、環境130及び/又は再生システム210(例えば、同じユーザ135及び再生装置210であるが、図11Aの例よりも遠い視聴距離)に対応する。グラフ1155、1160及び1165は、概して、図11Aのそれぞれのグラフ1105、1115及び1120に対応し、上述したように異なる視聴状況に応じて値が調整されている。グラフ1160によって示されるように、電子コンピュータ装置は、先ず、第1のハイブリッド画像のソース画像A及びBの人の知覚の変化が起こり得る空間周波数を540pに設定し得る。第1のハイブリッド画像(すなわち、テストメディア225)に対するユーザ応答220に基づいて、電子コンピュータ装置は、ソース画像A又はBのどちらがユーザ135にとって知覚的により優勢かを特定する。図11Aに示す例とは異なり、ソース画像Aがより優勢であることをユーザ応答220が示す場合、電子コンピュータ装置は、図11Bの下のグラフ1165によって表される第2のハイブリッド画像を生成し得る。下のグラフ1165によって示されるように、電子コンピュータ装置は、真ん中のグラフ1160によって表される第1のハイブリッド画像の表示からソース画像Aを選択するユーザ応答220に基づいて、第2のハイブリッド画像の第2のソース画像A及びBの人間の知覚の変化が起こり得る空間周波数を360pに設定し得る。図11Aに関して上述したように、電子コンピュータ装置は、図11Bの上のグラフ1155に示すように、推定CSF1170を特定するために、ハイブリッド画像の表示及びユーザ応答220の受信を続け得る。
【0073】
図11A及び図11Bに示すように、CSF1125及び1170は、ユーザ135、環境130及び/又は再生システム210のうちの1つ以上の差異により、互いに異なる。例えば、図11BのCSF1170は、図11AのCSF1125の感度ピーク1110よりも低い解像度で感度ピーク1175を有する。別の例として、図11BのCSF1170の全体的な範囲は図11AのCSF1125のものよりも小さいため、図11Aのユーザは、約540pより大きい異なる解像度を区別できる一方で、図11Bのユーザは、約540pより大きい異なる解像度を区別することができない。
【0074】
上述の説明から明らかなように、CSF1125及び1170は、表示されたハイブリッド画像及び/又は他のテストメディア225に応答して電子コンピュータ装置によって受信されたユーザ応答220に基づくパーソナル化されたCSFである。電子コンピュータ装置によって特定されるパーソナル化されたCSFは、図5に示し、本明細書で前に説明したCSF520と同様である。つまり、メディアサーバ105から再生システム210へのメディアストリーミングを制御するために一般的なABRロジック(例えば、図5の理想的なCSF515)を用いる代わりに、電子コンピュータ装置は、そうするために、パーソナル化されたビットレート/解像度決定ルールを用いり得る。一部の実施形態では、電子コンピュータ装置は、テスト測定セッションの間のテストメディア225に対するユーザ応答220に基づいて、新たなパーソナル化されたABRラダーを生成する。
【0075】
一部の実施形態では、1つ以上の記憶されたPSP215は、テスト測定セッションの間に再生システム210によって出力されるテストメディア225の特性に影響を与え得る。一部の実施形態では、電子コンピュータ装置は、前に記憶されたパーソナル化された感度プロファイル(PSP)215を読み出し、前に記憶されたPSP215に含まれる1つ以上の視聴特性に基づいてテストメディア225を生成する。一部の実施形態では、前に記憶されたPSP215を読み出すために、電子コンピュータ装置は、ユーザ135の特性、第1の再生システム210の特性及びユーザ135が第1の再生システム210を視聴している環境130の特性のうちの少なくとも1つを含む現在の/進行中のテスト測定セッションの特性を特定する。次に、電子コンピュータ装置は、現在の/進行中のテスト測定セッションの特性と同じ特性のうちの1つ以上を含む前に記憶されたPSP215に基づいて、前に記憶された複数のPSP215から前に記憶されたPSP215を特定し得る。
【0076】
例えば、電子コンピュータ装置は、記憶されたPSP215が、同じユーザ135に関する情報を含むが、現在の再生システム210及び/又は現在の環境130は、記憶された再生システム210及び/又は環境130とは異なると判定し得る(例えば、同じユーザが、自宅の別の部屋の別のテレビでテレビを見ている)。記憶されたPSP215の特性が現在の状況に正確にマッチしていないにもかかわらず、電子コンピュータ装置は、それでもなお、記憶されたPSP215の1つ以上のメディアパラメータをベースラインとして用いて、テスト測定セッションの間にテストメディア225を出力し始め得る。つまり、電子コンピュータ装置は、テストメディア225をランダムに又は一般的モデルに従って出力するのではなく、記憶されたPSP215に従ってフィルタリングされるか又はさもなくば変更されたテストメディア225(ハイブリッド画像等)を出力し得る。一部の状況では、記憶されたPSP215に含まれるメディアパラメータに基づいてテストメディア225を出力することにより、テスト測定セッションの期間が短縮され及び/又は現在の状況に最も適した測定精度が改善され得る。例えば、コントラスト感度関数(CSF)が、パーソナル化された感度情報を規定するために電子コンピュータ装置によって生成される場合、典型的には、1つのテスト測定セッションにおいてCSFのメディアパラメータを正確に推定するために数十の測定が必要になる。しかしながら、電子コンピュータ装置が、異なる環境130においてユーザ135について及び/又は異なる再生システム210によって(又は共通ユーザ135を有すること以外の別の共通属性について)既に測定された開始点からテスト測定セッションを開始する場合、現在の状況におけるメディアパラメータを正確に推定するのに必要な測定の数は、典型的な量と比べて低減され得る。つまり、現在のテスト測定セッションにおけるCSF測定のための現在の刺激の空間周波数及びコントラストは、前のテストメディア225のユーザ応答220及び前に保存されたPSP215からのCSFの推定に従って調整され得る。
【0077】
同様に、一部の実施形態では、QoEを推定及び最適化するためにPSP215を生成する場合、単一のPSP215は、複数の記憶されたPSP215から推定され得るか又は他の特定された属性(例えば、場所、人口学的、視聴装置のメーカー/モデル、スクリーンサイズ等)に密に一致するものが選択され得る。例えば、電子コンピュータ装置がユーザ135、環境130及び/又は再生装置210の変化を検出し、ユーザ135が新たなテスト測定セッションに参加しないことを選択する場合、電子コンピュータ装置は、ユーザ135、環境130及び/又は再生装置210が同様の複数の記憶されたPSP215に基づいて、推定PSP215を生成し得る。
【0078】
単一の再生システム210に対して(それぞれが一意的な又は未知のPSPを有する)複数の視聴者が存在する場合(例えば、複数のユーザ/視聴者がいる家庭にあるテレビ)、電子コンピュータ装置は、多くの異なる基準に基づいて単一のPSP215を選択し得る。例えば、システム600の目標が任意のユーザに対する知覚されるQoE劣化のリスクを最小限に抑えることである場合、電子コンピュータ装置は、複数の視聴者のそれぞれに対応するPSP215のグループの中から最も感度の高いPSP215を選択し得る。この例では、電子コンピュータ装置は、ディスプレイ730を見る最も敏感なユーザであっても、QoEの低下を経験することがないよう確実にすることを試みる。最も敏感なユーザがQoEの低下を経験しないと仮定すると、同じディスプレイ730を見ているより敏感でないユーザもQoEの低下を経験することはない。何故なら、最も敏感なユーザよりも画像/ビデオ品質の変化に敏感でないからである。一部の実施形態では、システム600は、例えば、他のアプリケーション(例えば、スマートホームアプリケーション)又はパーソナルモバイル装置のGPS情報から取り出されたユーザ存在情報に基づいて、所与の再生システム210(例えば、複数のユーザ/視聴者を有する家庭のテレビ)のPSP候補の数を減らし得る。
【0079】
ブロック925で、電子コンピュータ装置は、パーソナル化された感度プロファイル215を完成するのに十分な情報を収集したかどうか判定する。上述のように、この情報は、(ブロック920での)現在のテストメディア225に対する現在のユーザ応答220から収集され得る及び/又は(ブロック910で)前に記憶されたPSP215から読み出され得る。図9では、ブロック910が任意であり、方法900の一部の実施では行われないことがあることを示すためにブロック910を破線で示している。つまり、一部の状況では、電子コンピュータ装置は、前に記憶されたPSP215を読み出すことなく、テストメディア225に対する受信したユーザ応答220に基づいてPSP215を(ブロック930で)生成し得る。
【0080】
逆に、図9ではブロック915、920及び925を破線で示していないが、一部の状況では、ブロック915、920及び925は、電子コンピュータ装置によって行われないことがある。つまり、電子コンピュータ装置は、ある状況ではテスト測定セッションを行わず、代わりに、現在のメディアセッションに用いられるPSP215を生成するために、1つ以上の記憶されたPSP215にのみに依存し得る。例えば、(ブロック910で)ユーザ135及び/又は環境130の記憶されたPSP215を読み出す際に、電子コンピュータ装置は、記憶されたPSP215のうちの1つがユーザ135、環境130及び再生装置210に対応すると判定し得る。したがって、ブロック930で、電子コンピュータ装置は、環境130内の再生装置210上のユーザ135の現在のメディアセッションのためのPSP215として、対応する前に記憶されたPSP215を利用し得る。この状況では、電子コンピュータ装置がテスト測定セッションを行う必要はない。なぜなら、現在のメディア配信セッションの表示特性は、前のテスト測定セッションの間にPSP215に予め記憶されていたからである。
【0081】
電子コンピュータ装置がテスト測定セッションを行わない(すなわち、図9のブロック915、920及び925を行わない)別の例として、上述したように、電子コンピュータ装置がユーザ135、環境130、及び/又は再生装置210の変化を検出し、ユーザ135が新たなテスト測定セッションに参加しないことを選択した場合、電子コンピュータ装置は、ユーザ135、環境130及び/又は再生装置210が同様の複数の記憶されたPSP215に基づいて推定PSP215を生成し得る。例えば、記憶されたPSP215が同じユーザに関連している場合、電子コンピュータ装置は、記憶されたPSP215に関連する再生システム210と、ユーザ135によって現在使われている再生システム210との間の、表示サイズ又は他の表示特性の既知の変化に基づいて、記憶されたPSP215の1つ以上の特性を調整し得る。同様に、電子コンピュータ装置は、ユーザ135の環境における既知の変化に基づいて、記憶されたPSP215の1つ以上の特性を調整し得る。例えば、環境センサ305からのセンサデータに基づいて、電子コンピュータ装置は、現在の環境130が、記憶されたPSP215に関連する環境130よりも暗いと判定し得る。他の実施形態では、推定PSP215を生成する代わりに、電子コンピュータ装置は、ユーザ135、環境130及び/又は再生装置210の特定された及び/又は既知の特徴と同様の特性を含む記憶されたPSP215を読み出し、使用し得る。例えば、電子コンピュータ装置は、記憶されたPSP215が異なる環境130及び/又は異なる再生システム210のためのものであっても、ユーザ135の記憶されたPSP215を読み出し得る。
【0082】
ブロック925の説明に戻って、電子コンピュータ装置が、(例えば、図5図11A及び図11Bに示すように、CSFをより正確に完成させるために)PSP215を完成するのにより多くの情報が望ましいと判定した場合、方法900はブロック915に戻り、テストメディア225の出力及びテストメディア225に応答するユーザ入力(すなわち、ユーザ応答220)の受信を続ける。PSP215を完成させるのに十分な情報を収集したと電子コンピュータ装置が判定した場合、本方法はブロック930に進む。
【0083】
ブロック930で、電子コンピュータ装置は、ユーザ入力に基づいてユーザの1つ以上の視聴特性のパーソナル化された感度プロファイル(PSP)を生成する。例えば、電子コンピュータ装置は、図5に示すように、理想的なCSF515から変換及び/又はスケーリングされたパーソナル化されたCSF520を生成する。さらに又は代替的に、ABRリクエスト140(又は別のメディア配信方法に関する要求)等のストリーミングパラメータを特定するために用いられるアルゴリズムは、調整され、PSP215に記憶される係数を有し得る。一部の実施形態では、電子コンピュータ装置は、PSP215に含まれるべきパーソナル化されたABRラダー(又は別のパーソナル化されたメディア配信方法)を生成する。
【0084】
ブロック935で、電子コンピュータ装置は、少なくとも部分的にPSP215に基づいて、メディアパラメータを特定する。例えば、電子コンピュータ装置は、メディアパラメータの値(例えば、セグメントサイズ、ビットレート、解像度、フレームレート、メディアサーバ―105及び/又はネットワーク115に関連するビデオエンコーダ/トランスコーダ/トランスレータの動作に影響を与える別のメディアパラメータのうちの1つ以上の値)を決定する。ブロック940で、メディアサーバ105は、メディアパラメータに従って、ネットワーク115を介して、出力メディアを再生システム210に提供する。出力メディアは、再生システム210に出力されるように構成されている(例えば、再生システム210のディスプレイ730上に出力されるように構成された画像/ビデオ)。
【0085】
ブロック935でメディアパラメータ(すなわち、メディアパラメータの値)を決定するために、電子コンピュータ装置は、図4に示し、図4に関して本明細書で先に説明したように、一般的オブジェクティブABRロジックモデルのパーソナル化されたオブジェクティブABRロジックモデル(POM405)への変換を行い得る。一部の実施形態では、POM405は、図6に示すように、テレビ、セットトップボックス、デジタルメディアアダプタ又はモバイル装置等の、アダプティブビットレート配信をサポートするストリーミングシステム内で実施され得る。この例では、POM405は、再生システム210のABR要求ロジック140によって利用され、限定されないが、セグメントサイズ、ビットレート、解像度、フレームレート、コーデック等に基づいて、エンコードされたビデオ及び/又はオーディオセグメントの選択を改善し、ユーザ135のPSP215に利用可能なコード化セグメント間で最も近い一致と一致するか又は提供する。例えば、ABR要求140(又は別のメディア配信方法に関する要求)等のストリーミングパラメータを決定するために用いられる一般的オブジェクティブABRロジックモデル(又は別の一般的メディア配信方法)を定義するアルゴリズムは、PSP215に記憶された情報に従ってそれらの係数が調整/パーソナル化され得る。
【0086】
本明細書で前に説明したように、図6のABRラダー137は、ビットレート、解像度、フレームレート等の範囲にわたって利用可能なオーディオ及びビデオセグメントの集合を表す。また、本明細書で前に説明したように、既存のメディア配信システム/方法は(ABRが有効であるかどうかに関わらず)非効率であり、再生システム210は、シームレスな再生のために必要とされる以上のデータを要求する及び/又はユーザ135のPSP215を超えるメディアパラメータの値(例えば、解像度/ビットレート/フレームレートの組み合わせ)を要求することに多くの場合つながる。つまり、ユーザ135の感度閾値を超えて、配信解像度/ビットレート/フレームレートを高めることを試みる既存のメディア配信ロジックは、ユーザ135にとってQoEの向上に変換されない。開示するPOMベースのメディア配信方法はより効率的な配信に変換されるため、これらのサービスは、それらのコンテンツ配信ネットワーク(CDN)ベンダから引き出されたギガバイト当たりで支払うため、オーバーザトップ(OTT)サービスの配信コストの低減に変換される。
【0087】
一部の実施形態では、ブロック935で、電子コンピュータ装置は、ユーザ135の感度知覚の範囲内にあるストリームメディアをもたらす1つ以上のメディアパラメータ(例えば、解像度/ビットレート/フレームレートの組み合わせ)の値を選択する。例えば、電子コンピュータ装置は、ストリームメディアの解像度を約720pに要求するためメディアサーバ105へのABR要求140を制御するために図11AのCSF1125を用いり得る。なぜなら、CSF1125は、第1のユーザの感度ピーク1110が約720pであることを示すからである。他方で、電子コンピュータ装置は、ストリームメディアの解像度を低解像度である約540pに要求するためメディアサーバ105へのABR要求140を制御するために図11BのCSF1170を用いり得る。なぜなら、CSF1170は、第2のユーザの感度ピーク1175が約540pであることを示すからである。直ぐ上の2つの例では、第1のメディアパラメータ(すなわち、540pの解像度)及び第2のメディアパラメータ(すなわち、720pの解像度)は、第2のユーザの第1の再生装置210に第1の出力メディアを提供することがネットワーク115のリソースの第1の使用を、第1のユーザの第2の再生装置210に第2の出力メディアを提供することに関するネットワーク115のリソースの第2の使用よりも少なくなるように減少させるように決定される。しかしながら、2つの再生装置210に出力メディアをストリーミングする際のリソースの使用の差異にもかかわらず、第1のユーザの第1のパーソナル化されたQoEの第1のパーセンテージは、第2のユーザの第2のパーソナル化されたQoEの第2のパーセンテージとほぼ同じレベルで維持される(図12B及び表1B参照)。
【0088】
単一の再生システム210又は2つの再生システム210のメディアセッションに関して方法900を上述したが、一部の実施形態では、方法900は追加の再生システム210に関して行われ得る。例えば、ネットワーク115上の特定のノードからメディアストリームを受信する複数の再生システム210のそれぞれについてPSP215を決定するために方法900が用いられ得る。電子コンピュータ装置は、複数の再生システム210のそれぞれに提供される各メディアストリームの1つ以上のメディアパラメータ(例えば、符号化及び配信パラメータ)を改善/最適化して、ネットワーク115からのメディアストリームを全体で/全体として改善/最適化し得る。
【0089】
例えば、モバイル無線及びブロードバンドネットワークオペレータの場合、エンドユーザ/視聴者のQoEをトレードオフすることなく、開示のPOMベースのメディア配信及び符号化方法900を利用して、既存のアクセスネットワークに追加の容量を加えることができる。一部の実施形態では、方法900は、ネットワークの容量を増やすのに必要な資本投資の速度を減らすための新たな方法をネットワークオペレータに提供する。図12A及び図12B並びに表1A及び表1
Bは、既存のストリーミング方法を用いてメディアをストリーミングする場合と、方法900を用いてメディアをストリーミングする場合のネットワーク115の例示の帯域幅及びQoEの統計を示す。既存の方法を用いるサーバは既存のサーバと呼ぶのに対して、方法900を用いるサーバをxCDサーバと呼ぶ(すなわち、エクスペリエンスコーディング及び配信サーバ)。
【0090】
図12Aは、帯域幅の上限がないネットワークについてのチャート1205を示す。上側の曲線1210は既存のサーバによってストリーミングされるメディアによって用いられる帯域幅を表す。下側の曲線1215は、方法900を用いてxCDサーバによってストリーミングされるメディアによって用いられる帯域幅を表す。図12Aに示すように、方法900を用いてxCDサーバによってストリーミングされるメディアによって用いられる帯域幅は、既存のサーバによってストリーミングされる同じメディアによって用いられる帯域幅よりも約20%少ない。加えて、図12Aに対応する下記の表1Aに示すように、全ての視聴者(例えば、高感度のユーザ(すなわち、近い視聴者)及び低感度のユーザ(すなわち、離れた視聴者)の両方は100%で留まる(すなわち、完全なQoE)。
【0091】
【表1A】
【0092】
図12A及び表1Aに示すように、方法900は、それぞれのPSP215に基づいてユニキャストセッションをそれぞれが受信するユーザの集団について、ユーザQoEを低下させることなくより効率的なメディア配信をもたらす。この、ユーザQoEを低下させることなく、効率を高め、帯域幅を低下されることは、ビットレート、解像度等がある点を超えて増加した場合に、QoEの向上を経験しないユーザ135のPSP215に基づいてストリームメディアのビットレート、解像度等をシステム600が減らす結果である。つまり、一部の実施形態では、方法900は、特定のユーザが知覚できるよりも高い品質のメディアを特定のユーザに配信することなく、各ユーザに最も高い知覚可能な品質のメディアを配信すること(すなわち、パーソナル化されたメディアコンテンツ配信)を目的とし得る。
【0093】
図12Bは、帯域幅に上限が設けられた/ネットワーク容量が固定された(例えば、約60Mbps)ネットワークについてのチャート1250を示す。曲線1255は、既存のサーバによってストリームされたメディアによって用いられる帯域幅を表す。曲線1260は、方法900を用いるxCDサーバによってストリームされるメディアによって用いられる帯域幅を表す。図12Aの曲線とは異なり、図12Bの曲線1255及び1260は、経時的にほぼ同じ帯域幅を用いる。一部の実施形態では、方法900を用いるxCDサーバによってストリーミングされるメディアによって用いられる帯域幅は、既存のサーバによってストリーミングされる同じメディアによって用いられる帯域幅よりも約1%小さくてもよい。しかしながら、図12Bに対応する以下の表1Bによって示されるように、容量が固定されたネットワークリンクを介したxCDサーバによる方法900の使用は、従来のABRセグメント選択アプローチを実施する既存のサーバと比べて、高感度及び低感度ユーザにわたってよりQoEのより均一な低下をもたらす。
【0094】
【表1B】
【0095】
例えば、表1Bは、既存のサーバによってメディアがストリーミングされる場合に、上限が設けられた帯域幅ネットワークでは、高感度ユーザ(すなわち、それぞれの再生システム210に最も近いユーザ)は約40%のQoEの低下を経験することを示す。これに対して、既存のサーバによってメディアがストリーミングされる場合に、上限が設けられた帯域幅ネットワークでは、低感度ユーザ(すなわち、それぞれの再生システム210から最も遠いユーザ)は約20%のQoEの低下しか経験しない。このQoEの低下の差は、ストリーミング品質の変化が異なるユーザに異なる影響を与えるにもかかわらず、既存のサーバは全てのユーザに対してストリーミング品質を等しく低下させるに起因する。
【0096】
他方で、ユーザPSP215は、異なるユーザに対して異なる方法でストリーミング品質をよりインテリジェントに低減するためにxCDサーバによって用いられるため、同じ上限が設けられた帯域幅ネットワークは、システム600の全ユーザ間でより均一なQoEの低減を提供することができる。一部の実施形態では、QoEのより均一な低減は、システム600のユーザに対して全体的により高いQoEをもたらす。例えば、表1Bは、メディアがxCDサーバによってストリーミングされる場合に、キャップされた帯域幅ネットワークにおいて、高感度ユーザ(すなわち、それぞれの再生システム210に最も近いユーザ)は約20%のQoEの低下しか経験しないことを示す。同様に、メディアがxCDサーバによってストリーミングされる場合に、上限が設けられた帯域幅ネットワークにおいて、低感度ユーザ(すなわち、それぞれの再生システム210から最も遠いユーザ)は約20%のQoEの低下しか経験しない。つまり、表1Bによって示されるように、方法900を実施するxCDサーバは、高感度ユーザのQoEを有意に改善する一方で、低感度ユーザのQoEを適度に低下させるか又は維持する。
【0097】
図13A及び図13Bは、方法900が、QoEに悪影響を及ぼすことなく、どのようにより多くのユーザ/加入者が固定容量ネットワーク上でのメディアのストリーミングできるようにするかの別の例を示す。図13A及び図13Bは、オーバーヘッドを考慮した後に有効スループットが88%の1.89Gbit/s(4096-QAM)の固定容量ネットワークを用いた場合の、サービスが提供される加入者の数(x軸)に対するQoEの低下を経験する加入者の割合(y軸)の例示のグラフ1305及び1350を示す。図13A及び図13Bのグラフ1305、1350は、高感度(例えば、それぞれの再生システム210から離れた3つの画像高さ(3H))及び低感度(例えば、それぞれの再生システム210から離れた6つの画像高さ(6H))の視聴者が50%で分かれていると仮定している。
【0098】
グラフ1305、1350は、ユーザ/加入者が固定容量ネットワークに追加されるにつれて、ユーザ/加入者の数がある閾値1310、1355に達すると、(一例として)ビデオ解像度を低下させなければならないことを示す。しかしながら、図12A及び図12Bならびに表1A及び表1Bに関する上記の例と同様に、(図13Aに示すように)全てのユーザ/加入者の解像度を均一に下げることにより、ユーザ/加入者が3Hで又は6Hで視聴していることに依存して、不均一なQoEがもたらされる。例えば、全てのメディアストリームで同じ解像度の低減が実施された場合、3Hで視聴しているユーザは概して、6Hで視聴しているユーザよりもQoEの低下が大きいと認識する。異なるタイプのユーザ間のQoEの低下におけるこの違いは、図13A及び図13Bに示す3H曲線1315及び6H曲線1320によって示される。3H曲線1315と6H曲線1320との間の網掛け領域1325は、高感度ユーザ/加入者と低感度ユーザ/加入者との間でのQoEの低下の不均一を示す。例えば、ネットワークが1200人のユーザにサービスを提供するためには、3Hにおけるユーザ(すなわち、高感度のユーザ)の60%にとってビデオ品質の低下が見られるものの、6Hにおけるユーザ(すなわち、低感度のユーザ)では約2%にすぎない。
【0099】
図13Aは、全ユーザ/加入者の視聴距離に基づいてビデオコード化ビットレート及び解像度を同じように適合するストリーミング管理方法を用いた場合に、異なるユーザ/加入者が経験するQoEを示す第1のQoE曲線1330を示す。他方、図13Bは、追加のユーザがネットワークに加えられるにつれて、異なるユーザに対して解像度の劣化をパーソナル化するために図9の方法900が用いられる場合に、異なるユーザ/加入者が経験するQoEを示す第2のQoE曲線1360を示す。上述したように、図13A及び図13Bの双方は、ユーザ/加入者間で3H及び6Hの視聴距離が50%で分かれていると仮定する。
【0100】
方法900を用いることで、メディアパラメータを制御する電子コンピュータ装置は、(例えば、各ユーザのPSP215に記憶された情報に基づいて)どのユーザがどの距離でどのように各ユーザのQoEが解像度の低下によって影響を受けるかを理解する。したがって、方法900を実行する電子コンピュータ装置は、両グループのユーザ(すなわち、高感度ユーザ及び低感度ユーザ)において等しい平均的なQoEを実現するために、ビットレート/解像度の組み合わせを割り当てることができる。この改善は、図13AのQoE曲線1330と図13BのQoE曲線1360との間の違いによって示される。例えば、任意のユーザがQoEの低下を経験する図13Aの閾値1310は、ネットワークが約600のユーザにサービスを提供する場合のものである。これに対して、図13Bの閾値1355は、約1200人のユーザと約2倍になっている。つまり、方法900を実行するネットワークは、いずれのユーザもQoEの低下を経験することなく、既存のネットワークの約2倍のユーザにサービスを提供することができる。
【0101】
図9に戻って、図の破線矢印で示されるように、一部の実施形態では、電子コンピュータ装置は、ブロック935及び940を繰り返す。これらのブロックの繰り返しは、メディア配信サービスの間に再生環境130(例えば、環境センサ305)及び/又はネットワーク115におけるセンサ出力のリアルタイム追跡を可能にし、それに対応し、多様な用途のケースのためにパーソナル化されたオブジェクティブモデル405の動的/アダプティブな調整を可能にする。例えば、システム600は、(例えば、日が沈んだことにより、ユーザ135が部屋のカーテンを閉めることにより等)再生システム210が位置する部屋がユーザ135がテレビを見始めてから暗くなったと判定し得る。この判定に応答して、システム600は、例えば、現在より暗い部屋の特性により類似した環境光特性を含む別の記憶されたPSP215を選択することにより、パーソナル化されたオブジェクティブモデル405を調整し得る。
【0102】
本明細書で前で説明したように、本明細書で言及するABRラダー137及びABR選択方法は、ネットワーク115を介してメディアサーバ105から再生システム210へのメディア配信を制御するためにシステム600によって用いることができる一例の方法に過ぎない。他の実施形態では、ストリーミングされているコード化されたメディアのビットレート及び/又は解像度等のビデオエンコーダ/トランスコーダ/トランスレータのパラメータ(すなわち、メディアパラメータ)を動的に調整するために他の方法が用いられ得る。多くの例に含まれるABR関連方法と同様に、これらの他のメディア配信方法は、本明細書で説明したように、メディア配信を最適化するために、1つ以上のPSP215に基づいて調整されたそれらのメディアパラメータを有する。一部の実施形態では、メディア配信方法は、メディアサーバ105及び/又はネットワーク115(すなわち、再生システム210の上流)によって実施される上流のメディア配信方法である。
【0103】
本実施形態のその用途は、本明細書で説明した又は添付の図面に示すコンポーネントの詳細な構成及び配置に限定されないことを理解すべきである。実施形態は、様々な方法で実施又は行うことができる。また、本明細書で用いる表現及び用語は説明を目的としたものであり、限定的とみなすべきではないことを理解すべきである。「含む」又は「有する」及びそれらの変形の使用は、その後に列挙されるアイテム及びそれらの等価物に加えて追加のアイテムを含むことを意味する。特段規定又は限定されない限り、「取り付けられた」、「接続された」、「支持された」及び「連結された」という用語及びそれらの変形は広い意味で用いられ、直接的及び間接的な取り付け、接続、支持及び連結の両方を包含する。
【0104】
加えて、実施形態は、説明を目的として、コンポーネントの大部分があたかもハードウェアでのみ実施されているかのように図示及び説明され得るハードウェア、ソフトウェア及び電子コンポーネント又はモジュールを含み得ることが理解すべきである。しかしながら、当業者であれば、この詳細な説明の解釈に基づいて、少なくとも1つの実施形態で、電子ベースの態様は、マイクロプロセッサ及び/又は特定用途向け集積回路(「ASIC」)等の1つ以上の電子プロセッサによって実行可能な(例えば、非一時的コンピュータ読み取り可能媒体に記憶される)ソフトウェアで実施され得ることを認識するであろう。そのため、実施形態を実施するために複数のハードウェア及びソフトウェアベースのデバイス並びに複数の異なる構造コンポーネントが利用され得る。例えば、本明細書に記載の「サーバ」及び「コンピュータ装置」は、1つ以上の電子プロセッサ、1つ以上のコンピュータ読み取り可能媒体モジュール、1つ以上の入出力インターフェイス及び様々なコンポーネントを接続する様々な接続(例えば、システムバス)を含むことができる。
【0105】
様々な特徴及び利点は、以下の特許請求の範囲に記載されている。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10ABC
図10DE
図11
図12
図13A
図13B