特開2024-125995 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ベイジン・フル・ソフトウェア・テクノロジー・デベロップメント、カンパニー・リミテッドの特許一覧

特開2024-125995ビデオ符号化のためのレート歪み曲線の予測

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3A
3B
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30A
30B
31
32

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024125995

(43)【公開日】2024-09-19

(54)【発明の名称】ビデオ符号化のためのレート歪み曲線の予測

(51)【国際特許分類】

H04N 21/24 20110101AFI20240911BHJP

H04N 21/266 20110101ALI20240911BHJP

H04N 19/40 20140101ALI20240911BHJP

【ＦＩ】

H04N21/24

H04N21/266

H04N19/40

【審査請求】有

【請求項の数】20

【出願形態】ＯＬ

【外国語出願】

(21)【出願番号】P 2023199277

(22)【出願日】2023-11-24

(31)【優先権主張番号】18/179,281

(32)【優先日】2023-03-06

(33)【優先権主張国・地域又は機関】US

(31)【優先権主張番号】18/295,184

(32)【優先日】2023-04-03

(33)【優先権主張国・地域又は機関】US

(71)【出願人】

【識別番号】523380346

【氏名又は名称】ベイジン・フル・ソフトウェア・テクノロジー・デベロップメント、カンパニー・リミテッド

【氏名又は名称原語表記】ＢＥＩＪＩＮＧＨＵＬＵＳＯＦＴＷＡＲＥＴＥＣＨＮＯＬＯＧＹＤＥＶＥＬＯＰＭＥＮＴＣＯ．，ＬＴＤ．

【住所又は居所原語表記】Ｒｏｏｍ２１０１－２１０８２１／Ｆ，２２０１－２２０８２２／Ｆ，ＢｕｉｌｄｉｎｇＢ，Ｎｏ．１３Ｂｕｉｌｄｉｎｇ，ＷａｎｇｊｉｎｇＥａｓｔＰａｒｋ，４ｔｈＢｌｏｃｋ，ＰＯＳＣＯ，ＣｈａｏｙａｎｇＤｉｓｔｒｉｃｔ，Ｂｅｉｊｉｎｇ１００１０２，ＰＲＣ

(74)【代理人】

【識別番号】110003708

【氏名又は名称】弁理士法人鈴榮特許綜合事務所

(72)【発明者】

【氏名】チェン・リュー

(72)【発明者】

【氏名】ウェンハオ・ジャン

(72)【発明者】

【氏名】シーチャン・フアンフー

(72)【発明者】

【氏名】シャオボー・リュー

(72)【発明者】

【氏名】シューメイ・モン

【テーマコード（参考）】

5C159

5C164

【Ｆターム（参考）】

5C159KK53

5C159KK54

5C159UA02

5C159UA05

5C164MA06S

5C164SA32S

5C164SB01S

5C164SB41P

5C164SC01P

5C164YA21

5C164YA24

(57)【要約】（修正有）

【課題】ビデオ符号化のためのレート歪み曲線を予測できる方法及びプログラムを提供する。
【解決手段】予測方法は、ビデオの一部および符号器のパラメータに関連付けられ、ビットレートのセットおよび解像度を含むターゲット構成についての特徴値を決定することと、決定した特徴値に基づいて、ビットレートのセットおよび解像度についての複数の品質値を生成することと、ビットレートと解像度についての複数の品質値との関連性の表現を生成することと、生成した表現を分析し、解像度を使用してビデオの一部の符号化を使用するためのビットレートのリストを出力することと、を含む。
【選択図】図２４

【特許請求の範囲】

【請求項1】

コンピューティングデバイスによって、ビデオの一部およびターゲット構成についての特徴値を決定することと、ここにおいて、前記ターゲット構成は、符号器のパラメータに関連付けられ、ビットレートのセットおよび解像度を含み、
前記コンピューティングデバイスによって、前記特徴値に基づいてビットレートの前記セットおよび前記解像度についての複数の品質値を生成することと、
前記コンピューティングデバイスによって、ビットレートと前記解像度についての前記複数の品質値との間の関連性の表現を生成することと、
前記コンピューティングデバイスによって、前記ビデオの前記一部についてのビットレートのリストを決定するために前記表現を分析することと、
前記コンピューティングデバイスによって、前記解像度を使用して前記ビデオの前記一部の符号化を使用するための前記ビットレートのリストを出力することと
を備える方法。

【請求項2】

前記符号器の前記パラメータは、ビデオの前記一部を符号化するための設定を備える、請求項１に記載の方法。

【請求項3】

前記複数の品質値を生成することは、
ビットレートの前記セット中のビットレートごとに、前記解像度についての品質値を生成することを備える、請求項１に記載の方法。

【請求項4】

前記解像度は、複数の解像度を備え、ここにおいて、前記複数の品質値を生成することは、
前記複数の解像度のうちの解像度を選択することと、
前記ビットレートのセット中のビットレートごとに、前記解像度についての品質値を生成することと、
前記複数の解像度のうちのすべての解像度が処理されるまで、前記複数の解像度の中で新たな解像度を選択し続け、前記新たな解像度について、ビットレートの前記セットのうちの各ビットレートについての前記品質値を生成することと
を備える、請求項１に記載の方法。

【請求項5】

ビットレートと前記複数の品質値との間の前記関連性の前記表現は、レート歪み曲線を備える、請求項１に記載の方法。

【請求項6】

複数の解像度についてビットレートの前記セットについての複数の品質値を生成することと、
ビットレートと前記複数の解像度についての前記複数の品質値との間の前記関連性の複数の表現を生成することと
をさらに備える、請求項１に記載の方法。

【請求項7】

前記複数の解像度についての前記複数の表現を含むマップを生成することと、
ビットレートの前記リストを決定するために前記マップを使用すること
をさらに備える、請求項６に記載の方法。

【請求項8】

前記複数の品質値を生成することは、
前記複数の品質値を生成するために前記特徴値を予測ネットワークに入力することを備える、請求項１に記載の方法。

【請求項9】

前記特徴値は、コンピュータビジョン特徴、空間領域特徴、時間領域特徴、周波数領域特徴、およびプロキシ符号化特徴のうちのうちの１つまたは複数を備える、請求項８に記載の方法。

【請求項10】

前記プロキシ符号化特徴は、前記ビデオの実際の符号化に基づき、ここにおいて、前記実際の符号化における設定は、前記ターゲット構成における前記パラメータとは異なる、請求項９に記載の方法。

【請求項11】

前記複数の品質値を生成することは、
前記ビデオの実際の符号化からプロキシ符号化特徴値を決定することと、
複数のプロキシ品質値を生成するために前記プロキシ符号化特徴値を予測ネットワークに入力することと
を備える、請求項１に記載の方法。

【請求項12】

前記複数の品質値を生成することは、
前記複数のプロキシ品質値に基づいて前記複数の品質値を生成することを備える、請求項１１に記載の方法。

【請求項13】

前記複数のプロキシ品質値に基づいて前記複数の品質値を生成することは、
予測ネットワークを使用して複数のオフセット値を生成することと、ここにおいて、前記複数のオフセット値は、前記ターゲット構成における前記パラメータからの前記実際の符号化における設定間の差に基づき、
前記複数の品質値を生成するために前記複数のオフセット値と前記複数のプロキシ品質値とを使用することと
を備える、請求項１２に記載の方法。

【請求項14】

前記複数の品質値を生成することは、
第１の予測方法を使用して第１の複数の品質値を決定することと、
第２の予測方法を使用して第２の複数の品質値を決定することと、ここにおいて、前記第２の予測方法は、ターゲット構成における前記パラメータからの実際の符号化における設定間の差に基づいて決定されるプロキシ品質値に対してのオフセットを予測し、
前記複数の品質値を決定するために前記第１の複数の品質値と前記第２の複数の品質値とを比較することと
を備える、請求項１に記載の方法。

【請求項15】

前記複数の品質値を生成することは、
前記ビデオの前記一部の特性を分析することと、
前記特性に基づいて第１の予測方法および第２の予測方法のうちの１つを選択することと、ここにおいて、前記第２の予測方法は、前記ターゲット構成における前記パラメータからの実際の符号化における設定間の差に基づいて決定されるプロキシ品質値に対してのオフセットを予測し、
前記複数の品質値を決定するために前記第１の予測方法および前記第２の予測のうちの前記選択された１つを使用することと
を備える、請求項１に記載の方法。

【請求項16】

コンピュータ実行可能命令を記憶している非一時的なコンピュータ可読記憶媒体であって、コンピューティングデバイスによって実行されるときに、
ビデオの一部およびターゲット構成についての特徴値を決定することと、ここにおいて、前記ターゲット構成は、符号器のパラメータに関連付けられ、ビットレートのセットおよび解像度を含み、
前記特徴値に基づいてビットレートの前記セットおよび前記解像度についての複数の品質値を生成することと、
ビットレートと前記解像度についての前記複数の品質値との間の関連性の表現を生成することと、
前記ビデオの前記一部についてのビットレートのリストを決定するために前記表現を分析することと、
前記解像度を使用して前記ビデオの前記一部の符号化を使用するための前記ビットレートのリストを出力することと
について前記コンピューティングデバイスを動作可能にさせる、非一時的なコンピュータ可読記憶媒体。

【請求項17】

コンピューティングデバイスによって、符号器の第１のパラメータに関連付けられ、ビットレートのセットと解像度とを含むプロキシ符号化構成を使用してビデオの一部の実際の符号化からプロキシ符号化特徴値を決定することと、
前記コンピューティングデバイスによって、第１の予測方法を使用して前記プロキシ符号化特徴値に基づいてビットレートのセットおよび解像度についての複数のプロキシ品質値を生成することと、
前記コンピューティングデバイスによって、前記ビデオの前記一部についてのターゲット特徴値を決定することと、ここにおいて、前記ターゲット特徴値は、前記符号器の第２のパラメータに関連付けられたターゲット構成に基づき、
前記コンピューティングデバイスによって、第２の予測方法を使用して前記ターゲット特徴値に基づいてビットレートの前記セットおよび前記解像度についての複数のオフセット品質値を生成することと、ここにおいて、前記第２の予測方法は、前記第１のパラメータと前記第２のパラメータとの間の差に基づいて決定されるプロキシ品質値に対してのオフセットを予測し、
前記コンピューティングデバイスによって、前記複数のプロキシ品質値と前記複数の品質オフセット値とを使用して複数の品質値を生成することと
を備える、方法。

【請求項18】

前記複数の品質値は、第１の複数の品質値を備え、
前記ターゲット構成に基づいて品質値を予測する第３の予測方法を使用して第２の複数の品質値を決定すること、
ビットレートの前記セットおよび前記解像度について出力するための品質値を決定するために前記第１の複数の品質値と前記第２の複数の品質値とを比較することと
をさらに備える、請求項１７に記載の方法。

【請求項19】

出力するための品質値を決定するために前記第１の複数の品質値と前記第２の複数の品質値とを比較することは、
ビデオの前記一部の特性を分析することと、
前記特性に基づいて前記第１の複数の品質値および前記第２の複数の品質値のうちの１つを選択することと、
を備える、請求項１８に記載の方法。

【請求項20】

出力するための品質値を決定するために前記第１の複数の品質値と前記第２の複数の品質値とを比較することは、
特性に基づいて前記第１の複数の品質値および前記第２の複数の品質値を組み合わせることを備える、請求項１８に記載の方法。

【発明の詳細な説明】

【関連出願の相互参照】

【0001】

[0001]本出願は、一部継続出願であり、米国特許法第１２０条に従って、２０２３年３月６日に出願された「ＤＹＮＡＭＩＣＳＥＬＥＣＴＩＯＮＯＦＣＡＮＤＩＤＡＴＥＢＩＴＲＡＴＥＳＦＯＲＶＩＤＥＯＥＮＣＯＤＩＮＧ（ビデオ符号化のための候補ビットレートの動的選択）」という名称のより先に提出された出願である米国出願第１８／１７９，２８１号に対して権利が付与されており、その利益を主張するものであり、その内容は、すべての目的について全体として参照により本明細書に組み込まれる。

【背景技術】

【0002】

[0002]ビデオをクライアントデバイスに配信する一方法は、アダプティブビットレートストリーミング（ＡＢＲ）を使用する。アダプティブビットレートストリーミングは、異なるレベルのビットレートおよび／または品質などの異なるレベルのビデオ属性で符号化された（しばしば、バリアントまたはプロファイルと呼ばれる）複数のストリームを提供することに根拠が置かれる。プロファイルラダーは、ビデオのセグメントをストリーミングするときにクライアントが使用するために利用可能な異なるプロファイルをリストする。クライアントは、ネットワーク状態および他の要因に基づいて、プロファイルを動的に選択することができる。ビデオはセグメント化され（例えば、通常は数秒の長さごとに個別のセグメントに分割され）、クライアントは、ネットワーク状態が変化するときにセグメント境界であるプロファイルから別のプロファイルに切り替えることができる。例えば、ビデオ配信システムは、より高い利用可能な帯域幅を有するネットワーク状態が経験されているときに、ストリーミングされているビデオの品質を改善するより高いビットレートを有するプロファイルをクライアントに与えることを望む。より低い利用可能な帯域幅を有するネットワーク状態が経験されているときに、ビデオ配信システムは、クライアントが、再バッファリングまたはダウンロードの失敗などの何らかの再生問題を有することなしにビデオを再生することができるように、より低いビットレートを有するプロファイルをクライアントに与えることを望む。

【図面の簡単な説明】

【0003】

[0003]含まれる図面は、例示的な目的のためであり、開示される発明のシステム、装置、方法、およびコンピュータプログラム製品についての可能な構造および動作の例を与える役割を果たすものに過ぎない。これらの図面は、開示された実施の精神および範囲から逸脱することなく、当業者によってなされ得る形態および細部のいかなる変更も決して限定しない。

【図1】[0004]いくつかの実施形態による候補平均ビットレートのリストを動的に選択するためのシステムを示す図。

【図2】[0005]いくつかの実施形態によるビデオの部分の一例を示す図。

【図3A】[0006]いくつかの実施形態による候補平均ビットレートのリストの生成の一例を示す図。

【図3B】[0007]いくつかの実施形態による符号化されたセグメントの生成の一例を示す図。

【図4】[0008]いくつかの実施形態による符号化されたセグメントを複数のプールにクラスタリングする一例を示す図。

【図5】[0009]いくつかの実施形態による選択プロセスの一例を示す図。

【図6】[0010]いくつかの実施形態によるプールのために符号化されたセグメントを選択するために使用され得るレート歪み曲線のグラフの一例を示す図。

【図7】[0011]いくつかの実施形態によるセグメントごとにプロファイルについての選択された符号化されたセグメントの一例を示す図。

【図8】[0012]いくつかの実施形態によるビデオコンテンツのための異なるレート歪み曲線の一例を示す図。

【図9】[0013]いくつかの実施形態による異なる符号化構成を使用する異なる特性を示す図。

【図10】[0014]いくつかの実施形態による異なるレート歪み曲線について静的候補平均ビットレートを使用する一例を示す図。

【図11】[0015]いくつかの実施形態による最適化された候補平均ビットレートリストを示す図。

【図12】[0016]いくつかの実施形態によるセグメント品質駆動型適応処理システム（ＳＱＡ）システムおよび事前分析最適化プロセスのより詳細な例を示す図。

【図13】[0017]いくつかの実施形態によるレート歪み（ＲＤ）予測システムのより詳細な例を示す図。

【図14】[0018]いくつかの実施形態による予測ネットワークの出力を示す図。

【図15】[0019]いくつかの実施形態による候補平均ビットレートのリストを選択するための最適化プロセスを実行するための方法の簡略化されたフローチャートを示す図。

【図16】[0020]いくつかの実施形態による候補平均ビットレートのリストについての境界を決定する一例を示す図。

【図17】[0021]いくつかの実施形態による品質に基づいて候補平均ビットレートを除去する一例を示す図。

【図18】[0022]いくつかの実施形態による候補平均ビットレートを除去するために最小ギャップが使用される一例を示す図。

【図19】[0023]いくつかの実施形態による候補平均ビットレートを追加することが有利であり得る場合を示すグラフ。

【図20】[0024]いくつかの実施形態による候補平均ビットレートを追加することの決定を示す図。

【図21】[0025]いくつかの実施形態によるＲＤ予測システムの一例を示す図。

【図22】[0026]いくつかの実施形態による抽出され得る特徴の一例を示す図。

【図23】[0027]いくつかの実施形態によるビデオのフレームの一例を示す図。

【図24】[0028]いくつかの実施形態による予測方法の簡略化されたフローチャートを示す図。

【図25】[0029]いくつかの実施形態による１つのターゲット解像度についてのビットレートの品質値を列挙するグラフ。

【図26】[0030]いくつかの実施形態による直接予測モードの一例を示す図。

【図27】[0031]いくつかの実施形態による間接予測モードシステムの一例を示す図。

【図28】[0032]いくつかの実施形態によるプロキシ符号化結果およびターゲット符号化結果の一例を示す図。

【図29】[0033]いくつかの実施形態による、直接品質値および間接品質値を使用する一例を示す図。

【図30A】[0034]いくつかの実施形態による単一の解像度についてのレート歪み曲線のグラフ。

【図30B】[0035]いくつかの実施形態によるＲＤマップを示すグラフ。

【図31】[0036]一実施形態による１つまたは複数の通信ネットワークを介して複数のクライアントデバイスと通信するビデオストリーミングシステムを示す図。

【図32】[0037]ビデオコンテンツおよび広告を見るための装置の概略図。

【発明を実施するための形態】

【0004】

[0038]本明細書では、ビデオ配信システムについての技法が説明される。以下の説明では、説明のために、いくつかの実施形態の徹底的な理解を与えるために、多数の例および具体的な詳細が記載される。特許請求の範囲によって定められるいくつかの実施形態は、これらの例における特徴の一部または全部を、単独で、または以下で説明される他の特徴と組み合わせて含み得、本明細書で説明される特徴および概念の修正形態および均等物をさらに含み得る。

【0005】

[0039]システムは、ビデオを符号化するために使用されるビットレートのリストを適応的に生成することができる。ビットレートのリストは、候補平均ビットレート（ＣＡＢ）と呼ばれ得る。符号器は、候補平均ビットレートのリスト内のそれぞれのビットレートを使用してビデオのセグメントをトランスコードする。いくつかの実施形態では、システムは、ビデオの異なるチャンクについてなど、ビデオの異なる部分について候補平均ビットレートのリストを動的に選択することができる。チャンクは、符号器が同じ設定を用いて符号化する独立した符号化単位であり得る。ビデオは、１つまたは複数のチャンクを含むことができ、各チャンクは、複数のセグメントを含むことができる。いくつかの実施形態では、候補平均ビットレートのリストはチャンクレベルで設定され得る。候補平均ビットレートのリストは、チャンクレベルで設定されていると説明されるが、候補平均ビットレートのリストは、ビデオの異なる部分に対して設定され得る。

【0006】

[0040]符号器は、複数の候補セグメントを生成するために、候補平均ビットレートのリスト内のビットレートを使用して、ビデオのセグメントを符号化することができる。セグメント品質駆動型適応（ＳＱＡ）プロセスは、プロファイルラダーにおけるプロファイルに使用するために、候補セグメントからセグメントを選択することができる。プロセスのターゲットは、同様の品質を維持しつつビデオに部分の記憶または配信フットプリントを最適化する（例えば、最小化する）ことである。

【0007】

[0041]各ビデオは、異なる特性を有し得る。同様に、同じビデオ内の異なる部分も、異なる特性を有し得る。ビデオのすべての部分についてまたは複数のビデオについて候補平均ビットレートの静的リストを使用することは、最適な結果を与えない場合がある。例えば、候補平均ビットレートの静的リストは、必要とされるよりも多くのビットレートを有する単純なビデオコンテンツを有するビデオを符号化し得る。また、複雑なビデオコンテンツを有するビデオは、不十分なビットレートに起因して、低品質で符号化され得る。さらに、候補平均ビットレートの静的リストは、符号化の観点から不規則な品質ギャップを有するセグメントを生成し得る。例えば、隣接するプロファイルは、互いに冗長である同様のビデオ品質を有し得る、または許容できない大きい品質ギャップを有し得る。隣接するプロファイルについて同様のビデオ品質を有することは、不必要である場合があり、視聴品質において多くの利点を与えないことがある。例えば、候補平均ビットレートのリスト内の２つのビットレートが、同様の品質を有する符号化セグメントもたらす場合、それらの２つのビットレートを用いてセグメントをトランスコードすることは、冗長であり得、リソースを浪費し得る。また、大きな品質ギャップを有することは、再生が１つのプロファイルから別のプロファイルに切り替わるときに品質が急激に変化し得るので、再生中に悪い視聴体験をもたらし得る。

【0008】

[0042]上記の欠点を克服するために、事前分析最適化プロセスは、ビデオについての候補平均ビットレートのリスト内のビットレートを動的に選択することができる。候補平均ビットレートのリストを選択するために、事前分析最適化プロセスは、ビデオの一部分を分析し、その部分についての候補平均ビットレートの最適化されたリストを出力することができる。例えば、事前分析最適化プロセスは、各部分の特性を分析し、各部分についての候補平均ビットレートのリストを出力することができる。いくつかの実施形態では、事前分析最適化プロセスは、その部分についての品質対ビットレートを記述するレート歪み曲線など、その部分の特性を予測することができる。事前分析最適化プロセスは、各部分のビットレートの最適なリストを決定するために、それぞれのレート歪み曲線を使用する。

【0009】

[0043]最適化プロセスは、多くの利点を与える。例えば、このプロセスは、プロファイルラダー内のプロファイルについてのセグメントを選択するときに選択すべきトランスコードされたセグメントの最適な選択を与える。候補平均ビットレートのリストが、ビデオ全体について静的な値で設定され、および／または複数の異なるビデオについて同じである場合、準最適なトランスコーディングが生じ得る。異なるビデオは、および同じビデオの異なる部分も、多様な特性を有することができる。したがって、候補平均ビットレートの静的リストは、いくつかのビデオまたはビデオの部分について準最適であり得る。セグメント品質駆動型適応プロセスは、プロファイルラダーについてのプロファイルを形成するために選択すべき符号化セグメントのより良い選択を有し得るので、ビデオの部分の特性に基づく候補平均ビットレートの動的リストの使用は、より高品質のビデオおよび視聴体験をもたらし得る。

【0010】

[0044]システム
[0045]図１は、いくつかの実施形態による、候補平均ビットレートのリストを動的に選択するためのシステム１００を示す。システム１００は、コンテンツ配信ネットワーク１０２と、クライアント１０４と、ビデオ配信システム１０６とを含む。ソースファイルは、ビデオ、音声、または他のタイプのコンテンツ情報などの異なるタイプのコンテンツを含み得る。ビデオは、説明のために使用され得るが、他のタイプのコンテンツも理解され得る。いくつかの実施形態では、ソースファイルは、以下で説明する別のフォーマットへの符号化を必要とするフォーマットで受信され得る。例えば、ソースファイルは、圧縮されたビデオを含むメザニンファイルであってもよい。メザニンファイルは、ビデオの異なるプロファイルなどの他のファイルを生成するために符号化され得る。

【0011】

[0046]コンテンツプロバイダは、エンティティがメディアコンテンツを要求し、受信することを可能にするコンテンツ配信サービスを提供するためにビデオ配信システム１０６を動作させることができる。コンテンツプロバイダは、クライアント１０４へのメディアコンテンツの配給を調整するために、ビデオ配信システム１０６を使用することができる。単一のクライアント１０４が説明されているが、複数のクライアント１０４がサービスを使用していてもよい。メディアコンテンツは、ビデオのライブラリからのオンデマンドビデオ、およびライブビデオなどの異なるタイプのコンテンツであってもよい。いくつかの実施形態では、ライブビデオは、線形スケジュールに基づいてビデオが利用可能である場所であり得る。ビデオは、オンデマンドで提供されることも可能である。オンデマンドビデオは、いつでも要求されることが可能であり、線形スケジュールで見ることに限定されないコンテンツであり得る。ビデオは、映画、ショー、広告などのプログラムであり得る。

【0012】

[0047]クライアント１０４は、スマートフォン、リビングルームデバイス、テレビ、セットトップボックス、タブレットデバイス等などの異なるコンピューティングデバイスを含むことができる。クライアント１０４は、ビデオなどのコンテンツを再生することができるメディアプレーヤ１１２を含む。いくつかの実施形態では、メディアプレーヤ１１２は、ビデオのセグメントを受信し、これらのセグメントを再生することができる。クライアント１０４は、コンテンツ配信ネットワーク１０２のうちの１つにセグメントの要求を送信し、次いで、メディアプレーヤ１１２における再生のために要求されたセグメントを受信し得る。セグメントは、ビデオの６秒など、ビデオの一部分であり得る。

【0013】

[0048]ビデオは、複数のプロファイルを含むプロファイルラダーに符号化され得る。各プロファイルは、異なるレベルのビットレートおよび／または品質であり得る異なる構成に対応し得るが、コーデックタイプ、コンピューティングリソースタイプ（例えば、コンピュータ処理ユニット）等などの他の特性を含むこともできる。各ビデオは、異なる構成を有する関連付けられたプロファイルを有し得る。プロファイルは、異なるレベルで分類されてもよく、各レベルは、異なる構成に関連付けられてもよい。例えば、レベルは、ビットレート、解像度、コーデックなどの組合せであってもよく、例えば、各レベルは、４００キロバイト毎秒（ｋｂｐｓ）、６５０ｋｂｐｓ、１０００ｋｂｐｓ、１５００ｋｂｐｓ、．．．１２０００ｋｂｐｓなどの異なるビットレートに関連付けられ得る。また、各レベルは、品質特性（例えば、解像度）などの別の特性に関連付けられてもよい。プロファイルレベルは、より高いビットレートまたは品質を有するプロファイルが、より低いビットレートまたは品質を有するプロファイルよりも高く格付けされ得るなど、より高いまたはより低いと呼ばれ得る。符号器は、ソースビデオを符号化するために特性を使用し得る。例えば、符号器は、１５００ｋｂｐｓのターゲットビットレートでソースビデオをエンコードし得る。

【0014】

[0049]コンテンツ配信ネットワーク１０２は、ビデオをクライアント１０４に配信することができるサーバを含む。コンテンツ配信ネットワーク１０２は、クライアント１０４からビデオのセグメントの要求を受信し、ビデオのセグメントをクライアント１０４に配信する。クライアント１０４は、現在の再生状態に基づいて、プロファイルレベルのうちの１つからビデオのセグメントを要求し得る。再生状態は、利用可能な帯域幅、バッファ長等などのビデオの再生に基づいて経験される任意の状態であり得る。例えば、クライアント１０４は、現在の利用可能な帯域幅、バッファ長、または他の再生状態に基づいてビデオについてのプロファイルを選択するために、適応ビットレートアルゴリズムを使用してもよい。クライアント１０４は、現在の再生状態を継続的に評価し、ビデオのセグメントの再生中にプロファイルの間で切り替えることができる。例えば、再生中に、メディアプレーヤ１１２は、ビデオアセットの異なるプロファイルを要求することができる。例えば、低帯域幅再生状態が経験されている場合、メディアプレーヤ１１２は、ビデオの今度のセグメントについてのより低いビットレートに関連するより低いプロファイルを要求することができる。しかしながら、より高い利用可能な帯域幅の再生状態が経験されている場合、メディアプレーヤ１１２は、ビデオの今度のセグメントについてのより高い帯域幅に関連するより高いレベルのプロファイルを要求してもよい。

【0015】

[0050]セグメント品質駆動型適応処理システム（ＳＱＡシステム）１０８は、候補平均ビットレートのリストを使用してセグメントを符号化することができる。次いで、ＳＱＡシステム１０８は、最適化プロセスを使用してプロファイルごとにセグメントを選択する。例えば、ＳＱＡシステム１０８は、同様の品質レベルを維持しつつ、プロファイルラダーのプロファイルごとに最適なビットレートを有するセグメントを適応的に選択することができる。ＳＱＡシステム１０８は、コンテンツを記憶または配信するために必要とされるビット数を最小化しつつ、システムがターゲットビットレートと同様の品質またはターゲットビットレートに一致する品質を維持することを可能にする。

【0016】

[0051]事前分析最適化プロセス１１０は、ビデオの部分についての候補平均ビットレートのリストを動的に生成することができる。いくつかの実施形態では、事前分析最適化プロセス１１０は、レート歪み曲線などのビデオの一部分のそれぞれの特性を予測することができる。次いで、事前分析最適化プロセス１１０は、ビデオの部分のそれぞれの特性を分析することに基づいて、その部分についての候補平均ビットレートを選択する。

【0017】

[0052]以下は、まず、セグメント品質駆動型適応処理プロセスを説明し、次いで、候補平均ビットレートのリストの動的選択をより詳細に説明する。

【0018】

[0053]セグメント品質駆動型適応プロセス
[0054]上述のように、最適化プロセス１１０は、ビデオの部分についての候補平均ビットレートのリストを動的に選択することができる。ビデオの部分は、異なるサイズであってもよい。図２は、いくつかの実施形態によるビデオの部分の一例を示す。ビデオ２００は、セグメントレベルおよびチャンクレベルで異なる部分に分割され得る。いくつかの実施形態では、２０２において、ビデオ２００は、チャンクレベル部分に分割され得る。例えば、チャンク＿０、チャンク＿１、・・・、チャンク＿ｍの複数のチャンクが、ビデオ２００に含まれてもよい。各それぞれのチャンクは、セグメントと呼ばれ得るより小さな部分に分割され得る。例えば、２０４において、チャンク＿０は、セグメント＿０、セグメント＿１、・・・、セグメント＿ｎのセグメントに分割される。同様に、図示されていないが、チャンク＿１は、セグメント＿０、セグメント＿１、・・・、セグメント＿ｎのそれ自体のそれぞれのセグメントに分割され得る。セグメントは、チャンクよりも長さが短くてもよい。例えば、チャンクは、２分のビデオであってもよく、セグメントは５秒のビデオであってもよい。

【0019】

[0055]セグメント品質駆動型適応プロセスでは、ＳＱＡシステム１０８は、候補平均ビットレートのリストに基づいて、各それぞれのセグメントの複数の符号化を生成するために、ビデオ２００の各セグメントを処理することができる。説明のために、最適化プロセス１１０は、チャンクごとに候補平均ビットレートのリストを選択するが、候補平均ビットレートのリストは、セグメントごと、複数のチャンクについて等など、異なる部分サイズについて選択されてもよい。候補平均ビットレートの各それぞれのリストに含まれるビットレートは、候補平均ビットレートのリストを使用するビデオのそれぞれの部分（例えば、チャンクおよび／またはセグメント）に関連する特性に基づいて最適化され得る。異なるチャンクについて異なる特性が与えられると、候補平均ビットレートのそれぞれのリストは異なり得る。しかしながら、候補平均ビットレートのそれぞれのリスト内の複数のチャンクについてのビットレートが同じであることが可能であり得る。

【0020】

[0056]図３Ａは、いくつかの実施形態による候補平均ビットレートのリストの生成の例を示す。２０２において、チャンク＿０、チャンク＿１、チャンク＿２、・・・、チャンク＿ｎのチャンクが示されている。３０２において、最適化システム１１０は、各それぞれのチャンクの特性に基づいて、チャンクごとに選択された候補平均ビットレートのリストを有する。例えば、チャンク＿０について、候補平均ビットレートのリスト＃０は、チャンク＿０についての特性に基づく。また、候補平均ビットレートのリスト＃１は、チャンク＿１についての特性に基づくなどである。いくつかの例では、チャンク＿０について、候補平均ビットレートのリスト＃０は、８５００、７７５０、７０００、６２５０、５５００、４７５０、４０００、３２５０キロバイト毎秒（Ｋｂｐｓ）のビットレートを含み得る。チャンク＿１について、候補平均ビットレートのリスト＃１は、７０００、６２５０、４７５０、４０００、３２５０、２０００、１２５０Ｋｂｐｓのビットレートを含み得る。

【0021】

[0057]候補平均ビットレートのリストは、それぞれのセグメントを符号化するために符号器によって使用されるビットレートを含み得る。従来から、候補平均ビットレートは、同じビットレートを静的に含んできた可能性がある。時には、２つのタイプのビットレートがすべてのチャンクについて使用された。第１のタイプはターゲット平均ビットレートであり得、第２のタイプは中間平均ビットレートであり得る。ターゲット平均ビットレートは、適応ビットレート符号化のためのプロファイルラダーにおけるプロファイルに関連付けられた基本ビットレートであり得る。中間平均ビットレートは、ターゲット平均ビットレートへの補足であってもよい。例えば、ターゲット平均ビットレートの間の追加のビットレートが追加されてもよい。中間平均ビットレートの使用は、品質など、ターゲット平均ビットレートからの符号化されたセグメントとは異なる特性を有し得る追加の符号化セグメントを符号化するための追加のビットレートを与えることができる。場合によっては、最適化プロセス１１０は、候補平均ビットレートのリスト内にターゲット平均ビットレートおよび／または中間平均ビットレートからのビットレートを含め得る。例えば、最適化プロセス１１０は、候補平均ビットレートのリスト内にターゲット平均ビットレートを含み得るが、他のビットレートを動的に選択してもよい。他の例では、最適化プロセスは、チャンクの特性のみに基づいて、候補平均ビットレートのリスト内のビットレートを動的に選択することができる。

【0022】

[0058]上述のように、符号器は、チャンクについての符号化されたセグメントを生成する。図３Ｂは、いくつかの実施形態による符号化されたセグメントの生成の一例を示す。２０４において、チャンク＿０のチャンクについてのセグメントが、セグメント＿０、セグメント＿１、セグメント＿２、・・・、セグメント＿ｎで示されている。３０４において、チャンク＿０についての候補平均ビットレートのリスト（ＣＡＢのリスト）が使用される。いくつかの実施形態では、チャンク＿０についての候補平均ビットレートの同じリストが、チャンクのすべてのセグメントについて使用される。しかしながら、候補平均ビットレートの複数の異なるリストが、チャンクの異なるセグメントについて使用され得る。次いで、符号器は、候補平均ビットレートのリストを使用してチャンク＿０のセグメントを符号化する。

【0023】

[0059]３０６において、各セグメントについての符号化されたセグメントがリストされる。それぞれのセグメントについて、符号器は、候補平均ビットレートのリスト内の平均ビットレートを使用してセグメントを符号化する。符号器は、セグメントを符号化するときにそれぞれの平均ビットレートをターゲットにすることができる。これは、ＥＮＣ＿Ｓ０＿ＣＡＢ＿０、ＥＮＣ＿Ｓ０＿ＣＡＢ＿１、ＥＮＣ＿Ｓ０＿ＣＡＢ＿２、・・・、ＥＮＣ＿Ｓ０＿ＣＡＢ＿ｎのセグメント＿０についての符号化されたセグメントなど、チャンクのセグメントごとに符号化されたセグメントのセットをもたらす。表記において、ＥＮＣ＿Ｓ０は、セグメント＿０の符号化されたセグメントを表し、ＣＡＢ＿０、ＣＡＢ＿１、ＣＡＢ＿２などは、候補平均ビットレートを表す。例えば、ＣＡＢ＿０は８５００Ｋｂｐｓであってもよく、ＣＡＢ＿１は７７５０Ｋｂｐｓであってもよく、ＣＡＢ＿２は７０００Ｋｂｐｓであってもよい。各符号化セグメントは、１０８０ｐなどの同じ品質レベルで符号化され得る。プロセスは、候補平均ビットレートのリストを使用して別の品質レベルについて繰り返されてもよい。

【0024】

[0060]セグメントごとに、最適化プロセス１１０は、符号化されたセグメントを複数のプールにクラスタリングする。各プールは、１つのプロファイルに対応し得る。図４は、いくつかの実施形態による符号化されたセグメントを複数のプールにクラスタリングする一例を示す。４０２において、複数の符号化セグメントが、候補平均ビットレートについて示されている。各セグメントは、品質指標のための関連する値を有し得る。例えば、符号化されたセグメントＥＮＣ＿Ｓ０＿ＣＡＢ＿０は、ｑｕａｌｉｔｙ＿Ｓ０＿ｃ０の品質を有し得、符号化されたセグメントＥＮＣ＿Ｓ０＿ＣＡＢ＿１は、ｑｕａｌｉｔｙ＿Ｓ０＿ｃ１の品質を有し得るなどである。表記において、ｑｕａｌｉｔｙ＿Ｓ０は、セグメント＿０の符号化されたセグメントを表し、ｃ０、ｃ１、ｃ２などは、この符号化されたセグメントについての品質を表す。

【0025】

[0061]符号化されたセグメントをプール４０１－１、４０４－２、４０４－ｐに含めるために、異なる方法が使用され得る。例えば、各プールは、プロファイルを有してもよく、またはそれに関連付けられてもよい。それぞれのプロファイルは、関連付けられたプロファイルにセグメントを符号化するために使用され得る最大ビットレートであり得るターゲットビットレートに関連付けられ得る。ＳＱＡシステム１０８は、プールについての関連付けられたプロファイルに使用され得る最高平均ビットレートから始まる符号化されたセグメントを含んでもよい。次いで、ＳＱＡシステム１０８は、最大ビットレートよりも小さい他のビットレートで他の符号化されたセグメントを追加してもよい。これは、それぞれのプールに含まれる異なる符号化されたセグメントをもたらし得る。例えば、プールＳ０＿Ｐｏｏｌ＿０は、セグメントＥＮＣ＿Ｓ０＿ＣＡＢ＿０、ＥＮＣ＿Ｓ０＿ＣＡＢ＿１、ＥＮＣ＿Ｓ０＿ＣＡＢ＿２などを含むことができる。また、プールＳ０＿Ｐｏｏｌ＿１は、符号化されたセグメントＥＮＣ＿Ｓ０＿ＣＡＢ＿２、ＥＮＣ＿Ｓ０＿ＣＡＢ＿３、ＥＮＣ＿Ｓ０＿ＣＡＢ＿４などを含み得る。したがって、プールＳ０＿Ｐｏｏｌ＿１は、プールＳ０＿Ｐｏｏｌ＿０内の最大ビットレートよりも小さいビットレートから始まる符号化されたセグメントを含むことができる。符号化されたセグメントが、８５００、７７５０、７０００、６２５０、５５００、４７５０、４０００、３２５０Ｋｂｐｓのビットレートで符号化される場合、プールＳ０＿ｐｏｏｌ＿０は、８５００、７７５０、７０００などの平均ビットレートの符号化セグメントで開始することができ、プールＳ０＿ｐｏｏｌ＿１は、７０００、６２５０、５５００などの平均ビットレートで符号化されたセグメントから開始することができる。いくつかの例では、プールについての例示的なビットレートは、ｐｏｏｌ＿０：８５００、７７００、７０００、６２５０、５５００、４７５０、ｐｏｏｌ＿１：７０００、６２５０、５５００、４７５０、４０００、およびｐｏｏｌ＿ｐ：５５００、４７５０、４０００、３２５０であり得る。

【0026】

[0062]各プールから、ＳＱＡシステム１０８は、選択プロセスを用いることに基づいて、１つの符号化されたセグメントを選択してよい。図５は、いくつかの実施形態による選択プロセスの一例を示す。以下のプロセスは、プールごとに実行され得る。４０４－１において、図４からのプールＳ０＿ｐｏｏｌ＿０が、そのそれぞれの符号化されたセグメントとともに示されている。ＳＱＡシステム１０８は、それぞれのプールごとに符号化されたセグメントを選択するために、１つまたは複数の規則を使用することができる。５０２において、ＳＱＡシステム１０８は、プールＳ０＿ｐｏｏｌ＿０についての符号化セグメントＥＮＣ＿Ｓ０＿ＣＡＢ＿１を選択する。いくつかの実施形態では、ＳＱＡシステム１０８は、基準を満たす品質値を有する最小ビットレートを有する符号化されたセグメントを選択しようと試みることができる。いくつかの例では、ＳＱＡシステム１０８は、最高ビットレートを有するセグメントなど、プール内の第１の符号化されたセグメントから開始することができる。次に、ＳＱＡシステム１０８は、次に高いビットレートを有する符号化セグメントなど、プール内の隣接する符号化セグメントを選択する。第１の符号化されたセグメントと第２の符号化されたセグメントが（例えば、閾値内の）同様の品質を有する場合、ＳＱＡシステム１０８は、最低ビットレートを有する符号化セグメントを選択する。ＳＱＡシステム１０８は、第２の符号化セグメントと第３の符号化セグメントのようなプール内の隣接する符号化セグメントとを使用して、比較を継続することができる。隣接する符号化セグメントが同様の品質を有しないとき、プロセスは終了することができる。最低ビットレートを有する符号化されたセグメントから開始するなど、他の方法も使用され得る。また、プロセスは、最高ビットレートを有するセグメントなど、別のセグメントの閾値内の品質を有する最低ビットレートを有するセグメントを選択してもよい。以下は、レート歪み曲線を使用したプロセスの一例を説明する。

【0027】

[0063]図６は、いくつかの実施形態によるプールのための符号化セグメントを選択するために使用され得るレート歪み曲線のグラフ６００の一例を示す。グラフ６００において、Ｙ軸は品質であり、Ｘ軸はビットレートである。曲線６０２は、品質とビットレートの間の関係を定義する。例えば、曲線は、セグメントまたはチャンクのレートおよび歪みをプロットし得るが、曲線は、品質およびビットレートの他の特性をプロットしてもよい。

【0028】

[0064]符号化セグメントは、符号化セグメントのそれぞれのレートおよび歪みに基づいて、曲線６０２上のＡ、Ｂ、Ｃ、Ｄ、Ｅ、Ｆとしてリストされ得る。６０４において、同様の品質を有する符号化されたセグメントの一例が示されている。この場合、符号化セグメントＣおよび符号化セグメントＤは、同様のビットレートおよび同様の品質を有する。例えば、符号化されたセグメントＣと符号化されたセグメントＤとの間の品質差は、閾値値ｍｉｎ＿ｇａｐ（例えば、等しいおよび／またはより小さい）を満たし得る。この場合、この符号化セグメントは、符号化セグメントＣと比較して低いビットレートを有するが、セグメントＤは、セグメントＣと比較して同様の品質を提供するので、品質差が最小であるので、ＳＱＡシステム１０８は、符号化セグメントＤを選択することができる。

【0029】

[0065]ＳＱＡシステム１０８は、品質が上限境界を超える符号化されたセグメントを潰すこともできる。例えば、６０６における上限境界は、符号化されたセグメントを、潰すべき候補として決定するために使用される境界であり得る。この場合、ＳＱＡシステム１０８は、１つのセグメント（例えば、セグメントＢ）のみを選択するように、または上限閾値を上回ると見出されたセグメントをより少なく選択する（例えば、４つのセグメントのうちの２つを選択する）ように、上限閾値を上回るセグメントのうちの１つまたは複数を選択することができる。他の例では、符号化されたセグメントＡおよびＢは除去され得る。また、ＳＱＡシステム１０８は、品質が下限境界を下回る符号化されたセグメントを除去してもよい。例えば、６０８において、下限閾値が示される。ＳＱＡシステム１０８は、たった１つのセグメント（例えば、セグメントＦ）を選択するように、または下限閾値を下回ると見出されたセグメントをより少なく選択するように、下限閾値を下回るセグメントのうちの１つまたは複数を選択してもよい。他の例では、符号化されたセグメントＥおよびＦは除去され得る。上限閾値および下限閾値は、所望のビットレートまたは品質を超える、または所望のビットレートまたは品質よりも低いプロファイルについてのセグメントを制限するために使用され得る。上限が使用される理由の１つは、セグメントを符号化するために使用されるビットレートを制限するためであり、下限が使用される理由の１つは、使用されるビットレートが低すぎることを制限するためである。符号化されたセグメントを除去するために符号化されたセグメントを処理した後、ＳＱＡシステム１０８は、プロファイルについてのセグメントを選択してもよい。例えば、ＳＱＡシステム１０８は、最高品質セグメントとのギャップ以内のように閾値を満たす品質レベルを有する最低ビットレートを有する符号化されたセグメントを選択してもよい。この場合、ＳＱＡシステム１０８は、符号化されたセグメントＤを選択してもよい。

【0030】

[0066]上記の規則はセグメントを選択するために使用され得るが、他のプロセスが使用されてもよい。例えば、符号化されたセグメントの選択は、他のプロファイルについてどの符号化されたセグメントが選択されたかに基づいてもよい。いくつかの例では、選択されるセグメントは、プロファイルが他のプロファイルからのセグメントを再使用し得る符号化されたセグメントの記憶を減少させることに基づき得る。したがって、ＳＱＡシステム１０８は、品質を最適化するとともに、下限とシーリングとの間に見出される符号化されたセグメントに使用されるビットレートを最小化することができる。

【0031】

[0067]図７は、いくつかの実施形態による、各セグメントのプロファイルの選択された符号化されたセグメントの例を示す。７０２、７０４、７０６、および７０８において、符号化されたセグメントが、それぞれ、プロファイル＿０、プロファイル＿１、プロファイル＿２、およびプロファイル＿Ｐについて示されている。プロファイル内で、ＳＱＡシステム１０８は、異なるセグメントについて異なる候補平均ビットレートを有する異なる符号化されたセグメントを選択することができる。例えば、プロファイル＿０について、セグメント＿０は候補平均ビットレートＣＡＢ＿１を使用して符号化され、セグメント＿１は候補平均ビットレートＣＡＢ＿０を使用して符号化され、セグメント＿２は候補平均ビットレートＣＡＢ＿０を使用して符号化されたなどであった。いくつかの例では、プロファイル＿０において、セグメント＿０はビットレート７７５０Ｋｂｐｓを使用して符号化され、セグメント＿１はビットレート８５００を使用して符号化され、セグメント＿２はビットレート８５００Ｋｂｐｓを使用して符号化された。プロファイル＿１については、セグメント＿０はＣＡＢ＿４を使用して符号化され、セグメント＿１はＣＡＢ＿２を使用して符号化され、セグメント＿２はＣＡＢ＿３を使用して符号化された。例えば、プロファイル１では、セグメント＿０はビットレート５５００Ｋｂｐｓを使用して符号化され、セグメント＿１はビットレート７０００Ｋｂｐｓを使用して符号化され、セグメント＿２はビットレート６２５０Ｋｂｐｓを使用して符号化された。

【0032】

[0068]次に、以下は、候補平均ビットレートのリストを動的に生成するための最適化プロセスについて説明する。

【0033】

[0069]最適化プロセス
[0070]上述のように、ビデオコンテンツは、異なるビデオ内のコンテンツが異なる特性を有し得るとともに、同じビデオ内のコンテンツも異なる特性を有し得るなど、多様な特性を有し得る。例えば、漫画やニュースなどの一部のコンテンツは、符号化するのが簡単であり得る。しかしながら、ライブアクション映画またはスポーツなどのいくつかのコンテンツは、符号化するのが難しい場合がある。符号化の特性は、異なってもよい。以下は、コンテンツについての異なる特性を説明する。

【0034】

[0071]図８は、いくつかの実施形態によるビデオコンテンツのための異なるレート歪み曲線の一例を示す。レート歪み曲線は、品質とビットレートとの間の関連性を示すために使用されるが、他の指標が、ビデオコンテンツについての品質とビットレートとの間の関連性を示すために使用されてもよい。異なるレート歪み曲線は、ビデオの異なるチャンクについて示され得るが、レート歪み曲線は、セグメント、チャンク、複数のチャンク、または異なるビデオなど、ビデオの異なる部分について異なっていてもよい。

【0035】

[0072]チャンク＿Ａ、チャンク＿Ｂ、およびチャンク＿Ｃの３つのチャンクが、それぞれ、チャンクについてのレート歪み曲線のグラフ８０２、８０４、および８０６とともに示されている。グラフ８０２では、品質は、より低いビットレートでは急勾配を伴って変化するが、より高いビットレートでは、品質はあまり変化しない。グラフ８０４では、品質は、ビットレートが一定の関連性で増加するにつれて変化する。グラフ８０６では、より低いビットレートでの品質は、最小限にしか変化しない場合があり、一方、品質は、より高いビットレートで急勾配で増加する。

【0036】

[0073]異なるコンテンツが異なるレート歪み曲線を生成することに加えて、異なる符号化構成もまた、異なる符号化の結果を生成し得る。異なる符号化構成は、異なる符号器（例えば、ｘ２６４、ｘ２６５など）、または異なる符号化パラメータ（レート歪み最適化（ＲＤＯ）レベル、Ｂフレーム、参照数など）を使用することを含み得る。図９は、いくつかの実施形態による異なる符号化構成を使用する異なる特性を示す。同じセグメントまたはチャンクについて、９０２における第１の符号化構成は、９０４に示された第２の符号化構成と比較して異なる特性をもたらす。符号化構成Ａは、上記のチャンク＿Ａと同様のレート歪み曲線をもたらし、符号化構成Ｂは、これらのレート歪み曲線が同じコンテンツについてのものであっても、上記のチャンク＿Ｂと同様のレート歪み曲線をもたらす。

【0037】

[0074]上記のレート歪み曲線が異なり得ることを考慮すると、候補平均ビットレートの静的リストを使用することは、最適でない場合がある。例えば、異なるレート歪み曲線について候補平均ビットレートの同じリストを使用することは、最適な結果を与えない場合がある。図１０は、いくつかの実施形態による異なるレート歪み曲線について静的候補平均ビットレートを使用する一例を示す。グラフ８０２、８０４、および８０６は、図８に示された異なるチャンクについての異なるレート歪み曲線を示す。各グラフにおける点線は、候補平均ビットレートのリストの異なるビットレートを示す。候補平均ビットレートの固定されたリストを使用するときに、いくつかの問題が生じ得る。例えば、グラフ８０２では、１００８において、２つの最高候補平均ビットレートは、１０１０における第３の候補平均ビットレートと同様の品質を有するので、冗長であり得る。すなわち、同様の品質を有する符号化されたセグメントを与えるために、１０１０に列挙されたビットレートなどで、たった１つのビットレートが符号化される必要があり得る。

【0038】

[0075]グラフ８０４では、１０１２において、２つの候補平均ビットレートは、これらの２つの符号化されたセグメントが１０１４に示された次に低いビットレートを有する符号化されたセグメントと比較して同様の品質を有するので、冗長であり得る。上記と同様に、同様の品質を有する符号化されたセグメントを与えるために、１０１４における最低ビットレートなど、たった１つのビットレートが符号化される必要があり得る。

【0039】

[0076]グラフ８０６では、１０１６において、最低の３つの候補平均ビットレートが、同様の品質を有する符号化されたセグメントを生成し得る。また、１０１８において、符号化されたセグメント間で品質の差が大きすぎることがあるので、候補平均ビットレートは、遠く離れすぎている場合がある。すなわち、候補平均ビットレート間の品質の差を最小化するために、より少ない品質差を有するより多くの候補平均ビットレートを有することがより望ましいことがある。

【0040】

[0077]図１１は、いくつかの実施形態による最適化された候補平均ビットレートリストを示す。グラフ８０２において、ＳＱＡシステム１０８は、符号化されたセグメントにおいて見出される品質を最適化するために、候補平均ビットレートを動的に選択することができる。例えば、１１０２において、ＳＱＡシステム１０８は、曲線が急であるビットレートにおいて、候補平均ビットレートの数を増加させることができる。また、１１０３において、ＳＱＡシステム１０８は、曲線が品質をあまり変化させない候補平均ビットレートの数を減少させることができる。

【0041】

[0078]グラフ８０４において、１１０４において、ＳＱＡシステム１０８は、品質が冗長であり得る最低ビットレートから候補平均ビットレートを除去してもよい。また、１１０６において、ＳＱＡシステム１０８は、より高いビットレートで変化する品質を獲得するために、追加のビットレートを追加してもよい。

【0042】

[0079]グラフ８０６において、１１０８で、ＳＱＡシステム１０８は、曲線の下端でビットレートを除去してよい。また、１１１０において、ＳＱＡシステム１０８は、より均等な増分で異なる品質レベルを捕獲するために、候補平均ビットレートをより均等に区切ることができる。

【0043】

[0080]事前分析最適化プロセス設計
[0081]図１２は、いくつかの実施形態によるＳＱＡシステム１０８および事前分析最適化プロセス１１０のより詳細な例を示す。符号化されるチャンクが受信される。また、チャンクを符号化するための設定を定義する符号化構成が受信され得る。符号化構成は、符号器タイプ、品質レベルなどを含み得る。

【0044】

[0082]事前分析最適化プロセス１１０は、チャンクおよび符号化構成を受信し、候補平均ビットレートの最適化されたリストを出力することができる。ＲＤ予測システム１２０２は、チャンク内のセグメントおよび／またはチャンクについてのレート歪み曲線を予測することができる。セグメントまたはチャンクについてのレート歪み曲線を予測することが説明され得るが、レート歪み曲線は、複数のチャンクおよび／または複数のセグメントについてなど、ビデオの異なる部分について生成され得る。以下でより詳細に説明されるように、ＲＤ予測システム１２０２は、セグメントのレート歪み曲線の予測を生成するために機械学習論理を使用することができる。

【0045】

[0083]予測されたレート歪み曲線は、ＣＡＢリスト最適化システム１２０４に出力される。ＣＡＢリスト最適化システム１２０４は、チャンク内のセグメントについての予測されたレート歪み曲線などに基づいて、チャンクについての候補平均ビットレートのリストを最適化することができる。候補平均ビットレートの最適化されたリストは、それぞれのチャンクの特性に基づいてもよく、異なる特性を有するコンテンツを有するチャンクについて異なってもよい。このプロセスは、以下により詳細に説明される。

【0046】

[0084]ＣＡＢリスト最適化システム１２０４は、候補平均ビットレートの最適化されたリストをＳＱＡシステム１０８に出力する。ＳＱＡシステム１０８は、符号化構成、チャンク、および候補平均ビットレートの最適化されたリストを受信する符号化システム１２０６を含む。次いで、符号化システム１２０６は、チャンクの各セグメントを符号化するために、リスト内の各候補平均ビットレートを使用する。候補平均ビットレートのリストを使用して各セグメントを符号化した後、選択システム１２０８は、上述したような選択プロセスを使用して、プロファイルラダーにおける各プロファイルについて符号化されたセグメントを選択する。選択システム１２０８は、プロファイルラダーにおけるプロファイルについて選択された符号化されたセグメントを出力する。

【0047】

[0085]以下は、セグメントの特性の予測、次いで候補平均ビットレートのリストを選択するための最適化を説明する。

【0048】

[0086]ＲＤ予測システム
[0087]図１３は、いくつかの実施形態によるＲＤ予測システム１２０２のより詳細な一例を示す。特徴抽出システム１３０２は、ビデオのチャンクを受信する。次いで、特徴抽出システム１３０２は、ビデオトランスコーディングに関連した情報を伝達し得る特徴についての値を抽出し得る。特徴のいくつかの例は、ビデオコンテンツ、符号化設定などについてのものであり得る。抽出される特徴は、チャンクのセグメントの特性のより良い予測を与えることができる。特徴についての値は、予測ネットワーク１３０４に出力される。

【0049】

[0088]予測ネットワーク１３０４は、予測されたレート歪み曲線などのチャンクのセグメントについての特性を生成するために、トレーニングされたモデルを使用することができる。予測ネットワーク１３０４は、サポートベクターマシン（ＳＶＭ）回帰、畳み込みニューラルネットワーク（ＣＮＮ）、ブースティング等などの異なる機械学習アルゴリズムを使用してもよい。訓練されたモデルは、特定の機械学習アルゴリズムに基づいてトレーニングされ得る。

【0050】

[0089]予測ネットワーク１３０４は、セグメント位置、符号化構成、およびターゲットビットレートなどの他の入力に加えて特徴についての値を受信することができる。セグメント位置は、レート歪み曲線を生成するセグメント位置（例えば、ビデオ内のそのセグメント）であり得、符号化構成は、セグメントを符号化するために使用される構成を含み得、ターゲットビットレートは、セグメントについての出力ビットレート範囲を含み得る。予測ネットワーク１３０４は、特徴に基づいて、出力ビットレート範囲間のセグメントについてのレート歪み曲線を出力することができる。

【0051】

[0090]図１４は、いくつかの実施形態による予測ネットワーク１３０４の出力を示す。２０４において、チャンクについてのセグメントは、セグメント＿０、セグメント＿１、セグメント＿２、・・・、セグメント＿ｎを含む。レート歪み曲線は、ビデオの各チャンク内のセグメントごとに生成され得る。例えば、１４０２において、レート歪み曲線が、それぞれのセグメントごとに出力される。セグメント＿０のレート歪み曲線、セグメント＿１のレート歪み曲線などが示されている。各レート歪み曲線は、それぞれのセグメントについての特性に基づく。チャンクについての候補平均ビットレートのリストは、レート歪み曲線に基づいて生成され得る。また、チャンクレベルレート歪み曲線が出力されてもよい。

【0052】

[0091]候補平均ビットレート最適化のリスト
[0092]図１５は、いくつかの実施形態による候補平均ビットレートのリストを選択するための最適化プロセスを実行するための方法の簡略化されたフローチャート１５００を示す。１５０２において、ＣＡＢリスト最適化システム１２０４は、候補平均ビットレートのリストについての境界を決定する。例えば、境界は、候補平均ビットレートのリストに使用され得る最大ビットレートおよび最小ビットレートであり得る。異なる方法が、境界を決定するために使用されてもよく、図１６により詳細に説明される。

【0053】

[0093]１５０４において、ＣＡＢリスト最適化システム１２０４は、最適なビットレート割り振りを有する潜在的な候補平均ビットレートのリストを生成する。いくつかの実施形態では、潜在的な候補平均ビットレートの１つのリストは、５０２で決定された最大ビットレートおよび最小ビットレートに基づいてチャンクについて生成される。潜在的な候補平均ビットレートのリストは、異なる方法を使用して生成され得る。１つの方法は、最小ビットレートと最大ビットレートとの間に入る予め定められたリストを使用することであり得る。例えば、予め定められたリストは、ターゲット平均ビットレートおよび中間平均ビットレートからのビットレートを含むことができる。例えば、最小と最大の範囲内の予め定められたリストからのビットレートが使用されてもよい。別の方法は、潜在的な候補平均ビットレートの総数を決定し、最小ビットレートと最大ビットレートとの間のビットレート範囲を間隔に分割することができる。以下のような異なる例が、使用されてもよい。

【0054】

【数1】

【0055】

【数2】

【0056】

【数3】

【0057】

【数4】

【0058】

ただし、ｉｎｔｅｒｖａｌ＿ｉはｉの間隔値であり、ｉｎｔｅｒｖａｌ＿（ｉ＋１）は間隔値＋１であり、ｉｎｔｅｒｖａｌ＿（ｉ＋２）は間隔値＋２であり、ｄｅｌｔａは予め定められた値である。

【0059】

[0094]間隔の総数は、１０などの数に設定され得る。ｉｎｔｅｒｖａｌ＿ｉの間隔は、範囲を総数に分割することによって上記の方法に基づいて設定され得る。次いで、ＣＡＢリスト最適化システム１２０４は、最小ビットレートと最大ビットレートとの間のビットレートの範囲をビットレートのリストに分割するために間隔値に基づいてビットレートを選択する。例えば、１５００の間隔および５のビットレートの総数を有する２０００の最小ビットレートおよび１０，０００の最大ビットレートは、等分割を使用するとき、１０，０００、７５００、５０００、３５００、および２０００のビットレートのリストをもたらし得る。

【0060】

[0095]１５０６において、ＣＡＢリスト最適化システム１２０４は、候補平均ビットレートの最適化されたリストを生成するために、最適な品質割り振りを用いて潜在的な候補平均ビットレートのリストを改良する。品質割り振りは、セグメントごとに品質を検査し、品質が１つまたは複数の規則を満たすかどうかを決定することができる。例えば、同様の品質を有する候補平均ビットレートなどの冗長な候補平均ビットレートが除去され得る。また、隣接する候補平均ビットレートが、大きすぎる差など、閾値を上回る品質ギャップを有するときなど、必要に応じて、追加の候補平均ビットレートが追加され得る。プロセスは、図１７、図１８、および図１９により詳細に説明される。

【0061】

[0096]図１５の１５０２に説明されるように、ＣＡＢリスト最適化システム１２０４は、候補平均ビットレートのリストについての境界を決定する。図１６は、いくつかの実施形態による候補平均ビットレートのリストの境界を決定する一例を示す。以下のプロセスが説明されるが、他のプロセスも理解され得る。例えば、設定は、最小ビットレートおよび最大ビットレートを決定するために使用され得る。この例では、ＣＡＢリスト最適化システム１２０４は、チャンク内のそれぞれのセグメントについてのレート歪み曲線についての最小ビットレートと最大ビットレートとを分析し、最小ビットレートおよび最大ビットレートがチャンクレベルにおいてあるべきことを決定することができる。

【0062】

[0097]１６０２において、それぞれのセグメントについてのレート歪み曲線が受信され、分析される。次いで、ＣＡＢリスト最適化システム１２０４は、セグメントについてそれぞれのレート歪み曲線に基づいてセグメントごとに最小ビットレートと最大ビットレートとを選択し得る。例えば、セグメント＿０について、最小ビットレートおよび最大ビットレートが、セグメント＿０についてのレート歪み曲線の特性に基づいて選択される。例えば、ＣＡＢリスト最適化システム１２０４は、最小品質閾値に対応する最小ビットレートと最大品質閾値に対応する最大ビットレートとを決定するために、最大品質閾値と最小品質閾値とを設定し、レート歪み曲線を使用し得る。セグメント＿１について、ＣＡＢリスト最適化システム１２０４は、セグメント＿１についてのレート歪み曲線の特性に基づいて最小ビットレートと最大ビットレートとを選択する、などである。

【0063】

[0098]上記の分析は、セグメントレベルで実施した。次いで、ＣＡＢリスト最適化システム１２０４は、チャンクレベルにおける最小値と最大値とを決定するためにセグメントレベルの結果を分析する。１６０６において、ＣＡＢリスト最適化システム１２０４は、ｍａｘ＿ｂｉｔｒａｔｅ＿０、ｍａｘ＿ｂｉｔｒａｔｅ＿１、ｍａｘ＿ｂｉｔｒａｔｅ＿２、・・・、ｍａｘ＿ｂｉｔｒａｔｅ＿ｎなどから、セグメントについての最大ビットレートについての値から最大値を決定する。また、ＣＡＢリスト最適化システム１２０４は、ｍｉｎ＿ｂｉｔｒａｔｅ＿０、ｍｉｎ＿ｂｉｔｒａｔｅ＿１、ｍｉｎ＿ｂｉｔｒａｔｅ＿２、・・・、ｍｉｎ＿ｂｉｔｒａｔｅ＿ｎなどから、セグメントについての最小ビットレートについての値から最小値を決定する。

【0064】

[0099]１６０８において、ＣＡＢリスト最適化システム１２０４は、チャンクについての最小ビットレートと最大ビットレートとを出力する。この場合には、セグメントについての最小ビットレートから最も低い最小ビットレートが選択され、セグメントについての最大ビットレートから最も高い最大ビットレートが選択される。選択プロセスは、セグメントについてのレート歪み曲線の個々の特性を考慮に入れ、セグメントレベルで決定された最小ビットレートおよび最大ビットレートのすべてを含み得る最小ビットレートと最大ビットレートとを選択し得る。例えば、最小ビットレートが２０００、３０００、および３５００である場合、選択される最小ビットレートは２０００になる。同様に、最大ビットレートが１００００、９０００、および８５００である場合、選択される最大ビットレートは１００００になる。上記のプロセスが使用され得るが、値の平均を取ることなど、最小ビットレートと最大ビットレートとを選択する他の方法が理解され得る。

【0065】

[00100]図１５の１５０６に説明されるように、ＣＡＢリスト最適化システム１２０４は、最適な品質割り振りを有する候補平均ビットレートのリストを定義する。割り振りの一部は、同様の品質に基づいて候補平均ビットレートを除去することを含む。品質の類似性は、異なるやり方で定義されてもよい。例えば、ＣＡＢリスト最適化システム１２０４は、いくつかの候補平均ビットレートが除去されるべきかどうかを決定するために、品質の値間の距離を決定する。図１７は、いくつかの実施形態による品質に基づいて候補平均ビットレートを除去する一例を示す。この例では、ＣＡＢリスト最適化システム１２０４は、２つの隣接する候補平均ビットレートの品質レベルが閾値内にあるなど、閾値を満たすかを決定し得る。次いで、より高いビットレートを有する候補が除去され得る。

【0066】

[00101]１７０２において、各セグメントは、潜在的に除去され得る符号化されたセグメントの関連付けられた潜在的な除去リストを有し得る。図示されるように、セグメント＿０について、ＣＡＢリスト最適化システム１２０４は、Ｓ０＿ＣＡＢ＿０、Ｓ０＿ＣＡＢ＿３、およびＳ０＿ＣＡＢ＿４の候補平均ビットレートが除去され得ると決定している。これらの候補平均ビットレートは、符号化されたセグメントが隣接する符号化されたセグメントに関して閾値を満たす同様の品質レベルを有し得るので、除去され得る。同様に、セグメント＿１について、ＣＡＢリスト最適化システム１２０４は、Ｓ１＿ＣＡＢ＿０およびＳ１＿ＣＡＢ＿２の候補平均ビットレートが除去され得ると決定しており、セグメント＿ｎについて、ＣＡＢリスト最適化システム１２０４は、Ｓｎ＿ＣＡＢ＿０およびＳｎ＿ＣＡＢ＿３についての候補平均ビットレートが除去され得ると決定している。セグメントは閾値内で同様の品質を有すると決定されないので、セグメントは、セグメント＿２について除去されない。

【0067】

[00102]上記の分析は、セグメントレベルであった。次いで、１７０４において、ＣＡＢリスト最適化システム１２０４は、チャンクレベルで除去すべき候補平均ビットレートを決定するために、セグメントレベル候補平均ビットレートを使用することができる。例えば、潜在的な除去リストの異なるセグメントにおける候補平均ビットレートの発生に基づいて、ＣＡＢリスト最適化システム１２０４は、チャンクレベルについての候補平均ビットレートを選択し得る。いくつかの実施形態では、ＣＡＢリスト最適化システム１２０４は、候補平均ビットレートを選択し、潜在的な除去された候補プール内の発生の総数を計算することができる。この候補平均ビットレートの総数が、閾値にあるかまたはそれを上回るなど、閾値を満たす場合、ＣＡＢリスト最適化システム１２０４は、チャンクレベルにおいて、この候補平均ビットレートを除去候補リストに入れる。例えば、候補平均ビットレートＣＡＢ＿０は、上述のセグメントのうちの３つ（例えば、セグメント＿０、セグメント＿１、およびセグメント＿ｎ）に見出され、「３」の閾値を満たす。次いで、ＣＡＢリスト最適化システム１２０４は、ＣＡＢ＿０の候補平均ビットレートを除去候補リストに入れる。候補平均ビットレートＣＡＢ＿２、ＣＡＢ＿３、およびＣＡＢ＿４は、ビットレートが潜在的除去リスト中の２つ以下のセグメント中で発生するので、閾値を満たさない場合がある。したがって、ＣＡＢリスト最適化システム１２０４は、これらの候補平均ビットレートを除去候補リストに入れない。どの候補平均ビットレートを除去するかを選択する他の方法が理解され得る。

【0068】

[00103]上記の分析は、セグメントレベルで実行され、チャンクレベルにマージされた。しかしながら、プロセスは、異なるレベルで実行されてもよい。例えば、分析は、複数のチャンクから複数のチャンクレベルをカバーするビデオの部分へ、または複数のチャンクからビデオレベルへ、候補平均ビットレートをマージするために使用され得る。

【0069】

[00104]以下は、候補平均ビットレートを除去する一例について説明する。図１８は、いくつかの実施形態による候補平均ビットレートを除去するために最小ギャップが使用される一例を示す。例えば、１８０２において、候補平均ビットレートＣおよびＤは、閾値ｍｉｎ＿ｇａｐなどの閾値を満たす同様の品質レベルを有する。この場合、この候補平均ビットレートは候補平均ビットレートＤに隣接し、候補平均ビットレートＣは候補平均ビットレートＤよりも大きいビットレートを有するが、最小の品質の利点を有するので、ＣＡＢリスト最適化システム１２０４は、候補平均ビットレートＣなど、候補平均ビットレートのうちの１つが除去されるべきであると決定する。この場合、ＣＡＢリスト最適化システム１２０４は、隣接する候補平均ビットレートについての品質の値との間の差を閾値ｍｉｎ＿ｇａｐと比較し、閾値が満たされたとき、候補平均ビットレートのうちの１つを除去し得る。

【0070】

[00105]品質割り振りの別の部分は、品質のギャップに基づいて候補平均ビットレートを追加することを含む。図１９は、いくつかの実施形態による候補平均ビットレートを追加することが有利であり得る場合を示すグラフ１９００を示す。ＣＡＢリスト最適化システム１２０４は、候補平均ビットレートを追加するときを決定するために、１９０２における最大ギャップｍａｘ＿ｇａｐなどの閾値を使用し得る。例えば、グラフ１９００における候補平均ビットレートＣとＤとの間など、閾値ｍａｘ＿ｇａｐよりも大きい品質値のギャップが隣接する候補平均ビットレート間にある場合、ＣＡＢリスト最適化システム１２０４は、レート歪み曲線上の候補平均ビットレートＣとＤとの間に候補平均ビットレートを追加し得る。

【0071】

[00106]異なる方法が、新しい候補平均ビットレートがいくつ追加されるべきかを決定するために使用されてもよい。ＣＡＢリスト最適化システム１２０４は、２つの候補が比に基づく閾値によって分離されるとき、「ｉ」個の新しい候補を追加し得る。例えば、各ギャップが等しいことを意味する１：１、各ギャップが１．５であることを意味する１：１．５、または他の比など、異なる比が、追加された候補間のギャップを構成し得る。

【0072】

[00107]ある可能なプロセスでは、変数ｉはｉ＝１に設定され、ＣＡＢリスト最適化システム１２０４は、比に基づいてｉ個の新しい候補平均ビットレートを追加する。例えば、「Ｆ」と名付けられた１つの候補平均ビットレートは、点Ｃと点Ｄとの間に追加され得る。次いで、新しい隣接する候補平均ビットレート間のすべてのギャップが閾値ｍａｘ＿ｇａｐよりも小さい場合、プロセスは終了する。しかしながら、そうでない場合、変数ｉの値は、「２」などで増分され、２つの新しい候補が、比に基づいて候補平均ビットレート間に追加される。例えば、２つ以上の候補平均ビットレートが、点ＣとＦとの間、および点ＦとＤとの間に追加され得る。次いで、プロセスは、上記で説明されたように継続する。候補平均ビットレートＤとＣとの間に閾値よりも大きいギャップがないように候補平均ビットレートが追加されると、候補平均ビットレートが出力される。

【0073】

[00108]上記のプロセスは、セグメントごとに決定される。次いで、ＣＡＢリスト最適化システム１２０４は、セグメントレベルにおいて潜在的な追加された候補平均ビットレートを取り、チャンクレベルにおいて候補平均ビットレートをマージし得る。図２０は、いくつかの実施形態による候補平均ビットレートを追加することの決定を示す。２００２において、各セグメントは、潜在的に追加され得る候補平均ビットレートを有し得る。セグメント＿０について、２つの候補平均ビットレートが、候補平均ビットレートＣＡＢ＿０とＣＡＢ＿１との中間に追加され得る。また、ＣＡＢ＿４とＣＡＢ＿５との間に１つの候補平均ビットレートが追加され得る。セグメント＿１については、２つの候補平均ビットレートが、候補平均ビットレートＣＡＢ＿０とＣＡＢ＿１との間に追加され得る。セグメント＿ｎについては、２つの候補平均ビットレートが、候補平均ビットレートＣＡＢ＿０とＣＡＢ＿１との間に追加され得る。したがって、３つのセグメントは、候補平均ビットレートＣＡＢ＿０とＣＡＢ＿１との間に２つの候補平均ビットレートを追加しており、１つのセグメントは、ＣＡＢ＿４とＣＡＢ＿５との間に１つの候補平均ビットレートを追加している。

【0074】

[00109]ＣＡＢリスト最適化システム１２０４は、チャンクについての追加候補リストを決定するために、セグメントレベル候補を使用し得る。例えば、チャンクレベルで追加候補リストに追加されるために、ＣＡＢリスト最適化システム１２０４は、セグメントレベルでの潜在的な追加された候補平均ビットレートが、セグメントの数などの閾値内で見出されるかどうかを決定し得る。閾値がセグメントの７０％である場合、ＣＡＢリスト最適化システム１２０４は、候補平均ビットレートＣＡＢ＿０とＣＡＢ＿１との間の２つの候補を追加する。というのも、これらの候補は、セグメントの７０％よりも多く（４つのうち３つのセグメント）で見出されるからである。ＣＡＢリスト最適化システム１２０４は、ＣＡＢ＿４とＣＡＢ＿５との間に候補を追加しない。というのも、この追加は、セグメント＿０においてのみ見出され、セグメントの７０％未満であるからである。この場合、たった１つのセグメントが追加を必要とするので、追加の候補平均ビットレートを追加することは必要とされないことがあり、たった１つのセグメントが影響を受ける場合、チャンクの他のすべてのセグメントのための候補平均ビットレートを追加することは有用でないことがある。しかしながら、候補平均ビットレートＣＡＢ＿０とＣＡＢ＿１との間の２つの候補平均ビットレートの加算は、セグメントの７０％超が潜在的な追加を有していたので、有益であり得る。

【0075】

[00110]ＣＡＢリスト最適化システム１２０４の出力は、チャンクごとの候補平均ビットレートリストである。例えば、図３Ａに記載されたようなチャンクごとの候補平均ビットレートのリストは、いくつかの実施形態によるＣＡＢリスト最適化システム１２０４によって出力される。

【0076】

[00111]結論
[00112]したがって、候補平均ビットレートのリストは、各セグメントにおいて見出される特性に基づいて最適化され得る。これは、チャンクのそれぞれの特性について最適化されたチャンクごとの改善された候補平均ビットレートリストを生成する。候補平均ビットレートは、各チャンクのプロファイルの選択に利用可能な符号化されたセグメントの選択の品質を改善することができる。これは、再生経験を改善することに加えて、ビデオの品質を改善することができる。

【0077】

[00113]レート歪み曲線の予測
[00114]ＲＤ予測システム１２０２は、ビデオについてのビットレートと品質との間の関連性の予測を生成することができる。上述されたように、関連性は、レート歪み曲線（ＲＤ曲線）と呼ばれ得る。レート歪み曲線は、異なるターゲット構成について予測され得る。例えば、適応ビットレートビデオトランスコーディングについては、高解像度ソースビデオは、複数の解像度（例えば、４Ｋ（３８４０ｘ２１６０ピクセル）、１０８０ｐ（１９２０ｘ１０８０）、７２０ｐ（１２８０ｘ７２０）、３６０ｐ（４８０ｘ３６０）など）に変換および符号化され得る。各解像度について、ＲＤ予測システム１２０２は、レート歪み曲線を予測することができる。例えば、解像度が１０８０ｐ、７２０ｐ、および３６０ｐを含む場合、ＲＤ予測システム１２０２は、３つのそれぞれの解像度について異なるビットレートで３つのレート歪み曲線を生成し得る。異なる解像度における複数のレート歪み曲線は、レート歪みマップと呼ばれ得る。３つのレート歪み曲線が説明されるが、より多くのレート歪み曲線が、ビデオのために必要とされてもよい。より多くの解像度に加えて、例えば、ビデオを符号化するための設定の異なる組合せに対して新たなレート歪みマップが必要とされるように、新たなレート歪みマップを必要とする複数のターゲット構成が存在してもよい。符号器＃１および符号器＃２の２つの符号器タイプがある場合、ＲＤ予測システム１２０２は、各エンコーダについて異なるターゲット構成を生成し得る。次いで、符号器ごとに、ＲＤ予測システム１２０２は、合計６つのレート歪み曲線について３つのレート歪み曲線を生成し得る。

【0078】

[00115]従来、レート歪みマップは、適応ビットレートシステムのための符号化されたビットストリームを生成するための最適なトランスコーディングシステムを設計するためなど、異なるやり方で使用され得る。従来、レート歪みマップは、所与のビデオの多数の実際の符号化を介してのみ取得され得る。例えば、１つの符号化ジョブは、１つのビットレートおよび解像度のペアについて１つの品質値を生成することができる。ターゲット構成についてのレート歪み曲線を生成するために複数の符号化ジョブが各ビットレートで実行されなければならない。複数のターゲット解像度およびターゲット構成があるとき、レート歪み曲線を生成するために多数の符号化ジョブが実行されなければならない。したがって、レート歪み曲線を生成するための処理時間および計算リソースのコストはとても高い。サービスが複数のビデオをトランスコードしているとき、レート歪み曲線を生成するために必要とされる処理時間および計算リソースは、実用的でない可能性がある。

【0079】

[00116]いくつかの実施形態では、ＲＤ予測システム１２０２は、ビデオについての１つまたは複数のレート歪みマップを予測する。これは、ターゲット構成および解像度ごとのレート歪み曲線を生成するための実際の符号化ジョブが実行される必要がない可能性があるという点で、計算リソースの使用を改善する。さらに、予測は、実際の符号化ジョブを実行するよりも速く生成され得る。この予測は、プロキシ符号化情報を使用することなどによっても改善され得る。プロキシ符号化情報は、予測を生成するために実際の符号化からの符号化結果を使用することができる。しかしながら、プロキシ符号化情報は、ビデオの符号化時に高速プリセット設定を使用する構成などによって、予測において使用されているターゲット構成とは異なる符号化構成から収集され得る。高速プリセット設定は、入力ビデオのより小さい解像度、より少ないターゲットビットレート、間引かれたビデオフレーム等など、符号化がより高速に実行されることを可能にするための簡略化を含み得る。プロキシ符号化情報は、以下より詳細に説明される。

【0080】

[00117]システム概要
[00118]図２１は、いくつかの実施形態によるＲＤ予測システム１２０２の一例を示す。ＲＤ予測システム１２０２は、レート歪みマップのためのレート歪み曲線を生成し得る。上述のように、ビデオコンテンツは異なった特性を有し得るので、レート歪みマップは重要であり得る。例えば、一部のコンテンツは、漫画またはニュースのように符号化が簡単であり得るが、一部のコンテンツは、映画またはスポーツのように符号化が難しい場合もある。異なるコンテンツについてのレート歪み曲線は、ビデオの異なるチャンクについての異なるレート歪み曲線を示す図８において上述されたように異なり得る。また、図９は、同じセグメントについての異なる符号化構成についての異なるレート歪み曲線を示す。図１０および図１１は、適応ビットレートアルゴリズムのためのビットレートを選択するためにレート歪み曲線を使用することの利点を示す。上述のように、ＳＱＡシステム１０８は、符号化されたセグメントにおいて見出された品質を最適化するために候補平均ビットレートを動的に選択することができる。例えば、ＳＱＡシステム１０８は、曲線が急勾配であるビットレートで候補平均ビットレートの数を増加させ、曲線が品質をあまり変化させない候補平均ビットレートの数を減少させ、品質が冗長であり得る最低ビットレートから候補平均ビットレートを除去し、より高いビットレートで変化する品質を捕捉するために追加のビットレートを追加し、曲線の下端でビットレートを除去し、より等しい増分で異なるレベルの品質を獲得するために候補平均ビットレートをより均等に間隔をおいて配置してもよい。レート歪み曲線は、適応ビットレートアルゴリズムに使用され得るが、品質値の予測は、他の目的に使用されてもよい。いくつかの実施形態では、レート歪み曲線の予測は、異なる符号化最適化システムにおいて使用され得る。例えば、タイトルごとの符号化およびセグメントごとの符号化において、システムは、１つのビデオのタイトルレベルまたはセグメントレベルについてのレート歪み曲線を予測することができる。システムは、タイトルまたはセグメントについて、同じビットレートでより高い品質のための動的ターゲットビットレート、または同じ品質でより低いビットレートを決定することができる。符号化パラメータ最適化のために、システムは、異なるレート歪み曲線を予測するために異なる符号化パラメータを使用し得る。次いで、システムは、いくつかのビデオについて適切な符号化パラメータを選択し得る。異なるプロファイル（例えば、ビットレートおよび解像度）の適応プロファイルラダーを生成する際に、システムは、異なる解像度およびビットレートについてのレート歪み曲線を予測することができる。次いで、システムは、異なるビデオについての適応プロファイルラダーを設定するために群内のビットレートおよび解像度を最適化するためにレート歪み曲線に基づいて異なる解像度およびビットレート群を選択し得る。ＲＤ予測システム１２０２は、ビデオのフレームなどのビデオを受信し、レート歪みマップのためのレート歪み曲線を生成し得る。特徴抽出システム２１０２は、ビデオのフレームを受信することができる。次いで、特徴抽出システム２１０２は、ビデオの各フレームの特性に基づいて特徴のリストについての値を抽出し得る。特徴統合システム２１０４は、フレームレベル特徴をビデオの部分に統合することができる。例えば、上述したように、セグメントは、ビデオの６秒または複数のフレームのようなビデオの一部分であり得る。特徴統合システム２１０４は、フレームレベル特徴を、セグメントレベルで特徴を記述するセグメントレベル特徴に統合し得る。セグメントの開始フレームおよび終了フレームは、異なるやり方で決定され得る。例えば、セグメントを定める設定が受信されてもよく、またはセグメントは、セグメントを生成するためにビデオの特性を分析することによって動的に決定されてもよい。セグメントレベルの特徴が説明されるが、フレームレベル、チャンクレベルなど、ビデオの他の部分が使用されてもよい。

【0081】

[00119]予測ネットワーク２１０６は、セグメントレベル特徴およびターゲット構成を受信し得る。ターゲット構成は、異なるパラメータの組合せを含み得る。例えば、ターゲット構成のパラメータは、ターゲット開始フレーム／終了フレーム、ターゲット解像度、ターゲットビットレート、ターゲット品質指標、およびターゲット符号器を含み得る。例えば、パラメータは、ターゲット解像度（６４０×３６０、１２８０×７２０、１９２０×１０８０など）、ターゲットビットレート（５００ｋｂｐｓ、１Ｍｂｐｓ、３Ｍｂｐｓ、６Ｍｂｐｓなど）、ターゲット画質指標（ＰＳＮＲ、ＶＭＡＦ、ＥＰＳなど）、ターゲット符号化構成（例えば、ターゲット符号器（ＡＶＣ、ＨＥＶＣ、ＡＶ１など）、ターゲット符号化設定（高速プリセット、低速プリセットなど））を含むことができる。パラメータの異なる組合せが生成されてもよい。例えば、第１のターゲット構成は、ターゲット解像度（６４０×３６０、１２８０×７２０、１９２０×１０８０など）、ターゲットビットレート（５００ｋｂｐｓ、１Ｍｂｐｓ、３Ｍｂｐｓ、６Ｍｂｐｓなど）、ターゲット品質指標（ＰＳＮＲ）、ターゲット符号化構成（例えば、ターゲット符号器（ＡＶＣ））、およびターゲット符号化設定（高速プリセット）であり得る。第２のターゲット構成は、ターゲット解像度（６４０×３６０、１２８０×７２０、１９２０×１０８０など）、ターゲットビットレート（５００ｋｂｐｓ、１Ｍｂｐｓ、３Ｍｂｐｓ、６Ｍｂｐｓなど）、ターゲット品質指標（ＶＭＡＦ）、ターゲット符号化構成（例えば、ターゲット符号器（ＨＥＶＣ）、ターゲット符号化設定（低速プリセット））である。各組合せは、ターゲット構成として列挙され得るが、可能なパラメータ設定のリストが受信され得、次いで、ＲＤ予測システム１２０２は、異なる組合せを生成する。第１のターゲット構成を使用して、予測ネットワーク２１０６は、より高速なプリセットを使用してＡＶＣ符号器のための各解像度（６４０×３６０、１２８０×７２０、１９２０×１０８０など）における複数のビットレート（５００ｋｂｐｓ、１Ｍｂｐｓ、３Ｍｂｐｓ、６Ｍｂｐｓなど）についての品質値（ＰＳＮＲ）のリストを予測し得る。第２のターゲット構成を使用して、予測ネットワーク２１０６は、より遅いプリセットを使用してＨＥＶＣ符号器のための各解像度（６４０×３６０、１２８０×７２０、１９２０×１０８０など）における複数のビットレート（５００ｋｂｐｓ、１Ｍｂｐｓ、３Ｍｂｐｓ、６Ｍｂｐｓなど）についての品質値（ＶＭＡＦ）のリストを予測し得る。出力の結果は、ビットレートについての複数の品質値であり得る。ＲＤマップ生成器２１０８は、品質値からレート歪み曲線を生成し、次いでレート歪み曲線からレート歪みマップを生成し得る。レート歪みマップは、１つのターゲット構成についてのものであり得る。複数のターゲット構成が処理されている場合、ＲＤ予測システム１２０２は、ターゲット構成ごとにレート歪みマップを生成し得る。

【0082】

[00120]次に、以下は、ＲＤ予測システム１２０２の異なる部分をより詳細に説明する。

【0083】

[00121]特徴抽出
[00122]特徴抽出システム２１０２は、ビデオのフレームについての異なる種類の特徴を抽出することができる。いくつかの実施形態では、特徴抽出システム２１０２は、コンピュータビジョン特徴、空間領域特徴、時間領域特徴、周波数領域特徴、およびプロキシ符号化特徴に関連付けられた特徴を抽出することができるが、他の特徴も使用され得る。図２２は、いくつかの実施形態による抽出され得る特徴の一例を示す。２２０２において、コンピュータビジョン特徴は、フレームの視覚的特性に関する異なる特徴を含み得る。コンピュータビジョン特徴は、このフレームのいくつかの詳細な情報を記述し得る。例えば、ソーベル（Ｓｏｂｅｌ）の勾配は、この値がより高い場合、このフレームが複雑であることを意味し、符号器は、このフレームを符号化するためにより多くのビットレートを使用し得る。したがって、値が低い場合、符号化ビットレートは高くなり、品質はより低くなり、その逆も同様である。例えば、ピクセル値の平均、分散、およびヒストグラム、ソーベルおよびラプラス演算の勾配、ぼけ強度、ノイズ強度などに基づいて特徴が使用されてもよい。値は、ピクセルレベル、ブロックレベル、フレームレベルなどで組織化されてもよい。

【0084】

[00123]２２０４において、空間領域特徴は、フレームのコンテンツの類似性および／または冗長性などのコンテンツの差を分析することができる。空間領域特徴は、フレームの類似性および冗長性を記述することができ、したがって、フレーム内のコンテンツが多くの冗長性および類似性を有する場合、符号化ビットレートはより低くなり得、品質はより高くなり得、その逆も同様である。特徴は、フレームのコンテンツの類似性または冗長性を決定するために、絶対差の和（ＳＡＤ）を計算するためのイントラ予測に基づき得る。特徴は、４×４、８×８、１６×１６などの異なるブロックサイズなどによって、異なって組織化され得る。

【0085】

[00124]２２０６において、時間領域特徴は、複数のフレームに関連付けられた特徴に基づき得る。時間領域特徴は、隣接するフレームの動きの速度および動きの複雑さを記述することができ、したがって、これらのフレーム内のコンテンツが遅く、かつ予測可能に動く場合、符号化ビットレートはより低くなり得、品質はより高くなり得、その逆も同様である。例えば、時間領域特徴は、隣接するフレームの類似性、動きの速度、および動きの複雑さに基づき得る。特徴抽出システム２１０２は、隣接するフレームの類似性、動き、速度、または動きの複雑さを伝達するために、動きベクトル（ＭＶ）と、フレーム内のオブジェクト間の絶対差の和とを計算するためにインター予測を使用することができる。特徴は、異なるブロックサイズによっても組織化され得る。

【0086】

[00125]２２０８において、周波数領域特徴は、フレームの周波数領域情報に基づき得る。周波数領域特徴は、このフレームを見るための別のビューであるフレームの周波数領域情報を記述し得る。フレームが周波数領域において複雑である場合、符号器は、このフレームを符号化するためにより多くのビットレートを使用することができ、したがって、符号化ビットレートはより高くなり得るとともに、品質はより低くなり得、その逆も同様である。特徴抽出システム２１０２は、離散コサイン変換（ＤＣＴ）／離散サイン変換（ＤＳＴ）の変換係数などの異なる周波数領域情報を使用することができる。特徴は、ブロックサイズによっても組織化され得る。

【0087】

[00126]２２１０において、プロキシ符号化特徴は、ビデオの実際の符号化に基づくことができる。プロキシ符号化特徴は、符号化結果との関連性を有し、ビデオの符号化結果の予測と正の相関を有する。実際の符号化を実行するために使用される構成は、予測のために処理されているターゲット構成とは異なり得る。いくつかの実施形態において、プロキシ符号化特徴は、ターゲット構成と比較してより低いコンピューティングリソース消費符号化に基づいて決定されてよい。他の実施形態では、エンコーダのより高速なプリセットが、プロキシ符号化を生成するために使用され得る。符号器は、異なる量のコンピューティングリソースを使用する高速、低速、中間などの異なるプリセットを有し得る（例えば、低速は、より多くのコンピューティングリソースを使用し得るが、より高品質の符号化を生成し得る）。また、プロキシ符号化は、入力ビデオのより小さい解像度、より少ないターゲットビットレート、間引かれたビデオフレーム（例えば、より少ないビデオフレーム）、異なる符号器など、他の簡略化を有し得る。したがって、プロキシ符号化構成は、ターゲット構成の正確なコピーではあり得ないが、より速く実行されるように設計され得る。プロキシ符号化機能は、複数のターゲット構成にも使用され得る。いくつかの実施形態では、１つのプロキシ符号化は、複数のターゲット構成の予測において実行および使用される。プロキシ符号化結果は、プロキシ符号化特徴を生成するために使用され得る。プロキシ符号化特徴のいくつかの例は、実際のプロキシ符号化から生じるフレームタイプ量子化パラメータ、品質、ビットレートなどを含む。

【0088】

[00127]特徴統合
[00128]特徴統合システム２１０４は、フレームレベル特徴をセグメントレベル特徴に統合することができる。上述のように、セグメントレベル特徴が処理され得るが、このステップは、フレームレベル特徴が予測に使用されている場合には必要でない場合がある。図２３は、いくつかの実施形態によるビデオのフレームの一例を示す。２３０２－ｉ～２３０２－ｉ＋１、２３０２－ｉ＋ｊにおいて、フレーム＿ｉ、フレーム＿ｉ＋１、フレーム＿ｉ＋ｊを含むセグメントＸが示されている。各フレームは、フレームのフレーム＿ｉについての特徴の特徴＿０＿ｉ、特徴＿１＿ｉ、特徴＿２＿ｉ、特徴＿Ｍ＿ｉなどの２３０４におけるセグメント中の複数の特徴に関連付けられ得る。

【0089】

[00129]特徴統合システム２１０４は、特徴＿０＿出力、特徴＿１＿出力、特徴＿２＿出力、特徴＿Ｍ＿出力の２３０６におけるセグメントレベル特徴を生成するためにそれぞれの特徴を統合し得る。異なる方法が、セグメントレベル特徴を決定するために使用されてもよい。いくつかの実施形態では、各特徴の平均値が、セグメントの各フレームから計算され得る。例えば、特徴統合システム２１０４は、各フレームについて特徴＿０の特徴値の平均値を生成し得る。他の特徴についても平均値が同様に計算される。

【0090】

[00130]別の例では、平均が計算される前に、特徴統合システム２１０４は、閾値を満たすフレームのうちのいくつかからいくつかの値を除去することができる。いくつかの実施形態では、フレームからの一部の外れ値が除去され得る。例えば、あるフレームは、他のフレームからの特徴とは大きく異なり得る（例えば、閾値を上回る）特徴の値を有する場合があり、セグメントのフレームの大部分を表さないようにセグメントレベル値を歪め得る。外れ値を計算する異なる方法が、使用されてもよい。いくつかの実施形態では、セグメントのフレームについての特徴の平均が計算されてもよく、特徴の標準誤差が計算される。平均値を標準誤差と比較するスコアが、特徴のスコアが外れ値であるかどうかを決定するために使用され得る。スコアが閾値を満たす場合、その特徴は除去されてもよい。閾値が満たされない場合、スコアは除去されない場合がある。次いで、特徴統合システム２１０４は、除去されていない特徴のリストに基づいて、特徴の平均値を計算し得る。

【0091】

[00131]フレームレベルでの特徴をセグメントレベルに統合する結果は、特徴ごとの平均値であってもよい。平均値が説明されるが、フレームからの中央値を使用するなど、特徴を統合または組み合わせる他の方法が使用されてもよい。セグメントレベルで特徴を統合した後、レート歪みマップの予測が生成され得る。

【0092】

[00132]予測
[00133]予測ネットワーク２１０６は、ターゲット構成に基づいて複数のビットレートについての品質値のリストを予測することができる。予測ネットワーク２１０６は、予測される品質値のリストを出力するために、特徴統合システム２１０４からのセグメントレベル特徴とターゲット構成とを使用することができる。予測ネットワーク２１０６は、予測を実行するようにトレーニングされ得る１つまたは複数のモデルを使用することができる。いくつかの実施形態では、予測ネットワーク２１０６は、ターゲット解像度のビットレートごとに品質値を予測してもよい。例えば、ターゲット解像度６４０×３６０について、予測ネットワーク２１０６は、ターゲットビットレート５００Ｋｂｐｓ、１Ｍｂｐｓ、３Ｍｂｐｓ、６Ｍｂｐｓなどについての品質値を予測する。次いで、ターゲット解像度１２８０×７２０について、予測ネットワーク２１０６は、ターゲットビットレート５００Ｋｂｐｓ、１Ｍｂｐｓ、３Ｍｂｐｓ、６Ｍｂｐｓなどについての品質値を予測する。複数のターゲット構成が使用される場合、ターゲット構成ごとに以下のプロセスが実行され得る。

【0093】

[00134]図２４は、いくつかの実施形態による予測方法の簡略化されたフローチャート２４００を示す。以下のプロセスは、ビデオのセグメントごとに実行され得る。すなわち、レート歪みマップについての品質値は、セグメントごとに生成される。２４０２において、ＲＤ予測システム１２０２は、ターゲット構成に基づいてモデルを構成する。例えば、各ターゲット構成は、品質値を予測することができるモデルに関連付けられてもよい。他の実施形態では、単一のモデルが、複数のターゲット構成についての品質値を予測してもよい。教師ありトレーニングおよび教師なしトレーニングなどの異なる方法が、モデルを構成するために使用されてもよい。

【0094】

[00135]モデルを構成した後、品質値が予測され得る。品質値を生成する異なる方法が、少なくとも図２６および図２７において説明されるが、他の方法が使用されてもよい。２４０４において、ＲＤ予測システム１２０２は、最後のターゲット解像度が処理されたか決定する。例えば、ターゲット解像度は、６４０×３６０、１２８０×７２０、１９２０×１０８０などを含み得る。最後のターゲット解像度が処理された場合、プロセスは終了し得る。最後のターゲット解像度が処理されていない場合、２４０６において、ＲＤ予測システム１２０２は、最後のビットレートが処理されたかどうかを決定する。上述のように、予測ネットワーク２１０６は、ターゲット解像度ごとに複数のビットレートについての品質値を予測してもよい。

【0095】

[00136]最後のビットレートが処理されていない場合、２４０８において、ＲＤ予測システム１２０２は、予測ネットワーク２１０６のモデルを使用して、現在のターゲット解像度と現在のビットレートの品質値とを予測する。予測は、セグメントについての特徴およびターゲット構成を受信し、ビットレートについての品質値を出力することができる。例えば、予測は、６４０×３６０のターゲット解像度および５００ｋｂｐｓのターゲットビットレートについての品質値であり得る。

【0096】

[00137]２４１０において、ＲＤ予測システム１２０２は、解像度の次のターゲットビットレートに移る。例えば、５００ｋｂｐｓのビットレートの後、次のターゲットビットレートは１Ｍｂｐｓであってもよい。次いで、プロセスは２４０６に戻る。ビットレートごとに、予測ネットワーク２１０６は、品質値を予測する。例えば、他のビットレートは、３Ｍｂｐｓ、６Ｍｂｐｓなどであり得る。最後のビットレートが予測されたとき、プロセスは、２４１２に移り、次のターゲット解像度が処理される。例えば、別のターゲット解像度は、１２８０×７２０であってもよい。次いで、プロセスは２４０４に戻り、ＲＤ予測システム１２０２は、最後のターゲット解像度が処理されたかどうかを決定する。そうでない場合、プロセスは、新たなターゲット解像度についてのビットレートを処理し続ける。上述されたものと同じビットレートが使用されてもよい。１９２０×１０８０のターゲット解像度が処理された後など、すべてのターゲット解像度が処理されたとき、プロセスは終了する。

【0097】

[00138]予測は、レート歪み曲線の代わりに、解像度およびビットレートのペアごとの品質値を予測し得る。レート歪み曲線を生成するためにすべての詳細を予測することは、曲線のいくつかの部分がより速く増加し、いくつかの部分がより遅く増加する、曲線の部分の傾斜が異なる、曲線の形状が完全に異なるなど、多くの詳細な情報を予測することを必要とし得るので、予測は、曲線を予測することと比較して改善され得る。したがって、レート歪み曲線を直接予測することは困難であり得る。しかしながら、ＲＤ予測システム１２０２は、レート歪み曲線上の点を生成するためにより詳細な情報を使用することができ、次いで、これは、曲線を推定するために使用され得る。しかしながら、予測は、単一の入力に基づいてレート歪み曲線の品質測定値を予測し得る。

【0098】

[00139]図２５は、いくつかの実施形態による、１つのターゲット解像度についてのビットレートの品質値を列挙するグラフ２５００を示す。グラフ２５００は、たった１つの解像度における単一のターゲット構成についての品質値のリストを与える。Ｘ軸はビットレートであり、Ｙ軸は品質であり得る。グラフ２５００中の各点は、予測ネットワーク２１０６によって出力される品質値を表し得る。例えば、２５０２における点は、第１のビットレートについての品質値予測であり、２５０４における点は、第２のビットレートについての品質値である。複数の解像度は、図２５に示されるようにそれぞれの関連付けられた点を有することができる。

【0099】

[00140]２４０８に記載されているような現在のターゲット解像度およびビットレートの品質値の予測は、異なるやり方で実行されてもよい。以下は、直接予測モードと間接予測モードの２つの方法を説明する。

【0100】

[00141]直接予測モード
[00142]図２６は、いくつかの実施形態による直接予測モードの一例を示す。２６０２において、セグメントｘの特徴が、予測ネットワーク２１０６に入力される。さらに、ターゲット構成が、予測ネットワーク２１０６に入力される。使用される特徴は、コンピュータビジョン特徴、空間領域特徴、時間領域特徴、周波数領域特徴、および／またはプロキシ符号化特徴の図２２に記載された特徴を含み得る。予測ネットワーク２１０６は、特徴入力に基づいて予測を生成するようにトレーニングされ得る。例えば、特徴についての値に基づいて、予測ネットワーク２１０６は、品質値を生成することができる。プロキシ符号化特徴は、他の特徴とともに入力として使用され、予測ネットワーク２１０６は、プロキシ符号化特徴および他の特徴の値に基づいて品質値を出力するようにトレーニングされる。出力された品質値は、ターゲット構成についてのものである。以下により詳細に説明されるように、プロキシ符号化特徴は、プロキシ符号化構成についての品質値を予測することによって、間接予測モードにおいて異なるように使用され得る。

【0101】

[00143]予測ネットワーク２１０６は、ビットレートごとに予測品質値を出力する。いくつかの実施形態では、予測は、ビットレートおよび解像度のペアごとに実行され得る。予測を決定するためにプロキシ符号化特徴を使用することは、品質値を改善し得る。例えば、いくつかの実際の符号化結果を使用することは、実際の符号化に基づかない特徴を単に使用することよりも良好な情報を提供し得る。プロキシ符号化結果は、レート歪み曲線の正確な予測との強い相関関係を有し得る。実際の符号化からのいくつかの点を有することによって、レート歪み曲線の生成形状が与えられ得、実際の符号化結果からガイダンスを与えられた場合、それらの実際の点に基づく予測が改善され得る。図２５では、８つの品質値が存在した。予測ネットワーク２１０６は、１つの解像度について８つの異なるビットレートを使用して８つの異なる品質値を生成するように実行され得る。

【0102】

[00144]間接予測モード
[00145]間接予測モードは、品質オフセット予測を使用して品質値を予測することができる。品質オフセットは、プロキシ符号化予測とターゲット符号化予測との間の差に基づき得る。プロキシ符号化予測は、プロキシ符号化構成に基づく品質値であり得る。ターゲット符号化予測は、プロキシ符号化構成とターゲット構成との間の差に基づくターゲット品質値であり得る。例えば、プロキシ符号化構成は高速設定を含み得るが、ターゲット構成は通常設定を含み得る。プロセスは、プロキシ符号化構成とターゲット構成との間の差に基づいてプロキシ符号化予測を調整するためのオフセットを決定し得る。ターゲット符号化予測は、図２６で生成された品質値と同様のターゲット構成についての所望の品質値であり得る。

【0103】

[00146]図２７は、いくつかの実施形態による間接予測モードシステムの一例を示す。間接予測モードでは、予測ネットワーク２１０６およびプロキシ符号化品質計算エンジン２７０２の２つのサブモジュールが使用され得る。

【0104】

[00147]セグメントｘ２６０２の特徴は、予測ネットワーク２１０６およびプロキシ符号化品質計算エンジン２７０２で受信される。プロキシ符号化品質計算エンジン２７０２は、現在のターゲット解像度と現在のターゲットビットレートとに基づいてプロキシ品質値を計算するためにプロキシ符号化構成を使用することができる。いくつかの実施形態では、プロキシ符号化特徴を生成するためにビデオの実際の符号化が使用され得る。符号器は、セグメントｘのフレームを受信し、セグメントｘを符号化し、符号化されたビットストリームを出力することができる。プロキシ符号化特徴は、符号化されたビットストリームの特性によって決定され得る。プロキシ符号化品質計算エンジン２７０２は、プロキシ符号化点におけるプロキシ品質値を生成し得る。

【0105】

[00148]図２８は、いくつかの実施形態によるプロキシ品質値およびターゲット品質値のグラフ２８００の一例を示す。線２８０８はプロキシ品質値を表し、線２８１０はターゲット品質値を表す。プロキシ符号化値は、品質値がプロキシ符号化特徴から予測される点にあり、２８０６－１、２８０６－２、および２８０６－３に示される。符号器は、プロキシ符号化点においてプロキシ符号化結果を生成するために、高速符号化プリセットなどの設定を使用し得る。次いで、予測ネットワーク２１０６は、対応するプロキシ品質値を生成するために、プロキシ符号化からの特徴を使用することができる。しかしながら、プロキシ符号化点は、ターゲット品質値についての必要な点を生成するのに十分な点ではない場合がある。したがって、プロキシ符号化品質計算エンジン２７０２は、ターゲット符号化値を生成するために追加のプロキシ符号化値を生成し得る。

【0106】

[00149]追加のプロキシ符号化値を生成するために、プロキシ符号化品質計算エンジン２７０２は、他のビットレートで推定プロキシ符号化値を生成し得る。例えば、推定プロキシ品質値２８０２は、実際のプロキシ品質値に基づいて生成される。いくつかの例では、補間またはフィッティングアルゴリズムが、別のビットレートについて２８０２において推定プロキシ品質値を推定し得る。図示のように、推定プロキシ品質値２８０２は、プロキシ品質値２８０６－２と２８０６－３との間のビットレートで推定プロキシ品質値２８０２の値を推定することなどによって、推定プロキシ品質値２８０２の値を決定するためにプロキシ品質値２８０６－２および２８０６－３の値を使用し得る。計算エンジン２７０２は、同様に他のプロキシ品質値を生成してもよい。プロキシ符号化品質計算エンジン２７０２は、プロキシ符号化点品質値をコンバイナ２７０４に出力する。

【0107】

[00150]また、プロキシ符号化品質計算に加えて、予測ネットワーク２１０６は、ビットレートについての品質オフセットを生成するように構成される。例えば、予測ネットワーク２１０６は、セグメントについての入力された特徴に基づいて品質オフセットを決定するようにトレーニングされ得る。品質オフセットは、ターゲット構成とプロキシ符号化構成との間の差の予測であり得る。例えば、品質オフセットは、プロキシ符号化構成とターゲット構成との間の差に基づいて推定されるプロキシ品質値とターゲット品質値との間の差を推定し得る。予測ネットワークは、ターゲット品質値の代わりにオフセットを予測するために、異なってトレーニングされ得る。

【0108】

[00151]図２８では、予測ネットワーク２１０６は、点２８０２とターゲット符号化点との間の差であるオフセットを予測することができる。例えば、予測ネットワーク２１０６は、２８０２において、プロキシ品質値に関連付けられたターゲットビットレートについての品質値のオフセットを予測することができる。次いで、予測ネットワーク２１０６は、プロキシ品質値に関連付けられたビットレートごとのオフセットをコンバイナ２７０４に出力する。

【0109】

[00152]コンバイナ２７０４は、プロキシ品質値と品質オフセットとを組み合わせることができる。例えば、プロキシ品質値ごとに、それぞれの品質オフセットが受信され得る。次いで、コンバイナ２７０４は、図２８の２８０４に示されるように、ターゲット品質値を生成するために、プロキシ品質値を関連付けられた品質オフセット値と結合し得る。いくつかの実施形態では、コンバイナ２７０４は、ターゲット品質値を生成するために品質オフセットをそれぞれのプロキシ品質値に加算し得る。オフセットを乗数として使用すること、オフセットを減算することなど、オフセットを組み合わせる他の方法も理解され得る。次いで、コンバイナ２７０４は、ターゲット構成についてのターゲット品質値を出力する。上記のプロセスは、ターゲット品質値を生成するために、ターゲット構成ごとに実行されてもよい。

【0110】

[00153]直接予測モードおよび間接予測モードは、品質値を生成するためにモードのうちの一方のみが実行されるなど、二者択一的に実行されてもよい。例えば、間接モードは、ビデオの特定の特性に遭遇したときにより正確であるように決定され得、直接モードは、特定の特性に遭遇したときにより正確であり得る。いくつかの例では、直接モードは、漫画などの単純なコンテンツが符号化されているとき、より正確であり得る。しかしながら、映画がより複雑なコンテンツで符号化されているとき、間接モードはより正確であり得る。間接モードは、プロキシ符号化が品質値を生成するために実際の符号化を使用し得るので、より正確であり得る。そのとき、ターゲット品質値の予測は、実際の符号化からのいくつかの品質値に基づくことができ、品質値のストレートな予測は、コンテンツの複雑さのために困難であり得る。

【0111】

[00154]他の実施形態では、直接予測品質値および間接予測品質値は、組み合わせて使用され得る。図２９は、いくつかの実施形態による、直接品質値と間接品質値とを使用する一例を示す。いくつかの実施形態では、交差検証エンジン２９０２は、検証された品質値を出力するために、直接品質値および間接品質値を使用することができる。検証された品質値はビットレートについての直接品質値と間接品質値との組合せに基づき得る。例えば、２つの値の平均が使用されてもよい。他の実施形態では、交差検証エンジン２９０２は、出力するために直接品質値または間接品質値のうちの１つを選択し得る。例えば、直接予測測定が選択されてもよく、または間接予測測定が選択されてもよい。

【0112】

[00155]他の例では、交差検証エンジン２９０２は、ビットレートについての直接品質値と間接品質値とを比較などして、測定値を検証することができる。直接品質値と間接品質値との間の差が、互いの閾値内にあるなど閾値を満たす場合、交差検証エンジン２９０２は、品質値を検証することができる。そうでない場合、交差検証エンジン２９０２は、品質値を検証することができず、エラーを出力することができる。また、交差検証エンジン２９０２は、ビットレート範囲に基づいて、直接モード結果と間接モード結果とをマージし得る。例えば、交差検証エンジン２９０２は、異なる予測モードは異なるビットレート範囲において異なる利点を有し得るので、より低いビットレート範囲において品質値を予測するために直接モードを使用し、より高いビットレート範囲において品質値を予測するために間接モードを使用することができる。さらに、交差検証エンジン２９０２は、値を平均するときなど、値を一緒にマージするときに最大値または最小値を使用することができる。

【0113】

[00156]ＲＤマップ
[00157]複数の解像度およびビットレートについてのターゲット品質値の生成後、ＲＤマップ生成器２１０８は、ＲＤマップを生成する。ＲＤマップ生成器２１０８は、生成されている品質値をリンクするためにフィッティングまたは補間方法を使用することができる。ＲＤマップ生成器２１０８は、異なる解像度についてレート歪み曲線を生成し得る。

【0114】

[00158]図３０Ａは、いくつかの実施形態による、単一の解像度についてのレート歪み曲線のグラフ３０００を示す。品質値の点が示されており、ＲＤマップ生成器２１０８は、曲線３００４として点をリンクする方法を使用する。異なるフィッティング方法または補間方法が、品質値に基づいて曲線を描くために使用され得る。

【0115】

[00159]図３０Ｂは、いくつかの実施形態によるＲＤマップを示すグラフ３００２を示す。ＲＤマップは、３０６－１、３０６－２、および３０６－３で、それぞれ、１９２０×１０８０、１２８０×７２０、および６４０×３６０の３つの解像度についてのレート歪み曲線を含み得る。

【0116】

[00160]結論
[00161]したがって、レート歪み曲線およびレート歪みマップは、ターゲット構成を使用して各レート歪み曲線を実際に符号化することなく予測され得る。これは、計算リソースおよび時間を節約する。また、レート歪み曲線は、直接モードおよび間接モードを使用してより正確に予測され得る。

【0117】

[00162]システム
[00163]本明細書に開示される特徴および態様は、図３１に示されるように、１つまたは複数の通信ネットワークを介して複数のクライアントデバイスと通信するビデオストリーミングシステム３１００と併せて実施され得る。ビデオストリーミングシステム３１００の態様は、本開示に従って準備されたコンテンツの配給および配信を可能にするためのアプリケーションの一例を与えるように説明されるのに過ぎない。本技術は、ストリーミングビデオアプリケーションに限定されず、他のアプリケーションおよび配信機構に適合され得ることを理解されたい。

【0118】

[00164]一実施形態では、メディアプログラムプロバイダは、メディアプログラムのライブラリを含んでもよい。例えば、メディアプログラムは、サイト（例えば、ウェブサイト）、アプリケーション、またはブラウザを通じて集約および提供されてもよい。ユーザは、メディアプログラムプロバイダのサイトまたはアプリケーションにアクセスし、メディアプログラムを要求することができる。ユーザは、メディアプログラムプロバイダによって提供されるメディアプログラムのみを要求することに限定され得る。

【0119】

[00165]システム３１００において、ビデオデータは、ビデオコンテンツサーバ３１０２への入力として使用するために、１つまたは複数のソース、例えば、ビデオソース３１１０から取得され得る。入力ビデオデータは、任意の適切なデジタルフォーマット、例えば、ムービングピクチャーエクスパーツグループ（ＭＰＥＧ）－１、ＭＰＥＧ－２、ＭＰＥＧ－４、ＶＣ－１、Ｈ．２６４／高度ビデオコーディング（ＡＶＣ）、高効率ビデオコーディング（ＨＥＶＣ）、または他のフォーマットの生または編集されたフレームベースのビデオデータを備え得る。代替として、ビデオは、非デジタルフォーマットで提供され、スキャナまたはトランスコーダを使用してデジタルフォーマットに変換され得る。入力ビデオデータは、例えば、テレビエピソード、動画、および消費者に関心のある主要コンテンツとして生成される他のコンテンツなどの様々なタイプのビデオクリップまたは番組を含むことができる。ビデオデータは、音声も含んでもよく、または音声のみが使用されてもよい。

【0120】

[00166]ビデオストリーミングシステム３１００は、１つまたは複数のコンピュータにわたって分散された１つまたは複数のコンピュータサーバまたはモジュール３１０２、３１０４、および３１０７を含み得る。各サーバ３１０２、３１０４、３１０７は、１つまたは複数のデータストア３１０９、例えば、データベース、インデックス、ファイル、または他のデータ構造を含んでもよく、またはそれらに動作可能に結合されてもよい。ビデオコンテンツサーバ３１０２は、様々なビデオセグメントのデータストア（図示せず）にアクセスし得る。ビデオコンテンツサーバ３１０２は、クライアントデバイスと通信するユーザインターフェースコントローラによって指示されるようにビデオセグメントを供給することができる。本明細書で使用されるとき、ビデオセグメントは、テレビエピソード、動画、記録されたライブパフォーマンス、または他のビデオコンテンツを見るためにストリーミングビデオセッションにおいて使用され得るようなフレームベースのビデオデータの明確な部分を指す。

【0121】

[00167]いくつかの実施形態では、ビデオ広告サーバ３１０４は、特定の広告主またはメッセージのための広告として構成された比較的短いビデオ（例えば、１０秒、３０秒、または６０秒のビデオ広告）のデータストアにアクセスし得る。広告は、何らかの種類の支払いと引き換えに広告主に提供されてもよく、またはシステム３１００のための宣伝メッセージ、公共サービスメッセージ、もしくは何らかの他の情報を含んでもよい。ビデオ広告サーバ３１０４は、ユーザインターフェースコントローラ（図示せず）によって指示されるようにビデオ広告セグメントを供給してもよい。

【0122】

[00168]ビデオストリーミングシステム３１００は、事前分析最適化プロセス１１０を含むこともできる。

【0123】

[00169]ビデオストリーミングシステム３１００は、ビデオコンテンツおよびビデオ広告をストリーミングビデオセグメントに統合する統合およびストリーミングコンポーネント３１０７をさらに含んでもよい。例えば、ストリーミングコンポーネント３１０７は、コンテンツサーバまたはストリーミングメディアサーバであってもよい。コントローラ（図示せず）は、任意の適切なアルゴリズムまたはプロセスに基づいて、ストリーミングビデオ内の広告の選択または構成を決定することができる。ビデオストリーミングシステム３１００は、図３１に示されていない他のモジュールまたはユニット、例えば、管理サーバ、コマースサーバ、ネットワークインフラストラクチャ、広告選択エンジンなどを含み得る。

【0124】

[00170]ビデオストリーミングシステム３１００は、データ通信ネットワーク３１１２に接続してもよい。データ通信ネットワーク３１１２は、ローカルエリアネットワーク（ＬＡＮ）、広域通信網（ＷＡＮ）、例えば、インターネット、電話ネットワーク、ワイヤレスネットワーク３１１４（例えば、ワイヤレスセルラー電気通信ネットワーク（ＷＣＳ））、あるいはこれらのネットワークまたは類似のネットワークのいくつかの組合せを含み得る。

【0125】

[00171]１つまたは複数のクライアントデバイス３１２０は、データ通信ネットワーク３１１２、ワイヤレスネットワーク３１１４、または別のネットワークを介して、ビデオストリーミングシステム３１００と通信することができる。そのようなクライアントデバイスは、例えば、ＬＡＮのためのルータ３１１８を介して、ワイヤレスネットワーク３１１４のための基地局３１１７を介して、または何らかの他の接続を介して、１つまたは複数のラップトップコンピュータ３１２０－１、デスクトップコンピュータ３１２０－２、「スマート」モバイルフォン３１２０－３、タブレットデバイス３１２０－４、ネットワーク対応テレビ３１２０－５、またはそれらの組合せを含み得る。動作中、そのようなクライアントデバイス３１２０は、ユーザ入力デバイスから受信されたユーザ入力または他の入力に応答して、システム３１００にデータまたは命令を送信および受信し得る。これに応答して、システム３１００は、メディア番組の選択に応答して、データストア３１０９からのビデオセグメントおよびメタデータをクライアントデバイス３１２０に供給することができる。クライアントデバイス３１２０は、表示画面、プロジェクタ、または他のビデオ出力デバイスを使用して、メディアプレーヤ内のストリーミングビデオセグメントからビデオコンテンツを出力し、ビデオコンテンツと対話するためのユーザ入力を受信することができる。

【0126】

[00172]オーディオビデオデータの配信は、ストリーミングコンポーネント３１０７からリモートクライアントデバイスへ、コンピュータネットワーク、電気通信ネットワーク、およびそのようなネットワークの組合せを介して、様々な方法、例えばストリーミングを使用して実施され得る。ストリーミングでは、コンテンツサーバは、クライアントデバイス上で少なくとも部分的に動作するメディアプレーヤコンポーネントにオーディオビデオデータを連続的にストリーミングし、メディアプレーヤコンポーネントは、サーバからストリーミングデータを受信するのと同時にオーディオビデオデータを再生することができる。ストリーミングについて説明するが、他の配信方法を使用することもできる。メディアプレーヤコンポーネントは、コンテンツプロバイダからデータの最初の部分を受信した直後にビデオデータの再生を開始することができる。従来のストリーミング技術は、データのストリームをエンドユーザのセットに配信する単一のプロバイダを使用する。単一のストリームを多数の視聴者に配信するためには、高い帯域幅および処理能力が必要とされる場合があり、プロバイダの必要な帯域幅は、エンドユーザの数が増加するにつれて増加する場合がある。

【0127】

[00173]ストリーミングメディアは、オンデマンドまたはライブで配信され得る。ストリーミングは、ファイル内の任意の点での即時再生を可能にする。エンドユーザは、メディアファイルをスキップして、再生を開始するか、またはメディアファイル内の任意の点に再生を変更することができる。したがって、エンドユーザは、ファイルが徐々にダウンロードされるのを待つ必要がない。通常、ストリーミングメディアは、高帯域幅能力を有する少数の専用サーバから、ビデオファイルの要求を受け入れる専用デバイスを介して配信され、それらのファイルのフォーマット、帯域幅、および構造に関する情報を用いて、ビデオを再生するのに必要なデータ量だけを、ビデオを再生するのに必要な速度で配信する。ストリーミングメディアサーバは、宛先クライアント上のメディアプレーヤの伝送帯域幅および能力を考慮することもできる。ストリーミングコンポーネント３１０７は、ビデオが再生されるときに変化するネットワーク状態に適応するために、制御メッセージおよびデータメッセージを使用してクライアントデバイス３１２０と通信し得る。これらの制御メッセージは、クライアントにおいてファイルの特定の部分への早送り、早戻し、一時停止、またはシークなどの制御機能を可能にするためのコマンドを含むことができる。

【0128】

[00174]ストリーミングコンポーネント３１０７は、必要なときにのみ、必要とされるレートでビデオデータを送信するので、サービスされるストリームの数に対する正確な制御が維持され得る。視聴者は、より低いデータレートの伝送媒体を介して高いデータレートのビデオを視聴することができない。しかしながら、ストリーミングメディアサーバは、（１）ユーザにビデオファイルへのランダムアクセスを提供し、（２）誰がどのビデオ番組を視聴しているか、およびどれくらい長く視聴されているかの監視を可能にし、（３）視聴体験をサポートするために必要とされるデータ量のみが伝送されるため、伝送帯域幅をより効率的に使用し、（４）ビデオファイルは、視聴者のコンピュータに記憶されず、メディアプレーヤによって破棄され、したがって、コンテンツに対するさらなる制御を可能にする。

【0129】

[00175]ストリーミングコンポーネント３１０７は、ハイパーテキスト転送プロトコル（ＨＴＴＰ）およびリアルタイムメッセージングプロトコル（ＲＴＭＰ）などのＴＣＰベースのプロトコルを使用し得る。ストリーミングコンポーネント３１０７は、ライブウェブキャストを配信することもでき、マルチキャストすることができ、これにより、２つ以上のクライアントが単一のストリームに同調することが可能になり、したがって、帯域幅が節約される。ストリーミングメディアプレーヤは、メディアプログラムの任意の点へのランダムアクセスを提供するために、ビデオ全体をバッファリングすることに依存しない場合がある。その代わりに、これは、メディアプレーヤからストリーミングメディアサーバに送信される制御メッセージを使用して達成される。ストリーミングに使用される他のプロトコルは、ＨＴＴＰライブストリーミング（ＨＬＳ）またはＨＴＴＰ上の動的適応ストリーミング（ＤＡＳＨ）である。ＨＬＳおよびＤＡＳＨプロトコルは、通常は１つまたは複数のコンテンツ配信ネットワーク（ＣＤＮ）から様々なビットレートで利用可能にされる小さいセグメントのプレイリストを介してＨＴＴＰを介してビデオを配信する。これにより、メディアプレーヤは、セグメントごとにビットレートとコンテンツソースの両方を切り替えることができる。この切り替えは、ビデオの再生中に発生する可能性のあるネットワーク帯域幅の変動およびインフラストラクチャの障害を補償するのに役立つ。

【0130】

[00176]ストリーミングによるビデオコンテンツの配信は、様々なモデルの下で達成され得る。１つのモデルでは、ユーザは、ビデオ番組の視聴に対して支払いを行い、例えば、メディア番組のライブラリまたは制限されたメディア番組の一部へのアクセスに対して料金を支払い、またはペイパービューサービスを使用する。放送テレビによってその開始直後に広く採用されている別のモデルでは、スポンサーは、番組の提示中またはそれに隣接して広告を提示する権利と引き換えに、メディア番組の提示に対して支払いを行う。いくつかのモデルでは、広告はビデオ番組内の「広告スロット」「広告ブレイク」と呼ばれることがある所定の時間に挿入される。ストリーミングビデオでは、メディアプレーヤは、クライアントデバイスが、指定された広告スロット中に所定の広告を再生することもなくビデオを再生することができないように構成され得る。

【0131】

[00177]図３２を参照すると、ビデオコンテンツおよび広告を視聴するための装置３２００の概略図が示されている。選択された実施形態では、装置３２００は、プロセッサメモリ３２０４に動作可能に結合されたプロセッサ（ＣＰＵ）３２０２を含むことができ、プロセッサメモリは、プロセッサ３２０２による実行のためのバイナリコード化された機能モジュールを保持する。そのような機能モジュールは、入力／出力およびメモリアクセスなどのシステム機能を処理するためのオペレーティングシステム３２０６、ウェブページを表示するためのブラウザ３２０８、およびビデオを再生するためのメディアプレーヤ３２１０を含み得る。メモリ３２０４は、図３２に示されていない追加のモジュール、例えば、本明細書の他の箇所で説明される他の動作を実行するためのモジュールを保持し得る。

【0132】

[00178]バス３２１４または他の通信構成要素は、装置３２００内の情報の通信をサポートし得る。プロセッサ３２０２は、特定のタスクを定義する機械可読ソフトウェアコードを実行することによって、本明細書に開示される特徴および態様に従って特定のタスクを実行するように構成された、または動作可能な、専用または専用マイクロプロセッサであり得る。プロセッサメモリ３２０４（例えば、ランダムアクセスメモリ（ＲＡＭ）または他の動的記憶デバイス）は、バス３２１４に、またはプロセッサ３２０２に直接接続され、プロセッサ３２０２によって実行される情報および命令を記憶し得る。メモリ３２０４は、そのような命令の実行中に一時変数または他の中間情報を記憶することもできる。

【0133】

[00179]記憶装置３２２４内のコンピュータ可読媒体は、バス３２１４に接続され、プロセッサ３２０２のための静的情報および命令を記憶することができ、例えば、記憶装置（ＣＲＭ）３２２４は、装置３２００の電源がオフにされたときにオペレーティングシステム３２０６、ブラウザ３２０８、およびメディアプレーヤ３２１０のためのモジュールを記憶することができ、装置３２００の電源がオンにされたときに、そこからモジュールをプロセッサメモリ３２０４にロードすることができる。記憶デバイス３２２４は、情報、命令、またはそれらの何らかの組合せ、例えば、プロセッサ３２０２によって実行されたとき、本明細書で説明する方法の１つまたは複数の動作を実行するように装置３２００を構成させるかまたは動作可能にさせる命令を保持する非一時的コンピュータ可読記憶媒体を含み得る。

【0134】

[00180]ネットワーク通信（ｃｏｍｍ．）インターフェース３２１６も、バス３２１４に接続され得る。ネットワーク通信インターフェース３２１６は、任意選択でルータ／モデム３２２６および有線またはワイヤレス接続３２２５を介して、装置３２００と１つまたは複数の外部デバイス、例えばストリーミングシステム３１００との間の双方向データ通信を提供またはサポートすることができる。代替として、または追加的に、装置３２００は、アンテナ３２２９に接続された送受信機３２１８を含み得、それを通して、装置３２００は、ワイヤレス通信システムのためのベースステーションと、またはルータ／モデム３２２６とワイヤレスに通信し得る。代替として、装置３２００は、ローカルエリアネットワーク、バーチャル・プライベート・ネットワーク、または他のネットワークを介してビデオストリーミングシステム３１００と通信し得る。別の代替形態では、装置３２００は、システム３１００のモジュールまたは構成要素として組み込まれ、バス３２１４を介して、または何らかの他のモダリティによって他の構成要素と通信し得る。

【0135】

[00181]装置３２００は、（例えば、バス３２１４およびグラフィック処理ユニット３２２０を介して）ディスプレイユニット３２２８に接続されてもよい。ディスプレイ３２２８は、装置３２００のオペレータに情報を表示するための任意の適切な構成を含み得る。例えば、ディスプレイ３２２８は、液晶ディスプレイ（ＬＣＤ）、タッチスクリーンＬＣＤ（例えば、容量性ディスプレイ）、発光ダイオード（ＬＥＤ）ディスプレイ、プロジェクタ、または他のディスプレイ装置を含むかまたは利用して、視覚ディスプレイにおいて装置３２００のユーザに情報を提示することができる。

【0136】

[00182]１つまたは複数の入力デバイス３２３０（例えば、英数字キーボード、マイクロフォン、キーパッド、リモートコントローラ、ゲームコントローラ、カメラ、またはカメラアレイ）が、装置３２００に情報およびコマンドを通信するために、ユーザ入力ポート３２３２を介してバス３２１４に接続され得る。選択された実施形態では、入力装置３２３０は、カーソルの位置決めに対する制御を提供またはサポートすることができる。ポインティングデバイスとも呼ばれるそのようなカーソル制御デバイスは、マウス、トラックボール、トラックパッド、タッチスクリーン、カーソル方向キー、または物理的な動きを受信または追跡し、その動きをカーソルの動きを示す電気信号に変換するための他のデバイスとして構成され得る。カーソル制御装置は、例えばタッチセンシティブスクリーンを用いて、ディスプレイユニット３２２８に組み込まれてもよい。カーソル制御装置は、方向情報およびコマンド選択をプロセッサ３２０２に通信し、ディスプレイ３２２８上のカーソル移動を制御することができる。カーソル制御装置は、例えば、装置が平面または３次元空間におけるカーソル位置を指定することを可能にする２以上の自由度を有してもよい。

【0137】

[00183]いくつかの実施形態は、命令実行システム、装置、システム、または機械によって、またはそれらと関連して使用するための非一時的コンピュータ可読記憶媒体において実施され得る。コンピュータ可読記憶媒体は、いくつかの実施形態によって説明される方法を実行するようにコンピュータシステムを制御するための命令を含む。コンピュータシステムは、１つまたは複数のコンピューティングデバイスを含み得る。命令は、１つまたは複数のコンピュータプロセッサによって実行されるとき、いくつかの実施形態で説明されるものを実行するように構成され得、または動作可能であり得る。

【0138】

[00184]本明細書の説明においておよび以下の特許請求の範囲全体を通して使用されるとき、「ａ」、「ａｎ」、および「ｔｈｅ」は、文脈上が明らかに別段指示しない限り、複数の言及を含む。また、本明細書の説明においておよび以下の特許請求の範囲全体を通して使用されるとき、「ｉｎ」の意味は、文脈上別段明確に指示しない限り、「ｉｎ」および「ｏｎ」を含む。

【0139】

[00185]上記の説明は、いくつかの実施形態の態様がどのように実施され得るかの例とともに、様々な実施を示す。上記の例および実施形態は、唯一の実施形態であると見なされるべきではなく、以下の特許請求の範囲によって定められるようないくつかの実施形態の柔軟性および利点を例示するために提示される。上記の開示および以下の特許請求の範囲に基づいて、特許請求の範囲によって定められる本発明の範囲から逸脱することなく、他の構成、実施形態、実施、および均等物が採用されてもよい。

【図1】