【文献】
吉村雄司(外1名),「ランキング制御によるユーザセントリック型コンテンツ配信」,電子情報通信学会技術研究報告,日本,社団法人電子情報通信学会,2012年 3月 5日,Vol.111, No.476,第7〜12頁,ISSN:0913-5685
(58)【調査した分野】(Int.Cl.,DB名)
ビデオストリーム情報を取得するステップであって、前記ビデオストリーム情報が、ビデオフレームタイプ、ビデオフレームサイズ、フレームレート、およびビットレートを備えるステップと、
前記ビデオストリーム情報に従ってビデオコンテンツ複雑性を計算するステップであって、前記ビデオコンテンツ複雑性が、時間複雑性を備えるステップと、
前記ビットレート、前記フレームレート、および前記ビデオコンテンツ複雑性に従って、ビデオ符号化圧縮品質を計算するステップと、
を備え、
前記ビデオストリーム情報に従ってビデオコンテンツ複雑性を計算する前記ステップは、
前記ビデオフレームタイプおよび前記ビデオフレームサイズに従って、前記あらかじめ定められた時間内にIフレームの平均サイズを計算するステップと、
前記ビットレート対前記Iフレームの前記平均サイズの比率に従って、前記時間複雑性を決定するステップとを備えることを特徴とするビデオ符号化圧縮品質を取得するための方法。
前記ビデオストリームの前記総データ量が、受信したビデオストリームのデータ量と、失われたビデオストリームのデータ量の合計であることを特徴とする請求項2に記載の方法。
ビデオストリーム情報を取得するように構成された情報取得ユニットであって、前記ビデオストリーム情報が、ビデオフレームタイプ、ビデオフレームサイズ、フレームレート、およびビットレートを備える情報取得ユニットと、
前記情報取得ユニットによって取得された前記ビデオストリーム情報に従って、ビデオコンテンツ複雑性を計算するように構成された複雑性計算ユニットであって、前記ビデオコンテンツ複雑性が、時間複雑性を備える複雑性計算ユニットであって、
前記複雑性計算ユニットは、前記ビデオフレームタイプおよびビデオフレームサイズに従って、前記あらかじめ定められた時間内にIフレームの平均サイズを計算して、前記ビットレート対前記Iフレームの前記平均サイズの比率に従って、前記時間複雑性を決定するように構成された第1の時間サブユニットを備える複雑性計算ユニットと、
前記情報取得ユニットによって取得された前記ビットレートおよび前記フレームレート、ならびに前記複雑性計算ユニットによって取得された前記ビデオコンテンツ複雑性に従って、ビデオ符号化圧縮品質を計算するように構成された品質評価ユニットとを備えることを特徴とするビデオ符号化圧縮品質を取得するための装置。
前記評価サブユニットが、前記フレームレートが24以上であるとき、前記ビデオ品質評価パラメータの最大値と、前記ビデオ符号化圧縮歪みとの間の差を、前記ビデオ符号化圧縮品質として使用する、または、前記フレームレートが24以下であるとき、前記ビデオコンテンツ複雑性および前記フレームレートに基づいて、前記ビデオ品質評価パラメータの前記最大値と、前記ビデオ符号化圧縮歪みとの間の差を修正して、前記修正された結果を前記ビデオ符号化圧縮品質として使用するように特に構成されることを特徴とする請求項18に記載の装置。
【発明の概要】
【課題を解決するための手段】
【0006】
本発明の実施形態は、従来技術における問題を解決するために、評価の複雑性を低減することができ、またビデオ品質をリアルタイムに評価することを可能にする、ビデオ符号化圧縮品質を取得するための方法および装置を提供する。
【0007】
前述の技術的な問題を解決するために、本発明の実施形態は、以下の技術的ソリューションを開示する。
【0008】
一態様によれば、本発明の実施形態は、
ビデオストリーム情報を取得するステップであって、ビデオストリーム情報が、ビデオフレームタイプ、ビデオフレームサイズ、フレームレート、およびビットレートを含むステップと、
ビデオストリーム情報に従ってビデオコンテンツ複雑性を計算するステップであって、ビデオコンテンツ複雑性が、時間複雑性、または空間複雑性、あるいは時間複雑性と空間複雑性の両方を含むステップと、
ビットレート、フレームレート、およびビデオコンテンツ複雑性に従って、ビデオ符号化圧縮品質を計算するステップとを含む、ビデオ符号化圧縮品質を取得するための方法を提供する。
【0009】
さらに、ビデオストリーム情報を取得するステップは、
ビデオフレームタイプ、ビデオフレームサイズ、およびフレームレートを取得するステップと、
あらかじめ定められた時間内に、ビデオストリームの総データ量を取得するステップと、
ビデオストリームの総データ量対あらかじめ定められた時間の比率に従ってビットレートを決定するステップとを含む。
【0010】
さらに、ビデオストリームの総データ量は、受信したビデオストリームのデータ量と、失われたビデオストリームのデータ量の合計である。
【0011】
さらに、ビデオコンテンツ複雑性が時間複雑性を含むとき、ビデオストリーム情報に従ってビデオコンテンツ複雑性を計算するステップは、
ビデオフレームタイプおよびビデオフレームサイズに従って、あらかじめ定められた時間内にIフレームの平均サイズを計算するステップと、
ビットレート対Iフレームの平均サイズの比率に従って、時間複雑性を決定するステップとを含み、
ビデオコンテンツ複雑性が空間複雑性を含むとき、ビデオストリーム情報に従ってビデオコンテンツ複雑性を計算するステップは、
ビデオフレームタイプおよびビデオフレームサイズに従って、あらかじめ定められた時間内にPフレームの平均サイズを計算するステップと、
ビットレート対Pフレームの平均サイズの比率に従って、空間複雑性を決定するステップとを含む。
【0012】
【数1】
【0013】
さらに、時間複雑性は、具体的には、
【0014】
【数2】
【0015】
であり、上式で、TCCは時間複雑性であり、BRはビットレートであり、ABIはIフレームの平均サイズであり、a
0は定数である。
【0016】
さらに、ビデオストリーム情報はビデオフレーム量子化パラメータをさらに含み、
ビデオコンテンツ複雑性が時間複雑性を含むとき、ビデオストリーム情報に従ってビデオコンテンツ複雑性を計算するステップは、
ビデオフレーム量子化パラメータの場合、ビデオフレームタイプに従ってPフレームの各ピクセルのビット数を計算するステップと、
Pフレームの各ピクセルのビット数と、ビデオフレーム量子化パラメータに対応する第1のパラメトリック値とに従って、時間複雑性を計算するステップとを含み、
ビデオコンテンツ複雑性が空間複雑性を含むとき、ビデオストリーム情報に従ってビデオコンテンツ複雑性を計算するステップは、
ビデオフレーム量子化パラメータの場合、ビデオフレームタイプに従って、Iフレームの各ピクセルのビット数を計算するステップと、
Iフレームの各ピクセルのビット数と、ビデオフレーム量子化パラメータに対応する第2のパラメトリック値とに従って、空間複雑性を計算するステップとを含む。
【0017】
さらに、ビットレート、フレームレート、およびビデオコンテンツ複雑性に従って、ビデオ符号化圧縮品質を計算するステップの前に、該方法は、
ビットレートおよびフレームレートに従って、修正されたビットレートを計算するステップをさらに含み、
ビットレート、フレームレート、およびビデオコンテンツ複雑性に従って、ビデオ符号化圧縮品質を計算するステップは、
修正されたビットレート、フレームレート、およびビデオコンテンツ複雑性に従って、ビデオ符号化圧縮品質を計算するステップを含む。
【0018】
さらに、ビットレートおよびフレームレートに従って、修正されたビットレートを計算するステップは、
取得されたフレームレートと基準フレームレートとの間の、より小さい値を決定するステップと、
ビットレート対より小さい値の比率に従って、修正されたビットレートを決定するステップとを含む。
【0019】
さらに、修正されたビットレートは、具体的には、
【0020】
【数3】
【0021】
であり、上式で、MBRは修正されたビットレートであり、BRはビットレートであり、fpsはフレームレートであり、30は基準フレームレートである。
【0022】
さらに、修正されたビットレート、フレームレート、およびビデオコンテンツ複雑性に従って、ビデオ符号化圧縮品質を計算するステップは、
修正されたビットレート、ビデオコンテンツ複雑性、およびビデオ品質評価パラメータに従って、ビデオ符号化圧縮歪みを計算するステップと、
ビデオ符号化圧縮歪み、およびフレームレートに従って、ビデオ符号化圧縮品質を計算するステップとを含む。
【0023】
さらに、ビデオコンテンツ複雑性が空間複雑性だけを含むとき、ビデオ符号化圧縮歪みは、具体的には、
【0024】
【数4】
【0025】
であり、上式で、VD
cはビデオ符号化圧縮歪みであり、MOSはビデオ品質評価パラメータであり、MOS
maxはビデオ品質評価パラメータの最大値であり、MOS
minはビデオ品質評価パラメータの最小値であり、MBRは修正されたビットレートであり、TCCは時間複雑性であり、a
1、a
2、a
3、およびa
4は定数である。
【0026】
さらに、ビデオ符号化圧縮歪み、およびフレームレートに従って、ビデオ符号化圧縮品質を計算するステップは、
フレームレートが24以上であるとき、ビデオ品質評価パラメータの最大値と、ビデオ符号化圧縮歪みとの間の差を、ビデオ符号化圧縮品質として使用するステップ、または、
フレームレートが24以下であるとき、ビデオコンテンツ複雑性およびフレームレートに基づいて、ビデオ品質評価パラメータの最大値と、ビデオ符号化圧縮歪みとの間の差を修正して、修正された結果をビデオ符号化圧縮品質として使用するステップを含む。
【0027】
さらに、ビデオ符号化圧縮品質は、具体的には、
【0028】
【数5】
【0029】
である。
【0030】
別の態様によれば、本発明の実施形態は、
ビデオストリーム情報を取得するように構成された情報取得ユニットであって、ビデオストリーム情報が、ビデオフレームタイプ、ビデオフレームサイズ、フレームレート、およびビットレートを含む情報取得ユニットと、
情報取得ユニットによって取得されたビデオストリーム情報に従って、ビデオコンテンツ複雑性を計算するように構成された複雑性計算ユニットであって、ビデオコンテンツ複雑性が、時間複雑性、または空間複雑性、あるいは時間複雑性と空間複雑性の両方を含む複雑性計算ユニットと、
情報取得ユニットによって取得されたビットレートおよびフレームレート、ならびに複雑性計算ユニットによって取得されたビデオコンテンツ複雑性に従って、ビデオ符号化圧縮品質を計算するように構成された品質評価ユニットとを含む、ビデオ符号化圧縮品質を取得するための装置をさらに提供する。
【0031】
さらに、情報取得ユニットは、
あらかじめ定められた時間内に、ビデオストリームの総データ量を取得して、ビデオストリームの総データ量対あらかじめ定められた時間の比率に従ってビットレートを決定するように構成された、ビットレート取得サブユニットを含む。
【0032】
さらに、複雑性計算ユニットは、
ビデオコンテンツ複雑性が時間複雑性を含むとき、ビデオフレームタイプおよびビデオフレームサイズに従って、あらかじめ定められた時間内にIフレームの平均サイズを計算して、ビットレート対Iフレームの平均サイズの比率に従って、時間複雑性を決定するように構成された第1の時間サブユニットと、
ビデオコンテンツ複雑性が空間複雑性を含むとき、情報取得ユニットによって取得されたビデオフレームタイプおよびビデオフレームサイズに従って、あらかじめ定められた時間内にPフレームの平均サイズを計算して、ビットレート対Pフレームの平均サイズの比率に従って、空間複雑性を決定するように構成された第1の空間サブユニットとを含む。
【0033】
さらに、複雑性計算ユニットは、
情報取得ユニットによって取得されたビデオストリーム情報が、ビデオフレーム量子化パラメータをさらに含み、ビデオコンテンツ複雑性が時間複雑性を含むとき、ビデオフレーム量子化パラメータの場合、ビデオフレームタイプに従って、Pフレームの各ピクセルのビット数を計算して、Pフレームの各ピクセルのビット数、およびビデオフレーム量子化パラメータに対応する第1のパラメトリック値に従って、時間複雑性を計算するように構成された第2の時間サブユニットと、
情報取得ユニットによって取得されたビデオストリーム情報が、ビデオフレーム量子化パラメータをさらに含み、ビデオコンテンツ複雑性が空間複雑性を含むとき、ビデオフレーム量子化パラメータのとき、ビデオフレームタイプに従って、Iフレームの各ピクセルのビット数を計算して、Iフレームの各ピクセルのビット数、およびビデオフレーム量子化パラメータに対応する第2のパラメトリック値に従って、空間複雑性を計算するように構成された第2の空間サブユニットとを含む。
【0034】
さらに、該装置は、
品質評価ユニットが、ビットレート、フレームレート、およびビデオコンテンツ複雑性に従って、ビデオ符号化圧縮品質を決定する前に、ビットレートおよびフレームレートに従って、修正されたビットレートを計算するように構成されたビットレート修正ユニットをさらに含み、
品質評価ユニットが、ビットレート修正ユニットによって取得された修正されたビットレート、フレームレート、およびビデオコンテンツ複雑性に従って、ビデオ符号化圧縮品質を計算するように特に構成される。
【0035】
さらに、ビットレート修正ユニットは、
情報取得ユニットによって取得されたフレームレートと基準フレームレートとの間の、より小さい値を決定するように構成された比較サブユニットと、
ビットレート対より小さい値の比率に従って、修正されたビットレートを決定するように構成された計算サブユニットとを含む。
【0036】
さらに、品質評価ユニットは、
ビットレート修正ユニットによって取得された修正されたビットレート、ビデオコンテンツ複雑性、およびビデオ品質評価パラメータに従って、ビデオ符号化圧縮歪みを計算するように構成された歪み計算サブユニットと、
ビデオ符号化圧縮歪み、およびフレームレートに従って、ビデオ符号化圧縮品質を計算するように構成された評価サブユニットとを含む。
【0037】
さらに、評価サブユニットは、フレームレートが24以上であるとき、ビデオ品質評価パラメータの最大値と、ビデオ符号化圧縮歪みとの間の差を、ビデオ符号化圧縮品質として使用する、または、フレームレートが24以下であるとき、ビデオコンテンツ複雑性およびフレームレートに基づいて、ビデオ品質評価パラメータの最大値と、ビデオ符号化圧縮歪みとの間の差を修正して、修正された結果をビデオ符号化圧縮品質として使用するように特に構成される。
【0038】
別の態様によれば、本発明の実施形態は、第1のトランシーバと、第1のプロセッサとを含む端末であって、
第1のトランシーバが、ビデオストリームを受信するように構成され、
第1のプロセッサが、第1のトランシーバによって受信されたビデオストリームからビデオストリーム情報を取得して、ビデオストリーム情報が、ビデオフレームタイプ、ビデオフレームサイズ、フレームレート、およびビットレートを含み、ビデオストリーム情報に従ってビデオコンテンツ複雑性を計算して、ビデオコンテンツ複雑性が、時間複雑性、または空間複雑性、あるいは時間複雑性と空間複雑性の両方を含み、ビットレート、フレームレート、およびビデオコンテンツ複雑性に従って、ビデオ符号化圧縮品質を計算するように構成される端末をさらに提供する。
【0039】
別の態様によれば、本発明の実施形態は、第2のトランシーバと、第2のプロセッサとを含む端末であって、
第2のトランシーバが、ビデオストリームを送信するように構成され、
第2のプロセッサが、第2のトランシーバによって送信されたビデオストリームからビデオストリーム情報を取得して、ビデオストリーム情報が、ビデオフレームタイプ、ビデオフレームサイズ、フレームレート、およびビットレートを含み、ビデオストリーム情報に従ってビデオコンテンツ複雑性を計算して、ビデオコンテンツ複雑性が、時間複雑性、または空間複雑性、あるいは時間複雑性と空間複雑性の両方を含み、ビットレート、フレームレート、およびビデオコンテンツ複雑性に従って、ビデオ符号化圧縮品質を計算するように構成される端末をさらに提供する。
【0040】
別の態様によれば、本発明の実施形態は、ネットワーク側に配置され、第3のトランシーバと、第3のプロセッサとを含むサーバであって、
第3のトランシーバが、伝送端から受信端にビデオストリームを伝送するように構成され、
第3のプロセッサが、第3のトランシーバによって伝送されたビデオストリームからビデオストリーム情報を取得して、ビデオストリーム情報が、ビデオフレームタイプ、ビデオフレームサイズ、フレームレート、およびビットレートを含み、ビデオストリーム情報に従ってビデオコンテンツ複雑性を計算して、ビデオコンテンツ複雑性が、時間複雑性、または空間複雑性、あるいは時間複雑性と空間複雑性の両方を含み、ビットレート、フレームレート、およびビデオコンテンツ複雑性に従って、ビデオ符号化圧縮品質を計算するように構成されるサーバをさらに提供する。
【0041】
本発明の実施形態では、ビデオストリームのビデオフレーム情報、ビットレート、フレームレート、およびビデオコンテンツ複雑性が取得される限り、ビデオ符号化圧縮品質を取得することができる。ビデオ符号化圧縮品質は、後続のビデオ品質評価において使用され得る。この処理では、完全な元の基準ビデオおよび完全な端末ビデオを取得して、特定のMVまたはビデオストリームの残余を深く解析する必要はない。この処理はビデオ品質評価の複雑性を大いに低減し、評価をリアルタイムに実行することができるようになる。さらに、ビデオコンテンツ特性(すなわち、ビデオコンテンツ複雑性)の影響、およびフレームレートの影響が考慮されるので、評価された符号化圧縮品質は、人間の目の主観的感覚をより良く満足させる。
【0042】
本発明の実施形態における、または従来技術における技術的ソリューションをより明確に説明するために、以下で、実施形態または従来技術を説明するために必要な添付の図面を簡単に紹介する。創造的努力なしに、当業者がこれらの添付の図面から他の図面を依然として導き出すことができることは明らかである。
【発明を実施するための形態】
【0044】
当業者が、本発明の実施形態における技術的ソリューションをより良く理解できるようにするために、また本発明の実施形態の前述の目的、特徴、および利点をより明確かつより分かりやすくするために、以下で、添付の図面を参照して、本発明の実施形態の技術的ソリューションをより詳細に説明する。
【0045】
図1を参照すると、
図1は、本発明によるビデオ符号化圧縮品質を取得するための方法の第1の実施形態のフローチャートである。
【0046】
本発明のこの実施形態によって提供される方法は、ビデオストリームを送信するための伝送端に適用されてもよく、またビデオストリームを伝送するためのネットワーク側に適用されてもよく、ビデオストリームを受信するための受信端に適用されてもよい。該方法は、以下を含み得る。
【0047】
ステップ101:ビデオストリーム情報を取得する。ビデオストリーム情報は、ビデオフレームタイプ、ビデオフレームサイズ、フレームレート、およびビットレートを含む。
【0048】
本発明のこの実施形態では、まずビデオストリーム情報が取得される。該情報は、ビデオフレームタイプ、ビデオフレームサイズ、フレームレート、およびビットレートを含むことができ、もちろん他の情報、たとえばビデオフレーム量子化パラメータなども含むことができる。
【0049】
ビデオフレームタイプは、具体的には、Iフレーム(Iフレームは、ビデオのフレーム内符号化フレームを指す)、およびPフレーム(Pフレームは、ビデオのフレーム間符号化フレームを指す)でよい。また、フレームタイプは、既存のフレームタイプ検出方法によって、またはデータストリームを解析することなどによって取得され得る。ビデオストリーム内のビデオフレームのサイズは、バイト(byte)、ビット(bit)、またはキロビット(Kbit)でよい。ビットレートの単位がキロビット/秒(Kbps)であるとき、ビデオフレームサイズの単位はキロビット(Kbit)である。
【0050】
フレームレートは、ネットワーク伝送によって事前設定または取得されてもよく、また、RTPタイムスタンプに従って推定されてもよい。RTPタイムスタンプによって表わされる時間は、クロック周波数計算を通じて取得される。フレームレート=クロック周波数/表示順で隣接する2つのフレーム間のRTPタイムスタンプの増分である。通常、ビデオのクロック周波数は9000である。ビットレートは、1秒当たりのビデオデータ量である。計算についての詳細は、以下の実施形態の説明を参照されたい。
【0051】
ステップ102:ビデオストリーム情報に従ってビデオコンテンツ複雑性を計算する。ビデオコンテンツ複雑性は、時間複雑性、または空間複雑性、あるいは時間複雑性と空間複雑性の両方を含む。
【0052】
本発明の方法のこの実施形態では、ビデオコンテンツ複雑性は、時間複雑性だけを含んでもよく、空間複雑性だけを含んでもよく、また両方の複雑性を含んでもよい。時間複雑性が計算されるとき、時間複雑性は、ビデオフレーム内のIフレームのサイズと、前述のステップで取得されたビットレートとに従って具体的に決定することができ、また、ビデオストリーム情報がビデオフレーム量子化パラメータをさらに含むとき、量子化パラメータに対応するPフレームの各ピクセルに対応するバイト数によって決定することもできる。空間複雑性が計算されるとき、空間複雑性は、ビデオフレーム内のPフレームのサイズ、および前述のステップで取得されたビットレートに従って具体的に決定することができ、また、ビデオストリーム情報がビデオフレーム量子化パラメータをさらに含むとき、量子化パラメータに対応するIフレームの各ピクセルに対応するバイト数に従って決定することもできる。詳細については、以下の実施形態の説明を参照されたい。
【0053】
ステップ103:ビットレート、フレームレート、およびビデオコンテンツ複雑性に従って、ビデオ符号化圧縮品質を計算する。
【0054】
ビットレートの後、フレームレートおよびビデオコンテンツ複雑性が取得されて、その3つに従ってビデオ符号化圧縮品質が直接決定され得る。また、ビットレートおよびビデコンテンツ複雑性に従って、まずビデオ符号化圧縮歪みを決定することができ、次いで、ビデオ符号化圧縮歪みおよびフレームレートに従ってビデオ符号化圧縮品質が決定される。
【0055】
ビデオ符号化圧縮品質は、ビデオストリーム全体の品質を正確に評価する基礎である。ビデオ符号化圧縮品質に基づいて、ネットワークビデオの品質が評価され得る。一般的に、比較的高いビデオ符号化圧縮品質は、高いネットワークビデオ品質につながる。
【0056】
本発明のこの実施形態では、前述のステップにおいて、ビデオストリームのビデオフレーム情報、ビットレート、フレームレート、およびビデオコンテンツ複雑性が取得される限り、ビデオ符号化圧縮品質を取得することができる。この処理では、完全な元の基準ビデオおよび完全な端末ビデオを取得して、特定のMVまたはビデオストリームの残余を深く解析する必要はない。これによって、ビデオ品質評価の複雑性が大いに低減し、評価をリアルタイムに実行することができるようになる。さらに、ビデオコンテンツ特性(すなわち、ビデオコンテンツ複雑性)の影響、およびフレームレートの影響が考慮されるので、評価された符号化圧縮品質は、人間の目の主観的感覚をより良く満足させる。
【0057】
図2を参照すると、
図2は、本発明による、ビデオ符号化圧縮品質を取得するための方法の第2の実施形態のフローチャートである。
【0058】
この実施形態は、該方法が、ビデオストリームを伝送するためにネットワーク側に適用される、またはビデオストリームを受信するために受信端に適用される例を使用することによって説明される。該方法は、以下を含み得る。
【0059】
ステップ201:あらかじめ定められた時間内に、ビデオストリーム情報を取得する。ビデオストリーム情報は、Iフレームのサイズ、フレームレート、およびビデオストリームの総データ量を含む。
【0060】
このステップでは、一定の時間内にビデオストリームがまず受信され、時間はMTとして表わされ、次いでビデオストリーム内の情報が取得される。
【0061】
ビデオストリーム内のIフレームが、ビデオフレームのサイズを使用することによって、またはデータストリームを解析することによって取得されて、Iフレームのサイズがさらに取得され、
RTPタイムスタンプに従って、事前設定されたフレームレートが取得されるか、フレームレートが取得され、フレームレートがfpsとしてマークされ、
受信されたビデオデータパケットまたはビデオフレームに従って、失われたデータパケットまたはビデオフレームがあるかどうかが推測され、ある場合、失われたデータパケットまたはビデオフレームのデータ量が推測され、次いで、受信されたデータパケットまたはビデオフレームのデータ量と失われたデータ量との合計が計算され、MT内のビデオストリームの総データ量を取得できるようにして、総データ量は、ΣRTPpayloadSize(ビデオデータパケットのペイロードの総データ量)、またはΣFrameSize(ビデオフレームの総データ量)としてマークされる。失われたデータ量は、受信されたデータパケットまたはビデオフレームのデータ量に従って推測することができ、多くの方法がある。たとえば、失われたパケットのサイズは、正確に受信された以前のパケットのサイズと等しく、または失われたビデオフレームのサイズは、正確に受信された以前のフレームのサイズと等しい。
【0062】
もちろん、前述のビデオストリーム情報は、ここには列挙されていない他の方法で取得することもできる。
【0063】
ステップ202:ビットレートを取得するために、ビデオストリームの総データ量対時間の比率を計算する。
【0068】
であり、ビットレートの単位はキロビット/秒である。
【0069】
もちろん、ビデオストリームの総データ量対時間の比率の関数が、ビットレートとして使用されてもよい。
【0070】
ステップ203:ビットレートおよびフレームレートに従って、修正されたビットレートを計算する。
【0071】
フレームレートの低減は、単一フレームの画質の向上につながる場合がある。したがって、この実施形態において修正されたビットレートを取得するために、前述の計算を通じて取得されたビットレートもフレームレートに従って修正され得る。具体的には、修正されたビットレートを取得する処理は、以下のステップ301〜302を含み得る。
【0072】
ステップ301:ビデオストリームから取得されたフレームレートと基準フレームレートとの間のより小さい値を決定する。
【0073】
人間の目の視覚機能の持続性のため、人間の目は、1秒当たり30フレームを超えるピクチャを区別することができない。したがって、30のフレームレートが基準として使用されてよく、すなわち、基準フレームレートは30でよい。もちろん、必要に応じて他の数が選択されてもよい。さらに、より小さい値、すなわちMin(fps, 30)が取得される。
【0074】
ステップ302:計算されたビットレート対前述のより小さい値の比率に従って、修正されたビットレートを決定する。
【0075】
修正されたビットレートはMBRとしてマークされ、
【0077】
である。他の実施形態では、この比率の別の倍数または関数も、修正されたビットレートとして選択されてよい。
【0078】
ステップ203は、修正されたビットレートを使用する必要があるときに実行されてよく、この実施形態における順序に限定されない。他の実施形態では、ステップ203は含まれない場合がある。すなわち、後続の計算は、修正されたビットレートを使用することなしに、ビットレートが取得された後にビットレートに従って直接実行される。
【0079】
ステップ204:ビットレート対Iフレームのサイズの比率に従って、時間複雑性を決定する。
【0080】
ビデオ内に符号化圧縮歪みがあるとき、異なるビデオコンテンツ複雑性、すなわち、異なる時間複雑性および空間複雑性のために、同じビットレートで異なるデータストリームの主観的経験の間に大きな差がある。より低いビットレートの場合は特に、リッチなコンテンツを有するデータストリームの主観的経験は、シンプルなコンテンツを有するデータストリームの主観的経験よりも明らかに劣る。したがって、ビデオ符号化圧縮品質が計算されるとき、ビデオコンテンツ複雑性を考慮する必要がある。この実施形態では、説明のための例として時間コンテンツ複雑性が使用される。
【0081】
大量のデータストリームの統計解析実験によって、特定のビットレートの場合、大きな時間複雑性のシーケンスのP/Bフレームは、一般的に、より小さい時間複雑性のシーケンスのP/Bフレームよりも多いが、平均的なIフレームのP/Bフレームよりも少ない。したがって、ビットレートBR対Iフレームの平均サイズの比率は、ビデオコンテンツ特性のうちの1つ、すなわち時間複雑性を、ある程度反映することができる。時間複雑性は、TCCとしてマークされる。
【0082】
時間複雑性を決定するための方法は、具体的には、以下のステップ401〜402を含み得る。
【0083】
ステップ401:あらかじめ定められた時間内に、Iフレームのサイズに従って、Iフレームの平均サイズを決定する。
【0084】
このステップでは、あらかじめ定められた時間内に、ビデオストリームのすべてのIフレームを取得することができ、次いで、すべてのIフレームのサイズの平均値が、Iフレームの平均サイズとして決定される。また、平均値は、Iフレームのうちのいくつかを選択することによって計算することができる。Iフレームの平均サイズはABIとしてマークされる。
【0085】
ステップ402:ビットレート対Iフレームの平均サイズの比率に従って、時間複雑性を決定する。
【0086】
具体的には、時間複雑性は、以下の式を使用することによって計算することができる。
【0089】
ステップ205:修正されたビットレート、時間複雑性、およびビデオ品質評価パラメータに従って、ビデオ符号化圧縮歪みを計算する。
【0090】
ビデオのより大きい時間複雑性は、同じビットレートで、より大きい圧縮歪みにつながる。具体的には、歪みは以下の式に従って計算することができる。
【0092】
上式で、VD
cはビデオ符号化圧縮歪みであり、MOSはビデオ品質評価パラメータであり、MOS
maxはビデオ品質評価パラメータの最大値であって、ビデオの最高点であり(5段階マーキングシステムの場合は、5点)、MOS
minはビデオ品質評価パラメータの最小値であって、ビデオの最小点であり(5段階マーキングシステムの場合は、1点)、a
1、a
2、a
3、およびa
4は定数である。
【0093】
別の実施形態では、ビデオ符号化圧縮品質は、修正されたビットレートおよび時間複雑性に従って直接取得することもできる。別の実施形態では、ステップ203が実行されない場合、ステップ202で取得されたビットレートは修正されず、ビデオ符号化圧縮歪みまたはビデオ符号化圧縮品質も、ビットレートおよび時間複雑性に従って直接取得することができる。
【0094】
ステップ206:ビデオ符号化圧縮歪みおよびフレームレートに従って、ビデオ符号化圧縮品質を計算する。
【0095】
ビデオ符号化圧縮品質は、ビデオ品質評価パラメータの最大値と、ビデオ符号化圧縮歪みとの間の差を指す。しかしながら、ビデオのフレームレートが低下すると、再生中にビデオに時間的不連続性が発生する。より小さいフレームレートは、より明らかな不連続性、およびより劣った圧縮品質につながる。フレームレートの影響を考慮すると、ビデオ符号化圧縮品質は、具体的には、以下の式に従って計算することができる。
【0097】
フレームレートが24以上であるとき、ビデオ品質評価パラメータの最大値と、ビデオ符号化圧縮歪みとの間の差が、ビデオ符号化圧縮品質として使用される。フレームレートfpsが24を下回るとき、ビデオ再生中に不連続性が発生する。したがって、圧縮品質がある程度低下する。この場合、ビデオ品質評価パラメータの最大値と、ビデオ符号化圧縮歪みとの間の差が、時間複雑性に基づいて修正され、修正された結果が、ビデオ符号化圧縮品質として使用される。上式で、a
5とb
5の両方が定数であり、より小さいフレームレート、またはより大きい時間複雑性が、より劣った圧縮品質につながる。いくつかの適用シナリオでは、たとえば、端末デバイス(ネットワークデバイスまたはテストデバイス)の動作能力が非常に低いとき、このセクションに関連する式の特定の動作結果を、たとえば、
【0099】
のテーブルルックアップによって置換することができる。ビデオの品質は、ビデオ符号化圧縮品質によって測定することができる。
【0100】
本発明のこの実施形態では、完全な元の基準ビデオおよび完全な端末ビデオを取得して、ビデオストリームを深く完全に解析する必要はなく、またビデオ符号化圧縮品質は、ビデオストリームのビットレートおよびフレームレートについての情報が取得される限り、ビデオ品質評価を完了するために取得され得る。評価の複雑性が低く、したがって評価をリアルタイムに達成することができる。さらに、この方法では、ビデオコンテンツ特性におけるフレームレートの影響および時間複雑性の影響が考慮されるので、この方法は、人間の目の視覚システムによる符号化圧縮歪みの認識をより良く満足させる。
【0101】
図5を参照すると、
図5は、本発明による、ビデオ符号化圧縮品質を取得するための方法の第3の実施形態のフローチャートである。
【0102】
この実施形態は、該方法が、ビデオストリームを伝送するためにネットワーク側に適用される、またはビデオストリームを受信するために受信端に適用される例を依然として使用することによって説明される。この実施形態と、前述の実施形態との間の差は、前述の実施形態では、取得されたビデオ符号化圧縮品質において、ビデオコンテンツ複雑性における時間複雑性の影響だけが考慮されるが、この実施形態では、ビデオコンテンツ複雑性の別の特性、すなわち空間複雑性がさらに考慮されるという点にある。該方法は、以下のステップを含み得る。
【0103】
ステップ501:あらかじめ定められた時間内に、ビデオストリームのフレームタイプ、フレームサイズ、フレームレート、ビットレート、修正されたビットレート、および時間複雑性を取得する。
【0104】
このステップでは、ビデオフレームのサイズを使用することによって、またはデータストリームを解析することによって、ビデオストリーム内のIフレームおよびPフレームを取得することができ、IフレームのサイズおよびPフレームのサイズをさらに取得することができる。このステップでは、フレームレートfps、ビットレートBR、修正されたビットレートMBR、および時間複雑性TCCを取得するステップは、前述の実施形態におけるステップ201〜204と類似しており、ここでは繰り返さない。
【0105】
ステップ502:ビットレートおよびPフレームのサイズに従って、空間複雑性を決定する。
【0106】
大量のデータストリームの統計解析実験によって、特定のビットレートの場合、より大きな空間複雑性のシーケンスの平均的なIフレームは、一般的に、より小さい空間複雑性のシーケンスの平均的なIフレームよりも多いが、P/Bフレームの平均的なIフレームよりも少ない。したがって、ビットレートBR対Pフレームの平均サイズの比率は、ビデオコンテンツ特性のうちの1つ、すなわち空間複雑性を、ある程度反映することができる。空間複雑性は、SCCとしてマークされる。
【0107】
空間複雑性を決定するための方法は、具体的には、以下のステップ601〜602を含み得る。
【0108】
ステップ601:あらかじめ定められた時間内に、Pフレームのサイズに従って、Pフレームの平均サイズを決定する。
【0109】
このステップでは、Pフレームの平均サイズを計算するための方法は、前述の実施形態のステップ401におけるIフレームの平均サイズを計算するための方法と類似しており、ここでは繰り返さない。Pフレームの平均サイズは、ABPとしてマークされる。
【0110】
ステップ602:ビットレート対Pフレームの平均サイズの比率に従って、空間複雑性を決定する。
【0111】
具体的には、空間複雑性は、以下の式を使用することによって計算することができる。
【0114】
ステップ503:修正されたビットレート、時間複雑性および空間複雑性、ならびにビデオ品質評価パラメータに従って、ビデオ符号化圧縮歪みを計算する。
【0115】
ビデオのより大きい時間複雑性、または空間複雑性、あるいはより大きい時間複雑性と空間複雑性の両方は、同じビットレートでより大きい圧縮歪みにつながる。ビデオ符号化圧縮歪みは、以下の式に従って計算することができる。
【0117】
上式で、VD
cはビデオ符号化圧縮歪みであり、MOSはビデオ品質評価パラメータであり、MOS
maxはビデオ品質評価パラメータの最大値であって、ビデオの最高点であり(5段階マーキングシステムの場合は、5点)、MOS
minはビデオ品質評価パラメータの最小値であって、ビデオの最小点であり(5段階マーキングシステムの場合は、1点)、c
1、d
1、e
1、c
2、d
2、およびe
2は定数である。
【0118】
ステップ504:ビデオ符号化圧縮歪みおよびフレームレートに従って、ビデオ符号化圧縮品質を計算する。
【0119】
ビデオ符号化圧縮歪みが取得された後、前述の実施形態のステップ206における式と同じ式を使用することによって、ビデオ符号化圧縮品質を取得することができる。
【0120】
本発明のこの実施形態では、ビデオ符号化圧縮品質は、ビデオストリームのビットレートおよびフレームレートについての情報が取得される限り、ビデオ品質評価を完了するために取得され得る。評価の複雑性が低く、したがって評価をリアルタイムに達成することができる。さらに、この方法ではビデオコンテンツ特性におけるフレームレートの影響、ならびに時間複雑性および空間複雑性の影響が考慮されるので、この方法は、人間の目の視覚システムによる符号化圧縮歪みの認識をより良く満足させる。
【0121】
本発明の別の実施形態では、ビデオ符号化圧縮歪みが取得される時に、時間複雑性TCCを考慮することなしに、空間複雑性SCCの影響だけを考慮することができる。このとき、ビデオ符号化圧縮歪みは、以下の式に従って計算することができる。
【0123】
上式で、f
1、f
2、f
3、およびf
4は定数である。
【0124】
フレームレートの影響を考慮すると、対応するビデオ符号化圧縮品質は、具体的には、ビデオ符号化圧縮品質を取得するために、前述の実施形態のステップ206における式と同じ式を使用することによって計算することができる。
【0125】
図7を参照すると、
図7は、本発明による、ビデオ符号化圧縮品質を取得するための方法の第4の実施形態のフローチャートである。
【0126】
この実施形態は、該方法が、ビデオストリームを伝送するためにネットワーク側に適用される、またはビデオストリームを受信するために受信端に適用される例を依然として使用することによって説明される。この実施形態と、前述の実施形態との間の差は、ビデオコンテンツ複雑性、すなわち時間複雑性および空間複雑性を取得するための方法が、前述の実施形態における方法とは異なるという点にある。該方法は、以下のステップを含み得る。
【0127】
ステップ701:あらかじめ定められた時間内に、ビデオストリームのフレームタイプ、フレームレート、ビットレート、修正されたビットレート、およびビデオフレーム量子化パラメータを取得する。
【0128】
このステップでは、ビデオフレームのサイズを使用することによって、またはデータストリームを解析することによって、ビデオストリームのIフレームおよびPフレームを取得することができ、IフレームのサイズおよびPフレームのサイズをさらに取得することができる。このステップでは、フレームレートfps、ビットレートBR、および修正されたビットレートMBRを取得するステップは、前述の実施形態におけるステップ201〜203と類似しており、ここでは繰り返さない。
【0129】
このステップでは、ビデオストリーム内のビデオフレームの量子化パラメータをさらに取得する必要があり、量子化パラメータはQPとしてマークされる。量子化パラメータ(QP)は、符号化処理にとって重要なパラメータである。このパラメータの設定は、ビデオ画像の符号化品質を決定する。より大きいQPは、より劣ったビデオ画質につながる。特定のQP値は、ビデオストリームを解析することによって取得することができる。
【0130】
ステップ702:時間複雑性を計算する。
【0131】
特定のQPの場合、より大きいPフレームは、ビデオのより大きい時間複雑性を示す。Pフレームの各ピクセルの平均ビット数(ABPPとしてマークされる)は、時間複雑性の値を反映することができる。時間複雑性を計算するステップは、
ビデオフレーム量子化パラメータの場合、ビデオフレームタイプに従ってPフレームの各ピクセルのビット数を計算するステップと、
Pフレームの各ピクセルのビット数、およびビデオフレーム量子化パラメータに対応する第1のパラメトリック値に従って、時間複雑性を計算するステップとを含み得る。
【0132】
具体的には、時間複雑性は、以下の式に従って計算することができる。
TCC=h
1・ABPP+h
2
上式で、h
1とh
2の両方はQPに関連する第1のパラメータであり、すなわち各QP値がh
1とh
2のグループに対応する。
【0133】
ビデオストリームの時間複雑性は2つの方法で計算することもできるが、この2つの方法に限定されない。ある方法は、TCCが各PフレームのQPおよびABPPに従って計算されて、次いで、平均値計算方法を使用することによって、ビデオストリーム全体のTCCが取得される。第2の方法は、ビデオストリーム全体におけるPフレームのQPの平均値およびABPPの平均値が計算されて、次いで、前述の式を使用することによって、ビデオストリーム全体のTCCが計算される。単一のフレームの時間複雑性を計算する方法についての詳細は、特許出願第200910161628.9号、公開第CN101635846B号「VIDEO QUALITY ASSESSMENT METHOD, SYSTEM AND APPARATUS」の記述を参照されたい。
【0134】
ステップ703:空間複雑性を計算する。
【0135】
特定のQPの場合、より大きいIフレームは、ビデオのより大きい空間複雑性を示す。Iフレームの各ピクセルの平均ビット数(ABIPとしてマークされる)は、空間複雑性の値を反映することができる。空間複雑性を計算する処理は、
ビデオフレーム量子化パラメータの場合、ビデオフレームタイプに従って、Iフレームの各ピクセルのビット数を計算するステップと、
Iフレームの各ピクセルのビット数、およびビデオフレーム量子化パラメータに対応する第2のパラメトリック値に従って、空間複雑性を計算するステップとを含み得る。
【0136】
具体的には、空間複雑性は、以下の式に従って計算することができる。
SCC=j
1・ABIP+j
2
上式で、j
1とj
2の両方はQPに関連する第2のパラメータであり、すなわち各QP値がj
1とj
2のグループに対応する。
【0137】
同様に、ビデオストリームの空間複雑性は2つの方法によって計算することもできるが、この2つの方法に限定されない。ある方法は、SCCが各IフレームのQPおよびABIPに従って計算されて、次いで、平均値計算方法を使用することによって、ビデオストリーム全体のSCCが取得される。第2の方法は、ビデオストリーム全体におけるIフレームのQPの平均値およびABIPの平均値が計算されて、次いで、前述の式を使用することによって、ビデオストリーム全体のSCCが計算される。単一のフレームの時間複雑性を計算する方法についての詳細は、特許出願第200910161628.9号、公開第CN101635846B号「VIDEO QUALITY ASSESSMENT METHOD, SYSTEM AND APPARATUS」の記述を参照されたい。
【0138】
ステップ702および703は、順序を交換されてもよく、同時に実行されてもよい。
【0139】
ステップ704:修正されたビットレート、時間複雑性、空間複雑性、およびビデオ品質評価パラメータに従って、ビデオ符号化圧縮歪みを計算する。
【0140】
ステップ705:ビデオ符号化圧縮歪みおよびフレームレートに従って、ビデオ符号化圧縮品質を計算する。
【0141】
TCCとSCCが決定された後、前述の実施形態のステップ503〜504における方法を参照することによって、ステップ704および705におけるビデオ符号化圧縮歪みおよびビデオ符号化圧縮品質を計算して、取得することができる。
【0142】
別の実施形態では、ビデオ符号化圧縮歪みおよびビデオ符号化圧縮品質の計算は、TCCまたはSCCだけを使用することによって実行することもできる。処理についての詳細は、前述の実施形態における対応する説明を参照されたい。ここでは繰り返さない。
【0143】
本発明のこの実施形態では、評価の複雑性が低減し、したがって評価をリアルタイムに達成することができる。さらに、この方法ではビデオコンテンツ特性におけるフレームレートの影響、ならびに時間複雑性および空間複雑性の影響が考慮されるので、この方法は、人間の目の視覚システムによる符号化圧縮歪みの認識をより良く満足させる。
【0144】
図8を参照すると、
図8は、本発明による、ビデオ符号化圧縮品質を取得するための方法の第5の実施形態のフローチャートである。
【0145】
この実施形態は、該方法が、ビデオストリームを伝送するためにネットワーク側に適用される、またはビデオストリームを受信するために受信端に適用される例を依然として使用することによって説明される。該方法は、以下のステップを含み得る。
【0146】
ステップ801:あらかじめ定められた時間内に、ビデオストリームのフレームタイプおよびビデフレーム量子化パラメータを取得する。
【0147】
このステップでは、ビデオフレームのサイズを使用することによって、またはデータストリームを解析することによって、ビデオストリーム内のIフレームおよびPフレームが取得され、またビデオストリーム内のビデオフレームの量子化パラメータQPが取得される。
【0148】
ステップ802:ビデオストリームの平均ビデオフレーム量子化パラメータに従って、ビデオストリームの基本的なビデオ符号化圧縮歪みを計算する。
【0149】
人間の目の視覚マスキングのため、特定のQPの場合、大きな時間的複雑性と空間複雑性を有するビデオの圧縮歪みは比較的小さい。このステップでは、QPに従ってまず量子化ステップ(QPstep)が取得され、次いで、基本的なビデオ符号化圧縮歪みVD'
cが、テーブルをルックアップすることによって取得されるか、式を使用することによって計算される。基本的なビデオ符号化圧縮歪みVD'
cは、具体的には、以下の式を使用することによって取得され得る。
VD
c'=(MOS
max-MOS
min)・func1(QP)、または、
VD
c'=(MOS
max-MOS
min)・func1(QPstep)
上式で、func1(QP)はQPに正比例する関数であり、func1(QPstep)はQPstepに正比例する関数であり、func1(QP)とfunc1(QPstep)の両方は0と1との間であり、線形でもよく非線形でもよく、たとえばfunc1(QP)=k
1+k
2・QPである。
【0150】
ステップ803:ビデオフレーム量子化パラメータの場合にPフレームの各ピクセルの平均ビット数に従って時間複雑性を決定して、ビデオフレーム量子化パラメータの場合にIフレームの各ピクセルの平均ビット数に従って空間複雑性を決定する。
【0151】
このステップは、前述の実施形態におけるステップ702〜703と同じであり、ここでは繰り返さない。時間複雑性TCCおよび空間複雑性SCCが取得された後、次のステップ804が実行され得る。
【0152】
ステップ804:時間複雑性と空間複雑性に従って、基本的なビデオ符号化圧縮歪みを修正して、ビデオ符号化圧縮歪みを計算する。
【0153】
修正処理において、基本的なビデオ符号化圧縮歪みは、時間複雑性と空間複雑性の関数func2(TCC, SCC)に基づいて修正され得る。具体的には、修正は、以下の式を使用することによって実行され得る。
VD
c=VD
c'・func2(TCC, SCC)
上式で、func2(TCC, SCC)はTCCとSCCに反比例する関数であり、また0と1との間であり、より大きいTCCおよび/またはSCCは、より小さいfunc2(TCC, SCC)につながり、func2(TCC, SCC)は線形でも非線形でもよく、たとえば、func2(TCC, SCC)=k
3・TCC+k
4・SCC+k
5である。
【0154】
ステップ805:ビデオ符号化圧縮歪みおよびフレームレートに従って、ビデオ符号化圧縮品質を計算する。
【0155】
TCC、SCC、およびVDcが決定された後、前述の実施形態におけるステップ504の方法を参照することによって、ビデオ符号化圧縮品質を計算して、取得することができる。
【0156】
本発明のこの実施形態では、ビデオ符号化圧縮品質は、ビデオストリームのビットレートおよびフレームレートについての情報が取得される限り、ビデオ品質評価を完了するために取得され得る。評価の複雑性が低く、したがって評価をリアルタイムに達成することもできる。さらに、この方法ではビデオコンテンツ特性におけるフレームレートの影響、ならびに時間複雑性および空間複雑性の影響が考慮されるので、この方法は、人間の目の視覚システムによる符号化圧縮歪みの認識をより良く満足させる。
【0157】
本発明の別の実施形態では、ビデオ符号化圧縮品質が取得される時に、空間複雑性SCCまたは時間複雑性TCCだけが考慮され得る。すなわち、空間複雑性の関数だけ、または時間複雑性の関数だけを使用することに従って、基本的なビデオ符号化圧縮歪みを修正することができ、ビデオ符号化圧縮品質は、ビデオ符号化圧縮歪みが取得された後にさらに決定される。
【0158】
前述の実施形態におけるステップのシーケンスは必要に応じて調整することができるが、前述のステップシーケンスに限定されない。
【0159】
該方法の前述の実施形態は、ビデオ品質評価を実行できるように、ビデオストリームを伝送するためにネットワーク側に適用されてもよく、ビデオストリームを受信するために受信端に適用されてもよい。
【0160】
該方法の前述の実施形態は、ビデオストリームの伝送端にも適用することができる。伝送端、前述のネットワーク側、および受信端の間の差は、伝送端によって取得されたビデオストリーム情報において、ビデオデータパケットまたはビデオフレームの損失が発生しないので、ビデオストリームの総データ量は、送信されるべきビデオデータパケットのペイロードの総データ量、またはビデオフレームの総データ量と等しいという点にある。
【0161】
本発明の実施形態における技法は、ソフトウェア、および必要な汎用ハードウェアプラットフォームによって実装され得ることを、当業者は明確に理解するべきである。そのような理解に基づいて、本質的に本発明の技術的ソリューション、または従来技術に寄与する部分、あるいは技術的ソリューションの一部は、ソフトウェア製品の形態で実装することができる。ソフトウェア製品は、ROM/RAM、磁気ディスク、または光ディスクなどの記憶媒体に格納され、コンピュータデバイス(パーソナルコンピュータ、サーバ、またはネットワークデバイスであってよい)に、本発明の実施形態において説明した方法のステップのうちのすべてまたは一部を実行するように指示するためのいくつかの命令を含む。
【0162】
前述は、本発明の方法実施形態の説明である。前述の方法を実装するための装置を、以下で説明する。
【0163】
図9を参照すると、
図9は、本発明による、ビデオ符号化圧縮品質を取得するための装置の第1の実施形態のブロック図である。
【0165】
ビデオストリーム情報を取得するように構成された情報取得ユニット901であって、ビデオストリーム情報が、ビデオフレームタイプ、ビデオフレームサイズ、フレームレート、およびビットレートを含む、情報取得ユニット901と、
情報取得ユニット901によって取得されたビデオストリーム情報に従って、ビデオコンテンツ複雑性を計算するように構成された複雑性計算ユニット902であって、ビデオコンテンツ複雑性が、時間複雑性、または空間複雑性、あるいは時間複雑性と空間複雑性の両方を含む複雑性計算ユニット902と、
情報取得ユニット901によって取得されたビットレートおよびフレームレート、ならびに複雑性計算ユニット902によって取得されたビデオコンテンツ複雑性に従って、ビデオ符号化圧縮品質を計算するように構成された品質評価ユニット903とを含む、ビデオ符号化圧縮品質を取得するための装置をさらに提供する。
【0166】
情報取得ユニット901は、ビデオストリーム情報をまず取得する。該情報は、ビデオフレームタイプ、ビデオフレームサイズ、フレームレート、およびビットレートを含むことができ、もちろん他の情報、たとえばビデオフレーム量子化パラメータなどを含むこともできる。複雑性計算ユニット902は、ビデオストリーム情報に従ってビデオコンテンツ複雑性を決定する。ビデオコンテンツ複雑性は、時間複雑性、または空間複雑性、あるいは時間複雑性と空間複雑性の両方を含み得る。時間複雑性が計算されるとき、時間複雑性は、ビデオフレーム内のIフレームのサイズと、前述のステップによって取得されたビットレートとに従って具体的に決定することができ、また、ビデオストリーム情報がビデオフレーム量子化パラメータ情報をさらに含むとき、量子化パラメータに対応するPフレームの各ピクセルに対応するバイト数に従って決定することもできる。空間複雑性が計算されるとき、空間複雑性は、ビデオフレーム内のPフレームのサイズ、およびビットレートに従って具体的に決定することができ、また、ビデオストリーム情報がビデオフレーム量子化パラメータ情報をさらに含むとき、量子化パラメータに対応するIフレームの各ピクセルに対応するバイト数に従って決定することもできる。最後に、品質評価ユニット903は、ビットレート、フレームレート、およびビデオコンテンツ複雑性に従ってビデオ符号化圧縮品質を決定することができ、また、ビットレートおよびビデオコンテンツ複雑性に従って、ビデオ符号化圧縮歪みをまず決定して、次いで、ビデオ符号化圧縮歪みおよびフレームレートに従ってビデオ符号化圧縮品質を決定することができる。
【0167】
本発明のこの実施形態では、前述のユニットによってビデオ符号化圧縮品質を取得することによって、装置が完全な元の基準ビデオおよび端末ビデオを取得して、特定のMVまたは残余を深く解析する必要がなくなる。これによって、ビデオ品質評価の複雑性が大いに低減し、評価をリアルタイムに実行することができるようになる。さらに、ビデオコンテンツ特性(すなわち、ビデオコンテンツ複雑性)の影響、およびフレームレートの影響が考慮されるので、評価された符号化圧縮品質は、人間の目の主観的感覚をより良く満足させる。
【0168】
図10を参照すると、
図10は、本発明による、ビデオ符号化圧縮品質を取得するための装置の第2の実施形態のブロック図である。
【0169】
この実施形態では、該装置は、情報取得ユニット1001、複雑性計算ユニット1002、および品質評価ユニット1003以外に、ビットレート修正ユニット1004をさらに含み得る。
【0170】
この実施形態では、情報取得ユニット1001は、あらかじめ定められた時間内に、ビデオストリームの総データ量を取得して、ビデオストリームの総データ量対あらかじめ定められた時間の比率に従ってビットレートを決定するように構成されたビットレート取得サブユニットを含み得る。
【0171】
複雑性計算ユニット1002は、
ビデオコンテンツ複雑性が時間複雑性を含むとき、ビデオフレームタイプおよびビデオフレームサイズに従って、あらかじめ定められた時間内にIフレームの平均サイズを計算して、ビットレート対Iフレームの平均サイズの比率に従って、時間複雑性を決定するように構成された第1の時間サブユニット1021と、
ビデオコンテンツ複雑性が空間複雑性を含むとき、ビデオフレームタイプおよびビデオフレームサイズに従って、あらかじめ定められた時間内にPフレームの平均サイズを計算して、ビットレート対Pフレームの平均サイズの比率に従って、空間複雑性を決定するように構成された第1の空間サブユニット1022とを含み得る。
【0172】
ビットレート修正ユニット1004は、品質評価ユニット1003が、ビットレート、フレームレート、およびビデオコンテンツ複雑性に従って、ビデオ符号化圧縮品質を決定する前に、ビットレートおよびフレームレートに従って、修正されたビットレートを計算するように構成される。ビットレート修正ユニット1004は、
情報取得ユニット1001によって取得されたフレームレートと基準フレームレートとの間の、より小さい値を決定するように構成された比較サブユニット1041と、
ビットレート対より小さい値の比率に従って、修正されたビットレートを決定するように構成された計算サブユニット1042とをさらに含み得る。
【0173】
品質評価ユニット1003は、ビットレート修正ユニット1004によって取得された修正されたビットレート、フレームレート、およびビデオコンテンツ複雑性に従って、ビデオ符号化圧縮品質を計算するように特に構成される。品質評価ユニット1003は、
ビットレート修正ユニットによって取得された修正されたビットレート、ビデオコンテンツ複雑性、およびビデオ品質評価パラメータに従って、ビデオ符号化圧縮歪みを計算するように構成された歪み計算サブユニット1031と、
ビデオ符号化圧縮歪み、およびフレームレートに従って、ビデオ符号化圧縮品質を計算するように構成された評価サブユニット1032とを含み得る。評価サブユニット1032は、フレームレートが24以上であるとき、ビデオ品質評価パラメータの最大値と、ビデオ符号化圧縮歪みとの間の差を、ビデオ符号化圧縮品質として使用する、または、フレームレートが24以下であるとき、ビデオコンテンツ複雑性およびフレームレートに基づいて、ビデオ品質評価パラメータの最大値と、ビデオ符号化圧縮歪みとの間の差を修正して、修正された結果をビデオ符号化圧縮品質として使用するように特に構成される。
【0174】
本発明の別の実施形態では、情報取得ユニットによって取得されたビデオストリーム情報が、ビデオフレーム量子化パラメータをさらに含む場合、複雑性計算ユニットは、
情報取得ユニットによって取得されたビデオストリーム情報が、ビデオフレーム量子化パラメータをさらに含み、ビデオコンテンツ複雑性が時間複雑性を含むとき、ビデオフレーム量子化パラメータの場合、ビデオフレームタイプに従って、Pフレームの各ピクセルのビット数を計算して、Pフレームの各ピクセルのビット数と、ビデオフレーム量子化パラメータに対応する第1のパラメトリック値とに従って、時間複雑性を計算するように構成された第2の時間サブユニットと、
情報取得ユニットによって取得されたビデオストリーム情報が、ビデオフレーム量子化パラメータをさらに含み、ビデオコンテンツ複雑性が空間複雑性を含むとき、ビデオフレーム量子化パラメータの場合、ビデオフレームタイプに従って、Iフレームの各ピクセルのビット数を計算して、Iフレームの各ピクセルのビット数と、ビデオフレーム量子化パラメータに対応する第2のパラメトリック値とに従って、空間複雑性を計算するように構成された第2の空間サブユニットとを含み得る。
【0175】
ビデオコンテンツ複雑性が複雑性計算ユニットによって取得された後、ビットレート修正ユニット1004および品質評価ユニット1003によってビデオ符号化品質も取得され得る。
【0176】
本発明のこの実施形態では、前述のユニットによってビデオ符号化圧縮品質を取得することによって、装置が完全な元の基準ビデオおよび端末ビデオを取得して、特定のMVまたは残余を深く解析する必要がなくなる。これによって、ビデオ品質評価の複雑性が大いに低減し、評価をリアルタイムに実行することができるようになる。さらに、ビデオコンテンツ特性(すなわち、ビデオコンテンツ複雑性)の影響、およびフレームレートの影響が考慮されるので、評価された符号化圧縮品質は、人間の目の主観的感覚をより良く満足させる。
【0177】
図11を参照すると、
図11は、本発明による端末の第1の実施形態のブロック図である。
【0178】
この実施形態では、端末は、第1のトランシーバ1101と、第1のプロセッサ1102とを含み得る。
【0179】
第1のトランシーバ1101は、ビデオストリームを受信するように構成される。
【0180】
第1のプロセッサ1102は、第1のトランシーバ1101によって受信されたビデオストリームからビデオストリーム情報を取得して、ビデオストリーム情報が、ビデオフレームタイプ、ビデオフレームサイズ、フレームレート、およびビットレートを含み、ビデオストリーム情報に従ってビデオコンテンツ複雑性を計算して、ビデオコンテンツ複雑性が、時間複雑性、または空間複雑性、あるいは時間複雑性と空間複雑性の両方を含み、ビットレート、フレームレート、およびビデオコンテンツ複雑性に従って、ビデオ符号化圧縮品質を計算するように構成される。
【0181】
この実施形態では、端末は、ビデオ符号化圧縮品質を取得するためにビデオストリームの受信端に配置されてよい。端末はビデオ品質評価の複雑性を大いに低減し、評価をリアルタイムに実行することができるようになるようになる。さらに、ビデオコンテンツ特性(すなわち、ビデオコンテンツ複雑性)の影響、およびフレームレートの影響が考慮されるので、評価された符号化圧縮品質は、人間の目の主観的感覚をより良く満足させる。
【0182】
図12を参照すると、
図12は、本発明による端末の第2の実施形態のブロック図である。
【0183】
この実施形態では、端末は、第2のトランシーバ1201と、第2のプロセッサ1202とを含み得る。
【0184】
第2のトランシーバ1201は、ビデオストリームを送信するように構成される。
【0185】
第2のプロセッサ1202は、第2のトランシーバ1201によって送信されたビデオストリームからビデオストリーム情報を取得して、ビデオストリーム情報が、ビデオフレームタイプ、ビデオフレームサイズ、フレームレート、およびビットレートを含み、ビデオストリーム情報に従ってビデオコンテンツ複雑性を計算して、ビデオコンテンツ複雑性が、時間複雑性、または空間複雑性、あるいは時間複雑性と空間複雑性の両方を含み、ビットレート、フレームレート、およびビデオコンテンツ複雑性に従って、ビデオ符号化圧縮品質を計算するように構成される。
【0186】
この実施形態では、端末は、後続のビデオ品質評価において使用するために、ビデオ符号化圧縮品質を取得するためにビデオストリームの伝送端に配置されてよい。端末はビデオ品質評価の複雑性を大いに低減し、評価をリアルタイムに実行することができるようになる。さらに、ビデオコンテンツ特性(すなわち、ビデオコンテンツ複雑性)の影響、およびフレームレートの影響が考慮されるので、評価された符号化圧縮品質は、人間の目の主観的感覚をより良く満足させる。
【0187】
図13を参照すると、
図13は、本発明によるサーバの実施形態のブロック図である。
【0188】
サーバは、ネットワーク側に配置され、第3のトランシーバ1301と、第3のプロセッサ1302とを含み得る。
【0189】
第3のトランシーバ1301は、伝送端から受信端にビデオストリームを伝送するように構成される。
【0190】
第3のプロセッサ1302は、第3のトランシーバ1301によって伝送されたビデオストリームからビデオストリーム情報を取得して、ビデオストリーム情報が、ビデオフレームタイプ、ビデオフレームサイズ、フレームレート、およびビットレートを含み、ビデオストリーム情報に従ってビデオコンテンツ複雑性を計算して、ビデオコンテンツ複雑性が、時間複雑性、または空間複雑性、あるいは時間複雑性と空間複雑性の両方を含み、ビットレート、フレームレート、およびビデオコンテンツ複雑性に従って、ビデオ符号化圧縮品質を計算するように構成される。
【0191】
この実施形態では、サーバが後続のビデオ品質評価において使用するためのビデオ符号化圧縮品質を取得できるようにするために、サーバは、ビデオストリームを伝送するために、ネットワーク側に配置されてよい。ビデオ品質の評価の複雑性が大いに低下して、評価をリアルタイムに実行できるようになる。さらに、ビデオコンテンツ特性(すなわち、ビデオコンテンツ複雑性)の影響、およびフレームレートの影響が考慮されるので、評価された符号化圧縮品質は、人間の目の主観的感覚をより良く満足させる。
【0192】
この明細書における実施形態は、すべての進歩的な方法で説明されているが、実施形態における同一または類似の部分についてはこれらの実施形態が参照されてよく、各実施形態は他の実施形態との相違点に焦点を当てている。特に、システム実施形態は方法実施形態と基本的に類似しており、したがって簡単に説明されている。関連する部分については、方法実施形態における部分的な説明が参照されてよい。
【0193】
前述の説明は本発明の実装形態方法であるが、本発明の保護範囲を限定することを意図するものではない。本発明の趣旨および原理から逸脱することなしに行われる、任意の修正、均等な置換、および改善は、本発明の保護範囲内に含まれるものとする。