(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-02-09
(54)【発明の名称】データ処理方法、装置及びコンピュータプログラム。
(51)【国際特許分類】
H04N 19/126 20140101AFI20240202BHJP
H04N 19/154 20140101ALI20240202BHJP
H04N 19/172 20140101ALI20240202BHJP
【FI】
H04N19/126
H04N19/154
H04N19/172
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2023540821
(86)(22)【出願日】2022-04-08
(85)【翻訳文提出日】2023-06-30
(86)【国際出願番号】 CN2022085789
(87)【国際公開番号】W WO2022222767
(87)【国際公開日】2022-10-27
(31)【優先権主張番号】202110432240.9
(32)【優先日】2021-04-21
(33)【優先権主張国・地域又は機関】CN
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】523250577
【氏名又は名称】ベイジン フイジュン テクノロジー カンパニー リミテッド
【氏名又は名称原語表記】Beijing Huijun Technology Co., Ltd.
【住所又は居所原語表記】Room 1004, 10th floor, Building 1, No.18, Kechuang 11th Street, Beijing Economic and Technological Development Zone, Beijing 100176, China
(74)【代理人】
【識別番号】110004222
【氏名又は名称】弁理士法人創光国際特許事務所
(74)【代理人】
【識別番号】100166006
【氏名又は名称】泉 通博
(72)【発明者】
【氏名】ツァン シュジュン
【テーマコード(参考)】
5C159
【Fターム(参考)】
5C159LA00
5C159MC11
5C159TA53
5C159TB04
5C159TC10
5C159TC38
5C159UA02
5C159UA05
5C159UA11
(57)【要約】
本出願は、データ処理方法および装置を開示し、具体的な実施形態は、ビデオストリームの符号化ファイルを解析して、符号化ファイルに対応する目標フレーム画像セットと、目標フレーム画像セットに対応する、目標フレーム画像が品質評価指標を満たす場合の目標フレーム画像の量子化パラメータである各目標量子化パラメータとを取得するステップと、目標フレーム画像セットに対応する各目標量子化パラメータと、符号化ファイルと、ビデオストリームの各フレーム画像の初期量子化パラメータとの3つの比較結果に基づいて、目標フレーム画像セットにおける各目標フレーム画像の新しい量子化パラメータおよび新しい量子化パラメータに対応する各目標フレーム画像の新しいビット数を決定するステップと、目標フレーム画像セットにおける各目標フレーム画像の新しい量子化パラメータおよび新しいビット数に基づいて、ビデオストリームの各フレーム画像の初期量子化パラメータおよび初期ビット数を更新するステップと、を含む。
【選択図】
図1
【特許請求の範囲】
【請求項1】
ビデオストリームの符号化ファイルを解析して、前記符号化ファイルに対応する目標フレーム画像セット、および前記目標フレーム画像セットに対応する各目標量子化パラメータを取得するステップであって、前記目標フレーム画像セットにおける各目標フレーム画像は、品質評価指標および前記符号化ファイルに基づいて前記ビデオストリームの各フレーム画像をフィルタリングすることによって取得され、前記目標量子化パラメータは、前記目標フレーム画像が前記品質評価指標を満たす場合の前記目標フレーム画像の量子化パラメータであり、前記符号化ファイルは、前記ビデオストリームを一次符号化することによって生成されるステップと、
前記目標フレーム画像セットに対応する各目標量子化パラメータ、前記符号化ファイル、および前記ビデオストリームの各フレーム画像の初期量子化パラメータ3つの比較結果に基づいて、前記目標フレーム画像セットにおける各目標フレーム画像の新しい量子化パラメータ、および前記新しい量子化パラメータに対応する各前記目標フレーム画像の新しいビット数を決定するステップと、
前記目標フレーム画像セットにおける各目標フレーム画像の前記新しい量子化パラメータおよび前記新しいビット数に基づいて、前記ビデオストリームの各フレーム画像の初期量子化パラメータおよび初期ビット数を更新するステップであって、前記更新は、前記目標フレーム画像セットにおける各目標フレーム画像と前記ビデオストリームの各フレーム画像との対応関係に基づいて完了し、前記ビデオストリームの各フレーム画像の初期量子化パラメータおよび初期ビット数は、二次符号化時に前記符号化ファイルに基づいて予め割り当てられる、ステップと、
を含む、データ処理方法。
【請求項2】
ビデオストリームの符号化ファイルを解析して、前記符号化ファイルに対応する目標フレーム画像セット、および前記目標フレーム画像セットに対応する各目標量子化パラメータを取得する前記ステップは、
前記符号化ファイルにおける各フレーム画像の第1の量子化パラメータおよび前記各フレーム画像の第1の量子化誤差に基づいて、前記符号化ファイルにおける第1の曲線を生成するステップであって、前記第1の曲線は、前記各フレーム画像の第1の量子化パラメータと、対応するフレーム画像の第1の量子化誤差との間の線形関係を表すために使用される、ステップと、
前記第1の曲線を解析して、前記第1の曲線に対応する目標フレーム画像セット、および前記目標フレーム画像セットに対応する各目標量子化パラメータを取得するステップであって、前記目標フレーム画像セットにおける各目標フレーム画像は、品質評価指標および第1の曲線に基づいてビデオストリームの各フレーム画像をフィルタリングすることによって得られる、ステップと、
を含む請求項1に記載の方法。
【請求項3】
ビデオストリームの符号化ファイルを解析して、前記符号化ファイルに対応する目標フレーム画像セット、および前記目標フレーム画像セットに対応する各目標量子化パラメータを取得する前記ステップは、
前記符号化ファイルおよび前記品質評価指標を入力とし、予測モデルを用いて、前記符号化ファイルおよび前記品質評価指標に対応する目標フレーム画像セット、および前記目標フレーム画像セットに対応する各目標量子化パラメータを出力するステップであって、前記予測モデルは、前記符号化ファイルにおける各フレーム画像の第1の量子化パラメータ、および/または各フレーム画像の第1の量子化誤差と前記品質評価指標との比較結果に基づいて、前記符号化ファイルにおける各フレーム画像および前記符号化ファイルにおける各フレーム画像の第1の量子化パラメータをフィルタリングすることを表すために使用され、前記各フレーム画像の第1の量子化パラメータおよび前記各フレーム画像の第1の量子化誤差は、レート制御モードに基づいて、前記ビデオストリームの各フレーム画像を符号化することによって生成される、ステップを含む、
請求項1~2のいずれか1項に記載の方法。
【請求項4】
前記予測モデルは、フィルタリングサブモデルおよび決定サブモデルを含み、前記予測モデルは、機械学習技術によって事前トレーニングされて取得され、前記符号化ファイルおよび前記品質評価指標を入力とし、予測モデルを用いて、前記符号化ファイルおよび前記品質評価指標に対応する目標フレーム画像セット、および前記目標フレーム画像セットに対応する各目標量子化パラメータを出力する前記ステップは、
前記符号化ファイルおよび前記品質評価指標を事前トレーニングされたフィルタリングサブモデルに入力して、前記符号化ファイルおよび前記品質評価指標に対応する目標フレーム画像セットを生成するステップであって、前記フィルタリングサブモデルは、前記符号化ファイルにおける各フレーム画像の第1の量子化パラメータ、および/または各フレーム画像の第1の量子化誤差と前記品質評価指標との比較結果に基づいて、前記符号化ファイルにおける各フレーム画像をフィルタリングすることを表すために使用される、ステップと、
生成された前記目標フレーム画像セットおよび前記品質評価指標を、事前トレーニングされた決定サブモデルに入力して、前記目標フレーム画像セットに対応する各目標量子化パラメータを生成するステップであって、前記決定サブモデルは、前記品質評価指標に基づいて、前記目標フレーム画像セットにおける各目標フレーム画像の量子化パラメータを推定することを表すために使用される、ステップと、
を含む請求項3に記載の方法。
【請求項5】
前記目標フレーム画像セットに対応する各目標量子化パラメータ、前記符号化ファイル、および前記ビデオストリームの各フレーム画像の初期量子化パラメータ3つの比較結果に基づいて、前記目標フレーム画像セットにおける各目標フレーム画像の新しい量子化パラメータ、および前記新しい量子化パラメータに対応する各前記目標フレーム画像の新しいビット数を決定する前記ステップは、
前記目標フレーム画像セットに対応する各目標量子化パラメータと前記符号化ファイルとの比較結果、および前記目標フレーム画像セットに対応する各目標量子化パラメータと前記ビデオストリームの各フレーム画像の初期量子化パラメータとの比較結果に基づいて、前記目標フレーム画像セットにおける各目標フレーム画像の新しい量子化パラメータを決定するステップと、
各前記新しい量子化パラメータに基づいて、推定モデルを用いて、各前記新しい量子化パラメータに対応する前記目標フレーム画像セットにおける各目標フレーム画像の新しいビット数を決定するステップであって、前記推定モデルは、前記符号化ファイルにおいて各目標フレーム画像に対応する第1の量子化パラメータおよび第1のビット数に基づいて、前記目標フレーム画像セットにおける各目標フレーム画像の新しい量子化パラメータの下でのビット数を計算することを表すために使用される、ステップと、
を含む請求項1~4のいずれか1項に記載の方法。
【請求項6】
ビデオストリームの符号化ファイルを解析して、前記符号化ファイルに対応する目標フレーム画像セット、および前記目標フレーム画像セットに対応する各目標量子化パラメータを取得するステップの前に、さらに、
前記ビデオストリームの符号化ファイルにおけるデータをフィルタリングし、前記フィルタリングされた前記ビデオストリームの符号化ファイルを取得するステップであって、前記フィルタリングは、前記符号化ファイルにおけるフレームタイプ基づいて、前記符号化ファイルにおける各フレーム画像のデータを選択することを表すために使用され、前記フレームタイプは、前記ビデオストリームの各フレーム画像の圧縮アルゴリズムを示すために使用される、ステップをさらに含む、
請求項1~5いずれか1項に記載の方法。
【請求項7】
更新された前記ビデオストリームの各フレーム画像の初期ビット数に基づいて、前記ビデオストリームの目標レートを決定するステップと、および/または、
画定された前記目標レートに基づいて、第2の符号化モードを用いて、前記ビデオストリームを二次符号化するステップと、
をさらに含む請求項1~6のいずれか1項に記載の方法。
【請求項8】
ビデオストリームの符号化ファイルを解析して、前記符号化ファイルに対応する目標フレーム画像セット、および前記目標フレーム画像セットに対応する各目標量子化パラメータを取得するように構成される解析ユニットであって、前記目標フレーム画像セットにおける各目標フレーム画像は、品質評価指標および前記符号化ファイルに基づいて前記ビデオストリームの各フレーム画像をフィルタリングすることによって取得され、前記目標量子化パラメータは、前記目標フレーム画像が前記品質評価指標を満たす場合の前記目標フレーム画像の量子化パラメータであり、前記符号化ファイルは、前記ビデオストリームを一次符号化することによって生成される、解析ユニットと、
前記目標フレーム画像セットに対応する各目標量子化パラメータ、前記符号化ファイルおよび前記ビデオストリームの各フレーム画像の初期量子化パラメータ3つの比較結果に基づいて、前記目標フレーム画像セットにおける各目標フレーム画像の新しい量子化パラメータ、および前記新しい量子化パラメータに対応する各前記目標フレーム画像の新しいビット数を決定するように構成される決定ユニットと、
前記目標フレーム画像セットにおける各目標フレーム画像の前記新しい量子化パラメータおよび前記新しいビット数に基づいて、前記ビデオストリームの各フレーム画像の初期量子化パラメータおよび初期ビット数を更新するように構成される更新ユニットであって、前記更新は、前記目標フレーム画像セットにおける各目標フレーム画像と前記ビデオストリームの各フレーム画像との対応関係に基づいて完了し、前記ビデオストリームの各フレーム画像の初期量子化パラメータおよび初期ビット数は、二次符号化時に前記符号化ファイルに基づいて予め割り当てられる、更新ユニットと、
を備えるデータ処理装置。
【請求項9】
前記解析ユニットは、
前記符号化ファイルにおける各フレーム画像の第1の量子化パラメータ、および前記各フレーム画像の第1の量子化誤差に基づいて、前記符号化ファイルの第1の曲線を生成するように構成される生成モジュールであって、前記第1の曲線は、前記各フレーム画像の第1の量子化パラメータと対応するフレーム画像の第1の量子化誤差との間の線形関係を表すために使用される、生成モジュールと、
前記第1の曲線を解析して、前記第1の曲線に対応する目標フレーム画像セット、および前記目標フレーム画像セットに対応する各目標量子化パラメータを取得するように構成される解析モジュールであって、前記目標フレーム画像セットにおける各目標フレーム画像は、品質評価指標および第1の曲線に基づいてビデオストリームの各フレーム画像をフィルタリングすることによって得られる、解析モジュールと、
を備える請求項8に記載の装置。
【請求項10】
少なくとも一つのプロセッサと、
前記少なくとも一つのプロセッサに通信可能に接続されるメモリと、を備え、
前記メモリは、前記少なくとも一つのプロセッサによって実行可能な指令を格納し、前記指令が前記少なくとも一つのプロセッサによって実行される場合、前記少なくとも一つのプロセッサに請求項1から7のいずれか1項に記載の方法を実行することができるようにすることを特徴とする電子機器。
【請求項11】
コンピュータ指令が格納されている非一時的コンピュータ可読記憶媒体であって、前記コンピュータ指令は、コンピュータに請求項1~7のいずれか1項に記載の方法を実行させるために使用されることを特徴とする非一時的コンピュータ可読記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
[関連出願の相互参照]
本特許出願は、2021年4月21日に提出した、出願番号が202110432240.9で、発明の名称が「データ処理方法および装置」である中国特許出願の優先権を主張するものであり、該出願のすべての内容が援用により本出願に組み込まれる。
【0002】
本出願の実施例はコンピュータ技術分野に関し、詳しくは、インテリジェント交通技術分野に関し、特に、データ処理方法および装置に関する。
【背景技術】
【0003】
ストリーミングメディア技術の成長に伴い、ユーザが視聴するビデオデバイスと所有する伝送帯域幅に大きな差があるので、主観的な品質が低下することなくレートをさらに下げる目的を達成するために、ユーザが提供するコンテンツを異なる品質レベルに分け、品質レベルをエンコーディングラダーとして理解し、コンテンツごとにエンコーディングラダーをカスタマイズする符号化効率最適化(Per-Title)方法を提案した。現在のPer-Title方法はさらに機械学習に基づくPer-Title実装技術とContext Aware Encoding(CAE)実装技術を含む。
【発明の概要】
【0004】
本出願は、データ処理方法、装置、機器および記憶媒体を提供する。
【0005】
本出願の第1の態様によれば、ビデオストリームの符号化ファイルを解析して、符号化ファイルに対応する目標フレーム画像セット、および目標フレーム画像セットに対応する各目標量子化パラメータを取得するステップであって、目標フレーム画像セットにおける各目標フレーム画像は、品質評価指標および符号化ファイルに基づいて、ビデオストリームの各フレーム画像をフィルタリングすることによって取得され、目標量子化パラメータは、目標フレーム画像が品質評価指標を満たす場合の目標フレーム画像の量子化パラメータであり、符号化ファイルは、ビデオストリームを一次符号化することによって生成される、ステップと、目標フレーム画像セットに対応する各目標量子化パラメータ、符号化ファイル、およびビデオストリームの各フレーム画像の初期量子化パラメータ3つの比較結果に基づいて、目標フレーム画像セットにおける各目標フレーム画像の新しい量子化パラメータ、および新しい量子化パラメータに対応する各目標フレーム画像の新しいビット数を決定するステップと、目標フレーム画像セットにおける各目標フレーム画像の新しい量子化パラメータおよび新しいビット数に基づいて、ビデオストリームの各フレーム画像の初期量子化パラメータおよび初期ビット数を更新するステップであって、更新は、目標フレーム画像セットにおける各目標フレーム画像とビデオストリームの各フレーム画像との対応関係に基づいて完了し、ビデオストリームの各フレーム画像の初期量子化パラメータおよび初期ビット数は、二次符号化時に符号化ファイルに基づいて予め割り当てられる、ステップと、を含むデータ処理方法を提供する。
【0006】
いくつかの実施例において、ビデオストリームの符号化ファイルを解析して、符号化ファイルに対応する目標フレーム画像セット、および目標フレーム画像セットに対応する各目標量子化パラメータを取得するステップは、符号化ファイルにおける各フレーム画像の第1の量子化パラメータおよび各フレーム画像の第1の量子化誤差に基づいて、符号化ファイルの第1の曲線を生成するステップであって、第1の曲線は、各フレーム画像の第1の量子化パラメータと対応するフレーム画像の第1の量子化誤差との間の線形関係を特徴付けるために使用される、ステップと、第1の曲線を解析して、第1の曲線に対応する目標フレーム画像セット、および目標フレーム画像セットに対応する各目標量子化パラメータを取得するステップであって、目標フレーム画像セットにおける各目標フレーム画像は、品質評価指標および第1の曲線に基づいて、ビデオストリームの各フレーム画像をフィルタリングすることによって取得される、ステップと、を含む。
【0007】
いくつかの実施例において、ビデオストリームの符号化ファイルを解析して、符号化ファイルに対応する目標フレーム画像セット、および目標フレーム画像セットに対応する各目標量子化パラメータを取得するステップは、符号化ファイルおよび品質評価指標を入力とし、予測モデルを用いて、符号化ファイルおよび品質評価指標に対応する目標フレーム画像セット、および目標フレーム画像セットに対応する各目標量子化パラメータを出力するステップであって、予測モデルは、符号化ファイルにおける各フレーム画像の第1の量子化パラメータ、および/または各フレーム画像の第1の量子化誤差と品質評価指標との比較結果に基づいて、符号化ファイルにおける各フレーム画像および符号化ファイルにおける各フレーム画像の第1の量子化パラメータをフィルタリングすることを特徴付けるために使用され、各フレーム画像の第1の量子化パラメータおよび各フレーム画像の第1の量子化誤差は、レート制御モードに基づいて、ビデオストリームの各フレーム画像を符号化することによって生成される、ステップを含む。
【0008】
いくつかの実施例において、予測モデルは、フィルタリングサブモデルおよび決定サブモデルを含み、予測モデルは、機械学習技術を用いて事前トレーニングされて取得され、符号化ファイルおよび品質評価指標を入力とし、予測モデルを用いて、符号化ファイルおよび品質評価指標に対応する目標フレーム画像セット、および目標フレーム画像セットに対応する各目標量子化パラメータを出力するステップは、符号化ファイルおよび品質評価指標を事前トレーニングされたフィルタリングサブモデルに入力して、符号化ファイルおよび品質評価指標に対応する目標フレーム画像セットを生成するステップであって、フィルタリングサブモデルは、符号化ファイルにおける各フレーム画像の第1の量子化パラメータ、および/または各フレーム画像の第1の量子化誤差と品質評価指標との比較結果に基づいて、符号化ファイルにおける各フレーム画像をフィルタリングすることを特徴付けるために使用される、ステップと、生成された目標フレーム画像セットおよび品質評価指標を事前トレーニングされた決定サブモデルに入力して、品質評価指標に対応する目標フレーム画像セットに対応する各目標量子化パラメータを生成するステップであって、決定サブモデルは、品質評価指標に基づいて、目標フレーム画像セットにおける各目標フレーム画像の量子化パラメータを推定することを特徴付けるために使用される、ステップと、を含む。
【0009】
いくつかの実施例において、目標フレーム画像セットに対応する各目標量子化パラメータ、符号化ファイル、およびビデオストリームの各フレーム画像の初期量子化パラメータ3つの比較結果に基づいて、目標フレーム画像セットにおける各目標フレーム画像の新しい量子化パラメータ、および新しい量子化パラメータに対応する各目標フレーム画像の新しいビット数を決定するステップは、目標フレーム画像セットに対応する各目標量子化パラメータと符号化ファイルとの比較結果、および目標フレーム画像セットに対応する各目標量子化パラメータとビデオストリームの各フレーム画像の初期量子化パラメータとの比較結果に基づいて、目標フレーム画像セットにおける各目標フレーム画像の新しい量子化パラメータを決定するステップと、各新しい量子化パラメータに基づいて、推定モデルを用いて、各新しい量子化パラメータに対応する目標フレーム画像セットにおける各目標フレーム画像の新しいビット数を決定するステップであって、推定モデルは、符号化ファイルにおいて各目標フレーム画像に対応する第1の量子化パラメータおよび第1のビット数に基づいて、目標フレーム画像セットにおける各目標フレーム画像の新しい量子化パラメータの下でのビット数を計算することを特徴付けるために使用される、ステップと、を含む。
【0010】
いくつかの実施例において、ビデオストリームの符号化ファイルを解析して、符号化ファイルに対応する目標フレーム画像セット、および目標フレーム画像セットに対応する各目標量子化パラメータを取得するステップの前に、さらに、ビデオストリームの符号化ファイルにおけるデータをフィルタリングして、フィルタリングされたビデオストリームの符号化ファイルを取得するステップであって、フィルタリングは、符号化ファイルにおけるフレームタイプ基づいて、符号化ファイルにおける各フレーム画像のデータを選択することを特徴付けるために使用され、フレームタイプは、ビデオストリームの各フレーム画像の圧縮アルゴリズムを示すために使用される、ステップを含む。
【0011】
いくつかの実施例において、方法は、更新されたビデオストリームの各フレーム画像の初期ビット数に基づいて、ビデオストリームの目標レートを決定するステップ、および/または、目標レートに基づいて、第2の符号化モードを用いて、ビデオストリームを二次符号化するステップをさらに含む。
【0012】
第2の態様によれば、本出願は、ビデオストリームの符号化ファイルを解析して、符号化ファイルに対応する目標フレーム画像セット、および目標フレーム画像セットに対応する各目標量子化パラメータを取得するように構成される解析ユニットであって、目標フレーム画像セットにおける各目標フレーム画像は、品質評価指標および符号化ファイルに基づいてビデオストリームの各フレーム画像をフィルタリングすることによって取得され、目標量子化パラメータは、目標フレーム画像が品質評価指標を満たす場合の目標フレーム画像の量子化パラメータであり、符号化ファイルは、ビデオストリームを一次符号化することによって生成される、解析ユニットと、目標フレーム画像セットに対応する各目標量子化パラメータ、符号化ファイルおよびビデオストリームの各フレーム画像の初期量子化パラメータ3つの比較結果に基づいて、目標フレーム画像セットにおける各目標フレーム画像の新しい量子化パラメータ、および新しい量子化パラメータに対応する各目標フレーム画像の新しいビット数を決定するように構成される決定ユニットと、目標フレーム画像セットにおける各目標フレーム画像の新しい量子化パラメータおよび新しいビット数に基づいて、ビデオストリームの各フレーム画像の初期量子化パラメータおよび初期ビット数を更新するように構成される更新ユニットであって、更新は、目標フレーム画像セットにおける各目標フレーム画像とビデオストリームの各フレーム画像との対応関係に基づいて完了し、ビデオストリームの各フレーム画像の初期量子化パラメータおよび初期ビット数は、二次符号化時に符号化ファイルに基づいて予め割り当てられる、更新ユニットと、を備える、データ処理装置を提供する。
【0013】
いくつかの実施例において、解析ユニットは、符号化ファイルにおける各フレーム画像の第1の量子化パラメータ、および各フレーム画像の第1の量子化誤差に基づいて、符号化ファイルの第1の曲線を生成するように構成される生成モジュールであって、第1の曲線は、各フレーム画像の第1の量子化パラメータと対応するフレーム画像の第1の量子化誤差との間の線形関係を特徴付けるために使用される、生成モジュールと、第1の曲線を解析して、第1の曲線に対応する目標フレーム画像セット、および目標フレーム画像セットに対応する各目標量子化パラメータを取得するように構成される解析モジュールであって、目標フレーム画像セットにおける各目標フレーム画像は、品質評価指標および第1の曲線に基づいてビデオストリームの各フレーム画像をフィルタリングすることによって得られる、解析モジュールと、を備える。
【0014】
いくつかの実施例において、解析ユニットは、さらに、符号化ファイルおよび品質評価指標を入力とし、予測モデルを用いて、符号化ファイルおよび品質評価指標に対応する目標フレーム画像セット、および目標フレーム画像セットに対応する各目標量子化パラメータを出力するように構成され、予測モデルは、符号化ファイルにおける各フレーム画像の第1の量子化パラメータ、および/または各フレーム画像の第1の量子化誤差と品質評価指標との比較結果に基づいて、符号化ファイルにおける各フレーム画像および符号化ファイルにおける各フレーム画像の第1の量子化パラメータをフィルタリングすることを特徴付けるために使用され、各フレーム画像の第1の量子化パラメータおよび各フレーム画像の第1の量子化誤差は、レート制御モードに基づいて、ビデオストリームの各フレーム画像を符号化することによって生成される。
【0015】
いくつかの実施例において、解析ユニットにおける予測モデルは、フィルタリングサブモデルおよび決定サブモデルを含み、解析ユニットにおける予測モデルは、機械学習技術によって事前トレーニングされて取得され、解析ユニットは、符号化ファイルおよび品質評価指標を事前トレーニングされたフィルタリングサブモデルに入力して、符号化ファイルおよび品質評価指標に対応する目標フレーム画像セットを生成するように構成されるフィルタリングモジュールであって、フィルタリングサブモデルは、符号化ファイルにおける各フレーム画像の第1の量子化パラメータ、および/または各フレーム画像の第1の量子化誤差と品質評価指標との比較結果に基づいて、符号化ファイルにおける各フレーム画像をフィルタリングすることを特徴付けるために使用される、フィルタリングモジュールと、生成された目標フレーム画像セットおよび品質評価指標を、事前トレーニングされた決定サブモデルに入力して、品質評価指標に対応する目標フレーム画像セットに対応する各目標量子化パラメータを生成するように構成される決定モジュールであって、決定サブモデルは、品質評価指標に基づいて、目標フレーム画像セットにおける各目標フレーム画像の量子化パラメータを推定することを特徴付けるために使用される、決定モジュールと、を備える。
【0016】
いくつかの実施例において、決定ユニットは、目標フレーム画像セットに対応する各目標量子化パラメータと符号化ファイルとの比較結果、および目標フレーム画像セットに対応する各目標量子化パラメータとビデオストリームの各フレーム画像の初期量子化パラメータとの比較結果に基づいて、目標フレーム画像セットにおける各目標フレーム画像の新しい量子化パラメータを決定するように構成される第1の決定モジュールと、各新しい量子化パラメータに基づいて、推定モデルを用いて、各新しい量子化パラメータに対応する目標フレーム画像セットにおける各目標フレーム画像の新しいビット数を決定するように構成される第2の決定モジュールであって、推定モデルは、符号化ファイルにおいて各目標フレーム画像に対応する第1の量子化パラメータおよび第1のビット数に基づいて、目標フレーム画像セットにおける各目標フレーム画像の新しい量子化パラメータの下でのビット数を計算することを特徴付けるために使用される、第2の決定モジュールと、を備える。
【0017】
いくつかの実施例において、装置は、ビデオストリームの符号化ファイルにおけるデータをフィルタリングし、フィルタリングされたビデオストリームの符号化ファイルを取得するように構成される選択ユニットであって、フィルタリングは、符号化ファイルにおけるフレームタイプに基づいて、符号化ファイルにおける各フレーム画像のデータを選択することを特徴付けるために使用され、フレームタイプは、ビデオストリームの各フレーム画像の圧縮アルゴリズムを示すために使用される、選択ユニットをさらに備える。
【0018】
いくつかの実施例において、装置は、更新されたビデオストリームの各フレーム画像の初期ビット数に基づいて、ビデオストリームの目標レートを生成するように構成される生成ユニットと、目標レートに基づいて、第2の符号化モードを用いて、ビデオストリームを二次符号化するように構成される符号化ユニットと、をさらに備える。
【0019】
第3の態様によれば、本出願は、少なくとも1つのプロセッサと、少なくとも1つのプロセッサに通信可能に接続されるメモリと、を備え、メモリには、少なくとも1つのプロセッサによって実行可能な指令が格納され、指令が少なくとも1つのプロセッサによって実行される場合、少なくとも1つのプロセッサに第1の態様のいずれかの実施形態に記載の方法を実行させる電子機器を提供する。
【0020】
第4の態様によれば、本出願は、コンピュータ指令が格納されている非一時的コンピュータ可読記憶媒体であって、コンピュータ指令が第1の態様のいずれかの実施形態に記載の方法をコンピュータに実行させるために使用されることを特徴とする非一時的コンピュータ可読記憶媒体を提供する。
【0021】
本明細書に記載された内容は、本出願の実施例の核心または重要な特徴を特定するためのものではなく、本出願の範囲を制限するためのものでもないことを理解されたい。本出願のその他の特徴は以下の説明によって容易に理解されるであろう。
【図面の簡単な説明】
【0022】
図面は、本技術的手段をよりよく理解するためのものであって、本出願を限定するものではない。
【
図1】本出願によるデータ処理方法の第1の実施例の概略図である。
【
図2】本出願によるデータ処理方法における新しい量子化パラメータの決定ロジックを示す図である。
【
図3】本出願の実施例のデータ処理方法を実現可能なシーンを示す図である。
【
図4】本出願によるデータ処理方法の第2の実施例の概略図である。
【
図5】本出願によるデータ処理装置の一実施例の構造概略図である。
【
図6】本出願の実施例のデータ処理方法を実現するための電子機器のブロック図である。
【発明を実施するための形態】
【0023】
以下、図面を参照しながら本出願の例示的な実施例を説明するが、含まれる本出願の実施例の様々な詳細は理解を容易にするためのものであり、それらは単なる例示的なものとして見なされるべきである。従って、当業者は、本出願の範囲および精神から逸脱することなく、説明された実施例に対して様々な変更および修正を行うことができることを理解すべきである。同様に、明確かつ簡潔にするために、以下の説明では周知の機能および構成の説明は省略する。
【0024】
本出願における実施例および実施例における特徴は衝突しない限り、互いに組み合わせ可能であることを理解されたい。以下、図面を参照し、実施例に組み合わせて、本出願を詳細に説明する。
【0025】
図1は、本出願によるデータ処理方法の第1の実施例の概略
図100である。当該データ処理方法は、以下のステップを含む。
【0026】
ステップ101:ビデオストリームの符号化ファイルを解析して、符号化ファイルに対応する目標フレーム画像セット、および目標フレーム画像セットに対応する各目標量子化パラメータを取得する。
【0027】
本実施例では、実行主体は、ローカルまたはリモートから有線接続または無線接続によりビデオストリームの符号化ファイルを取得した後、取得したビデオストリームの符号化ファイルを解析して、符号化ファイルに対応する目標フレーム画像セット、および目標フレーム画像セットに対応する各目標量子化パラメータを取得する。目標フレーム画像セットにおける各目標フレーム画像は、品質評価指標および符号化ファイルに基づいてビデオストリームの各フレーム画像をフィルタリングして得ることができ、目標量子化パラメータは、目標フレーム画像が品質評価指標を満たすときの目標フレーム画像の量子化パラメータであってもよい。ビデオストリームとはストリーミングメディア伝送プロセスにおける伝送方法を指し、ビデオストリーム、イメージストリーム、アニメーションストリームのうちの1つまたは複数を表すことができ、ビデオストリームはセグメント化されたビデオセグメントであってもよく、長いビデオであってもよく、ここではビデオストリームの長さは特に限定しない。符号化ファイルは、第1の符号化モードを用いてビデオストリームを一次符号化することによって生成することができる。第1の符号化モードは、1パスモードなどのビデオ符号化における符号化モードを指し、第1の符号化モードは、レート制御モードに基づいて、ビデオストリームの各フレーム画像を符号化することを特徴付けることができ、レート制御モードは、エンコーディングラダーに基づいて各フレーム画像のレートを選択することを特徴付けるために使用される。各フレーム画像のレートとは、このフレーム画像ファイルが単位時間あたりに使用するデータトラフィックを指し、例えば、800kbps、1200kbps、1800kbpsなどである。第1の符号化モードでは、ビデオ圧縮に様々なアルゴリズムを使用でき、例えば、IPBアルゴリズムがよく使用され、アルゴリズムによって圧縮された後、符号化ファイルに対応するフレーム画像(すなわち、単一のコンテンツ)のフレームタイプ、例えば、Iフレーム、Pフレーム、Bフレームなどが記録される。品質評価指標は、量子化誤差、すなわち、ピーク信号対雑音比に基づいて事前に設定することができ、または、様々な既存または新たに追加された符号化品質評価指標に基づいて事前に設定することができ、例えば、品質評価指標がコンテンツのピーク信号対雑音比が45db以下に設定され、つまり、特定のコンテンツがエンコーディングラダーにおいて45dbを超える符号化結果を取得した場合、エンコーディングラダーはそのコンテンツに対してレートが過剰と見なされる。上記の無線接続方法には、3G、4G、5G接続、WiFi接続、Bluetooth接続、WiMAX接続、Zigbee接続、UWB(ultra wideband)接続、およびその他の既知または将来開発される無線接続方法が含まれるが、これらに限定されない。レート制御モードは、VBR、CBR、ABRなどであってもよく、ここでは限定されない。
【0028】
本実施例において、符号化ファイルは、各フレーム画像の以下のデータ、すなわち、フレーム番号、フレームタイプ、フレーム持続時間、量子化パラメータ、本フレームの空間複雑度を反映するビット数、本フレームの時間複雑度を反映するビット数、その他のビット数、量子化誤差(すなわち、ピーク信号対雑音比)、および参照情報などを含み、本フレームの空間複雑度を反映するビット数、本フレームの時間複雑度を反映するビット数、その他のビット数を累積して、本フレーム符号化後のトラフィックサイズを得る。
【0029】
本実施例のいくつかのオプション的な実施形態において、ビデオストリームの符号化ファイルを解析して、符号化ファイルに対応する目標フレーム画像セット、および目標フレーム画像セットに対応する各目標量子化パラメータを取得するステップは、符号化ファイルおよび品質評価指標を入力とし、予測モデルを用いて、符号化ファイルおよび品質評価指標に対応する目標フレーム画像セット、および目標フレーム画像セットに対応する各目標量子化パラメータを出力するステップであって、予測モデルは、符号化ファイルにおける各フレーム画像の第1の量子化パラメータ、および/または各フレーム画像の第1の量子化誤差と品質評価指標との比較結果に基づいて、符号化ファイルにおける各フレーム画像および符号化ファイルにおける各フレーム画像の第1の量子化パラメータをフィルタリングすることを特徴付けるために使用され、各フレーム画像の第1の量子化パラメータおよび各フレーム画像の第1の量子化誤差は、レート制御モードに基づいて、ビデオストリームの各フレーム画像を符号化することによって生成される、ステップを含む。第1の量子化誤差は、第1のピーク信号対雑音比であり、第1の量子化誤差は、現在のフレームの第1の量子化パラメータの下での現在のフレーム画像の符号化品質を特徴付けるために使用される。深層学習の方法を使用して目標の量子化パラメータを取得し、システム処理の精度および効率を向上させた。
【0030】
本実施例のいくつかのオプション的な実施形態において、予測モデルは、フィルタリングサブモデルおよび決定サブモデルを含み、予測モデルは、機械学習技術によって事前トレーニングされて取得され、符号化ファイルおよび品質評価指標を入力とし、予測モデルを用いて、符号化ファイルおよび品質評価指標に対応する目標フレーム画像セット、および目標フレーム画像セットに対応する各目標量子化パラメータを出力するステップは、符号化ファイルおよび品質評価指標を事前トレーニングされたフィルタリングサブモデルに入力して、符号化ファイルおよび品質評価指標に対応する目標フレーム画像セットを生成するステップであって、フィルタリングサブモデルは、符号化ファイルにおける各フレーム画像の第1の量子化パラメータ、および/または各フレーム画像の第1の量子化誤差と品質評価指標との比較結果に基づいて、符号化ファイルにおける各フレーム画像をフィルタリングすることを特徴付けるために使用されるステップと、生成された目標フレーム画像セットおよび品質評価指標を、事前トレーニングされた決定サブモデルに入力して、品質評価指標に対応する目標フレーム画像セットに対応する各目標量子化パラメータを生成するステップであって、決定サブモデルは、品質評価指標に基づいて、目標フレーム画像セットにおける各目標フレーム画像の量子化パラメータを推定することを特徴付けるために使用される、ステップと、を含む。目標量子化パラメータを階層的に取得することにより、システム処理の効率がさらに向上する。
【0031】
ステップ102:目標フレーム画像セットに対応する各目標量子化パラメータ、符号化ファイル、およびビデオストリームの各フレーム画像の初期量子化パラメータ3つの比較結果に基づいて、目標フレーム画像セットにおける各目標フレーム画像の新しい量子化パラメータ、および新しい量子化パラメータに対応する各目標フレーム画像の新しいビット数を決定する。
【0032】
本実施例において、実行主体は、ステップ101で得られた目標フレーム画像セットに対応する各目標量子化パラメータ、符号化ファイルにおける目標フレーム画像セットに対応する各フレーム画像の量子化パラメータ、およびビデオストリームの各フレーム画像の初期量子化パラメータの3つを比較し、比較結果に基づいて、パラメータ決定方法を使用して、目標フレーム画像セットにおける各目標フレーム画像の新しい量子化パラメータ、および新しい量子化パラメータに対応する各目標フレーム画像の新しいビット数を決定することができる。ここでのビット数は、現在フレームの空間複雑度のビット数を指してもよいし、累積後に得られた現在フレームの符号化後のトラフィックサイズを指してもよい。
【0033】
さらに例を挙げて説明すると、パラメータ決定方法は、現在のフレームの量子化誤差psnr>42dbであり、且つ現在のフレームの1次符号化後の当該フレームの量子化パラメータQP
1pass>量子化誤差が42dbに達した当該フレームの量子化パラメータQP
psnr42の場合、現在のフレームに事前に割り当てられた初期量子化パラメータQP
newは、QP
1passであると決定され、現在のフレームの量子化誤差psnr>42dbであり、且つ現在のフレームの初期量子化パラメータQP
new<QP
psnr42の場合、現在のフレームの初期量子化パラメータQP
newはQP
psnr42であると決定され、新しい量子化パラメータQP
adjが取得される。詳細については
図2を参照されたい。
【0034】
本実施例のいくつかのオプション的な実施形態において、目標フレーム画像セットに対応する各目標量子化パラメータ、符号化ファイル、およびビデオストリームの各フレーム画像の初期量子化パラメータ3つの比較結果に基づいて、目標フレーム画像セットにおける各目標フレーム画像の新しい量子化パラメータ、および新しい量子化パラメータに対応する各目標フレーム画像の新しいビット数を決定するステップは、目標フレーム画像セットに対応する各目標量子化パラメータと符号化ファイルとの比較結果、および目標フレーム画像セットに対応する各目標量子化パラメータとビデオストリームの各フレーム画像の初期量子化パラメータとの比較結果に基づいて、目標フレーム画像セットにおける各目標フレーム画像の新しい量子化パラメータを決定するステップと、各新しい量子化パラメータに基づいて、推定モデルを用いて、各新しい量子化パラメータに対応する目標フレーム画像セットにおける各目標フレーム画像の新しいビット数を決定するステップであって、推定モデルは、符号化ファイルにおいて各目標フレーム画像に対応する第1の量子化パラメータおよび第1のビット数に基づいて、目標フレーム画像セットにおける各目標フレーム画像の新しい量子化パラメータの下でのビット数を計算することを特徴付けるために使用される、ステップと、を含む。量子化パラメータおよびビット数を正確で高速に決定する方法を実現する。
【0035】
ステップ103:目標フレーム画像セットにおける各目標フレーム画像の新しい量子化パラメータおよび新しいビット数に基づいて、ビデオストリームの各フレーム画像の初期量子化パラメータおよび初期ビット数を更新する。
【0036】
本実施例において、実行主体は、ステップ102で決定された目標フレーム画像セットにおける各目標フレーム画像の新しい量子化パラメータおよび新しいビット数に基づいて、ビデオストリームの各フレーム画像の初期量子化パラメータおよび初期ビット数を更新する。更新は、目標フレーム画像セットにおける各目標フレーム画像とビデオストリームの各フレーム画像との対応関係に基づいて完了し、ビデオストリームの各フレーム画像の初期量子化パラメータおよび初期ビット数は、二次符号化時に符号化ファイルに基づいて予め割り当てられる。二次符号化は、第2の符号化モードを使用してビデオストリームを再符号化することを特徴付けることができ、第2の符号化モードは、第1の符号化モードと同じであってもよく、第1の符号化モードと異なっていてもよく、例えば、2passモードである。
【0037】
本実施例のいくつかのオプション的な実施形態において、ビデオストリームの符号化ファイルを解析して、符号化ファイルに対応する目標フレーム画像セット、および目標フレーム画像セットに対応する各目標量子化パラメータを取得するステップの前に、ビデオストリームの符号化ファイルにおけるデータをフィルタリングし、フィルタリングされたビデオストリームの符号化ファイルを取得するステップであって、フィルタリングは、符号化ファイルにおけるフレームタイプ基づいて、符号化ファイルにおける各フレーム画像のデータを選択することを特徴付けるために使用され、フレームタイプは、ビデオストリームの各フレーム画像の圧縮アルゴリズムを示すために使用される、ステップをさらに含む。符号化データをフィルタリングして、IフレームおよびBフレームを除外し、Pフレーム画像のみに対してデータ処理を行うことにより、データ処理がより的を絞ったものになり、システム処理の精度が向上する。
【0038】
本実施例のいくつかのオプション的な実施形態において、方法は、更新されたビデオストリームの各フレーム画像の初期ビット数に基づいて、ビデオストリームの目標レートを決定するステップ、および/または、目標レートに基づいて、第2の符号化モードを用いて、ビデオストリームを二次符号化するステップ、をさらに含む。オンデマンドアプリケーションシーンで、ユーザに提供するトランスコーディングテンプレートが最適なものではなく、固定のエンコーディングラダーであるという問題を解決し、従来のエンコーディングラダーと比較して、余分なエンコーディング回数を増加させることなく、既存のオンデマンドアプリケーションシーンの演算量を増加させることなく、主観的な品質を低下させずに適切にレートを低減できる方法を実現した。
【0039】
上記実行主体は、例えば、データテーブルまたは計算式などであり得る、事前トレーニングされた予測モデルを格納することができ、本実施例はこれに対して特に限定しない。当業者は、実際のニーズに応じて、前記予測モデルのモデル構造を自ら設定することができ、本出願の実施例ではこれに対して特に限定しない。
【0040】
引き続き
図3を参照し、本実施例のデータ処理方法300は、サーバ301上で実行される。まず、サーバ301は、ビデオストリームの符号化ファイルを解析して、符号化ファイルに対応する目標フレーム画像セット、および目標フレーム画像セットに対応する各目標量子化パラメータを取得する(302)。次に、サーバ301は、目標フレーム画像セットに対応する各目標量子化パラメータ、符号化ファイル、およびビデオストリームの各フレーム画像の初期量子化パラメータ3つの比較結果に基づいて、目標フレーム画像セットにおける各目標フレーム画像の新しい量子化パラメータ、および新しい量子化パラメータに対応する各目標フレーム画像の新しいビット数を決定する(303)。最後に、サーバ301は、目標フレーム画像セットにおける各目標フレーム画像の新しい量子化パラメータおよび新しいビット数に基づいて、ビデオストリームの各フレーム画像の初期量子化パラメータおよび初期ビット数を更新する(304)。
【0041】
本出願の上記実施例によるデータ処理方法は、ビデオストリームの符号化ファイルを解析して、符号化ファイルに対応する目標フレーム画像セット、および目標フレーム画像セットに対応する各目標量子化パラメータを取得するステップであって、目標フレーム画像セットにおける各目標フレーム画像は、品質評価指標および符号化ファイルに基づいてビデオストリームの各フレーム画像をフィルタリングすることによって取得され、目標量子化パラメータは、目標フレーム画像が品質評価指標を満たす場合の目標フレーム画像の量子化パラメータであり、符号化ファイルは、ビデオストリームを一次符号化することによって生成される、ステップと、目標フレーム画像セットに対応する各目標量子化パラメータ、符号化ファイル、およびビデオストリームの各フレーム画像の初期量子化パラメータ3つの比較結果に基づいて、目標フレーム画像セットにおける各目標フレーム画像の新しい量子化パラメータ、および新しいビット数を決定するステップと、目標フレーム画像セットにおける各目標フレーム画像の新しい量子化パラメータおよび新しいビット数に基づいて、ビデオストリームの各フレーム画像の初期量子化パラメータおよび初期ビット数を更新するステップであって、ビデオストリームの各フレーム画像の初期量子化パラメータおよび初期ビット数は、二次符号化時に符号化ファイルに基づいて予め割り当てられている、ステップと、を採用することによって、既存の符号化最適化実装において、同じコンテンツを大量に繰り返し符号化する必要があり、計算量が多く、既存の技術では主に長さ範囲が秒レベルのビデオスライスを対象とするので長いビデオへの普及が困難であり、既存の技術では第三者が提供するユーザ機器情報やネットワーク属性などの情報を取得することが困難であるという問題を解決した。また、一次符号化結果を解析することにより、二次符号化時に量子化誤差が高すぎる(つまり、品質評価指標を達成する)フレームの量子化パラメータおよびビット数を調整し、目標レートを節約するための品質評価指標を超える目標フレーム画像の量子化パラメータを取得する、符号化効率最適化に対するデータ処理方法を実現した。従来のエンコーディングラダーと比較して、余分なエンコーディング回数を増加させることなく、既存のオンデマンドアプリケーションシーンの演算量を増加させることなく、主観品質を低下させずに適切にレートを低減することができる方法を実現した。
【0042】
さらに
図4を参照し、データ処理方法の第2の実施例の概略
図400を示す。該方法のプロセス400は以下のステップを含む。
【0043】
ステップ401:符号化ファイルにおける各フレーム画像の第1の量子化パラメータおよび各フレーム画像の第1の量子化誤差に基づいて、符号化ファイルの第1の曲線を生成する。
【0044】
本実施例において、実行主体は、符号化ファイルにおける各フレーム画像の第1の量子化パラメータおよび各フレーム画像の第1の量子化誤差に基づいて、最小二乗法を用いて量子化パラメータ-量子化誤差の直線をフィッティングして、符号化ファイルの第1の曲線を生成する。各フレーム画像の第1の量子化パラメータおよび各フレーム画像の第1の量子化誤差は、レート制御モードに基づいて、ビデオストリームの各フレーム画像を符号化することによって生成される。第1の曲線は線形フィッティング曲線であり、各フレーム画像の第1の量子化パラメータと対応するフレーム画像の第1の量子化誤差との間の線形関係を特徴付けるために使用される。第1の曲線は、第1の量子化パラメータをX軸とし、第1の量子化誤差をY軸とする。
【0045】
ステップ402:第1の曲線を解析して、第1の曲線に対応する目標フレーム画像セット、および目標フレーム画像セットに対応する各目標量子化パラメータを取得する。
【0046】
本実施例において、実行主体は、ステップ401で得られた第1の曲線を解析して、第1の曲線に対応する目標フレーム画像セット、および目標フレーム画像セットに対応する各目標量子化パラメータを取得することができる。目標フレーム画像セットにおける各目標フレーム画像は、品質評価指標および第1の曲線に基づいてビデオストリームの各フレーム画像をフィルタリングすることによって得られる。例えば、量子化誤差が大きい(>42db)位置と小さい(<31db)位置ではデータの分散が大きくなるため、量子化誤差が31db~42dbの間にあるフレーム画像のみがデータ処理される。
【0047】
ステップ403:目標フレーム画像セットに対応する各目標量子化パラメータ、符号化ファイル、およびビデオストリームの各フレーム画像の初期量子化パラメータ3つの比較結果に基づいて、目標フレーム画像セットにおける各目標フレーム画像の新しい量子化パラメータ、および新しい量子化パラメータに対応する各目標フレーム画像の新しいビット数を決定する。
【0048】
ステップ404:目標フレーム画像セットにおける各目標フレーム画像の新しい量子化パラメータおよび新しいビット数に基づいて、ビデオストリームの各フレーム画像の初期量子化パラメータおよび初期ビット数を更新する。
【0049】
本実施例において、ステップ403およびステップ404の具体的な動作は、
図1に示されている実施例のステップ102およびステップ103の動作と実質的に同じであり、ここではこれ以上説明しない。
【0050】
図4から分かるように、
図1に対応する実施例と比較して、本実施例におけるデータ処理方法の概略
図400は、符号化ファイルにおける各フレーム画像の第1の量子化パラメータおよび各フレーム画像の第1の量子化誤差に基づいて、符号化ファイルの第1の曲線を生成し、第1の曲線を解析して、第1の曲線に対応する目標フレーム画像セット、および目標フレーム画像セットに対応する各目標量子化パラメータを取得し、各フレーム画像(つまり、ビデオストリームの異なるコンテンツ)について、その量子化パラメータと量子化誤差との関係を探索することにより、余分な符号化回数を増加させることなく、既存のオンデマンドアプリケーションシーン演算量を増加させることなく、主観品質を低下させずにレートを適切に低くできる方法を採用している。
【0051】
さらに
図5を参照し、上記
図1~
図4に示す方法の実現として、本出願はデータ処理装置の一実施例を提供し、該装置の実施例は
図1に示す方法の実施例に対応し、該装置は様々な電子機器に適用することができる。
【0052】
図5に示されるように、本実施例のデータ処理装置500は、ビデオストリームの符号化ファイルを解析して、符号化ファイルに対応する目標フレーム画像セット、および目標フレーム画像セットに対応する各目標量子化パラメータを取得するように構成される解析ユニット501であって、目標フレーム画像セットにおける各目標フレーム画像は、品質評価指標および符号化ファイルに基づいてビデオストリームの各フレーム画像をフィルタリングすることによって取得され、目標量子化パラメータは、目標フレーム画像が品質評価指標を満たす場合の目標フレーム画像の量子化パラメータであり、符号化ファイルは、ビデオストリームを一次符号化することによって生成される、解析ユニット501と、目標フレーム画像セットに対応する各目標量子化パラメータ、符号化ファイルおよびビデオストリームの各フレーム画像の初期量子化パラメータ3つの比較結果に基づいて、目標フレーム画像セットにおける各目標フレーム画像の新しい量子化パラメータ、および新しい量子化パラメータに対応する各目標フレーム画像の新しいビット数を決定するように構成される決定ユニット502と、目標フレーム画像セットにおける各目標フレーム画像の新しい量子化パラメータおよび新しいビット数に基づいて、ビデオストリームの各フレーム画像の初期量子化パラメータおよび初期ビット数を更新するように構成される更新ユニット503であって、更新は、目標フレーム画像セットにおける各目標フレーム画像とビデオストリームの各フレーム画像との対応関係に基づいて完了し、ビデオストリームの各フレーム画像の初期量子化パラメータおよび初期ビット数は、二次符号化時に符号化ファイルに基づいて予め割り当てられる、更新ユニット503と、を備える。
【0053】
本実施例において、データ処理装置500の解析ユニット501、決定ユニット502、および更新ユニット503の具体的な処理およびそれらがもたらす技術的効果はそれぞれ
図1の対応する実施例におけるステップ101~ステップ103の関連する説明を参照することができ、ここでは繰り返して説明しない。
【0054】
本実施例のいくつかのオプション的な実施形態において、解析ユニットは、符号化ファイルにおける各フレーム画像の第1の量子化パラメータ、および各フレーム画像の第1の量子化誤差に基づいて、符号化ファイルの第1の曲線を生成するように構成される生成モジュールであって、第1の曲線は、各フレーム画像の第1の量子化パラメータと対応するフレーム画像の第1の量子化誤差との間の線形関係を特徴付けるために使用される、生成モジュールと、第1の曲線を解析して、第1の曲線に対応する目標フレーム画像セット、および目標フレーム画像セットに対応する各目標量子化パラメータを取得するように構成される解析モジュールであって、目標フレーム画像セットにおける各目標フレーム画像は、品質評価指標および第1の曲線に基づいて、ビデオストリームの各フレーム画像をフィルタリングすることによって得られる、解析モジュールと、を備える。
【0055】
本実施例のいくつかのオプション的な実施形態において、解析ユニットは、さらに、符号化ファイルおよび品質評価指標を入力とし、予測モデルを用いて、符号化ファイルおよび品質評価指標に対応する目標フレーム画像セット、および目標フレーム画像セットに対応する各目標量子化パラメータを出力するように構成され、予測モデルは、符号化ファイルにおける各フレーム画像の第1の量子化パラメータ、および/または各フレーム画像の第1の量子化誤差と品質評価指標との比較結果に基づいて、符号化ファイルにおける各フレーム画像および符号化ファイルにおける各フレーム画像の第1の量子化パラメータをフィルタリングすることを特徴付けるために使用され、各フレーム画像の第1の量子化パラメータおよび各フレーム画像の第1の量子化誤差は、レート制御モードに基づいて、ビデオストリームの各フレーム画像を符号化することによって生成される。
【0056】
本実施例のいくつかのオプション的な実施形態において、解析ユニットにおける予測モデルは、フィルタリングサブモデルおよび決定サブモデルを含み、解析ユニットにおける予測モデルは、機械学習技術によって事前トレーニングされて取得され、解析ユニットは、符号化ファイルおよび品質評価指標を事前トレーニングされたフィルタリングサブモデルに入力して、符号化ファイルおよび品質評価指標に対応する目標フレーム画像セットを生成するように構成されるフィルタリングモジュールであって、フィルタリングサブモデルは、符号化ファイルにおける各フレーム画像の第1の量子化パラメータ、および/または各フレーム画像の第1の量子化誤差と品質評価指標との比較結果に基づいて、符号化ファイルにおける各フレーム画像をフィルタリングすることを特徴付けるために使用される、フィルタリングモジュールと、生成された目標フレーム画像セットおよび品質評価指標を、事前トレーニングされた決定サブモデルに入力して、品質評価指標に対応する目標フレーム画像セットに対応する各目標量子化パラメータを生成するように構成される決定モジュールであって、決定サブモデルは、品質評価指標に基づいて、目標フレーム画像セットにおける各目標フレーム画像の量子化パラメータを推定することを特徴付けるために使用される、決定モジュールと、を備える。
【0057】
本実施例のいくつかのオプション的な実施形態において、決定ユニットは、目標フレーム画像セットに対応する各目標量子化パラメータと符号化ファイルとの比較結果、および目標フレーム画像セットに対応する各目標量子化パラメータとビデオストリームの各フレーム画像の初期量子化パラメータとの比較結果に基づいて、目標フレーム画像セットにおける各目標フレーム画像の新しい量子化パラメータを決定するように構成される第1の決定モジュールと、各新しい量子化パラメータに基づいて、推定モデルを用いて、各新しい量子化パラメータに対応する目標フレーム画像セットにおける各目標フレーム画像の新しいビット数を決定するように構成される第2の決定モジュールであって、推定モデルは、符号化ファイルにおいて各目標フレーム画像に対応する第1の量子化パラメータおよび第1のビット数に基づいて、目標フレーム画像セットにおける各目標フレーム画像の新しい量子化パラメータの下でのビット数を計算することを特徴付けるために使用される、第2の決定モジュールと、を備える。
【0058】
本実施例のいくつかのオプション的な実施形態において、装置は、ビデオストリームの符号化ファイルにおけるデータをフィルタリングし、フィルタリングされたビデオストリームの符号化ファイルを取得するように構成される選択ユニットであって、フィルタリングは、符号化ファイルにおけるフレームタイプに基づいて、符号化ファイルにおける各フレーム画像のデータを選択することを特徴付けるために使用され、フレームタイプは、ビデオストリームの各フレーム画像の圧縮アルゴリズムを示すために使用される、選択ユニットをさらに備える。
【0059】
本実施例のいくつかのオプション的な実施形態において、装置は、更新されたビデオストリームの各フレーム画像の初期ビット数に基づいて、ビデオストリームの目標レートを生成するように構成される生成ユニットと、目標レートに基づいて、第2の符号化モードを用いて、ビデオストリームを二次符号化するように構成される符号化ユニットと、をさらに備える。
【0060】
本出願の実施例によれば、本出願はさらに電子機器および可読記憶媒体を提供する。
【0061】
図6に示されるように、
図6は、本出願の実施例によるデータ処理方法の電子機器のブロック図である。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークベンチ、パーソナル・デジタル・アシスタント、サーバ、ブレードサーバ、メインフレームコンピュータ、およびその他適切なコンピュータなど様々な形態のデジタルコンピュータを表すことを目的としている。電子機器は、パーソナル・デジタル・アシスタント、携帯電話、スマートフォン、ウェアラブルデバイス、およびその他類似のコンピューティングデバイスなど、様々な形態のモバイルデバイスを表すこともできる。本明細書に示されている部品、それらの接続と関係、およびそれらの機能は単なる例であり、本明細書で説明および/または要求されている本出願の実施を制限するものではない。
【0062】
図6に示されるように、該電子機器は、1つまたは複数のプロセッサ601、メモリ602、並びに、高速インターフェースおよび低速インターフェースを含む様々な部品を接続するためのインターフェースを備える。各部品は異なるバスで互いに接続されており、共通のマザーボードに実装されていてもよいし、または必要に応じて他の形態で実装されていてもよい。プロセッサは、電子機器内で実行される指令を処理することができ、メモリ内またはメモリに格納されて外部の入力/出力装置(インターフェースなどに接続されたディスプレイデバイス)にGUIのグラフィック情報を表示させる指令を含む。他の実施形態では、必要に応じて、複数のプロセッサおよび/または複数のバスを複数のメモリおよび複数のメモリと共に使用してもよい。同様に、複数の電子機器を接続することができ、それぞれの機器はいくつかの必要な動作(例えば、サーバアレイ、一組のブレードサーバ、またはマルチプロセッサシステムとして)を提供する。
図6では一つのプロセッサ601を例とする。
【0063】
メモリ602は本出願により提供される非一時的コンピュータ可読記憶媒体である。メモリには少なくとも1つのプロセッサによって実行可能な指令が格納されており、少なくとも1つのプロセッサに本出願により提供されるデータ処理方法を実行させる。本出願の非一時的コンピュータ可読記憶媒体には、本出願により提供されるデータ処理方法をコンピュータに実行させるためのコンピュータ指令が格納されている。
【0064】
メモリ602は、非一時的コンピュータ可読記憶媒体として、非一時的ソフトウェアプログラム、非一時的コンピュータ実行可能プログラム、およびモジュール、例えば、本出願の実施例におけるデータ処理方法に対応するプログラム指令/モジュール(例えば、
図5に示される解析ユニット501、決定ユニット502、および更新ユニット503)を記憶するために用いられる。プロセッサ601は、メモリ602に記憶されている非一時的ソフトウェアプログラム、指令およびモジュールを実行することで、サーバの様々な機能アプリケーションおよびデータ処理を実行し、上記方法の実施例におけるデータ処理方法を実現する。
【0065】
メモリ602は、記憶プログラム領域および記憶データ領域を含んでもよく、記憶プログラム領域はオペレーティングシステム、少なくとも一つの機能に必要なアプリケーションプログラムを記憶してもよく、記憶データ領域はデータ処理電子機器の使用により作成されたデータなどを記憶してもよい。また、メモリ602は、高速ランダムアクセスメモリを含んでもよく、さらに非一時的メモリを含んでもよく、例えば、少なくとも一つの磁気ディスク記憶装置、フラッシュメモリ装置、または他の非一時的固体記憶装置を含んでもよい。いくつかの実施例において、メモリ602は、プロセッサ601に対してリモートに設置されたメモリを選択的に含んでもよく、これらのリモートメモリはネットワークを介してデータ処理電子機器に接続されてもよい。上記ネットワークの例には、インターネット、イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク、およびそれらの組み合わせが含まれるが、これらに限定されない。
【0066】
データ処理方法の電子機器は入力装置603と出力装置604をさらに含み得る。プロセッサ601、メモリ602、入力装置603、および出力装置604はバスまたは他の方法で接続されてもよく、
図6は、バスで接続されることを例にしている。
【0067】
入力装置603は、入力された数値または文字情報を受信し、データ処理電子機器のユーザ設定および機能制御に関連するキー信号入力を生成でき、例えば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、ポインティングスティック、一つまたは複数のマウスボタン、トラックボール、ジョイスティックなどの入力装置である。出力装置604は、表示装置、補助照明装置(例えば、LED)、触覚フィードバック装置(例えば、振動モーター)などを含むことができる。当該表示装置は、液晶ディスプレイ(LCD)、発光ダイオード(LED)ディスプレイ、およびプラズマディスプレイを含み得るが、これらに限定されない。 いくつかの実施形態では、表示装置はタッチスクリーンであってもよい。
【0068】
本明細書に説明されるシステムおよび技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、フィールドプログラマブルゲートアレイ(ASIC)、特定用途向け集積回路(ASIC)、コンピュータハードウェア、ファームウェア、ソフトウェア、および/またはそれらの組み合わせで実装されてもよい。これらの様々な実施形態は、1つまたは複数のコンピュータプログラムに実施され、当該1つまたは複数のコンピュータプログラムは、少なくとも1つのプログラマブルプロセッサを含むプログラム可能なシステムで実行および/または解釈され得、当該プログラマブルプロセッサは、専用または汎用のプログラマブルプロセッサであってもよく、記憶システム、少なくとも1つの入力装置、および少なくとも1つの出力装置からデータおよび指令を受信し、データおよび指令を当該記憶システム、当該少なくとも1つの入力装置、および当該少なくとも1つの出力装置に伝送することができることを含み得る。
【0069】
これらのコンピューティングプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、または、コードとも称される)は、プログラマブルプロセッサの機械コマンドを含み、高水準のプロセスおよび/もしくはオブジェクト向けプログラミング言語、および/またはアセンブリ/機械言語で実行されることができる。本明細書で用いられる「機械可読媒体」および「コンピュータ可読媒体」という用語は、機械可読信号としての機械コマンドを受け取る機械可読媒体を含むプログラマブルプロセッサに機械コマンドおよび/またはデータを提供するのに用いられる任意のコンピュータプログラム製品、機器、および/または装置(例えば、磁気ディスク、光ディスク、メモリ、およびプログラマブル論理デバイス(PLD))を指す。「機械可読信号」という用語は、プログラマブルプロセッサに機械コマンドおよび/またはデータを提供するために用いられる任意の信号を指す。
【0070】
ユーザとのインタラクトを提供するために、本明細書で説明されるシステムおよび技術を、ユーザに情報を表示するための表示装置(例えば、CRT(陰極線管)またはLCD(液晶ディスプレイ)モニタ)と、キーボードおよびポインティングデバイス(例えば、マウスまたはトラックボール)とを有するコンピュータ上に実施することができ、ユーザは、当該キーボードおよび当該ポインティングデバイスによって入力をコンピュータに提供することができる。他の種類の装置は、ユーザとのインタラクションを提供するために使用されることができ、例えば、ユーザに提供されるフィードバックは、任意の形態のセンシングフィードバック(例えば、視覚フィードバック、聴覚フィードバック、または触覚フィードバック)であってもよく、任意の形態(音響、発話または触覚による入力を含む)でユーザからの入力を受信することができる。
【0071】
本明細書で説明されるシステムおよび技術は、バックグラウンドコンポーネントを含むコンピューティングシステム(例えば、データサーバとする)、またはミドルウェアコンポーネントを含むコンピューティングシステム(例えば、アプリケーションサーバ)、またはフロントエンドコンポーネントを含むコンピューティングシステム(例えば、グラフィカルユーザインターフェースまたはウェブブラウザを有するクライアントコンピュータであり、ユーザは、当該グラフィカルユーザインターフェースまたは当該ウェブブラウザを通じて、本明細書で説明されるシステムおよび技術の実施形態とインタラクションすることができる)、またはそのようなバックグラウンドコンポーネント、ミドルウェアコンポーネント、またはフロントエンドコンポーネントの任意の組み合わせを含むコンピューティングシステムに実施することができる。任意の形態または媒体のデジタルデータ通信(例えば、通信ネットワーク)によって、システムのコンポーネントを互いに接続することができる。通信ネットワークの例示的なものとして、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、インターネットワークが含まれる。
【0072】
コンピュータシステムはクライアントおよびサーバを含むことができる。クライアントとサーバは一般的に互いに離れており、通常は通信ネットワークを介して相互作用している。クライアントとサーバの関係は、対応するコンピュータで実行されるとともに互いにクライアント-サーバの関係を持つコンピュータプログラムによって生成される。
【0073】
本出願の実施例は、ビデオストリームの符号化ファイルを解析して、符号化ファイルに対応する目標フレーム画像セット、および目標フレーム画像セットに対応する各目標量子化パラメータを取得するステップであって、目標フレーム画像セットにおける各目標フレーム画像は、品質評価指標および符号化ファイルに基づいてビデオストリームの各フレーム画像をフィルタリングすることによって取得され、目標量子化パラメータは、目標フレーム画像が品質評価指標を満たす場合の目標フレーム画像の量子化パラメータであり、符号化ファイルは、ビデオストリームを一次符号化することによって生成される、ステップと、目標フレーム画像セットに対応する各目標量子化パラメータ、符号化ファイル、およびビデオストリームの各フレーム画像の初期量子化パラメータ3つの比較結果に基づいて、目標フレーム画像セットにおける各目標フレーム画像の新しい量子化パラメータおよび新しいビット数を決定するステップと、目標フレーム画像セットにおける各目標フレーム画像の新しい量子化パラメータおよび新しいビット数に基づいて、ビデオストリームの各フレーム画像の初期量子化パラメータおよび初期ビット数を更新するステップであって、ビデオストリームの各フレーム画像の初期量子化パラメータおよび初期ビット数は、二次符号化時に符号化ファイルに基づいて予め割り当てられる、ステップと、を含む技術的手段を採用し、既存の符号化最適化実装技術では、同一のコンテンツを繰り返し符号化する必要があり、計算量が多く、既存技術は主に長さ範囲が秒レベルのビデオスライスを対象とし長いビデオへの普及が難しく、既存技術では第三者から提供されるユーザ機器情報やネットワーク属性などの情報を取得することが困難であるという問題を解決した。一次符号化結果を解析することにより、二次符号化時に量子化誤差が高すぎる(つまり、品質評価指標に達している)フレームの量子化パラメータおよびビット数を調整し、レートを節約するための、品質評価指標を超える目標フレーム画像の量子化パラメータを取得する、符号化効率最適化に対するデータ処理方法を実現した。従来のエンコーディングラダーと比較して、余分なエンコーディング回数を増加させることなく、既存のオンデマンドアプリケーションシーンの演算量を増加させることなく、主観品質を低下させずに適切にレートを低くすることができる方法を実現した。
【0074】
以上で示された様々な形態のフローを使用して、ステップを並べ替え、追加または削除できることを理解されたい。例えば、本出願が開示する技術的手段の望ましい結果が実現できれば、本出願に記載された各ステップは並行して、または順次に、または異なる順序で実行されてもよく、本明細書はここでは制限をしない。
【0075】
上記の具体的な実施形態は、本出願の保護範囲を制限するものではない。当業者は、設計要件および他の要因に従って、様々な修正、組み合わせ、サブコンビネーションおよび置換を行うことができると理解すべきである。本出願の精神および原則の範囲内で行われた如何なる修正、同等の置き換え、および改善は、本出願の保護範囲内に含まれるべきである。
【手続補正書】
【提出日】2023-06-30
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
ビデオストリームの符号化ファイルを解析して、前記符号化ファイルに対応する目標フレーム画像セット、および前記目標フレーム画像セットに対応する各目標量子化パラメータを取得するステップであって、前記目標フレーム画像セットにおける各目標フレーム画像は、品質評価指標および前記符号化ファイルに基づいて前記ビデオストリームの各フレーム画像をフィルタリングすることによって取得され、前記目標量子化パラメータは、前記目標フレーム画像が前記品質評価指標を満たす場合の前記目標フレーム画像の量子化パラメータであり、前記符号化ファイルは、前記ビデオストリームを一次符号化することによって生成されるステップと、
前記目標フレーム画像セットに対応する各目標量子化パラメータ、前記符号化ファイル、および前記ビデオストリームの各フレーム画像の初期量子化パラメータ3つの比較結果に基づいて、前記目標フレーム画像セットにおける各目標フレーム画像の新しい量子化パラメータ、および前記新しい量子化パラメータに対応する各前記目標フレーム画像の新しいビット数を決定するステップと、
前記目標フレーム画像セットにおける各目標フレーム画像の前記新しい量子化パラメータおよび前記新しいビット数に基づいて、前記ビデオストリームの各フレーム画像の初期量子化パラメータおよび初期ビット数を更新するステップであって、前記更新は、前記目標フレーム画像セットにおける各目標フレーム画像と前記ビデオストリームの各フレーム画像との対応関係に基づいて完了し、前記ビデオストリームの各フレーム画像の初期量子化パラメータおよび初期ビット数は、二次符号化時に前記符号化ファイルに基づいて予め割り当てられる、ステップと、
を含む、データ処理方法。
【請求項2】
ビデオストリームの符号化ファイルを解析して、前記符号化ファイルに対応する目標フレーム画像セット、および前記目標フレーム画像セットに対応する各目標量子化パラメータを取得する前記ステップは、
前記符号化ファイルにおける各フレーム画像の第1の量子化パラメータおよび前記各フレーム画像の第1の量子化誤差に基づいて、前記符号化ファイルにおける第1の曲線を生成するステップであって、前記第1の曲線は、前記各フレーム画像の第1の量子化パラメータと、対応するフレーム画像の第1の量子化誤差との間の線形関係を表すために使用される、ステップと、
前記第1の曲線を解析して、前記第1の曲線に対応する目標フレーム画像セット、および前記目標フレーム画像セットに対応する各目標量子化パラメータを取得するステップであって、前記目標フレーム画像セットにおける各目標フレーム画像は、品質評価指標および第1の曲線に基づいてビデオストリームの各フレーム画像をフィルタリングすることによって得られる、ステップと、
を含む請求項1に記載の方法。
【請求項3】
ビデオストリームの符号化ファイルを解析して、前記符号化ファイルに対応する目標フレーム画像セット、および前記目標フレーム画像セットに対応する各目標量子化パラメータを取得する前記ステップは、
前記符号化ファイルおよび前記品質評価指標を入力とし、予測モデルを用いて、前記符号化ファイルおよび前記品質評価指標に対応する目標フレーム画像セット、および前記目標フレーム画像セットに対応する各目標量子化パラメータを出力するステップであって、前記予測モデルは、前記符号化ファイルにおける各フレーム画像の第1の量子化パラメータ、および/または各フレーム画像の第1の量子化誤差と前記品質評価指標との比較結果に基づいて、前記符号化ファイルにおける各フレーム画像および前記符号化ファイルにおける各フレーム画像の第1の量子化パラメータをフィルタリングすることを表すために使用され、前記各フレーム画像の第1の量子化パラメータおよび前記各フレーム画像の第1の量子化誤差は、レート制御モードに基づいて、前記ビデオストリームの各フレーム画像を符号化することによって生成される、ステップを含む、
請求項1または2に記載の方法。
【請求項4】
前記予測モデルは、フィルタリングサブモデルおよび決定サブモデルを含み、前記予測モデルは、機械学習技術によって事前トレーニングされて取得され、前記符号化ファイルおよび前記品質評価指標を入力とし、予測モデルを用いて、前記符号化ファイルおよび前記品質評価指標に対応する目標フレーム画像セット、および前記目標フレーム画像セットに対応する各目標量子化パラメータを出力する前記ステップは、
前記符号化ファイルおよび前記品質評価指標を事前トレーニングされたフィルタリングサブモデルに入力して、前記符号化ファイルおよび前記品質評価指標に対応する目標フレーム画像セットを生成するステップであって、前記フィルタリングサブモデルは、前記符号化ファイルにおける各フレーム画像の第1の量子化パラメータ、および/または各フレーム画像の第1の量子化誤差と前記品質評価指標との比較結果に基づいて、前記符号化ファイルにおける各フレーム画像をフィルタリングすることを表すために使用される、ステップと、
生成された前記目標フレーム画像セットおよび前記品質評価指標を、事前トレーニングされた決定サブモデルに入力して、前記目標フレーム画像セットに対応する各目標量子化パラメータを生成するステップであって、前記決定サブモデルは、前記品質評価指標に基づいて、前記目標フレーム画像セットにおける各目標フレーム画像の量子化パラメータを推定することを表すために使用される、ステップと、
を含む請求項3に記載の方法。
【請求項5】
前記目標フレーム画像セットに対応する各目標量子化パラメータ、前記符号化ファイル、および前記ビデオストリームの各フレーム画像の初期量子化パラメータ3つの比較結果に基づいて、前記目標フレーム画像セットにおける各目標フレーム画像の新しい量子化パラメータ、および前記新しい量子化パラメータに対応する各前記目標フレーム画像の新しいビット数を決定する前記ステップは、
前記目標フレーム画像セットに対応する各目標量子化パラメータと前記符号化ファイルとの比較結果、および前記目標フレーム画像セットに対応する各目標量子化パラメータと前記ビデオストリームの各フレーム画像の初期量子化パラメータとの比較結果に基づいて、前記目標フレーム画像セットにおける各目標フレーム画像の新しい量子化パラメータを決定するステップと、
各前記新しい量子化パラメータに基づいて、推定モデルを用いて、各前記新しい量子化パラメータに対応する前記目標フレーム画像セットにおける各目標フレーム画像の新しいビット数を決定するステップであって、前記推定モデルは、前記符号化ファイルにおいて各目標フレーム画像に対応する第1の量子化パラメータおよび第1のビット数に基づいて、前記目標フレーム画像セットにおける各目標フレーム画像の新しい量子化パラメータの下でのビット数を計算することを表すために使用される、ステップと、
を含む請求項1
または2に記載の方法。
【請求項6】
ビデオストリームの符号化ファイルを解析して、前記符号化ファイルに対応する目標フレーム画像セット、および前記目標フレーム画像セットに対応する各目標量子化パラメータを取得するステップの前に、さらに、
前記ビデオストリームの符号化ファイルにおけるデータをフィルタリングし、前記フィルタリングされた前記ビデオストリームの符号化ファイルを取得するステップであって、前記フィルタリングは、前記符号化ファイルにおけるフレームタイプ基づいて、前記符号化ファイルにおける各フレーム画像のデータを選択することを表すために使用され、前記フレームタイプは、前記ビデオストリームの各フレーム画像の圧縮アルゴリズムを示すために使用される、ステップをさらに含む、
請求項1
または2に記載の方法。
【請求項7】
更新された前記ビデオストリームの各フレーム画像の初期ビット数に基づいて、前記ビデオストリームの目標レートを決定するステップと、および/または、
画定された前記目標レートに基づいて、第2の符号化モードを用いて、前記ビデオストリームを二次符号化するステップと、
をさらに含む請求項1
または2に記載の方法。
【請求項8】
ビデオストリームの符号化ファイルを解析して、前記符号化ファイルに対応する目標フレーム画像セット、および前記目標フレーム画像セットに対応する各目標量子化パラメータを取得するように構成される解析ユニットであって、前記目標フレーム画像セットにおける各目標フレーム画像は、品質評価指標および前記符号化ファイルに基づいて前記ビデオストリームの各フレーム画像をフィルタリングすることによって取得され、前記目標量子化パラメータは、前記目標フレーム画像が前記品質評価指標を満たす場合の前記目標フレーム画像の量子化パラメータであり、前記符号化ファイルは、前記ビデオストリームを一次符号化することによって生成される、解析ユニットと、
前記目標フレーム画像セットに対応する各目標量子化パラメータ、前記符号化ファイルおよび前記ビデオストリームの各フレーム画像の初期量子化パラメータ3つの比較結果に基づいて、前記目標フレーム画像セットにおける各目標フレーム画像の新しい量子化パラメータ、および前記新しい量子化パラメータに対応する各前記目標フレーム画像の新しいビット数を決定するように構成される決定ユニットと、
前記目標フレーム画像セットにおける各目標フレーム画像の前記新しい量子化パラメータおよび前記新しいビット数に基づいて、前記ビデオストリームの各フレーム画像の初期量子化パラメータおよび初期ビット数を更新するように構成される更新ユニットであって、前記更新は、前記目標フレーム画像セットにおける各目標フレーム画像と前記ビデオストリームの各フレーム画像との対応関係に基づいて完了し、前記ビデオストリームの各フレーム画像の初期量子化パラメータおよび初期ビット数は、二次符号化時に前記符号化ファイルに基づいて予め割り当てられる、更新ユニットと、
を備えるデータ処理装置。
【請求項9】
前記解析ユニットは、
前記符号化ファイルにおける各フレーム画像の第1の量子化パラメータ、および前記各フレーム画像の第1の量子化誤差に基づいて、前記符号化ファイルの第1の曲線を生成するように構成される生成モジュールであって、前記第1の曲線は、前記各フレーム画像の第1の量子化パラメータと対応するフレーム画像の第1の量子化誤差との間の線形関係を表すために使用される、生成モジュールと、
前記第1の曲線を解析して、前記第1の曲線に対応する目標フレーム画像セット、および前記目標フレーム画像セットに対応する各目標量子化パラメータを取得するように構成される解析モジュールであって、前記目標フレーム画像セットにおける各目標フレーム画像は、品質評価指標および第1の曲線に基づいてビデオストリームの各フレーム画像をフィルタリングすることによって得られる、解析モジュールと、
を備える請求項8に記載の装置。
【請求項10】
少なくとも一つのプロセッサと、
前記少なくとも一つのプロセッサに通信可能に接続されるメモリと、を備え、
前記メモリは、前記少なくとも一つのプロセッサによって実行可能な指令を格納し、前記指令が前記少なくとも一つのプロセッサによって実行される場合、前記少なくとも一つのプロセッサに請求項1
または2に記載の方法を実行することができるようにすることを特徴とする電子機器。
【請求項11】
コンピュータ指令が格納されている非一時的コンピュータ可読記憶媒体であって、前記コンピュータ指令は、コンピュータに請求項1
または2に記載の方法を実行させるために使用されることを特徴とする非一時的コンピュータ可読記憶媒体。
【請求項12】
プロセッサによって実行されると、請求項1または2に記載の方法が実行するためのコンピュータプログラム。
【手続補正3】
【補正対象書類名】明細書
【補正対象項目名】0002
【補正方法】変更
【補正の内容】
【0002】
本出願の実施例はコンピュータ技術分野に関し、詳しくは、インテリジェント交通技術分野に関し、特に、データ処理方法、装置及びコンピュータプログラムに関する。
【手続補正4】
【補正対象書類名】明細書
【補正対象項目名】0004
【補正方法】変更
【補正の内容】
【0004】
本出願は、データ処理方法、装置及びコンピュータプログラムを提供する。
【手続補正5】
【補正対象書類名】明細書
【補正対象項目名】0021
【補正方法】変更
【補正の内容】
【0021】
第5の態様によれば、本出願は、プロセッサによって実行されると、第1の態様のいずれかの実施形態に記載の方法が実行するためのコンピュータプログラムを提供する。
本明細書に記載された内容は、本出願の実施例の核心または重要な特徴を特定するためのものではなく、本出願の範囲を制限するためのものでもないことを理解されたい。本出願のその他の特徴は以下の説明によって容易に理解されるであろう。
【国際調査報告】