IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッドの特許一覧

特許7402201ビデオ再生開始の最適化方法、装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム
<>
  • 特許-ビデオ再生開始の最適化方法、装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム 図1
  • 特許-ビデオ再生開始の最適化方法、装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム 図2
  • 特許-ビデオ再生開始の最適化方法、装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム 図3
  • 特許-ビデオ再生開始の最適化方法、装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム 図4
  • 特許-ビデオ再生開始の最適化方法、装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-12-12
(45)【発行日】2023-12-20
(54)【発明の名称】ビデオ再生開始の最適化方法、装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム
(51)【国際特許分類】
   H04N 21/433 20110101AFI20231213BHJP
   G06F 12/0875 20160101ALI20231213BHJP
   H04N 21/442 20110101ALI20231213BHJP
   G06N 20/20 20190101ALI20231213BHJP
   G06N 20/00 20190101ALI20231213BHJP
【FI】
H04N21/433
G06F12/0875 106
H04N21/442
G06N20/20
G06N20/00 130
【請求項の数】 17
【外国語出願】
(21)【出願番号】P 2021110593
(22)【出願日】2021-07-02
(65)【公開番号】P2022006167
(43)【公開日】2022-01-12
【審査請求日】2021-10-20
(31)【優先権主張番号】202011578020.9
(32)【優先日】2020-12-28
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】514322098
【氏名又は名称】ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド
【氏名又は名称原語表記】Beijing Baidu Netcom Science Technology Co., Ltd.
【住所又は居所原語表記】2/F Baidu Campus, No.10, Shangdi 10th Street, Haidian District, Beijing 100085, China
(74)【代理人】
【識別番号】110000796
【氏名又は名称】弁理士法人三枝国際特許事務所
(72)【発明者】
【氏名】高 遠飛
【審査官】鈴木 順三
(56)【参考文献】
【文献】Yi Sun et al.,CS2P:Improving Video Bitrate Selection and Adaptation with Data-Driven Throughput Prediction,SIGCOMM'16,Association for Computing Machinery,2016年08月22日,pp.272-285,https://d1.acm.org/doi/10.1145/2934872.2944898
【文献】Rana F. Ghani et al.,Objective Video Streaming QoE Measurement Based On Prediction Model,2017 9th Computer Science and Electronic Engineering (CEEC),IEEE,2017年11月09日,pp.201-206,https://ieeexplore.ieee.org/document/8101625/
(58)【調査した分野】(Int.Cl.,DB名)
H04N 21/00 - 21/858
G06F 12/08 - 12/128
G06N 3/00 - 99/00
(57)【特許請求の範囲】
【請求項1】
コンピュータによって実行されるビデオ再生開始の最適化方法であって、
ビデオ再生開始時にビデオ再生開始速度に影響する特徴データを取得するステップと、
予め訓練されている勾配ブースティング決定木GBDT回帰モデルに前記特徴データを入力して、予測した最小ビデオキャッシュフレームの値を出力し、第1の予測値とするステップと、
前記第1の予測値に基づいて、ビデオ再生を開始させるか否かを決定するステップと、を含み、
前記第1の予測値に基づいて、ビデオ再生を開始させるか否かを決定する前記ステップは、
レーヤーのビデオフレームの実際キャッシュ値と前記第1の予測値とを比較するステップと、
前記プレーヤーのビデオフレームの実際キャッシュ値が前記第1の予測値よりも大きい場合、ビデオ再生を開始させるステップとを含むビデオ再生開始の最適化方法。
【請求項2】
前記ビデオ再生開始時にビデオ再生開始速度に影響する特徴データを取得する前に、
プレーヤーによってビデオ再生開始前に前記GBDT回帰モデルをロードするステップをさらに含む、請求項1に記載のビデオ再生開始の最適化方法。
【請求項3】
前記プレーヤーによってビデオ再生開始前に前記GBDT回帰モデルをロードする前に、
プレーヤーによって予測スレッドを起動させ、前記プレーヤーが前記GBDT回帰モデルをダウンロードしているか否かを判断するステップと、
前記プレーヤーが前記GBDT回帰モデルをダウンロードしていない場合、予測スレッドにおいて前記GBDT回帰モデルをダウンロードし、ダウンロードに成功すると前記GBDT回帰モデルをロードするステップと、をさらに含む、請求項2に記載のビデオ再生開始の最適化方法。
【請求項4】
ビデオ再生開始速度に影響するサンプル特徴データを取得するステップと、
前記サンプル特徴データに基づいてGBDT回帰訓練を行い、前記GBDT回帰モデルを得るステップとをさらに含む、請求項1に記載のビデオ再生開始の最適化方法。
【請求項5】
前記サンプル特徴データに基づいてGBDT回帰訓練を行い、前記GBDT回帰モデルを得る前記ステップは、
前記サンプル特徴データに対してデータクリーニングを行い、最適化されたサンプル特徴データを選択してGBDT回帰訓練を行い、前記GBDT回帰モデルを得るステップを含む、請求項4に記載のビデオ再生開始の最適化方法。
【請求項6】
前記ビデオ再生開始速度に影響する特徴は、ネットワーク速度、ビデオビットレート、ビデオフレームレート、ビデオストリームフォーマット、符号化タイプ、復号モード、ラウンドトリップ遅延のうちの少なくとも1つを含む、請求項5に記載のビデオ再生開始の最適化方法。
【請求項7】
前記特徴データは、ネットワークタイプを少なくとも含み、前記ネットワークタイプは、ローカルエリアネットワーク、有線ネットワークまたは無線ネットワークを含む、請求項1に記載のビデオ再生開始の最適化方法。
【請求項8】
ビデオ再生開始の最適化装置であって、
ビデオ再生開始時にビデオ再生開始速度に影響する特徴データを取得するように構成される第1の取得モジュールと、
予め訓練されている勾配ブースティング決定木GBDT回帰モデルに前記特徴データを入力して、予測した最小ビデオキャッシュフレームの値を出力し、第1の予測値とするように構成される予測モジュールと、
前記第1の予測値に基づいて、ビデオ再生を開始させるか否かを決定するように構成される決定モジュールと、を含み、
前記決定モジュールは、さらに、
レーヤーのビデオフレームの実際キャッシュ値と前記第1の予測値とを比較し、
前記プレーヤーのビデオフレームの実際キャッシュ値が前記第1の予測値よりも大きい場合、ビデオ再生を開始させるように構成される、ビデオ再生開始の最適化装置。
【請求項9】
プレーヤーによってビデオ再生開始前に前記GBDT回帰モデルをロードするように構成されるロードモジュールをさらに含む、請求項8に記載のビデオ再生開始の最適化装置。
【請求項10】
前記ロードモジュールは、さらに、
プレーヤーによって予測スレッドを起動させ、前記プレーヤーが前記GBDT回帰モデルをダウンロードしているか否かを判断し、
前記プレーヤーが前記GBDT回帰モデルをダウンロードしていない場合、予測スレッドにおいて前記GBDT回帰モデルをダウンロードし、ダウンロードに成功すると前記GBDT回帰モデルをロードするように構成される、請求項9に記載のビデオ再生開始の最適化装置。
【請求項11】
ビデオ再生開始速度に影響するサンプル特徴データを取得するように構成される第2の取得モジュールと、
前記サンプル特徴データに基づいてGBDT回帰訓練を行い、前記GBDT回帰モデルを得るように構成される訓練モジュールとをさらに含む、請求項8に記載のビデオ再生開始の最適化装置。
【請求項12】
前記訓練モジュールは、さらに、
前記サンプル特徴データに対してデータクリーニングを行い、最適化されたサンプル特徴データを選択してGBDT回帰訓練を行い、前記GBDT回帰モデルを得るように構成される、請求項11に記載のビデオ再生開始の最適化装置。
【請求項13】
前記ビデオ再生開始速度に影響する特徴は、ネットワーク速度、ビデオビットレート、ビデオフレームレート、ビデオストリームフォーマット、符号化タイプ、復号モード、ラウンドトリップ遅延のうちの少なくとも1つを含む、請求項12に記載のビデオ再生開始の最適化装置。
【請求項14】
前記特徴データは、ネットワークタイプを少なくとも含み、前記ネットワークタイプは、ローカルエリアネットワーク、有線ネットワークまたは無線ネットワークを含む、請求項8に記載のビデオ再生開始の最適化装置。
【請求項15】
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサに通信可能に接続されたメモリとを含み、
前記メモリには、前記少なくとも1つのプロセッサにより実行可能な指令が格納され、前記指令が前記少なくとも1つのプロセッサにより実行されることで、前記少なくとも1つのプロセッサが請求項1~7のいずれか1項に記載のビデオ再生開始の最適化方法を実行できるようにする電子機器。
【請求項16】
コンピュータ指令が記憶されている非一時的コンピュータ読み取り可能な記憶媒体であって、
前記コンピュータ指令はコンピュータに請求項1~7のいずれか1項に記載のビデオ再生開始の最適化方法を実行させる、非一時的コンピュータ読み取り可能な記憶媒体。
【請求項17】
コンピュータ指令を含むコンピュータプログラムがプロセッサにより実行されると、請求項1~7のいずれか1項に記載のビデオ再生開始の最適化方法を実現するコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本出願の実施例はコンピュータ分野に関し、具体的には、ディープラーニング、コンピュータビジョンなどの人工知能の分野に関し、特に、ビデオ再生開始の最適化方法、装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラムに関する。
【背景技術】
【0002】
ネットワーク技術及び知能機器の普及に伴い、スマート端末(携帯電話、テレビ、ボックス、タブレットコンピュータなど)の数が急増し、時間と場所を問わずにネットワークビデオ、生配信ビデオを視聴することが次第に習慣となり、それに伴い、さまざまな原因により引き起こされるネットワークビデオの再生開始がスムーズにいかないことがしばしば発生し、その結果、ユーザのビデオ再生エクスペリエンスが損なわれてしまう。
【0003】
ネットワークビデオ再生開始前に、ビデオプレーヤーは、通常、一定量のビデオフレームを予めダウンロードしてキャッシュしておき、キャッシュしたビデオフレームが所定の閾値に達した時になってはじめて、ビデオフレームを復号して再生し、閾値の選択は往々にして、ある特定タイプのシーンに対応し、閾値が一旦選択されると固定され、ビデオ再生の開始はずっとこの閾値を基準としている。
【発明の概要】
【発明が解決しようとする課題】
【0004】
本出願の実施例は、ビデオ再生開始の最適化方法、装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラムを提案する。
【課題を解決するための手段】
【0005】
第1の態様によれば、本出願の実施例は、ビデオ再生開始時にビデオ再生開始速度に影響する特徴データを取得するステップと、予め訓練されている勾配ブースティング決定木であるGBDT回帰モデルに特徴データを入力して、予測したビデオキャッシュフレームの値を出力し、第1の予測値とするステップと、第1の予測値に基づいて、ビデオ再生を開始させるか否かを決定するステップとを含む、ビデオ再生開始の最適化方法を提案する。
【0006】
第2の態様によれば、本出願の実施例は、ビデオ再生開始時にビデオ再生開始速度に影響する特徴データを取得するように構成される第1の取得モジュールと、予め訓練されているGBDT回帰モデルに特徴データを入力して、予測したビデオキャッシュフレームの値を出力し、第1の予測値とするように構成される予測モジュールと、第1の予測値に基づいて、ビデオ再生を開始させるか否かを決定するように構成される決定モジュールとを含む、ビデオ再生開始の最適化装置を提案する。
【0007】
第3の態様によれば、本出願の実施例は、少なくとも1つのプロセッサと、少なくとも1つのプロセッサに通信可能に接続されたメモリとを含み、メモリには少なくとも1つのプロセッサにより実行可能な指令が格納され、指令は、少なくとも1つのプロセッサにより実行されることで、少なくとも1つのプロセッサが第1の態様のいずれかの実現形態に記載の方法を実行できるようにする電子機器を提案する。
【0008】
第4の態様によれば、本出願の実施例は、コンピュータ指令が記憶されている非一時的コンピュータ読み取り可能な記憶媒体であって、コンピュータ指令はコンピュータに第1の態様のいずれかの実現形態に記載の方法を実行させる非一時的コンピュータ読み取り可能な記憶媒体を提案する。
【0009】
第5の態様によれば、本出願の実施例は、コンピュータ指令を含むコンピュータプログラムがプロセッサにより実行されると、第1の態様のいずれかの実現形態に記載の方法を実現するコンピュータプログラムを提案する。
【発明の効果】
【0010】
本出願の実施例によるビデオ再生開始の最適化方法、装置、機器及び記憶媒体では、まず、ビデオ再生開始時にビデオ再生開始速度に影響する特徴データを取得し、次に、予め訓練されているGBDT回帰モデルに特徴データを入力して、予測したビデオキャッシュフレームの値を出力し、第1の予測値とし、最後に、第1の予測値に基づいて、ビデオ再生を開始させるか否かを決定する。本出願は、機械学習の方法によって最適化されたビデオキャッシュフレーム値を動的に予測する方法を提供し、複数のシーンにおけるビデオの再生開始時間を減らし、ビデオ再生のバッファーリング回数を減少させることにより、ユーザエクスペリエンスを向上させる。なお、本部分に記載された内容は、本開示の実施例のキーとなる特徴又は重要な特徴を示すことを意図しておらず、また本開示の範囲を制限するものでもないことを理解すべきである。本開示のほかの特徴は以下の明細書の記載により理解しやすくなる。
【図面の簡単な説明】
【0011】
本出願のほかの特徴、目的及び利点は、以下の図面を参照して非限定的な実施例について行われる詳細な説明を通じて、より明らかになる。図面は本技術方案をよりよく理解するために使用されるもので、本出願を限定するものではない。
図1】本出願に係るビデオ再生開始の最適化方法の1つの実施例のフローチャートである。
図2】本出願に係るビデオ再生開始の最適化方法の別の実施例のフローチャートである。
図3】プレーヤーが本出願のビデオ再生開始の最適化方法を実行する実現ブロック図である。
図4】本出願に係るビデオ再生開始の最適化装置の1つの実施例の構造模式図である。
図5】本出願の実施例のビデオ再生開始の最適化方法を実現する電子機器のブロック図である。
【発明を実施するための形態】
【0012】
以下、図面を参照しながら本出願の例示的な実施例を説明し、この説明には、理解を助けるために本出願の実施例の各種の詳細が含まれているが、これらは例示的なものに過ぎないことを理解すべきである。したがって、当業者は、本出願の範囲及び主旨を逸脱することなく、ここで記載された実施例に対して各種の変化と修正を行うことができることを理解すべきである。同様に、明確及び明瞭の観点から、以下の説明において公知の機能及び構造についての説明を省略する。
【0013】
なお、矛盾しない限り、本出願における実施例及び実施例における特徴は互いに組み合わせることができる。以下、図面を参照して実施例にて本出願を詳しく説明する。
【0014】
図1は、本出願に係るビデオ再生開始の最適化方法の1つの実施例のプロセス100を示す。該ビデオ再生開始の最適化方法は、ステップ101~ステップ103を含む。
【0015】
ステップ101、ビデオ再生開始時にビデオ再生開始速度に影響する特徴データを取得する。
【0016】
本実施例では、ビデオ再生開始の最適化方法の実行エンティティは、ビデオ再生開始時にビデオ再生開始速度に影響する特徴データを取得することができる。具体的には、ビデオの最初の画面が現れる前に、上記実行エンティティは、ビデオ再生開始速度に影響するすべての特徴データを取得し、これらの特徴データには、ネットワークタイプ、ネットワーク速度、ビデオビットレート、ビデオの高さと幅、ビデオフレームレート、符号化タイプ、復号モードなどの特徴データが含まれているが、これらに制限されない。ネットワークタイプは、ローカルエリアネットワーク、有線ネットワーク、無線ネットワークなどを含むことができ、ネットワーク速度は、ネットワーク速度、すなわち現在のビデオの再生開始時のネットワーク速度であり、ネットワークが弱いシーンの下では、同じフレーム数のビデオデータをダウンロードするには、閾値までに時間がさらにかかり、再生開始時間劣化の問題を招き、ビデオビットレートは、データ伝送において単位時間あたり伝送するデータビットであり、ビデオフレームレートは、表示フレーム数を測定するためのスケールである。ビデオ再生開始時に、以上の特徴はいずれもビデオ再生開始速度に影響を及ぼすものであり、現在のビデオの再生開始時のビデオ再生開始速度に影響するすべての特徴データを取得することにより、ビデオ再生開始についてより適切に最適化することができる。
【0017】
ステップ102、予め訓練されている勾配ブースティング決定木GBDT回帰モデルに特徴データを入力して、予測したビデオキャッシュフレームの値を出力し、第1の予測値とする。
【0018】
本実施例では、上記実行エンティティは、予め訓練されているGBDT(GradientBoostingDecisionTree、勾配ブースティング決定木)回帰モデルに、取得したビデオ再生開始速度に影響するすべての特徴データを入力して、出力した予測したビデオキャッシュフレームの値を得て、この値を第1の予測値とする。GBDT回帰モデルへの入力はビデオ再生開始速度に影響する特徴データであり、出力は予測された最小ビデオキャッシュフレームの値であり、このため、現在のビデオの再生開始時のビデオ再生開始速度に影響するすべての特徴データを上記GBDT回帰モデルに入力すると、予測した現在のネットワークでの最小ビデオキャッシュフレームの値を得ることができ、この値を第1の予測値とする。
【0019】
本実施例のいくつかのオプション的な実施形態では、ビデオ再生開始時にビデオ再生開始速度に影響する特徴データを取得する前に、予め訓練されているGBDT回帰モデルをロードする。ビデオ再生開始速度に影響する特徴データを取得する前に、GBDT回帰モデルをロードし、特徴データを取得した後、特徴データをGBDT回帰モデルに入力して予測値を得る。
【0020】
本実施例のいくつかのオプション的な実施形態では、ビデオ再生開始時にビデオ再生開始速度に影響する特徴データを取得する前に、プレーヤーによってビデオ再生開始前に予め訓練されているGBDT回帰モデルをロードする。プレーヤーを作成する際に、プレーヤーによってGBDT回帰モデルをロードすることにより、それ以降、プレーヤーを開くたびに現在のビデオの再生開始時の最小ビデオキャッシュフレームの値を直接的予測することができ、このようにすると、ビデオ再生開始のための時間を減らすことができる。
【0021】
ステップ103、第1の予測値に基づいて、ビデオ再生を開始させるか否かを決定する。
【0022】
本実施例では、上記実行エンティティは、第1の予測値に基づいて、ビデオ再生を開始させるか否かを決定する。プレーヤーを開くときから、プレーヤーはすでにビデオフレームをキャッシュしているので、プレーヤーのビデオフレームの実際キャッシュ値を実際キャッシュ値とし、このため、GBDT回帰モデルが第1の予測値を出力すると、プレーヤーは該第1の予測値を取得して、このときの実際キャッシュ値を第1の予測値と比較し、2つの数値の比較結果に基づいて、ビデオ再生を開始させるか否かを決定するようにする。
【0023】
本実施例のいくつかのオプション的な実施形態では、プレーヤーのビデオフレームの実際キャッシュ値を第1の予測値と比較し、プレーヤーのビデオフレームの実際キャッシュ値が第1の予測値よりも大きい場合、ビデオ再生を開始させる。第1の予測値は現在のネットワーク状況に基づいて得られた最小ビデオキャッシュフレームであり、プレーヤーのビデオフレームの実際キャッシュ値が第1の予測値よりも大きい時にビデオ再生を開始させることにより、異なるシーンでのビデオ再生開始時間劣化の問題を解決できる。
【0024】
本実施例のいくつかのオプション的な実施形態では、プレーヤーのビデオフレームの実際キャッシュ値を第1の予測値と比較し、プレーヤーのビデオフレームの実際キャッシュ値が第1の予測値未満である場合、プレーヤーはデータのキャッシュ・ダウンロードのバッファーリングを継続し、ビデオフレームの実際キャッシュ値が第1の予測値にまで達してはじめて、ビデオ再生を開始させ、それにより、ビデオ再生時のバッファーリング回数を減らすことができる。
【0025】
本出願の実施例によるビデオ再生開始の最適化方法では、まず、ビデオ再生開始時にビデオ再生開始速度に影響する特徴データを取得し、次に、予め訓練されているGBDT回帰モデルに特徴データを入力して、予測したビデオキャッシュフレームの値を出力し、第1の予測値とし、最後に、第1の予測値に基づいて、ビデオ再生を開始させるか否かを決定する。本出願は、機械学習の方法によって最適化されるビデオキャッシュフレーム値を動的に予測する方法を提供し、複数のシーンにおけるビデオの再生開始時間を減らし、ビデオ再生のバッファーリング回数を減少させ、それにより、ユーザエクスペリエンスを向上させることができた。
【0026】
さらに、図2を参照すると、図2は、本出願に係るビデオ再生開始の最適化方法の別の実施例のプロセス200を示す。該ビデオ再生開始の最適化方法は、ステップ201~ステップ206を含む。
【0027】
ステップ201、ビデオ再生開始速度に影響するサンプル特徴データを取得する。
【0028】
本実施例では、上記実行エンティティは、ビデオ再生開始速度に影響する特徴データを取得してサンプル特徴データとするようにしてもよい。例えば、ネットワーク速度、ラウンドトリップ時間、ビデオビットレートなどが挙げられ、データをダウンロードする際に、ネットワーク速度又はラウンドトリップ時間を取得し、ビデオフレームを復号する際に、ビデオビットレート及びフォーマットを取得する。これらの特徴点データはトリガーされると、サーバにアップロードされ、サーバはこれらのデータを保存しておく。このようにして、クライアントがこれらのデータを取得して、これらのデータを用いてモデルを訓練することが可能になる。
【0029】
本実施例のいくつかのオプション的な実施形態では、ビデオ再生開始速度に影響する特徴は、ネットワーク速度、ビデオビットレート、ビデオフレームレート、ビデオストリームフォーマット、符号化タイプ、復号モード、ラウンドトリップ遅延のうちの少なくとも1つを含む。
【0030】
ステップ202、上記サンプル特徴データに基づいて、GBDT回帰訓練を行い、GBDT回帰モデルを得る。
【0031】
本実施例では、上記実行エンティティは、サンプルの損失をできるだけ小さくするように一連のパラメータを調整により得られるまで、取得したサンプル特徴データをGBDTアルゴリズムライブラリに入力して反復訓練を行い、モデルパラメータを取得し、訓練済みのGBDT回帰モデルを得る。GBDT回帰訓練は、訓練サンプルデータを用いてモデルに対して行われる教師あり訓練であり、訓練サンプルデータは、入力及びターゲット出力を含み、ここで、サンプル特徴データは訓練の入力であり、最小ビデオキャッシュフレームは訓練のターゲット出力である。具体的な過程には、以下のステップが含まれる。
【0032】
1)訓練サンプルデータT={(x,y),(x,y)…(x,y),}、ここで、xはサンプル特徴データで、yは訓練されるターゲット出力で、mはサンプル特徴データの個数で、Tは最大反復回数で、L(y,f(x))は損失関数であり、xはi番目の訓練サンプルを表し、yはi番目の訓練サンプルに対応するターゲット出力を表し、f(x)はi番目の訓練サンプルの損失値を表す。弱学習器f(x)を初期化する。
【数1】
式中、cは最小損失値である。
【0033】
2)反復回数t=1,2...Tに対して以下を行う。
a、サンプルi=1,2...mに対して、負の勾配rtiを計算する。
【数2】
b、(x,rti)(i=1,2..m)を用いて、1つのCART(Classification and Regression Trees、分類と回帰木)回帰木をフィッティングし、t番目の回帰木を得て、それに対応する葉ノード領域はRtj、j=1,2..Jであり、ここで、Jは回帰木tの葉ノードの個数である。
c、葉領域j=1,2..Jに対して、最適フィッティング値ctjを計算する。
【数3】
d、強学習器ft(x)を更新する。
【数4】
【0034】
3)強学習器f(x)の表現式を得る。
【数5】
【0035】
上記ステップにより、訓練済みのGBDT回帰モデルを得る。
【0036】
本実施例のいくつかのオプション的な実施形態では、サンプル特徴データに基づいて、GBDT回帰訓練を行い、GBDT回帰モデルを得るステップは、サンプル特徴データに対してデータクリーニングを行い、最適化されたサンプル特徴データを選択してGBDT回帰訓練を行い、GBDT回帰モデルを得るステップをさらに含む。サンプル特徴データを取得した後、サンプル特徴データに対してデータクリーニングを行い、一部の特徴が異常なデータをフィルタリングし、例えば数値がnull、又は数値が大きすぎるデータをフィルタリングして除去する。同時に、ビデオバッファーリング率の大きい過ぎるもの又はビデオ再生開始時間が長すぎることを引き起こすデータをフィルタリングする。サンプル特徴データに対してクリーニングするのは、最適化された特徴データを選択して回帰訓練を行うことで、サンプルの損失をできるだけ小さくするモデルパラメータを得て、それによりGBDT回帰モデルを得るためである。
【0037】
ステップ203、プレーヤーはビデオ再生開始前にGBDT回帰モデルをロードする。
【0038】
本実施例では、プレーヤーは、ビデオ再生開始前に、訓練済みのGBDT回帰モデルをロードする。例えばプレーヤーは、スレッドを起動させ、GBDT回帰モデルをロードする。
【0039】
本実施例のいくつかのオプション的な実施形態では、プレーヤーによって予測スレッドを起動させ、プレーヤーがGBDT回帰モデルをダウンロードしたか否かを判断し、プレーヤーがGBDT回帰モデルをダウンロードしていない場合、予測スレッドにおいてGBDT回帰モデルをダウンロードし、ダウンロードに成功するとGBDT回帰モデルをロードする。一方、プレーヤーは、予測スレッドを起動させ、GBDT回帰モデルがすでにダウンロードされているか否かを判断し、ダウンロードされていない場合、予測スレッドにおいてGBDT回帰モデルをダウンロードし、ダウンロードに成功するとGBDT回帰モデルをロードし、他方、プレーヤーは、初期化した直後にビデオフレームデータをダウンロードする。このようにして、予測スレッドが予測したビデオキャッシュフレームの値を出力すると、プレーヤーは該予測値を直接取得し、該予測値に基づいてビデオ再生を開始させるか否かを決定することができ、それによって、作業効率を高め、ビデオ再生開始時間を減らし、ユーザエクスペリエンスを向上させることができる。
【0040】
ステップ204、現在のビデオの再生開始時のビデオ再生開始速度に影響するすべての特徴データを取得する。
【0041】
本実施例では、ビデオの最初の画面が現れる前に、上記実行エンティティは、ビデオ再生開始速度に影響するすべての特徴データを取得し、この特徴データには、ネットワークタイプ、ネットワーク速度、ビデオビットレートなどの特徴が含まれるが、これらに制限されない。
【0042】
ステップ205、ロードしたGBDT回帰モデルに上記特徴データを入力し、予測したビデオキャッシュフレームの値を出力する。
【0043】
本実施例では、上記実行エンティティは、ロードしたGBDT回帰モデルに上記取得したすべての特徴データを入力すると、出力し予測したビデオキャッシュフレームの値を得ることができる。
【0044】
ステップ206、予測したビデオキャッシュフレームの値に基づいて、ビデオ再生を開始させるか否かを決定する。
【0045】
本実施例では、上記実行エンティティは、取得した予測ビデオキャッシュフレームの値に基づいて、ビデオ再生を開始させるか否かを決定する。具体的には、このときにプレーヤーが実際にキャッシュしているビデオキャッシュフレームの数値を取得し、この数値を予測したビデオキャッシュフレームの値と比較し、実際にキャッシュしたビデオフレームが予測したビデオキャッシュフレーム未満である場合、データキャッシュを継続し、それ以外の場合、ビデオ再生を開始させる。
【0046】
本出願の実施例によるビデオ再生開始の最適化方法では、まず、ビデオ再生開始速度に影響するサンプル特徴データを取得し、上記サンプル特徴データに基づいて、GBDT回帰訓練を行い、GBDT回帰モデルを得て、次に、プレーヤーは、ビデオ再生開始前にGBDT回帰モデルをロードし、現在のビデオの再生開始時のビデオ再生開始速度に影響するすべての特徴データを取得し、その後、ロードしたGBDT回帰モデルに上記特徴データを入力して、予測したビデオキャッシュフレームの値を出力し、最後に、予測したビデオキャッシュフレームの値に基づいて、ビデオ再生を開始させるか否かを決定する。本出願は、機械学習の方法によって最適化されたビデオキャッシュフレーム値を動的に予測する方法を提供し、複数のシーンにおけるビデオの再生開始時間を減らし、ビデオ再生のバッファーリング回数を減少させ、それにより、ユーザエクスペリエンスを向上させることができる。
【0047】
さらに、図3を参照すると、図3には、プレーヤーが本出願のビデオ再生開始の最適化方法を実行する実現ブロック図が示されている。図3に示すように、プレーヤーは、初期して初期化する際に、予測スレッドを起動させ、予測スレッドによってプレーヤーがGBDT回帰モデルをダウンロードしているか否かを判断し、GBDT回帰モデルをダウンロードした場合、特徴データを直接ロードして取得し、GBDT回帰モデルをダウンロードしていない場合、GBDT回帰モデルのダウンロードを開始させ、ダウンロードに成功するとGBDT回帰モデルをロードする。次に、予測スレッドは、現在のビデオの再生開始時のビデオ再生開始速度に影響するすべての特徴データを取得し、それと同時に、プレーヤーはビデオフレームデータをダウンロードする。予測スレッドは、取得した特徴データをGBDT回帰モデルに入力し、予測したビデオキャッシュフレームの値を出力する。プレーヤーは該予測値を取得し、このときに実際にキャッシュしたビデオフレームデータを該予測値と比較し、実際にキャッシュしたビデオフレームの値が該予測値よりも大きい場合、ビデオ再生を開始させ、それ以外の場合、プレーヤーはビデオフレームデータのキャッシュを継続し、キャッシュしたビデオフレームデータが該予測値まで達すると、ビデオ再生を開始させる。
【0048】
さらに、図4を参照すると、上記各図に示す方法の実装として、本出願は、ビデオ再生開始の最適化装置の1つの実施例を提供し、該装置の実施例は図1に示す方法の実施例に対応し、具体的には、各種の電子機器に適用できる。
【0049】
図4に示すように、本実施例のビデオ再生開始の最適化装置400は、第1の取得モジュール401と、予測モジュール402と、決定モジュール403とを含むことができる。第1の取得モジュール401は、ビデオ再生開始時にビデオ再生開始速度に影響する特徴データを取得するように構成され、予測モジュール402は、予め訓練されている勾配ブースティング決定木GBDT回帰モデルに特徴データを入力して、予測したビデオキャッシュフレームの値を出力し、第1の予測値とするように構成され、決定モジュール403は、第1の予測値に基づいて、ビデオ再生を開始させるか否かを決定するように構成される。
【0050】
本実施例では、ビデオ再生開始の最適化装置400において、第1の取得モジュール401と、予測モジュール402と、決定モジュール403とによる具体的な処理及びこれらによる技術的効果については、図1において対応する実施例のステップ101~103の関連説明を参照すればよく、ここでは更なる説明はしない。
【0051】
本実施例のいくつかのオプション的な実施形態では、該ビデオ再生開始の最適化装置は、プレーヤーによってビデオ再生開始前にGBDT回帰モデルをロードするように構成されるロードモジュールをさらに含む。
【0052】
本実施例のいくつかのオプション的な実施形態では、ロードモジュールは、さらに、プレーヤーによって予測スレッドを起動させ、プレーヤーがGBDT回帰モデルをダウンロードしているか否かを判断し、プレーヤーがGBDT回帰モデルをダウンロードしていない場合、予測スレッドにおいてGBDT回帰モデルをダウンロードし、ダウンロードに成功するとGBDT回帰モデルをロードするように構成される。
【0053】
本実施例のいくつかのオプション的な実施形態では、該ビデオ再生開始の最適化装置は、ビデオ再生開始速度に影響するサンプル特徴データを取得するように構成される第2の取得モジュールと、サンプル特徴データに基づいて、GBDT回帰訓練を行い、GBDT回帰モデルを得るように構成される訓練モジュールとをさらに含む。
【0054】
本実施例のいくつかのオプション的な実施形態では、訓練モジュールは、さらに、サンプル特徴データに対してデータクリーニングを行い、最適化されたサンプル特徴データを選択してGBDT回帰訓練を行い、GBDT回帰モデルを得るように構成される。
【0055】
本実施例のいくつかのオプション的な実施形態では、ビデオ再生開始速度に影響する特徴は、ネットワーク速度、ビデオビットレート、ビデオフレームレート、ビデオストリームフォーマット、符号化タイプ、復号モード、ラウンドトリップ遅延のうちの少なくとも1つを含む。
【0056】
本実施例のいくつかのオプション的な実施形態では、決定モジュールは、さらに、プレーヤーのビデオフレームの実際キャッシュ値を第1の予測値と比較し、プレーヤーのビデオフレームの実際キャッシュ値が第1の予測値よりも大きい場合、ビデオ再生を開始させるように構成される。
【0057】
本出願に係る実施例では、本出願は電子機器、読み取り可能な記憶媒体、及びコンピュータプログラムをさらに提供する。
【0058】
図5には、本出願の実施例に係るビデオ再生開始の最適化方法の電子機器のブロック図が示されている。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナル・デジタル・アシスタント、サーバ、ブレードサーバ、メインフレームコンピュータ、及び他の適切なコンピュータのような、様々な形態のデジタルコンピュータを表すことを意図している。電子機器はまた、パーソナルデジタルプロセッシング、セルラー電話、スマートフォン、ウェアラブルデバイス、及び他の類似のコンピューティング装置のような、様々な形態のモバイル装置を表すことができる。本明細書に示されるコンポーネント、それらの接続及び関係、ならびにそれらの機能は一例にすぎず、本明細書に記載及び/又は必要とされる本出願の実装を制限することを意図していない。
【0059】
図5に示すように、該電子機器は、1つ以上のプロセッサ501と、メモリ502と、高速インタフェースと低速インタフェースとを含む、各コンポーネントを接続するためのインタフェースとを含む。各コンポーネントは、異なるバスを用いて相互に接続され、共通のマザーボードに実装される、又は、必要に応じて他の方法で実装され得る。プロセッサは、外部入力/出力装置(例えば、インターフェイスに結合された表示機器)にGUIのグラフィック情報を表示するためにメモリ内又はメモリ上に記憶された指令を含む、電子機器内で実行される命令を処理することができる。他の実施形態では、必要に応じて、複数のプロセッサ及び/又は複数のバスは、複数のメモリ及び複数のメモリと共に使用され得る。同様に、複数の電子機器を接続することができ、各機器は、必要な動作の一部(例えば、サーバアレイ、ブレードサーバセット、又はマルチプロセッサシステムとして)を提供する。図5では、1つのプロセッサ501が例示されている。
【0060】
メモリ502は、本出願による非一時的コンピュータ読み取り可能な記憶媒体である。ここで、前記メモリは、前記少なくとも1つのプロセッサに本出願によるビデオ再生開始の最適化方法を実行させるために、少なくとも1つのプロセッサによって実行可能な指令を記憶している。本出願の非一時的コンピュータ読み取り可能な記憶媒体は、本出願によるビデオ再生開始の最適化方法をコンピュータに実行させるためのコンピュータ指令を記憶する。
【0061】
メモリ502は、非一時的コンピュータ読み取り可能な記憶媒体として、非一時的ソフトウェアプログラム、非一時的コンピュータ実行可能プログラム、及び本出願の実施例におけるビデオ再生開始の最適化方法に対応するプログラム指令/モジュール(例えば、図4に示す第1の取得モジュール401、予測モジュール402、及び決定モジュール403)のようなモジュールを記憶するために使用することができる。プロセッサ501は、メモリ502に記憶された非一時的ソフトウェアプログラム、指令、及びモジュールを実行することによって、サーバの様々な機能アプリケーション及びデータ処理を実行する、すなわち、上記方法の実施例におけるビデオ再生開始の最適化方法を実現することができる。
【0062】
メモリ502は、オペレーティングシステム、少なくとも1つの機能に必要なアプリケーションプログラムを記憶することができるプログラム記憶領域と、ビデオ再生開始の最適化方法の電子機器の使用に応じて送信されたデータなどを記憶することができるデータ記憶領域とを含む。さらに、メモリ502は、高速ランダムアクセスメモリを含むことができ、少なくとも1つの磁気ディスクメモリデバイス、フラッシュメモリデバイス、又は他の非一時的固体メモリデバイスなどの非一時的メモリを含むこともできる。いくつかの実施例では、メモリ502は、オプションとして、プロセッサ501に対して遠隔的に設置されたメモリを含むことができ、これらの遠隔メモリは、メモリネットワークを介してビデオ再生開始の最適化方法の電子機器に接続され得る。上記のネットワークの例には、インターネット、企業イントラネット、ローカルエリアネットワーク、移動体通信ネットワーク、及びこれらの組み合わせが含まれるが、これらに限定されるものではない。
【0063】
ビデオ再生開始の最適化方法の電子機器は、入力装置503及び出力装置504をさらに含むことができる。プロセッサ501、メモリ502、入力装置503、及び出力装置504は、バス又は他の方法で接続されてもよく、図5には、バスを介した接続が例示されている。
【0064】
入力装置503は、送信された特徴データを受信すること、及びビデオ再生開始の最適化方法の電子機器のユーザ設定及び機能制御に関連するキー信号入力を生成することができ、例えば、タッチスクリーン、キーパッド、マウス、トラックボード、タッチパッド、ポインティングスティック、1つ以上のマウスボタン、トラックボール、ジョイスティックなどの入力装置である。出力装置504は、表示機器、補助照明装置(例えば、LED)、及び触覚フィードバック装置(例えば、振動モータ)などを含むことができる。この表示機器は、液晶ディスプレイ(LCD)、発光ダイオード(LED)ディスプレイ、及びプラズマディスプレイを含むことができるが、これらに限定されない。いくつかの実施形態では、表示機器はタッチスクリーンであってもよい。
【0065】
ここで、記載されたシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、専用ASIC(特定用途向け集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はこれらの組み合わせにおいて実装されてもよい。これらの様々な実施形態は、以下を含むことができる。1つ以上のコンピュータプログラムで実行し、この1つ以上のコンピュータプログラムは、専用又は汎用のプログラマブルプロセッサとすることができる少なくとも1つのプログラマブルプロセッサを含むプログラマブルシステム上で実行及び/又は解釈することができ、記憶システムと、少なくとも1つの入力装置と、少なくとも1つの出力装置とからデータ及び指令を受信し、この記憶システムと、この少なくとも1つの入力装置と、この少なくとも1つの出力装置とにデータ及び指令を転送することができる。
【0066】
これらの計算プログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、又はコードとも呼ばれる)は、プログラマブルプロセッサの機械指令を含み、これらの計算プログラムは、高度なプロセス及び/又はオブジェクト指向プログラミング言語、及び/又はアセンブル/機械語を使用して実装されてもよい。本明細書で使用されるように、用語「機械読み取り可能な媒体」及び「コンピュータ読み取り可能な媒体」は、機械指令及び/又はデータをプログラマブルプロセッサに提供するための任意のコンピュータプログラム、機器、及び/又は装置(例えば、磁気ディスク、光ディスク、メモリ、プログラマブル論理デバイス(PLD))を指し、機械読み取り可能な信号としての機械指令を受信する機械読み取り可能媒体を含む。用語「機械読み取り可能な信号」は、機械指令及び/又はデータをプログラマブルプロセッサに提供するための任意の信号を指す。
【0067】
ユーザとの対話を提供するために、ここで記載されたシステム及び技術は、コンピュータで実施することができ、このコンピュータは、ユーザに情報を表示するための表示装置(例えば、CRT(陰極線管)又はLCD(液晶ディスプレイ)モニタ)と、ユーザがコンピュータに入力を提供することを可能にするキーボード及びポインティング装置(例えば、マウス又はトラックボール)とを有する。他の種類の装置も、ユーザとの対話を提供するために使用され得、例えば、ユーザに提供されるフィードバックは、任意の形態のセンシングフィードバック(例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック)であってもよく、そしてユーザからの入力は、任意の形式(音声入力、音声入力、又は触覚入力を含む)で受信することができる。
【0068】
ここで、記載されたシステム及び技術は、バックグラウンドコンポーネント(例えば、データサーバとして)、又はミドルウェアコンポーネント(例えば、アプリケーションサーバ)、又はフロントエンドコンポーネントを含むコンピューティングシステム(例えば、ユーザがここで記載されたシステム及び技術の実施形態と対話することを可能とするグラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータ)、又はそのようなバックグラウンドコンポーネント、ミドルウェアコンポーネント、又はフロントエンドコンポーネントの任意の組み合わせを含むコンピューティングシステムにおいて実施される。システムのコンポーネントは、任意の形や媒体のデジタルデー通信(例えば、通信ネットワーク)を使っても相互に接続され得る。通信ネットワークの例には、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、及びインターネットが含まれる。
【0069】
コンピュータシステムは、クライアント及びサーバを含むことができる。クライアント及びサーバは、一般的に互いに離れており、通常通信ネットワークを介してインタラクションする。クライアントとサーバの関係は、対応するコンピュータ上で実行され、互いにクライアント-サーバ関係を有するコンピュータプログラムによって生成される。
【0070】
本出願の技術方案によれば、まず、ビデオ再生開始時にビデオ再生開始速度に影響する特徴データを取得し、次に、予め訓練されているGBDT回帰モデルに特徴データを入力して、予測したビデオキャッシュフレームの値を出力し、第1の予測値とし、最後に、第1の予測値に基づいて、ビデオ再生を開始させるか否かを決定する。本出願は、機械学習の方法によって最適化されたビデオキャッシュフレーム値を動的に予測する方法を提供し、複数のシーンにおけるビデオの再生開始時間を減らし、ビデオ再生のバッファーリング回数を減少させ、それにより、ユーザエクスペリエンスを向上させた。
【0071】
なお、上記の様々な形式のプロセスを使用して、ステップを並べ替えたり、追加したり、削除したりすることができることを理解すべきである。例えば、本出願に記載された各ステップは、本出願で開示された技術的解決手段によって期待される結果を達成することができる限り、並行して実行されてもよく、異なる順序で実行されてもよく、本明細書では限定しない。
【0072】
上記の具体的な実施形態は、本出願の保護範囲に対する制限を構成するものではない。当業者は、設計要件及びその他の要素に応じて、様々な修正、組み合わせ、サブ組み合わせ及び代替が可能であることは理解すべきである。本出願の精神及び原則の範囲内で行われた修正、均等な置換や改良等は、すべて本出願の保護範囲に含まれるものとする。
図1
図2
図3
図4
図5