(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-12-18
(45)【発行日】2023-12-26
(54)【発明の名称】視聴完了率推定装置、視聴完了率推定方法及びプログラム
(51)【国際特許分類】
H04N 21/24 20110101AFI20231219BHJP
【FI】
H04N21/24
(21)【出願番号】P 2022532953
(86)(22)【出願日】2020-07-02
(86)【国際出願番号】 JP2020026019
(87)【国際公開番号】W WO2022003902
(87)【国際公開日】2022-01-06
【審査請求日】2022-11-09
(73)【特許権者】
【識別番号】000004226
【氏名又は名称】日本電信電話株式会社
(74)【代理人】
【識別番号】100107766
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100124844
【氏名又は名称】石原 隆治
(72)【発明者】
【氏名】山岸 和久
(72)【発明者】
【氏名】レブレトン ピエール
【審査官】富樫 明
(56)【参考文献】
【文献】国際公開第2019/216197(WO,A1)
【文献】IOWNの実現に向けてネットワークと環境エネルギーの技術革新に取り組むNTTネットワーク基盤技術研究,BUSINESS COMMUNICATION,日本,株式会社ビジネスコミュニケーション社,2020年03月01日,Vol. 57, No.3,pp. 30-33
(58)【調査した分野】(Int.Cl.,DB名)
H04N 21/00-21/858
(57)【特許請求の範囲】
【請求項1】
映像品質の推定値と、視聴完了率が映像品質の低下とともに低下する特性とに基づいて、単位時間あたりの視聴完了率の推定値を算出する第1の推定部と、
前記単位時間あたりの視聴完了率の推定値に基づいて、或る映像コンテンツ長に対する視聴完了率を推定する第2の推定部と、
を有することを特徴とする視聴完了率推定装置。
【請求項2】
前記第2の推定部は、映像コンテンツ長の増加に伴い、前記単位時間あたりの視聴完了率が低いほど視聴完了率が低下する特性に基づき、前記或る映像コンテンツ長に対する視聴完了率を推定する、
ことを特徴とする請求項1記載の視聴完了率推定装置。
【請求項3】
映像品質の推定値と、視聴完了率が映像品質の低下とともに低下する特性とに基づいて、単位時間あたりの視聴完了率の推定値を算出する第1の推定手順と、
前記単位時間あたりの視聴完了率の推定値に基づいて、或る映像コンテンツ長に対する視聴完了率を推定する第2の推定手順と、
をコンピュータが実行することを特徴とする視聴完了率推定方法。
【請求項4】
前記第2の推定手順は、映像コンテンツ長の増加に伴い、前記単位時間あたりの視聴完了率が低いほど視聴完了率が低下する特性に基づき、前記或る映像コンテンツ長に対する視聴完了率を推定する、
ことを特徴とする請求項3記載の視聴完了率推定方法。
【請求項5】
請求項1又は2記載の視聴完了率推定装置としてコンピュータを機能させることを特徴とするプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、視聴完了率推定装置、視聴完了率推定方法及びプログラムに関する。
【背景技術】
【0002】
インターネットを介して映像や音響(以下、音声も含む)を含む映像メディアを端末間あるいはサーバと端末との間で転送する映像通信サービス(例えば、IPTV、アダプティブストリーミング(例えば、HLS、MPEG-DASH))が普及している。
【0003】
インターネットは、必ずしも通信品質が保証されているネットワークではないため、音声メディアや映像メディアなどを用いて通信を行う場合、視聴者端末とネットワークの回線帯域が狭いことによるビットレートの低下、回線が輻輳することによるパケット損失、パケット転送遅延、パケットの再送が発生し、音声メディアや映像メディアなどに対して視聴者が知覚する品質が劣化してしまう。
【0004】
具体的には、ネットワークを介して過剰なビットレートで映像を配信することができないために原映像について符号化が行われるが、原映像を符号化する際に、フレーム内の映像信号にブロック単位の処理による劣化が生じたり、映像信号の高周波成分が失われることにより、映像全体の精細感が低くなったりする。また、配信ビットレートを確保できないために、映像の解像度を低下させ、精細感が低くなったり、フレームレートを低下させることで映像の連続性が確保できず、不連続な映像になったりする。また、符号化された映像データをパケットとしてネットワークを介して視聴者端末に送信する際、パケット損失や廃棄が発生すると、フレーム内に劣化が生じたり、スループット等が低下したりして、パケットが再生のタイミングまでに届かず、視聴者端末でのデータバッファ量が不足して映像の再生が停止したりする。
【0005】
同様に、音響においても、ネットワークを介して過剰なビットレートで音響を配信することができないために原音響について符号化が行われるが、原音響を符号化する際に、音響の高周波成分が失われ、音響の明瞭度が失われる。また、映像同様に、符号化された音響データをパケットとしてネットワークを介して視聴者端末に送信する際、パケット損失や廃棄が発生すると、音響に歪が生じたり、スループット等が低下したりして、パケットが再生のタイミングまでに届かず、視聴者端末でのデータバッファ量が不足して音響の再生が停止したりする。
【0006】
結果として、視聴者は、映像劣化、音響劣化を知覚し、オーディオビジュアル品質の低下を知覚する。この知覚した品質低下により、ユーザが映像を完全に視聴し終わる前に視聴を終了してしまう問題が発生する.
サービス提供者が、上記のような映像通信サービスを良好な品質で提供し、品質低下による視聴離脱を低減(視聴完了率を増加)するためには、品質と視聴完了率との対応関係に基づき、提供品質を決定することが重要となる。
【0007】
したがって、視聴者が体感するオーディオビジュアル品質と視聴完了率との関係を適切に表現することができる視聴完了率推定技術が必要とされている。
【0008】
従来、オーディオビジュアル品質を評価する手法として、例えば、非特許文献1-5等に開示された品質推定法がある。
【0009】
具体的には、送信されたパケットとサービス提供者などから得た設定値を入力とし、パケット損失により発生した映像フレームの損失により、劣化がどの程度伝搬するかを考慮し、実コンテンツの尺長(例えば、30分、1時間、2時間など)に対し、短時間(例えば、10秒程度)の音響、映像、オーディオビジュアル品質評価値を導出する技術がある(例えば、非特許文献1参照)。
【0010】
また、送信された映像配信に関するメタデータ(例えば、解像度、フレームレート、ビットレート等)とサービス提供者などから得た設定値(例えば、コーデック等)を入力とし、実コンテンツの尺長(例えば、30分、1時間、2時間など)に対し、短時間(例えば、10秒程度)のオーディオビジュアル品質評価値を導出する技術がある(例えば、非特許文献2-5参照)。
【0011】
従来の品質推定法は、上記のように、短時間における音響、映像、オーディオビジュアル品質評価値を推定するものであった。
【先行技術文献】
【非特許文献】
【0012】
【文献】Parametric non-intrusive assessment of audiovisual media streaming quality, ITU-T P.1201
【文献】Parametric bitstream-based quality assessment of progressive download and adaptive audiovisual streaming services over reliable transport, ITU-T P.1203
【文献】Parametric bitstream-based quality assessment of progressive download and adaptive audiovisual streaming services over reliable transport - Video quality estimation module, ITU-T P.1203.1
【文献】P. Lebreton and K. Yamagishi, " Transferring adaptive bit rate streaming quality models from H.264/HD to H.265/4K-UHD," IEICE Transactions on Communications, Vol.E102-B, No.12, pp.2226-2242, Dec. 2019,
【文献】K. Yamagishi and T. Hayashi, "Parametric Quality-Estimation Model for Adaptive-Bitrate Streaming Services," IEEE Transactions on Multimedia, Vol.19, No. 7, pp.1545-1557, 2017.
【発明の概要】
【発明が解決しようとする課題】
【0013】
しかしながら、非特許文献1-5の技術(パラメトリックモデル)は、コーデック情報やビットレートなどのパラメータから音響、映像、オーディオビジュアル品質を推定するため、各品質グレードに対し、視聴完了率を直接推定することができない.
また、映像コンテンツは任意の時間長(例えば、30分、1時間、2時間等)を有するため、各映像コンテンツに合わせた視聴完了率を推定できることが必要である。
【0014】
本発明は、上記の点に鑑みてなされたものであって、映像の視聴完了率を推定可能とすることを目的とする。
【課題を解決するための手段】
【0015】
そこで上記課題を解決するため、視聴確率推定装置は、映像品質の推定値と、視聴完了率が映像品質の低下とともに低下する特性とに基づいて、単位時間あたりの視聴完了率の推定値を算出する第1の推定部と、前記単位時間あたりの視聴完了率の推定値に基づいて、或る映像コンテンツ長に対する視聴完了率を推定する第2の推定部と、を有する。
【発明の効果】
【0016】
映像の視聴完了率を推定可能とすることができる。
【図面の簡単な説明】
【0017】
【
図1】本発明の実施の形態における視聴完了率推定装置10のハードウェア構成例を示す図である。
【
図2】本発明の実施の形態における視聴完了率推定装置10の機能構成例を示す図である。
【
図3】視聴完了率推定装置10が実行する処理手順の一例を説明するためのフローチャートである。
【
図4】単位時間(映像コンテンツ長)ごとの視聴完了率と映像品質(MOS)の関係を示す図である。
【発明を実施するための形態】
【0018】
以下、図面に基づいて本発明の実施の形態を説明する。
図1は、本発明の実施の形態における視聴完了率推定装置10のハードウェア構成例を示す図である。
図1の視聴完了率推定装置10は、それぞれバスBで相互に接続されているドライブ装置100、補助記憶装置102、メモリ装置103、CPU104、及びインタフェース装置105等を有する。
【0019】
視聴完了率推定装置10での処理を実現するプログラムは、フレキシブルディスク又はCD-ROM等の記録媒体101によって提供される。プログラムを記憶した記録媒体101がドライブ装置100にセットされると、プログラムが記録媒体101からドライブ装置100を介して補助記憶装置102にインストールされる。但し、プログラムのインストールは必ずしも記録媒体101より行う必要はなく、ネットワークを介して他のコンピュータよりダウンロードするようにしてもよい。また、当該プログラムは、他のプログラムの一部としてインストールされるようにしてもよい。補助記憶装置102は、インストールされたプログラムを格納すると共に、必要なファイルやデータ等を格納する。
【0020】
メモリ装置103は、プログラムの起動指示があった場合に、補助記憶装置102からプログラムを読み出して格納する。CPU104は、メモリ装置103に格納されたプログラムに従って視聴完了率推定装置10に係る機能を実行する。インタフェース装置105は、ネットワークに接続するためのインタフェースとして用いられる。
【0021】
図2は、本発明の実施の形態における視聴完了率推定装置10の機能構成例を示す図である。
図2において、視聴完了率推定装置10は、視聴者が体感する品質に対する視聴完了率を推定するために、符号化品質推定部11、単位時間視聴完了率推定部12及び視聴完了率推定部13を有する。これら各部は、視聴完了率推定装置10にインストールされた1以上のプログラムが、CPU104に実行させる処理により実現される。すなわち、これら各部は、視聴完了率推定装置10のハードウェア資源と、視聴完了率推定装置10にインストールされたプログラム(ソフトウェア)との協働によって実現される。
【0022】
なお、視聴完了率とは、1つの映像コンテンツの最後までが視聴される確率をいう。
【0023】
符号化品質推定部11は、実サービスで利用するコーデック設定(例えば、プロファイル、エンコーディングパス数、GoPサイズ、動きベクトル探索範囲等)、符号化パラメータ(例えば、解像度、フレームレート、ビットレート)を入力とし、或る映像コンテンツ(以下、「対象映像」という。)について、当該コーデック設定及び当該符号化パラメータに基づく符号化後の映像品質(例えば、MOS(Mean Opinion Score))を推定する。
【0024】
単位時間視聴完了率推定部12は、符号化品質推定部11によって推定された映像品質を入力し、単位時間(例えば、1秒、10秒、1分、等)あたりの視聴完了率(以下、「単位時間視聴完了率」という。)を推定する。なお、単位時間あたりの視聴完了率とは、仮に映像コンテンツ長が単位時間であった場合の視聴完了率をいう。例えば、単位時間が1分であれば、単位時間あたりの視聴完了率とは、映像コンテンツ長が1分である場合の視聴完了率をいう。
【0025】
視聴完了率推定部13は、対象映像の映像コンテンツ長(対象映像の本来の再生時間)及び単位時間視聴完了率推定部12によって推定された単位時間視聴完了率を入力とし、当該映像コンテンツ長に対応した視聴完了率を推定する。
【0026】
以下、視聴完了率推定装置10が実行する処理手順について説明する。
図3は、視聴完了率推定装置10が実行する処理手順の一例を説明するためのフローチャートである。
【0027】
ステップS101において、任意のコーデック設定(以下、「対象コーデック設定」という。)及び任意の符号化パラメータが入力されると、符号化品質推定部11は、当該コーデック設定及び当該符号化パラメータに基づく符号化後の映像品質の推定値(以下、「品質推定値」という。)を算出し、当該品質推定値を単位時間視聴完了率推定部12へ出力する。なお、任意のコーデック設定及び任意の符号化パラメータとは、映像通信サービスの提供者が実サービスで利用するコーデック設定(例えば、プロファイル、エンコーディングパス数、GoPサイズ、動きベクトル探索範囲等)、及び実サービスで利用する符号化パラメータ(例えば、解像度、フレームレート、ビットレート)である。映像品質は、例えば、非特許文献3-5等に開示された技術を用いて推定することができる。
【0028】
例えば、符号化品質推定部11は、非特許文献5の映像品質推定技術に基づく以下の数式を用いて品質推定値Qを算出する。
【0029】
【数1】
但し、rsは、垂直・水平方向のライン数及び画素数から求められた解像度(例えば、1920×1080などの総画素数)である。但し、垂直方向のライン数又は水平方向の画素数のみを把握可能な場合、rsは、当該ライン数又は当該画素数から公知の方法で算出された解像度である。frは、フレームレートである。brは、ビットレートである。v
1,…,v
7は、係数である。
【0030】
続いて、単位時間視聴完了率推定部12は、符号化品質推定部11によって推定された映像品質(品質推定値Q)に基づいて、単位時間視聴完了率の推定値を算出し、算出結果を視聴完了率推定部13に出力する(S102)。この際、単位時間視聴完了率推定部12は、視聴完了率が映像品質の低下とともに低下する特性も考慮して、単位時間視聴完了率の推定値を算出する。
【0031】
図4は、単位時間(映像コンテンツ長)ごとの視聴完了率と映像品質(MOS)の関係を示す図である。
図4には、1分、2分、3分の単位時間(映像コンテンツ長)について、映像品質(MOS)と視聴完了率との関係が示されている。
図4に示されるように、視聴完了率は、映像品質の低下とともに低下する特性を有する。
【0032】
例えば、単位時間視聴完了率推定部12は、以下の数式を用い、単位時間視聴完了率C(Q)の推定値を算出する。この数式は、映像品質の低下に伴い、視聴完了率が低下(視聴離脱率が増加)するという特性を表現している。
C(Q)=1-exp(-c1×Q+c2)
但し、Qは、上記の品質推定値、c1、c2は係数であり、単位時間によって異なる。したがって、ユーザが任意に採用又は選択した単位時間に応じた数式に基づいて、単位時間視聴完了率C(Q)が算出される。具体的には、例えば、単位時間として1分が採用された場合には、
図4の左の曲線に近似された数式(すなわち、c1及びc2)に従って、単位時間視聴完了率C(Q)が算出される。又は、単位時間として2分が採用された場合には、
図4の真ん中の曲線に近似された数式(すなわち、c1及びc2)に従って、単位時間視聴完了率C(Q)が算出される。又は、単位時間として3分が採用された場合には、
図4の右の曲線に近似された数式(すなわち、c1及びc2)に従って、単位時間視聴完了率C(Q)が算出される。なお、単位時間視聴完了率C(Q)を算出するための数式は、映像品質低下に伴い、視聴完了率が低下する特性を加味できる数式であればよく、本数式に限定されない。
【0033】
続いて、視聴完了率推定部13は、任意の映像コンテンツ長(例えば、ユーザによって入力された映像コンテンツ長)及び単位時間視聴完了率に基づいて、対象コーデック設定に対する視聴完了率を算出し、当該視聴完了率を出力する(S103)。
【0034】
ここで、
図4によれば、映像コンテンツ長が長くなれば長くなるほど、同一の視聴完了率を達成するためには映像品質を高く維持する必要があることが分かる。例えば、
図4に示されるように、視聴完了率90%を達成するために必要な映像品質(MOS)は、1分の映像コンテンツで2.1程度、2分の映像コンテンツでは2.5程度、3分の映像コンテンツでは2.7程度となる。視聴完了率推定部13は、この特性に基づいて、映像コンテンツ長及び単位時間視聴完了率から対象コーデック設定に対する視聴完了率を算出する。
【0035】
例えば、視聴完了率推定部13は、以下の数式を用いて視聴完了率C(Q,t)を推定する。この数式は、映像コンテンツ長が増加すればするほど、映像品質が高くないと(すなわち、単位時間視聴完了率が高くないと)、視聴完了率が低下してしまう特性を表現している。なお、単位時間視聴完了率が高くないと視聴完了率が低下してしまう特性とは、換言すれば、単位時間視聴完了率が低いほど視聴完了率が低下する特性をいう。
C(Q,t)=[C(Q)]t
但し、C(Q)は、上記の単位時間視聴完了率である。tは、映像コンテンツ長(分)である。
【0036】
また、映像コンテンツ長に対する視聴完了率の低下をコントロールするため、係数c3、又は更に係数c4が追加された以下のいずれかの数式が用いられてもよい。
C(Q,t)=[C(Q)]c3・t
C(Q,t)=[C(Q)](c3・t+c4)
但し、C(Q)は、上記の単位時間視聴完了率である。tは、映像コンテンツ長(分)である。c3及びc4は係数である。視聴完了率を算出するための数式は、映像コンテンツ長の増加に伴い、単位時間あたりの視聴完了率が高くないと視聴完了率が低下する特性を加味できる数式であればよく、上記の数式に限定されない。
【0037】
上述したように、本実施の形態によれば、コーデック設定ごとに映像の視聴完了率を推定可能とすることができる。
【0038】
従来、映像品質を推定する品質推定技術は確立されているものの、品質低下による視聴離脱の増加(視聴完了の低下)が把握できない課題が有った。これに対し、本実施の形態では、視聴完了率を機械的に推定できる。
【0039】
その結果、映像通信サービスの提供者は、視聴者が実際に視聴する映像通信サービスの視聴完了率を把握できるため、例えば、視聴完了率が著しく低い映像を作成することを避けることができる。このため、提供予定の映像配信の視聴完了率を改善することが可能となる。
【0040】
なお、本実施の形態において、単位時間視聴完了率推定部12は、第1の推定部の一例である。視聴完了率推定部13は、第2の推定部の一例である。
【0041】
以上、本発明の実施の形態について詳述したが、本発明は斯かる特定の実施形態に限定されるものではなく、請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
【符号の説明】
【0042】
10 視聴完了率推定装置
11 符号化品質推定部
12 単位時間視聴完了率推定部
13 視聴完了率推定部
100 ドライブ装置
101 記録媒体
102 補助記憶装置
103 メモリ装置
104 CPU
105 インタフェース装置
B バス