(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-04-21
(45)【発行日】2022-05-02
(54)【発明の名称】ビデオ処理方法、ビデオ処理装置および記憶媒体
(51)【国際特許分類】
H04N 21/4402 20110101AFI20220422BHJP
H04N 21/442 20110101ALI20220422BHJP
【FI】
H04N21/4402
H04N21/442
(21)【出願番号】P 2020125375
(22)【出願日】2020-07-22
【審査請求日】2020-07-22
(31)【優先権主張番号】202010165769.4
(32)【優先日】2020-03-11
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】520274253
【氏名又は名称】ペキン シャオミ パインコーン エレクトロニクス カンパニー, リミテッド
(74)【代理人】
【識別番号】100107489
【氏名又は名称】大塩 竹志
(72)【発明者】
【氏名】フー ジアガオ
(72)【発明者】
【氏名】リウ チャンシン
(72)【発明者】
【氏名】ワン フェイ
(72)【発明者】
【氏名】ユー ペンフェイ
【審査官】大西 宏
(56)【参考文献】
【文献】特開2005-229578(JP,A)
【文献】特開2019-149785(JP,A)
【文献】国際公開第2009/141955(WO,A1)
【文献】米国特許出願公開第2009/0251594(US,A1)
【文献】米国特許出願公開第2013/0050574(US,A1)
【文献】米国特許出願公開第2017/0249719(US,A1)
【文献】米国特許出願公開第2019/0348077(US,A1)
【文献】中国特許出願公開第110062279(CN,A)
【文献】中国特許出願公開第110149532(CN,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 7/10
H04N 7/14 - 7/173
H04N 7/20 - 7/56
H04N 21/00 -21/858
(57)【特許請求の範囲】
【請求項1】
ビデオ処理方法であって、
前記ビデオ処理方法は、
第1アスペクト比を有するソースビデオから複数のビデオフレームを抽出することと、
第2アスペクト比を有する複数の候補クロッピングフレームを生成するために、前記複数のビデオフレームの各ビデオフレームをそれぞれ複数回クロッピングすることと、
前記複数のビデオフレームの各ビデオフレームの複数の候補クロッピングフレームのそれぞれについて評点を決定することであって、前記評点は、各候補クロッピングフレームがクロッピング範囲であるときの前記ビデオフレームの再生効果を表
す、ことと、
前記評点に基づいて前記複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択することと、
各ビデオフレームが、選択された前記クロッピングフレームを使用してクロッピングし、前記第2アスペクト比を有するターゲットビデオを生成すること
と
を含
み、
前記評点に基づいて前記複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択することは、
前記複数のビデオフレームの各ビデオフレームに対して、各2つの候補クロッピングフレーム間の位置に基づいて、状態遷移行列を構築することであって、前記状態遷移行列は、隣接する各フレーム間の各ビデオフレームで選択された候補クロッピングフレームのジッターに対して平滑化制御を実行するために使用される、ことと、
前記状態遷移行列および各候補クロッピングフレームの評点を使用して、最大クロッピングフレーム評点を満たすクロッピングフレームシーケンスを決定することであって、前記クロッピングフレームシーケンスは、各ビデオフレームから選択された候補クロッピングフレームを含む、ことと
を含む、ビデオ処理方法。
【請求項2】
前記候補クロッピングフレームの評点を決定することは、
前記候補クロッピングフレーム内の画像コンテンツに
既存の画像美的クロッピング方法または画像美的評点方法を使用して美的スコアを付けて、前記候補クロッピングフレームの評点を取得することを含む
、請求項1に記載のビデオ処理方法。
【請求項3】
前記候補クロッピングフレームの評点を決定することは、
前記候補クロッピングフレーム内の各画素に対して顕著性ターゲット検出を実行し、前記顕著性ターゲット検出結果に基づいて各画素の画素評点を決定することと、
前記候補クロッピングフレーム内の各画素の画素評点に従って、前記候補クロッピングフレームの評点を決定すること
と
を含む
、請求項1に記載のビデオ処理方法。
【請求項4】
前記状態遷移行列および各候補クロッピングフレームの評点を使用して、最大クロッピングフレーム評点を満たすクロッピングフレームシーケンスを決定することであって、前記クロッピングフレームシーケンスは、各ビデオフレームから選択された候補クロッピングフレームを含む、ことは、
関数
【数1】
に基づいて、状態遷移行列および各候補クロッピングフレームの評点を使用して、最大クロッピングフレーム評点を満たすクロッピングフレームシーケンスを決定することを含み、前記クロッピングフレームシーケンスは、各ビデオフレームから選択された候補クロッピングフレームを含み、
【数2】
は、n番目のフレームから選択されたy番目の候補クロッピングフレームの評点を表し、
【数3】
は、n番目のフレームから選択されたy番目の候補クロッピングフレームとn-1番目のフレームから選択されたy番目の候補クロッピングフレームに対応する状態遷移行列値を表す、請求項1~3のいずれか一項に記載のビデオ処理方法。
【請求項5】
前記各2つの候補クロッピングフレーム間の位置に基づいて、状態遷移行列を構築することは、
前記各2つの候補クロッピングフレーム間の交差比および係数乗数に基づいて、状態遷移行列を構築することを含み、前記係数乗数は、平滑化の度合いを制御するために使用される
、請求項4に記載のビデオ処理方法。
【請求項6】
前記各2つの候補クロッピングフレーム間の位置に基づいて、状態遷移行列を構築することは、
隣接する各2つの候補クロッピングフレームの中心位置間のユークリッド距離
および候補クロッピングフレームの面積
および係数乗数に基づいて、状態遷移行列を構築することを含み、前記係数乗数は、平滑化の度合いを制御するために使用される
、請求項4に記載のビデオ処理方法。
【請求項7】
各ビデオフレームのクロッピングフレームを選択した後、前記
ビデオ処理方法は、
前記ソースビデオを、隣接する各フレーム間で選択されたクロッピングフレーム位置とサイズが変更しない複数のビデオセグメントに分割することと、
隣接する2つのビデオセグメントの中間時点と隣接する2つのビデオセグメント内のクロッピングフレーム間の距離に基づいて、クロッピングフレームが前記隣接する2つのビデオセグメント内で移動する速度を決定することと、
前記速度および再生時間に基づいて、前記隣接する2つのビデオセグメント内のクロッピングフレームの位置を調整すること
と
をさらに含む
、請求項4に記載のビデオ処理方法。
【請求項8】
前記複数のビデオセグメントの総数はK(Kは1より大きい正の整数である)であり、
前記速度および再生時間に基づいて、前記隣接する2つのビデオセグメント内のクロッピングフレームの位置を調整することは、
第1ビデオセグメントに対して、再生時間が第1ビデオセグメントの中間時点より短い場合、第1ビデオセグメント内のクロッピングフレーム位置を変更しないことを維持することと、
第k(kは、1<k<K-1を満たす正の整数である)ビデオセグメントおよび第k+1ビデオセグメントに対して、再生時間が第kビデオセグメントの中間時点より長いか等しく、且つ第k+1ビデオセグメントの中間時点より短い場合、前記第kビデオセグメント内のクロッピングフレームを調整して第1距離を移動することであって、前記第1距離は、第1速度と第1時間の積であり、前記第1速度は、クロッピングフレームが第kビデオセグメントから第k+1ビデオセグメントまで移動する速度であり、前記第1時間は、現在の時間と第kビデオセグメントの中間時点の差である
、ことと、
第Kビデオセグメントに対して、再生時間が第Kビデオセグメントの中間時点より長い場合、第Kビデオセグメント内のクロッピングフレーム位置を変更しないことを維持すること
と
を含む
、請求項7に記載のビデオ処理方法。
【請求項9】
ビデオ処理装置であって、
前記ビデオ処理装置は、
第1アスペクト比を有するソースビデオから複数のビデオフレームを抽出するように構成される抽出ユニットと、
第2アスペクト比を有する複数の候補クロッピングフレームを生成するために、前記複数のビデオフレームの各ビデオフレームをそれぞれ複数回クロッピングするように構成されるクロッピングユニットと、
前記複数のビデオフレームの各ビデオフレームの複数の候補クロッピングフレームのそれぞれについて評点を決定するように構成される評点ユニットであって、前記評点は、各候補クロッピングフレームがクロッピング範囲であるときの前記ビデオフレームの再生効果を表す
、評点ユニットと、
前記評点に基づいて前記複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択するように構成される選択ユニットと、
各ビデオフレームが、選択された前記クロッピングフレームを使用してクロッピングし、前記第2アスペクト比を有するターゲットビデオを生成するように構成される生成ユニット
と
を含
み、
前記選択ユニットは、
前記複数のビデオフレームの各ビデオフレームに対して、各2つの候補クロッピングフレーム間の位置に基づいて、状態遷移行列を構築することであって、前記状態遷移行列は、隣接する各フレーム間の各ビデオフレームで選択された候補クロッピングフレームのジッターに対して平滑化制御を実行するために使用される、ことと、
前記状態遷移行列および各候補クロッピングフレームの評点を使用して、最大クロッピングフレーム評点を満たすクロッピングフレームシーケンスを決定することであって、前記クロッピングフレームシーケンスは、各ビデオフレームから選択された候補クロッピングフレームを含む、ことと
を採用することによって、前記評点に基づいて前記複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択する、ビデオ処理装置。
【請求項10】
前記評点ユニットは、
前記候補クロッピングフレーム内の画像コンテンツに
既存の画像美的クロッピング方法または画像美的評点方法を使用して美的スコアを付けて、前記候補クロッピングフレームの評点を取得することを採用
することによって、前記候補クロッピングフレームの評点を決定する
、請求項9に記載のビデオ処理装置。
【請求項11】
前記評点ユニットは、
前記候補クロッピングフレーム内の各画素に対して顕著性ターゲット検出を実行し、顕著性ターゲット検出結果に基づいて各画素の画素評点を決定すること
と、
前記候補クロッピングフレーム内の各画素の画素評点に従って、前記候補クロッピングフレームの評点を決定すること
と
を
採用することによって、前記候補クロッピングフレームの評点を決定する
、請求項9に記載のビデオ処理装置。
【請求項12】
前記状態遷移行列および各候補クロッピングフレームの評点を使用して、最大クロッピングフレーム評点を満たすクロッピングフレームシーケンスを決定することであって、前記クロッピングフレームシーケンスは、各ビデオフレームから選択された候補クロッピングフレームを含む、ことは、
関数
【数4】
に基づいて、状態遷移行列および各候補クロッピングフレームの評点を使用して、最大クロッピングフレーム評点を満たすクロッピングフレームシーケンスを決定することを含み、前記クロッピングフレームシーケンスは、各ビデオフレームから選択された候補クロッピングフレームを含み、
【数5】
は、n番目のフレームから選択されたy番目の候補クロッピングフレームの評点を表し、
【数6】
は、n番目のフレームから選択されたy番目の候補クロッピングフレームとn-1番目のフレームから選択されたy番目の候補クロッピングフレームに対応する状態遷移行列値を表す、請求項9~11のいずれか一項に記載のビデオ処理装置。
【請求項13】
前記選択ユニットは、
前記各2つの候補クロッピングフレーム間の交差比および係数乗数に基づいて、状態遷移行列を構築すること
を採用
することによって、前記各2つの候補クロッピングフレーム間の位置に基づいて、状態遷移行列を構築
し、前記係数乗数は、平滑化の度合いを制御するために使用される、請求項12に記載のビデオ処理装置。
【請求項14】
前記選択ユニットは、
隣接する各2つの候補クロッピングフレームの中心位置間のユークリッド距離
および候補クロッピングフレームの面積
および係数乗数に基づいて、状態遷移行列を構築すること
を採用
することによって、前記各2つの候補クロッピングフレーム間の位置に基づいて、状態遷移行列を構築
し、前記係数乗数は、平滑化の度合いを制御するために使用される、請求項12に記載のビデオ処理装置。
【請求項15】
前記
ビデオ処理装置は
、調整ユニットをさらに含み
、
前記調整ユニットは、
前記選択ユニットが各ビデオフレームのクロッピングフレームを選択した後、前記ソースビデオを、隣接する各フレーム間で選択されたクロッピングフレーム位置とサイズが変更しない複数のビデオセグメントに分割
することと、
隣接する2つのビデオセグメントの中間時点と隣接する2つのビデオセグメント内のクロッピングフレーム間の距離に基づいて、クロッピングフレームが前記隣接する2つのビデオセグメント内で移動する速度を決定
することと、
前記速度および再生時間に基づいて、前記隣接する2つのビデオセグメント内のクロッピングフレームの位置を調整すること
と、
を行うように構成される
、請求項12に記載のビデオ処理装置。
【請求項16】
前記複数のビデオセグメントの総数は
、K(Kは1より大きい正の整数である)であり、
前記調整ユニットは、
第1ビデオセグメントに対して、再生時間が第1ビデオセグメントの中間時点より短い場合、第1ビデオセグメント内のクロッピングフレーム位置を変更しないことを維持すること
と、
第k(kは、1<k<K-1を満たす正の整数である)ビデオセグメントおよび第k+1ビデオセグメントに対して、再生時間が第kビデオセグメントの中間時点より長いか等しく、且つ第k+1ビデオセグメントの中間時点より短い場合、前記第kビデオセグメント内のクロッピングフレームを調整して第1距離を移動することであって、前記第1距離は、第1速度と第1時間の積であり、前記第1速度は、クロッピングフレームが第kビデオセグメントから第k+1ビデオセグメントまで移動する速度であり、前記第1時間は、現在の時間と第kビデオセグメントの中間時点の差である
、こと
と、
第Kビデオセグメントに対して、再生時間が第Kビデオセグメントの中間時点より長い場合、第Kビデオセグメント内のクロッピングフレーム位置を変更しないことを維持することを採用して、前記速度および再生時間に基づいて、前記隣接する2つのビデオセグメント内のクロッピングフレームの位置を調整すること
と
を行うように構成される、請求項15に記載のビデオ処理装置。
【請求項17】
ビデオ処理装置であって、
前記ビデオ処理装置は、
プロセッサと、
プロセッサ実行可能
な命令を記憶するように構成されるメモリ
と
を含み、
前記プロセッサは、請求項1
~8のいずれか一項に記載のビデオ処理方法を実行するように構成される
、ビデオ処理装置。
【請求項18】
命令が記憶された非一時的なコンピュータ読み取り可能な記憶媒体であって、
前記命令は、モバイル端末のプロセッサによって実行されると
、請求項1
~8のいずれか一項に記載のビデオ処理方法を実行すること
を前記モバイル端末に行わせる、非一時的なコンピュータ読み取り可能な記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、画像およびビデオ処理の技術分野に関し、特に、ビデオ処理方法、ビデオ処理装置および記憶媒体に関する。
【背景技術】
【0002】
ソースビデオのアスペクト比とビデオの現在の再生機器のディスプレイのアスペクト比が一致しない場合が発生する。例えば、ユーザが撮影したビデオや、インタネットからダウンロードしたビデオなどは、通常、複数のアスペクト比を有し、ユーザの再生機器のディスプレイも複数のアスペクト比を有する。ソースビデオのアスペクト比とターゲットディスプレイのアスペクト比が一致しない場合、ビデオをターゲットディスプレイで再生すると(アスペクト比が16:9であるターゲットディスプレイでアスペクト比が4:3であるビデオを再生する)、ディスプレイの両側に大きな黒い画面が表示される。
【0003】
関連技術では、ソースビデオ再生のアスペクト比を再生機器のディスプレイのアスペクト比とマッチングさせて、ビデオ画面をディスプレイに埋めてより優れたユーザ体験を提供するためには、通常、ビデオ画面をズームし、またはクロッピングする必要がある。
【発明の概要】
【発明が解決しようとする課題】
【0004】
関連技術に存在する問題を解決するために、本開示は、ビデオ処理方法、ビデオ処理装置および記憶媒体を提供する。
【課題を解決するための手段】
【0005】
本開示の実施例の第1態様によれば、ビデオ処理方法を提供し、前記方法は、
第1アスペクト比を有するソースビデオから複数のビデオフレームを抽出することと、第2アスペクト比を有する複数の候補クロッピングフレームを生成するために、前記複数のビデオフレームの各ビデオフレームをそれぞれ複数回クロッピングすることと、前記複数のビデオフレームの各ビデオフレームの複数の候補クロッピングフレームのそれぞれについて評点を決定することであって、前記評点は、各候補クロッピングフレームがクロッピング範囲であるときの前記ビデオフレームの再生効果を表し、前記評点に基づいて前記複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択することと、各ビデオフレームが、選択された前記クロッピングフレームを使用してクロッピングし、前記第2アスペクト比を有するターゲットビデオを生成することとを含む。
【0006】
一実施形態において、前記候補クロッピングフレームの評点を決定することは、
前記候補クロッピングフレーム内の画像コンテンツに美的スコアを付けて、前記候補クロッピングフレームの評点を取得することを含む。
【0007】
別の実施形態において、前記候補クロッピングフレームの評点を決定することは、
前記候補クロッピングフレーム内の各画素に対して顕著性ターゲット検出を実行し、顕著性ターゲット検出結果に基づいて各画素の画素評点を決定することと、前記候補クロッピングフレーム内の各画素の画素評点に従って、前記候補クロッピングフレームの評点を決定することとを含む。
【0008】
さらに別の実施形態において、前記評点に基づいて前記複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択することは、
前記複数のビデオフレームの各ビデオフレームに対して、各2つの候補クロッピングフレーム間の位置に基づいて、状態遷移行列を構築することであって、前記状態遷移行列は、隣接する各フレーム間の各ビデオフレームで選択された候補クロッピングフレームのジッターに対して平滑化制御を実行するために使用されることと、最大目的関数に基づいて、前記状態遷移行列および各候補クロッピングフレームの評点を使用して、最大クロッピングフレーム評点を満たすクロッピングフレームシーケンスを決定することであって、前記クロッピングフレームシーケンスは、各ビデオフレームから選択された候補クロッピングフレームを含むこととを含む。
【0009】
さらに別の実施形態において、前記各2つの候補クロッピングフレーム間の位置に基づいて、状態遷移行列を構築することは、
前記各2つの候補クロッピングフレーム間の交差比および係数乗数に基づいて、状態遷移行列を構築するを含み、前記係数乗数は、平滑化の度合いを制御するために使用される。
【0010】
さらに別の実施形態において、前記各2つの候補クロッピングフレーム間の位置に基づいて、状態遷移行列を構築することは、
隣接する各2つの候補クロッピングフレームの中心位置間のユークリッド距離、候補クロッピングフレームの面積、および係数乗数に基づいて、状態遷移行列を構築することを含み、前記係数乗数は、平滑化の度合いを制御するために使用される。
【0011】
さらに別の実施形態において、各ビデオフレームのクロッピングフレームを選択した後、前記方法は、
前記ソースビデオを、隣接する各フレーム間で選択されたクロッピングフレーム位置とサイズが変更しない複数のビデオセグメントに分割することと、隣接する2つのビデオセグメントの中間時点と隣接する2つのビデオセグメント内のクロッピングフレーム間の距離に基づいて、クロッピングフレームが前記隣接する2つのビデオセグメント内で移動する速度を決定することと、前記速度および再生時間に基づいて、前記隣接する2つのビデオセグメント内のクロッピングフレームの位置を調整することとをさらに含む。
【0012】
さらに別の実施形態において、前記複数のビデオセグメントの総数はK(Kは1より大きい正の整数である)であり、
前記速度および再生時間に基づいて、前記隣接する2つのビデオセグメント内のクロッピングフレームの位置を調整することは、
第1ビデオセグメントに対して、再生時間が第1ビデオセグメントの中間時点より短い場合、第1ビデオセグメント内のクロッピングフレーム位置を変更しないことを維持することと、第k(kは、1<k<K-1を満たす正の整数である)ビデオセグメントおよび第k+1ビデオセグメントに対して、再生時間が第kビデオセグメントの中間時点より長いか等しく、且つ第k+1ビデオセグメントの中間時点より短い場合、前記第kビデオセグメント内のクロッピングフレームを調整して第1距離を移動することであって、前記第1距離は、第1速度と第1時間の積であり、ここで、前記第1速度は、クロッピングフレームが第kビデオセグメントから第k+1ビデオセグメントまで移動する速度であり、前記第1時間は、現在の時間と第kビデオセグメントの中間時点の差であることと、第Kビデオセグメントに対して、再生時間が第Kビデオセグメントの中間時点より長い場合、第Kビデオセグメント内のクロッピングフレーム位置を変更しないことを維持することとを含む。
【0013】
本開示の実施例の第2態様によれば、ビデオ処理装置を提供し、前記装置は、
第1アスペクト比を有するソースビデオから複数のビデオフレームを抽出するように構成される抽出ユニットと、第2アスペクト比を有する複数の候補クロッピングフレームを生成するために、前記複数のビデオフレームの各ビデオフレームをそれぞれ複数回クロッピングするように構成されるクロッピングユニットと、前記複数のビデオフレームの各ビデオフレームの複数の候補クロッピングフレームのそれぞれについて評点を決定するように構成される評点ユニットであって、前記評点は、各候補クロッピングフレームがクロッピング範囲であるときの前記ビデオフレームの再生効果を表す評点ユニットと、前記評点に基づいて前記複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択するように構成される選択ユニットと、各ビデオフレームが、選択された前記クロッピングフレームを使用してクロッピングし、前記第2アスペクト比を有するターゲットビデオを生成するように構成される生成ユニットとを含む。
【0014】
一実施形態において、前記評点ユニットは、
前記候補クロッピングフレーム内の画像コンテンツに美的スコアを付けて、前記候補クロッピングフレームの評点を取得することを採用して、前記候補クロッピングフレームの評点を決定するように構成される。
【0015】
別の実施形態において、前記評点ユニットは、
前記候補クロッピングフレーム内の各画素に対して顕著性ターゲット検出を実行し、顕著性ターゲット検出結果に基づいて各画素の画素評点を決定すること、前記候補クロッピングフレーム内の各画素の画素評点に従って、前記候補クロッピングフレームの評点を決定することを採用して、前記候補クロッピングフレームの評点を決定するように構成される。
【0016】
さらに別の実施形態において、前記選択ユニットは、
前記複数のビデオフレームの各ビデオフレームに対して、各2つの候補クロッピングフレーム間の位置に基づいて、状態遷移行列を構築することであって、前記状態遷移行列は、隣接する各フレーム間の各ビデオフレームで選択された候補クロッピングフレームのジッターに対して平滑化制御を実行するために使用されること、最大目的関数に基づいて、前記状態遷移行列および各候補クロッピングフレームの評点を使用して、最大クロッピングフレーム評点を満たすクロッピングフレームシーケンスを決定することであって、前記クロッピングフレームシーケンスは、各ビデオフレームから選択された候補クロッピングフレームを含むことを採用して、前記評点に基づいて前記複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択する。
【0017】
さらに別の実施形態において、前記選択ユニットは、
各2つの候補クロッピングフレーム間の交差比および係数乗数に基づいて、状態遷移行列を構築することであって、前記係数乗数は、平滑化の度合いを制御するために使用されることを採用して、各2つの候補クロッピングフレーム間の位置に基づいて、状態遷移行列を構築する。
【0018】
さらに別の実施形態において、前記選択ユニットは、
隣接する各2つの候補クロッピングフレームの中心位置間のユークリッド距離、候補クロッピングフレームの面積、および係数乗数に基づいて、状態遷移行列を構築することであって、前記係数乗数は、平滑化の度合いを制御するために使用されることを採用して、各2つの候補クロッピングフレーム間の位置に基づいて、状態遷移行列を構築する。
【0019】
さらに別の実施形態において、前記装置は調整ユニットをさらに含み、前記調整ユニットは、
前記選択ユニットが各ビデオフレームのクロッピングフレームを選択した後、前記ソースビデオを、隣接する各フレーム間で選択されたクロッピングフレーム位置とサイズが変更しない複数のビデオセグメントに分割し、隣接する2つのビデオセグメントの中間時点と隣接する2つのビデオセグメント内のクロッピングフレーム間の距離に基づいて、クロッピングフレームが前記隣接する2つのビデオセグメント内で移動する速度を決定し、前記速度および再生時間に基づいて、前記隣接する2つのビデオセグメント内のクロッピングフレームの位置を調整するように構成される。
【0020】
さらに別の実施形態において、前記複数のビデオセグメントの総数はK(Kは1より大きい正の整数である)であり、
前記調整ユニットは、
第1ビデオセグメントに対して、再生時間が第1ビデオセグメントの中間時点より短い場合、第1ビデオセグメント内のクロッピングフレーム位置を変更しないことを維持すること、第k(kは、1<k<K-1を満たす正の整数である)ビデオセグメントおよび第k+1ビデオセグメントに対して、再生時間が第kビデオセグメントの中間時点より長いか等しく、且つ第k+1ビデオセグメントの中間時点より短い場合、前記第kビデオセグメント内のクロッピングフレームを調整して第1距離を移動することであって、前記第1距離は、第1速度と第1時間の積であり、ここで、前記第1速度は、クロッピングフレームが第kビデオセグメントから第k+1ビデオセグメントまで移動する速度であり、前記第1時間は、現在の時間と第kビデオセグメントの中間時点の差であること、第Kビデオセグメントに対して、再生時間が第Kビデオセグメントの中間時点より長い場合、第Kビデオセグメント内のクロッピングフレーム位置を変更しないことを維持することを採用して、前記速度および再生時間に基づいて、前記隣接する2つのビデオセグメント内のクロッピングフレームの位置を調整する。
【0021】
本開示の実施例の第3態様によれば、ビデオ処理装置を提供し、前記装置は、
プロセッサと、プロセッサ実行可能命令を記憶するように構成されるメモリとを含み、
ここで、前記プロセッサは、第1態様または第1態様の任意の1つの実施形態に記載のビデオ処理方法を実行するように構成される。
【0022】
本開示の実施例の第4態様によれば、非一時的なコンピュータ読み取り可能な記憶媒体を提供し、前記記憶媒体の命令がモバイル端末のプロセッサによって実行されるときに、モバイル端末が第1態様または第1態様の任意の1つの実施形態に記載のビデオ処理方法を実行することができるようにする。
【0023】
例えば、本願は以下の項目を提供する。
(項目1)
ビデオ処理方法であって、
第1アスペクト比を有するソースビデオから複数のビデオフレームを抽出することと、
第2アスペクト比を有する複数の候補クロッピングフレームを生成するために、上記複数のビデオフレームの各ビデオフレームをそれぞれ複数回クロッピングすることと、
上記複数のビデオフレームの各ビデオフレームの複数の候補クロッピングフレームのそれぞれについて評点を決定することであって、上記評点は、各候補クロッピングフレームがクロッピング範囲であるときの上記ビデオフレームの再生効果を表し、上記評点に基づいて上記複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択することと、
各ビデオフレームが、選択された上記クロッピングフレームを使用してクロッピングし、上記第2アスペクト比を有するターゲットビデオを生成することとを含むことを特徴とする、上記ビデオ処理方法。
(項目2)
上記候補クロッピングフレームの評点を決定することは、
上記候補クロッピングフレーム内の画像コンテンツに美的スコアを付けて、上記候補クロッピングフレームの評点を取得することを含むことを特徴とする、
上記項目に記載のビデオ処理方法。
(項目3)
上記候補クロッピングフレームの評点を決定することは、
上記候補クロッピングフレーム内の各画素に対して顕著性ターゲット検出を実行し、上記顕著性ターゲット検出結果に基づいて各画素の画素評点を決定することと、
上記候補クロッピングフレーム内の各画素の画素評点に従って、上記候補クロッピングフレームの評点を決定することとを含むことを特徴とする、
上記項目のいずれか一項に記載のビデオ処理方法。
(項目4)
上記評点に基づいて上記複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択することは、
上記複数のビデオフレームの各ビデオフレームに対して、各2つの候補クロッピングフレーム間の位置に基づいて、状態遷移行列を構築することであって、上記状態遷移行列は、隣接する各フレーム間の各ビデオフレームで選択された候補クロッピングフレームのジッターに対して平滑化制御を実行するために使用されることと、
最大目的関数に基づいて、上記状態遷移行列および各候補クロッピングフレームの評点を使用して、最大クロッピングフレーム評点を満たすクロッピングフレームシーケンスを決定することであって、上記クロッピングフレームシーケンスは、各ビデオフレームから選択された候補クロッピングフレームを含むこととを含むことを特徴とする、
上記項目のいずれか一項に記載のビデオ処理方法。
(項目5)
上記各2つの候補クロッピングフレーム間の位置に基づいて、状態遷移行列を構築することは、
上記各2つの候補クロッピングフレーム間の交差比および係数乗数に基づいて、状態遷移行列を構築することを含み、上記係数乗数は、平滑化の度合いを制御するために使用されることを特徴とする、
上記項目のいずれか一項に記載のビデオ処理方法。
(項目6)
上記各2つの候補クロッピングフレーム間の位置に基づいて、状態遷移行列を構築することは、
隣接する各2つの候補クロッピングフレームの中心位置間のユークリッド距離、候補クロッピングフレームの面積、および係数乗数に基づいて、状態遷移行列を構築することを含み、上記係数乗数は、平滑化の度合いを制御するために使用されることを特徴とする、
上記項目のいずれか一項に記載のビデオ処理方法。
(項目7)
各ビデオフレームのクロッピングフレームを選択した後、上記方法は、
上記ソースビデオを、隣接する各フレーム間で選択されたクロッピングフレーム位置とサイズが変更しない複数のビデオセグメントに分割することと、
隣接する2つのビデオセグメントの中間時点と隣接する2つのビデオセグメント内のクロッピングフレーム間の距離に基づいて、クロッピングフレームが上記隣接する2つのビデオセグメント内で移動する速度を決定することと、
上記速度および再生時間に基づいて、上記隣接する2つのビデオセグメント内のクロッピングフレームの位置を調整することとをさらに含むことを特徴とする、
上記項目のいずれか一項に記載のビデオ処理方法。
(項目8)
上記複数のビデオセグメントの総数はK(Kは1より大きい正の整数である)であり、
上記速度および再生時間に基づいて、上記隣接する2つのビデオセグメント内のクロッピングフレームの位置を調整することは、
第1ビデオセグメントに対して、再生時間が第1ビデオセグメントの中間時点より短い場合、第1ビデオセグメント内のクロッピングフレーム位置を変更しないことを維持することと、
第k(kは、1<k<K-1を満たす正の整数である)ビデオセグメントおよび第k+1ビデオセグメントに対して、再生時間が第kビデオセグメントの中間時点より長いか等しく、且つ第k+1ビデオセグメントの中間時点より短い場合、上記第kビデオセグメント内のクロッピングフレームを調整して第1距離を移動することであって、上記第1距離は、第1速度と第1時間の積であり、上記第1速度は、クロッピングフレームが第kビデオセグメントから第k+1ビデオセグメントまで移動する速度であり、上記第1時間は、現在の時間と第kビデオセグメントの中間時点の差であることと、
第Kビデオセグメントに対して、再生時間が第Kビデオセグメントの中間時点より長い場合、第Kビデオセグメント内のクロッピングフレーム位置を変更しないことを維持することとを含むことを特徴とする、
上記項目のいずれか一項に記載のビデオ処理方法。
(項目9)
ビデオ処理装置であって、
第1アスペクト比を有するソースビデオから複数のビデオフレームを抽出するように構成される抽出ユニットと、
第2アスペクト比を有する複数の候補クロッピングフレームを生成するために、上記複数のビデオフレームの各ビデオフレームをそれぞれ複数回クロッピングするように構成されるクロッピングユニットと、
上記複数のビデオフレームの各ビデオフレームの複数の候補クロッピングフレームのそれぞれについて評点を決定するように構成される評点ユニットであって、上記評点は、各候補クロッピングフレームがクロッピング範囲であるときの上記ビデオフレームの再生効果を表す評点ユニットと、
上記評点に基づいて上記複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択するように構成される選択ユニットと、
各ビデオフレームが、選択された上記クロッピングフレームを使用してクロッピングし、上記第2アスペクト比を有するターゲットビデオを生成するように構成される生成ユニットとを含むことを特徴とする、上記ビデオ処理装置。
(項目10)
上記評点ユニットは、
上記候補クロッピングフレーム内の画像コンテンツに美的スコアを付けて、上記候補クロッピングフレームの評点を取得することを採用して、上記候補クロッピングフレームの評点を決定するように構成されることを特徴とする、
上記項目に記載のビデオ処理装置。
(項目11)
上記評点ユニットは、
上記候補クロッピングフレーム内の各画素に対して顕著性ターゲット検出を実行し、顕著性ターゲット検出結果に基づいて各画素の画素評点を決定すること、
上記候補クロッピングフレーム内の各画素の画素評点に従って、上記候補クロッピングフレームの評点を決定することを採用して、上記候補クロッピングフレームの評点を決定するように構成されることを特徴とする、
上記項目のいずれか一項に記載のビデオ処理装置。
(項目12)
上記選択ユニットは、
上記複数のビデオフレームの各ビデオフレームに対して、各2つの候補クロッピングフレーム間の位置に基づいて、状態遷移行列を構築することであって、上記状態遷移行列は、隣接する各フレーム間の各ビデオフレームで選択された候補クロッピングフレームのジッターに対して平滑化制御を実行するために使用されること、
最大目的関数に基づいて、上記状態遷移行列および各候補クロッピングフレームの評点を使用して、最大クロッピングフレーム評点を満たすクロッピングフレームシーケンスを決定することであって、上記クロッピングフレームシーケンスは、各ビデオフレームから選択された候補クロッピングフレームを含むことを採用して、上記評点に基づいて上記複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択することを特徴とする、
上記項目のいずれか一項に記載のビデオ処理装置。
(項目13)
上記選択ユニットは、
各2つの候補クロッピングフレーム間の交差比および係数乗数に基づいて、状態遷移行列を構築することであって、上記係数乗数は、平滑化の度合いを制御するために使用されることを採用して、各2つの候補クロッピングフレーム間の位置に基づいて、状態遷移行列を構築することを特徴とする、
上記項目のいずれか一項に記載のビデオ処理装置。
(項目14)
上記選択ユニットは、
隣接する各2つの候補クロッピングフレームの中心位置間のユークリッド距離、候補クロッピングフレームの面積、および係数乗数に基づいて、状態遷移行列を構築することであって、上記係数乗数は、平滑化の度合いを制御するために使用されることを採用して、各2つの候補クロッピングフレーム間の位置に基づいて、状態遷移行列を構築することを特徴とする、
上記項目のいずれか一項に記載のビデオ処理装置。
(項目15)
上記装置は調整ユニットをさらに含み、上記調整ユニットは、
上記選択ユニットが各ビデオフレームのクロッピングフレームを選択した後、上記ソースビデオを、隣接する各フレーム間で選択されたクロッピングフレーム位置とサイズが変更しない複数のビデオセグメントに分割し、
隣接する2つのビデオセグメントの中間時点と隣接する2つのビデオセグメント内のクロッピングフレーム間の距離に基づいて、クロッピングフレームが上記隣接する2つのビデオセグメント内で移動する速度を決定し、
上記速度および再生時間に基づいて、上記隣接する2つのビデオセグメント内のクロッピングフレームの位置を調整するように構成されることを特徴とする、
上記項目のいずれか一項に記載のビデオ処理装置。
(項目16)
上記複数のビデオセグメントの総数はK(Kは1より大きい正の整数である)であり、
上記調整ユニットは、
第1ビデオセグメントに対して、再生時間が第1ビデオセグメントの中間時点より短い場合、第1ビデオセグメント内のクロッピングフレーム位置を変更しないことを維持すること、
第k(kは、1<k<K-1を満たす正の整数である)ビデオセグメントおよび第k+1ビデオセグメントに対して、再生時間が第kビデオセグメントの中間時点より長いか等しく、且つ第k+1ビデオセグメントの中間時点より短い場合、上記第kビデオセグメント内のクロッピングフレームを調整して第1距離を移動することであって、上記第1距離は、第1速度と第1時間の積であり、上記第1速度は、クロッピングフレームが第kビデオセグメントから第k+1ビデオセグメントまで移動する速度であり、上記第1時間は、現在の時間と第kビデオセグメントの中間時点の差であること、
第Kビデオセグメントに対して、再生時間が第Kビデオセグメントの中間時点より長い場合、第Kビデオセグメント内のクロッピングフレーム位置を変更しないことを維持することを採用して、上記速度および再生時間に基づいて、上記隣接する2つのビデオセグメント内のクロッピングフレームの位置を調整することを特徴とする、
上記項目のいずれか一項に記載のビデオ処理装置。
(項目17)
ビデオ処理装置であって、
プロセッサと、
プロセッサ実行可能命令を記憶するように構成されるメモリとを含み、
上記プロセッサは、上記項目のいずれか一項に記載のビデオ処理方法を実行するように構成されることを特徴とする、上記ビデオ処理装置。
(項目18)
非一時的なコンピュータ読み取り可能な記憶媒体であって、
上記記憶媒体の命令がモバイル端末のプロセッサによって実行されるときに、モバイル端末が上記項目のいずれか一項に記載のビデオ処理方法を実行することができるようにすることを特徴とする、上記非一時的なコンピュータ読み取り可能な記憶媒体。
(摘要)
本開示は、ビデオ処理方法、ビデオ処理装置および記憶媒体に関する。ビデオ処理方法は、第1アスペクト比を有するソースビデオから複数のビデオフレームを抽出することと、第2アスペクト比を有する複数の候補クロッピングフレームを生成するために、前記複数のビデオフレームの各ビデオフレームをそれぞれ複数回クロッピングすることと、前記複数のビデオフレームの各ビデオフレームの複数の候補クロッピングフレームのそれぞれについて評点を決定することであって、前記評点は、各候補クロッピングフレームがクロッピング範囲であるときの前記ビデオフレームの再生効果を表し、前記評点に基づいて前記複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択することと、各ビデオフレームが、選択された前記クロッピングフレームを使用してクロッピングし、前記第2アスペクト比を有するターゲットビデオを生成することとを含む。本開示により、ソースビデオをターゲットアスペクト比に従って出力することができ、出力コンテンツの再生効果を保証することができる。
【発明の効果】
【0024】
本開示の実施例によって提供される技術的解決策は、以下の有益な効果を含み得る。
【0025】
ソースビデオから抽出された複数のビデオフレームの各ビデオフレームをそれぞれ複数回クロッピングして、第2アスペクト比を有する複数の候補クロッピングフレームを生成し、候補クロッピングフレーム再生効果の評点に基づいてクロッピングフレームを選択し、最後に、クロッピングフレームを使用してビデオフレームをクロッピングして前記第2アスペクト比を有するターゲットビデオを生成することにより、ソースビデオをターゲットアスペクト比に従って出力することができ、出力コンテンツの再生効果を保証することができる。
【0026】
上記した一般的な説明および後述する詳細な説明は、単なる例示および説明に過ぎず、本開示を限定するものではないことを理解されたい。
【図面の簡単な説明】
【0027】
ここでの図面は、本明細書に組み込まれてその一部を構成し、本開示と一致する実施例を示し、明細書とともに本開示の実施例の原理を説明するために使用される。
【
図1】一例示的な実施例によって示されたビデオ処理方法のフローチャートである。
【
図2】一例示的な実施例によって示された評点に基づいて複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択してフレーム間の平滑化制御を実現する例示的なフローチャートである。
【
図3】一例示的な実施例によって示されたクロッピングフレーム位置調整方法のフローチャートである。
【
図4】一例示的な実施例によって示されたビデオ処理装置のブロック図(モバイル端末の一般的な構造)である。
【
図5】一例示的な実施例によって示されたビデオ処理のための装置のブロック図である。
【発明を実施するための形態】
【0028】
ここで、例示的な実施例について詳細に説明し、その例は図面に示す。特に明記しない限り、以下の説明が添付の図面に関する場合、異なる図面の同じ数字は同じまたは類似の要素を表す。以下の例示的な実施例で説明される実施形態は、本開示と一致するすべての実施形態を表すものではない。むしろ、それらは、添付された特許請求の範囲に詳述されたように、本開示の特定の態様と一致する装置および方法の例である。
【0029】
関連技術では、ソースビデオ再生のアスペクト比を再生機器のディスプレイのアスペクト比とマッチングさせて、ビデオ画面をディスプレイに埋めてより優れたユーザ体験を提供するためには、通常、ビデオ画面をズームし、またはクロッピングする必要がある。ここで、ビデオ画面をズームする技術案では、ソースビデオをターゲットアスペクト比に直接にズームするが、ソースビデオのアスペクト比とターゲットアスペクト比が一致しないため、ビデオの水平方向および垂直方向のスケーリングファクタは必ず異なり、これにより画面がある程度引き伸ばされ、または圧縮される。両者のアスペクト比の差が大きいとより明確になり、ルックアンドフィールを影響する。別の技術案では、コンテンツに対する敏感なズームを試し、まず、ビデオ内の重要な物体/コンテンツを検出してキーアウトし、その後、それをターゲットアスペクト比にズームした背景に貼り付け直す。しかし、プロセス全体は、重要な物体の検出、画像の復元、ズームおよび画像の合成などの多くの動作に関するため、計算の複雑さが比較的に大きくなる。ビデオ画面をクロッピングする技術案では、通常の方式は、ビデオ画面の中心を保持する中心クロッピング方法を採用し、ソースビデオをターゲットディスプレイにリアルタイムで出力して、「全画面再生」を実現する。実施プロセス全体では、垂直方向と水平方向のコンテンツの不均等なズームがなく、それにより、背景を含む、表示されるすべてのコンテンツは、引き伸ばされたり圧縮されたりすることがない。しかしながら、ビデオ両端の余分のコンテンツをクロッピングし、ビデオの中央位置のみを保持する方法でビデオの主要コンテンツを失わないことが保証されず、クロッピングされた画像の美しさを維持することは不可能である。
【0030】
これを鑑みて、本開示の実施例はビデオ処理方法を提供し、固定領域のクロッピングとコンテンツ敏感領域を組み合わせてビデオ処理を実行して、ソースビデオをターゲットアスペクト比に従って出力し、出力コンテンツの再生効果を保証することができる。
【0031】
一方式において、本開示の実施例では、ソースビデオから複数のビデオフレームを抽出し、抽出された複数のビデオフレームの各ビデオフレームをそれぞれ複数回クロッピングしてターゲットアスペクト比を有する複数の候補クロッピングフレームを生成し、候補クロッピングフレーム再生効果の評点に基づいてクロッピングフレームを選択し、最後に、クロッピングフレームを使用してビデオフレームをクロッピングしてターゲットアスペクト比を有するターゲットビデオを生成して、ソースビデオをターゲットアスペクト比に従って出力し、出力コンテンツの再生効果を保証することができる。
【0032】
図1は、一例示的な実施例によって示されたビデオ処理方法のフローチャートであり、
図1に示されたように、ビデオ処理方法は次のステップを含む。
【0033】
ステップS11において、第1アスペクト比を有するソースビデオから複数のビデオフレームを抽出する。
【0034】
本開示の実施例では、ソースビデオは処理されるビデオとして理解することができ、特定のアスペクト比を有する。説明を容易にするため、ソースビデオのアスペクト比を第1アスペクト比と称する。
【0035】
本開示の実施例では、画像に変換して後続のクロッピング処理を実行するために、第1アスペクト比を有するソースビデオから複数のビデオフレームを抽出する。ここで、ソースビデオから複数のビデオフレームを抽出する場合、ソースビデオ内のすべてのビデオフレームを抽出してもよく、ビデオフレームを等間隔でまばらに抽出してもよい。
【0036】
本開示の実施例では、抽出された複数のビデオフレームの数をN(Nは正の整数である)として表記する。
【0037】
ステップS12において、第2アスペクト比を有する複数の候補クロッピングフレームを生成するために、複数のビデオフレームの各ビデオフレームをそれぞれ複数回クロッピングする。
【0038】
本開示の実施例では、ビデオの完全なフォーマットで、ウィンドウをスライディングする方式を使用して固定のステップサイズでターゲットアスペクト比を有する長方形フレームを生成することができ、候補クロッピングフレームとして使用される。ここで、説明を容易にするために、ターゲットアスペクト比を第2アスペクト比と称する。
【0039】
本開示の実施例では、各ビデオフレームを複数回クロッピングした後に生成された複数の候補クロッピングフレームの数をM(Mは正の整数である)として表記する。
【0040】
ここで、本開示の実施例では、候補クロッピングフレームの数を実際のニーズに従って設定することができる。ここで、候補クロッピングフレームの数を減らし、且つ大量のコンテンツがクロッピングされて破棄されるのを防ぐために、スライディングウィンドウの大きさを設定された閾値より大きいか等しいように制限することができる。
【0041】
ステップS13において、複数のビデオフレームの各ビデオフレームの複数の候補クロッピングフレームのそれぞれについて評点を決定し、評点は、各候補クロッピングフレームがクロッピング範囲であるときのビデオフレームの再生効果を表す。
【0042】
本開示の実施例では、コンテンツ敏感領域の決定を実現するために、各候補クロッピングフレームがクロッピング範囲であるときのビデオフレームの再生効果を評点することができる。評点の高さを通じて、各候補クロッピングフレームがクロッピング範囲であるときのビデオフレームの再生効果を表す。
【0043】
本開示の実施例の一実施形態において、各ビデオフレームにクロッピングフレームがあるようにするために、各ビデオフレーム内のすべての候補クロッピングフレームの評点を調整することができる。一例では、本開示の実施例は、softmax関数を使用して、各ビデオフレーム内のすべての候補クロッピングフレームの評点をそれらの和が1であるように調整するため、各候補クロッピングフレーム重み評点の高さを通じてビデオフレームの各候補クロッピングフレームがクロッピング範囲であるときのビデオフレームの再生効果を表すことができる。
【0044】
本開示の実施例では、n(nは1より大きいか等しく、且つNより小さいか等しい正の整数である)番目のフレームのm(mは1より大きいか等しく、且つMより小さいか等しい正の整数である)番目の候補クロッピングフレームの評点を
【0045】
【0046】
として表記することができる。
【0047】
ステップS14において、評点に基づいて複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択する。
【0048】
ステップS15において、各ビデオフレームは、選択されたクロッピングフレームを使用してクロッピングし、第2アスペクト比を有するターゲットビデオを生成する。
【0049】
本開示の実施例では、第1アスペクト比を有するソースビデオから抽出された複数のビデオフレームの各ビデオフレームをそれぞれ複数回クロッピングして、第2アスペクト比を有する複数の候補クロッピングフレームを生成し、候補クロッピングフレーム再生効果の評点に基づいてクロッピングフレームを選択し、最後に、クロッピングフレームを使用してビデオフレームをクロッピングして前記第2アスペクト比を有するターゲットビデオを生成することにより、ソースビデオをターゲットアスペクト比に従って出力することができ、出力コンテンツの再生効果を保証することができる。
【0050】
本開示の実施例において、以下、上記した実施例に関するビデオ処理プロセスを実際の応用と組み合わせて説明する。
【0051】
本開示の実施例では、まず、候補クロッピングフレームを評点するプロセスを説明する。
【0052】
本開示の実施例では、ソースビデオから抽出されたN個のビデオフレームに対して、候補クロッピングフレームの評点の決定を1フレームずつ実行する必要がある。
【0053】
一実施形態において、候補クロッピングフレームの評点を決定する場合、候補クロッピングフレーム内の画像コンテンツに美的スコアを付けて、候補クロッピングフレームの評点を取得することができる。本開示の実施例では、美的スコアを付ける具体的な実施プロセスを限定せず、既存の画像美的クロッピング方法または画像美的評点方法を使用して各フレームのすべてのM個の候補クロッピングフレームに対して美的スコアを付けることができる。その後、softmax関数を使用して、将各ビデオフレーム内のすべての候補クロッピングフレームの評点をそれらの和が1であるように調整するため、各フレームのすべてのM個の候補クロッピングフレームの評点を取得することができる。例えば、n番目のフレームのm番目の候補クロッピングフレームの評点
【0054】
【0055】
を取得する。
【0056】
別の実施形態において、候補クロッピングフレームの評点を決定する場合、顕著性ターゲット検出方式に基づいて評点することもできる。ここで、本開示の実施例では、各フレームのすべてのM個の候補クロッピングフレーム内の各候補クロッピングフレームに対して、候補クロッピングフレーム内の各画素に対して顕著性ターゲット検出を実行し、顕著性ターゲット検出結果に基づいて各画素の画素評点を決定することを採用して、評点を決定する。候補クロッピングフレーム内の各画素の画素評点に従って、候補クロッピングフレームの評点を決定する。
【0057】
本開示の実施例では、各ビデオフレームが選択した候補クロッピングフレームに基づいて選択されたクロッピングフレームをビデオ再生する場合、フレーム間にジッターがあるという問題が発生する可能性がある。本開示の実施例では、評点に基づいて複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択する場合、隣接する各フレーム間のジッターに対して平滑化制御を実行する。
【0058】
本開示の実施例の一実施形態において、複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択するプロセスを分類プロセスと見なされ、隣接する各フレーム間のジッターを削除するために、線形チェーン条件付きランダムフィールド(linear-CRF:Linear chain Conditional Random Fields)モデルを使用して処理する。
【0059】
図2は、一例示的な実施例によって示された評点に基づいて複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択してフレーム間のスムーズな制御を実現する例示的なフローチャートである。
図2を参照すると、隣接する各フレーム間のジッターに対して平滑化制御を実行することは、次のステップを含み得る。
【0060】
ステップS141において、複数のビデオフレームの各ビデオフレームに対して、各2つの候補クロッピングフレーム間の位置に基づいて、状態遷移行列を構築する。
【0061】
本開示の実施例によって構築された状態遷移行列は、隣接する各フレーム間の各ビデオフレームで選択された候補クロッピングフレームのジッターに対して平滑化制御を実行するために使用される。
【0062】
本開示の実施例では、候補クロッピングフレーム間の位置大きさの差に従って状態遷移行列を設定し、以下、状態遷移行列は
【0063】
【0064】
として表される。
【0065】
一実施形態において、各2つの候補クロッピングフレーム間の交差比(IoU:Intersection over Union,)および係数乗数に基づいて、状態遷移行列を構築することができる。
【0066】
例えば、2つのクロッピングフレーム間の交差比に基づいて計算し、具体的な計算式は以下に示す。
【0067】
【0068】
ここで、
【0069】
【0070】
は状態遷移行列の第i行第j列の値を表し、
【0071】
【0072】
はi番目の候補クロッピングフレームを表し、
【0073】
【0074】
はi番目の候補クロッピングフレームとj番目の候補クロッピングフレームの間のIoUを表し、
【0075】
【0076】
は係数乗数であり、平滑化の度合いの大きさを制御するために使用され、
【0077】
【0078】
の大きさを調整することにより平滑化の度合いの制御を実現することができる。
【0079】
別の実施形態において、本開示の実施例では、隣接する各2つの候補クロッピングフレームの中心位置間のユークリッド距離、候補クロッピングフレームの面積、および係数乗数に基づいて、状態遷移行列を構築し、前記係数乗数は、平滑化の度合いを制御するために使用される。
【0080】
例えば、本開示の実施例では、クロッピングフレームの大きさおよび中心位置を同時に考慮して、以下の式を使用して状態遷移行列を決定することができる。
【0081】
【0082】
ここで、
【0083】
【0084】
はi番目の候補クロッピングフレームの中心座標を表し、
【0085】
【0086】
はi番目の候補クロッピングフレームの面積を表し、
【0087】
【0088】
関数は2つのクロッピングフレーム中心座標の差を計算するために使用され、ここで、直接にユークリッド距離を使用して計算することができ、
【0089】
【0090】
は、中心点位置と面接の差の影響のバランスを取るために使用され、
【0091】
【0092】
を調整することにより面積変化および中心点位置変化による影響のバランスを取ることができ、
【0093】
【0094】
は平滑化の度合いの大きさを制御するための係数乗数であり、
【0095】
【0096】
の大きさを制御することにより平滑化の度合いの制御を実現することができる。
【0097】
ステップS142において、最大目的関数に基づいて、状態遷移行列および各候補クロッピングフレームの評点を使用して、最大クロッピングフレーム評点を満たすクロッピングフレームシーケンスを決定し、クロッピングフレームシーケンスは、各ビデオフレームから選択された候補クロッピングフレームを含む。
【0098】
一実施形態において、本開示の実施例は、フレーム間にジッターが発生しないクロッピングフレームシーケンス
【0099】
【0100】
を取得するために、ビタビアルゴリズムを使用して以下の最大目的関数を解ける。
【0101】
【0102】
ここで、
【0103】
【0104】
はi番目のフレームが選択した候補クロッピングフレームの番号を表す。
【0105】
【0106】
はn番目のフレームから選択されたy番目の候補クロッピングフレームの評点を表す。
【0107】
【0108】
はn番目のフレームから選択されたy番目の候補クロッピングフレームとn-1番目のフレームから選択されたy番目の候補クロッピングフレームに対応する状態遷移行列値を表す。
【0109】
本開示の実施例では、上記したアンチシェイク平滑化処理を実行した後、各クロッピングフレームは、フレーム間にジッターがないようにする。通常、候補クロッピングフレームの位置と大きさは一定期間変更しないが、突然別の候補クロッピングフレームにジャンプして一定時間維持する。クロッピングフレームのこのようなジャンプは、最後に出力されたビデオコンテンツがジャンプし、および途切れる。したがって、このクロッピングフレーム変化をクロッピングフレームの移動およびズームの平滑を含む平滑化処理し、クロッピングフレーム位置の調整を実行する必要がある。
【0110】
図3は、一例示的な実施例によって示されたクロッピングフレーム位置調整方法のフローチャートである。
図3を参照すると、クロッピングフレーム位置調整方法は、次のステップを含む。
【0111】
ステップS21において、ソースビデオを隣接する各フレーム間で選択されたクロッピングフレーム位置とサイズが変更しない複数のビデオセグメントに分割する。
【0112】
本開示の実施例では、クロッピングフレーム位置および大きさが変更しない各ビデオセグメントを決定することができ、複数のビデオセグメントの総数がK(Kは1より大きい正の整数である)であると仮定する。
【0113】
ステップS22において、隣接する2つのビデオセグメントの中間時点と隣接する2つのビデオセグメント内のクロッピングフレーム間の距離に基づいて、クロッピングフレームが隣接する2つのビデオセグメント内で移動する速度を決定する。
【0114】
本開示の実施例では、k番目のビデオの持続時間は
【0115】
【0116】
であり、中間時点は
【0117】
【0118】
である。ここで、
【0119】
【0120】
である。ベクトル
【0121】
【0122】
を使用して
【0123】
【0124】
番目のセグメントのビデオのクロッピングフレームを表し、ここで、
【0125】
【0126】
はそれぞれ、前記クロッピングフレームの左上頂点の横軸および縦軸であり、
【0127】
【0128】
はそれぞれ、前記クロッピングフレームの右下頂点の横軸および縦軸である。
【0129】
クロッピングフレームの移動速度を決定する場合、以下の式を使用してk番目からk+1番目までのクロッピングフレームの速度を計算することができる。
【0130】
【0131】
ここで、クロッピングフレームの減算は4つの座標の減算である。計算された速度
【0132】
【0133】
の各値は各座標が特定の軸に沿った移動速度に対応し、即ち、
【0134】
【0135】
それぞれはx軸に沿った左上隅および右下隅の頂点の移動速度であり、
【0136】
【0137】
それぞれはy軸に沿った左上隅および右下隅の頂点の移動速度である。
【0138】
ステップS23において、隣接する2つのビデオセグメントでクロッピングフレームが移動しようとする速度および再生時間に基づいて、隣接する2つのビデオセグメント内のクロッピングフレームの位置を調整する。
【0139】
本開示の実施例では、第1ビデオセグメントに対して、再生時間が第1ビデオセグメントの中間時点より短い場合、第1ビデオセグメント内のクロッピングフレーム位置を変更しないことを維持する。
【0140】
【0141】
である場合、第kビデオセグメントおよび第k+1ビデオセグメントに対して、再生時間が第kビデオセグメントの中間時点より長いか等しく、且つ第k+1ビデオセグメントの中間時点より短い場合、第kビデオセグメント内のクロッピングフレームを調整して第1距離を移動し、第1距離は第1速度と第1時間の積であり、前記第1速度は、クロッピングフレームが第kビデオセグメントから第k+1ビデオセグメントまで移動する速度であり、第1時間は、現在の時間と第kビデオセグメントの中間時点の差である。
【0142】
第Kビデオセグメントに対して、再生時間が第Kビデオセグメントの中間時点より長い場合、第Kビデオセグメント内のクロッピングフレーム位置を変更しないことを維持する。
【0143】
本開示の実施例では、任意の時間tに対して、以下の式を使用して当該時間のクロッピングフレーム位置
【0144】
【0145】
を計算することができる。
【0146】
【0147】
ここで、
【0148】
【0149】
(即ち、最初のビデオの前半である)である場合、
【0150】
【0151】
である。
【0152】
【0153】
(即ち、最後のビデオの後半である)である場合、
【0154】
【0155】
である。
【0156】
【0157】
である場合、
【0158】
【0159】
である。
【0160】
本開示の実施例では、ソースビデオ内の各ビデオフレームに対して、上記した方法を採用してクロッピングして、クロッピングフレームを生成し、ここで、クロッピングして生成されたクロッピングフレームは同じアスペクト比を有する。同じアスペクト比を有するクロッピングフレームを同じ解像度にズームした後にビデオに再び組み合わせすると、ターゲットビデオを取得して出力することができ、ソースビデオをターゲットアスペクト比に従って出力し、出力コンテンツの再生効果を保証することができる。
【0161】
同じ構想に基づいて、本開示の実施例はビデオ処理装置をさらに提供する。
【0162】
前記機能を実現するために、本開示の実施例によって提供されるビデオ処理装置は、各機能を実行することに対応するハードウェア構造および/またはソフトウェアモジュールを含むことを理解すべきである。本開示の実施例に開示される実施例で説明された各例示のユニットおよびアルゴリズムステップを組み合わせることにより、本開示の実施例は、ハードウェア、またはハードウェアとコンピュータソフトウェアの組み合わせの形態で実現されることができる。特定の機能がハードウェアで実行されるかコンピュータソフトウェア駆動のハードウェアで実行されるかは、技術的解決策の特定の応用および設計の制約条件に依存する。当業者は、各特定の応用に対して異なる方法を使用して説明された機能を実現することができるが、このような実現は本開示の実施例の範囲を超えると見なされるべきではない。
【0163】
図4は、一例示的な実施例によって示されたビデオ処理装置のブロック図である。
図4を参照すると、ビデオ処理装置100は、抽出ユニット101、クロッピングユニット102、評点ユニット103、選択ユニット104および生成ユニット105を含む。
【0164】
抽出ユニット101は、第1アスペクト比を有するソースビデオから複数のビデオフレームを抽出するように構成される。クロッピングユニット102は、第2アスペクト比を有する複数の候補クロッピングフレームを生成するために、複数のビデオフレームの各ビデオフレームをそれぞれ複数回クロッピングするように構成される。評点ユニット103は、複数のビデオフレームの各ビデオフレームの複数の候補クロッピングフレームのそれぞれについて評点を決定するように構成され、評点は、各候補クロッピングフレームがクロッピング範囲であるときのビデオフレームの再生効果を表す。選択ユニット104は、評点に基づいて複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択するように構成される。生成ユニット105は、各ビデオフレームが、選択されたクロッピングフレームを使用してクロッピングし、第2アスペクト比を有するターゲットビデオを生成するように構成される。
【0165】
一実施形態において、評点ユニット103は、候補クロッピングフレーム内の画像コンテンツに美的スコアを付けて、候補クロッピングフレームの評点を取得する。
【0166】
別の実施形態において、評点ユニット103は、候補クロッピングフレーム内の各画素に対して顕著性ターゲット検出を実行し、顕著性ターゲット検出結果に基づいて各画素の画素評点を決定する。候補クロッピングフレーム内の各画素の画素評点に従って、候補クロッピングフレームの評点を決定する。
【0167】
さらに別の実施形態において、選択ユニット104は、
複数のビデオフレームの各ビデオフレームに対して、各2つの候補クロッピングフレーム間の位置に基づいて、状態遷移行列を構築することであって、状態遷移行列は、隣接する各フレーム間の各ビデオフレームで選択された候補クロッピングフレームのジッターに対して平滑化制御を実行するために使用されること、最大目的関数に基づいて、状態遷移行列および各候補クロッピングフレームの評点を使用して、最大クロッピングフレーム評点を満たすクロッピングフレームシーケンスを決定することであって、クロッピングフレームシーケンスは、各ビデオフレームから選択された候補クロッピングフレームを含むことを採用して、評点に基づいて複数の候補クロッピングフレームから各ビデオフレームのクロッピングフレームを選択する。
【0168】
さらに別の実施形態において、選択ユニット104は、各2つの候補クロッピングフレーム間の交差比および係数乗数に基づいて、状態遷移行列を構築し、係数乗数は、平滑化の度合いを制御するために使用される。
【0169】
さらに別の実施形態において、選択ユニット104は、隣接する各2つの候補クロッピングフレームの中心位置間のユークリッド距離、候補クロッピングフレームの面積、および係数乗数に基づいて、状態遷移行列を構築し、係数乗数は、平滑化の度合いを制御するために使用される。
【0170】
さらに別の実施形態において、ビデオ処理装置100は調整ユニット106をさらに含み、調整ユニット106は、選択ユニット104が各ビデオフレームのクロッピングフレームを選択した後、ソースビデオを隣接する各フレーム間で選択されたクロッピングフレーム位置とサイズが変更しない複数のビデオセグメントに分割し、隣接する2つのビデオセグメントの中間時点と隣接する2つのビデオセグメント内のクロッピングフレーム間の距離に基づいて、クロッピングフレームが隣接する2つのビデオセグメント内で移動する速度を決定し、速度および再生時間に基づいて、隣接する2つのビデオセグメント内のクロッピングフレームの位置を調整するように構成される。
【0171】
さらに別の実施形態において、複数のビデオセグメントの総数はKであり、ここで、Kは1より大きい正の整数である。
【0172】
調整ユニット106は、
第1ビデオセグメントに対して、再生時間が第1ビデオセグメントの中間時点より短い場合、第1ビデオセグメント内のクロッピングフレーム位置を変更しないことを維持すること、第k(kは、1<k<K-1を満たす正の整数である)ビデオセグメントおよび第k+1ビデオセグメントに対して、再生時間が第kビデオセグメントの中間時点より長いか等しく、且つ第k+1ビデオセグメントの中間時点より短い場合、第kビデオセグメント内のクロッピングフレームを調整して第1距離を移動することであって、第1距離は第1速度と第1時間の積であり、ここで、第1速度は、クロッピングフレームが第kビデオセグメントから第k+1ビデオセグメントまで移動する速度であり、第1時間は、現在の時間と第kビデオセグメントの中間時点の差であること、第Kビデオセグメントに対して、再生時間が第Kビデオセグメントの中間時点より長い場合、第Kビデオセグメント内のクロッピングフレーム位置を変更しないことを維持することを採用して、速度および再生時間に基づいて、隣接する2つのビデオセグメント内のクロッピングフレームの位置を調整する。
【0173】
上記の実施例の装置に関して、ここで、各モジュールが動作を実行する具体的な方法は、既に、前記方法に関する実施例で詳細に説明されており、ここでは詳細に説明しない。
【0174】
図5は、一例示的な実施例によって示されたビデオ処理のための装置200のブロック図である。例えば、装置200は携帯電話、コンピュータ、デジタル放送端末、メッセージングデバイス、ゲームコンソール、タブレットデバイス、医療機器、フィットネス機器、携帯情報端末等であってもよい。
【0175】
図5を参照すれば、装置200は、処理コンポーネント202、メモリ204、電力コンポーネント206、マルチメディアコンポーネント208、オーディオコンポーネント210、入力/出力(I/O)インターフェース212、センサコンポーネント214、および通信コンポーネント216のうちの1つまたは複数のコンポーネットを含むことができる。
【0176】
処理コンポーネント202は、一般的に、ディスプレイ、電話の呼び出し、データ通信、カメラ操作及び記録操作に関する操作のような装置200の全般的な操作を制御する。処理コンポーネント202は、前記方法のステップのすべてまたは一部を完了するために、1つまたは複数のプロセッサ220を含んで命令を実行することができる。加えて、処理コンポーネント202は、処理コンポーネント202と他のコンポーネントの間の相互作用を容易にするために、1つまたは複数のモジュールを含むことができる。例えば、処理コンポーネント202は、マルチメディアコンポーネント208と処理コンポーネント202との間の相互作用を容易にするために、マルチメディアモジュールを含むことができる。
【0177】
メモリ204は、機器200での操作をサポートするために、様々なタイプのデータを格納するように構成される。これらのデータの例には、装置200で動作する任意のアプリケーションまたは方法の命令、連絡先データ、電話帳データ、メッセージ、写真、ビデオ等が含まれる。メモリ204は、スタティックランダムアクセスメモリ(SRAM)、電気的に消去可能なプログラム可能な読み取り専用メモリ(EEPROM)、消去可能なプログラム可能な読み取り専用メモリ(EPROM)、プログラム可能な読み取り専用メモリ(PROM)、磁気メモリ、フラッシュメモリ、磁気ディスクまたは光ディスクなど、あらゆるタイプの揮発性または不揮発性ストレージデバイスまたはそれらの組み合わせによって実現されることができる。
【0178】
電力コンポーネント206は、装置200の様々なコンポーネントに電力を提供する。電力コンポーネント206は、電力管理システム、1つまたは複数の電源、及び装置200の電力の生成、管理および分配に関する他のコンポーネントを含むことができる。
【0179】
マルチメディアコンポーネント208は、前記バッテリの充電装置200とユーザとの間の、出力インターフェースを提供するスクリーンを含む。いくつかの実施形態において、スクリーンは、液晶ディスプレイ(LCD)及びタッチパネル(TP)を含み得る。スクリーンがタッチパネルを含む場合、スクリーンは、ユーザからの入力信号を受信するためのタッチスクリーンとして実装されることができる。タッチパネルは、タッチ、スワイプ及びタッチパネルでのジェスチャーを検知するための1つまたは複数のタッチセンサを含む。前記タッチセンサは、タッチまたはスワイプの操作の境界を感知するだけでなく、前記タッチまたはスワイプ動作に関連する持続時間及び圧力も検出することができる。いくつかの実施例において、マルチメディアコンポーネント208は、1つのフロントカメラ及び/またはリアカメラを含む。機器200が、撮影モードまたはビデオモードなどの動作モードにあるとき、フロントカメラ及び/またはリアカメラは、外部のマルチメディアデータを受信することができる。各フロントカメラ及びリアカメラは、固定光学レンズシステムであり、または焦点距離と光学ズーム機能を持つことができる。
【0180】
オーディオコンポーネント210は、オーディオ信号を出力および/または入力するように構成される。例えば、オーディオコンポーネント210は、1つのマイクロフォン(MIC)を含み、装置200が通話モード、録音モード及び音声認識モードなどの動作モードにあるとき、マイクロフォンは、外部オーディオ信号を受信するように構成される。受信されたオーディオ信号は、メモリ204にさらに格納されてもよく、または通信コンポーネント216を介して送信されてもよい。いくつかの実施例において、オーディオコンポーネント210は、オーディオ信号を出力するためのスピーカをさらに含む。
【0181】
I/Oインターフェース212は、処理コンポーネント202と周辺インターフェースモジュールとの間にインターフェースを提供し、前記周辺インターフェースモジュールは、キーボード、クリックホイール、ボタンなどであってもよい。これらのボタンは、ホームボタン、ボリュームボタン、スタートボタン、ロックボタンを含むが、これらに限定されない。
【0182】
センサコンポーネント214は、装置200に各態様の状態の評価を提供するための1つまたは複数のセンサを含む。例えば、センサコンポーネント214は、機器200のオン/オフ状態と、装置200のディスプレイやキーパッドなどのコンポーネントの相対的な位置づけを検出することができ、センサコンポーネント214は、装置200または装置200のコンポーネントの位置の変化、ユーザとの装置200の接触の有無、装置200の向きまたは加速/減速、及び装置200の温度の変化も検出することができる。センサコンポ―ネット214は、物理的接触なしに近くの物体の存在を検出するように構成された近接センサを含むことができる。センサコンポーネント214は、撮像用途で使用するためのCMOSまたはCCD画像センサなどの光センサも含むことができる。いくつかの実施例において、前記センサコンポーネント214は、加速度センサ、ジャイロスコープセンサ、磁気センサ、圧力センサまたは温度センサをさらに含むことができる。
【0183】
通信コンポーネント216は、装置200と他の装置の間の有線または無線通信を容易にするように構成される。装置200は、WiFi、2Gまたは3G、またはそれらの組み合わせなどの通信規格に基づく無線ネットワークにアクセスすることができる。一例示的な実施例において、前記通信コンポーネント216は、放送チャンネルを介して外部放送管理システムからの放送信号または放送関連情報を受信する。一例示的な実施例において、前記通信コンポーネント216は、短距離通信を促進するために、近距離通信(NFC)モジュールをさらに含む。例えば、NFCモジュールは、無線周波数識別(RFID)技術、赤外線データ協会(IrDA)技術、超広帯域(UWB)技術、ブルートゥース(登録商標)(BT)技術及び他の技術に基づいて具現することができる。
【0184】
例示的な実施例において、装置200は、1つまたは複数の特定用途向け集積回路(ASIC)、デジタル信号プロセッサ(DSP)、デジタル信号処理装置(DSPD)、プログラマブルロジックデバイス(PLD)、フィールドプログラマブルゲートアレイ(FPGA)、コントローラ、マイクロコントローラ、マイクロプロセッサまたは他の電子素子によって具現されることができ、前記方法を実行するように構成される。
【0185】
例示的な実施例において、命令を含むメモリ204などの、命令を含む非一時的なコンピュータ読み取り可能な記憶媒体をさらに提供し、前記命令は、装置200のプロセッサ220によって実行されて前記方法を完了することができる。例えば、前記非一時的なコンピュータ読み取り可能な記憶媒体は、ROM、ランダムアクセスメモリ(RAM)、CD-ROM、磁気テープ、フロッピー(登録商標)ディスクおよび光学データ記憶装置などであってもよい。
【0186】
本開示の「複数」は2つまたは2つ以上を指し、他の数量詞はこれと類似することを理解することができる。「および/または」は、関連付けられたオブジェクトを説明する関連付けであり、3種類の関係が存在することができることを示し、例えば、Aおよび/またはBは、Aが独立で存在する場合、AとBが同時に存在する場合、Bが独立で存在する場合など3つの場合を表すことができる。文字「/」は、一般的に、コンテキストオブジェクトが「または」の関係であることを示す。単数形の「1つ」、「前記」および「当該」は、コンテキストで他の意味を明確に示さない限り、複数形も含むことを意図する。
【0187】
用語「第1」、「第2」などは様々な情報を説明するために使用されるが、これらの情報はこれらの用語に限定されないことをさらに理解されたい。これらの用語は、同じタイプの情報をお互いに区別するために使用され、特定の順序または重要性を示すものではない。実際に、「第1」、「第2」などの表現は、お互いに交換して使用することができる。例えば、本開示の範囲から逸脱することなく、第1の情報は第2の情報とも称し得、同様に、第2の情報は第1の情報とも称し得る。
【0188】
本開示の実施例で、図面において特定の順序で動作を説明したが、それらの動作は、示された特定の順序でまたは連続した順序に従って実行されることを要求し、または示された全ての動作を実行して、目的の結果を取得することを要求するものとして理解されるべきではないことをさらに理解することができる。特定の環境では、マルチタスクと並列処理が有利な場合がある。
【0189】
当業者は、明細書を考慮して、本明細書に開示された発明を実施した後に、本開示の他の実施形態を容易に想到し得るであろう。本出願は、本開示のあらゆる変形、応用または適応性変化を網羅することを意図し、これらの変形、応用または適応性変化は、本開示の普通の原理に準拠し、本開示によって開示されない本技術分野における公知知識または従来の技術的手段を含む。明細書と実施例は、例示としてのみ考慮され、本開示の真の範囲および思想は添付の特許請求の範囲によって示される。
【0190】
本開示は、上記に既に説明し且つ図面に示した正確な構造に限定されるものではなく、その範囲から逸脱することなく様々な修正及び変更を行うことができることを理解されたい。本開示の範囲は、添付の特許請求の範囲によってのみ制限される。