(58)【調査した分野】(Int.Cl.,DB名)
前記ビデオシーケンスのパラメータ又は前に復号化されたサブシーケンスのパラメータは、GOPサイズ、シーン長、時間サブサンプリングファクタ、最大及び最小ズームファクタ並びに境界ボックス速度の少なくとも1つを有する、請求項1又は2記載の方法。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明は、ビデオソースデータを復号化する際に利用可能な情報を活用することによって、リフレーミングアプリケーションの設定又は入力パラメータを自動調整することを可能にする。復号化されたビデオシーケンスのための設定又は入力パラメータを自動調整するための開示される手段は、以前に復号化されたシーケンスの性質を利用する。
【課題を解決するための手段】
【0006】
本発明によると、ビデオシーケンスのイメージを処理する方法は、ビデオシーケンスのパラメータ、ビデオシーケンスの前に復号化されたGOP(Group Of Picture)のパラメータ及びユーザ設定を決定するステップと、決定されたパラメータに従ってクロップ処理される部分を決定するステップと、表示のため決定された部分をクロップ処理するステップとを有する。
【0007】
GOPサイズ、時間サブサンプリングファクタ、最小及び最大ズームファクタ又は境界ボックス速度などのビデオシーケンスの各種パラメータが決定及び利用可能である。これらのパラメータは、別々に利用されるか、又は組み合わせ可能である。例えば、一実施例では、決定及び利用されたパラメータは、(上述したパラメータから)境界ボックス速度のみを有する。
【0008】
一実施例では、決定及び利用されたパラメータは最小及び最大ズームファクタを有する。
【0009】
一実施例では、決定及び利用されたパラメータは、GOPサイズ、時間サブサンプリングファクタ、最小及び最大ズームファクタ又は境界ボックス速度を有する。
【0010】
本発明の一実施例では、ビデオシーケンスのイメージを処理する方法は、前のイメージにおいてリフレーミングウィンドウに含めるための前のイメージの最も顕著な部分であるピクセルのサブエリア又はサブセットを決定するステップと、当該ピクセルのサブエリア又はサブセットの周辺の第1境界ボックスを決定するステップと、現在のイメージにおいてリフレーミングウィンドウに含めるための現在のイメージの最も顕著な部分であるピクセルのサブエリア又はサブセットと、当該エリアの周辺の第2境界ボックスとを決定するステップと、連続するイメージの間で境界ボックスを移動するための最大境界ボックス速度を決定するステップと、第1及び第2境界ボックスと境界ボックスの決定された最大速度から新たな境界ボックスを決定するステップと、現在のイメージにおいて表示のために決定された新たな境界ボックスに従ってサブエリアをクロップ処理するステップとを有する。
【0011】
最大境界ボックス速度は、ビデオシーケンスの前に復号化されたGOPのパラメータから決定されてもよい。最大境界ボックス速度はまた、レジスタ又はストレージから抽出可能な所定値であってもよく、それはまたビデオシーケンスの前に復号化されたGOPについて有効である。
【0012】
上記方法を利用する装置は、ビデオシーケンスのパラメータを決定し、ビデオシーケンスの前に復号化されたGOP(Group Of Picture)のパラメータを決定し、ユーザ設定(ユーザインタフェース手段など)を決定するイメージ解析手段と、決定されたパラメータに従ってクロップ処理される部分を決定し、表示のため決定された部分をクロップ処理するイメージ処理手段とを有する。ビデオシーケンスの各種パラメータが、上述されるように、個別に又は組み合わせて決定及び利用可能である。
【0013】
本発明の一実施例では、ビデオシーケンスのイメージを処理する装置は、前のイメージにおいてリフレーミングウィンドウに含めるため前のイメージの最も顕著な部分であるピクセルのサブエリア又はサブセットを決定する手段と、当該ピクセルのサブエリア又はサブセットの周辺の第1境界ボックスを決定する手段と、現在のイメージにおいてリフレーミングウィンドウに含めるための現在のイメージの最も顕著な部分であるピクセルのサブエリア又はサブセットと当該エリアの周辺の第2境界ボックスとを決定する手段と、ビデオシーケンスの前に復号化されたGOPのパラメータから、連続するイメージの間で境界ボックスを移動するための最大境界ボックス速度を決定する手段と、第1及び第2境界ボックスと境界ボックスの決定された最大速度とから新たな境界ボックスを決定する手段と、現在のイメージにおいて表示のため決定された新たな境界ボックスに従ってサブエリアをクロップ処理する手段とを有する。
【0014】
一態様では、本発明は、コンピュータに上述されるような方法を実行させるための実行可能な命令を格納したコンピュータ可読媒体に関する。一実施例では、コンピュータは、ビデオシーケンスのイメージを処理する方法であって、ビデオシーケンスのパラメータを決定するステップと、ビデオシーケンスの前に復号化されたGOPのパラメータを決定するステップと、ユーザ設定を決定するステップと、決定されたパラメータに従ってクロップ処理される部分を決定するステップと、表示のため決定された部分をクロップ処理するステップとを有する方法を実行する。
【0015】
本発明の効果的な実施例は、従属形式の請求項、以下の説明及び図面に開示される。
【発明の効果】
【0016】
本発明による、ビデオソースデータを復号化する際に利用可能な情報を活用することによって、リフレーミングアプリケーションの設定又は入力パラメータを自動調整することが可能になる。
【発明を実施するための形態】
【0018】
図1は、自動リフレーミングユニットARを備えたビデオデコーダDECの構成を示す。デコーダDECは、符号化入力ビデオシーケンス11を受信し、それを復号化して復号化ビデオシーケンス12を取得する。パラメータ抽出手段PEは、復号化ビデオシーケンス及び/又はデコーダ設定13からパラメータ及び/又はリフレーミング設定14を抽出する。自動リフレーミングユニットARは、復号化ビデオシーケンス12及び抽出されたパラメータ及び/又はリフレーミング設定14から、リフレーミング(すなわち、クロップ処理された)ビデオシーケンス16を生成する。
【0019】
リフレーミングアプリケーションは、本発明によると符号化ストリーム又は復号化処理から自動調整されたある個数の設定Sを有する。一実施例では、当該設定は、バッファサイズ、時間サブサンプリングファクタ、2つのズームファクタz
min及びz
max、並びに境界ボックス速度を有する。これらの設定s
1,s
2,s
3,s
4は、以下に記述される。
【0020】
【数1】
バッファサイズ(s
1)は、経時的にクロップ処理ウィンドウパラメータをスムース化するためリフレーミング処理において利用されるバッファのサイズである。一実施例では、バッファサイズは、GOPサイズに従って調整される。
【0021】
時間サブサンプリングファクタ(s
2)は、リフレーミング処理が適用されるフレーム数を制限するのに利用され、これにより、例えば、s
sにおける1フレーム又はs
2個のフレームからの1フレームのみにリフレーミング処理を適用するなど、アプリケーションの計算複雑さを低減及び制御することが可能である。一実施例では、可能な時間サブサンプリングファクタ/モードは、GOPの長さ及びs
2に応じて“フルモード”(すべてのフレーム)、“中間モード”(IフレームとPフレームのみ)及び“ライトモード”(Iフレームのみ)である。
【0022】
ズームファクタ(s
3=(z
min,z
max))は、クロップ処理ウィンドウが境界間で経時的に変更しうる境界を規定する。この制限は、クロップ処理ウィンドウのサイズを変更する。ユーザは、大きすぎる又は小さすぎるズーム効果を回避するため、当該特徴を設定してもよい。一実施例では、シーンカット後の最初のピクチャにおいて、MBコストマップが、最も重要なブロックを検出するため生成される。その後、MBコストマップが、ズームファクタを決定するため利用される。
【0023】
境界ボックス速度(s
4)は、クロップ処理ウィンドウがピクチャ内で移動可能な速度である。一実施例では、境界ボックスは、リフレーミングウィンドウに含まれるべき最も顕著であると選択されるサブエリア又はピクセルのサブセットを表す。許容される速度はイメージコンテンツに依存し、すなわち、それは、以降のイメージのイントラ予測されたMB間の相関がかなり低いか、かなり高いときに低い値に制限される。高い相関は、静的イメージ又は少ない動きを意味し、安定的な境界ボックス位置が好ましく、低い相関は、シーン変更(すなわち、新たな“ショット”)を意味し、それは、境界ボックスシフトによって補償できないため、アルゴリズムを酷使することになる。従って、境界ボックス速度s
4は、コンテンツに依存してカメラの自然なカメラの動きにより良好に適合するようにシーケンスに対して適応化されてもよい。一実施例では、Kalmanフィルタは、フィルタリングのための境界ボックス座標に適用され、境界ボックス速度は、Kalmanフィルタに投入されるノイズファクタである。
【0024】
図2は、ビデオシーケンスのイメージを処理するための方法のフローチャートである。本方法は、ビデオシーケンスのパラメータ、ビデオシーケンスの以前に復号化されたGOP(Group Of Picture)のパラメータ及びユーザ設定を決定するステップ21と、決定されたパラメータに従ってクロップ処理される部分を決定するステップ22と、決定された部分を表示のためクロップ処理するステップ23とを有する。
【0025】
一実施例では、復号化パラメータは以下のように決定される。
【0026】
バッファサイズs
1は、GOPサイズ(Gsize)に従って調整される。原理的には、当該バッファサイズが小さなGOPについて低減され、フルバッファSize
maxがあるリミットを超過したGOPサイズについて利用される。GOPサイズは、デコーダDECがストレージから抽出するか、又は符号化ビットストリームから抽出してもよい所定のパラメータである。以下のルールが適用されてもよい。
【0027】
【数2】
一例となる具体的なアプリケーションのため、Gsize
maxは40に設定され、Size
maxは25に設定される。すなわち、Size
maxの以前のフレームのクロップ処理ウィンドウパラメータは、GOPサイズが40以上である場合、現在フレームのクロップ処理ウィンドウパラメータを取得するためバッファされて考慮される。このように、クロップ処理ウィンドウパラメータの急激な変更が回避され、クロップ処理ウィンドウパラメータは経時的にスムース化される。このとき、
図3に示されるようなバッファサイズの曲線が得られる。
【0028】
時間サブサンプリングファクタs
2は、GOPサイズ及びスキームに従って設定されてもよい。その考え方は、少なくともIフレームに対するリフレーミング処理(及びそのときの顕著性マップ)の計算を維持することであり、これは、それらが最も高いクオリティを有し、シーンの始め(すなわち、シーンカットの直後)にある可能性が高いためである。このとき、Pフレームは、処理対象としてあまり関心はない。最後に、時間サブサンプリングによりフレームを削除する必要がある場合、Bフレームは省略されるべき最初のフレームになるであろう。
【0029】
GOPスキームを利用することによって、EP1956550Aの既知の手段と比較して向上を図ることが可能であり、これは、何れのフレームタイプと何れのフレームが影響を受けるか選択することが可能であるためである。
【0030】
このとき、ファクタを規定する代わりに、
図4に示されるように、3つのモード又は利用ケースを規定することが可能である。フロモードFMでは、時間サブサンプリングはなく、すべてのフレームに対してリフレーミング処理が実行される。中間モードIMでは、シーケンスの一部又はすべてのBフレームが計算から除外される。ライトモードLMでは、シーケンスのPフレームの一部又はすべてと共に、Bフレームのすべてが計算から除外される。モード選択は、計算問題又は利用可能な計算環境CI/Envによりそれぞれ制御される。これは、コンテクスト(高低ビットレート又は高低クオリティ)要求に従って、3つのモードの1つが選択されることを意味し、高品質はフルモードを意味し、中程度の品質は中間モードを意味し、低品質はライトモードを意味する。
【0031】
図5は、モードの選択を示す詳細なフローチャートを示す。基本的に、Bフレームの有無がチェックされ、その後、それらの計算が中間モードIM及びライトモードLMにおいて省略される。その後、環境の制約に依存して、Pフレーム(又はサブセット)がまた破棄される。
図5に示されるように、上述した可能な3つのモードの1つが、モード選択MSにおいて選択可能である。
【0032】
フルモードFMでは、すべてのフレームが維持され、ステップ50において、時間サブサンプリングファクタパラメータs
2が1などに設定される。すなわち、すべてのフレームが処理される(59)。
【0033】
中間モードIMでは、Bフレームがあるかチェックされる(51)。Bフレームがない場合、すべてのフレームが処理される(59)。少なくとも1つのBフレームがある場合、次のステップ52は、NbBのBフレームを削除し、s
2=G
size−NbB(G
sizeはGOPサイズである)に従って時間サブサンプリングファクタパラメータs
2を計算する。計算された時間サブサンプリングファクタパラメータs
2は、例えば、“s
2>G
size/2?“などに従って所与の閾値と比較される(53)。時間サブサンプリングファクタが閾値を下回らない場合、削除されるBフレームの個数は増加され、当該計算が繰り返される。NbBは、1に初期化され、ループの各実行によりインクリメントされる変数である。nb
iterは、ループの実行をカウントするカウント変数であり、従って(中間モードでは)、スキップされるBフレームの個数である。あるいは、s
2,min=G
size−NbB
maxを計算し(NbB
maxはGOPにおけるBフレームの総数である)、結果として得られるs
2が閾値を下回っている限り、1つのBフレームバックを加え、すなわち、NbB
maxを減少させる。閾値ステップ53では、他の閾値thr
tSubsが、”s
2>thr
tSubs?“に従って時間サブサンプリングファクタパラメータs
2と比較するのに利用可能であることに留意されたい。好ましくは、当該閾値は、G
size/2に実質的に近い。
【0034】
ライトモードLMでは、Bフレームがあるかまず確認される(54)。ある場合、すべてのBフレームが次のステップ55において削除される。その後、取得した時間サブサンプリングファクタパラメータs
2が、s
2=G
size−NbBに従って計算され(56)、“s
2<G
size/2?”などに従って(又は、中間モードと同様に)所与の閾値と比較される(57)。時間サブサンプリングファクタパラメータs
2が閾値を下回る場合、残りのすべてのフレームが処理される(59)。Bフレームがない場合、次のステップ58において、NbP個のPフレームが削除される。結果として得られる時間サブサンプリングファクタs
2は、s
2=G
size−NbP−NbBに従って再び計算され(56)、所与の閾値と再び比較される(57)。時間サブサンプリングファクタがまだ閾値を下回っていない場合、削除されるPフレームの個数はさらの増加され、当該計算が繰り返される。NbPは、1に初期化され、ループの各実行毎にインクリメントされる変数である。nb
iterは、ループの実行をカウントするカウント変数であり、従って(ライトモードでは)、スキップされるPフレームの個数である。あるいは、s
2,min=G
size−NbP
max−NbBを計算し(NbP
maxはGOPにおけるPフレームの総数である)、結果として得られるs
2が閾値を下回る限り、1つのPフレームバックを加え、すなわち、NbP
maxを減少させることも可能である。
【0035】
最後に、残りのすべてのフレームが、クロップ処理などを含めて処理される(59)。
【0036】
他のパラメータは、最大許容ズームファクタs
3又はズームファクタのペア(s
3=(z
min,z
max))である。一実施例では、ズームファクタs
3を決定するため、通常はIフレームであるGOP又はシーンの最初のフレームに対応するマクロブロック(MB)コストマップが利用される。MBコストマップは、各MBについてそれの符号化コストを示す。
図6は、異なるビットレート及び異なるシーンのための一例となる4つの異なるMBコストマップを示す。各MBコストマップは、オリジナルピクチャの右に示される。最も重要なブロックは明確に特定でき(最も大きな符号化コストを有するライトブロック)、その後、リフレーミング処理に利用される最小及び最大ズーム境界がそれから導出可能である。本発明の一実施例では、ズームファクタは、すべてのシーンカットにおいて再調整される。この場合、シーンカット検出は、当該処理前に実行される。
【0037】
クロップ処理ウィンドウのズームファクタzは、z
min≦z≦z
maxにより規定されたズームファクタの範囲内で経時的に変化してもよい。しかしながら、z
min,z
maxの1つは明示的又は非明示的に与えられてもよい。
【0038】
一実施例では、s
3=(z
min,z
max)が、
【数3】
に従って規定できる。ここで、nb
MBはピクチャ内のMBの総数であり、nb
MBcost0は互いに必ずしも隣接する必要のない0に等しいコストのMBの個数であり(例えば、
図6の上方及び下方エッジの暗いMB)、nb
MBadjは大きなコスト(>最大コスト/2)を有し、互いに空間的に隣接するMBの個数である。一実施例では、それは、ピクチャにおいて最大のコスト(>最大コスト/2)を有する隣接MBの最大グループである。
【0039】
他のパラメータは、境界ボックス速度s
4である。ズームファクタと同様に、境界ボックス速度は、特にそれがシーン毎に調整される場合、スマートに調整されてもよい。一実施例では、境界ボックス速度は、現在のIntraMapと隣接ピクチャのIntraMapとの間の相関係数により表現可能な隣接ピクチャとの類似度に従って設定される。ここで、IntraMapは、Pピクチャ又はBピクチャにおけるイントラ符号化MBのマップである。隣接ピクチャのイントラ符号化MBの平均の相関係数がそれの平均から乖離するに従って、許容される境界ボックス速度は低くなる。符号化される困難なMBは通常はイントラ符号化されるため、IntraMapは、シーンの複雑さに関する情報を提供する。この情報から、連続するIntraMapの間の相関を記述する値が推定される。相関が高い場合(すなわち、グローバルな動きがほとんどないか、又はまったくなく、ローカルな動きがほとんどないか、まったくない)、境界ボックス速度はウィンドウを固定するため低くなっているべきであることが検出された。他方、相関がかなり低い場合、これはおそらく強いカメラの動き又は強いコンテンツの変化から生じる(例えば、誰かがカメラの前で移動しているなど)。この場合、コンテンツに関して意味がなく、混乱させる可能のある境界ボックス位置の強い適応化より好ましい適応化はない。従って、低い相関についてもまた、境界ボックス速度が低くなるべきである。中程度の相関について、コンテンツの変更はより容易に処理可能であり、より高い速度は、境界ボックスの再配置を可能にするため利用可能である。
【0040】
一実施例では、境界ボックス速度は、
【数4】
例えば、
【数5】
などに従って計算可能である。ただし、IntraMapはPピクチャ又はBピクチャにおけるイントラ符号化MBのマップであり、CCは現在のIntraMapと隣接するIntraMap(すなわち、次の又は前のもの)との間の相関係数であり、V
maxは境界ボックスの最大許容速度である。式6において、xは現在及び前のGOPを表す。このとき、境界ボックスは、
図7に示されるように、ガウス関数として経時的に変化する。m及びσはそれぞれ、速度の分布の平均及び標準偏差である。それらは、m=0.5及びσ=0.2などに調整されてもよい。m、σ及びV
maxはシステムにおける最大値として定義された固定的なパラメータであることに留意されたい。上述されるように、最大境界ボックス速度は、相関が中間値を有するときに可能とされる。
【0041】
図8は、境界ボックス速度の制限を例示的かつ簡単化された方法により示す。図示されたスケールは現実的なものでなく、簡単化のために利用されていることに留意されたい。上述されるように、前のイメージim
n−1では、最も顕著なエリアsa
1の周辺の第1境界ボックスbb
1が決定され、現在のイメージim
nでは、最も顕著なエリアsa
2の周辺の第2境界ボックスbb
2が決定される。その後、第1境界ボックスと第2境界ボックスとの間のシフトベクトル又はシフト距離d
detが決定され、最大許容シフトベクトル又はシフト距離d
maxと比較される。
【0042】
あるいは、イメージim
n−1とim
nとの間の時間距離を考慮するとき(フレームレートfを利用して)、決定された実際の境界ボックス速度が、v
det=d
det*fに従って計算可能である。決定された実際の境界ボックス速度は、最大許容境界ボックス速度v
maxと比較される。
【0043】
決定された境界ボックスシフトベクトルd
detが最大許容境界ボックスシフトベクトルd
maxを上回る(すなわち、より長い)場合、又は決定された境界ボックス速度v
detが最大許容境界ボックス速度v
maxを上回る場合、新たな境界ボックスの位置及び/又はサイズが決定され、決定された新たな境界ボックス位置に従うサブエリアが、表示のため現在のイメージにおいてクロップ処理される(すなわち、境界ボックスにより特定されるイメージの当該部分のみが表示される)。そうでない場合、決定された境界ボックスシフトベクトルd
detが最大許容境界ボックスシフトベクトルd
maxを上回らない場合、又は決定された境界ボックス速度v
detが最大許容境界ボックス速度v
maxを上回らない場合、第2境界ボックスはそのまま利用可能である。同様に、ズームファクタが説明可能である。
図9は、境界ボックスズームファクタの制限を例示的かつ簡単化された方法により示す。図示されたスケールは現実的でないかもしれないことに留意されたい。上述されるように、前のイメージim
n−1では、最も顕著なエリアの周辺の第1境界ボックスbb
1が決定され、現在のイメージim
nでは、最も顕著なエリアの周辺の第2境界ボックスbb
2が決定される。本例では、第2境界ボックスbb
2は、第1境界ボックスbb
1よりかなり小さい。その後、ズームファクタが計算される。原理的には、ズームファクタは、例えば、z=n
bb2/n
bb1などに従って境界ボックスによりピクセル数から計算されてもよい。計算されたズームファクタは、最大許容ズームファクタz
maxと比較される。
【0044】
決定されたズームファクタz
detが最大許容ズームファクタz
maxを上回らない場合、第2境界ボックスはそのまま利用可能である。他方、決定されたズームファクタz
detが最大許容ズームファクタz
maxを上回る場合、新たな境界ボックスbb
detのサイズは、最大許容ズームファクタz
maxが充足されるように決定される。新たな境界ボックスbb
detは、第2境界ボックスbb
2と同心円状にある。決定された新たな境界ボックスbb
detの位置によるサブエリアは、表示のため現在イメージにおいてクロップ処理される。
【0045】
図8及び9に関して上記は境界ボックスのコンセプトの原理の説明であることに留意すべきである。実際の実現形態では、例えば、境界ボックス速度について、フィルタ(Kalmanフィルタなど)が境界ボックスの座標に適用され、境界ボックスの座標の軌跡及び境界ボックスのサイズをスムース化するため、境界ボックス速度は、フィルタに投入されるノイズファクタである。
【0046】
境界ボックス(又はクロップ処理ウィンドウ)は、一実施例では、ウィンドウに含まれるべき最も顕著なものとして選択されるピクセルのサブエリア又はサブセットを表す。一実施例では、当該ウィンドウは、目標とされる所定のアスペクト比(ユーザなどにより規定される)に設定される。このとき、一実施例では、リフレーミングアプリケーションにおいて、ウィンドウの位置(x及びy軸)及び/又はサイズは変化する。速度はボックスの位置のみを参照し、すなわち、境界ボックスが経時的にその位置を変更する方法を参照する。従って、それは、カメラの動きなどによって影響を受ける。実際には、境界ボックス速度は、フレームの可視的部分が移動する速度としてみなすことができる。
【0047】
図10は、本発明による入力ビデオシーケンスseq
inのイメージを処理する装置100の原理的なブロック図を示す。本装置は、イメージ解析モジュール102とイメージ処理モジュール110とを有する。イメージ解析モジュールは、ビデオシーケンスのパラメータを決定する第1パラメータ決定モジュール103と、ビデオシーケンスの前に復号化されたGOPのパラメータを決定する第2パラメータ決定モジュール104と、ユーザ設定を決定するユーザインタフェースモジュール105とを有する。さらに、本装置は、決定されたパラメータに従ってクロップ処理される部分を決定するクロップウィンドウポジショニングモジュール106と、表示のため決定された部分をクロップ処理するクロップ処理モジュール107とを有する。クロップ処理されたイメージシーケンスseq
crは、出力に提供される。ビデオシーケンスの各種パラメータが、上述されるように、決定され、別々に又は組み合わせて利用可能である。上述したモジュールは、ハードウェアモジュール、ソフトウェアによりサポートされたハードウェアモジュール又はソフトウェアモジュールとして実現可能である。
【0048】
一実施例では、本装置はさらに、シーン変更検出モジュールを有する。サブシーケンスがシーン(すなわち、“ショット”)である場合、当該シーン(又はシーン変更)はシーン変更検出モジュールにより検出される。
【0049】
一実施例では、本装置はさらに、前のイメージ(im
n−1)において当該前のイメージの最も顕著な部分であるピクセルのサブエリア又はサブセット(sa
1)を決定する手段、前のイメージのピクセルのサブエリア又はサブセットの周辺の第1境界ボックス(bb
1)を決定する手段、現在イメージにおいて当該現在イメージの最も顕著な部分であるピクセルのサブエリア又はサブセット(sa
2)を決定する手段、第1境界ボックス(bb
1)及び第2境界ボックス(bb
2)から境界ボックスシフト(d
det)を計算する手段、第1境界ボックス(bb
1)及び第2境界ボックス(bb
2)の位置から境界ボックスシフト(d
det)を計算するか、又は第1境界ボックス(bb
1)及び第2境界ボックス(bb
2)の位置並びにビデオフレームレートから境界ボックス速度を計算する手段、決定された境界ボックスシフト(d
det)又は境界ボックス速度と連続するイメージの間の最大許容境界ボックスシフト又は境界ボックス速度とを比較する手段、及び新たな境界ボックスの位置及び/又はサイズ(bb
det)を決定し、決定した境界ボックスシフトが最大許容境界ボックスシフトを上回る場合、又は決定した境界ボックス速度が最大許容境界ボックス速度を上回る場合、現在イメージにおいて表示のため決定された新たな境界ボックスに従ってサブエリアをクロップ処理し、他方、決定した境界ボックスシフト(d
det)又は境界ボックス速度が最大許容境界ボックスシフト又は境界ボックス速度以下である場合、現在イメージにおいて表示のため決定された第2境界ボックス(bb
2)に従ってサブエリアをクロップ処理する手段を有する。
【0050】
本発明の効果は、それがコンテンツの信頼できて有用な復号化情報に基づき、リフレーミングパラメータの自動調整を実行することである。すなわち、リフレーミングパラメータは、ビデオを復号化する際に利用可能な情報を利用することによって(特に、前に復号化されたシーケンスの性質)、コンテンツに基づき自動調整される。従来、符号化中には付加的情報は挿入される必要がなかったため、符号化ビデオシーケンスが利用可能である。リフレーミングアプリケーションの設定Sは、復号化処理又は復号化ストリームから自動的に調整可能である。これらのパラメータは、上述されたように、バッファサイズs
1、時間サブサンプリングファクタs
2、ズームファクタs
3=(z
min,z
max)及び境界ボックス速度s
4の1以上である。
【0051】
一実施例では、復号化ビデオシーケンスの設定又は入力パラメータが、それの直前の復号化シーケンスの性質に従って自動調整される。
【0052】
本発明の一実施例では、リフレーミングアプリケーションはビデオ復号化後に実行される。
【0053】
本発明は、表示のためのビデオを前処理する装置又はビデオを表示可能な装置において実現可能である。本発明は、特に小さなスクリーンサイズを備えたビデオ表示装置に有用である。
【0054】
本発明が純粋に具体例により説明され、本発明の範囲から逸脱することなく詳細の変更が可能であることが理解されるであろう。本発明の基本的な新規な特徴がそれの好適な実施例に適用されるように図示、説明及び指摘されたが、説明された装置及び方法、開示された装置の形式及び詳細、及びそれらの動作の各種省略、置換及び変更が、本発明の趣旨から逸脱することなく当業者により可能であることが理解されるであろう。同一の結果を達成するため実質的に同じ方法により実質的に同一の機能を実行する要素のすべての組み合わせが本発明の範囲内であることが明示的に意図される。説明された実施例の間の要素の置換はまた、完全に意図及び想定される。
【0055】
本説明、(適切である場合)請求項及び図面に開示された各特徴は、独立して又は何れか適切な組み合わせにより提供されてもよい。各特徴は、適切である場合、ハードウェア、ソフトウェア又はこれら2つの組み合わせにより実現されてもよい。請求項に現れる参照番号は、単なる具体例であり、請求項の範囲に対して限定的な効果を有さない。
以下、本願により教示される手段を例示的に列挙する。
(付記1)
ビデオシーケンスのイメージを処理する方法であって、
前記ビデオシーケンスのパラメータ、前記ビデオシーケンスの前に復号化されたサブシーケンスのパラメータ及びユーザ設定を決定するステップと、
前記決定されたパラメータに従ってクロップ処理される部分を決定するステップであって、前記クロップ処理される部分は、可変的な位置及び可変的なサイズの少なくとも1つを有する境界ボックスにより規定され、前記可変的な位置は、前記ビデオシーケンスにおける隣接フレームのイントラ符号化マクロブロックの間の相関に依存し、前記相関の第1相関値について、前記境界ボックス位置は、前記第1相関値より高い又は低い相関値に対してより速く変化し、前記可変的なサイズは、現在のGOP又はシーンの第1フレームのマクロブロックコストマップのパラメータから計算される最大ズームファクタに依存し、ゼロに等しいコストを有するマクロブロックのパーセンテージがより低い場合、より大きな最大ズームファクタが許容される、前記決定するステップと、
リフレーミングステップにおいて、表示のため前記決定された部分をクロップ処理するステップと、
を有する方法。
(付記2)
前記サブシーケンスはGOP又はシーンであり、前記シーンはシーン変更検出により検出される、付記1記載の方法。
(付記3)
前記ビデオシーケンスのパラメータ又は前に復号化されたサブシーケンスのパラメータは、GOPサイズ、シーン長、時間サブサンプリングファクタ、最大及び最小ズームファクタ並びに境界ボックス速度の少なくとも1つを有する、付記1又は2記載の方法。
(付記4)
前記ビデオシーケンスのパラメータを決定するステップは、現在のイメージについて、
前のイメージにおいて、前記前のイメージの最も顕著な部分であるピクセルのサブエリア又はサブセットを決定するステップと、
前記前のイメージのピクセルのサブエリア又はサブセットの周辺の第1境界ボックスを決定するステップと、
前記現在のイメージにおいて、前記現在のイメージの最も顕著な部分であるピクセルのサブエリア又はサブセットを決定するステップと、
前記現在のイメージの前記エリアの周辺の第2境界ボックスを決定するステップであって、前記第2境界ボックスは前記可変的な境界ボックス位置を有する、前記第2境界ボックスを決定するステップと、
前記第1境界ボックスと前記第2境界ボックスとの位置から境界ボックスシフトを計算するか、又は前記第1境界ボックスと前記第2境界ボックスとの位置及び前記ビデオフレームレートから、境界ボックスシフトと境界ボックス速度とを計算するステップと、
前記決定された境界ボックスシフト又は境界ボックス速度と、連続するイメージの間の最大許容境界ボックスシフト又は境界ボックス速度とを比較するステップと、
前記決定された境界ボックスシフトが前記最大許容境界ボックスシフトを上回る場合、又は前記決定された境界ボックス速度が前記最大許容境界ボックス速度を上回る場合、新たな境界ボックスの位置及び/又はサイズを決定し、前記現在のイメージにおいて表示のため前記決定された新たな境界ボックスに従って前記サブエリアをクロップ処理するステップと、
他方、前記決定された境界ボックスシフト又は境界ボックス速度が前記最大許容境界ボックスシフト又は最大許容境界ボックス速度以下である場合、前記現在のイメージにおいて表示のため前記決定された第2境界ボックスに従って前記サブエリアをクロップ処理するステップと、
を有する、付記1乃至3何れか一項記載の方法。
(付記5)
前記最大許容境界ボックスシフト又は境界ボックス速度は、前記ビデオシーケンスの前に復号化されたサブシーケンスのパラメータから決定される、付記1乃至4何れか一項記載の方法。
(付記6)
前記最大許容境界ボックス速度は、
【数6】
に従って計算され、IntraMapはPピクチャ又はBピクチャにおけるイントラ符号化されたMBのマップであり、CCは現在のIntraMapと隣接するIntraMapとの間の相関係数であり、Vmaxは前記境界ボックスの最大速度であり、m及びσは前記境界ボックス速度の分布の平均及び標準偏差である、付記1乃至5何れか一項記載の方法。
(付記7)
前記クロップ処理ウィンドウパラメータを経時的にスムース化するステップをさらに有し、
前記クロップ処理ウィンドウパラメータを経時的にスムース化するため、前記リフレーミングステップにおいてバッファが利用され、
前記バッファのサイズは、前記GOPサイズに従って調整される、付記1乃至6何れか一項記載の方法。
(付記8)
時間サブサンプリングファクタ又は時間サブサンプリングスキームが、時間サブサンプリングモードに従って設定され、
第1サブサンプリングモードでは、前記リフレーミングステップがすべてのフレームに適用され、
第2サブサンプリングモードでは、前記リフレーミングステップがすべてのIフレーム及びPフレームに適用され、0以上のBフレームには適用されず、
第3サブサンプリングモードでは、前記リフレーミングステップがすべてのIフレームに適用され、何れのBフレームに適用されず、0以上のPフレームに適用されない、付記1乃至7何れか一項記載の方法。
(付記9)
前記サブサンプリングモードの1つは、ビットレート要求とイメージ品質要求との少なくとも1つに従って選択される、付記8記載の方法。
(付記10)
前記クロップ処理される部分は、クロップ処理ウィンドウにより規定され、
最大又は最小許容ズームファクタ又はズームファクタのペアを決定するステップをさらに有し、
前記最大又は最小許容ズームファクタは、前記クロップ処理ウィンドウが経時的に変化する境界を規定し、又は前記ズームファクタのペアは、前記クロップ処理ウィンドウが経時的に変化する2つの境界を規定する、付記1乃至9何れか一項記載の方法。
(付記11)
前記ズームファクタのペアは、現在のGOP又はシーンの第1フレームのマクロブロックコストマップのパラメータから計算される、付記10記載の方法。
(付記12)
最小許容ズームファクタは、
【数7】
により計算され、
最大許容ズームファクタは、
【数8】
により計算され、nbMBは前記イメージ内のMBの総数であり、nbMBcost0は0に等しいコストを有するMBの個数であり、nbMBadjは最大のコストを有する隣接MBの個数である、付記1乃至11何れか一項記載の方法。
(付記13)
ビデオシーケンスのイメージを処理する装置であって、
前記ビデオシーケンスのパラメータを決定し、前記ビデオシーケンスの前に復号化されたサブシーケンスのパラメータを決定し、ユーザ設定を決定するイメージ解析手段と、
前記決定されたパラメータに従ってクロップ処理される部分を決定し、表示のため前記決定された部分をクロップ処理するイメージ処理手段であって、前記クロップ処理される部分は、可変的な位置及び可変的なサイズの少なくとも1つを有する境界ボックスにより規定され、前記可変的な位置は、前記ビデオシーケンスにおける隣接フレームのイントラ符号化マクロブロックの間の相関に依存し、前記相関の第1相関値について、前記境界ボックス位置は、前記第1相関値より高い又は低い相関値についてより速く変化し、前記可変的サイズは、現在のGOP又はシーンの第1フレームのマクロブロックコストマップのパラメータから計算されるズームファクタに依存し、ゼロに等しいコストを有するマクロブロックのパーセンテージがより低い場合、より高い最大ズームファクタが許容される、前記イメージ解析手段と、
を有する装置。
(付記14)
シーン変更検出モジュールをさらに有し、
前記サブシーケンスは、GOP又はシーンであり、
前記シーンは、前記シーン検出モジュールにより検出される、付記13記載の装置。
(付記15)
前のイメージにおいて、前記前のイメージの最も顕著な部分であるピクセルのサブエリア又はサブセットを決定する手段と、
前記前のイメージのピクセルのサブエリア又はサブセットの周辺の第1境界ボックスを決定する手段と、
前記現在のイメージにおいて、前記現在のイメージの最も顕著な部分であるピクセルのサブエリア又はサブセットを決定する手段と、
前記現在のイメージの前記エリアの周辺の第2境界ボックスを決定する手段と、
前記第1境界ボックスと前記第2境界ボックスとの位置から境界ボックスシフトを計算するか、又は前記第1境界ボックスと前記第2境界ボックスとの位置及び前記ビデオフレームレートから、境界ボックス速度とを計算する手段と、
前記決定された境界ボックスシフト又は境界ボックス速度と、連続するイメージの間の最大許容境界ボックスシフト又は境界ボックス速度とを比較する手段と、
前記決定された境界ボックスシフトが前記最大許容境界ボックスシフトを上回る場合、又は前記決定された境界ボックス速度が前記最大許容境界ボックス速度を上回る場合、新たな境界ボックスの位置及び/又はサイズを決定し、前記現在のイメージにおいて表示のため前記決定された新たな境界ボックスに従って前記サブエリアをクロップ処理し、前記決定された境界ボックスシフト又は境界ボックス速度が前記最大許容境界ボックスシフト又は最大許容境界ボックス速度以下である場合、前記現在のイメージにおいて表示のため前記決定された第2境界ボックスに従って前記サブエリアをクロップ処理する手段と、
を有する、付記13又は14記載の装置。