【文献】
三須俊枝,他,超解像復元技術を用いる4K12ビット実時間映像符号化システム,FIT2015 第14回情報科学技術フォーラム 講演論文集,一般社団法人情報処理学会 一般社団法人電子情報通信,2015年 8月24日,第3分冊,I-036,pp.291-294
(58)【調査した分野】(Int.Cl.,DB名)
映像信号を符号化したビットストリームと、前記ビットストリームを復号化して得る映像信号の高解像化に用いられる第1補助情報とを出力する映像符号化装置から、前記ビットストリームと前記第1補助情報とを受信する映像復号装置であって、
前記受信したビットストリームを復号化し、映像信号を出力する映像復号部と、
前記映像復号部から出力される映像信号に含まれる閾値以上の空間周波数の成分の大きさに応じて、当該映像信号の高解像化に用いる第2補助情報を生成する補助情報生成部と、
前記第1補助情報の受信状態に応じて、前記受信した第1補助情報又は前記第2補助情報を選択する補助情報選択部と、
前記補助情報選択部によって選択される前記第1補助情報又は前記第2補助情報を用いて前記映像復号部から出力される映像信号を高解像化する画像復元部と
を含み、
前記画像復元部は、前記第2補助情報に基づいて、前記映像信号に対する高解像化の度合いを決定する、
映像復号装置。
前記補助情報選択部は、前記第1補助情報の受信状態が所定レベル以下のときに前記第2補助情報を選択し、前記第1補助情報の受信状態が前記所定レベルよりも高いときに前記受信した第1補助情報を選択する、請求項1記載の映像復号装置。
【発明を実施するための形態】
【0009】
以下、本発明の映像復号装置を適用した実施の形態について説明する。
【0010】
<実施の形態>
図1は、実施の形態の映像復号装置と、映像復号装置に映像信号を伝送する映像符号化装置とを示す図である。
【0011】
映像符号化装置1は、画像縮小部10、映像符号化部11、画像復元部12、最適化部13、及び補助情報送信部14を含む。映像復号装置2は、映像復号部20、補助情報受信部21、補助情報生成部22、補助情報選択部23、及び画像復元部24を含む。
【0012】
映像符号化装置1は、典型的にはテレビ放送局の施設に設置され、放送用の放送波を用いた無線の伝送路3で映像ストリームをデジタル方式で多重化して伝送するとともに、携帯電話回線を利用したIP(Internet Protocol)プロトコルによる無線の伝送路4で補助情報を伝送する。補助情報は、映像復号装置2において低解像映像信号を高解像映像信号に復元する際の最適な条件を表す制御値であり、高解像映像信号に含まれる特徴量を表す。特徴量には、例えば、低解像映像信号成分を空間周波数成分に分解した場合の高域成分(例えば所定の閾値以上の空間周波数成分)の大きさを定量化した数値(例えば電力)を用いることができる。高域成分を定量化する際に、空間周波数成分を水平・垂直方向にそれぞれ区分(例えば4帯域区画に区分)し、方向毎の成分の大きさを定量化してもよい。また、映像復号装置2は、視聴者の家や施設等に設置され、映像ストリームと補助情報とを別々に受信する。
【0013】
なお、ここでは、映像ストリームを伝送路3でデジタル方式で多重化して伝送する形態について説明する。伝送路3は、映像ストリームを伝送するため、天候等の影響を受けにくい頑強な伝送路である。ただし、伝送路3は、映像ストリームを多重化せずに伝送する伝送路であってもよい。
【0014】
また、ここでは、伝送路4が携帯電話回線を用いた無線の伝送路である形態について説明する。補助情報を伝送する伝送路4は、伝送路3ほど頑強な伝送路ではなくてよく、携帯電話回線の代わりに、PHS(Personal Handy-phone System)回線、無線又は有線のLAN(Local Area Network)、又は、Bluetoothのような近距離通信等の伝送路であってもよい。また、伝送路4は、利用者がこれらの伝送路を選択でき、希望に応じて切り替えられるものであってもよい。
【0015】
また、ここでは映像ストリームと補助情報の伝送について説明するため、音声やその他の情報等は、音声やその他の情報等とは別に伝送すればよい。
【0016】
以下では、
図1に加えて
図2を用いる。
図2は、
図1の詳細版であり、画像復元部12及び画像復元部24の内部の構成を詳細に示す図である。画像復元部12は、4つの高解像化部0、1、2、3を有し、画像復元部24は、4つの高解像化部0、1、2、3を有する。
【0017】
画像縮小部10は、高解像の映像信号を出力する装置から入力された高解像映像信号の解像度削減処理を実行し、解像度を低下させた低解像映像信号を生成する。解像度削減処理は、例えば、空間解像度の削減、時間解像度の削減、又は、空間解像度及び時間解像度の複合(例えば、空間解像度と時間解像度とを両方とも一定に間引く方法や、時間に応じて空間解像度を間引く位相を変化させるインタレース法)による標本数の削減を行う処理である。
【0018】
映像符号化部11は、低解像映像信号に対して周知の映像符号化方式による映像符号化処理を行うことにより、映像ストリーム(映像情報)を出力する。また、映像符号化部11は、映像符号化処理の途中で生成される局部復号映像(ローカルデコード映像)も出力する。
【0019】
また、映像符号化部11は、ローカルデコード映像を直接出力する代わりに、映像符号化方式による映像復号を映像情報に対して施して復号映像を得て、この復号映像を出力してもよい。この場合には、このような復号映像をローカルデコード映像とみなして用いればよい。
【0020】
画像復元部12は、映像符号化部11から出力されるローカルデコード映像に対して映像の高解像化を行い、高解像映像信号を出力する。画像復元部12は、例えば複数の高解像化部(例えば、補間による標本点数の増加、各種超解像技術による標本点数の増加など)を備え、それら複数の結果を出力するよう構成してもよい。
【0021】
画像復元部12は、一例として、
図2に示すように高解像化部0、1、2、3を有する。画像復元部12の高解像化部0〜3は、例えば、互いに高域付加の度合いが異なり、それぞれが高解像化した画像を出力するアップコンバータである。ここで、ローカルデコード映像の画像(フレームもしくはこれを分割した部分画像)をL、高解像化部n(nは0以上3以下の整数)の出力をH
nとおく。このとき、高解像化部nは、次式(1)に従って出力H
nを生成する。出力H
nは、nの数値(0〜3)に応じて、式(1)に含まれる4つの右辺のうちのいずれか1つを出力する。出力H
nは、高解像映像信号である。
【0023】
ここに、B[L]は画像Lを補間処理(例えば、双一次補間、双三次補間、最近傍補間、Lanczos補間など)により高解像化する(例えば、解像度を水平2倍、垂直2倍にする)操作を表す汎関数である。また、S[L]は画像Lを超解像処理により高解像化することを表す汎関数である。なお、超解像処理は、例えば、特開2014-119949号公報に記載の超解像手法で実現できるものである。
【0024】
また、画像復元部12は、後述する最適化部13からのフィードバック入力に従って高解像化部n(nは0〜3)の出力を調整し、調整した画像を出力するよう構成してもよいし、フィードバック入力に従って、例えば高解像化部n(nは0〜3)のパラメータを調整し、調整したパラメータに基づいて高解像化部n(nは0〜3)が出力する画像を出力するよう構成してもよい。
【0025】
最適化部13は、画像復元部12の高解像化部0〜3の出力を高解像映像信号(原画像)と比較し、高解像映像信号に最も近い高解像化の結果を表す高解像化部nを(1つ)求め(並列型の最適判定)、高解像化部nを特定する識別子を補助情報として出力する。補助情報は、画像復元部12の高解像化部n(nは0〜3)のいずれか1つを表す情報である。
【0026】
また、画像復元部12が最適化部13からのフィードバック入力に従って高解像化の結果を求める構成の場合には、最適化部13は、フィードバック入力を複数通り変化させ、画像復元部12からの高解像化の結果が最も高解像映像信号に近くなるフィードバック入力のパラメータを求め(反復処理による最適判定)、このパラメータを補助情報として出力する。このパラメータは、高解像化部0〜3のいずれか1つを表す。
【0027】
最適化部13の並列型又は反復処理による最適判定は、画面(フレーム)単位で実行してもよいし、画面を分割した領域単位で実行してもよいし、複数フレームの集合単位(例えば映像符号化部11のGOP(Group Of Pictures)単位)で実行してもよい。
【0028】
補助情報送信部14は、最適化部13から入力される補助情報を伝送路4に出力するインタフェースである。補助情報送信部14は、例えば、情報源符号化や、暗号化、パリティビットやチェックディジット、ハッシュ値の付加、伝送路符号化、変調といった操作を行ってから補助情報伝送手段4の伝送フォーマットにフォーマット化して出力してもよいし、情報源符号化や、暗号化、伝送路符号化、変調といった操作を行わず、単純に伝送路4の伝送フォーマットにフォーマット化して出力してもよい。
【0029】
映像復号部20は、映像符号化装置1の映像符号化部11から伝送路3を介して受信する映像ストリーム(映像情報)を周知の映像符号化方式による映像復号処理を実行して、低解像映像を出力する。
【0030】
補助情報受信部21は、補助情報送信部14から出力され、伝送路4を介して伝送される補助情報を受信するインタフェースである。補助情報受信部21は、受信した補助情報を受信補助情報r(
図2参照)として出力する。受信補助情報rは、第1補助情報の一例である。補助情報受信部21は、補助情報そのものを受信するのみならず、補助情報が正しく受信されたか否かを判定し、判定結果をフラグfとして出力する。例えば、フラグfは、正常受信時にはf=1、それ以外の場合にはf=0である。
【0031】
補助情報が正しく受信されたか否かは、例えば受信したデータ量(例えばIPパケットの数)やデータ受信時のタイムアウトエラーで判定してもよいし、あるいは補助情報送信部14において伝送路符号化やチェックディジット、パリティビット、ハッシュ値の付加を行った場合にはこれら(パリティ等)の状態で判定してもよい。
【0032】
補助情報送信部14が、例えば、情報源符号化や、暗号化、伝送路符号化やチェックディジット、パリティビット、ハッシュ値の付加、変調といった操作を行ってから補助情報伝送手段4の伝送フォーマットにフォーマット化して出力する場合には、補助情報受信部21は、これらの逆処理を必要に応じて行うものとする。
【0033】
次に、補助情報生成部22及び補助情報選択部23について説明する前に、画像復元部24について説明する。
【0034】
画像復元部24は、画像復元部12と同様の処理により映像復号部20から入力される低解像復号映像の高解像化を実行する。画像復元部24は、一例として、
図2に示すように高解像化部0、1、2、3と、スイッチ24Aとを有する。
【0035】
画像復元部24の高解像化部0〜3は、例えば、高解像化手法(例えば、補間による標本点数の増加、各種超解像技術による標本点数の増加など)を実現するアップコンバータである。
【0036】
画像復元部24は、補助情報選択部23から入力される補助情報a(
図2参照)によって特定される高解像化部0〜3のうちのいずれか1つを選択するようにスイッチ24Aを切り替え、選択されたいずれか1つの高解像化部が出力する画像を高解像映像信号として出力する。補助情報aによって特定されるのは、高解像化部0〜3のうちのいずれか1つである。
【0037】
ここで、低解像復号映像の画像(フレームもしくはこれを分割した部分画像)をD、高解像化部m(mは0以上3以下の整数)の出力をR
mとおく。このとき、高解像化部mは、次式(2)に従って出力R
mを生成する。出力R
mは、高解像映像信号である。
【0039】
また、画像復元部24は、補助情報aに従って、例えば高解像化部0〜3のパラメータを調整し、このパラメータを用いて高解像化した高解像化部0〜3の出力のうちのいずれか1つを高解像映像信号として出力する構成であってもよい。
【0040】
補助情報生成部22は、映像復号部20から入力される低解像復号映像に基づき、画像復元部24を制御するための情報(ローカル補助情報s)を生成する。ローカル補助情報sは、第2補助情報の一例である。例えば、補助情報生成部22は、低解像復号映像のフレーム(又はこれを分割した部分画像)に含まれる空間周波数の高域成分に着目し、高域成分の電力に応じてローカル補助情報sを生成する。ローカル補助情報sは、画像復元部24の高解像化部0〜3のうちのいずれか1つを選択する情報である。
【0041】
画像復元部24が、式(2)で表される4つの高解像化部m(m=0〜3)によって実現される場合には、補助情報生成部22は、低解像復号映像の画像(フレーム又はその部分画像)Dを2次元ウェーブレット分解により水平低域・垂直低域成分、水平高域・垂直低域成分、水平低域・垂直高域成分、及び水平高域・垂直高域成分の4帯域に分解する。
【0042】
補助情報生成部22は、これら4帯域のうち水平高域・垂直低域成分、水平低域・垂直高域成分、及び水平高域・垂直高域成分の3帯域成分(高域成分)について、画素値の電力Pを求める。補助情報生成部22は、電力Pに対して所定の3つの閾値(いずれも正の実数)を用いて閾値処理を行い、電力Pを4段階(電力Pの小さい方から、例えば、分類0〜3とする)に分類する。補助情報生成部22は、このような4つの分類を表すローカル補助情報sを出力する。例えば、補助情報生成部22は、分類0〜3に応じて、それぞれ、s=0〜3のローカル補助情報sを出力する。
【0043】
補助情報選択部23は、補助情報受信部21から入力されるフラグfを参照し、補助情報受信部21が正常受信(f=1)の場合には受信した受信補助情報rを、正常受信ではない場合(f=0の場合)にはローカル補助情報sを選択し、選択した受信補助情報r又はローカル補助情報sを補助情報aとして出力する。補助情報選択部23が出力する補助情報aは、画像復元部24に入力される。
【0044】
このため、補助情報受信部21が正常受信ではない場合(f=0の場合)においても、補助情報選択部23がローカル補助情報sを補助信号aとして選択して出力するので、画像復元部24は、ローカル補助情報sに基づく補助信号aを用いて、映像復号部20から入力される低解像復号映像の高解像化を実行し、出力R
m(高解像映像信号)を出力することができる。
【0045】
なお、補助情報選択部23は、画面単位、画面を分割した領域単位、又は、複数フレーム単位で補助情報aを出力すればよい。画像復元部24は、画面単位、画面を分割した領域単位、又は、複数フレーム単位で出力R
m(高解像映像信号)を出力することができる。
【0046】
以上の動作により、映像復号装置2は、補助情報の受信の成否に応じて、受信補助情報rとローカル補助情報sのいずれかを画面単位、部分画像単位あるいは複数フレーム単位で切り替えつつ高解像映像信号を生成する。これにより、伝送路4の状態(例えば輻輳等)が悪化しても画像復元部24による高解像化処理を維持することができ、安定した画質の高解像映像信号(出力R
m)を出力することができる。
【0047】
従って、補助情報を受信できない場合でも映像信号を高解像化することができる映像復号装置を提供することができる。
【0048】
なお、以上では、補助情報選択部23が受信補助情報rとローカル補助情報sのいずれか1つを選択する形態について説明したが、例えば、時系列的に、ある瞬間では正常受信(f=1)であり、次のある瞬間では正常受信ではない(f=0)ような状態が続く場合には、補助情報選択部23は、フラグfの値に応じて、ローカル補助情報s又は受信補助情報rを補助情報aとして出力すればよい。
【0049】
また、例えば、受信補助情報rが50%の信頼性で受信されるような場合(例えば、QPSK変調により補助情報が伝送される場合に、受信信号の振幅・位相が2信号点から等距離の位置にあり、これをいずれか一方の信号点であったものとして復調した場合)には、ローカル補助情報sと受信補助情報rとを、ある比率(例えば、50%ずつの比率)で合成して補助情報aとして出力してもよい。
【0050】
また、以上では、伝送路4が携帯電話回線を用いた無線の伝送路であり、伝送路3ほど頑強な伝送路ではない形態について説明した。しかしながら、伝送路3と伝送路4とは、物理的には同一の伝送路であってもよい。伝送路3と伝送路4の間において、伝送路符号化や変調における誤り耐性の差異が存在すれば、実施の形態の映像復号装置2を用いることが有効的である。
【0051】
以上、本発明の例示的な実施の形態の映像復号装置について説明したが、本発明は、具体的に開示された実施の形態に限定されるものではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。