(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6188005
(24)【登録日】2017年8月10日
(45)【発行日】2017年8月30日
(54)【発明の名称】濃淡画像符号化装置及び復号装置
(51)【国際特許分類】
H04N 1/41 20060101AFI20170821BHJP
G06T 5/00 20060101ALI20170821BHJP
G06T 5/20 20060101ALI20170821BHJP
H04N 19/132 20140101ALI20170821BHJP
H04N 19/136 20140101ALI20170821BHJP
H04N 19/14 20140101ALI20170821BHJP
H04N 19/147 20140101ALI20170821BHJP
H04N 19/172 20140101ALI20170821BHJP
H04N 19/196 20140101ALI20170821BHJP
H04N 19/20 20140101ALI20170821BHJP
H04N 19/21 20140101ALI20170821BHJP
H04N 19/46 20140101ALI20170821BHJP
H04N 19/463 20140101ALI20170821BHJP
H04N 19/593 20140101ALI20170821BHJP
H04N 19/60 20140101ALI20170821BHJP
H04N 19/61 20140101ALI20170821BHJP
H04N 19/70 20140101ALI20170821BHJP
H04N 19/80 20140101ALI20170821BHJP
H04N 19/90 20140101ALI20170821BHJP
H04N 19/91 20140101ALI20170821BHJP
【FI】
H04N1/41 Z
G06T5/00 705
G06T5/20
H04N19/132
H04N19/136
H04N19/14
H04N19/147
H04N19/172
H04N19/196
H04N19/196 300
H04N19/20
H04N19/21
H04N19/46
H04N19/463
H04N19/593
H04N19/60
H04N19/61
H04N19/70
H04N19/80
H04N19/90
H04N19/91
【請求項の数】8
【全頁数】22
(21)【出願番号】特願2012-140268(P2012-140268)
(22)【出願日】2012年6月21日
(65)【公開番号】特開2014-7477(P2014-7477A)
(43)【公開日】2014年1月16日
【審査請求日】2015年5月19日
(73)【特許権者】
【識別番号】504202472
【氏名又は名称】大学共同利用機関法人情報・システム研究機構
(74)【代理人】
【識別番号】110000925
【氏名又は名称】特許業務法人信友国際特許事務所
(72)【発明者】
【氏名】チョン ジーン
(72)【発明者】
【氏名】フー ウェイ
【審査官】
畑中 高行
(56)【参考文献】
【文献】
特開2011−228811(JP,A)
【文献】
特開平08−129646(JP,A)
【文献】
特開2007−052644(JP,A)
【文献】
G. Shen et al.,EDGE-ADAPTIVE TRANSFORMS FOR EFFICIENT DEPTH MAP CODING,Picture Coding Symposiun (PCS), 2010,IEEE,2010年12月 8日,p.566-569
(58)【調査した分野】(Int.Cl.,DB名)
H04N1/41−1/419
H04N19/00−19/98
G06T1/00−9/40
(57)【特許請求の範囲】
【請求項1】
濃淡画像を符号化する濃淡画像符号化装置において、
前記濃淡画像の隣り合う画素間のエッジ点を検出し、隣り合うエッジ点を連ねた輪郭を可逆的に符号化する輪郭符号化手段と、
前記輪郭を跨がないように前記輪郭の内側の濃淡画像をローパスフィルタリングした後、ダウンサンプリングすることにより低解像度濃淡画像を取得し、前記低解像度濃淡画像をGBT直交変換して量子化した後にエントロピー符号化する低解像度画像符号化手段と、を有し、
前記符号化された輪郭と前記エントロピー符号化された低解像度濃淡画像との組を、マルチ解像度符号化濃淡画像として出力する
ことを特徴とする濃淡画像符号化装置。
【請求項2】
前記濃淡画像は、Kn×Kn画素(Kは2以上の整数、nは2以上の整数)であり、
前記低解像度画像符号化手段は、着目画素の値を、前記着目画素を中心とする(2K−1)×(2K−1)画素のうち、前記着目画素から前記輪郭を跨がない範囲の画素の加重平均値に変換することにより、前記ローパスフィルタリングを行う、
ことを特徴とする請求項1に記載の濃淡画像符号化装置。
【請求項3】
前記濃淡画像は、Kn×Kn画素(Kは2以上の整数、nは2以上の整数)であり、
前記濃淡画像を(Kn)2次元ベクトルxで表したとき、
前記低解像度画像符号化手段は、
前記濃淡画像上の隣り合う画素を、前記輪郭を跨がないように連結して得られるグラフの隣接行列Aと、その次数行列Dと、で表されるラプラス行列L=D−Aを作成するラプラス行列作成手段と、
前記ラプラス行列Lの固有行ベクトルをその固有値の降順に対応して並べた直交変換行列Eを作成する直交変換行列作成手段と、
ベクトルy=Exの上位n2成分以外を0にしたベクトルy’を求め、これを行列Etで変換したベクトルx’を前記ダウンサンプリングの対象として求めるローパスフィルタリング手段と、
を有することを特徴とする請求項1に記載の濃淡画像符号化装置。
【請求項4】
前記濃淡画像は、Kn×Kn画素(Kは2以上の整数、nは2以上の整数)であり、
前記低解像度濃淡画像は、n×n画素であり、
前記低解像度濃淡画像をn2次元ベクトルuで表したとき、
前記低解像度画像符号化手段は、
前記ダウンサンプリングされた濃淡画像上の隣り合う画素を、前記濃淡画像の隣り合う画素間のエッジ点を1/Kの率でダウンサンプリングしたときのエッジ点を連ねた縮小輪郭を跨がないように連結して得られるグラフの隣接行列A'と、その次数行列D'と、で表されるラプラス行列L'=D'−A'を作成するラプラス行列作成手段と、
前記ラプラス行列L'の固有行ベクトルをその固有値の降順に対応して並べた直交変換行列E'を作成する直交変換行列作成手段と、
前記ベクトルuを、v=E’uなるベクトルvに直交変換する直交変換手段と、を有して、
前記低解像度濃淡画像を前記GBT直交変換することを特徴とする請求項1〜3のいずれか1項に記載の濃淡画像符号化装置。
【請求項5】
濃淡画像の隣り合う画素間のエッジ点を連ねた輪郭が可逆符号化された高解像度符号化データと、前記輪郭を跨がないように前記輪郭の内側の前記濃淡画像がダウンサンプリングされて符号化された低解像度符号化データとの組が、マルチ解像度符号化データとして供給され、前記マルチ解像度符号化データを復号して元の解像度の濃淡画像を再構成する濃淡画像復号装置であって、
濃淡画像記憶部と、
エッジマップ記憶部と、 前記低解像度符号化データを復号し、復号された低解像度濃淡画像をアップサンプリングして前記濃淡画像記憶部に格納する低解像度濃淡画像復号手段と、
前記高解像度符号化データを復号して、前記エッジマップ記憶部内に前記エッジ点の集合であるエッジマップを再構成するエッジマップ復号手段と、
前記低解像度濃淡画像の中の画素をLR画素としたとき、前記アップサンプリングにより挿入された挿入画素を、(1)前記輪郭を跨がず且つ前記挿入画素に隣接するLR画素の加重平均値で補間し、(2)補間されていない挿入画素が残っていれば前記挿入画素を、前記輪郭を跨がず且つ前記挿入画素に隣接する補間された画素の加重平均値で補間する挿入画素補間手段と、
を有することを特徴とする濃淡画像復号装置。
【請求項6】
前記挿入画素補間手段は、
(3)補間されていない挿入画素のそれぞれについて処理(2)を行った後に、この処理(2)で補間された画素とし、
補間されていない挿入画素が無くなるまで、処理(3)を繰り返す、
ことを特徴とする請求項5に記載の濃淡画像復号装置。
【請求項7】
前記アップサンプリングで1画素をK×K画素(Kは2以上の整数)にする場合、前記挿入画素補間手段における、の処理(1)及び(2)での前記隣接する画素は、前記挿入画素を中心とする(2K−1)×(2K−1)画素である、
ことを特徴とする請求項5に記載の濃淡画像復号装置。
【請求項8】
前記元の解像度の濃淡画像は、Kn×Kn画素(Kは2以上の整数、nは2以上の整数)であり、
前記低解像度濃淡画像は、n×n画素であり、
前記低解像度濃淡画像をn2次元ベクトルvで表したとき、
前記低解像度濃淡画像復号手段は、
前記アップサンプリングされた濃淡画像中の挿入画素を除く画素に対応する点の集合のうち隣り合う点を、前記エッジマップ上の隣り合うエッジ点を連ねた輪郭を跨がないように連結したエッジの隣接行列A'とその次数行列D'とで表されるラプラス行列L'=D'−A'を作成するラプラス行列作成手段と、
前記ラプラス行列L'の固有列ベクトルをその固有値の降順に対応して並べた直交逆変換行列E'を作成する直交変換行列作成手段と、
前記低解像度濃淡画像のベクトルvを、u=E’vなるベクトルuに直交逆変換する直交逆変換手段と、
を有し前記ベクトルuは前記アップサンプリングの対象であることを特徴とする請求項5乃至7のいずれか1項に記載の濃淡画像復号装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、濃淡画像符号化装置及び復号装置に係り、特に、シャープな輪郭を有し輪郭内ではスムーズな分布を持つ奥行き画像、X線画像又はアニメーション画像等の濃淡画像(動画又は静止画)に好適な濃淡画像符号化装置及び復号装置に関する。
【背景技術】
【0002】
多視点3D動画データをサーバからクライアントへ送信するシステムでは、クライアント側で、指定した視点に応じて、多視点画像中の選択された2視点の画像が合成されて表示される。このため送信ビットレートが比較的高く、奥行き画像の符号化率を高める必要がある。
【0003】
奥行き画像では一般に、背景と前景の輪郭を横切る線上で値が急変する。DCT変換は、ブロックサイズで空間周波数成分に変換することと、高周波成分の量子化ステップが低周波のそれよりも大きいことから、シャープな輪郭が存在すると、高周波成分の誤差が大きくなって、ブロック全体に影響するノイズ(エイリアス)が発生し、画質が劣化する原因となる。
【0004】
そこで、下記特許文献1では、背景マスクを用い、背景と前景の境界をまたがないように両領域に平滑フィルタを施して、エイリアスの発生を抑制している。
【0005】
また、下記非特許文献1では、輪郭の位置を、画素間の位置で検出することにより、より正確に輪郭を検出し、DCT(Discrete Cosine Transform)変換の替わりにGBT(Graph-Based Transform)変換を用いている。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2007−52644号公報
【非特許文献】
【0007】
【非特許文献1】Godwin Shen, et. al., "EDGE-ADAPTIVE TRANSFORMS FOR EFFICIENT DEPTH MAP CODING," IEEE Picture Coding Symposium, Nagoya, Japan, December 2010
【発明の概要】
【発明が解決しようとする課題】
【0008】
奥行き画像は一般に、シャープな輪郭を有し輪郭内ではスムーズに変化するという性質がある。本発明者は、この性質を利用して、エッジマップは解像度を落とさずに可逆圧縮し、輪郭内はダウンサンプリングして低解像度で圧縮することにより、奥行き画像全体として、画質に対する符号化率を高めることができるであろうということを知見した。この方法は、奥行き画像のみならず、この性質を有する画像、例えば、X線画像やアニメーション画像などの濃淡画像(RGBアニメーション画像の各成分画像は濃淡画像)にも適用可能である。
【0009】
本発明の目的はしたがって、符号化率を向上させることが可能な濃淡画像符号化装置及び復号装置を提供することにある。
【課題を解決するための手段】
【0010】
本発明の第1態様では、濃淡画像を符号化する濃淡画像符号化装置において、
濃淡画像の隣り合う画素間のエッジ点を検出し隣り合うエッジ点を連ねた輪郭を可逆的に符号化する輪郭符号化手段と、
この輪郭を跨がないように、
輪郭の内側の濃淡画像を、ローパスフィルタリングした後、ダウンサンプリングすることにより低解像度濃淡画像を取得し、この低解像度濃淡画像をGBT直交変換し量子化した後にエントロピー符号化する低解像度画像符号化手段とを有し、符号化された輪郭とエントロピー符号化された低解像度濃淡画像との組を、マルチ解像度符号化濃淡画像として出力する。
【0011】
本発明による濃淡画像符号化装置の第2態様では、第1態様において、
濃淡画像は、Kn×Kn画素(Kは2以上の整数、nは2以上の整数)であり、
低解像度画像符号化手段は、着目画素の値を、
着目画素を中心とする(2K−1)×(2K−1)画素のうち、
着目画素から
輪郭を跨がない範囲の画素の加重平均値に変換することにより、
ローパスフィルタリングを行う。
【0012】
本発明による濃淡画像符号化装置の第3態様では、第1態様において、
濃淡画像は、Kn×Kn画素(Kは2以上の整数、nは2以上の整数)であり、
この濃淡画像を(Kn)
2次元ベクトルxで表したとき、
低解像度画像符号化手段は、
濃淡画像上の隣り合う画素を、
その輪郭を跨がないように連結して得られるグラフの隣接行列Aと、その次数行列Dと、で表されるラプラス行列L=D−Aを作成するラプラス行列作成手段と、
このラプラス行列Lの固有行ベクトルをその固有値の降順に対応して並べた直交変換行列Eを作成する直交変換行列作成手段と、
ベクトルy=Exの上位n
2成分以外を0にしたベクトルy’を求め、これを行列E
tで変換したベクトルx’を
ダウンサンプリングの対象として求めるローパスフィルタリング手段とを有する。
【0013】
本発明の濃淡画像復号装置の第1態様は、濃淡画像の隣り合う画素間のエッジ点を連ねた輪郭が可逆符号化された高解像度符号化データと、
輪郭の内側の濃淡画像がダウンサンプリングされて符号化された低解像度符号化データとの組が、マルチ解像度符号化データとして供給され、このマルチ解像度符号化データを復号して元の解像度の濃淡画像を再構成する濃淡画像復号装置であって、
濃淡画像記憶部と、
エッジマップ記憶部と、
低解像度符号化データを復号し、復号された低解像度濃淡画像をアップサンプリングして濃淡画像記憶部に格納する低解像度濃淡画像復号手段と、
高解像度符号化データを復号して、エッジマップ記憶部内にエッジ点の集合であるエッジマップを再構成するエッジマップ復号手段と、
低解像度濃淡画像の中の画素をLR画素としたとき、アップサンプリングにより挿入された挿入画素を、(1)エッジマップ上の隣り合うエッジ点を連ねた輪郭を跨がず且つ挿入画素に隣接するLR画素の加重平均値で補間し、(2)補間されていない挿入画素が残っていればその挿入画素を、
輪郭を跨がず且つ
挿入画素に隣接する補間された画素の加重平均値で補間する挿入画素補間手段とを有する。
【0014】
本発明による濃淡画像復号装置の第2態様では、第1態様において、
挿入画素補間手段は、
(3)補間されていない挿入画素のそれぞれについて処理(2)
を行った後に、この処理(2)で補間された画素とし、
補間されていない挿入画素が無くなるまで処理(3)を繰り返す。
【0015】
本発明による濃淡画像復号装置の第3態様では、第1態様において、
アップサンプリングで1画素をK×K画素(Kは2以上の整数)にする場合、
挿入画素補間手段の処理(1)及び(2)での
隣接する画素は、
挿入画素を中心とする(2K−1)×(2K−1)画素である。
【発明の効果】
【0016】
上記濃淡画像符号化装置の第1態様の構成によれば、一方では濃淡画像の輪郭を可逆的に符号化し、他方では
輪郭の内側の濃淡画像を、輪郭を跨がないようにローパスフィルタリングした後、ダウンサンプリングすることにより低解像度濃淡画像を取得し、この低解像度濃淡画像をGBT直交変換し量子化した後にエントロピー符号化するので、シャープな輪郭を有し輪郭内ではスムーズに変化するという性質を持った濃淡画像に対し、輪郭と輪郭内の画像の性質に適応した解像度で効率よく符号化することが可能となるという効果を奏する。
【0017】
上記第2態様の構成によれば、
低解像度画像符号化手段が、着目画素の値を、
着目画素を中心とする(2K−1)×(2K−1)画素のうち、
着目画素から
その輪郭を跨がない範囲の画素の加重平均値に変換するので、
輪郭に応じて比較的簡単にローパスフィルタリングすることができ、これによりエイリアスを低減することができるという効果を奏する。
【0018】
上記第3態様の構成によれば、
輪郭の内側の濃淡画像上の隣り合う画素を、
その輪郭を跨がないように連結して得られるグラフに基づくGBT変換した後、その後のダウンサンプリングに対応した上位n
2成分以外を0にすることによりローパスフィルタリングするので、エイリアスを低減することができるという効果を奏する。
【0019】
上記濃淡画像復号装置の第1態様の構成によれば、低解像度濃淡画像中の画素をLR画素としたとき
、アップサンプリングにより挿入された挿入画素を、(1)
エッジマップ上の隣り合うエッジ点を連ねた輪郭を跨がず且つ
挿入画素に隣接するLR画素の加重平均値で補間し、(2)補間されていない挿入画素が残っていれば
この挿入画素を、
輪郭を跨がず且つ
挿入画素に隣接する補間された画素の加重平均値で補間するので、輪郭の形状に応じてその影響を受けずに挿入画素を補間することができるという効果を奏する。
【0020】
上記濃淡画像復号装置の第2態様の構成によれば、(3)補間されていない挿入画素のそれぞれについて処理(2)
を行った後に、この処理(2)で補間された画素とし、補間されていない挿入画素が無くなるまで処理(3)を繰り返すので、例えば、
図12においてノード1と3に対応したLR画素の値の平均でノード2に対応した挿入画素を補間した後、この値でノード6に対応した挿入画素を補間するということを避けることができ、すなわち、さらにノード1と9に対応したLR画素の値の平均でノード5に対応した挿入画素を補間した後、ノード2とノード5の画素の値の平均でノード6に対応した挿入画素を補間することができ、これにより画素値の分布がスムーズになってノイズの発生を抑制できるという効果を奏する。
【0021】
上記濃淡画像復号装置の第3態様の構成によれば、任意のアップサンプリング率K(Kは2以上の整数)について、挿入画素を効率よく補間することができるという効果を奏する。
【0022】
本発明の他の目的、特徴的な構成及び効果は、以下の説明を特許請求の範囲及び図面の記載と関係づけて読むことにより明らかになる。
【図面の簡単な説明】
【0023】
【
図1】本発明の実施例1に係る、マルチ解像度の符号化データを生成する濃淡画像符号化装置の概略機能ブロック図である。
【
図2】
図1の装置に対応した濃淡画像復号装置の概略機能ブロック図である。
【
図3】
図1の濃淡画像符号化装置のハードウェア構成を示す概略機能ブロック図である。
【
図4】(A)は濃淡画像の説明図、(B)はエッジ検出前のエッジマップの説明図である。
【
図5】エッジ検出後のエッジマップの説明図である。
【
図6】
図1中のローパスフィルタ部の、GBT変換を用いた構成を示す概略機能ブロック図である。
【
図7】(A)は濃淡画像に対応したグラフのノードとエッジ点との関係を示す説明図であり、(B)はエッジ点を跨がないように4隣接ノード間を連結したグラフを示す図である。
【
図8】(A)及び(B)はそれぞれ、
図7(B)のグラフに対応した隣接行列及びその次数行列の構成の一部を示す説明図である。
【
図9】(A)は
図1中のGBT変換部の構成を示す概略機能ブロック図であり、(B)は
図2中の逆GBT変換部の構成を示す概略機能ブロック図である。
【
図10】(A)〜(C)は低解像度濃淡画像用ラプラス行列作成で用いられるグラフの作成方法説明図である。
【
図11】
図2中のGB補間部による画素補間処理を示す概略フローチャートである。
【
図12】(A)及び(B)は、
図11のステップS1〜S9のループの1回目でのステップS5の補間処理説明図である。
【
図13】(A)及び(B)は、
図11のステップS1〜S9のループの2回目でのステップS5の補間処理説明図である。
【
図14】(A)及び(B)は、
図11のステップS1〜S9のループの3回目でのステップS5の補間処理説明図である。
【
図15】(A)〜(C)は、本発明の実施例2に係るエッジ適応型ローパスフィルタリングの説明図である。
【
図16】
図15に示すエッジ適応型ローパスフィルタリングの変形例の説明図である。
【
図17】(A)及び(B)は、本発明の実施例2に係るGB補間部による補間処理説明図である。
【
図18】本発明の実施例2に係るGB補間部による補間処理説明図である。
【
図19】本発明の実施例2(MR−GBT)と比較対象としての3つの従来法(高解像度(HR)DCT、低解像度(LR)DCT及び高解像度GBT)との実験結果を示すRD曲線図である。
【
図20】本発明の実施例2について、ダウンサンプリング率を1/2、1/3及び1/4にした場合の実験結果を示すRD曲線図である。
【
図21】上記実験での奥行き画像を用いて2視点画像の2視点の中点から見た画像を合成したときの奥行き濃淡画像(左2つ)とRGB画像(右2つ)とを示し、上側は従来の低解像度(LD)DCT、下側は高解像度と低解像度をミックスした本実施例2の場合の画像を示す図である。
【実施例1】
【0024】
図3は、本発明の実施例1に係る濃淡画像符号化装置のハードウェア構成を示す概略ブロック図である。
【0025】
この装置では、MPU(Micro Processing Unit)10がインターフェイス11を介してPROM(Programmable Read-Only Memory)12、DRAM(Dynamic Random Access Memory)13及びDMAC(Direct Memory Access Controller)14に結合されている。PROM12は、例えばフラッシュメモリであり、OS(Operating System)及び濃淡画像符号化のアプリケーションプログラムが格納されている。処理高速化のため、PROM12上のプログラムはDMAC14によりDRAM13上に転送されて実行される。DRAM13は、ワークエリアとしても用いられる。DMAC14は、DRAM13内又はDRAM13と外部との間で濃淡画像、エッジマップ及び符号化されたデータを高速転送する。
【0026】
図3のハードウェアは、ワンチップマイクロコンピュータで構成しても、パーソナルコンピュータやスマートフォンなどのコンピュータの一部で構成してもよい。
【0027】
図1は、マルチ解像度の符号化データを生成する濃淡画像符号化装置の概略機能ブロック図である。
【0028】
濃淡画像記憶部20、エッジマップ記憶部21、HR(高解像度)符号化データ記憶部22、LR(低解像度)符号化データ記憶部23及び量子化ベクトル24はいずれも、DRAM13内の領域であり、その他のブロックは何れも、MPU10が上記プログラムを実行することにより機能する。
【0029】
濃淡画像記憶部20には、
図3の構成の内部(DRAM13)から、又は、外部からインターフェイス11を介して、濃淡画像が格納される。この濃淡画像は、例えばステレオビデオカメラで撮像された互いに接近した画像の対応点をステレオマッチングにより決定した後、幾何学的に奥行きを算出することにより生成される。
【0030】
濃淡画像のサイズは、その輪郭データが映像のマクロブロックでの動き補償処理等で利用されることを考慮して、本実施例ではマクロブロックと同一、例えば、8X8画素となっている。しかし、以下の説明から明らかなように、本願発明は、原理的にはブロックサイズに依存せず、任意のブロックサイズ(フレームサイズを含む)に適用できる。
【0031】
図1に戻って、本実施例1の第1の特徴は、奥行き画像のような濃淡画像の、シャープな輪郭を有し輪郭内ではスムーズに変化するという性質を利用し、HR輪郭符号化部30でエッジマップを可逆符号化し、すなわち解像度を落とさずに符号化し、LR画像符号化部40で濃淡画像をダウンサンプリングすることにより低解像度(LR)で符号化するというマルチ解像度符号化することにより、全体として、画質に対する符号化率を高める点である。
【0032】
HR輪郭符号化部30では、エッジ検出部31で、濃淡画像201の隣り合う画素間のエッジ点を検出してエッジマップを生成し、これをエッジマップ記憶部21に格納する。
【0033】
図4(A)は、濃淡画像記憶部20内の濃淡画像201の説明図であり、簡単化の為に、1ブロックが4×4画素である場合を示している。この図中、画素d(j,k)、j=0〜3、k=0〜3は、位置(j,k)での濃淡値である。
【0034】
エッジ検出部31は、左右上下に隣り合う4画素(4隣接画素)間のそれぞれについて、画素間の差分の絶対値が閾値以上であれば、その画素間にエッジ点が存在すると判定する。
図4(A)には、理解を容易にするため、画素間のエッジを太線で示している。例えば|画素d(0,2)−d(0,3)|≧Ethであり、ここにEthは正の閾値である。
【0035】
図4(B)は、濃淡画像201に対応したエッジマップ記憶部21内のエッジマップ211を示す。
【0036】
エッジマップ211は、画素数が濃淡画像201の2×2倍のビットマップである。この図中のハッチングを施した矩形は、濃淡画像201内の画素に対応したビットを表しており、×印を付した矩形(斜め隣接画素間)は、エッジ点判定対象外のビットであることを示している。すなわち、白抜きの矩形(jが偶数の場合にはkが偶数のビットのみ、jが奇数の場合にはkが偶数のビットのみ)に相当するエッジビットに、エッジ点有無の判定結果‘1’又は‘0’が格納される。
【0037】
図
5はエッジ判定結果が格納された状態を示す。この図中のドットは、エッジ点有り(ビットが‘1’)を示しており、それぞれ
図4(A)中の太線に対応している。
【0038】
可逆符号化部32は、このエッジマップを可逆的に圧縮し、すなわち例えば、エッジマップをランレングス符号化し、又は、エッジ点の連鎖を差分チェインコードで表した後にハフマン符号化若しくは算術符号化し、その結果をHR符号化データ記憶部22に格納する。
【0039】
LR濃淡画像符号化部40では、エッジ適応型ローパスフィルタ部41が、濃淡画像記憶部20内の濃淡画像201を、エッジ点を跨がないようにローパスフィルタリングする。例えば、エッジ点を跨がないように1画素ずつ走査しながらガウスフィルタなどの平滑フィルタを施してローパスフィルタリングし、又は、
図6に示すようなGBT変換を用いてローパスフィルタリングする。これは、次にダウンサンプリングしたときに、エイリアスの発生を抑制するためである。
【0040】
次に、本実施例1の第2の特徴である
図6の構成を、
図7及び
図8を参照して説明する。
【0041】
グラフは、ノードの集合と、ノード間の連結を示すエッジの集合とで表される。
図7(A)は、
図5中のハッチングを施した画素に対応するノードを○印で示し、
図5中のエッジ点であるドットをそのまま転記したものである。4隣接ノード間を、エッジ点を跨がないように連結し、ドットを省略すると、
図7(B)に示す如くなる。この図では、ノードを左上からのラスタスキャン順に、シリアル番号1〜16をノードにラベル付けしている。
【0042】
図8(A)は、
図7(B)の隣接行列Aの一部を示す。
【0043】
隣接行列Aは、次数がノード数に等しく、16X16行列である。隣接行列Aの第i行第j列の要素Aijの値は、
図7(B)のグラフ上でノードiとノードjが連結されていれば1、そうでなければ0となり、隣接行列Aは対象行列である。i、jはいずれも上記ラベルである。
【0044】
図8(B)は、この隣接行列Aの次数行列Dの一部を示す。
【0045】
次数行列Dは、隣接行列Aと同じく16X16行列であり、対角行列であって、対角要素Diiの値は、隣接行列Aの第i行の要素の値の総和に等しい。
【0046】
ラプラス行列L=D−Aは、D−Aの内容を直接作成することもできる。また、
図7(B)のグラフは、
図5のエッジマップ211に対応しているので、グラフを作成せずにエッジマップ211に基づいてラプラス行列Lを作成することもできる。
【0047】
図6に戻って、ラプラス行列作成部410は、エッジマップ記憶部21内のエッジマップ211に基づいてラプラス行列Lを作成する。
【0048】
変換行列作成部411は、ラプラス行列Lの固有行ベクトルをその固有値の降順に対応して並べた直交変換行列E及びその逆行列に等しい転置行列E
tを作成する。
【0049】
ここで、濃淡画像201上の画素d(j,k)、j=0〜3、k=0〜3を、
図7(B)中のノードのラベル順に並べた列ベクトルをベクトルxとする。
【0050】
変換部412は、ベクトルxを変換行列Eでベクトルy=Exに変換(GBT変換)する。この変換を行う理由は、次にローパスフィルタ413で、ベクトルyの上位8成分以外(第9行以降)を0にしたベクトルy’を求めることにより、ローパスフィルタリングするためである。換言すれば、変換行列Eはこのような性質をもっている。逆変換部414は、ベクトルy’を変換行列Eの逆行列であるE
tで変換したベクトルx’を出力する。
【0051】
このような処理により、ベクトルx’は、ベクトルxに対しエッジ点を跨がずに、ローパスフィルタリングを施した画像となる。
【0052】
図1に戻って、ダウンサンプリング部42は、ベクトルx’の成分を、
図7(B)の行及び列に関し1行おき及び1列おきに(2X2画素に1画素の割合で)ダウンサンプリングして、すなわちラベルが1、3、9及びインターフェイス11の成分のみ取り出して、4行の列ベクトルuで表される低解像度濃淡画像にする。
【0053】
GBT変換部43は、列ベクトルuをGBT変換してベクトルvにする。
【0054】
図9(A)は、GBT変換部43の構成を示す。機能ブロック430〜432はそれぞれ、
図6の機能ブロック410〜412に対応している。但し、ラプラス行列L’は4X4である。ラプラス行列作成部430でグラフを作成する場合、
図10(A)に網掛け表示した、ラベルが上記1、3、9及び11のノードを取り出して、
図10(B)に示すように連結関係を維持し、
図10(C)に示すようラベルを付け替えればよい。
【0055】
図1に戻って、量子化部44は、ベクトルvを量子化する。すなわち、ベクトルvに対応した量子化ベクトル24が予め設定されており、DCT変換の場合と同様に、vの各成分を量子化ベクトル24の対応する成分(量子化ステップ)で量子化する。エントロピー符号化部45は、ベクトルvの成分を順次、出現確率に基づき符号化する。
【0056】
GBT変換部43は、量子化部44での処理により値が0になる成分を多くして(出現確率を大きくして)、エントロピー符号化部45での符号化率を高めるためのものであり、この点は、同じ直交変換であるDCTの場合と同様である。
【0057】
次に、濃淡画像符号化装置に対応した濃淡画像復号装置について説明する。
【0058】
濃淡画像復号装置のハードウェア構成は、
図3と同じであるので、その説明を省略する。
【0059】
図2は、濃淡画像復号装置の概略機能ブロック図である。
【0060】
濃淡画像記憶部50、エッジマップ記憶部51、HR符号化データ記憶部52及びLR符号化データ記憶部53はいずれも、DRAM13内の領域であり、その他のブロックは何れも、MPU10が上記プログラムを実行することにより機能する。
【0061】
HR符号化データ記憶部52、LR符号化データ記憶部53及び量子化ベクトル54にはそれぞれ、
図3の構成の内部(DRAM13)から、又は、外部からインターフェイス11を介して、
図1のHR符号化データ記憶部22、LR符号化データ記憶部23及び量子化ベクトル24の内容が格納される。
【0062】
復号部60は、HR符号化データ記憶部52内のデータを復号して、エッジマップ記憶部51内にエッジマップを再構成する。
【0063】
LR濃淡画像復号部70において、エントロピー復号部71は、LR符号化データ記憶部53内のデータを復号し、逆量子化部72はその結果を、量子化ベクトル54で逆量子化して、ベクトルvを再構成する。
【0064】
図9(B)は、このベクトルvを変換する逆GBT変換部73の構成を示す概略機能ブロック図である。
【0065】
逆GBT変換部73は、GBT変換部43のラプラス行列作成部430と同一構成のラプラス行列作成部730を備え、エッジマップ記憶部51内のエッジマップに基づいてラプラス行列L'を作成する。逆変換行列作成部731は、変換行列作成部431と同様にして、変換行列E'を転置した変換行列E'
-1を作成する。逆変換部732は、この変換行列E'
-1でベクトルvをベクトルuに変換する。
【0066】
図2に戻って、アップサンプリング部74は、ベクトルuをアップサンプリングして濃淡画像記憶部50に格納する。これにより、濃淡画像記憶部50には、挿入され画素値が欠落している画素(挿入画素)を含むLR濃淡画像が得られる。
【0067】
GB補間部75は、前記格納の完了に応答して、エッジマップ記憶部51内のエッジマップに基づき、上記
図7(B)と同一の
図10(C)に示すグラフを作成し、網掛けが表示されていない挿入画素を、直接連結された(エッジ点を跨がず隣接する)ノードの値又は平均値で補間する。すなわち、輪郭の形に応じて補間を行う。この点が、本実施例1の第3の特徴である。
【0068】
ノードのラベルiは、画素d(j,k)と、
j=[(i−1)/4]、k=(i−1) mod 4
の関係にある。ここに、[]は小数点以下を切り捨てて整数化する演算子であり、modは剰余演算子である。
【0069】
以下の処理で用いるため、各ノードに、挿入画素であるか否か(低解像度(LR)画素でないかLR画素か)を示すフラグ及び挿入画素については補間されたか否かを示すフラグを対応付けておく。
【0070】
図11は、GB補間部75による処理を示す概略フローチャートである。以下、括弧内は
図11中のステップ識別符号である。
【0071】
(S0)ブロック内の全挿入画素数12をダウンカウンタCに代入する。
【0072】
(S1)走査ラベルiに、初期値2を代入する。
【0073】
(S2)ラベルiのノードへ移動する。
【0074】
(S3)このノードが挿入画素のノードであればステップS4へ進み、そうでなければステップS7へ進む。
【0075】
(S4)このノードに直接連結された、挿入画素でないノード(ノードr)が1以上存在すれば、ステップS5へ進み、そうでなければステップS7へ進む。
【0076】
(S5)このノードiに対応する画素d(j,k)を、ノードrが複数の場合にはそれぞれに対応した画素d(p,q)の平均値で補間し、ノードrが1個の場合にはこれに対応した画素d(p,q)の値で補間する。iの値を記憶しておく。
【0077】
(S6)ダウンカウンタCを1だけデクリメントし、iを1だけインクリメントする。
【0078】
(S7)i>16であればステップS8へ進み、そうでなければステップS2へ戻る。
【0079】
(S8)C=0であれば補間処理を終了し、そうでなければステップS9へ進む。
【0080】
(S9)ステップS5で記憶した各iのノードを、挿入画素でないノードとし(上記フラグをセットし)、ステップS1へ戻る。
【0081】
図12(A)は、
図11のステップS1〜S9のループの1回目でのステップS5の補間処理を示しており、矢印の始点の画素で、矢印の終点の画素が補間されることを示している。
図12(B)はステップS9の処理が行われた後の状態を示す。
【0082】
図13(A)は、上記ループの2回目でのステップS5の補間処理を示している。2回目以降は、補間された画素による補間となる。
図13(B)は、ステップS9の処理が行われた後の状態を示す。
【0083】
図14(A)は、上記ループの3回目でのステップS5の補間処理を示している。
図14(B)は、ステップS9の処理が行われた後の状態を示す。
【0084】
以上において、ダウンサンプリング部42によるダウンサンプリング率が1/2である場合を説明したが、これを1/K、すなわち、Kn×Kn濃淡画像(Kは2以上の整数、nは2以上の整数)をKxK画素に1画素の割合でダウンサンプリングにする場合の構成は、ローパスフィルタ413において、ベクトルyの上位n
2成分以外を0にしたベクトルy’を求めることにより、ローパスフィルタリングすること以外は、以上の説明から明らかであるので、その説明を省略する。
【0085】
なお、ラプラス行列作成の場合と同様に、グラフを作成せずにエッジマップに基づいて
図11の処理を行うこともできる。
【0086】
また、
図1の符号化部30及び
図2の復号部60はそれぞれ、フレーム単位でエッジマップの符号化及び復号を行い、GB補間部75においてもフレーム単位で補間処理を行ってもよい。この場合、フレーム全体としてより適切に補間することができる。
【0087】
本実施例1の濃淡画像符号化装置によれば、一方ではエッジ検出部31で濃淡画像のエッジマップを生成し、これを可逆符号化部32で符号化し、他方では濃淡画像を、エッジマップ211上の輪郭を跨がないようにローパスフィル部41でフィルタリングした後、ダウンサンプリング部42でダウンサンプリングすることにより低解像度濃淡画像を取得し、該低解像度濃淡画像をGBT直交変換部43で変換し量子化した後にエントロピー符号化部45で符号化するので、シャープな輪郭を有し輪郭内ではスムーズに変化するという性質を持った濃淡画像に対し、輪郭と輪郭内の画像の性質に適応した解像度で効率よく符号化することが可能となるという効果を奏する。
【0088】
また、GBT直交変換部43で濃淡画像に対し、輪郭を跨がないように隣り合う点を連結したグラフに基づく直交変換をした後、その後のダウンサンプリングに対応した上位n
2成分以外を0にすることによりローパスフィルタリングするので、エイリアスを低減することができるという効果を奏する。
【0089】
さらに、低解像度濃淡画像中の画素をLR画素としたとき、アップサンプリングにより挿入された挿入画素を、
図11のステップS1〜S9のループの1回目で、エッジマップ上のエッジ点を跨がず且つ挿入画素に隣接するLR画素の値又は平均値で補間し、このループの2回目以降で、補間されていない挿入画素を、エッジマップ上のエッジ点を跨がず且つ挿入画素に隣接する補間された画素の値又は平均値で補間するので、輪郭の形状に応じてその影響を受けずに挿入画素を補間することができるという効果を奏する。
【0090】
また、図のステップS9の処理により、例えば、
図12においてノード1と3に対応したLR画素の値の平均でノード2に対応した挿入画素を補間した後、この値でノード6に対応した挿入画素を補間するということを避けることができ、すなわち、さらにノード1と9に対応したLR画素の値の平均でノード5に対応した挿入画素を補間した後、ノード2とノード5の画素の値の平均でノード6に対応した挿入画素を補間することができ、これにより画素値の分布がスムーズになって、ノイズの発生を抑制できるという効果を奏する。
【実施例2】
【0091】
図15(A)〜(C)は、本発明の実施例2に係るエッジ適応型ローパスフィルタリング部による処理の説明図である。
【0092】
このローパスフィルタリング部は、
図6のエッジ適応型ローパスフィルタ部41の替わりに用いられ、空間フィルタの一種である平滑化フィルタとして、矩形で示すサイズ3×3の平均値フィルタを用いている。
図15(A)は、着目画素d(1、3)に平均値フィルタを施している状態を示しており、フィルタ領域内に含まれる画素のうち、着目画素から輪郭を跨がない範囲の画素をフィルタリングの対象とする。すなわち、この例では画素値d(1,3)をd’(1,3)={w・d(1,3)+d(0,3)+d(2,3)+d(2,2)+d(1,2)}/(4+w)に変換し(d(1,3)は書き換えない)、変換後の記憶部にこれを書き込む。wは1であってもよい。着目画素から見た斜め方向の画素については、エッジ点を
図4のような線分に置き換えたときの輪郭を、該着目画素から該斜め方向の画素への直線が跨ぐか否か判定し、跨がないとき、平均化の対象画素とする。
【0093】
同様に
図15(B)では、画素値d(1,1)をd’(1,1)={w・d(1,1)+d(0,1)+d(0,2)+d(2,0)+d(1,0)+d(0,0)}/(5+w)に変換し、該変換後の記憶部にこれを書き込む。
図15(C)は、輪郭が
図15(B)のそれと異なる場合を示しており、この場合、画素値d(1,1)をd’(1,1)={w・d(1,1)+d(0,1)+d(0,2)+d(1,0)+d(0,0)}/(4+w)に変換する。
【0094】
以上のようにして、該変換後の記憶部に、ローパスフィルタリングされたブロック画像が得られ、これに対し、
図1のダウンサンプリング部42がダウンサンプリングし、上記ベクトルuに変換する。
【0095】
図16は、
図15のローパスフィルタリングの変形例の説明図である。
【0096】
この変形例では、
図7(B)のグラフに含まれる2つの部分グラフの各ノードに、部分グラフ識別番号をラベルとして付与している。画像に対応してグラフにも図示のように平均値フィルタを対応させ、着目画素に対応したノードのラベルと同一の部分グラフ識別番号を有するノードに対応した画素を、平均値フィルタによる平均化対象画素(輪郭を股がない画素)とする。他の点は、上記の処理と同一である。
【0097】
ここで、本実施例2では、
図1の符号化部30及び
図2の復号部60はそれぞれ、フレーム単位でエッジマップの符号化及び復号を行う。
【0098】
図17(A)、(B)及び
図18は、本発明の実施例2に係るGB補間部による補間処理の説明図である。
【0099】
この補間処理も、フレーム単位で行うが、説明の簡単化のため、
図17(A)、(B)及び
図18では、1ブロックに対する補間処理を示している。
【0100】
図11と同様にアップサンプリングされた濃淡画像上の挿入画素及びこれに対応するグラフ上のノードを走査しながら、サイズ3×3の平均値補間フィルタを施して、着目している挿入画素の補間値を求める。
図17(A)は、ラベルが2のノード(着目ノード2)に平均値補間フィルタを対応させた状態を示す。以下ではラベル値iのノードに対応した画素値をd(<i>)と表記する。d(<i>)を、このフィルタ内の、挿入画素でないノードに対応した画素値の加重平均値として求める。重みwは、着目画素からの距離に反比例した値とする。
【0101】
図17(A)では、着目ノード2に対応した画素値d(<2>)を、d(<2>)={d(<1>)+d(<3>)}/2と決定し、
図17(B)では、着目ノード6に対応した画素値d(<6>)を、d(<6>)={d(<1>)+d(<3>)+d(<9>)}/3と決定する。
【0102】
このようにして濃淡画像を1回走査すると、
図18に示すようにノード4に対応した画素値d(<4>)のみが未定となる。2回目の走査で、d(<4>)をd(<4>)={d(<8>)+d(<7>)/√2}/(1+√2)と決定する。
【0103】
他の点は、実施例1と同一である。
【0104】
本実施例2において、アップサンプリング部によるアップサンプリング率が2である場合を説明したが、これをK、すなわち1画素をKxK画素にアップサンプリングにする場合、上記平均値フィルタ及び平均値補間フィルタのサイズをいずれも(2K−1)×(2K−1)とする。
【0105】
次に、本実施例2の実験結果を説明する。
【0106】
H.264/AVC規格の下で奥行き画像を符号化し、復号した。量子化ベクトル54の各成分の値を互いに同一にし、その値が24、28、32及び36の場合についてRD(Rate-Distortion)曲線を求めた結果を
図19及び
図20に示す。
【0107】
図19は、本実施例2(MR−GBT)と比較対象としての3つの従来法HR−DCT、LR−DCT及びHR−GBTとの実験結果を示す。ここにHRは、ダウンサンプリングを行わなかったことを示し、LRは、エンコーダ側で、ガウスフィルタによりローパスフィルタリングした後、ダウンサンプリングを行い、デコーダ側で、アップサンプリングし、全変動正則化補間を行ったことを示す。本実施例2(MR−GBT)と従来のLR−DCTのダウンサンプリング率はいずれも1/2にした。
【0108】
本実施例2の符号化方法は、従来のHR−DCTと同一のPSNR値で比較して、ビットレートを68%低減(実施例1の場合、67%低減)することができた。また、従来のHR−GBTと同一のPSNR値で比較して、ビットレートを55%低減(実施例1の場合、54%低減)することができた。
【0109】
図21は、上記実験での奥行き画像を用いて2視点画像の2視点の中点から見た画像を合成したときの奥行き濃淡画像(左2つ)とRGB画像(右2つ)であり、上側はLD−DCT、下側はMR−GBTの場合の画像を示す。LR−DCT法は本実施例1のMR−GBTよりもブロックノイズが多く、また、本実施例2の方がLR−DCT法よりも映像がより明瞭である。
【0110】
図20は、本実施例2について、ダウンサンプリング率を1/2、1/3及び1/4にした場合の実験結果を示す。ダウンサンプリング率の値が小さくなるほど高圧縮となり画質が低下するが、ダウンサンプリング率をどこまで小さくすべきかは、奥行き画像の輪郭内スムーズさにより異なる。
【0111】
以上において、本発明の好適な実施例を説明したが、本発明には他にも種々の変形例が含まれ、上記実施例で述べた各構成要素の機能を実現する他の構成を用いたもの、当業者であればこれらの構成又は機能から想到するであろう他の構成も、本発明に含まれる。
【0112】
例えば、上記実施例1、2ではGBT変換のグラフにおいて、最大4隣接エッジ点を連結する場合を説明したが、
図5中のX印を付したビットを有効にして、すなわち
図5で斜め方向に隣接する画素間についてもエッジを検出し、グラフ上で最大8隣接エッジ点を連結したもののラプラス行列を用い、
図11の補間処理においてもこのグラフを用いる構成であってもよい。
【符号の説明】
【0113】
10 MPU
11 インターフェイス
12 PROM
13 DRAM
14 DMAC
20、50 濃淡画像記憶部
201 濃淡画像
21、51 エッジマップ記憶部
211 エッジマップ
22、52 HR符号化データ記憶部
23、53 LR符号化データ記憶部
24、54 量子化ベクトル
30 HR輪郭符号化部
31 エッジ検出部
32 可逆符号化部
40 LR濃淡画像符号化部
41 ローパスフィルタ部
410、430、730 ラプラス行列作成部
411、431 変換行列作成部
412、432 変換部
413 ローパスフィルタ
414 逆変換部
42 ダウンサンプリング部
43 GBT変換部
44 量子化部
45 エントロピー符号化部
60 復号部
70 LR濃淡画像復号部
71 エントロピー復号部
72 逆量子化部
73 逆GBT変換部
731 逆変換行列作成部
732 逆変換部
74 アップサンプリング部
75 GB補間部
A 隣接行列
L、L' ラプラス行列
E、E' 変換行列
x、x'、y、y' ベクトル