(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6029984
(24)【登録日】2016年10月28日
(45)【発行日】2016年11月24日
(54)【発明の名称】分類ベースのループ・フィルタのための方法と装置
(51)【国際特許分類】
H04N 19/117 20140101AFI20161114BHJP
H04N 19/136 20140101ALI20161114BHJP
H04N 19/176 20140101ALI20161114BHJP
H04N 19/82 20140101ALI20161114BHJP
【FI】
H04N19/117
H04N19/136
H04N19/176
H04N19/82
【請求項の数】28
【全頁数】23
(21)【出願番号】特願2012-557038(P2012-557038)
(86)(22)【出願日】2011年3月2日
(65)【公表番号】特表2013-522956(P2013-522956A)
(43)【公表日】2013年6月13日
(86)【国際出願番号】US2011000394
(87)【国際公開番号】WO2011112237
(87)【国際公開日】20110915
【審査請求日】2014年2月24日
(31)【優先権主張番号】61/312,063
(32)【優先日】2010年3月9日
(33)【優先権主張国】US
(73)【特許権者】
【識別番号】501263810
【氏名又は名称】トムソン ライセンシング
【氏名又は名称原語表記】Thomson Licensing
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100091214
【弁理士】
【氏名又は名称】大貫 進介
(72)【発明者】
【氏名】シユウ,チヤン
(72)【発明者】
【氏名】ジエン,ユンフエイ
(72)【発明者】
【氏名】イン,ペン
(72)【発明者】
【氏名】ルウ,シヤオアン
(72)【発明者】
【氏名】ソレ,ジヨエル
【審査官】
岩井 健二
(56)【参考文献】
【文献】
特開2006−032999(JP,A)
【文献】
特開2003−179933(JP,A)
【文献】
国際公開第2009/133844(WO,A1)
【文献】
国際公開第2009/110559(WO,A1)
【文献】
国際公開第2009/110160(WO,A1)
【文献】
国際公開第2009/074117(WO,A1)
【文献】
国際公開第2008/084745(WO,A1)
【文献】
国際公開第2008/075247(WO,A1)
【文献】
国際公開第2007/111292(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 19/00 − 19/98
(57)【特許請求の範囲】
【請求項1】
入力画像の残差を変換し量子化して量子化変換係数を得、前記量子化変換係数を逆量子化し逆変換して前記残差の再構成バージョンを得、前記残差の前記再構成バージョンと少なくとも1つの参照画像とを合成して前記入力画像の再構成バージョンを得ることによって前記入力画像を処理するビデオ符号器を有し、
前記ビデオ符号器は、局所的な幾何学的特徴に応じた複数のカテゴリのうちのそれぞれのカテゴリ内で前記入力画像の前記再構成バージョン内の画素を分類し、少なくとも1つの選択された画素を、前記複数のカテゴリについて、前記少なくとも1つの画素の対応する分類に応じてフィルタ処理する第1のフィルタを含み、
前記第1のフィルタによる前記フィルタ処理が、ブロック適応ループ・フィルタ処理、あるいは、クアッドツリー(四分木)適応ループ・フィルタ処理と共に行われ、
エッジ検出が前記入力画像の再構成バージョンに適用され、検出された非オブジェクト・ベースのエッジの画素が、方向、大きさ、または、傾度、および前記エッジが異方性であるか等方性であるかを含む前記局所的な幾何学的特徴に基づいて異なるグループあるいはカテゴリに分類され、前記画素に対し、特定のグループに分類される全ての画素に対して選択されている係数を有するフィルタによってフィルタ処理が行われる、装置。
【請求項2】
フィルタ係数が、適応的であり、前記複数のカテゴリのうちの少なくとも1つのカテゴリ内でのフィルタ処理の改善パフォーマンスの提供に応じて選択される、請求項1に記載の装置。
【請求項3】
前記改善パフォーマンスが、前記入力画像と前記入力画像の前記再構成バージョンとの間の歪み測度を最小にすることによって提供される、請求項2に記載の装置。
【請求項4】
前記少なくとも1つの画素の前記分類が、前記少なくとも1つの画素に対応する、方向、大きさ、異方性/等方性、コントラスト、及び、傾度のうちの少なくとも1つに応じて決定される、請求項1に記載の装置。
【請求項5】
フィルタ係数が、画像毎に適応的に調整されて、1つ以上の高レベルのシンタックス要素を使用して示される、請求項1に記載の装置。
【請求項6】
フィルタ係数が、オフラインで調整されて、前記ビデオ符号器と対応するビデオ復号器との双方に記憶される、請求項1に記載の装置。
【請求項7】
前記フィルタ処理が、ブロック適応ループ・フィルタ処理、あるいは、クアッドツリー(四分木)適応ループ・フィルタ処理と共に行われる、請求項1に記載の装置。
【請求項8】
ビデオ符号器における方法であって、
入力画像を符号化するステップを含み
前記符号化するステップは、
前記入力画像の残差を変換し量子化して量子化変換係数を得るステップと、
前記量子化変換係数を逆量子化し逆変換して前記残差の再構成バージョンを得るステップと、
前記残差の前記再構成バージョンと少なくとも1つの参照画像とを合成して前記入力画像の再構成バージョンを得るステップと、
局所的な幾何学的特徴に応じた複数のカテゴリのうちのそれぞれのカテゴリ内で前記入力画像の前記再構成バージョン内の画素を分類するステップと、
少なくとも1つの選択された画素に対し、前記複数のカテゴリについて、前記少なくとも1つの画素の対応する分類に応じて第1のフィルタ処理を行うステップと、を含み、
前記第1のフィルタ処理が、ブロック適応ループ・フィルタ処理、あるいは、クアッドツリー(四分木)適応ループ・フィルタ処理と共に行われ、
エッジ検出が前記入力画像の再構成バージョンに適用され、検出された非オブジェクト・ベースのエッジの画素が、方向、大きさ、または、傾度、および前記エッジが異方性であるか等方性であるかを含む前記局所的な幾何学的特徴に基づいて異なるグループあるいはカテゴリに分類され、前記画素に対し、特定のグループに分類される全ての画素に対して選択されている係数を有するフィルタによってフィルタ処理が行われる、前記方法。
【請求項9】
フィルタ係数が、適応的であり、前記複数のカテゴリのうちの少なくとも1つのカテゴリ内でのフィルタ処理の改善パフォーマンスの提供に応じて選択される、請求項8に記載の方法。
【請求項10】
前記改善パフォーマンスが、前記入力画像と前記入力画像の前記再構成バージョンとの間の歪み測度を最小にすることによって提供される、請求項9に記載の方法。
【請求項11】
前記少なくとも1つの画素の前記分類が、前記少なくとも1つの画素に対応する、方向、大きさ、異方性/等方性、コントラスト、及び、傾度のうちの少なくとも1つに応じて決定される、請求項8に記載の方法。
【請求項12】
フィルタ係数が、画像毎に適応的に調整されて、1つ以上の高レベルのシンタックス要素を使用して示される、請求項8に記載の方法。
【請求項13】
フィルタ係数が、オフラインで調整されて、前記ビデオ符号器と対応するビデオ復号器との双方に記憶される、請求項8に記載の方法。
【請求項14】
前記フィルタ処理が、ブロック適応ループ・フィルタ処理、あるいは、クアッドツリー(四分木)適応ループ・フィルタ処理と共に行われる、請求項8に記載の方法。
【請求項15】
量子化変換係数を受信し、前記量子化変換係数を逆量子化し逆変換して残差の再構成バージョンを得、前記残差の前記再構成バージョンと少なくとも1つの参照画像とを合成して当該画像の再構成バージョンを得ることによって前記画像を処理するビデオ復号器を有し、
前記ビデオ復号器は、局所的な幾何学的特徴に応じた複数のカテゴリのうちのそれぞれのカテゴリ内で前記画像の前記再構成バージョン内の画素を分類し、少なくとも1つの選択された画素を、前記複数のカテゴリについて、前記少なくとも1つの画素の対応する分類に応じてフィルタ処理する第1のフィルタを含み、
前記第1のフィルタによる前記フィルタ処理が、ブロック適応ループ・フィルタ処理、あるいは、クアッドツリー(四分木)適応ループ・フィルタ処理と共に行われ、
エッジ検出が入力画像の再構成バージョンに適用され、検出された非オブジェクト・ベースのエッジの画素が、方向、大きさ、または、傾度、および前記エッジが異方性であるか等方性であるかを含む前記局所的な幾何学的特徴に基づいて異なるグループあるいはカテゴリに分類され、前記画素に対し、特定のグループに分類される全ての画素に対して選択されている係数を有するフィルタによってフィルタ処理が行われる、装置。
【請求項16】
フィルタ係数が、適応的であり、前記複数のカテゴリのうちの少なくとも1つのカテゴリ内でのフィルタ処理の改善パフォーマンスの提供に応じて選択される、請求項15に記載の装置。
【請求項17】
前記改善パフォーマンスが、前記画像と前記画像の前記再構成バージョンとの間の歪み測度を最小にすることによって提供される、請求項16に記載の装置。
【請求項18】
前記少なくとも1つの画素の前記分類が、前記少なくとも1つの画素に対応する、方向、大きさ、異方性/等方性、コントラスト、及び、傾度のうちの少なくとも1つに応じて決定される、請求項15に記載の装置。
【請求項19】
フィルタ係数が、画像毎に適応的に調整されて、1つ以上の高レベルのシンタックス要素を使用して示される、請求項15に記載の装置。
【請求項20】
フィルタ係数が、オフラインで調整されて、ビデオ符号器と対応する前記ビデオ復号器との双方に記憶される、請求項15に記載の装置。
【請求項21】
前記フィルタ処理が、ブロック適応ループ・フィルタ処理、あるいは、クアッドツリー(四分木)適応ループ・フィルタ処理と共に行われる、請求項15に記載の装置。
【請求項22】
ビデオ復号器における方法であって、
画像を復号するステップを含み、
前記復号するステップは、
量子化変換係数を受信するステップと、
前記量子化変換係数を逆量子化し逆変換して残差の再構成バージョンを得るステップと、
前記残差の前記再構成バージョンと少なくとも1つの参照画像とを合成して当該画像の再構成バージョンを得るステップと、
局所的な幾何学的特徴に応じた複数のカテゴリのうちのそれぞれのカテゴリ内で前記画像の前記再構成バージョン内の画素を分類するステップと、
少なくとも1つの選択された画素に対し、前記複数のカテゴリについて、前記少なくとも1つの画素の対応する分類に応じて第1のフィルタ処理を行うステップと、を含み、
前記第1のフィルタ処理が、ブロック適応ループ・フィルタ処理、あるいは、クアッドツリー(四分木)適応ループ・フィルタ処理と共に行われ、
エッジ検出が入力画像の再構成バージョンに適用され、検出された非オブジェクト・ベースのエッジの画素が、方向、大きさ、または、傾度、および前記エッジが異方性であるか等方性であるかを含む前記局所的な幾何学的特徴に基づいて複数の異なるグループあるいはカテゴリに分類され、前記画素に対し、特定のグループに分類される全ての画素に対して選択されている係数を有するフィルタによってフィルタ処理が行われる、前記方法。
【請求項23】
フィルタ係数が、適応的であり、前記複数のカテゴリのうちの少なくとも1つのカテゴリ内でのフィルタ処理の改善パフォーマンスの提供に応じて選択される、請求項22に記載の方法。
【請求項24】
前記改善パフォーマンスが、前記画像と前記画像の前記再構成バージョンとの間の歪み測度を最小にすることによって提供される、請求項23に記載の方法。
【請求項25】
前記少なくとも1つの画素の前記分類が、前記少なくとも1つの画素に対応する、方向、大きさ、異方性/等方性、コントラスト、及び、傾度のうちの少なくとも1つに応じて決定される、請求項22に記載の方法。
【請求項26】
フィルタ係数が、画像毎に適応的に調整されて、1つ以上の高レベルのシンタックス要素を使用して示される、請求項22に記載の方法。
【請求項27】
フィルタ係数が、オフラインで調整されて、ビデオ符号器と対応する前記ビデオ復号器との双方に記憶される、請求項22に記載の方法。
【請求項28】
前記フィルタ処理が、ブロック適応ループ・フィルタ処理、あるいは、クアッドツリー(四分木)適応ループ・フィルタ処理と共に行われる、請求項22に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
(関連出願のクロスリファレンス)
本出願は、2010年3月9日に提出された米国仮出願第61/312063号の利益を主張し、この米国仮出願の全体はこの参照によって本明細書に組み込まれる。
【0002】
本原理は、概して、ビデオ符号化とビデオ復号に関し、更に詳しくは、分類ベースの(分類に基づく)ループ・フィルタのための方法と装置に関する。
【背景技術】
【0003】
現行のビデオ符号化規格は、ブロック・ベースの(ブロックに基づく)変換(例えば、離散コサイン変換(DCT))と動き補償とを採用して圧縮効率を上げている。フレームワーク内に於ける圧縮は損失が大きいという性質があるので、再構成されたビデオの品質は必ず劣化し、決して完全には元の映像に復元できない。従って、損失が大きいビデオ圧縮と効率改善との間でトレードオフが為されている。
【0004】
国際標準化機構/国際電気標準会議(ISO/IEC)ムービング・ピクチャー・エクスパーツ・グループ4(MPEG4) Part10 アドバンスド・ビデオ・コーディング(AVC)規格/国際電気通信連合電気通信部門(ITU−T)H.264勧告(以下、「MPEG4AVC規格」という)に於いて、濃淡むらのあるアーティファクトを取り除く目的で、非ブロック化フィルタを復号化画像に適用している。MPEG4AVC規格のキー・テクノロジー・エリア(KTA)では、ウィーナ・フィルタ(Wiener filter)をインループ(in−loop)、或いは、アウトループ(out−loop)で使用して、復号化画像の品質を向上させている。
【0005】
時間的適応性を実現する為に、ウィーナ・フィルタは、通常、画像毎に、元の画像と復号化画像との間の二乗平均誤差を最小にすることによって推定される。フィルタ係数が、画像毎にオーバヘッドとして復号器に送られる。また、空間的適応性を実現する為に、1つの画像が、コンテンツ、或いは、レート−歪み(RD)コストに基づいて、複数の領域に分割される。各々の領域に於いて、スイッチがフィルタ処理をオン・オフ制御する。領域分割情報とスイッチ制御メッセージとが、副情報として復号器に送られる。
【0006】
この手法は、基本的な特性が、時間とともに(フレーム相互間で)あまり大きく変化しないビデオ映像については、良好に機能する。第1の従来技術の手法では、各領域部分は、通常、同じサイズのブロックであり、第2の従来技術の手法では、各領域部分は、通常、サイズが可変のブロックである。しかしながら、これらのブロック・ベースの方法は、当然に変化している(通常の)ビデオ内では、空間的な変動の特性を事実上示すことができない。例えば、ビデオ・シーケンスの視覚的な品質は縁端部の鮮鋭度に大きく依存しているが、画像内の縁端部はブロック・ベースとは程遠い。更に重要なこととして、種々の方向の縁端部は、その鮮鋭度を保持する為に、種々の組のウィーナ・フィルタを必要とする。
【0007】
MPEG4AVC規格のキー・テクノロジー・エリアでは、第3の従来技術の手法に於いて、適応ポスト・フィルタが提案されている。この基本的な考え方は、ウィーナ・フィルタを、復号化画像に、表示の前に適用することである。ウィーナ・フィルタは、符号器に於いて、画像毎に、元の画像と復号化画像との間の二乗平均誤差(MSE)を最小にすることによって推定できる。この場合、推定されたフィルタ係数が、復号器にオーバヘッドとして送られる。画像全体が、推定されたフィルタによってフィルタ処理される。もう1つ別の場合、一組のウィーナ・フィルタが、オフラインで調整されて、復号器に伝えられるか、或いは、復号器に記憶されている。復号化の際、画像が、画素単位で、フィルタ処理される。各々の画素に於いて、1つのフィルタが、周囲の画素の統計量に基づいて、フィルタ組から選択される。この技術に於いて、フィルタリング・インジケータは、オーバヘッドを要しない。フィルタリング・インジケータは、復号化画像コンテンツによって、導き出せる。しかしながら、フィルタリング・インジケータと画像コンテンツとの間のモデルは、構成することが難しい。第3の従来技術の手法では、オフライン調整スキームを使用して、フィルタリング・インジケータと局所的な変化との間の対応するモデルを見出す。この調整は、調整セット(training set)に依存する度合いが高いので、限られたデータで調整されたモデルは、より一般的なビデオ信号について不正確になる。
【0008】
第1の従来技術の手法では、ブロック・ベースの適応ループ・フィルタが提案されている。この提案に於いては、再構成フレームが、ウィーナ・フィルタによって元のフレームに向けて復元される。ウィーナ・フィルタ係数が、符号器に於いて推定されて、復号器に副情報として送られる。ウィーナ・フィルタは再構成フレームを元のフレームに全体的に復元できるが、局所的に劣化した画素が存在する。劣化した領域によって、画素の忠実性とその後に符号化するフレームについての予測効率性とが低下するので、これらの領域をフィルタ処理しないことによって、符号化のパフォーマンスが改善される。ブロック適応ループ・フィルタ(BALF)では、フレームを同じサイズのブロックに分割し、スイッチ・フラグを各々のブロックに使用して、ブロックをフィルタ処理するか否かを制御する。第2の従来技術の手法では、クアッド・ツリー(四部木)適応ループ・フィルタ(QALF)が導入されて、フレームの、可変サイズのブロックをフィルタ処理するか否かを示している。可変サイズのブロックのスキームを使用する場合、同サイズのブロックのスキームに比べてフィルタ・パフォーマンスは良いが、ブロックのサイズと位置を符号化するオーバヘッドは要求が厳しい。しかしながら、クアッド・ツリー・ベースのフィルタ処理であっても、2次元(2D)データの空間的特徴を捕捉することが出来ないので、圧縮アーティファクトを効率的には取り除けない。
【発明の概要】
【0009】
本原理は、従来技術の上述の、及び、その他の欠点と不利な点に取り組むものであって、分類ベースのループ・フィルタのための方法と装置に関する。
【0010】
本原理の一態様によれば、装置が提供される。この装置は、入力画像の残差を変換し量子化して量子化変換係数を得、量子化変換係数を逆量子化し逆変換して残差の再構成バージョンを得、残差の再構成バージョンと少なくとも1つの参照画像とを合成して入力画像の再構成バージョンを得ることによって入力画像を符号化するビデオ符号器を有する。このビデオ符号器は、局所的な幾何学的特徴に応じた複数のカテゴリのうちのそれぞれのカテゴリ内で入力画像の再構成バージョン内の画素を分類し、少なくとも1つの選択された画素を、複数のカテゴリについて、少なくとも1つの画素の対応する分類に応じてフィルタ処理するフィルタを含んでいる。
【0011】
本原理の他の態様によれば、ビデオ符号器に於ける方法が提供される。この方法は、入力画像を符号化するステップを含む。符号化するステップは、入力画像の残差を変換し量子化して量子化変換係数を得るステップと、量子化変換係数を逆量子化し逆変換して残差の再構成バージョンを得るステップと、残差の再構成バージョンと少なくとも1つの参照画像とを合成して入力画像の再構成バージョンを得るステップと、局所的な幾何学的特徴に応じた複数のカテゴリのうちのそれぞれのカテゴリ内で入力画像の再構成バージョン内の画素を分類するステップと、少なくとも1つの選択された画素を、複数のカテゴリについて、少なくとも1つの画素の対応する分類に応じてフィルタ処理するステップと、を含む。
【0012】
本原理の更に他の態様によれば、装置が提供される。この装置は、量子化変換係数を受信し、量子化変換係数を逆量子化し逆変換して残差の再構成バージョンを得、残差の再構成バージョンと少なくとも1つの参照画像とを合成して画像の再構成バージョンを得るビデオ復号器を有する。ビデオ復号器は、局所的な幾何学的特徴に応じた複数のカテゴリのうちのそれぞれのカテゴリ内で画像の再構成バージョン内の画素を分類し、少なくとも1つの選択された画素を、複数のカテゴリについて、少なくとも1つの画素の対応する分類に応じてフィルタ処理するフィルタを含んでいる。
【0013】
本原理の更に他の態様によれば、ビデオ復号器に於ける方法が提供される。この方法は、画像を復号するステップを含む。復号するステップは、量子化変換係数を受信することと、量子化変換係数を逆量子化し逆変換して残差の再構成バージョンを得ることと、残差の再構成バージョンと少なくとも1つの参照画像とを合成して画像の再構成バージョンを得ることと、局所的な幾何学的特徴に応じた複数のカテゴリのうちのそれぞれのカテゴリ内で画像の再構成バージョン内の画素を分類することと、少なくとも1つの選択された画素を、複数のカテゴリについて、少なくとも1つの画素の対応する分類に応じてフィルタ処理するステップと、を含む。
【0014】
本原理の上述の、及び、その他の各態様、各特徴、並びに、各利点は、添付図面の参照と共に、以下の代表的な実施形態の詳細な説明から明らかになるであろう。
【図面の簡単な説明】
【0015】
本原理は、以下の代表的な図に従って、より良く理解できるであろう。
【0016】
【
図1】
図1は、本原理の一実施形態に従って、本原理を適用できる例示的なビデオ符号器を示すブロック図である。
【
図2】
図2は、本原理の一実施形態に従って、本原理を適用できる例示的なビデオ復号器を示すブロック図である。
【
図3】
図3は、本原理の一実施形態に従って、分類ベースのループ・フィルタを用いて、入力画像についての画像データを符号化する例示的な方法を示す流れ図である。
【
図4】
図4は、本原理の一実施形態に従って、分類ベースのループ・フィルタを用いて、画像についての画像データを復号する例示的な方法を示す流れ図である。
【
図5】
図5は、本原理の一実施形態に従って、分類ベースのループ・フィルタを用いて、入力画像についての画像データを符号化する他の例示的な方法を示す流れ図である。
【
図6】
図6は、本原理の一実施形態に従って、分類ベースのループ・フィルタを用いて、画像についての画像データを復号する他の例示的な方法を示す流れ図である。
【
図7】
図7は、本原理の一実施形態に従って、分類ベースのループ・フィルタを用いて、入力画像についての画像データを符号化する更に他の例示的な方法を示す流れ図である。
【
図8】
図8は、本原理の一実施形態に従って、分類ベースのループ・フィルタを用いて、画像についての画像データを復号する更に他の例示的な方法を示す流れ図である。
【発明を実施するための形態】
【0017】
本原理は、分類ベースのループ・フィルタのための方法と装置に関する。
【0018】
本説明は、本原理を例示するものである。従って、当業者であれば、ここに明示的に説明または示されていないが、本原理を具体化し、且つ、その意図と権利範囲内にある種々の構成を考案できるであろう。
【0019】
ここに列挙する全ての例と条件を表す用語とは、本発明者が、技術の進歩のために提供した本原理と概念とを読み手が理解するための助けとなるべく教授目的のために意図されたものであり、本原理と概念とが、そのように具体的に説明された例と条件には限定されないと解釈すべきである。
【0020】
更に、本原理、本原理の態様、本原理の実施形態、並びに、それらの各具体例を列挙した全て記載は、それらの構造的及び機能的な均等物の両方を包含するように意図されている。更に、そのような均等物には、現在周知の均等物と、将来開発される均等物、即ち、構造に関わらず同一機能を果たすように開発された任意の要素とが含まれる。
【0021】
従って、例えば、ここに提示した各ブロック図が本原理を具体化する回路例の概念的な図を表していることが当業者に理解されるであろう。同様に、任意のフロー・チャート、流れ図、状態遷移図、擬似コード等が、コンピュータ可読媒体に実質的に表されて、従って、コンピュータ或いはプロセッサによって(そのようなコンピュータ或いはプロセッサが明示されているか否かに関わらず)実行され得る種々のプロセスを表していることが理解されるであろう。
【0022】
各図に示す種々の要素の各機能は、専用ハードウェアの使用や適切なソフトウェアと共同してソフトウェアを実行できるハードウェアの使用によって提供できる。機能がプロセッサによって提供される場合、1つの専用プロセッサ、1つの共用プロセッサ、或いは、複数の個別のプロセッサ(その一部は、共用されてもよい)によって提供され得る。更に、「プロセッサ」或いは「コントローラ(制御器)」という用語の明示的な使用は、ソフトウェアを実行できるハードウェアを専ら意味すると解釈すべきではなく、デジタル信号プロセッサ(「DSP」)ハードウェア、ソフトウェアを記憶するリードオンリ・メモリ(「ROM」)、ランダム・アクセス・メモリ(「RAM」)、及び、不揮発性記憶装置を制限なく暗示的に含み得る。
【0023】
その他の従来技術のハードウェア、及び/又は、オーダーメイドのハードウェアも含み得る。同様に、各図に示された任意のスイッチは、単に、概念的なものである。それらの機能は、プログラム論理の動作を介して、専用論理を介して、プログラム論理と専用論理との対話処理を介して、或いは、手動で、行うことができ、また、個々の技術は実施者によって選択できることが、詳細な説明から更に具体的に理解できるであろう。
【0024】
特許請求の範囲の各請求項に於いて、特定の機能を果たす手段として表現された任意の要素は、例えば、a)当該機能を果たす各回路要素の組み合わせ、或いは、b)任意の形態、従って、ファームウェア又はマイクロコード等を含む形態のソフトウェアであり、当該機能を果たす当該ソフトウェアを実行する適切な回路網と組み合わされるソフトウェアを含む機能を果たす任意のものを包含することが意図されている。このような各請求項によって規定された本原理は、種々の列挙された各手段によって提供される各機能が各請求項に記載された態様で組み合わされて統合されることにある。従って、それらの機能を提供できる任意の各手段は、ここに記載の各手段に等しいと考えられる。
【0025】
本明細書に於いて、本原理の「一実施形態」或いは「ある実施形態」という表現、及び、その表現の異形は、当該実施形態に関連して説明された特定の特徴、構造、及び、特性等が、本原理の少なくとも一実施形態に含まれていることを意味している。従って、「一実施形態に於いて」或いは「ある実施形態に於いて」という語句、及び、その語句の異形が記載されている場合は、必ずしも同一の実施形態を意味している訳ではない。
【0026】
例えば、「A/B」、「A及び/又はB」、及び、「AとBの少なくとも1つ」の場合の「/」、「及び/又は」、及び、「・・・の少なくとも1つ」の何れかの使用は、1番目に記載のオプション(A)のみの選択、2番目に記載のオプション(B)のみの選択、或いは、両方のオプション(AとB)の選択を包含することを意図している。更なる例として、「A、B、及び/又は、C」と「A、B、及び、Cの少なくとも1つ」の場合、そのような記載は、1番目に記載のオプション(A)のみの選択、2番目に記載のオプション(B)のみの選択、3番目に記載のオプション(C)のみの選択、1番目と2番目に記載のオプション(AとB)のみの選択、1番目と3番目に記載のオプション(AとC)のみの選択、2番目と3番目に記載のオプション(BとC)のみの選択、或いは、3つのオプション(AとBとC)の選択を包含することを意図している。このことは、当業者に直ちに明らかなように、多数の項目が記載される場合にも拡張できる。
【0027】
更に、ここで使用されているように、「画像」という用語と「映像」という用語とは、互換可能に使用され、静止画、或いは、ビデオ・シーケンスから得られる画像を意味する。周知のように、1画像は、1フレーム又は1フィールドである場合もある。
【0028】
更に、ここで使用されているように、「高レベル・シンタックス」は、階層的にマイクロブロック層の上に存在するビットストリーム内にあるシンタックスを意味する。例えば、ここで使用されているように、高レベル・シンタックスは、スライス・ヘッダ・レベルのシンタックス、サプリメンタル・エンハンスメント・インフォメーション(SEI)レベル、ピクチャ・パラメータ・セット(PPS)レベル、シーケンス・パラメータ・セット(SPS)レベル、及び、ネットワーク・アブストラクション・レイヤ(NAL)ユニット・ヘッダ・レベルのシンタックスを意味することが出来、また、これらに限定される訳ではない。
【0029】
また、ここで使用されているように、「フィルタ係数が、画像毎に適応的に調整される」という表現は、フィルタ係数を、分類ベースのループ・フィルタについて、画像単位で、調整することを意味する。即ち、このような係数は、画像全体の特性が考慮され、そして、複数の画像が考慮される一方で、調整される。
【0030】
更に、ここで使用されているように、「フィルタ係数が、オフラインで調整される」という表現は、フィルタ係数を、分類ベースのループ・フィルタについて、フィルタが特定の画素の特定の画素に適用されている期間と異なる時点で、調整することを意味する。従って、オフラインは、その画像が属する特定のビデオ・シーケンスを処理する前の期間を意味する場合がある。
【0031】
例示と説明のため、各例を、ここでは、MPEG4AVC規格の改善について説明し、
MPEG4AVC規格を説明のベースライン(基準)として使用し、MPEG4AVC規格の改善と拡張を説明する。しかしながら、本原理がMPEG4AVC規格とその拡張とだけに限定される訳ではないことが理解されるであろう。当業者であれば、ここに記載の本原理の各開示事項から、本原理が、その他の規格の拡張に適用される場合、或いは、未だ開発されていない規格に適用、及び/又は、組み込まれる場合、等しく適用可能であり、少なくとも同様の効果をもたらすことを容易に理解できるであろう。更に、本原理が、規格に適合するのではなく、寧ろ、独自の定義に適合するビデオ符号器とビデオ復号器とにも適用できることが理解できるであろう。
【0032】
また、例示と説明のため、各例を、ここでは、周知のウィーナ・フィルタを背景にして説明する。しかしながら、本原理が1つ以上の画素及び/又は画素データに適用できる任意のタイプのフィルタに適用できることは理解されるべきである。例えば、本原理の幾つかの実施形態に於いて、あるグループに分類される画素について、あるフィルタ・タイプ(例えば、ウィーナ・フィルタ)が選択され、係数が決定され、別のあるグループに分類される画素について、別のあるフィルタ・タイプ(例えば、非ウィーナ・フィルタ)が選択され、係数が決定されることが理解できるであろう。当業者であれば、ここに記載された本原理の各開示事項から、ここに記載された本原理の上述の、及び、その他の変形を容易に求めることが出来る。
【0033】
図1を参照すると、本原理を適用できるビデオ符号器の代表例の全体が、参照番号100によって示されている。ビデオ符号器100には、フレーム順序付けバッファ110が含まれており、合成器185の非反転入力部と信号通信可能な出力部を有している。合成器185の出力部が、変換器と量子化器125の第1の入力部と信号通信可能に接続されている。変換器と量子化器125の出力部が、エントロピ符号器145の第1の入力部と、逆変換器と逆量子化器150の第1の入力部とに信号通信可能に接続されている。エントロピ符号器145の出力部が、合成器190の第1の非反転入力部と信号通信可能に接続されている。合成器190の出力部が、出力バッファ135の第1の入力部と信号通信可能に接続されている。
【0034】
符号器制御装置105の第1の出力部が、フレーム順序付けバッファ110の第2の入力部、逆変換器と逆量子化器150の第2の入力部、画像タイプ決定モジュール115の入力部、マイクロブロック・タイプ(MBタイプ)決定モジュール120の第1の入力部、イントラ予測モジュール160の第2の入力部、非ブロック化フィルタ165の第2の入力部、動き補償器170の第1の入力部、動き推定器175の第1の入力部、及び、参照画像バッファ180の第2の入力部と信号通信可能に接続されている。
【0035】
符号器制御装置105の第2の出力部が、サプリメンタル・エンハンスメント・インフォメーション(付加拡張情報)(SEI)挿入器130の第1の入力部、変換器と量子化器125の第2の入力部、エントロピ符号器145の第2の入力部、出力バッファ135の第2の入力部、及び、シーケンス・パラメータ・セット(SPS)と画像パラメータ・セット(PPS)挿入器140の入力部と信号通信可能に接続されている。
【0036】
SEI挿入器130の出力部が、合成器190の第2の非反転入力部と信号通信可能に接続されている。
【0037】
画像タイプ決定モジュール115の第1の出力部が、フレーム順序付けバッファ110の第3の入力部と信号通信可能に接続されている。画像タイプ決定モジュール115の第2の出力部が、マイクロブロック・タイプ決定モジュール120の第2の入力部と信号通信可能に接続されている。
【0038】
シーケンス・パラメータ・セット(SPS)と画像パラメータ・セット(PPS)挿入器140の出力部が、合成器190の第3の非反転入力部と信号通信可能に接続されている。
【0039】
逆量子化器と逆変換器150の出力部が、合成器119の第1の非反転入力部と信号通信可能に接続されている。合成器119の出力部が、イントラ予測モジュール160の第1の入力部、及び、非ブロック化フィルタ165の第1の入力部と信号通信可能に接続されている。非ブロック化フィルタ165の出力部が、適応ループ・フィルタ133の入力部と信号通信可能に接続されている。適応ループ・フィルタの出力部が、参照画像バッファ180の第1の入力部と信号通信可能に接続されている。参照画像バッファ180の出力部が、動き推定器175の第2の入力部、及び、動き補償器170の第3の入力部と信号通信可能に接続されている。動き推定器175の第1の出力部が、動き補償器170の第2の入力部と信号通信可能に接続されている。動き推定器175の第2の出力部が、エントロピ符号器145の第3の入力部と信号通信可能に接続されている。
【0040】
動き補償器170の出力部が、スイッチ197の第1の入力部と信号通信可能に接続されている。イントラ予測モジュール160の出力部が、スイッチ197の第2の入力部と信号通信可能に接続されている。マイクロブロック・タイプ決定モジュール120の出力部が、スイッチ197の第3の入力部と信号通信可能に接続されている。スイッチ197の第3の入力によって、スイッチの「データ」入力(これは、制御入力、即ち、第3の入力と対比される)が、動き補償器170か、或いは、イントラ予測モジュール160かによって提供されるべきか否かが決定される。スイッチ197の出力部は、合成器119の第2の非反転入力部、及び、合成器185の反転入力部と信号通信可能に接続されている。
【0041】
フレーム順序付けバッファ110の第1の入力部と符号器制御装置105の入力部とが、入力画像を受信するための符号器100の入力部として、使用できる。更に、サプリメンタル・エンハンスメント・インフォメーション(付加拡張情報)(SEI)挿入器130の第2の入力部が、メタデータを受信するための符号器100の入力部として、使用できる。出力バッファ135の出力部が、ビットストリームを出力するための符号器100の出力部として、使用できる。
【0042】
図2を参照すると、本原理を適用できるビデオ復号器の代表例の全体が、参照番号200によって示されている。ビデオ復号器200には入力バッファ210が含まれており、エントロピ復号器245の第1の入力部と信号通信可能に接続された出力部を有している。エントロピ復号器245の第1の出力部が、逆変換器と逆量子化器250の第1の入力部と信号通信可能に接続されている。逆変換器と逆量子化器250の出力部が、合成器225の第2の非反転入力部と信号通信可能に接続されている。合成器225の出力部が、非ブロック化フィルタ265の第2の入力部、及び、イントラ予測モジュール260の第1の入力部と信号通信可能に接続されている。非ブロック化フィルタ265の第2の出力部が、適応ループ・フィルタ233の入力部と信号通信可能に接続されている。適応ループ・フィルタ233の出力部が、参照画像バッファ280の第1の入力部と信号通信可能に接続されている。参照画像バッファ280の出力部が、動き補償器270の第2の入力部と信号通信可能に接続されている。
【0043】
エントロピ復号器245の第2の出力部が、動き補償器270の第3の入力部、非ブロック化フィルタ265の第1の入力部、及び、イントラ予測器260の第3の入力部と信号通信可能に接続されている。エントロピ復号器245の第3の出力部が、復号器制御装置205の入力部と信号通信可能に接続されている。復号器制御装置205の第1の出力部が、エントロピ復号器245の第2の入力部と信号通信可能に接続されている。復号器制御装置205の第2の出力部が、逆変換器と逆量子化器250の第2の入力部と信号通信可能に接続されている。復号器制御装置205の第3の出力部が、非ブロック化フィルタ265の第3の入力部と信号通信可能に接続されている。復号器制御装置205の第4の出力部が、イントラ予測モジュール260の第2の入力部、動き補償器270の第1の入力部、及び、参照画像バッファ280の第2の入力部と信号通信可能に接続されている。
【0044】
動き補償器270の出力部が、スイッチ297の第1の入力部と信号通信可能に接続されている。イントラ予測モジュール260の出力部が、スイッチ297の第2の入力部と信号通信可能に接続されている。スイッチ297の出力部が、合成器225の第1の非反転入力部と信号通信可能に接続されている。
【0045】
入力バッファ210の入力部が、入力ビットストリームを受信するための復号器200の入力部として使用できる。非ブロック化フィルタ265の第1の出力部が、出力画像を出力するための復号器200の出力部として使用できる。
【0046】
上述のように、本原理は、分類ベースのループ・フィルタのための方法と装置に関する。前述のように、従来技術のフィルタ処理の各手法は、変化しない(普通ではない)ビデオ信号については、良好に機能する傾向がある。更に、前述のように、従来技術の各方法は、通常、サイズが等しい、或いは、可変的なブロックである分割部分を使用する。しかしながら、ブロック・ベースの方法は、普通の(標準的な)映像、及び、ビデオ内の空間の変化を効果的に特徴付けることはない。例えば、ビデオ・シーケンスの視覚的な品質は、縁端部の鮮鋭度に大きく依存しているが、画像内の縁端部は、ブロック・ベースでは殆ど対応できない。更に重要なこととして、相異なる方向の縁端部は、その鮮鋭度を保持する為に、相異なる組のウィーナ・フィルタを必要とする。これらの問題を解決する為に、フィルタを改善する分類ベースの方式を提案する。
【0047】
本原理の一実施形態によるビデオ符号器に於いて、映像の予測誤差が先ず変換係数に変換されるビデオ符号化のための方法と装置を開示し、説明する。変換係数は、次に量子化される。量子化された変換係数(量子化変換係数)は、逆量子化され、逆変換されて、その結果、再構成された予測誤差映像が得られる。この再構成された予測誤差映像と予測映像とを合成することによって、再構成映像が生成される。次に、縁端部の方位、異方性/等方性、方向、大きさ、コントラスト、傾度等のような局所的な幾何学的特徴に応じたグループ或いはカテゴリ内で、画素が分類される。例えば、分類が方位に基づく一実施形態に於いて、再構成映像の縁端部検出が行われ、そして、縁端部に於ける画素が、方位に基づくグループ或いはカテゴリ内で、分類される。あるフィルタが、特定の画素に適用される。その際、そのフィルタは、グループ或いはカテゴリ内での画素の分類に応じて選択される。
【0048】
本原理の一実施形態によるビデオ復号器に於いて、エントロピ符号化された量子化変換係数が受信されて、次に逆量子化され、逆変換されて、その結果、再構成された予測誤差映像が得られるビデオ復号のための方法と装置を開示し、説明する。この再構成された予測誤差映像と予測映像とを合成することによって、再構成映像が生成される。次に、縁端部の方位、異方性/等方性、方向、大きさ、コントラスト、傾度等のような局所的な幾何学的特徴に応じたグループ或いはカテゴリ内で、画素が分類される。例えば、分類が方位に基づく一実施形態に於いて、再構成映像の縁端部検出が行われ、そして、縁端部に於ける画素が、方位に基づくグループ或いはカテゴリ内で、分類される。あるフィルタが、特定の画素に適用される。その際、そのフィルタは、グループ或いはカテゴリ内での画素の分類に応じて選択される。
【0049】
グループ内で類別された全ての画素について選択された構造(係数)を有するフィルタによって、画素がフィルタ処理される。各フィルタは、相異なるグループ/カテゴリに属する画素について、互いに異なるように構成される。
【0050】
現行のビデオ符号化のフレームワークに於いて、フィルタ処理技術は、通常、圧縮アーティファクトを取り除くことに、或いは、アンチ・エイリアシングに使用されている。このようなフィルタ処理技術は、多くのビデオ圧縮アプリケーションに於いて、インループ、或いは、アウトループとして使用できる。ビデオ信号の特性は変化するので、フィルタ処理は、空間領域と時間領域の両方に於いて適応できることが期待される。圧縮アーティファクトを取り除く際に空間的適応性を実現する多くのブロック・ベースの適応フィルタが提案されている。本原理に従って、画素特性ベースの(画素特性に基づく)適応性を有する適応フィルタを使用する点でパフォーマンスを改善する方法と装置とを開示し、説明する。具体的には、ビデオ・フレームが縁端部検出され、検出された縁端部に於ける画素が、ある画素分類に基づく相異なるグループ又はカテゴリに分類される(このような各画素は、方向、大きさ、傾度、及び/又は、その他の検出可能な何らかの特性に基づいて、選択されて、グループ化、或いは、類別されてもよい)。次に、特定のグループ内で類別された全ての画素について選択された構造(各係数)を有するフィルタによって、画素がフィルタ処理される。各フィルタは、相異なるグループ/カテゴリに属する画素について、互いに異なるように構成される。フィルタ係数はフレーム毎に適応的に選択でき、係数は、符号器から復号器に送信できる(伝えることが出来る)。別の一実施形態では、各々のカテゴリについてのフィルタ係数は、オフラインで選択でき、符号器と復号器の双方で記憶できる。
【0051】
一実施形態に於いて、縁端部検出が、フィルタ処理すべき入力画像について行われる。縁端部であると確認された各画素は、更に、縁端部方位に基づく相異なるカテゴリに分類される。各々のカテゴリについて、一組のウィーナ・フィルタ係数(或いは、他のタイプのフィルタ係数)が、このカテゴリ内の画素について、元の画像と処理すべき入力画像との間の平均2乗誤差(MSE)を最小にすることによって計算される。各々のカテゴリについてのフィルタ係数は、フレーム毎に適応的に調整でき、高レベルのシンタックスによって送信できる(伝えることが出来る)。
【0052】
縁端部として確認されない残りの画像部分に於ける画素については、別の一組のフィルタ係数がフィルタ処理の前に計算される。復号器に於いて、その画像について同様の縁端部検出と分類処理とが行なわれ、その後、カテゴリによる縁端部画素のフィルタ処理と残りの画像部分のフィルタ処理とが行われる。
【0053】
別の一実施形態に於いて、画素レベルでの分類処理を行なう代わりに、基本単位をブロック、例えば、8×8のブロック・サイズを有するブロックとしてもよい。
【0054】
図3を参照すると、分類ベースのループ・フィルタを用いて、入力画像についての画像データを符号化する代表的な方法の全体が、参照番号300によって示されている。方法300には開始ブロック305が含まれており、制御を機能ブロック310に送る。機能ブロック310は、符号化セットアップを行い、制御を機能ブロック315に送る。
機能ブロック315は、入力画像の残差を変換し量子化して量子化変換係数を得、量子化変換係数を逆量子化し逆変換して残差の再構成バージョンを得、この残差の再構成バージョンと少なくとも1つの参照画像とを合成して入力画像の再構成バージョンを得、制御を機能ブロック330に送る。機能ブロック330は、入力画像の再構成バージョン内の縁端部の画素、或いは、ブロックを、局所的な幾何学的特徴に基づくn個のカテゴリに分類し、制御をループ端ブロック340に送る。ループ端ブロック340は、カテゴリ毎にループして、制御を機能ブロック350に送る。機能ブロック350は、ウィーナ・フィルタ係数を計算し、ループ・インデックスによって示された特定のクラス(分類)内の縁端部の画素、或いは、ブロックにフィルタを適用し、制御を機能ブロック360に送る。機能ブロック360は、フィルタ係数を符号化し、制御をループ端ブロック370に送る。ループ端ブロック370は、各々のカテゴリについてのループを終了し、制御を機能ブロック380に送る。機能ブロック380は、その他の(即ち、非縁端部の)画素について、ウィーナ・フィルタ係数を計算して適用し、制御を機能ブロック390に送る。機能ブロック390は、(その他の画素について)このフィルタ係数を符号化し、制御を終了ブロック399に送る。
【0055】
図4を参照すると、分類ベースのループ・フィルタを用いて、画像についての画像データを復号する代表的な方法の全体が、参照番号400によって示されている。方法400には開始ブロック405が含まれており、制御を機能ブロック415に送る。機能ブロック415は、量子化変換係数を受信し、量子化変換係数を逆量子化し逆変換して残差の再構成バージョンを得、この残差の再構成バージョンと少なくとも1つの参照画像とを合成して当該画像の再構成バージョンを得、制御を機能ブロック420に送る。機能ブロック420は、当該画像の再構成バージョン内の縁端部の画素、或いは、ブロックを、局所的な幾何学的特徴に基づくn個のカテゴリに分類し、制御をループ端ブロック430に送る。ループ端ブロック430は、各々のカテゴリについてのループを開始し、制御を機能ブロック440に送る。機能ブロック440は、ウィーナ・フィルタ係数を解析し、制御を機能ブロック450に送る。機能ブロック450は、ループ・インデックスによって示された特定のクラス(分類)内の縁端部の画素、或いは、ブロックにウィーナ・フィルタを適用し、制御をループ端ブロック460に送る。ループ端ブロック460は、カテゴリについてのループを終了し、制御を機能ブロック470に送る。機能ブロック470は、その他の(即ち、非縁端部の)画素について、ウィーナ・フィルタ係数を解析し、制御を機能ブロック480に送る。機能ブロック480は、(その他の画素について)このウィーナ・フィルタを適用し、制御を終了ブロック499に送る。
【0056】
別の一実施形態に於いて、送信オーバヘッドは回避できる。そのような場合、一組のシーケンスによってフィルタをオフラインで調整でき、符号器と復号器の双方で記憶できる。
【0057】
図5を参照すると、分類ベースのループ・フィルタを用いて、入力画像についての画像データを符号化するもう1つの代表的な方法の全体が、参照番号500によって示されている。方法500には、開始ブロック505が含まれており、制御を機能ブロック510に送る。機能ブロック510は、符号化セットアップを行い、制御を機能ブロック530に送る。明示的に示されていないが、当業者には直ちに明らかなように、方法500には、機能ブロック530によって行なわれる分類処理の前に、
図3の機能ブロック315について示された各ステップと同様の各ステップも含まれている。機能ブロック530は、入力画像の再構成バージョン内の縁端部の画素、或いは、ブロックを、局所的な幾何学的特徴に基づくn個のカテゴリに分類し、制御をループ端ブロック540に送る。ループ端ブロック540は、カテゴリ毎にループを開始し、制御を機能ブロック550に送る。機能ブロック550は、当該クラス(分類)について、予め調整された係数で縁端部の画素、或いは、ブロックをフィルタ処理し、制御をループ端ブロック560に送る。ループ端ブロック560は、カテゴリについてのループを終了し、制御を機能ブロック570に送る。機能ブロック570は、その他の(即ち、非縁端部の)画素について、ウィーナ・フィルタ係数を計算して適用し、制御を機能ブロック580に送る。機能ブロック580は、フィルタ係数を符号化し、制御を終了ブロック599に送る。
【0058】
図6を参照すると、分類ベースのループ・フィルタを用いて、画像についての画像データを復号するもう1つの代表的な方法の全体が、参照番号600によって示されている。方法600には開始ブロック605が含まれており、制御を機能ブロック620に送る。明示的に示されていないが、当業者には直ちに明らかなように、方法600には、機能ブロック620によって行なわれる分類処理の前に、
図4の機能ブロック415について示された各ステップと同様の各ステップも含まれている。機能ブロック620は、当該画像の再構成バージョン内の縁端部の画素、或いは、ブロックを、局所的な幾何学的特徴に基づくn個のカテゴリに分類し、制御をループ端ブロック630に送る。ループ端ブロック630は、各々のカテゴリについてのループを開始し、制御をループ端ブロック640に送る。ループ端ブロック640は、当該クラス(分類)について、予め調整された係数で縁端部の画素、或いは、ブロックをフィルタ処理し、制御をループ端ブロック650に送る。ループ端ブロック650は、カテゴリについてのループを終了し、制御を機能ブロック660に送る。機能ブロック660は、その他の(即ち、非縁端部の)画素について、ウィーナ・フィルタ係数を解析し、制御を機能ブロック670に送る。機能ブロック670は、(その他の画素について)ウィーナ・フィルタを適用し、制御を終了ブロック699に送る。
【0059】
別の一実施形態に於いて、分類ベースのウィーナ・フィルタ処理は、画素毎に、フィルタ処理を行うか否かを決定するBALF又はQALFと組み合わされる。BALF又はQALFがあるブロックをフィルタ処理することを決定した場合、縁端部として検出された画素が、その画素が属するカテゴリについて、個別に調整されたフィルタによって、フィルタ処理される。
【0060】
図7を参照すると、分類ベースのループ・フィルタを用いて、入力画像についての画像データを符号化する更にもう1つの代表的な方法の全体が、参照番号700によって示されている。方法700には、開始ブロック705が含まれており、制御を機能ブロック710に送る。機能ブロック710は、符号化セットアップを行い、制御を機能ブロック720に送る。明示的に示されていないが、当業者には直ちに明らかなように、方法700には、機能ブロック720によって行なわれる分類処理の前に、
図3の機能ブロック315について示された各ステップと同様の各ステップも含まれている。機能ブロック720は、入力画像の再構成バージョン内の縁端部の画素、或いは、ブロックを、局所的な幾何学的特徴に基づくn個のカテゴリに分類し、制御をループ端ブロック725に送る。ループ端ブロック725は、カテゴリ毎にループし、制御を機能ブロック730に送る。機能ブロック730は、各々のカテゴリについてウィーナ・フィルタ係数を計算し、制御をループ端ブロック735に送る。ループ端ブロック735は、カテゴリについてのループを終了し、制御を機能ブロック740に送る。機能ブロック740は、ブロック適応ループ・フィルタについてフィルタ係数とフィルタ制御フラグとを計算し、制御をループ端ブロック745に送る。ループ端ブロック745は、各々のブロックについてのループを終了し、制御を決定ブロック750に送る。決定ブロック750は、当該(現在の)ブロックをフィルタ処理すべきか否かを判定する。当該(現在の)ブロックをフィルタ処理すべきであると判定した場合、制御をループ端ブロック755に送る。当該(現在の)ブロックをフィルタ処理すべきでないと判定した場合、制御をループ端ブロック780に送る。ループ端ブロック755は、現在のブロック内の各々の画素についてのループを開始し、制御を決定ブロック760に送る。決定ブロック760は、現在の画素が縁端部の画素であるか否かを判定する。現在の画素が縁端部の画素であると判定した場合、制御を機能ブロック765に送る。現在の画素が縁端部の画素でないと判定した場合、制御を機能ブロック770に送る。機能ブロック765は、当該画素が属するカテゴリについて調整されたフィルタを適用し、制御をループ端ブロック775に送る。機能ブロック770は、BALF又はQALFによって調整されたフィルタを適用し、制御をループ端ブロック775に送る。ループ端ブロック775は、画素についてのループを終了し、制御をループ端ブロック780に送る。ループ端ブロック780は、ブロックについてのループを終了し、制御を機能ブロック790に送る。機能ブロック790は、フィルタ係数と制御フラグとを符号化し、制御を終了ブロック799に送る。
【0061】
図8を参照すると、分類ベースのループ・フィルタを用いて、画像についての画像データを復号する更にもう1つの代表的な方法の全体が、参照番号800によって示されている。方法800には開始ブロック805が含まれており、制御を機能ブロック810に送る。機能ブロック810は、フィルタ係数と制御フラグとを解析し、制御を機能ブロック820に送る。明示的に示されていないが、当業者には直ちに明らかなように、方法800には、機能ブロック820によって行なわれる分類処理の前に、
図4の機能ブロック415について示された各ステップと同様の各ステップも含まれている。機能ブロック820は、当該画像の再構成バージョン内の縁端部の画素、或いは、ブロックを、局所的な幾何学的特徴に基づくn個のカテゴリに分類し、制御をループ端ブロック830に送る。ループ端ブロック830は、各々のブロックについてループを開始し、制御を決定ブロック835に送る。決定ブロック835は、当該(現在の)ブロックをフィルタ処理すべきか否かを判定する。当該(現在の)ブロックをフィルタ処理すべきであると判定した場合、制御をループ端ブロック840に送る。当該(現在の)ブロックをフィルタ処理すべきでないと判定した場合、制御をループ端ブロック870に送る。ループ端ブロック840は、現在のブロック内の各々の画素についてのループを開始し、制御を決定ブロック845に送る。決定ブロック845は、現在の画素が縁端部の画素であるか否かを判定する。現在の画素が縁端部の画素であると判定した場合、制御を機能ブロック850に送る。現在の画素が縁端部の画素でないと判定した場合、制御を機能ブロック855に送る。機能ブロック850は、当該画素が属するカテゴリについて調整されたフィルタを適用し、制御をループ端ブロック860に送る。機能ブロック855は、BALF又はQALFによって調整されたフィルタを適用し、制御をループ端ブロック860に送る。ループ端ブロック860は、画素についてのループを終了し、制御をループ端ブロック870に送る。ループ端ブロック870は、ブロックについてのループを終了し、制御を終了ブロック899に送る。
シンタックス
【0062】
表1には、本原理の一実施形態に従う代表的なスライス・ヘッダ・シンタックスが示されている。
【0063】
表1に於ける各シンタックス要素のセマンティックスは、次の通りである。
・1に等しい「edge_filter_flag」は、縁端部の方位ベースのフィルタ処理を使用することを指定する。0に等しい「edge_filter_flag」は、縁端部の方位ベースのフィルタ処理を使用しないことを指定し、このことは、スライス内の全画素について同一のフィルタが使用されることを意味する。
・「num_edge_dir」は、縁端部の方向の総数を指定する。
・1に等しい「edge_dir_used_flag[i]」は、i番目の方向のフィルタを使用することを指定し、0に等しい「edge_dir_used_flag[i]」は、i番目の方向のフィルタを使用しないことを指定する。
・「filter_coeff[i]」は、i番目の方向のフィルタについての係数を指定する。
【表1】
【0064】
本発明に伴う多数の利点/特徴の一部は既に説明したが、次に、その他の一部を説明する。例えば、ある利点/特徴は、入力画像の残差を変換し量子化して量子化変換係数を得、量子化変換係数を逆量子化し逆変換して残差の再構成バージョンを得、この残差の再構成バージョンと少なくとも1つの参照画像とを合成して入力画像の再構成バージョンを得ることによって入力画像を符号化するビデオ符号器を有する装置である。ビデオ符号器は、局所的な幾何学的特徴に応じた複数のカテゴリのうちのそれぞれのカテゴリ内で入力画像の再構成バージョン内の画素を分類し、少なくとも1つの選択された画素を、複数のカテゴリについて、少なくとも1つの画素の対応する分類に応じてフィルタ処理するフィルタを含んでいる。
【0065】
別の利点/特徴は、上述のビデオ符号器を有する装置であって、フィルタ係数が、適応的であり、複数のカテゴリのうちの少なくとも1つのカテゴリ内でのフィルタ処理の改善パフォーマンスの提供に応じて選択される装置である。
【0066】
更に別の利点/特徴は、上述のビデオ符号器を有する装置であって、フィルタ係数が、適応的であり、複数のカテゴリのうちの少なくとも1つのカテゴリ内でのフィルタ処理の改善パフォーマンスの提供に応じて選択され、且つ、改善パフォーマンスが、入力画像と入力画像の再構成バージョンとの間の歪み測度を最小にすることによって提供される装置である。
【0067】
更に別の利点/特徴は、上述のビデオ符号器を有する装置であって、少なくとも1つの画素の分類が、少なくとも1つの画素に対応する、方向、大きさ、異方性/等方性、コントラスト、及び、傾度のうちの少なくとも1つに応じて決定される装置である。
【0068】
更に別の利点/特徴は、上述のビデオ符号器を有する装置であって、フィルタ係数が、画像毎に適応的に調整されて、1つ以上の高レベルのシンタックス要素を使用して示される装置である。
【0069】
更に別の利点/特徴は、上述のビデオ符号器を有する装置であって、フィルタ係数が、オフラインで調整されて、符号器と対応する復号器との双方に記憶される装置である。
【0070】
更に別の利点/特徴は、上述のビデオ符号器を有する装置であって、フィルタ処理が、ブロック適応ループ・フィルタ処理、或いは、クアッドツリー(四部木)適応ループ・フィルタ処理と共に行われる装置である。
【0071】
当業者であれば、ここに記載された開示事項から、本原理の上述の特徴と利点、及び、その他の特徴と利点を容易に把握できるであろう。また、本原理の開示事項が、ハードウェア、ソフトウェア、ファームウェア、特定用途のプロセッサ、或いは、それらの各組み合わせの種々の形態で実施できることも理解できるであろう。
【0072】
最も望ましくは、本発明の開示事項は、ハードウェアとソフトウェアの組み合わせとして実施される。更に、そのソフトウェアは、プログラム記憶装置に具体的に組み入れられるアプリケーション・プログラムとして実施できる。そのアプリケーション・プログラムは、任意の適当なアーキテクチャから成るマシンにアップロードされて、実行されてもよい。望ましくは、そのマシンは、1つ以上の中央処理装置(CPU)、ランダム・アクセス・メモリ(RAM)、及び、入力 / 出力(I/O)インタフェースのようなハードウェアを有するコンピュータ・プラットフォーム上で実施される。このコンピュータ・プラットフォームには、オペレーティング・システムとマイクロ命令コードも含まれてもよい。ここで説明した種々のプロセスと機能は、CPUによって実行され得るマイクロ命令コードの一部、或いは、アプリケーション・プログラムの一部、或いは、それらの任意の組み合わせであってもよい。更に、種々の他の周辺装置、例えば、追加のデータ記憶装置や印刷装置等をコンピュータ・プラットフォームに接続してもよい。
【0073】
更に、添付図面に描写された各システム構成要素及び各方法の一部はソフトウェアで実施されることが望ましいので、各システム構成要素、或いは、各処理機能ブロックの相互間の実際の接続関係は、本原理がプログラムされる様態に従って異なる場合がある。当業者であれば、ここに記載された開示事項から、本原理のこれらの実施形態或いは構成と同様の実施形態或いは構成を考案できるであろう。
【0074】
また、添付図面を参照して、各実施例を説明したが、本原理は、これらの厳密な実施例に限定される訳ではなく、当業者であれば、本原理の権利範囲と意図とから逸脱することなく、種々の変更と修正を行うことが出来るであろう。そのような全ての変更と修正は、特許請求の範囲の各請求項に記載した本原理の権利範囲内に含まれるものである。
以下、本願により教示される形態を例示的に列挙する。
(付記1)
入力画像の残差を変換し量子化して量子化変換係数を得、前記量子化変換係数を逆量子化し逆変換して前記残差の再構成バージョンを得、前記残差の前記再構成バージョンと少なくとも1つの参照画像とを合成して前記入力画像の再構成バージョンを得ることによって前記入力画像を符号化するビデオ符号器(100)を有し、
前記ビデオ符号器は、局所的な幾何学的特徴に応じた複数のカテゴリのうちのそれぞれのカテゴリ内で前記入力画像の前記再構成バージョン内の画素を分類し、少なくとも1つの選択された画素を、前記複数のカテゴリについて、前記少なくとも1つの画素の対応する分類に応じてフィルタ処理するフィルタ(133)を含んでいる、
装置。
(付記2)
フィルタ係数が、適応的であり、前記複数のカテゴリのうちの少なくとも1つのカテゴリ内でのフィルタ処理の改善パフォーマンスの提供に応じて選択される、付記1に記載の装置。
(付記3)
前記改善パフォーマンスが、前記入力画像と前記入力画像の前記再構成バージョンとの間の歪み測度を最小にすることによって提供される、付記2に記載の装置。
(付記4)
前記少なくとも1つの画素の前記分類が、前記少なくとも1つの画素に対応する、方向、大きさ、異方性/等方性、コントラスト、及び、傾度のうちの少なくとも1つに応じて決定される、付記1に記載の装置。
(付記5)
フィルタ係数が、画像毎に適応的に調整されて、1つ以上の高レベルのシンタックス要素を使用して示される、付記1に記載の装置。
(付記6)
フィルタ係数が、オフラインで調整されて、前記符号器と対応する復号器との双方に記憶される、付記1に記載の装置。
(付記7)
前記フィルタ処理が、ブロック適応ループ・フィルタ処理、或いは、クアッドツリー(四部木)適応ループ・フィルタ処理と共に行われる、付記1に記載の装置。
(付記8)
ビデオ符号器に於ける方法であって、
入力画像を符号化するステップを含み、
前記符号化するステップは、
前記入力画像の残差を変換し量子化して量子化変換係数を得るステップ(315)と、
前記量子化変換係数を逆量子化し逆変換して前記残差の再構成バージョンを得るステップ(315)と、
前記残差の前記再構成バージョンと少なくとも1つの参照画像とを合成して前記入力画像の再構成バージョンを得るステップ(315)と、
局所的な幾何学的特徴に応じた複数のカテゴリのうちのそれぞれのカテゴリ内で前記入力画像の前記再構成バージョン内の画素を分類するステップ(330,530,720)と、
少なくとも1つの選択された画素を、前記複数のカテゴリについて、前記少なくとも1つの画素の対応する分類に応じてフィルタ処理するステップ(350,550,765)と、を含む前記方法。
(付記9)
フィルタ係数が、適応的であり、前記複数のカテゴリのうちの少なくとも1つのカテゴリ内でのフィルタ処理の改善パフォーマンスの提供に応じて選択される、付記8に記載の方法。
(付記10)
前記改善パフォーマンスが、前記入力画像と前記入力画像の前記再構成バージョンとの間の歪み測度を最小にすることによって提供される、付記9に記載の方法。
(付記11)
前記少なくとも1つの画素の前記分類が、前記少なくとも1つの画素に対応する、方向、大きさ、異方性/等方性、コントラスト、及び、傾度のうちの少なくとも1つに応じて決定される、付記8に記載の方法。
(付記12)
フィルタ係数が、画像毎に適応的に調整されて、1つ以上の高レベルのシンタックス要素を使用して示される、付記8に記載の方法。
(付記13)
フィルタ係数が、オフラインで調整されて、前記符号器と対応する復号器との双方に記憶される、付記8に記載の方法。
(付記14)
前記フィルタ処理が、ブロック適応ループ・フィルタ処理、或いは、クアッドツリー(四部木)適応ループ・フィルタ処理と共に行われる(770)、付記8に記載の方法。
(付記15)
量子化変換係数を受信し、前記量子化変換係数を逆量子化し逆変換して残差の再構成バージョンを得、前記残差の前記再構成バージョンと少なくとも1つの参照画像とを合成して当該画像の再構成バージョンを得るビデオ復号器(200)を有し、
前記ビデオ復号器は、局所的な幾何学的特徴に応じた複数のカテゴリのうちのそれぞれのカテゴリ内で前記画像の前記再構成バージョン内の画素を分類し、少なくとも1つの選択された画素を、前記複数のカテゴリについて、前記少なくとも1つの画素の対応する分類に応じてフィルタ処理するフィルタ(233)を含んでいる、
装置。
(付記16)
フィルタ係数が、適応的であり、前記複数のカテゴリのうちの少なくとも1つのカテゴリ内でのフィルタ処理の改善パフォーマンスの提供に応じて選択される、付記15に記載の装置。
(付記17)
前記改善パフォーマンスが、前記画像と前記画像の前記再構成バージョンとの間の歪み測度を最小にすることによって提供される、付記16に記載の装置。
(付記18)
前記少なくとも1つの画素の前記分類が、前記少なくとも1つの画素に対応する、方向、大きさ、異方性/等方性、コントラスト、及び、傾度のうちの少なくとも1つに応じて決定される、付記15に記載の装置。
(付記19)
フィルタ係数が、画像毎に適応的に調整されて、1つ以上の高レベルのシンタックス要素を使用して示される、付記15に記載の装置。
(付記20)
フィルタ係数が、オフラインで調整されて、前記符号器と対応する復号器との双方に記憶される、付記15に記載の装置。
(付記21)
前記フィルタ処理が、ブロック適応ループ・フィルタ処理、或いは、クアッドツリー(四部木)適応ループ・フィルタ処理と共に行われる、付記15に記載の装置。
(付記22)
ビデオ復号器に於ける方法であって、
画像を復号するステップを含み、
前記復号するステップは、
量子化変換係数を受信するステップ(415)と、 前記量子化変換係数を逆量子化し逆変換して残差の再構成バージョンを得るステップ(415)と、
前記残差の前記再構成バージョンと少なくとも1つの参照画像とを合成して当該画像の再構成バージョンを得るステップ(415)と、
局所的な幾何学的特徴に応じた複数のカテゴリのうちのそれぞれのカテゴリ内で前記画像の前記再構成バージョン内の画素を分類するステップ(420,620,820)と、
少なくとも1つの選択された画素を、前記複数のカテゴリについて、前記少なくとも1つの画素の対応する分類に応じてフィルタ処理するステップ(450,640,850)と、を含む前記方法。
(付記23)
フィルタ係数が、適応的であり、前記複数のカテゴリのうちの少なくとも1つのカテゴリ内でのフィルタ処理の改善パフォーマンスの提供に応じて選択される、付記22に記載の方法。
(付記24)
前記改善パフォーマンスが、前記画像と前記画像の前記再構成バージョンとの間の歪み測度を最小にすることによって提供される、付記23に記載の方法。
(付記25)
前記少なくとも1つの画素の前記分類が、前記少なくとも1つの画素に対応する、方向、大きさ、異方性/等方性、コントラスト、及び、傾度のうちの少なくとも1つに応じて決定される、付記22に記載の方法。
(付記26)
フィルタ係数が、画像毎に適応的に調整されて、1つ以上の高レベルのシンタックス要素を使用して示される、付記22に記載の方法。
(付記27)
フィルタ係数が、オフラインで調整されて、前記符号器と対応する復号器との双方に記憶される、付記22に記載の方法。
(付記28)
前記フィルタ処理が、ブロック適応ループ・フィルタ処理、或いは、クアッドツリー(四部木)適応ループ・フィルタ処理と共に行われる(855)、付記22に記載の方法。
(付記29)
符号化されたビデオ信号データを有するコンピュータ読み取り可能な非一時的な記憶媒体であって、
入力画像の残差を変換し量子化して量子化変換係数を得、前記量子化変換係数を逆量子化し逆変換して前記残差の再構成バージョンを得、前記残差の前記再構成バージョンと少なくとも1つの参照画像とを合成して前記入力画像の再構成バージョンを得、局所的な幾何学的特徴に応じた複数のカテゴリのうちのそれぞれのカテゴリ内で前記入力画像の前記再構成バージョン内の画素を分類し、少なくとも1つの選択された画素を、前記複数のカテゴリについて、前記少なくとも1つの画素の対応する分類に応じてフィルタ処理することによって符号化された前記入力画像を含む、前記記憶媒体。