(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022189535
(43)【公開日】2022-12-22
(54)【発明の名称】符号化装置及び方法
(51)【国際特許分類】
H04N 19/11 20140101AFI20221215BHJP
H04N 19/136 20140101ALI20221215BHJP
H04N 19/176 20140101ALI20221215BHJP
H04N 19/147 20140101ALI20221215BHJP
H04N 19/593 20140101ALI20221215BHJP
【FI】
H04N19/11
H04N19/136
H04N19/176
H04N19/147
H04N19/593
【審査請求】未請求
【請求項の数】15
【出願形態】OL
(21)【出願番号】P 2021098164
(22)【出願日】2021-06-11
(71)【出願人】
【識別番号】000001007
【氏名又は名称】キヤノン株式会社
(74)【代理人】
【識別番号】110003281
【氏名又は名称】弁理士法人大塚国際特許事務所
(72)【発明者】
【氏名】川上 雅司
【テーマコード(参考)】
5C159
【Fターム(参考)】
5C159MA04
5C159MA05
5C159MA21
5C159MA23
5C159MC11
5C159ME01
5C159TA31
5C159TB08
5C159TC02
5C159TC18
5C159TC26
5C159TC27
5C159TC42
5C159TD04
5C159TD12
5C159UA02
5C159UA16
(57)【要約】
【課題】 符号量を削減しつつ、符号化対象ブロックと隣接ブロックとのサイズ等が大きく異なっている場合に予測精度の劣化を低減すること。
【解決手段】 入力画像を複数の画素で構成された複数の符号化対象のブロックに分割し、当該ブロック毎に符号化処理を行う符号化装置であって、イントラ予測により、異なる複数の予測モードで、符号化対象ブロックに隣接する符号化済みの参照ブロックを参照して、前記符号化対象ブロックの符号化を行うと共に、前記複数の予測モードのうち、符号化効率が最も高い予測モードでの符号化の結果を出力する第1の符号化手段と、前記参照ブロックと前記符号化対象ブロックとの違いに基づいて、前記複数の予測モードのうち、予め決められた予測モードを優遇するかどうかを判断する判断手段と、を有し、前記第1の符号化手段は、前記判断手段により優遇すると判断された予測モードの符号化効率が高くなるように調整する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
入力画像を複数の画素で構成された複数の符号化対象のブロックに分割し、当該ブロック毎に符号化処理を行う符号化装置であって、
イントラ予測により、異なる複数の予測モードで、符号化対象ブロックに隣接する符号化済みの参照ブロックを参照して、前記符号化対象ブロックの符号化を行うと共に、前記複数の予測モードのうち、符号化効率が最も高い予測モードでの符号化の結果を出力する第1の符号化手段と、
前記参照ブロックと前記符号化対象ブロックとの違いに基づいて、前記複数の予測モードのうち、予め決められた予測モードを優遇するかどうかを判断する判断手段と、を有し、
前記第1の符号化手段は、前記判断手段により優遇すると判断された予測モードが選択され易くなるように前記符号化効率を調整することを特徴とする符号化装置。
【請求項2】
前記第1の符号化手段は、複数の前記参照ブロックを参照して符号化を行い、
前記判断手段は、
前記複数の参照ブロックが同じ予測モードで符号化されたかどうかを判定し、
前記複数の参照ブロックが同じ予測モードで符号化され、且つ、前記複数の参照ブロックそれぞれと前記符号化対象ブロックとの大きさの差が、いずれも第1の閾値よりも小さい場合に、前記予め決められた予測モードを優遇すると判断することを特徴とする請求項1に記載の符号化装置。
【請求項3】
前記第1の符号化手段は、複数の前記参照ブロックを参照して符号化を行い、
前記判断手段は、
前記複数の参照ブロックが同じ予測モードで符号化されたかどうかを判定し、
前記複数の参照ブロックそれぞれの特徴量と、前記符号化対象ブロックの特徴量とを求め、
前記複数の参照ブロックが同じ予測モードで符号化され、且つ、前記複数の参照ブロックそれぞれと前記符号化対象ブロックとの大きさの差が、いずれも第1の閾値よりも小さく、且つ、前記複数の参照ブロックそれぞれと前記符号化対象ブロックとの特徴量の差が、いずれも第2の閾値よりも小さい場合に、前記予め決められた予測モードを優遇すると判断することを特徴とする請求項1に記載の符号化装置。
【請求項4】
前記符号化は、H.265の規格に基づいており、前記複数の参照ブロックの予測モードが同じであって、かつ、当該予測モードの値が2未満の場合に、前記予め決められた予測モードは、予測モード0、予測モード1、予測モード2であることを特徴とする請求項2または3に記載の符号化装置。
【請求項5】
前記符号化は、H.265の規格に基づいており、前記複数の参照ブロックの予測モードが同じであって、かつ、当該予測モードの値が2未満ではない場合に、前記予め決められた予測モードは、前記複数の参照ブロックの予測モードと、当該予測モードより1大きい予測モードと、当該予測モードより1小さい予測モードであることを特徴とする請求項2乃至4のいずれか1項に記載の符号化装置。
【請求項6】
前記第1の符号化手段は、複数の前記参照ブロックを参照して符号化を行い、
前記判断手段は、
前記複数の参照ブロックが同じ予測モードで符号化されたかどうかを判定し、
前記複数の参照ブロックが異なる予測モードで符号化されている場合、前記予め決められた予測モードは前記複数の参照ブロックの予測モードを含み、前記複数の参照ブロックのうち、前記符号化対象ブロックとの大きさの差が、第1の閾値よりも小さい参照ブロックの予測モードを優遇すると判断することを特徴とする請求項1乃至5のいずれか1項に記載の符号化装置。
【請求項7】
前記第1の符号化手段は、複数の前記参照ブロックを参照して符号化を行い、
前記判断手段は、
前記複数の参照ブロックが同じ予測モードで符号化されたかどうかを判定し、
前記複数の参照ブロックそれぞれの特徴量と、前記符号化対象ブロックの特徴量とを求め、
前記複数の参照ブロックが異なる予測モードで符号化されている場合、前記予め決められた予測モードは前記複数の参照ブロックの予測モードを含み、前記複数の参照ブロックのうち、前記符号化対象ブロックとの大きさの差が、第1の閾値よりも小さく、且つ、前記符号化対象ブロックとの特徴量の差が、第2の閾値よりも小さい参照ブロックの予測モードを優遇すると判断することを特徴とする請求項1乃至5のいずれか1項に記載の符号化装置。
【請求項8】
前記符号化は、H.265の規格に基づいており、前記複数の参照ブロックの予測モードが異なる場合、前記予め決められた予測モードは、更に、前記複数の参照ブロックの予測モードがいずれも予測モード0でない場合には予測モード0、前記複数の参照ブロックの予測モードのいずれも予測モード1でない場合には予測モード1、それ以外の場合には予測モード26を含み、前記判断手段は、当該予測モードを優遇すると判断することを特徴とする請求項6または7に記載の符号化装置。
【請求項9】
前記特徴量は、分散値であることを特徴とする請求項3または7に記載の符号化装置。
【請求項10】
前記第1の符号化手段は、前記複数の予測モードそれぞれについて、前記符号化効率を示すコストを算出し、コストが低いほど、より高い符号化効率を示すことを特徴とする請求項1乃至9のいずれか1項に記載の符号化装置。
【請求項11】
前記第1の符号化手段は、優遇する予測モードのコストを算出する際に
コスト=SAD+λ*binsMPM
を用い、それ以外の予測モードのコストを算出する際に
コスト=SAD+λ*bins
を用い、SADは符号化対象ブロックと参照ブロックとの差分絶対値和、λは重み付け係数、binsは予測モードの符号量、binsMPMは優遇する予測モードの符号量、bins>binsMPMであることを特徴とする請求項10に記載の符号化装置。
【請求項12】
インター予測により入力画像の符号化を行う第2の符号化手段を更に有することを特徴とする請求項1乃至11のいずれか1項に記載の符号化装置。
【請求項13】
入力画像を複数の画素で構成された複数の符号化対象のブロックに分割し、当該ブロック毎に符号化処理を行う符号化方法であって、
符号化手段が、イントラ予測により、異なる複数の予測モードで、符号化対象ブロックに隣接する符号化済みの参照ブロックを参照して、前記符号化対象ブロックの符号化を行うと共に、前記複数の予測モードのうち、符号化効率が最も高い予測モードでの符号化の結果を出力する符号化工程と、
判断手段が、前記参照ブロックと前記符号化対象ブロックとの違いに基づいて、前記複数の予測モードのうち、予め決められた予測モードを優遇するかどうかを判断する判断工程と、を有し、
前記符号化工程は、前記判断工程で優遇すると判断された予測モードが選択され易くなるように前記符号化効率を調整することを特徴とする符号化方法。
【請求項14】
コンピュータを、請求項1乃至12のいずれか1項に記載の符号化装置の各手段として機能させるためのプログラム。
【請求項15】
請求項14に記載のプログラムを記憶したコンピュータが読み取り可能な記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は符号化装置及び方法に関し、特に映像信号を符号化する符号化装置及び方法に関するものである。
【背景技術】
【0002】
近年、デジタルカメラやデジタルカムコーダーにおいて、H.265やH.266に代表される高能率符号化方式が採用されている(非特許文献1及び非特許文献2参照)。H.265におけるイントラ予測では、隣接ブロックの予測モードからMPM(Most Probable Mode)を求め、予測モードの符号量を削減する仕組みが導入されている。MPMは周辺の隣接ブロックから求めるため、隣接ブロックの予測モードと近い予測モードになることが規格で定められている。
【0003】
予測モードがMPMと一致すると符号量が削減されるため、予測モードを選択する際にMPMが選ばれやすくする技術がある。予測モードの選択は、予測ブロック毎に、Planer予測(予測モード0)、DC予測(予測モード1)、及びAngular予測(予測モード2~34)の全35モードについて、それぞれのコストを算出し、最もコストが小さい予測モードを選択する方法が一般的である。コストは、式(1)により求められる。
【0004】
コスト=SAD+λ*bins …(1)
式(1)において、SADは原画像と予測画像との差分絶対値和、λは重み付け係数、binsは予測モードの符号量である。特許文献1には、MPMと一致する予測モードのコストを求める際に、binsを小さくすることでMPMのコストを小さくしてMPMが選択されやすいようにする技術が開示されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】国際公開第2018/047952号明細書
【非特許文献】
【0006】
【非特許文献1】ITU-T:"SERIES H: AUDIOVISUAL AND MULTIMADIA SYSTEMS Infrastructure of audiovisual services - Coding of moving video"、High efficiency video coding Recommendation ITU-T H.265、02/2018
【非特許文献2】ITU-T:"SERIES H: AUDIOVISUAL AND MULTIMADIA SYSTEMS Infrastructure of audiovisual services - Coding of moving video"、Versatile video coding Recommencation ITU-T H.266 08/2020
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、符号化対象ブロックと隣接ブロックとのサイズが大きく異なっている場合は、隣接ブロックの予測モードを基に生成しているMPMの予測モードを選択すると予測の精度が落ちる、という課題がある。
【0008】
本発明は上記問題点を鑑みてなされたものであり、符号量を削減しつつ、符号化対象ブロックと隣接ブロックとのサイズ等が大きく異なっている場合に予測精度の劣化を低減することを目的とする。
【課題を解決するための手段】
【0009】
上記目的を達成するために、入力画像を複数の画素で構成された複数の符号化対象のブロックに分割し、当該ブロック毎に符号化処理を行う本発明の符号化装置は、イントラ予測により、異なる複数の予測モードで、符号化対象ブロックに隣接する符号化済みの参照ブロックを参照して、前記符号化対象ブロックの符号化を行うと共に、前記複数の予測モードのうち、符号化効率が最も高い予測モードでの符号化の結果を出力する第1の符号化手段と、前記参照ブロックと前記符号化対象ブロックとの違いに基づいて、前記複数の予測モードのうち、予め決められた予測モードを優遇するかどうかを判断する判断手段と、を有し、前記第1の符号化手段は、前記判断手段により優遇すると判断された予測モードが選択され易くなるように前記符号化効率を調整する。
【発明の効果】
【0010】
本発明によれば、符号量を削減しつつ、符号化対象ブロックと隣接ブロックとのサイズ等が大きく異なっている場合に予測精度の劣化を低減することができる。
【図面の簡単な説明】
【0011】
【
図1】本発明の第1の実施形態に係る符号化部及びその周辺モジュールの機能構成例を示すブロック図。
【
図2】第1の実施形態において判断部により実行される優遇決定処理のフローチャート。
【
図3】第1の実施形態における優遇決定処理0の詳細なフローチャート。
【
図4】第1の実施形態における優遇決定処理1の詳細なフローチャート。
【
図5】第1の実施形態における優遇決定処理2の詳細なフローチャート。
【
図6】第2の実施形態に係る符号化部及びその周辺モジュールの機能構成例を示すブロック図。
【
図7】第2の実施形態において判断部により実行される優遇決定処理0の一部処理を示すフローチャート。
【
図8】第2の実施形態において判断部により実行される優遇決定処理1の一部処理を示すフローチャート。
【
図9】第2の実施形態において判断部により実行される優遇決定処理2の一部処理を示すフローチャート。
【発明を実施するための形態】
【0012】
以下、添付図面を参照して実施形態を詳しく説明する。なお、以下の実施形態は特許請求の範囲に係る発明を限定するものではない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。
【0013】
<第1の実施形態>
以下、本発明の第1の実施形態について説明する。
【0014】
●装置構成
まず、第1の実施形態における、本発明を適用可能な符号化装置を
図1を用いて説明する。
図1は、本発明の第1の実施形態に係る符号化処理部100及びその周辺モジュールの機能構成例を示すブロック図である。なお、符号化処理部100と、その周辺モジュールである撮像部101、及び記録媒体116、制御部117は、いずれも符号化装置(不図示)に収容され、制御部117は符号化処理部100を制御する。記録媒体116は、例えば不揮発性メモリで構成される記録メディアである。
【0015】
撮像部101は、レンズ光学系と、レンズ光学系から入射する光を電気信号に変換するイメージセンサとを含む。レンズ光学系は、複数枚の光学レンズ、絞り、フォーカス制御部、及びレンズ駆動部を含む。撮像部101では、イメージセンサにより得られた電気信号がデジタル信号に変換されて画像データが生成され、生成された画像データに対して現像処理を行うことで、符号化処理部100の入力画像(原画像)が生成される。なお、イメージセンサの構成は特に限定されず、例えば、CCDイメージセンサやCMOSセンサ等のイメージセンサにより構成される。また、現像処理には、デモザイク処理、ノイズ除去処理、光学歪補正処理、色補正処理等の処理が含まれる。
【0016】
加算器102は、撮像部101から入力した原画像と、後述する選択器115から出力される予測画像との差分画像を生成する。選択器により選択される予測画像は、イントラ予測部110もしくはインター予測部114で生成される。
【0017】
直交変換部103は、加算器102で生成された差分画像のデータに対して、例えば離散コサイン変換(DCT変換)や離散サイン変換(DST変換)等の直交変換を行う。
量子化部104は、直交変換部103にて直交変換により生成された変換係数に対して、量子化処理を施し、主に高周波成分の情報を落とし、圧縮を行う。
エントロピー符号化部105は、量子化部104で量子化処理が施された変換係数や、動きベクトル等の予測モードに応じた符号化過程で生じる符号化パラメータを入力とし、規格で定められた手順でエントロピー符号化を行う。そして、エントロピー符号化して得られたデータは、記録媒体116に記録される。
【0018】
逆量子化部106は、量子化部104で量子化処理された変換係数に対して逆量子化処理を行う。
逆直交変換部107は、逆量子化部106で逆量子化処理された変換係数に対して逆直交変換を行い、差分画像を生成する。
加算器108は、逆直交変換部107で生成された差分画像と、選択器115から出力される予測画像とを加算し、局所復号画像(ローカルデコード画像)を生成する。
【0019】
イントラ用メモリ109は、イントラ予測用で参照される可能性がある領域のローカルデコード画像を保持する。
イントラ予測部110は、原画像を複数のブロックに分割し、符号化対象ブロックとイントラ用メモリ109から入力した符号化対象ブロックの周辺ブロック(参照ブロック)とを用いて、イントラ予測を行う。イントラ予測では、予測を行うブロックサイズや周辺ブロックの画像から予測画像を生成する際の方向や方法を意味する予測モードを選択する。予測モードを選択する際には、予測モード毎にコスト式を用いて符号化効率を示すコストを算出し、コストが最小となる予測モードを選択する。なお、イントラ予測部110で用いる予測モードは、H.265規格に準じた、Planer予測(予測モード0)、DC予測(予測モード1)、及びAngular予測(予測モード2~34)の全35モードとする。
【0020】
判断部111は、イントラ予測部110から予測ブロックサイズと周辺画素ブロックサイズとを入力し、イントラ予測部110でコストを算出する際に、MPMの予測モードを優遇するかどうかを判断する。なお、ここで行われる動作及び制御方法については後述する。
【0021】
ループフィルタ112は、ローカルデコード画像にフィルタ処理を施し、ブロックノイズを除去する。これにより、参照画像として使用されるローカルデコード画像の品質を向上することができる。フィルタ処理後のローカルデコード画像はフレームメモリ113に出力する。
フレームメモリ113は、ループフィルタ112によるフィルタ処理後のローカルデコード画像を記憶する。フレームメモリ113は、イントラ用メモリ109よりも多くの領域を有し、複数フレーム分のフィルタ処理後のローカルデコード画像を記憶することができる。記憶されているローカルデコード画像は、インター予測時に参照画像として使用される。
インター予測部114は、原画像とフレームメモリ113から入力した参照画像とを用いて、インター予測を行う。インター予測部114は、動きベクトルを検出する動きベクトル検出部や、動きベクトル検出部で検出された動きベクトルを用いて予測画像を生成する補償部等で構成される。
【0022】
選択器115は、イントラ予測部110によるイントラ予測の予測画像と、インター予測部114によるインター予測の予測画像のいずれかを選択する。
【0023】
●優遇決定処理
続いて、判断部111で行う動作及び制御方法について、
図2乃至
図5を用いて説明する。判断部111では、イントラ予測部110が予測モードを選択するために算出するコストのうち、MPMの予測モードを優遇するかどうかを判断する処理を行う。
【0024】
MPMの予測モードを優遇するかどうかの判断は、符号化対象ブロックと隣接ブロックのサイズを比較して行う。サイズが大きく異なる場合は、符号化対象ブロックと隣接ブロックの性質が異なる可能性が高く、MPMの予測モードを優遇しない方が良いケースが多いと考えられる。
以下、符号化対象ブロックの左隣接ブロックをAブロック、上隣接ブロックをBブロックと呼び、本実施形態におけるMPMの予測モードの優遇の有無について説明する。
【0025】
まず、
図2のフローチャートを参照して、優遇決定処理のメインフローについて説明する。AブロックとBブロックは符号化済みのブロックであるため、予測モードは決定済みである。S201では、Aブロックの予測モードとBブロックの予測モードが等しいかどうかを判断する。AブロックとBブロックの予測モードが等しい場合(S201でYes)、S202に進んで、AブロックとBブロックの予測モードの値が2未満かどうかを判断する。
【0026】
AブロックとBブロックの予測モードの値が2未満である場合(S202でYes)、S203において優遇決定処理0を実行する。H.265規格では、AブロックとBブロックの予測モードによって、3つのMPMが決定される。このS203が実行される場合、1つ目のMPM(以下、MPM[0])は予測モード0、2つ目のMPM(以下、MPM[1])は予測モード1、3つ目のMPM(以下、MPM[2])は予測モード26である。なお、優遇決定処理0の詳細については、
図3を参照して後述する。
【0027】
一方、AブロックとBブロックの予測モードの値が2未満でない場合(S202でNo)、S204において優遇決定処理1を実行する。このS204が実行される場合、MPM[0]は、AブロックとBブロックの予測モードとなる。また、MPM[1]は、次式(2)で決定される。
【0028】
MPM[1]=2+((AまたはBブロックの予測モード+29)%32) …(2)
式(2)の結果、MPM[1]は、AとBの予測モードよりも1小さな予測モードになる。
また、MPM[2]は、次の式で決定される。
【0029】
MPM[2]=2+((AまたはBブロックの予測モード-2+1)%32) …(3)
式(3)の結果、MPM[2]は、AとBの予測モードよりも1大きな予測モードになる。
なお、優遇決定処理1の詳細については、
図4を参照して後述する。
【0030】
AブロックとBブロックの予測モードが等しくない場合(S201でNo)、S205において優遇決定処理2を実行する。このS205が実行される場合、MPM[0]はAブロックの予測モード、MPM[1]はBブロックの予測モードとなる。そして、MPM[2]は、Aブロック及びBブロックの予測モードがいずれも予測モードが0でない場合は予測モード0、Aブロック及びBブロックの予測モードがいずれもいずれも予測モードが1でない場合は予測モード1、それ以外は予測モード26となる。なお、優遇決定処理2の詳細については、
図5を参照して後述する。
【0031】
優遇決定処理0
続いて、
図3を参照して、S203で行われる優遇決定処理0について説明する上述したようにH.265規格により、優遇決定処理0では、開始時点でMPM[0]が0、MPM[1]が1、MPM[2]が26に決まっている。
また、以下の説明において、64x64画素ブロックのサイズを一辺の長さを用いて「64」と表現する。同様に、32x32画素ブロックは32、16x16画素ブロックは16、8x8画素ブロックは8、4x4画素ブロックは4としてサイズを表現する。
【0032】
S301では、Aブロックのサイズと符号化対象ブロックのサイズの差分絶対値を求め、閾値Th0よりも大きいかどうか判断する。ここでYesと判断された場合は、符号化対象ブロックとAブロックとのサイズ差が大きいことを意味している。なお、閾値Th0は制御部117から与えることができ、適宜変更が可能である。
【0033】
例えば、符号化対象ブロックのサイズが64で閾値Th0を30とすると、Aブロックのサイズが64のときはNoとなり、符号化対象ブロックと左隣接ブロックとの間に大きなサイズ差がないことを意味している。また、Aブロックのサイズが32以下のときはYesとなり、符号化対象ブロックと左隣接ブロックとの間に大きなサイズ差があることを意味している。
【0034】
また、例えば、符号化対象ブロックのサイズが32で閾値Th0が20とすると、Aブロックのサイズが32や16の場合はNoとなり、符号化対象ブロックと左隣接ブロックとの間に大きなサイズ差がないことを意味している。また、Aブロックのサイズが64のとき、及び、8、4の場合はYesとなり、符号化対象ブロックと左隣接ブロックとの間に大きなサイズ差があることを意味している。
【0035】
Aブロックのサイズと符号化対象ブロックのサイズの差分絶対値が閾値Th0よりも大きい場合(S301でYes)、S303に進み、予測モード0、1、26(MPM[0]、MPM[1]、MPM[2])の優遇は行わない。このように、Aブロックと符号化対象ブロックのサイズ差が大きい場合には、MPMを優遇しない。
【0036】
ここで、予測モードの優遇について説明する。前述したようにイントラ予測部110では、上述した式(1)により、予測モード毎にコストを算出している。
【0037】
コスト=SAD+λ*bins …(1)
これに対し、MPMの予測モードのときは下式(4)を用いる。
【0038】
コスト=SAD+λ*binsMPM …(4)
ここでは、予測モードの符号量binsMPMを、bins>binsMPMを満たす値とすることで、予測モードがMPMのときに得られるコストを下げ、MPMが選択され易くなるように調整する。
【0039】
判断部111は、S303に進んだときにイントラ予測部110に対し、MPMである予測モード0、1、26のコストを小さくする処理を行わないように指示を出す。つまり、予測モード0、1、26のコストを算出する際にも、式(4)ではなく、式(1)を使うように指示を出す。
【0040】
なお、binsMPMは固定値ではなく、場合によって値が変化する構成でも良い。例えば、予測モード0のときのbinsMPMをbinsMPM0、予測モード1のときをbinsMPM1、予測モード26のときをbinsMPM26として、S303において、binsMPM1<binsMPM0<binsMPM26の関係になるようにbinsMPMを変動させても良い。こうすることでモード毎に選ばれやすさの度合いを変えることができる。
【0041】
一方、Aブロックのサイズと符号化対象ブロックのサイズの差分絶対値が閾値Th0以下の場合(S301でNo)、S302においてBブロックのサイズと符号化対象ブロックのサイズの差分絶対値を求め、閾値Th0よりも大きいかどうかを判断する。なお、ここではS301で用いた閾値Th0を用いているが、別の値を用いる構成でも良い。
【0042】
Bブロックのサイズと符号化対象ブロックのサイズの差分絶対値が、閾値Th0よりも大きい場合(S302でYes)はS303に進み、上述した制御を行う。一方、閾値Th0以下の場合(S302でNo)、符号化対象ブロックのサイズ、Aブロック、Bブロックのサイズには大きな差が無い。そのため、S304に進んで、予測モード0、1、26の全てのMPMを優遇し、式(4)を用いてコストを算出するように指示する。
【0043】
優遇決定処理1
続いて、
図4を参照して、S204で行われる優遇決定処理1について説明する。上述したように、優遇決定処理1では、開始時点でMPM[0]がAブロック(=Bブロック)の予測モード、MPM[1]がAブロック(=Bブロック)の予測モードよりも1小さい予測モード、MPM[2]がAブロック(=Bブロック)の予測モードよりも1大きい予測モードに決まっている。
【0044】
S401では、Aブロックのサイズと符号化対象ブロックのサイズとの差分絶対値を求め、閾値Th0よりも大きいかどうか判断する。閾値Th0よりも大きい場合(S401でYes)、AブロックとBブロックの予測モード(MPM[0])と周辺モード(MPM[1]、MPM[2])は優遇しない(S403)。この場合、MPM[0]、MPM[1]、MPM[2]全てのコスト計算に式(1)を使用するように指示する。
【0045】
一方、Aブロックのサイズと符号化対象ブロックのサイズの差分絶対値が閾値Th0以下の場合(S401でNo)、S402においてBブロックのサイズと符号化対象ブロックのサイズの差分絶対値を求め、閾値Th0よりも大きいかどうか判断する。閾値Th0よりも大きい場合(S402でYes)はS403に進み、上述した制御を行う。一方、閾値Th0以下の場合(S402でNo)、AブロックとBブロックの予測モード(MPM[0])と周辺モード(MPM[1]、MPM[2])を優遇する(S404)。この場合、MPM[0]、MPM[1]、MPM[2]全てのコスト計算で式(4)を使用するように指示する。
【0046】
優遇決定処理2
次に、
図5を参照して、S205で行われる優遇決定処理2について説明する。上述したように、優遇決定処理2では、開始時点でMPM[0]がAブロックの予測モード、MPM[1]がBブロックの予測モード、MPM[2]がモード0もしくは1もしくは26のいずれかの予測モードに決まっている。
【0047】
S501では、Aブロックのサイズと符号化対象ブロックのサイズとの差分絶対値を求め、閾値Th0よりも大きいかどうか判断する。閾値Th0よりも大きい場合(S501でYes)、S502において、Aブロックの予測モード(MPM[0])は優遇せず、コスト計算で式(1)を使用するように指示する。一方、閾値Th0以下の場合(S501でNo)、S503において、Aブロックの予測モード(MPM[0])を優遇し、コスト計算で式(4)を使用するように指示する。
【0048】
また、S504において、Bブロックのサイズと符号化対象ブロックのサイズの差分絶対値を求め、閾値Th0よりも大きいかどうか判断する。閾値Th0よりも大きい場合(S504でYes)、S505において、Bブロックの予測モード(MPM[1])は優遇せず、コスト計算で式(1)を使用するように指示する。一方、閾値Th0以下の場合(S504でNo)、S506において、Bブロックの予測モード(MPM[1])を優遇し、コスト計算で式(4)を使用するように指示する。
【0049】
最後に、S507において、Aブロック及びBブロックのサイズと、符号化対象ブロックのサイズの違いに関わらず、MPM{2}を優遇し、コスト計算で式(4)を使用するように指示する。
【0050】
なお、上述した
図4及び
図5では、閾値Th0をサイズの比較に用いるものとして説明したが、本発明はこれに限られるものでは無く、異なる閾値を用いても良い。
上記の通り第1の実施形態によれば、符号化対象ブロックのサイズと隣接ブロックのサイズとの差に応じてMPMの予測モードを優遇するかしないかを選択する。これにより隣接ブロックと符号化対象ブロックのサイズが大きく変わらない場合に符号量を削減しつつ、サイズが大きく異なっている場合の予測精度の劣化を低減することが可能となる。
【0051】
<第2の実施形態>
次に、本発明の第2の実施形態について説明する。
【0052】
●装置構成
図6は、第2の実施形態における符号化処理部600及び装置の機能構成を示す図である。第2の実施形態における符号化処理部600は、
図1に示した符号化処理部100とに対し、特徴抽出部617が追加されている点が異なると共に、判断部611における制御方法が異なる。それ以外の構成は
図1に示したものと同様であるので、同じ参照番号を付して説明を省略する。
【0053】
特徴抽出部617は、撮像部101から出力される原画像とイントラ用メモリ109から入力される周辺画像とを用いて、特徴検出を行う。なお、ここで検出される特徴は、例えば分散、エッジ、明暗等である。そして、特徴抽出部617により抽出された特徴情報を判断部611に出力する。判断部611は、第1の実施形態で説明した判断部111に対し、入力された特徴情報に応じてMPMの予測モードを優遇するかどうかを判断する処理を追加して行う。これは、符号化対象ブロックと隣接ブロックの特徴が異なる場合、MPMの予測モードを優遇しない方が良いケースが多いと考えられるからである。
【0054】
以下、特徴抽出部617において特徴情報として分散を検出するものとして説明する
分散は、所定のブロックサイズで計算し、分散値が高い場合、ブロック内の画素値がバラバラであり、複雑な絵柄を有するブロックとみなすことができる。逆に分散値が低い場合、ブロック内の画素値は均一的であり、平坦な絵柄を有するブロックとみなすことができる。高分散なブロックは符号化難易度が上がり、低分散なブロックは符号化難易度が下がる傾向にある。
【0055】
●優遇決定処理
次に、本第2の実施形態における優遇決定処理について説明する。なお、第2の実施形態における優遇決定処理では、判断部611が特徴抽出部617から入力された特徴情報を用いて判断を行うところが異なる。これに伴い、
図3~
図5の優遇決定処理0、優遇決定処理1、優遇決定処理2の代わりに、
図7~
図9に示す優遇決定処理0、優遇決定処理1、優遇決定処理2を実行する。
【0056】
優遇決定処理0
図7は、第2の実施形態における優遇決定処理0を示すフローチャートである。第2の実施形態における優遇決定処理0では、
図3で示した優遇決定処理0のS304の前に、更に、特徴抽出部617から入力された特徴情報に応じて、予測モード0、1、26(MPM[0]、MPM[1]、MPM[2])を優遇するか否かを判定する。なお、これ以外の処理は
図3に示す処理と同様であるため、同じステップ番号を付して説明を省略する。
【0057】
S701では、Aブロックの分散値(特徴量)と符号化対象ブロックの分散値(特徴量)との差分絶対値が閾値ThVarよりも大きいかどうか判断する。閾値ThVar以下の場合(S701でNo)、S702に進み、Bブロックの分散値(特徴量)と符号化対象ブロックの分散値(特徴量)との差分絶対値が閾値ThVarよりも大きいかどうか判断する。
【0058】
Bブロックの分散値と符号化対象ブロックの分散値の差分絶対値が、閾値ThVar以下の場合(S702でNo)、S304に進んで、予測モード0、1、26(MPM[0]、MPM[1]、MPM[2])を優遇する。つまり、予測モード0、1、26のコスト計算は、式(4)を使って行うように指示する。
【0059】
一方、Aブロック及びBブロックの分散値と符号化対象ブロックの分散値との差分絶対値の少なくともいずれかが閾値ThVarよりも大きい場合(S701またはS702でYes)、S303に進んで、予測モード0、1、26(MPM[0]、MPM[1]、MPM[2])の優遇は行わない。すなわち、予測モード0、1、26のコスト計算は、式(4)ではなく、式(1)を使って行うように指示する。
【0060】
優遇決定処理1
図8は、第2の実施形態における優遇決定処理1を示すフローチャートである。第2の実施形態における優遇決定処理1では、
図4で示した優遇決定処理1のS404の前に、更に、特徴抽出部617から入力された特徴情報に応じて、AブロックとBブロックの予測モード(MPM[0])と周辺モード(MPM[1]、MPM[2])を優遇するか否かを判定する。なお、これ以外の処理は
図4に示す処理と同様であるため、同じステップ番号を付して説明を省略する。
【0061】
S801では、Aブロックの分散値(特徴量)と符号化対象ブロックの分散値(特徴量)との差分絶対値が閾値ThVarよりも大きいかどうか判断する。閾値ThVar以下の場合(S801でNo)、S802に進み、Bブロックの分散値(特徴量)と符号化対象ブロックの分散値(特徴量)との差分絶対値が閾値ThVarよりも大きいかどうか判断する。
【0062】
Bブロックの分散値と符号化対象ブロックの分散値の差分絶対値が、閾値ThVar以下の場合(S802でNo)、S404に進んで、AブロックとBブロックの予測モード(MPM[0])と周辺モード(MPM[1]、MPM[2])を優遇する。つまり、MPM[0]、MPM[1]、MPM[2]全てのコスト計算に式(4)を使用するように指示する。
【0063】
一方、Aブロック及びBブロックの分散値と符号化対象ブロックの分散値との差分絶対値の少なくともいずれかが閾値ThVarよりも大きい場合(S801またはS802でYes)、S403に進んで、AブロックとBブロックの予測モード(MPM[0]、MPM[1])と周辺モード(MPM[2])の優遇は行わない。この場合、MPM[0]、MPM[1]、MPM[2]全てのコスト計算に式(1)を使用するように指示する。
【0064】
優遇決定処理2
図9は、第2の実施形態における優遇決定処理2を示すフローチャートである。第2の実施形態における優遇決定処理2では、
図5で示した優遇決定処理2のS503及びS506の前に、更に、特徴抽出部617から入力された特徴情報に応じて、Aブロックの予測モード(MPM[0])及びBブロックの予測モード(MPM[1])優遇するか否かを判定する。なお、これ以外の処理は
図5に示す処理と同様であるため、同じステップ番号を付して説明を省略する。
【0065】
S901では、Aブロックの分散値(特徴量)と符号化対象ブロックの分散値(特徴量)との差分絶対値が閾値ThVarよりも大きいかどうか判断する。閾値ThVarより大きい場合(S901でYes)はS502に進み、閾値ThVar以下の場合(S901でNo)はS503に進んで、上述した処理を行う。
【0066】
また、S902では、Bブロックの分散値(特徴量)と符号化対象ブロックの分散値(特徴量)との差分絶対値が閾値ThVarよりも大きいかどうか判断する。閾値ThVarより大きい場合(S902でYes)はS505に進み、閾値ThVar以下の場合(S902でNo)はS506に進んで、上述した処理を行う。
【0067】
上記の通り第2の実施形態によれば、更に、符号化対象ブロックの画像の特徴量と周辺ブロックの画像の特徴量との差に応じて、MPMの予測モードを優遇するかしないかを判定する。これにより、第1の実施形態と同様の効果に加えて、隣接ブロックと符号化対象ブロックの画像の特徴量が大きく異なっていても、予測精度の劣化を低減することが可能となる。
【0068】
<他の実施形態>
なお、本発明は、複数の機器(例えばホストコンピュータ、インターフェイス機器、スキャナ、ビデオカメラなど)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機、ファクシミリ装置など)に適用してもよい。
【0069】
また、本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
【0070】
発明は上記実施形態に制限されるものではなく、発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、発明の範囲を公にするために請求項を添付する。
【符号の説明】
【0071】
100:符号化処理部、101:撮像部、102,108:加算器、103:直交変換部、104:量子化部、105:エントロピー符号化部、106:逆量子化部、107:逆直交変換部、109:イントラ用メモリ、110:イントラ予測部、111,611:判断部、112:ループフィルタ、113:フレームメモリ、114:インター予測部、115:選択器、116:記録媒体、117:制御部、617:特徴抽出部