IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本放送協会の特許一覧

<>
  • 特許-GOPサイズ決定装置及びプログラム 図1
  • 特許-GOPサイズ決定装置及びプログラム 図2
  • 特許-GOPサイズ決定装置及びプログラム 図3
  • 特許-GOPサイズ決定装置及びプログラム 図4
  • 特許-GOPサイズ決定装置及びプログラム 図5
  • 特許-GOPサイズ決定装置及びプログラム 図6
  • 特許-GOPサイズ決定装置及びプログラム 図7
  • 特許-GOPサイズ決定装置及びプログラム 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-07-11
(45)【発行日】2023-07-20
(54)【発明の名称】GOPサイズ決定装置及びプログラム
(51)【国際特許分類】
   H04N 19/114 20140101AFI20230712BHJP
   H04N 19/137 20140101ALI20230712BHJP
   H04N 19/14 20140101ALI20230712BHJP
   H04N 19/142 20140101ALI20230712BHJP
   H04N 19/177 20140101ALI20230712BHJP
   H04N 19/85 20140101ALI20230712BHJP
【FI】
H04N19/114
H04N19/137
H04N19/14
H04N19/142
H04N19/177
H04N19/85
【請求項の数】 5
(21)【出願番号】P 2019011610
(22)【出願日】2019-01-25
(65)【公開番号】P2020120334
(43)【公開日】2020-08-06
【審査請求日】2021-12-24
(73)【特許権者】
【識別番号】000004352
【氏名又は名称】日本放送協会
(74)【代理人】
【識別番号】100147485
【弁理士】
【氏名又は名称】杉村 憲司
(74)【代理人】
【識別番号】230118913
【弁護士】
【氏名又は名称】杉村 光嗣
(74)【代理人】
【識別番号】100161148
【弁理士】
【氏名又は名称】福尾 誠
(72)【発明者】
【氏名】松尾 康孝
【審査官】坂東 大五郎
(56)【参考文献】
【文献】米国特許出願公開第2002/0101929(US,A1)
【文献】特開2012-039569(JP,A)
【文献】特開2014-017739(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 19/00-19/98
(57)【特許請求の範囲】
【請求項1】
映像を符号化する際の前処理装置であって、前記符号化のGOPサイズを動的に決定するGOPサイズ決定装置において、
複数フレームの画像を時間方向及び空間方向に周波数分解して周波数分解画像を生成する時空間周波数分解部と、
前記周波数分解画像の高周波帯域内の要素値の分散値に第1の重みを乗じた値と、前記周波数分解画像の他の周波帯域内の要素値の分散値に前記第1の重みよりも小さい第2の重みを乗じた値との合計値を、パワー分散値として算出するパワー分散算出部と、
前記パワー分散値が大きいほど、GOPサイズが小さくなるように決定するGOPサイズ決定部と、
を備えることを特徴とするGOPサイズ決定装置。
【請求項2】
映像を符号化する際の前処理装置であって、前記符号化のGOPサイズを動的に決定するGOPサイズ決定装置において、
複数フレームの画像を時間方向及び空間方向に周波数分解して周波数分解画像を生成する時空間周波数分解部と、
高周波帯域内の要素値の重みが大きくなるように重み付けをした、前記周波数分解画像の全周波数帯域内の要素値の合計値を、トータルパワー値として算出するトータルパワー算出部と、
前記トータルパワー値が大きいほど、GOPサイズが小さくなるように決定するGOPサイズ決定部と、
を備えることを特徴とするGOPサイズ決定装置。
【請求項3】
映像を符号化する際の前処理装置であって、前記符号化のGOPサイズを動的に決定するGOPサイズ決定装置において、
複数フレームの画像を時間方向及び空間方向に周波数分解して周波数分解画像を生成する時空間周波数分解部と、
前記周波数分解画像の高周波帯域内の要素値の分散値に第1の重みを乗じた値と、前記周波数分解画像の他の周波帯域内の要素値の分散値に前記第1の重みよりも小さい第2の重みを乗じた値との合計値を、パワー分散値として算出するパワー分散算出部と、
高周波帯域内の要素値の重みが大きくなるように重み付けをした、前記周波数分解画像の全周波数帯域内の要素値の合計値を、トータルパワー値として算出するトータルパワー算出部と、
前記パワー分散値及び前記トータルパワー値が大きいほど、GOPサイズが小さくなるように決定するGOPサイズ決定部と、
を備えることを特徴とするGOPサイズ決定装置。
【請求項4】
入力された映像についてシーンチェンジが行われたフレームを特定するシーンチェンジ判定部をさらに備え、
前記時空間周波数分解部は、前記シーンチェンジ判定部により特定されたフレームから複数フレームの画像を時間方向及び空間方向に周波数分解して前記周波数分解画像を生成することを特徴とする、請求項1から3のいずれか一項に記載のGOPサイズ決定装置。
【請求項5】
コンピュータを、請求項1から4のいずれか一項に記載のGOPサイズ決定装置として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、GOP(Group of Pictures)サイズを動的に決定するGOPサイズ決定装置及びプログラムに関する。
【背景技術】
【0002】
従来、H.265/HEVC(High Efficiency Video Coding)などの符号化技術では、符号化効率を向上させるために、RD(Rate-Distortion)最適化において、RDが最小となる符号化パラメータを選定している。ここで、全ての符号化パラメータを探索すれば符号化効率を最大化することができるが、符号化時間の問題から実用的ではない。特に、GOPサイズを可変とする場合には、様々なGOPサイズに応じた符号化を行う必要があり、全ての符号化パラメータを探索するには非常に時間を要する。
【0003】
そこで、特許文献1には、蓄積手段に蓄積された各画像の小ブロック毎の代表値間の差分情報又は該各画像の画素差分情報の画面内総和から画像間の変化量を測定し、該測定された変化量が予め決められた閾値以上の場合に、フレーム内符号化モードでの符号化を行う画像を決定し、該フレーム内符号化された画像と次にフレーム内符号化される画像の直前の画像までを1GOPと決定する技術が開示されている。また、特許文献2には、入力画像の特徴に応じて適切なGOPサイズ、GOP構造をとることにより、符号化ビット量を制御することで、少ない遅延時間で高画質を実現できる可変ビットレート動画像符号化技術が開示されている。
【先行技術文献】
【特許文献】
【0004】
【文献】特許第3888533号公報
【文献】特許第3815665号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1及び特許文献2に開示された技術では、フレーム内で局所的にランダムな動きをする画像(例えば、飛び散る火花、水面の乱反射など)が含まれているような場合に、少ない遅延時間で入力画像の特徴に応じて適切なGOPサイズを制御することにより符号化効率を向上させることは困難であった。
【0006】
かかる事情に鑑みてなされた本発明の目的は、符号化時間を増大させることなく、最適なGOPサイズを動的に決定し、局所的にランダムな動きをする画像が含まれている場合であっても、符号化効率を向上させることが可能なGOPサイズ決定装置及びプログラムを提供することにある。
【課題を解決するための手段】
【0007】
上記課題を解決するため、本発明に係るGOPサイズ決定装置は、映像を符号化する際の前処理装置であって、前記符号化のGOPサイズを動的に決定するGOPサイズ決定装置において、複数フレームの画像を時間方向及び空間方向に周波数分解して周波数分解画像を生成する時空間周波数分解部と、前記周波数分解画像の高周波帯域内の要素値の分散値に第1の重みを乗じた値と、前記周波数分解画像の他の周波帯域内の要素値の分散値に前記第1の重みよりも小さい第2の重みを乗じた値との合計値を、パワー分散値として算出するパワー分散算出部と、前記パワー分散値が大きいほど、GOPサイズが小さくなるように決定するGOPサイズ決定部と、を備えることを特徴とする。
【0008】
また、上記課題を解決するため、本発明に係るGOPサイズ決定装置は、映像を符号化する際の前処理装置であって、前記符号化のGOPサイズを動的に決定するGOPサイズ決定装置において、複数フレームの画像を時間方向及び空間方向に周波数分解して周波数分解画像を生成する時空間周波数分解部と、高周波帯域内の要素値の重みが大きくなるように重み付けをした、前記周波数分解画像の全周波数帯域内の要素値の合計値を、トータルパワー値として算出するトータルパワー算出部と、前記トータルパワー値が大きいほど、GOPサイズが小さくなるように決定するGOPサイズ決定部と、を備えることを特徴とする。
【0009】
また、上記課題を解決するため、本発明に係るGOPサイズ決定装置は、映像を符号化する際の前処理装置であって、前記符号化のGOPサイズを動的に決定するGOPサイズ決定装置において、複数フレームの画像を時間方向及び空間方向に周波数分解して周波数分解画像を生成する時空間周波数分解部と、前記周波数分解画像の高周波帯域内の要素値の分散値に第1の重みを乗じた値と、前記周波数分解画像の他の周波帯域内の要素値の分散値に前記第1の重みよりも小さい第2の重みを乗じた値との合計値を、パワー分散値として算出するパワー分散算出部と、高周波帯域内の要素値の重みが大きくなるように重み付けをした、前記周波数分解画像の全周波数帯域内の要素値の合計値を、トータルパワー値として算出するトータルパワー算出部と、前記パワー分散値及び前記トータルパワー値が大きいほど、GOPサイズが小さくなるように決定するGOPサイズ決定部と、を備えることを特徴とする。
【0010】
さらに、本発明に係るGOPサイズ決定装置において、入力された映像についてシーンチェンジが行われたフレームを特定するシーンチェンジ判定部をさらに備え、前記時空間周波数分解部は、前記シーンチェンジ判定部により特定されたフレームから複数フレームの画像を時間方向及び空間方向に周波数分解して前記周波数分解画像を生成することを特徴とする。
【0011】
また、上記課題を解決するため、本発明に係るプログラムは、コンピュータを、上記GOPサイズ決定装置として機能させることを特徴とする。
【発明の効果】
【0012】
本発明によれば、符号化時間を増大させることなく、最適なGOPサイズを動的に決定することができる。また、本発明によれば、局所的にランダムな動きをする画像が含まれている場合であっても、符号化効率を向上させることが可能となる。
【図面の簡単な説明】
【0013】
図1】本発明の実施形態に係るGOPサイズ決定装置の概要を説明する図である。
図2】本発明の第1の実施形態に係るGOPサイズ決定装置の構成例を示すブロック図である。
図3】本発明の第1の実施形態に係るGOPサイズ決定装置における時空間周波数分解部の処理を説明する図である。
図4】本発明の第2の実施形態に係るGOPサイズ決定装置の構成例を示すブロック図である。
図5】本発明の第3の実施形態に係るGOPサイズ決定装置の構成例を示すブロック図である。
図6】本発明の第3の実施形態に係るGOPサイズ決定装置の効果を示す図である。
図7】本発明の第4の実施形態に係るGOPサイズ決定装置の構成例を示すブロック図である。
図8】本発明の第4の実施形態に係るGOPサイズ決定装置の動作例を示すフローチャートである。
【発明を実施するための形態】
【0014】
以下、本発明の実施形態について、図面を参照して詳細に説明する。
【0015】
まず、図1を参照して、本発明の実施形態に係るGOPサイズ決定装置の概要について説明する。符号化装置20は、H.264/AVC(Advanced Video Coding)やH.265/HEVCなどの符号化方式により符号化を行う、既存の符号化装置である。
【0016】
GOPサイズ決定装置10は、映像を符号化する際の前処理装置であり、符号化装置20にて符号化される映像を事前解析し、符号化のGOPサイズ(GOP内のフレーム数)を動的に、短時間で決定する。そして、GOPサイズ決定装置10は、GOPサイズを含むGOP情報を符号化装置20に出力する。GOPサイズの決定方法の詳細については、下記の実施形態にて説明する。
【0017】
GOPサイズ決定装置10は、所定のタイミングごとに複数フレームの画像を入力して、GOPサイズを決定してもよい。すなわち、GOPサイズ決定装置10は、各GOPのサイズを変えてもよいし、所定のタイミングでGOPのサイズを変えてもよい。なお、GOPサイズの最小値は1である。また、GOPサイズ決定装置10は、ピクチャ間の参照関係(GOP構造)を示す情報をGOP情報に含めてもよい。GOP構造は任意とすることができる。例えば、GOPサイズ決定装置10は、GOP構造を、H.264/AVCやH.265/HEVCなどの符号化方式で採用されている階層構造とする。
【0018】
符号化装置20は、GOPサイズ決定装置10から入力されたGOP情報に従って、入力映像に対してフレーム内予測処理又はフレーム間予測処理を行い、符号化データを生成する。一般的に、従来の符号化装置20は、GOPサイズを固定として符号化処理を行っていたが、GOPサイズ決定装置10からGOP情報を取得することにより、パラメータの1つであるGOPサイズを可変とすることができ、符号化効率を向上させることが可能となる。
【0019】
(第1の実施形態)
次に、本発明の第1の実施形態に係るGOPサイズ決定装置について説明する。図2に、本発明の第1の実施形態に係るGOPサイズ決定装置1の構成例を示す。図2に示すGOPサイズ決定装置1は、フレームメモリ11と、時空間周波数分解部12と、パワー分散算出部13と、GOPサイズ決定部14-1と、を備える。
【0020】
フレームメモリ11は、時空間周波数分解部12による処理を行うために、複数フレームの画像を記憶する。
【0021】
時空間周波数分解部12は、フレームメモリ11に記憶された複数フレームの画像を時間方向及び空間方向(以下、「時空間方向」という。)に周波数分解(3次元周波数分解)して、周波数分解画像を生成する。そして、時空間周波数分解部12は、生成した周波数分解画像のうち、パワー分散値の算出に用いられる帯域の画像をパワー分散算出部13に出力する。時空間周波数分解部12は、フーリエ変換、ウェーブレット分解などの既知の任意の手法により周波数分解を行う。
【0022】
図3を参照して、ウェーブレット分解による周波数分解について説明する。時空間周波数分解部12は、周波数分解を行う際に、各方向の分解階数を任意とすることができるが、図3に示す例では、水平方向の分解階数n=1、垂直方向の分解階数n=1、時間方向の分解階数n=1としている。この場合、時空間周波数分解部12は、水平方向、垂直方向、及び時間方向のそれぞれについて、低周波帯域Lの画像及び高周波帯域Hの画像を得る。
【0023】
パワー分散算出部13は、時空間周波数分解部12から入力された周波数分解画像の各画素の全周波数電力に対するパワーの分散値であるパワー分散値を、高周波帯域のパワー分散値の重みが大きくなるように重み付けして算出する。そして、パワー分散算出部13は、算出したパワー分散値をGOPサイズ決定部14-1に出力する。
【0024】
例えば、パワー分散算出部13は、周波数分解画像のうち、水平方向、垂直方向、及び時間方向の全てについて高周波帯域である時空間高周波帯域HHHの重みをaとし、他の周波数帯域の重みをaよりも小さいbとして、a×(時空間高周波帯域HHHのパワー分散値)+b×(他の周波数帯域のパワー分散値)を全体のパワー分散値として算出する。なお、重みbを0としてもよく、その場合には、パワー分散算出部13は、時空間高周波帯域HHHの画像のみを用いて、該画像の各画素のパワーの分散値をパワー分散値として算出する。さらに、パワー分散算出部13は、時空間高周波帯域HHHの画像の全画素を用いてパワー分散値を算出してもよいし、時空間高周波帯域HHHの画像のうち、閾値以上のパワーのみ又は上位から所定の割合のパワーのみを用いてパワー分散値を算出してもよい。
【0025】
GOPサイズ決定部14-1は、パワー分散算出部13から入力されたパワー分散値が大きいほど、GOPサイズが小さくなるように決定する。そして、GOPサイズ決定部14-1は、決定したGOPサイズを含むGOP情報を外部に出力する。
【0026】
時空間方向に周波数分解した周波数分解画像の高周波帯域のパワー分散値が大きいということは、細かい模様がランダムに動いていることを意味する。このような画像に対しては、Pピクチャ及びBピクチャにおけるフレーム間予測が困難であり、符号化時における差分誤差が大きくなると考えられる。そこで、GOPサイズ決定部14-1により、パワー分散値が大きい場合にはGOPサイズを小さくすることにより、符号化効率を向上させることが可能となる。
【0027】
なお、パワー分散値の大きさとGOPサイズとの関係を、予めテーブルに保持しておき、GOPサイズ決定部14-1は該テーブルを参照してGOPサイズを決定してもよい。また、GOPサイズ決定部14-1は、さらにビットレートや画質に応じてGOPサイズを可変としてもよい。
【0028】
以上説明したように、GOPサイズ決定装置1は、複数フレームの画像を時空間方向に周波数分解した周波数分解画像の各画素のパワーのパワー分散値を、高周波帯域の重みが大きくなるように重み付けして算出し、パワー分散値が大きいほど、GOPサイズが小さくなるように決定する。そのため、GOPサイズ決定装置1によれば、符号化前に映像の特徴量を事前解析し、その結果に基づいて最適なGOPサイズを動的に短時間で決定することが可能となる。かくして、符号化装置において符号化時間を増大させずに符号化効率を向上させることが可能となる。
【0029】
(第2の実施形態)
次に、本発明の第2の実施形態に係るGOPサイズ決定装置について説明する。図4に、本発明の第2の実施形態に係るGOPサイズ決定装置2の構成例を示す。図4に示すGOPサイズ決定装置2は、フレームメモリ11と、時空間周波数分解部12と、GOPサイズ決定部14-2と、トータルパワー算出部15と、を備える。
【0030】
時空間周波数分解部12は、第1の実施形態と同様に、フレームメモリ11に記憶された複数フレームの画像を時空間方向に周波数分解して、周波数分解画像を生成する。そして、時空間周波数分解部12は、生成した周波数分解画像のうち、トータルパワー値の算出に用いられる帯域の画像をトータルパワー算出部15に出力する。
【0031】
トータルパワー算出部15は、時空間周波数分解部12から入力された周波数分解画像の各画素の全周波数電力に対するパワーの合計値であるトータルパワー値を、高周波帯域のトータルパワー値の重みが大きくなるように重み付けして算出する。トータルパワー値は、各画素のパワーのRMS(Root Mean Square)値であってもよい。そして、トータルパワー算出部15は、算出したトータルパワー値をGOPサイズ決定部14-2に出力する。
【0032】
例えば、トータルパワー算出部15は、周波数分解画像のうち、水平方向、垂直方向、及び時間方向の全てについて高周波帯域である時空間高周波帯域HHHの画像の重みをcとし、他の周波数帯域画像の重みをcよりも小さいdとし、c×(時空間高周波帯域HHHのトータルパワー値)+d×(他の周波数帯域のトータルパワー値)を全体のトータルパワー値として算出する。なお、重みdを0としてもよく、その場合には、トータルパワー算出部15は、時空間高周波帯域HHHの画像のみを用いて、該画像の各画素のパワーの合計値をトータルパワー値として算出する。さらに、トータルパワー算出部15は、時空間高周波帯域HHHの画像の全画素を用いてトータルパワー値を算出してもよいし、時空間高周波帯域HHHの画像のうち、閾値以上のパワーのみ又は上位から所定の割合のパワーのみを用いてトータルパワー値を算出してもよい。
【0033】
GOPサイズ決定部14-2は、トータルパワー算出部15から入力されたトータルパワー値が大きいほど、GOPサイズが小さくなるように決定する。そして、GOPサイズ決定部14-2は、決定したGOPサイズを含むGOP情報を外部に出力する。
【0034】
時空間方向に周波数分解した周波数分解画像の高周波帯域のトータルパワー値が大きいということは、細かい模様が大きく動いていることを意味する。このような画像に対しては、Pピクチャ及びBピクチャにおけるフレーム間予測が困難であり、符号化時における差分誤差が大きくなると考えられる。そこで、GOPサイズ決定部14-2により、トータルパワー値が大きい場合にはGOPサイズを小さくすることにより、符号化効率を向上させることが可能となる。
【0035】
なお、トータルパワー値の大きさとGOPサイズとの関係を、予めテーブルに保持しておき、GOPサイズ決定部14-2は該テーブルを参照してGOPサイズを決定してもよい。また、GOPサイズ決定部14-2は、さらにビットレートや画質に応じてGOPサイズを可変としてもよい。
【0036】
以上説明したように、GOPサイズ決定装置2は、複数フレームの画像を時空間方向に周波数分解した周波数分解画像の各画素のパワーのトータルパワー値を、高周波帯域の重みが大きくなるように重み付けして算出し、トータルパワー値が大きいほど、GOPサイズが小さくなるように決定する。そのため、GOPサイズ決定装置2によれば、符号化前に映像の特徴量を事前解析し、その結果に基づいて最適なGOPサイズを動的に短時間で決定することが可能となる。かくして、符号化装置において符号化時間を増大させずに符号化効率を向上させることが可能となる。
【0037】
(第3の実施形態)
次に、本発明の第3の実施形態に係るGOPサイズ決定装置について説明する。図5に、本発明の第3の実施形態に係るGOPサイズ決定装置3の構成例を示す。図5に示すGOPサイズ決定装置3は、フレームメモリ11と、時空間周波数分解部12と、パワー分散算出部13と、GOPサイズ決定部14-3と、トータルパワー算出部15と、を備える。
【0038】
時空間周波数分解部12は、第1の実施形態と同様に、フレームメモリ11に記憶された、複数フレームの画像を時空間方向に周波数分解して、周波数分解画像を生成する。そして、時空間周波数分解部12は、生成した周波数分解画像のうち、パワー分散値の算出に用いられる帯域の画像をパワー分散算出部13に出力し、トータルパワー値の算出に用いられる帯域の画像をトータルパワー算出部15に出力する。
【0039】
パワー分散算出部13は、第1の実施形態と同様に、時空間周波数分解部12から入力された周波数分解画像の各画素の全周波数電力に対するパワーのパワー分散値を、高周波帯域のパワー分散値の重みが大きくなるように重み付けして算出する。そして、パワー分散算出部13は、算出したパワー分散値をGOPサイズ決定部14-3に出力する。
【0040】
トータルパワー算出部15は、第2の実施形態と同様に、時空間周波数分解部12から入力された周波数分解画像の各画素の全周波数電力に対するパワーのトータルパワー値を、高周波帯域のトータルパワー値の重みが大きくなるように重み付けして算出する。そして、トータルパワー算出部15は、算出したトータルパワー値をGOPサイズ決定部14-3に出力する。
【0041】
GOPサイズ決定部14-3は、パワー分散算出部13から入力されたパワー分散値、及びトータルパワー算出部15から入力されたトータルパワー値が大きいほど、GOPサイズが小さくなるように決定する。そして、GOPサイズ決定部14-3は、決定したGOPサイズを含むGOP情報を外部に出力する。
【0042】
時空間方向に周波数分解した周波数分解画像の高周波帯域のパワー分散値及びトータルパワー値が大きいということは、細かい模様がランダム且つ大きく動いていることを意味する。このような画像に対しては、Pピクチャ及びBピクチャにおけるフレーム間予測が困難であり、符号化時における差分誤差が大きくなると考えられる。そこで、パワー分散値及びトータルパワー値が大きい場合にはGOPサイズが小さくすることにより、符号化効率を向上させることが可能となる。
【0043】
例えば、GOPサイズ決定部14-3は、パワー分散算出部13から入力されたパワー分散値と、トータルパワー算出部15から入力されたトータルパワー値とを乗算し、乗算値が大きいほど、GOPサイズが小さくなるように決定する。乗算する際には、重み付けをしてもよい。例えば、GOPサイズ決定部14-3は、パワー分散値の重みをe、トータルパワー値の重みをfとし、e×パワー分散値+f×トータルパワー値を求め、該値が大きいほど、GOPサイズが小さくなるように決定する。重みe,fは、映像の種類に応じて可変としてもよい。
【0044】
なお、パワー分散値及びトータルパワー値の乗算値とGOPサイズとの関係を、予めテーブルに保持しておき、GOPサイズ決定部14-3は該テーブルを参照してGOPサイズを決定してもよい。また、GOPサイズ決定部14-3は、さらにビットレートや画質に応じてGOPサイズを可変としてもよい。
【0045】
以上説明したように、GOPサイズ決定装置3は、複数フレームの画像を時空間方向に周波数分解した周波数分解画像の各画素のパワーのパワー分散値及びトータルパワー値を、高周波帯域の重みが大きくなるように重み付けして算出し、パワー分散値及びトータルパワー値が大きいほど、GOPサイズが小さくなるように決定する。そのため、GOPサイズ決定装置3によれば、符号化前に映像の特徴量を事前解析し、その結果に基づいて最適なGOPサイズを動的に短時間で決定することが可能となる。GOPサイズ決定装置3は、パワー分散値及びトータルパワー値の双方を算出しているため、フレーム間予測が困難な画像をGOPサイズ決定装置1及びGOPサイズ決定装置2よりもさらに精度良く検出し、最適なGOPサイズを決定することができる。かくして、符号化装置において符号化時間を増大させずに符号化効率を向上させることが可能となる。
【0046】
図6は、GOPサイズ決定装置3の効果を示す図である。図6(a)は、GOPサイズ決定装置3により決定されたGOPサイズに従って符号化した後に復号した画像である。図6(b)は、従来法のように複数のGOPサイズによる処理を試行して符号化を行い最適なGOPサイズを決定して符号化した後に復号した画像である。図6(a)(b)の比較により明らかなように、本装置を用いることで符号化劣化を抑制し、高画質な画像を得ることが可能となる。また、従来の方法では試行数分の符号化処理を行うため、並列処理を行った場合には回路規模が膨大となり最大GOPサイズ分の遅延が発生し、直列処理を行った場合には回路規模は大きくならないが遅延量が膨大となる。これに対して、本装置を用いることで、符号化時間を増大させずに符号化効率を向上させることが可能となる。
【0047】
(第4の実施形態)
次に、本発明の第4の実施形態に係るGOPサイズ決定装置について説明する。図7に、本発明の第4の実施形態に係るGOPサイズ決定装置4の構成例を示す。図7に示すGOPサイズ決定装置4は、フレームメモリ11と、時空間周波数分解部12と、パワー分散算出部13と、GOPサイズ決定部14-3と、トータルパワー算出部15と、シーンチェンジ判定部16と、を備える。
【0048】
シーンチェンジ判定部16は、GOPサイズ決定装置4に入力された映像について、シーンチェンジの有無を判定し、シーンチェンジが行われたフレームを特定する。例えば、フレーム間の画像値の差分を求め、差分が閾値を超える場合にはシーンチェンジが行われたものと判定する。そして、シーンチェンジ判定部16は、シーンチェンジが行われたフレームから、該フレーム以降の数フレームをフレームメモリ11に記憶させる。
【0049】
時空間周波数分解部12は、フレームメモリ11に記憶された複数フレームの画像、すなわち、シーンチェンジ判定部16により特定されたフレームから複数フレームの画像を、時空間方向に周波数分解して周波数分解画像を生成する。
【0050】
パワー分散算出部13、トータルパワー算出部15、及びGOPサイズ決定部14-3の処理は、第3の実施形態と同一であるため、説明を省略する。
【0051】
(GOPサイズ決定装置4の動作)
次に、GOPサイズ決定装置4の動作について説明する。図8は、GOPサイズ決定装置4の動作例を示すフローチャートである。
【0052】
ステップS101において、GOPサイズ決定装置4は、シーンチェンジ判定部16によりシーンチェンジの有無を判定する。シーンチェンジ判定部16によりシーンチェンジが行われていないと判断された場合には(ステップS102-No)、処理をステップS101に戻して、継続してシーンチェンジの有無を判定する(ステップS101)。そして、シーンチェンジ判定部16によりシーンチェンジが行われたと判定された場合にのみ、以降に処理を進める。すなわち、GOPサイズ決定装置4はGOPサイズを決定すると、次にシーンチェンジ判定部16によりシーンチェンジが行われたと判定されるまで、GOPサイズを保持する。
【0053】
GOPサイズ決定装置4は、シーンチェンジ判定部16によりシーンチェンジが行われたと判定された場合には(ステップS102-Yes)、ステップS103において、フレームメモリ11により、複数フレームの画像を記憶する。
【0054】
続いて、ステップS104において、GOPサイズ決定装置4は、時空間周波数分解部12により、フレームメモリ11に記憶された複数フレームの画像を時空間方向に周波数分解して、周波数分解画像を生成する。
【0055】
続いて、ステップS105において、GOPサイズ決定装置4は、パワー分散算出部13により、周波数分解画像の各画素のパワーのパワー分散値を、高周波帯域の重みが大きくなるように重み付けして算出する。
【0056】
また、ステップS106において、トータルパワー算出部15により、周波数分解画像の各画素のパワーのトータルパワー値を、高周波帯域の重みが大きくなるように重み付けして算出する。なお、ステップS105の処理とステップS106の処理とは、並行して行われてもよいし、ステップS106の処理が先に行われてもよい。
【0057】
最後に、ステップS107において、GOPサイズ決定装置4は、GOPサイズ決定部14-3により、パワー分散値及びトータルパワー値に基づいて、GOPサイズを決定する。
【0058】
以上説明したように、GOPサイズ決定装置4は、入力された映像についてシーンチェンジが行われたフレームを特定してから、周波数分解画像を生成し、パワー分散値及びトータルパワー値に基づいてGOPサイズを決定する。そのため、GOPサイズ決定装置4によれば、適切なタイミングでGOPサイズを変更することができ、フレーム内で局所的にランダムな動きをするような画像の符号化時における差分誤差を小さくすることができる。したがって、GOPサイズ決定装置3よりもさらに符号化効率を向上させることが可能となる。
【0059】
以上、GOPサイズ決定装置1~4について説明したが、GOPサイズ決定装置1から4として機能させるためにコンピュータを用いることも可能である。そのようなコンピュータは、GOPサイズ決定装置1~4の各機能を実現する処理内容を記述したプログラムを該コンピュータの記憶部に格納しておき、該コンピュータのCPUによってこのプログラムを読み出して実行させることで実現することができる。
【0060】
また、このプログラムは、コンピュータ読取り可能媒体に記録されていてもよい。コンピュータ読取り可能媒体を用いれば、コンピュータにインストールすることが可能である。ここで、プログラムが記録されたコンピュータ読取り可能媒体は、非一過性の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、CD-ROMやDVD-ROMなどの記録媒体であってもよい。
【0061】
上述の実施形態は代表的な例として説明したが、本発明の趣旨及び範囲内で、多くの変更及び置換ができることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。例えば、実施形態の構成図に記載の複数の構成ブロックを1つに組み合わせたり、あるいは1つの構成ブロックを分割したりすることが可能である。
【0062】
例えば、第4の実施形態において説明したシーンチェンジ判定部16を、第1の実施形態にかかるGOPサイズ決定装置1が備えていてもよいし、第2の実施形態にかかるGOPサイズ決定装置2が備えていてもよい。
【符号の説明】
【0063】
1,2,3,4,10 GOPサイズ決定装置
11 フレームメモリ
12 時空間周波数分解部
13 パワー分散算出部
14-1,14-2,14-3 GOPサイズ決定部
15 トータルパワー算出部
16 シーンチェンジ判定部
20 符号化装置
図1
図2
図3
図4
図5
図6
図7
図8