特許第6606827号(P6606827)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 沖電気工業株式会社の特許一覧

特許6606827動画像符号化装置、動画像符号化プログラム、及び動画像符号化システム
<>
  • 特許6606827-動画像符号化装置、動画像符号化プログラム、及び動画像符号化システム 図000002
  • 特許6606827-動画像符号化装置、動画像符号化プログラム、及び動画像符号化システム 図000003
  • 特許6606827-動画像符号化装置、動画像符号化プログラム、及び動画像符号化システム 図000004
  • 特許6606827-動画像符号化装置、動画像符号化プログラム、及び動画像符号化システム 図000005
  • 特許6606827-動画像符号化装置、動画像符号化プログラム、及び動画像符号化システム 図000006
  • 特許6606827-動画像符号化装置、動画像符号化プログラム、及び動画像符号化システム 図000007
  • 特許6606827-動画像符号化装置、動画像符号化プログラム、及び動画像符号化システム 図000008
  • 特許6606827-動画像符号化装置、動画像符号化プログラム、及び動画像符号化システム 図000009
  • 特許6606827-動画像符号化装置、動画像符号化プログラム、及び動画像符号化システム 図000010
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6606827
(24)【登録日】2019年11月1日
(45)【発行日】2019年11月20日
(54)【発明の名称】動画像符号化装置、動画像符号化プログラム、及び動画像符号化システム
(51)【国際特許分類】
   H04N 19/30 20140101AFI20191111BHJP
   H04N 19/107 20140101ALI20191111BHJP
   H04N 19/146 20140101ALI20191111BHJP
   H04N 19/172 20140101ALI20191111BHJP
   H04N 19/46 20140101ALI20191111BHJP
【FI】
   H04N19/30 200
   H04N19/107
   H04N19/146
   H04N19/172
   H04N19/46
【請求項の数】8
【全頁数】18
(21)【出願番号】特願2015-9655(P2015-9655)
(22)【出願日】2015年1月21日
(65)【公開番号】特開2016-134847(P2016-134847A)
(43)【公開日】2016年7月25日
【審査請求日】2017年11月20日
(73)【特許権者】
【識別番号】000000295
【氏名又は名称】沖電気工業株式会社
(74)【代理人】
【識別番号】100180275
【弁理士】
【氏名又は名称】吉田 倫太郎
(74)【代理人】
【識別番号】100161861
【弁理士】
【氏名又は名称】若林 裕介
(74)【代理人】
【識別番号】100090620
【弁理士】
【氏名又は名称】工藤 宣幸
(72)【発明者】
【氏名】迫水 和仁
【審査官】 鉢呂 健
(56)【参考文献】
【文献】 特開2010−206395(JP,A)
【文献】 特開平06−054319(JP,A)
【文献】 米国特許出願公開第2013/0044183(US,A1)
【文献】 Limin Liu, Zhen Li, Edward J. Delp,Backward channel aware Wyner-Ziv video coding,2006 International Conference on Image Processing,IEEE,2007年 2月20日,pp. 1677-1680
【文献】 Ghazaleh Esmaili, Pamela Cosman,Low Complexity Spatio-Temporal Key Frame Encoding for Wyner-Ziv Video Coding,2009 Data Compression Conference,IEEE,2009年 5月26日,pp. 382-390
(58)【調査した分野】(Int.Cl.,DB名)
H04N 19/00−19/98
IEEE Xplore
(57)【特許請求の範囲】
【請求項1】
非キーフレームを符号化して非キーフレーム符号化データとして出力する非キー符号化部を有する動画像符号化装置において、
入力されたフレームを、イントラ符号化するキーフレームか、差分符号化するキーフレームか、又は非キーフレームかに判定するフレームタイプ判定手段と、
キーフレームをイントラ符号化し、キーフレーム符号化データとして出力するイントラ符号化部と、
キーフレームから参照フレームを差し引いた差分画像を符号化し、キーフレーム符号化データとして出力する差分符号化部と、
前記キーフレーム符号化データを蓄積するバッファメモリと、
前記バッファメモリから取得されたキーフレーム符号化データから前記参照フレームを生成する参照フレーム再構成部とを有し
記非キー符号化部は、非キーフレームをWyner−Ziv符号化してWyner−Ziv符号化データとして出力するものであり、
非キーフレームのWyner−Ziv符号化が行われる度にWyner−Ziv符号化データの符号量であるWZ符号量を出力するWZ符号量出力部とを備え、
前記フレームタイプ判定手段は、前記WZ符号量が入力される度に、前記WZ符号量を加算して、そのWZ符号量の総和を求め、キーフレームと判定する度に前記総和をリセットするものであって、
前記フレームタイプ判定手段は、最初のキーフレームを前記イントラ符号化部で符号化するキーフレームと判定し、これ以降については、前記総和が所定の閾値以上の場合に前記イントラ符号化部で符号化するキーフレームと判定し、それ以外の場合には前記差分符号化部で符号化するキーフレームと判定する
ことを特徴とする動画像符号化装置。
【請求項2】
前記閾値を生成・更新する閾値調整部を備え、
前記フレームタイプ判定手段で使用される前記閾値は、前記閾値調整部から取得された閾値である
ことを特徴とする請求項1に記載の動画像符号化装置。
【請求項3】
前記フレームタイプ判定手段で使用された閾値と、前記イントラ符号化部又は前記差分符号化部から出力される前記キーフレーム符号化データの符号量であるキー符号量とを記憶する閾値調整用記憶部を備え、
前記閾値調整部は、前記閾値調整用記憶部により取得される前記フレームタイプ判定手段で前回使用された前回閾値と、前々回使用された前々回閾値と、前記イントラ符号化部又は前記差分符号化部から前回出力された前回キー符号量と、前々回出力された前々回キー符号量とに基づき、前記閾値を生成・更新する
ことを特徴とする請求項2に記載の動画像符号化装置。
【請求項4】
符号化するフレームのインデックスをn、フレームnを符号化するときの閾値をT(n)、フレームnの前記キー符号量をR(n)、所定の正の定数をαとし、
前記閾値調整部は、以下の(A)式に従い、前記閾値を調整することを特徴とする請求項3に記載の動画像符号化装置。
T(n+2)=T(n+1) − α[R(n+1)−R(n)]/[T(n+1)−T(n)]…(A)
【請求項5】
符号化するフレームのインデックスをn、フレームnを符号化するときの閾値をT(n)、フレームnの前記キー符号量をR(n)、単調減少関数をα(n)とし、
前記閾値調整部は、以下の(B)式に従い、前記閾値を調整することを特徴とする請求項3に記載の動画像符号化装置。
T(n+2)=T(n+1) −α(n)[R(n+1)−R(n)]/[T(n+1)−T(n)]…(B)
【請求項6】
前記キーフレーム符号化データ又は前記非キーフレーム符号化データについて、前記イントラ符号化部で符号化されたキーフレームか、前記差分符号化部で符号化されたキーフレームか、又は前記非キー符号化部で符号化された非キーフレームかを識別するための識別子をヘッダに加えたストリームデータを生成するストリーム部を有することを特徴とする請求項1〜5のいずれかに記載の動画像符号化装置。
【請求項7】
請求項1〜のいずれかに記載の動画像符号化装置と、動画像復号装置とを有することを特徴とする動画像符号化システム。
【請求項8】
非キーフレームを符号化して非キーフレーム符号化データとして出力する非キー符号化部を有する動画像符号化装置に搭載されるコンピュータを、
入力されたフレームを、イントラ符号化するキーフレームか、差分符号化するキーフレームか、又は非キーフレームかに判定するフレームタイプ判定手段と、
キーフレームをイントラ符号化し、キーフレーム符号化データとして出力するイントラ符号化部と、
キーフレームから参照フレームを差し引いた差分画像を符号化し、キーフレーム符号化データとして出力する差分符号化部と、
前記キーフレーム符号化データを蓄積するバッファメモリと、
前記バッファメモリから取得されたキーフレーム符号化データから前記参照フレームを生成する参照フレーム再構成部として機能させ
記非キー符号化部は、非キーフレームをWyner−Ziv符号化してWyner−Ziv符号化データとして出力するものであり、
上記コンピュータを、非キーフレームのWyner−Ziv符号化が行われる度にWyner−Ziv符号化データの符号量であるWZ符号量を出力するWZ符号量出力部としてさらに機能させ、
前記フレームタイプ判定手段は、前記WZ符号量が入力される度に、前記WZ符号量を加算して、そのWZ符号量の総和を求め、キーフレームと判定する度に前記総和をリセットするものであって、
前記フレームタイプ判定手段は、最初のキーフレームを前記イントラ符号化部で符号化するキーフレームと判定し、これ以降については、前記総和が所定の閾値以上の場合に前記イントラ符号化部で符号化するキーフレームと判定し、それ以外の場合には前記差分符号化部で符号化するキーフレームと判定する
ことを特徴とする動画像符号化プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、動画像符号化装置、動画像符号化プログラム、及び動画像符号化システムに関し、例えば、Distributed Video Coding(分散映像符号化;以下、DVCと呼ぶ)方式に基づいて動画像の符号化、復号を行う場合に適用し得るものである。
【背景技術】
【0002】
DVC方式は、Slepian−Wolf理論又はWyner−Ziv理論に基づき動画像の符号化及び復号を行う動画像符号化方式である(非特許文献1参照)。
【0003】
DVC方式は、動画像符号化装置(以下、デコーダと呼ぶこともある)で生成される符号化対象画像の予測画像(以下、デコーダ予測画像)から符号化対象画像を再構成する符号(以下、Wyner−Ziv符号とする)を、デコーダ予測画像を直接参照することなく生成することを特徴としている。この特徴より、DVC方式の動画像符号化装置は、複雑な予測画像生成部を備える必要がなく、符号化に係る演算量の削減が可能になる。
【0004】
図9は、DVC方式に基づく従来の動画像符号化装置310と、動画像復号装置320とを有する動画像符号化システム2の構成を示すブロック図である。
【0005】
動画像符号化装置310は、入力フレームのフレームタイプを後述する判定方法に基づきキーフレームか、WZフレーム(WZは、Wyner−Zivを省略したものである)かに判定し、キーフレームならば入力フレームをキーフレームとしてイントラ符号化部312に、WZフレームならば、入力フレームをWZフレームとしてWZ符号化部316に出力するフレームタイプ判定部311と、キーフレームをイントラ符号化し、キーフレームの符号化データ(以下、キー符号化データと呼ぶ)を出力するイントラ符号化部312と、WZフレームをWZ符号化し、WZフレームの符号化データ(以下、WZ符号化データと呼ぶ)を出力するWZ符号化部316と、キー符号化データとWZ符号化データに、フレームタイプを識別するための識別子を付けてストリームデータとして出力するストリーム出力部117を有する。
【0006】
フレームタイプ判定部311で用いる判定方法は、例えば、最初の入力フレームはキーフレームと判定し、以降のフレームについては、予め定められた数のフレームをWZフレームと判定し、その次の入力フレームをキーフレームと判定することを繰り返すというものである。
【0007】
動画像復号装置320は、入力ストリームデータ中のヘッダを参照することでフレームタイプを判定し、キーフレームの符号化データならばイントラ復号部322に出力し、WZフレームの符号化データならばWZ復号部325に出力するフレームタイプ判定部321と、キーフレームの符号化データを復号し、復号キーフレームを生成するイントラ復号部322と、WZフレームの符号化データを復号し、復号WZフレームを生成するWZ復号部325と、復号キーフレーム又は復号WZフレームを順次復号フレームとして出力するフレーム出力部326とを有する。
【0008】
フレームタイプ判定部321は、ストリームデータ中のヘッダに存在する識別子を参照することで、フレームタイプがキーフレームの符号化データかWZフレームの符号化データであるかを判定する。
【先行技術文献】
【非特許文献】
【0009】
【非特許文献1】B.Girod,a M.Aaron,S.Rane,andD.Rebollo−Monedero,“Distributed Video Coding,”Proceedings of the IEEE,vol.93,Jan.2005,pp.71−83.
【発明の概要】
【発明が解決しようとする課題】
【0010】
一般的に、動画像は、フレーム間に相関がある場合が多く、フレーム間の差分をとることにより相関による冗長性を除外して符号化する差分符号化を実施することで、符号量を削減することができる。
【0011】
しかしながら、従来のDVC方式は、キーフレームにおいて、イントラ符号化を行うのみであった(つまり、差分符号化は不採用である)。なぜならば、フレーム間の相関が高いシーンでは、差分符号化によって符号量の削減が実現されるが、シーンチェンジのある動画像や激しく動く動画像のようにフレーム間の相関が低いシーンでは、差分符号化によって符号量が増加してしまうためである。
【0012】
そのため、演算量増加を最小限に抑えつつ、符号量削減を実現することができる動画像符号化装置、動画像符号化プログラム、及び動画像符号化システムが望まれている。
【課題を解決するための手段】
【0013】
第1の本発明は、非キーフレームを符号化して非キーフレーム符号化データとして出力する非キー符号化部を有する動画像符号化装置において、(1)入力されたフレームを、イントラ符号化するキーフレームか、差分符号化するキーフレームか、又は非キーフレームかに判定するフレームタイプ判定手段と、(2)キーフレームをイントラ符号化し、キーフレーム符号化データとして出力するイントラ符号化部と、(3)キーフレームから参照フレームを差し引いた差分画像を符号化し、キーフレーム符号化データとして出力する差分符号化部と、(4)前記キーフレーム符号化データを蓄積するバッファメモリと、(5)前記バッファメモリから取得されたキーフレーム符号化データから前記参照フレームを生成する参照フレーム再構成部とを有し、(6)前記非キー符号化部は、非キーフレームをWyner−Ziv符号化してWyner−Ziv符号化データとして出力するものであり、()非キーフレームのWyner−Ziv符号化が行われる度にWyner−Ziv符号化データの符号量であるWZ符号量を出力するWZ符号量出力部とを備え、()前記フレームタイプ判定手段は、前記WZ符号量が入力される度に、前記WZ符号量を加算して、そのWZ符号量の総和を求め、キーフレームと判定する度に前記総和をリセットするものであって、()前記フレームタイプ判定手段は、最初のキーフレームを前記イントラ符号化部で符号化するキーフレームと判定し、これ以降については、前記総和が所定の閾値以上の場合に前記イントラ符号化部で符号化するキーフレームと判定し、それ以外の場合には前記差分符号化部で符号化するキーフレームと判定することを特徴とする。
【0015】
の本発明の動画像符号化システムは、第1の本発明の動画像符号化装置と、動画像復号装置とを有することを特徴とする。
【0016】
第3の本発明の動画像符号化プログラムは、非キーフレームを符号化して非キーフレーム符号化データとして出力する非キー符号化部を有する動画像符号化装置に搭載されるコンピュータを、(1)入力されたフレームを、イントラ符号化するキーフレームか、差分符号化するキーフレームか、又は非キーフレームかに判定するフレームタイプ判定手段と、(2)キーフレームをイントラ符号化し、キーフレーム符号化データとして出力するイントラ符号化部と、(3)キーフレームから参照フレームを差し引いた差分画像を符号化し、キーフレーム符号化データとして出力する差分符号化部と、(4)前記キーフレーム符号化データを蓄積するバッファメモリと、(5)前記バッファメモリから取得されたキーフレーム符号化データから前記参照フレームを生成する参照フレーム再構成部として機能させ、(6)前記非キー符号化部は、非キーフレームをWyner−Ziv符号化してWyner−Ziv符号化データとして出力するものであり、()上記コンピュータを、非キーフレームのWyner−Ziv符号化が行われる度にWyner−Ziv符号化データの符号量であるWZ符号量を出力するWZ符号量出力部としてさらに機能させ、()前記フレームタイプ判定手段は、前記WZ符号量が入力される度に、前記WZ符号量を加算して、そのWZ符号量の総和を求め、キーフレームと判定する度に前記総和をリセットするものであって、()前記フレームタイプ判定手段は、最初のキーフレームを前記イントラ符号化部で符号化するキーフレームと判定し、これ以降については、前記総和が所定の閾値以上の場合に前記イントラ符号化部で符号化するキーフレームと判定し、それ以外の場合には前記差分符号化部で符号化するキーフレームと判定することを特徴とする。
【発明の効果】
【0018】
本発明によれば、演算量増加を最小限に抑えつつ、符号量削減を実現することができる。
【図面の簡単な説明】
【0019】
図1】第1の実施形態に係る動画像符号化装置の構成を示すブロック図である。
図2】第1の実施形態に係る動画像復号装置の構成を示すブロック図である。
図3】第1の実施形態に係る動画像符号化装置と、動画像復号装置とを有する動画像符号化システムの構成を示すブロック図である。
図4】第1の実施形態に係る動画像符号化装置の動作を示すフローチャートである。
図5】第1の実施形態に係る動画像復号装置の動作を示すフローチャートである。
図6】第2の実施形態に係る動画像符号化装置の構成を示すブロック図である。
図7】第3の実施形態に係る動画像符号化装置の構成を示すブロック図である。
図8】第3の実施形態に係る動画像符号化装置の動作を示すフローチャートである。
図9】DVC方式に基づく従来の動画像符号化装置と、動画像復号装置とを有する動画像符号化システムの構成を示すブロック図である。
【発明を実施するための形態】
【0020】
(A)第1の実施形態
以下、本発明による動画像符号化装置、動画像符号化プログラム、及び動画像符号化システムの第1の実施形態を、図面を参照しながら説明する。
【0021】
(A−1)第1の実施形態の構成
図3は、第1の実施形態に係る動画像符号化装置110と、動画像復号装置120とを有する動画像符号化システム1の構成を示すブロック図である。
【0022】
図3において、動画像符号化システム1は、入力フレームを符号化し、その符号化したフレームをストリームデータとして出力する動画像符号化装置110と、当該ストリームデータを復号し、復号フレームを出力する動画像復号装置120とを有する、なお、動画像符号化システム1において、動画像符号化装置110及び動画像復号装置120は、ネットワークNを介してストリームデータのやりとりが行われる。ネットワークNは、例えば、LAN(Local Area Network)、WAN(Wide Area Network)等の各種ネットワークを利用することができる。
【0023】
図1は、第1の実施形態に係る動画像符号化装置110の構成を示すブロック図である。
【0024】
図1において、動画像符号化装置110は、フレームタイプ判定部111、イントラ符号化部112、バッファメモリ113、参照フレーム再構成部114、差分符号化部115、WZ符号化部116及びストリーム出力部117を有する。
【0025】
動画像符号化装置110は、ハードウェア的に各種回路を接続して構築されても良く、また、CPU、ROM、RAMなどを有する汎用的な装置が動画像符号化プログラムを実行することで動画像符号化装置としての機能を実現するように構築されても良い。いずれの構築方法を適用した場合であっても、動画像符号化装置110の機能的な詳細構成は、図1で表す構成となっている。
【0026】
フレームタイプ判定部111は、後述する判定方法に基づき、入力フレームを、3種類のフレームタイプ、即ち、(a)イントラ符号化するキーフレーム、(b)差分符号化すキーフレーム、(c)WZフレームのいずれかに判定する。
【0027】
そして、フレームタイプ判定部111は、入力フレームのフレームタイプをイントラ符号化するキーフレームと判定したならば、入力フレームをキーフレームとしてイントラ符号化部112に出力する。また、フレームタイプ判定部111は、入力フレームのフレームタイプを差分符号化するキーフレームと判定したならば、入力フレームをキーフレームとして差分符号化部115に出力する。さらに、フレームタイプ判定部111は、入力フレームのフレームタイプをWZフレームと判定したならば、入力フレームをWZフレームとしてWZ符号化部116に出力する。
【0028】
具体的に、フレームタイプ判定部111は、まず、入力フレームがキーフレームかWZフレームかの判定を行う。この判定方法は、先述の従来の技術と同様であるので、その詳細説明は省略する。さらに、フレームタイプ判定部111は、キーフレームと判定されたフレームを、イントラ符号化するキーフレームか差分符号化するキーフレームかのいずれかに判定する。この判定方法として、例えば、以下の方法が考えられる。
【0029】
フレームタイプ判定部111は、WZ符号化部116からWZ符号量が入力される度に、WZ符号量を加算し、WZ符号量の総和を求め、最初のキーフレームをイントラ符号化キーフレームと判定する。これ以降、フレームタイプ判定部111は、WZ符号量の総和が予め定められた閾値以上の場合にイントラ符号化するキーフレームと判定し、それ以外の場合には、差分符号化するキーフレームと判定する。フレームタイプ判定部111は、キーフレームと判定する度にWZ符号量の総和を、リセット(消去)する。
【0030】
なお、上記の方法によりフレームタイプを判定できる理由は、「WZ符号量の総和」と「キーフレームと、参照画像(例えば、直前のキーフレーム)との間の相関」との間に相関があるためである。原則として、DVCにおけるWZ符号量は、サイド情報(補助情報;Side Information)に存在する誤りを訂正するのに必要十分な量である。一般的に、フレーム間の相関が大きいほど、Side Informationに存在する誤りが減る傾向があるため、WZ符号量も同様に減少する。つまり、「キーフレームと参照画像の間の相関」が大きいほど、各WZフレームのWZ符号量が減る傾向があり、結果としてWZ符号量の総和が減る傾向がある。
【0031】
この「WZ符号量の総和」と「キーフレームと、参照画像との間の相関」の関係と、先に述べたキーフレームと参照画像の相関が大きい時に差分符号化は有効に機能するという性質から、WZ符号量の総和が小さいとき、キーフレームと参照画像の間の相関が大きいことが推定できるため、差分符号化は、有効に機能すると推定できる。以上の理由から、上記の判定方法を使用することで、多くのシーンにおいてフレームタイプを適切に判定することができる。
【0032】
イントラ符号化部112は、先述の従来の技術(イントラ符号化部312)と同様な機能に加え、差分符号化のために再構成用データをバッファメモリ113に出力することを行う。ここで、再構成用データとは、例えば、量子化後の画像データである。また、復号品質の低下を許容できる場合は、入力されたキーフレームをそのまま再構成用データとしても良い。
【0033】
バッファメモリ113は、イントラ符号化部112と、差分符号化部115とから出力される再構成用データを保存するものである。
【0034】
参照フレーム再構成部114は、バッファメモリ113から取り出した再構成用データから参照フレームを再構成する。参照フレーム再構成部114は、再構成用データとして、例えば、量子化後の画像データを格納している場合は、逆量子化や逆変換等を通して、ピクセル領域の画像を生成し、それを参照フレームとして出力する。参照フレームの元となる再構成用データとしては、例えば、直前のキーフレームの再構成用データを用いる。
【0035】
差分符号化部115は、キーフレームから参照フレームを差し引き、その差分画像を符号化してキー符号化データとして、ストリーム出力部117へ出力する。
【0036】
WZ符号化部116は、先述の従来の技術(WZ符号化部316)と同様な機能に加え、WZ符号化データの符号量をWZ符号量としてフレームタイプ判定部111に出力することを行う。なお、WZ符号化部116は、WZ符号化データの符号量の算出については、例えば、特開2014−207565号公報に記載の技術を用いることができる。
【0037】
ストリーム出力部117は、イントラ符号化部112と、差分符号化部115と、WZ符号化部116とから出力されるキー符号化データ又はWZ符号化データを、順次、ストリームデータとして出力する。ストリーム出力部117は、復号時にフレームタイプを判定できるようにするために、出力するストリームデータにおいて、例えば、3種類のフレームタイプを識別するための識別子を付加させる。また、ストリーム出力部117は、例えば、キーフレームとWZフレームを識別するためだけの識別子を付加する従来の技術に加えて、イントラ符号化するキーフレームと差分符号化するキーフレームの識別については、動画像復号装置120でもフレームタイプ判定部111と同様のアルゴリズム及び閾値で判定できるような仕組みを導入して、フレームタイプを判定しても良い。
【0038】
図2は、第1の実施形態に係る動画像復号装置120の構成を示すブロック図である。
【0039】
図2において、動画像復号装置120は、フレームタイプ判定部121、イントラ復号部122、バッファメモリ123、差分復号部124、WZ復号部125及びフレーム出力部126を有する。
【0040】
動画像復号装置120は、ハードウェア的に各種回路を接続して構築されても良く、また、CPU、ROM、RAMなどを有する汎用的な装置が動画像復号プログラムを実行することで動画像復号装置としての機能を実現するように構築されても良い。いずれの構築方法を適用した場合であっても、動画像復号装置120の機能的な詳細構成は、図2で表す構成となっている。
【0041】
フレームタイプ判定部121は、入力されたストリームデータのフレームタイプの判定を行う。例えば、フレームタイプ判定部121は、ストリームデータ中のヘッダを参照することでフレームタイプを判定し、イントラ符号化されたキーフレームならばストリームデータをキーストリームデータとしてイントラ復号部122に出力し、差分符号化されたキーフレームならばストリームデータをキーストリームデータとして差分復号部124に出力し、WZフレームならばストリームデータをWZストリームデータとしてWZ復号部125に出力する。
【0042】
また、例えば、入力ストリームデータについて、先述の従来の技術と同様に、キーフレームとWZフレームを識別するためだけの識別子が付加されている場合には、イントラ符号化するキーフレームと差分符号化するキーフレームの識別は、フレームタイプ判定部121において、フレームタイプ判定部111で使用した同様のアルゴリズム及び閾値によって、判定する。これは、動画像符号化装置110のフレームタイプ判定部111と、動画像復号装置120のフレームタイプ判定部121とで使用するアルゴリズムや閾値を共通にする方法である。この方法を実現するために、動画像符号化装置110のフレームタイプ判定部111及び動画像復号装置120のフレームタイプ判定部121は、予め定められたアルゴリズムや閾値を使うようにしても良いし、又は、付加拡張情報を送るためのパケットやメッセージを通して、共有しても良い。
【0043】
イントラ復号部122は、先述の従来の技術(イントラ復号部322)と同様であるので、その説明を省略する。
【0044】
バッファメモリ123は、イントラ復号部122や差分復号部124が出力する復号キーフレームを、後の差分復号処理のために保存するものである。
【0045】
差分復号部124は、キーストリームデータを復号し、復号結果に参照フレームを足し合わせることで、復号キーフレームを生成し、出力する。参照フレームは、動画像符号化装置110の差分符号化部115が参照したフレームと同じインデックスのフレームとする。
【0046】
WZ復号部125は、先述の従来の技術(WZ復号部325)と同様であるので、その説明を省略する。
【0047】
フレーム出力部126は、イントラ復号部122と、差分復号部124と、WZ復号部125とから出力される復号キーフレーム又は復号WZフレームを、順次、復号フレームとして出力する。
【0048】
(A−2)第1の実施形態の動作
次に、以上のような構成を有する第1の実施形態の動画像符号化システム1における主に符号化・復号動作を、図面を参照しながら説明する。
【0049】
まずは、動画像符号化装置110の動作について説明する。
【0050】
図4は、第1の実施形態に係る動画像符号化装置110の動作を示すフローチャートである。
【0051】
フレームタイプ判定部111は、入力フレームをキーフレームとして符号化するか、WZフレームとして符号化するかを判定する(S101)。フレームタイプ判定部111は、キーフレームとして符号化する場合、イントラ符号化するか、差分符号化するかどうかも判定する(S102)。
【0052】
具体的には、フレームタイプ判定部111は、WZ符号量の総和が予め定められた閾値を超えるか否かで判定する。つまり、フレームタイプ判定部111は、WZ符号量の総和が、閾値以上の場合には、イントラ符号化を行い、閾値を超えない場合には、差分符号化を行う。なお、フレームタイプ判定部111が、入力フレームをイントラ符号化するキーフレームと判定した場合には、後述するステップS103の処理に進む。フレームタイプ判定部111が、差分符号化するキーフレームと判定した場合は、後述するステップS104の処理に進む。フレームタイプ判定部111が、WZフレームと判定した場合は、後述するステップS106の処理に進む。
【0053】
イントラ符号化部112は、キーフレームをイントラ符号化し、キー符号化データを出力する(S103)。また、イントラ符号化部112は、後の差分符号化のために、再構成用データをバッファメモリ113に出力もする。その後の処理は、後述するステップS106の処理に進む。
【0054】
参照フレーム再構成部114は、再構成用データから参照フレームを再構成する(S104)。
【0055】
差分符号化部115は、キーフレームから参照フレームを差し引き、差分画像を符号化して、キー符号化データとして出力する(S105)。差分符号化部115は、後の差分符号化のために、再構成用データをバッファメモリ113に出力もする。その後の処理は、後述するステップS107の処理に進む。
【0056】
WZ符号化部116は、WZフレームをWZ符号化し、WZ符号化データとして出力する(S106)。
【0057】
ストリーム出力部117は、例えば、キー符号化データやWZ符号化データに、フレームタイプを識別できるヘッダを付けて、ストリームデータとして出力する(S107)。当該ストリームデータは、例えば、ネットワークNを通じて、動画像復号装置120に出力される。
【0058】
次に、動画像復号装置120の動作について説明する。
【0059】
図5は、第1の実施形態に係る動画像復号装置120の動作を示すフローチャートである。
【0060】
フレームタイプ判定部121は、入力ストリームデータをキーフレームとして復号するか、WZフレームとして復号するかを判定する(S201)。さらに、フレームタイプ判定部121は、入力ストリームデータをキーフレームとして復号する場合において、イントラ復号するか、差分復号するかどうかも判定する(S202)。ステップS201及びステップS202の入力ストリームデータのフレームタイプの判定は、例えば、ストリームデータのヘッダに負荷されたフレームタイプの情報に基づいて判定される。
【0061】
なお、フレームタイプ判定部121が、入力ストリームデータをイントラ符号化されたキーフレームと判定した場合、後の処理は、後述するステップS203の処理に進む。フレームタイプ判定部121が、入力ストリームデータを差分符号化されたキーフレームと判定した場合、後の処理は、後述するステップS204の処理に進む。また、フレームタイプ判定部121が、入力ストリームデータをWZフレームと判定した場合、後の処理は、後述するステップS205の処理に進む。
【0062】
イントラ復号部122は、キーストリームデータを復号し、復号キーフレームとして出力する(S203)。また、イントラ復号部122は、復号キーフレームを、後の差分復号のためにバッファメモリ123にも出力する。後の処理は、後述するステップS206の処理に進む。
【0063】
差分復号部124は、キーストリームデータを復号し、その結果を、バッファメモリ123から取り出した参照フレームに足し合わせる(S204)。差分復号部124は、足し合わせた結果を復号キーフレームとして出力する。また、差分復号部124は、復号キーフレームを後の差分符号化のためにバッファメモリ123にも出力する。後の処理は、後述するステップS206の処理に進む。
【0064】
WZ符号化部125は、ストリームデータをWZ復号し、復号WZフレームとして出力する(S205)。
【0065】
フレーム出力部126は、復号キーフレーム又は復号WZフレームを復号フレームとして順次出力する(S206)。
【0066】
(A−3)第1の実施形態の効果
第1の実施形態によれば、動画像符号化装置110のフレームタイプ判定部111が、WZ符号化部116から通知されるWZ符号量の総和と、予め定められた閾値とを比較することによって、キーフレームの最適な動画像符号化方式(差分符号化又はイントラ符号化のいずれか)の選択が可能となった。これにより、DVC方式を採用している動画像符号化システムは、システム全体として符号化に伴う処理量を減少させることが可能となった。言い換えれば、動画像符号化装置110が、キーフレームについて、イントラ符号化と差分符号化のいずれも実施し、両者の符号量を比較した後に、いずれかの符号化方式を選択するプロセスを経ることなく(つまり、演算量の大幅な増加を伴わない)、従来技術に比べて有利な効果を発揮することになる。
【0067】
(B)第2の実施形態
次に、本発明による動画像符号化装置、動画像符号化プログラム、及び動画像符号化システムの第2の実施形態を、図面を参照しながら説明する。
【0068】
(B−1)第2の実施形態の構成
第2の実施形態の動画像符号化システム1も、上述した図1に示すように、動画像符号化装置110Aと動画像復号装置120を有するものである。なお、内部構成は異なっているが、動画像符号化装置に対する符号は、第1の実施形態のものと同一のものを用いる。
【0069】
図6は、第2の実施形態に係る動画像符号化装置110Aの構成を示すブロック図であり、第1の実施形態に係る図1との同一、対応部分には同一、対応符号を付して示している。
【0070】
図6において、第2の実施形態に係る動画像符号化装置110Aは、フレームタイプ判定部411、イントラ符号化部112、バッファメモリ113、参照フレーム再構成部414、差分符号化部115、WZ符号化部116及びストリーム出力部117を有する。すなわち、第1の実施形態におけるフレームタイプ判定部111及び参照フレーム再構成部114に代えて、フレームタイプ判定部411及び参照フレーム再構成部414が設けられており、その他の構成要素は、第1の実施形態のものと同様である。
【0071】
フレームタイプ判定部411は、入力されたフレームをキーフレームとWZフレームかに判定する手法については、先述のフレームタイプ判定部111と同一である。しかしながら、キーフレームをイントラ符号化するキーフレームか、差分符号化するキーフレームかに判定する手法については、先述のフレームタイプ判定部111と異なるので、以下に、その説明を行う。
【0072】
フレームタイプ判定部411は、まず、入力された最初のキーフレームをイントラ符号化するキーフレームと判定する。これ以降、フレームタイプ判定部411は、入力されたキーフレームと参照フレームの絶対差分和が予め定められた閾値以上の場合にイントラ符号化するキーフレームと判定し、それ以外の場合には差分符号化するキーフレームと判定する。なお、フレームタイプ判定部411は、判定に利用する参照フレームを後述する参照フレーム再構成部414から取得する。
【0073】
参照フレーム再構成部414は、先述の参照フレーム再構成部114の機能に加え、フレームタイプ判定部411からの求めに応じて、参照フレームをフレームタイプ判定部411に出力する。
【0074】
(B−2)第2の実施形態の動作
次に、第2の実施形態に係る動画像符号化システム1の動作を説明する。
【0075】
第2の実施形態の動画像符号化装置110Aの動作も、第1の実施形態と同様に図4を用いて説明することができる。ただし、図4のフローチャートのS102処理が、第1の実施形態と異なるので、以下では、この動作(S102’)を説明する。
【0076】
フレームタイプ判定部411は、入力されたキーフレームについて、イントラ符号化するか、差分符号化するかを判定する(S102’)。
【0077】
具体的には、フレームタイプ判定部411は、入力されたキーフレームが最初に入力されたキーフレームかを判定し、最初に入力されたキーフレームならば、当該フレームはイントラ符号化するキーフレームと判定する。なお、最初に入力されたキーフレームかの判定については、例えば、キーフレームのインデックスを利用して判定して良い。次以降のキーフレームについては、以下の判定処理を行う。
【0078】
フレームタイプ判定部411は、参照フレーム再構成部414から参照フレームを取得し、入力されたキーフレームと参照フレームの絶対差分和が予め定められた閾値以上の場合にイントラ符号化するキーフレームと判定し、それ以外の場合には差分符号化するキーフレームと判定する。
【0079】
(B−3)第2の実施形態の効果
第2の実施形態によれば、動画像符号化装置110Aのフレームタイプ判定部411が、入力されたキーフレームと参照フレームとの絶対差分和と、予め定められた閾値とを比較することによって、キーフレームの最適な符号化方式(差分符号化又はイントラ符号化のいずれか)の選択が可能となった。これにより、第1の実施形態の効果の項で述べた効果と同様の効果を得ることができる。
【0080】
(C)第3の実施形態
次に、本発明による動画像符号化装置、動画像符号化プログラム、及び動画像符号化システムの第3の実施形態を、図面を参照しながら説明する。
【0081】
(C−1)第3の実施形態の構成
第3の実施形態の動画像符号化システム1の構成についても、第1の実施形態の動画像符号化システム1と同様に図3を用いて示すことができる。ただし、動画像符号化システム1の構成は、動画像符号化システム1の動画像符号化装置110の代わりに動画像符号化装置210を適用した点が異なる。以下では、第3の実施形態の動画像符号化装置210の構成について、第1の実施形態の動画像符号化装置110との差異を中心に説明する。
【0082】
図7は、第3の実施形態に係る動画像符号化装置210の構成を示すブロック図であり、第1の実施形態に係る図1との同一、対応部分には同一、対応符号を付して示している。
【0083】
動画像符号化装置210は、フレームタイプ判定部211、イントラ符号化部212、バッファメモリ113、参照フレーム再構成部114、差分符号化部215、WZ符号化部116、ストリーム出力部117、閾値調整用記憶領域218及び閾値調整部219を有する。
【0084】
バッファメモリ113、参照フレーム再構成部114、WZ符号化部116及びストリーム出力部117は、第1の実施形態の構成の項において説明したので、その詳細説明は、省略する。
【0085】
フレームタイプ判定部211は、フレームタイプ判定部111の機能に加え、後述する閾値調整部219からの閾値の入力を受け付ける機能を有するものである。第1の実施形態の閾値は予め設定しておく固定値であったが、第2の実施形態の閾値は可変値である点が第1の実施形態と異なる。フレームタイプ判定部211は、入力された閾値に基づき、フレームタイプの判定を行う。
【0086】
イントラ符号化部212は、イントラ符号化部112の機能に加え、キー符号化データの符号量であるキー符号量を閾値調整用記憶領域218に出力する。
【0087】
差分符号化部215は、差分符号化部115の機能に加え、同様にキー符号化データの符号量であるキー符号量を閾値調整用記憶領域218に出力する。
【0088】
閾値調整用記憶領域218は、「閾値」と「キー符号量」を記憶する閾値調整用の記憶領域である。閾値調整用記憶領域218は、記憶された閾値とキー符号量を「閾値調整用データ」として、閾値調整部219に出力する。
【0089】
閾値調整部219は、直前のフレームタイプ判定時に使用した閾値と、その結果得られたキー符号量、及び、その前のフレームタイプ判定時に使用した閾値と、その結果得られたキー符号量とに基づき、閾値を更新する。そして、閾値調整部219は、その閾値をフレームタイプ判定部211と閾値調整用記憶領域218に出力する。閾値の更新は、例えば、以下の(1)式に基づき行う。
【0090】
T(n+2)=T(n+1) − α[R(n+1)−R(n)]/[T(n+1)−T(n)] …(1)
ここで、nは符号化するフレームのインデックスを表す。T(n)は、フレームnを符号化するときに用いる閾値を表す。R(n)は、フレームnのキー符号量を表す。αは、任意の正の定数とする。
【0091】
システムの起動時など、閾値T(n)や符号量R(n)、閾値T(n+1)や符号量R(n+1)のデータが存在しない場合には、予め定めたパターンに基づき、閾値T(n)は、決定される。
【0092】
上記(1)式に基づき、更新することで、閾値T(n)と符号量R(n)の関係の勾配に基づき、更新方向(プラス/マイナス)と更新の大きさを決めるため、高い確率で単調減少するように閾値T(n)は、変化する。
【0093】
ただし、閾値T(n)は、パラメータαの大きさによっては振動してしまったり、局所解に捕まったりする可能性もある。そのため、シミュレーティッドアニーリングのように、システムを起動してしばらくは、大きなαで更新し、nの増加に伴ってαも小さくしていくようにしても良い。つまり、例えば、下記の式(2)に従って、閾値T(n)を変化させても良い。
【0094】
T(n+2)=T(n+1) − α(n)[R(n+1)−R(n)]/[T(n+1)−T(n)] …(2)
ここでα(n)は、単調減少関数とする。
【0095】
(C−2)第3の実施形態の動作
次に、以上のような構成を有する第3の実施形態の動画像符号化システム1における動画像符号化装置210の動作を、図面を参照しながら説明する。
【0096】
図8は、第3の実施形態に係る動画像符号化装置210の動作を示すフローチャートである。なお、先述の第1の実施形態に係る動画像符号化装置110の動作と対応する処理については、適宜省略しながら説明する。
【0097】
ステップS301の処理は、先述の対応するステップS101の処理と同様であるため、その説明を省略する。
【0098】
フレームタイプ判定部211は、キーフレームとして符号化する場合、イントラ符号化するか、差分符号化するかどうかも判定する(S302)。
【0099】
具体的には、フレームタイプ判定部211は、WZ符号量の総和が、閾値調整用記憶領域218が更新した現在のフレームnに対応する閾値T(n)を超えるか否かで判定する。つまり、フレームタイプ判定部211は、WZ符号量の総和が閾値T(n)以上の場合には、イントラ符号化を行い、閾値T(n)を超えない場合には、差分符号化を行う。
【0100】
ステップS303の処理は、先述の対応するステップS103の処理を全て含むため、その共通する処理の説明を省略する。さらに、イントラ符号化部212は、閾値調整用記憶領域218に対して、キー符号量を出力する(ステップS303)。
【0101】
ステップS304の処理は、先述の対応するステップS104の処理と同様であるため、その説明を省略する。
【0102】
ステップS305の処理は、先述の対応するステップS105の処理を全て含むため、その共通する処理の説明を省略する。さらに、差分符号化部215は、閾値調整用記憶領域218に対して、キー符号量を出力する(ステップS305)。
【0103】
ステップS306及びステップS307の処理は、先述の対応するステップS106及びステップS107の処理と同様であるため、その説明を省略する。
【0104】
閾値調整部219は、閾値調整用記憶領域218から取得した閾値調整用データから、新しい閾値T(n+2)を計算し、フレームタイプ判定部211と閾値調整用記憶領域218に出力する(ステップS308)。
【0105】
(C−3)第3の実施形態の効果
第3の実施形態によれば、第1の実施形態においてWZ符号量の総和との比較で用いられていた閾値を符号化の選択時において動的に変化させることによって、映像の性質や圧縮条件に応じた最適な閾値が使用可能となり、フレームタイプ判定部121は、第1の実施形態に比べて、より最適な動画像符号化方式の選択が可能となる。これにより、映像の性質や圧縮条件が変化する動画像符号化システムの利用環境において、動画像符号化システムは、システム全体の符号量をより一層削減することが可能となる。
【0106】
また、第1の実施形態では、動画像符号化システムについて良く理解しているユーザ(例えば、開発者)により、最適な閾値を設定する必要があったが、第3の実施形態では、このプロセスが不要になるので、動画像符号化システムのより簡易な運用が可能となる。
【0107】
(D)他の実施形態
上記各実施形態に加えて、さらに、以下に例示するような変形実施形態も挙げることができる。
【0108】
上記各実施形態において、動画像符号化装置(110、110A、210)と動画像復号装置120との間でどのようにストリームデータを受け渡しするかを明記していないが、任意の通信プロトコル(例えば、HTML5等)に従って、動画像符号化システム1は、ストリームデータの受け渡しを行って良い。また、動画像符号化システム1は、ストリーム配信形式ではなく、ダウンロード形式により、符号化データを受け渡して良い。さらに、動画像符号化システム1は、ネットワークNを介さずにデータのやり取りを行っても良く、例えば、動画像符号化装置(110、110A、210)から出力された符号化データを任意のファイル形式により記録媒体(CD、USBメモリ等)に格納し、その格納されたデータを動画像復号装置120に入力しても良い。
【0109】
第2の実施形態では、非キーフレームについて、WZ符号化部116においてWyner−Ziv符号化方式に従った符号化を行っていたが、これは一例であり、代替えとして、任意の符号化方式に従った符号化処理を行っても良い。
【符号の説明】
【0110】
1…動画像符号化システム、110、110A、210…動画像符号化装置、111、211、411…フレームタイプ判定部、112、212…イントラ符号化部、113…バッファメモリ、114、414…参照フレーム再構成部、115、215…差分符号化部、116…WZ符号化部、117…ストリーム出力部、120…動画像復号装置、121…フレームタイプ判定部、122…イントラ復号部、123…バッファメモリ、124…差分復号部、125…WZ復号部、126…フレーム出力部、218…閾値調整用記憶領域、219…閾値調整部。
図1
図2
図3
図4
図5
図6
図7
図8
図9