特許第6016488号(P6016488)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ KDDI株式会社の特許一覧

特許6016488映像圧縮フォーマット変換装置、映像圧縮フォーマット変換方法、およびプログラム
<>
  • 特許6016488-映像圧縮フォーマット変換装置、映像圧縮フォーマット変換方法、およびプログラム 図000002
  • 特許6016488-映像圧縮フォーマット変換装置、映像圧縮フォーマット変換方法、およびプログラム 図000003
  • 特許6016488-映像圧縮フォーマット変換装置、映像圧縮フォーマット変換方法、およびプログラム 図000004
  • 特許6016488-映像圧縮フォーマット変換装置、映像圧縮フォーマット変換方法、およびプログラム 図000005
  • 特許6016488-映像圧縮フォーマット変換装置、映像圧縮フォーマット変換方法、およびプログラム 図000006
  • 特許6016488-映像圧縮フォーマット変換装置、映像圧縮フォーマット変換方法、およびプログラム 図000007
  • 特許6016488-映像圧縮フォーマット変換装置、映像圧縮フォーマット変換方法、およびプログラム 図000008
  • 特許6016488-映像圧縮フォーマット変換装置、映像圧縮フォーマット変換方法、およびプログラム 図000009
  • 特許6016488-映像圧縮フォーマット変換装置、映像圧縮フォーマット変換方法、およびプログラム 図000010
  • 特許6016488-映像圧縮フォーマット変換装置、映像圧縮フォーマット変換方法、およびプログラム 図000011
  • 特許6016488-映像圧縮フォーマット変換装置、映像圧縮フォーマット変換方法、およびプログラム 図000012
  • 特許6016488-映像圧縮フォーマット変換装置、映像圧縮フォーマット変換方法、およびプログラム 図000013
  • 特許6016488-映像圧縮フォーマット変換装置、映像圧縮フォーマット変換方法、およびプログラム 図000014
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6016488
(24)【登録日】2016年10月7日
(45)【発行日】2016年10月26日
(54)【発明の名称】映像圧縮フォーマット変換装置、映像圧縮フォーマット変換方法、およびプログラム
(51)【国際特許分類】
   H04N 19/119 20140101AFI20161013BHJP
   H04N 19/107 20140101ALI20161013BHJP
   H04N 19/14 20140101ALI20161013BHJP
   H04N 19/176 20140101ALI20161013BHJP
   H04N 19/40 20140101ALI20161013BHJP
【FI】
   H04N19/119
   H04N19/107
   H04N19/14
   H04N19/176
   H04N19/40
【請求項の数】5
【全頁数】18
(21)【出願番号】特願2012-152951(P2012-152951)
(22)【出願日】2012年7月6日
(65)【公開番号】特開2014-17621(P2014-17621A)
(43)【公開日】2014年1月30日
【審査請求日】2015年1月16日
【前置審査】
(73)【特許権者】
【識別番号】000208891
【氏名又は名称】KDDI株式会社
(74)【代理人】
【識別番号】100122426
【弁理士】
【氏名又は名称】加藤 清志
(72)【発明者】
【氏名】吉野 知伸
(72)【発明者】
【氏名】内藤 整
【審査官】 坂東 大五郎
(56)【参考文献】
【文献】 Isabelle Metoevi and Stephane Coulombe,Efficient MPEG-4 to H.264 transcoding exploiting MPEG-4 block modes, motion vectors, and residuals,9th International Symposium on Communications and Information Technology, 2009. ISCIT 2009.,2009年 9月28日,pp.224-229
(58)【調査した分野】(Int.Cl.,DB名)
H04N 19/00−19/98
(57)【特許請求の範囲】
【請求項1】
符号化処理の単位ブロックサイズが異なる圧縮方式間での映像圧縮フォーマットの変換を行う映像圧縮フォーマット変換装置であって、
変換後における符号化処理の単位ブロックである変換後単位ブロックごとに、当該変換後単位ブロックに対応する変換前単位ブロックにおけるデコード映像の特徴量解析を行う画像解析手段と、
前記変換後単位ブロックで適用し得る全ての予測方法と、変換前における符号化処理の単位ブロックである変換前単位ブロックのうち当該変換後単位ブロックに対応するもので適用し得る全ての予測方法と、の組み合わせごとに、前記画像解析手段による特徴量解析の結果に基づいて、変換の前後での予測方法の遷移を遷移率で評価する遷移率算出手段と、
前記遷移率に基づいて、前記変換後単位ブロックごとに、当該変換後単位ブロックで適用し得る全ての予測方法の中から、1つ以上を予測方法候補として選択する予測方法候補決定手段と、
前記変換後単位ブロックごとに、前記予測方法候補を適用した結果を求める適用結果算出手段と、
前記変換後単位ブロックごとに、前記適用結果算出手段により求められた結果に基づいて、前記予測方法候補の中から当該変換後単位ブロックに最適な予測方法を決定する予測方法決定手段と、を備えることを特徴とする映像圧縮フォーマット変換装置。
【請求項2】
前記画像解析手段は、前記特徴量解析を行って、変換後単位ブロックに対応する変換前単位ブロックにおけるデコード映像についてテクスチャの複雑さを評価し、
前記遷移率算出手段は、前記テクスチャの複雑さの評価結果に基づいて前記遷移率を算出し、
前記予測方法候補決定手段は、前記遷移率に基づいて、前記テクスチャの複雑さが高くなるに従って、前記変換後単位ブロックのサイズが小さい予測方法を前記予測方法候補として選択する度合いを高くすることを特徴とする請求項1に記載の映像圧縮フォーマット変換装置。
【請求項3】
前記予測方法候補決定手段には、前記予測方法候補として選択すべき予測方法を示す情報が入力され、
前記予測方法候補決定手段は、前記情報に基づいて前記予測方法候補を選択することを特徴とする請求項1に記載の映像圧縮フォーマット変換装置。
【請求項4】
画像解析手段、遷移率算出手段、予測方法候補決定手段、適用結果算出手段、および予測方法決定手段を備え、符号化処理の単位ブロックサイズが異なる圧縮方式間での映像圧縮フォーマットの変換を行う映像圧縮フォーマット変換装置における映像圧縮フォーマット変換方法であって、
前記画像解析手段が、変換後における符号化処理の単位ブロックである変換後単位ブロックごとに、当該変換後単位ブロックに対応する変換前単位ブロックにおけるデコード映像の特徴量解析を行う第1のステップと、
前記遷移率算出手段が、前記変換後単位ブロックで適用し得る全ての予測方法と、変換前における符号化処理の単位ブロックである変換前単位ブロックのうち当該変換後単位ブロックに対応するもので適用し得る全ての予測方法と、の組み合わせごとに、前記第1のステップによる特徴量解析の結果に基づいて、変換の前後での予測方法の遷移を遷移率で評価する第2のステップと、
前記予測方法候補決定手段が、前記遷移率に基づいて、前記変換後単位ブロックごとに、当該変換後単位ブロックで適用し得る全ての予測方法の中から、1つ以上を予測方法候補として選択する第3のステップと、
前記適用結果算出手段が、前記変換後単位ブロックごとに、前記予測方法候補を適用した結果を求める第4のステップと、
前記予測方法決定手段が、前記変換後単位ブロックごとに、前記第4のステップにおいて求められた結果に基づいて、前記予測方法候補の中から当該変換後単位ブロックに最適な予測方法を決定する第5のステップと、を備えることを特徴とする映像圧縮フォーマット変換方法。
【請求項5】
符号化処理の単位ブロックサイズが異なる圧縮方式間での映像圧縮フォーマットの変換を行うためのプログラムであって、
変換後における符号化処理の単位ブロックである変換後単位ブロックごとに、当該変換後単位ブロックに対応する変換前単位ブロックにおけるデコード映像の特徴量解析を行う画像解析手段と、
前記変換後単位ブロックで適用し得る全ての予測方法と、変換前における符号化処理の単位ブロックである変換前単位ブロックのうち当該変換後単位ブロックに対応するもので適用し得る全ての予測方法と、の組み合わせごとに、前記画像解析手段による特徴量解析の結果に基づいて、変換の前後での予測方法の遷移を遷移率で評価する遷移率算出手段と、
前記遷移率に基づいて、前記変換後単位ブロックごとに、当該変換後単位ブロックで適用し得る全ての予測方法の中から、1つ以上を予測方法候補として選択する予測方法候補決定手段と、
前記変換後単位ブロックごとに、前記予測方法候補を適用した結果を求める適用結果算出手段と、
前記変換後単位ブロックごとに、前記適用結果算出手段により求められた結果に基づいて、前記予測方法候補の中から当該変換後単位ブロックに最適な予測方法を決定する予測方法決定手段と、としてコンピュータを機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、映像圧縮フォーマット変換装置、映像圧縮フォーマット変換方法、およびプログラムに関する。
【背景技術】
【0002】
映像圧縮方式技術の高性能化に関する研究開発が、世界的に継続して実施されている。そして、映像圧縮技術に関する国際標準規格として、数年ごとに新しい技術が規格化されている。
【0003】
近年では、2003年にH.264(例えば、非特許文献1参照)が規格化され、普及しつつある。しかしながら、国際標準規格の規格化の場では、新たな圧縮技術としてHEVC(例えば、非特許文献2参照)が議論されている。
【0004】
H.264とHEVCといった、互いに異なる圧縮方式間では、類似した技術が用いられるものの、圧縮データのフォーマットとしての互換性はない場合がある。例えばH.264とHEVCとでは、どちらも動き補償および直交変換(離散コサイン変換)をベースとした方式であるが、フォーマットに関する互換性はない。
【0005】
このため、新たな映像圧縮方式が普及する際には、圧縮データフォーマットが互いに異なる映像コンテンツが、混在することになる。このため、映像コンテンツを、旧来の圧縮データフォーマットから、新たな圧縮データフォーマットに変換する、フォーマット変換技術が求められる。
【先行技術文献】
【非特許文献】
【0006】
【非特許文献1】Joint Video Team(JVT) of ISO/IEC MPEG and ITU-T VCEG, “Text of ISO/IEC 14496-10 Advanced Video Coding,”
【非特許文献2】High Efficiency Video Coding (HEVC) text specification draft 6, JCTVC-H1003
【非特許文献3】ISO/IEC MPEG and ITU-T VCEG, “Text of ISO/IEC 13818-2 Generic coding of moving pictures and associated audio information: Video,” 2000.
【発明の概要】
【発明が解決しようとする課題】
【0007】
従来のフォーマット変換技術は、変換の前後で符号化処理の単位ブロックサイズが同一である場合を想定した技術である。
【0008】
例えばMPEG−2(例えば、非特許文献3参照)とH.264とでは、符号化処理の単位ブロックサイズが同一である。このため、映像コンテンツをMPEG−2からH.264に変換する場合、変換対象となる符号化処理ブロックが1対1で対応するため、変換前の符号化情報を変換後の圧縮処理に用いることは容易であり、従来のフォーマット変換技術を適用することが可能であった。
【0009】
しかしながら、H.264からHEVCのように、変換の前後で符号化処理の単位ブロックサイズが異なる場合、上述のように変換前の符号化情報を変換後の圧縮処理に単純に用いると、画質が低下してしまう場合があった。
【0010】
そこで、本発明は、上述の課題に鑑みてなされたものであり、変換の前後で符号化処理の単位ブロックサイズが異なる圧縮方式間であっても、画質の低下を抑制しつつ映像圧縮フォーマットを変換できる映像圧縮フォーマット変換装置、映像圧縮フォーマット変換方法、およびプログラムを提供することを目的とする。
【課題を解決するための手段】
【0011】
本発明は、上記の課題を解決するために、以下の事項を提案している。
(1) 本発明は、符号化処理の単位ブロックサイズが異なる圧縮方式間での映像圧縮フォーマットの変換を行う映像圧縮フォーマット変換装置(例えば、図1の映像圧縮フォーマット変換装置1や、図10の映像圧縮フォーマット変換装置1Aに相当)であって、変換後における符号化処理の単位ブロックである変換後単位ブロックごとに、当該変換後単位ブロックで適用し得る全ての予測方法(例えば、図6〜9のIntra8×8、Intra16×16、Inter8×8、およびInter16×16に相当)の中から、1つ以上を予測方法候補として選択する予測方法候補決定手段(例えば、図4の予測方法候補決定部212や、図12の予測方法候補決定部212Aに相当)と、前記変換後単位ブロックごとに、前記予測方法候補を適用した結果を求める適用結果算出手段(例えば、図4図12の単位予測値生成部213およびコスト値算出部214に相当)と、前記変換後単位ブロックごとに、前記適用結果算出手段により求められた結果に基づいて、前記予測方法候補の中から当該変換後単位ブロックに最適な予測方法を決定する予測方法決定手段(例えば、図4図12の予測方法決定部215に相当)と、を備えることを特徴とする映像圧縮フォーマット変換装置を提案している。
【0012】
この発明によれば、符号化処理の単位ブロックサイズが異なる圧縮方式間での映像圧縮フォーマットの変換を行う映像圧縮フォーマット変換装置に、予測方法候補決定手段、適用結果算出手段、および予測方法決定手段を設けた。そして、予測方法候補決定手段により、変換後における符号化処理の単位ブロックである変換後単位ブロックごとに、この変換後単位ブロックで適用し得る全ての予測方法の中から、1つ以上を予測方法候補として選択することとした。また、適用結果算出手段により、変換後単位ブロックごとに、予測方法候補を適用した結果を求めることとした。また、予測方法決定手段により、変換後単位ブロックごとに、適用結果算出手段により求められた結果に基づいて、この変換後単位ブロックに最適な予測方法を予測方法候補の中から決定することとした。
【0013】
このため、予測方法候補として、変換処理である符号化処理において高い符号化性能が期待される予測方法を選択することで、変換後単位ブロックごとに、符号化処理において高い符号化性能が期待される予測方法を適用できる。したがって、変換の前後で符号化処理の単位ブロックサイズが異なる圧縮方式間であっても、画質の低下を抑制しつつ、映像圧縮フォーマットを変換できる。
【0014】
また、適用結果算出手段により予測方法候補を適用した結果を求め、この結果に基づいて、予測方法決定手段により変換後単位ブロックに最適な予測方法を決定する。このため、適用結果算出手段は、適用結果を、変換後単位ブロックで適用し得る全ての予測方法について求めるのではなく、これら予測方法のうちの一部である予測方法候補についてのみ求めることになる。したがって、変換の前後で符号化処理の単位ブロックサイズが異なる圧縮方式間において、変換に要する処理コストを低減できる。
【0015】
(2) 本発明は、(1)の映像圧縮フォーマット変換装置について、前記変換後単位ブロックで適用し得る全ての予測方法と、変換前における符号化処理の単位ブロックである変換前単位ブロックのうち当該変換後単位ブロックに対応するもので適用し得る全ての予測方法(例えば、図6〜9のIntra4×4、Intra8×8、Inter4×4、およびInter8×8に相当)と、の組み合わせごとに、変換の前後での予測方法の遷移を遷移率で評価する遷移率算出手段(例えば、図4の予測方法候補決定部212や、図12の予測方法候補決定部212Aに相当)を備え、前記予測方法候補決定手段は、前記遷移率に基づいて、前記予測方法候補を選択することを特徴とする映像圧縮フォーマット変換装置を提案している。
【0016】
ここで、変換前単位ブロックにおける予測方法と、変換後単位ブロックにおける予測方法と、の間には、相関性が存在する場合がある。
【0017】
そこで、この発明によれば、(1)の映像圧縮フォーマット変換装置に遷移率算出手段を設けた。そして、遷移率算出手段により、変換後単位ブロックで適用し得る全ての予測方法と、変換前における符号化処理の単位ブロックである変換前単位ブロックのうち変換後単位ブロックに対応するもので適用し得る全ての予測方法と、の組み合わせごとに、変換の前後での予測方法の遷移を遷移率で評価することとした。また、予測方法候補決定手段により、遷移率に基づいて、予測方法候補を選択することとした。
【0018】
このため、変換後単位ブロックにおける予測方法の決定に、変換前単位ブロックにおける予測方法を反映させることができる。したがって、画質の低下をさらに抑制できる。
【0019】
(3) 本発明は、(2)の映像圧縮フォーマット変換装置について、前記変換後単位ブロックごとに、当該変換後単位ブロックに対応する変換前単位ブロックにおけるデコード映像の特徴量解析を行う画像解析手段(例えば、図4の画像解析部211に相当)を備え、前記遷移率算出手段は、前記画像解析手段による特徴量解析の結果に基づいて、前記遷移率を算出することを特徴とする映像圧縮フォーマット変換装置を提案している。
【0020】
ここで、変換前単位ブロックにおける予測方法と、変換後単位ブロックにおける予測方法と、の間には、テクスチャの複雑さやオブジェクトの追従性などの、映像の特徴量に応じた相関性が存在する場合がある。
【0021】
そこで、この発明によれば、(2)の映像圧縮フォーマット変換装置に画像解析手段を設けた。そして、画像解析手段により、変換後単位ブロックごとに、この変換後単位ブロックに対応する変換前単位ブロックにおけるデコード映像の特徴量解析を行うこととした。また、遷移率算出手段により、画像解析手段による特徴量解析の結果に基づいて、遷移率を算出することとした。
【0022】
このため、変換後単位ブロックにおける予測方法の決定に、この変換後単位ブロックに対応する変換前単位ブロックにおけるデコード映像の特徴量に応じて、変換前単位ブロックにおける予測方法を反映させることができる。したがって、画質の低下をさらに抑制できる。
【0023】
(4) 本発明は、(3)の映像圧縮フォーマット変換装置について、前記画像解析手段は、前記特徴量解析を行って、変換後単位ブロックに対応する変換前単位ブロックにおけるデコード映像についてテクスチャの複雑さを評価し、前記遷移率算出手段は、前記テクスチャの複雑さの評価結果に基づいて前記遷移率を算出し、前記予測方法候補決定手段は、前記遷移率に基づいて、前記テクスチャの複雑さが高くなるに従って高精度になる予測方法を、前記予測方法候補として選択することを特徴とする映像圧縮フォーマット変換装置を提案している。
【0024】
この発明によれば、(3)の映像圧縮フォーマット変換装置において、画像解析手段により、特徴量解析を行って、変換後単位ブロックに対応する変換前単位ブロックにおけるデコード映像についてテクスチャの複雑さを評価し、遷移率算出手段により、テクスチャの複雑さの評価結果に基づいて遷移率を算出することとした。また、予測方法候補決定手段により、遷移率に基づいて、テクスチャの複雑さが高くなるに従って高精度になる予測方法を、予測方法候補として選択することとした。
【0025】
このため、変換後単位ブロックにおける予測方法の決定に、この変換後単位ブロックに対応する変換前単位ブロックにおけるデコード映像のテクスチャの複雑さに応じて、変換前単位ブロックにおける予測方法を反映させることができる。したがって、画質の低下をさらに抑制できる。
【0026】
(5) 本発明は、(3)または(4)の映像圧縮フォーマット変換装置について、前記画像解析手段は、前記特徴量解析を行って、変換後単位ブロックに対応する変換前単位ブロックにおけるデコード映像についてオブジェクトの追従性を評価し、前記遷移率算出手段は、前記オブジェクトの追従性の評価結果に基づいて前記遷移率を算出し、前記予測方法候補決定手段は、前記遷移率に基づいて、前記オブジェクトの追従性が低くなるに従ってイントラ予測を前記予測方法候補として選択する度合いを高くすることを特徴とする映像圧縮フォーマット変換装置を提案している。
【0027】
この発明によれば、(3)または(4)の映像圧縮フォーマット変換装置において、画像解析手段により、特徴量解析を行って、変換後単位ブロックに対応する変換前単位ブロックにおけるデコード映像についてオブジェクトの追従性を評価し、遷移率算出手段により、オブジェクトの追従性の評価結果に基づいて遷移率を算出することとした。また、予測方法候補決定手段により、遷移率に基づいて、オブジェクトの追従性が低くなるに従ってイントラ予測を予測方法候補として選択する度合いを高くすることとした。
【0028】
このため、変換後単位ブロックにおける予測方法の決定に、この変換後単位ブロックに対応する変換前単位ブロックにおけるデコード映像のオブジェクトの追従性に応じて、変換前単位ブロックにおける予測方法を反映させることができる。したがって、画質の低下をさらに抑制できる。
【0029】
(6) 本発明は、(1)の映像圧縮フォーマット変換装置について、前記予測方法候補決定手段には、前記予測方法候補として選択すべき予測方法を示す情報(例えば、図10図11の予測方法候補情報pに相当)が入力され、前記予測方法候補決定手段は、前記情報に基づいて前記予測方法候補を選択することを特徴とする映像圧縮フォーマット変換装置を提案している。
【0030】
この発明によれば、(1)の映像圧縮フォーマット変換装置において、予測方法候補決定手段には、予測方法候補として選択すべき予測方法を示す情報が入力され、この予測方法候補決定手段により、上述の情報に基づいて予測方法候補を選択することとした。
【0031】
このため、上述の情報に基づいて、適切な予測方法を予測方法候補として選択することができる。
【0032】
(7) 本発明は、(1)〜(6)のいずれかの映像圧縮フォーマット変換装置について、予測ブロックサイズと、符号化方法と、イントラ予測方向と、動きベクトルと、の少なくともいずれかを、前記予測方法として用いることを特徴とする映像圧縮フォーマット変換装置を提案している。
【0033】
この発明によれば、(1)〜(6)のいずれかの映像圧縮フォーマット変換装置において、予測ブロックサイズと、符号化方法と、イントラ予測方向と、動きベクトルと、の少なくともいずれかを、予測方法として用いることとした。これによれば、上述した効果と同様の効果を奏することができる。
【0034】
(8) 本発明は、予測方法候補決定手段(例えば、図4の予測方法候補決定部212や、図12の予測方法候補決定部212Aに相当)、適用結果算出手段(例えば、図4図12の単位予測値生成部213およびコスト値算出部214に相当)、および予測方法決定手段(例えば、図4図12の予測方法決定部215に相当)を備え、符号化処理の単位ブロックサイズが異なる圧縮方式間での映像圧縮フォーマットの変換を行う映像圧縮フォーマット変換装置(例えば、図1の映像圧縮フォーマット変換装置1や、図10の映像圧縮フォーマット変換装置1Aに相当)における映像圧縮フォーマット変換方法であって、前記予測方法候補決定手段が、変換後における符号化処理の単位ブロックである変換後単位ブロックごとに、当該変換後単位ブロックで適用し得る全ての予測方法(例えば、図6〜9のIntra8×8、Intra16×16、Inter8×8、およびInter16×16に相当)の中から、1つ以上を予測方法候補として選択する第1のステップ(例えば、図5図13の予測方法候補決定処理に相当)と、前記適用結果算出手段が、前記変換後単位ブロックごとに、前記予測方法候補を適用した結果を求める第2のステップ(例えば、図5図13の予測値生成処理およびコスト値算出処理に相当)と、前記予測方法決定手段が、前記変換後単位ブロックごとに、前記第2のステップにおいて求められた結果に基づいて、前記予測方法候補の中から当該変換後単位ブロックに最適な予測方法を決定する第3のステップ(例えば、図5図13の予測方法決定処理に相当)と、を備えることを特徴とする映像圧縮フォーマット変換方法を提案している。
【0035】
この発明によれば、予測方法候補決定手段により、変換後における符号化処理の単位ブロックである変換後単位ブロックごとに、この変換後単位ブロックで適用し得る全ての予測方法の中から、1つ以上を予測方法候補として選択することとした。また、適用結果算出手段により、変換後単位ブロックごとに、予測方法候補を適用した結果を求めることとした。また、予測方法決定手段により、変換後単位ブロックごとに、適用結果算出手段により求められた結果に基づいて、この変換後単位ブロックに最適な予測方法を予測方法候補の中から決定することとした。このため、上述した効果と同様の効果を奏することができる。
【0036】
(9) 本発明は、予測方法候補決定手段(例えば、図4の予測方法候補決定部212や、図12の予測方法候補決定部212Aに相当)、適用結果算出手段(例えば、図4図12の単位予測値生成部213およびコスト値算出部214に相当)、および予測方法決定手段(例えば、図4図12の予測方法決定部215に相当)を備え、符号化処理の単位ブロックサイズが異なる圧縮方式間での映像圧縮フォーマットの変換を行う映像圧縮フォーマット変換装置(例えば、図1の映像圧縮フォーマット変換装置1や、図10の映像圧縮フォーマット変換装置1Aに相当)における映像圧縮フォーマット変換方法を、コンピュータに実行させるためのプログラムであって、前記予測方法候補決定手段が、変換後における符号化処理の単位ブロックである変換後単位ブロックごとに、当該変換後単位ブロックで適用し得る全ての予測方法(例えば、図6〜9のIntra8×8、Intra16×16、Inter8×8、およびInter16×16に相当)の中から、1つ以上を予測方法候補として選択する第1のステップ(例えば、図5図13の予測方法候補決定処理に相当)と、前記適用結果算出手段が、前記変換後単位ブロックごとに、前記予測方法候補を適用した結果を求める第2のステップ(例えば、図5図13の予測値生成処理およびコスト値算出処理に相当)と、前記予測方法決定手段が、前記変換後単位ブロックごとに、前記第2のステップにおいて求められた結果に基づいて、前記予測方法候補の中から当該変換後単位ブロックに最適な予測方法を決定する第3のステップ(例えば、図5図13の予測方法決定処理に相当)と、をコンピュータに実行させるためのプログラムを提案している。
【0037】
この発明によれば、コンピュータを用いてプログラムを実行することで、予測方法候補決定手段により、変換後における符号化処理の単位ブロックである変換後単位ブロックごとに、この変換後単位ブロックで適用し得る全ての予測方法の中から、1つ以上を予測方法候補として選択することとした。また、適用結果算出手段により、変換後単位ブロックごとに、予測方法候補を適用した結果を求めることとした。また、予測方法決定手段により、変換後単位ブロックごとに、適用結果算出手段により求められた結果に基づいて、この変換後単位ブロックに最適な予測方法を予測方法候補の中から決定することとした。このため、上述した効果と同様の効果を奏することができる。
【発明の効果】
【0038】
本発明によれば、変換の前後で符号化処理の単位ブロックサイズが異なる圧縮方式間であっても、画質の低下を抑制するとともに、変換に要する処理コストを低減しつつ、映像圧縮フォーマットを変換できる。
【図面の簡単な説明】
【0039】
図1】本発明の第1実施形態に係る映像圧縮フォーマット変換装置のブロック図である。
図2】前記映像圧縮フォーマット変換装置に設けられた変換前復号処理部のブロック図である。
図3】前記映像圧縮フォーマット変換装置に設けられた変換処理部のブロック図である。
図4】前記変換処理部に設けられた第2の予測値生成部のブロック図である。
図5】前記第2の予測値生成部が行う予測処理を示す図である。
図6】前記第2の予測値生成部の動作を説明するための図である。
図7】前記第2の予測値生成部の動作を説明するための図である。
図8】前記第2の予測値生成部の動作を説明するための図である。
図9】前記第2の予測値生成部の動作を説明するための図である。
図10】本発明の第2実施形態に係る映像圧縮フォーマット変換装置のブロック図である。
図11】前記映像圧縮フォーマット変換装置に設けられた変換処理部のブロック図である。
図12】前記変換処理部に設けられた第2の予測値生成部のブロック図である。
図13】前記第2の予測値生成部が行う予測処理を示す図である。
【発明を実施するための形態】
【0040】
以下、本発明の実施の形態について図面を参照しながら説明する。なお、以下の実施形態における構成要素は適宜、既存の構成要素などとの置き換えが可能であり、また、他の既存の構成要素との組み合せを含む様々なバリエーションが可能である。したがって、以下の実施形態の記載をもって、特許請求の範囲に記載された発明の内容を限定するものではない。
【0041】
<第1実施形態>
[映像圧縮フォーマット変換装置1の構成および動作]
図1は、本発明の第1実施形態に係る映像圧縮フォーマット変換装置1のブロック図である。映像圧縮フォーマット変換装置1は、変換前圧縮データaを、変換前圧縮データaとは符号化処理の単位ブロックサイズが異なる圧縮方式の変換後圧縮データbに変換する。この映像圧縮フォーマット変換装置1は、変換前復号処理部10および変換処理部20を備える。
【0042】
(変換前復号処理部10の構成および動作)
図2は、変換前復号処理部10のブロック図である。変換前復号処理部10は、エントロピー復号部11、第1の予測値生成部12、逆DCT/逆量子化部13、およびローカルメモリ14を備える。
【0043】
エントロピー復号部11は、変換前圧縮データaを入力とする。このエントロピー復号部11は、変換前圧縮データaをエントロピー復号して、変換前における符号化処理の単位ブロックである変換前単位ブロックごとに変換前符号化情報dおよび残差信号fを抽出し、出力する。
【0044】
第1の予測値生成部12は、変換前符号化情報dと、ローカルメモリ14から出力される後述の変換前デコード映像eと、を入力とする。この第1の予測値生成部12は、変換前符号化情報dに従って、変換前単位ブロックごとに変換前デコード映像eから予測値gを生成し、出力する。
【0045】
逆DCT/逆量子化部13は、残差信号fを入力とする。この逆DCT/逆量子化部13は、変換前単位ブロックごとに残差信号fに対して逆DCT処理および逆量子化処理を行って、逆DCTおよび逆量子化された残差信号hとして出力する。
【0046】
第1の予測値生成部12から出力された予測値gと、逆DCT/逆量子化部13から出力された残差信号hとは、変換前単位ブロックごとに加算器で加算され、変換前デコード映像eとして変換前復号処理部10から出力される。
【0047】
ローカルメモリ14は、変換前デコード映像eを入力とする。このローカルメモリ14は、入力された変換前デコード映像eを蓄積し、適宜、第1の予測値生成部12に供給する。
【0048】
(変換処理部20の構成および動作)
図3は、変換処理部20のブロック図である。変換処理部20は、第2の予測値生成部21、DCT/量子化部22、エントロピー符号化部23、逆DCT/逆量子化部24、およびローカルメモリ25を備える。
【0049】
第2の予測値生成部21は、ローカルメモリ25から出力される後述の変換後ローカルデコード映像nと、変換処理部20の外部から入力される符号化パラメータcと、変換前符号化情報dと、変換前デコード映像eと、を入力とする。この第2の予測値生成部21は、図4に示すように、画像解析部211、予測方法候補決定部212、単位予測値生成部213、コスト値算出部214、および予測方法決定部215を備えており、変換後における符号化処理の単位ブロックである変換後単位ブロックごとに、図5に示す予測処理を行い、現在の変換後単位ブロックについての最適な予測方法を決定して、決定した予測方法による予測値iと、決定した予測方法を示す予測情報jと、を出力する。
【0050】
なお、本実施形態において、予測方法の種類としては、例えば、予測ブロックサイズ、符号化方法、イントラ符号化における予測方向、動きベクトルなどを挙げることができる。符号化方法としては、例えば、イントラ予測やインター予測などを挙げることができる。
【0051】
画像解析部211は、図5の画像解析処理を行う。この画像解析部211は、変換前デコード映像eを入力とし、変換後単位ブロックごとに、この変換後単位ブロックに対応する変換前単位ブロックのデコード映像の特徴量解析を行う。特徴量解析では、後述のテクスチャの複雑さと、後述のオブジェクトの追従性と、の少なくともいずれかを評価し、評価結果に基づいて画像特徴量を決定する。
【0052】
ここで、上述の変換後単位ブロックに対応する変換前単位ブロックについて、説明する。例えば、フレームを構成する全ての変換後単位ブロックのうちの1つを、所定の変換後単位ブロックと呼ぶこととする。すると、所定の変換後単位ブロックに対応する変換前単位ブロックとは、フレームを構成する全ての変換前単位ブロックのうち、所定の変換後単位ブロックに含まれる画素を含む変換前単位ブロックのことである。
【0053】
テクスチャの複雑さの評価は、イントラ予測の容易性を評価するのに適している。テクスチャの複雑さを評価する場合には、例えば、変換前単位ブロック内の画素値の分散値や、変換前単位ブロック内の各画素にラプラシアンフィルタを適用した結果についてこの変換前単位ブロック内で二乗和した値や、変換前単位ブロック内の画素値をフーリエ変換などで周波数変換したときのAC成分のエネルギーを求める。
【0054】
一方、オブジェクトの追従性の評価は、インター予測の容易性を評価するのに適している。オブジェクトの追従性を評価する場合には、まず、オブジェクトの動きを検出する。オブジェクトの動きの検出では、例えば、時間的に過去のフレームのローカルデコード画像とブロックマッチングしたときの動きベクトルの大きさや、変換前単位ブロックを包含する領域(またはフレーム全体)でのグローバル動きの大きさなどを求める。なお、時間的に過去のフレームとのブロックマッチングによる動きベクトルの検出では、後述の予測方法候補決定部212への入力である変換前符号化情報に含まれる動きベクトルの情報を、援用できる。
【0055】
次に、上述の検出したオブジェクトの動きを用いて符号化処理ブロックの動き補償を行った際の、符号化処理ブロック画素値と参照先画素値との差分に関する二乗和または絶対値和を求める。
【0056】
予測方法候補決定部212は、図5の予測方法候補決定処理を行う。予測方法候補決定部212は、変換前符号化情報dと、符号化パラメータcと、上述の画像解析処理で決定された画像特徴量と、を入力とする。この予測方法候補決定部212は、変換後単位ブロックごとに、まず、この変換後単位ブロックで効果的な予測方法を変換前符号化情報dに基づいて抽出する。次に、この変換後単位ブロックで最終的に候補とする予測方法を予測方法候補情報として、画像特徴量や符号化パラメータcを用いて決定する。
【0057】
ここで、本実施形態に係る映像圧縮フォーマット変換装置1は、映像圧縮フォーマットの変換の前後で符号化処理の単位ブロックサイズが異なる場合を想定している。そこで、予測方法候補決定部212は、変換後単位ブロックに適した予測方法候補として、この変換後単位ブロックに対応する変換前単位ブロックにおける全ての予測方法と、これら全ての予測方法のそれぞれに符号化性能が近い予測方法と、を選択する。
【0058】
具体的には、予測方法候補決定部212は、まず、変換後単位ブロックで適用し得る全ての予測方法と、この変換後単位ブロックに対応する変換前単位ブロックで適用し得る全ての予測方法と、の組み合わせごとに、変換の前後での予測方法の遷移率を初期値に設定するとともに、これら遷移率の閾値を設定する。
【0059】
図6は、遷移率を初期値に設定するとともに、これら遷移率の閾値を設定した例を示す図である。図6では、変換前の予測方法として、Intra4×4、Intra8×8、Inter4×4、およびInter8×8を想定し、変換後の予測方法として、Intra8×8、Intra16×16、Inter8×8、およびInter16×16を想定している。そして、例えばIntra4×4からIntra8×8に遷移する遷移率の初期値として15%を設定し、Inter4×4からInter16×16に遷移する遷移率の初期値として5%を設定している。また、遷移率の閾値として、10%を設定している。
【0060】
予測方法候補決定部212は、次に、画像解析部211で決定された画像特徴量と、符号化パラメータcと、に基づいて遷移率を更新する。
【0061】
図7は、図6に示した遷移率を、テクスチャの複雑さを用いて更新した例を示す図である。図7では、テクスチャの複雑さが高くなるに従って、予測ブロックを細分化する予測方法の遷移率を高くしている。これによれば、テクスチャの複雑さが高くなるに従って、高精度になる予測方法が、後述の予測方法候補決定部212において予測方法候補として選択されることになる。
【0062】
図8は、図7に示した遷移率を、オブジェクトの追従性を用いて更新した例を示す図である。図8では、オブジェクトの追従性が低くなるに従って、イントラ予測の遷移率を高くしている。これによれば、オブジェクトの追従性が低くなるに従って、イントラ予測が、後述の予測方法候補決定部212において予測方法候補として選択されることになる。
【0063】
予測方法候補決定部212は、次に、遷移率が閾値以上である予測方法を、変換後の処理ブロックにおける予測方法候補として決定する。
【0064】
図9は、図8に示した遷移率に基づいて、変換後の処理ブロックにおける予測方法候補を選択した例を示す図である。図9では、上述の設定した閾値(10%)以上である遷移率が、5つある。このため、これら5つの遷移率で遷移すると求められたIntra8×8、Intra16×16、およびInter8×8が予測方法候補として選択される。
【0065】
単位予測値生成部213は、図5の予測値生成処理を行う。この単位予測値生成部213は、変換前デコード映像eと、変換後ローカルデコード映像nと、上述の予測方法候補決定処理で決定された予測方法候補と、を入力とし、予測方法候補ごとに、その予測方法にしたがって、入力された映像から予測値を求める。
【0066】
コスト値算出部214は、図5のコスト値算出処理を行う。このコスト値算出部214は、予測値生成処理で求められた予測方法候補ごとの予測値と、変換後ローカルデコード映像nと、変換前デコード映像eと、を入力とし、予測方法候補ごとに、その予測方法によって生じる符号化歪および符号量を、コスト値として算出する。
【0067】
予測方法決定部215は、図5の予測方法決定処理を行う。この予測方法決定部215は、コスト値算出処理で求められた予測方法候補ごとのコスト値と、変換後ローカルデコード映像nと、変換前デコード映像eと、を入力とし、コスト値の最も高い予測方法候補の予測方法を、現在の変換後単位ブロックについての最適な予測方法として決定し、決定した予測方法による予測値iと、決定した予測方法を示す予測情報jと、を出力する。
【0068】
図3に戻って、DCT/量子化部22は、予測値iと変換前デコード映像eとの差分信号(残差信号)を入力とする。このDCT/量子化部22は、変換後単位ブロックごとに残差信号に対してDCTを行ってDCT係数を求め、このDCT係数に対して量子化処理を行って、DCTおよび量子化された残差信号kとして出力する。
【0069】
エントロピー符号化部23は、予測情報jと、DCTおよび量子化された残差信号kと、を入力とする。このエントロピー符号化部23は、変換後単位ブロックごとに、入力された情報に対して可変長符号化または算術符号化を行い、その結果を符号化シンタックスにしたがって圧縮データストリームとして書き出し、変換後圧縮データbとして出力する。
【0070】
逆DCT/逆量子化部24は、DCTおよび量子化された残差信号kを入力とする。この逆DCT/逆量子化部24は、変換後単位ブロックごとに、DCTおよび量子化された残差信号kに対して逆量子化処理および逆DCT処理を行って、逆量子化および逆DCTされた残差信号mとして出力する。
【0071】
ローカルメモリ25は、変換後ローカルデコード映像nを入力とする。変換後ローカルデコード映像nは、予測値iと、逆量子化および逆DCTされた残差信号mと、の加算情報のことである。このローカルメモリ25は、入力された変換後ローカルデコード映像nを蓄積し、適宜、第2の予測値生成部21に供給する。
【0072】
以上の映像圧縮フォーマット変換装置1によれば、以下の効果を奏することができる。
【0073】
映像圧縮フォーマット変換装置1は、変換後単位ブロックごとに、この変換後単位ブロックに対応する変換前単位ブロックのデコード映像について、テクスチャの複雑さと、オブジェクトの追従性と、の少なくともいずれかを評価して、評価結果に基づいて画像特徴量を決定する。そして、変換後単位ブロックで適用し得る全ての予測方法の中から、この変換後単位ブロックでの候補を画像特徴量を用いて絞り込み、候補ごとにコスト値を算出して、コスト値に基づいて、絞り込んだ候補の中から1つをこの変換後単位ブロックで適用する予測方法として決定する。このため、変換後単位ブロックにおける予測方法の決定に、この変換後単位ブロックに対応する変換前単位ブロックにおけるデコード映像のテクスチャの複雑さやオブジェクトの追従性に応じて、変換前単位ブロックにおける予測方法を反映させることができる。したがって、画質の低下を抑制しつつ、映像圧縮フォーマットを変換できる。
【0074】
また、映像圧縮フォーマット変換装置1は、上述のように、変換後単位ブロックで適用し得る全ての予測方法の中から候補を予め絞り込んだ上で、この変換後単位ブロックで適用する予測方法を最終的に1つに決定する。このため、上述のように絞り込まない場合と比べて、コスト値を算出する処理を少なくすることができるため、変換に要する処理コストを低減できる。
【0075】
<第2実施形態>
[映像圧縮フォーマット変換装置1Aの構成および動作]
図10は、本発明の第2実施形態に係る映像圧縮フォーマット変換装置1Aのブロック図である。映像圧縮フォーマット変換装置1Aは、図1に示した本発明の第1実施形態に係る映像圧縮フォーマット変換装置1とは、変換処理部20の代わりに変換処理部20Aを備える点が異なる。なお、映像圧縮フォーマット変換装置1Aにおいて、映像圧縮フォーマット変換装置1と同一構成要件については、同一符号を付し、その説明を省略する。
【0076】
(変換処理部20の構成および動作)
図11は、変換処理部20Aのブロック図である。変換処理部20Aは、図3に示した本発明の第1実施形態に係る変換処理部20とは、第2の予測値生成部21の代わりに第2の予測値生成部21Aを備える点が異なる。
【0077】
図12は、第2の予測値生成部21Aのブロック図である。第2の予測値生成部21Aは、図4に示した本発明の第1実施形態に係る第2の予測値生成部21とは、画像解析部211を備えていない点と、予測方法候補決定部212の代わりに予測方法候補決定部212Aを備える点と、が異なる。
【0078】
予測方法候補決定部212Aは、変換前符号化情報dと、予測方法候補情報pと、を入力とする。予測方法候補情報pは、予測方法候補として選択すべき予測方法を示す情報であり、変換処理部20Aの外部から入力される。なお、本実施形態では、変換の前後での予測方法の遷移は、画像特徴量に依存しないものとする。
【0079】
この予測方法候補決定部212Aは、変換前符号化情報dの予測方法に対して、予測方法候補情報pにしたがって、最終的に処理ブロックで候補とする予測方法を、予測方法候補情報として選択する。予測方法候補情報として選択する際には、例えば、処理ブロックに含まれる変換前の全ての予測方法に対する全ての予測方法を候補としたり、処理ブロックに含まれる変換前の予測方法のうち頻度の高い予測方法に対応する予測方法を候補としたりする。
【0080】
以上の映像圧縮フォーマット変換装置1Aによれば、以下の効果を奏することができる。
【0081】
映像圧縮フォーマット変換装置1Aは、予測方法候補情報pに基づいて、変換後単位ブロックで適用し得る全ての予測方法の中から、この変換後単位ブロックでの候補を画像特徴量を用いて絞り込み、候補ごとにコスト値を算出して、コスト値に基づいて、絞り込んだ候補の中から1つをこの変換後単位ブロックで適用する予測方法として決定する。このため、映像圧縮フォーマット変換装置1が奏することのできる上述の効果と同様の効果を奏することができる。
【0082】
また、映像圧縮フォーマット変換装置1Aでは、映像圧縮フォーマット変換装置1に設けられている画像解析部211が不要である。このため、映像圧縮フォーマット変換装置1と比べて、構成を簡易化できるとともに、変換に要する処理コストをさらに提言できる。
【0083】
なお、本発明の映像圧縮フォーマット変換装置1や映像圧縮フォーマット変換装置1Aの処理を、コンピュータ読み取り可能な非一時的な記録媒体に記録し、この記録媒体に記録されたプログラムを映像圧縮フォーマット変換装置1や映像圧縮フォーマット変換装置1Aに読み込ませ、実行することによって、本発明を実現できる。
【0084】
ここで、上述の記録媒体には、例えば、EPROMやフラッシュメモリといった不揮発性のメモリ、ハードディスクといった磁気ディスク、CD−ROMなどを適用できる。また、この記録媒体に記録されたプログラムの読み込みおよび実行は、映像圧縮フォーマット変換装置1や映像圧縮フォーマット変換装置1Aに設けられたプロセッサによって行われる。
【0085】
また、上述のプログラムは、このプログラムを記憶装置などに格納した映像圧縮フォーマット変換装置1や映像圧縮フォーマット変換装置1Aから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネットなどのネットワーク(通信網)や電話回線などの通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
【0086】
また、上述のプログラムは、上述の機能の一部を実現するためのものであってもよい。さらに、上述の機能を映像圧縮フォーマット変換装置1や映像圧縮フォーマット変換装置1Aにすでに記録されているプログラムとの組み合せで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
【0087】
以上、この発明の実施形態につき、図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計なども含まれる。
【0088】
例えば、上述の第1実施形態や第2実施形態では、映像圧縮フォーマットの変換の前後で符号化処理の単位ブロックサイズが異なる場合を想定しているものとしたが、具体的には、変換前の処理ブロックサイズが、変換後の処理ブロックサイズより小さい場合であってもよいし、変換後の処理ブロックサイズより大きい場合であってもよい。
【0089】
また、上述の第1実施形態や第2実施形態では、変換前の予測方法として、Intra4×4、Intra8×8、Inter4×4、およびInter8×8を想定するものとしたが、これに限らず、種々の予測方法を想定することができる。また、変換後の予測方法として、Intra8×8、Intra16×16、Inter8×8、およびInter16×16と、を想定するものとしたが、これに限らず、種々の予測方法を想定することができる。
【0090】
また、上述の第2実施形態では、予測方法候補情報pは、変換処理部20Aの外部から入力されるものとしたが、これに限らず、変換処理部20Aの内部で生成されるものとしてもよい。
【0091】
なお、上述の第1実施形態や第2実施形態において、変換前圧縮データaの圧縮方式は、例えばH.264であり、変換後圧縮データbの圧縮方式は、例えばHEVCであってもよい。また、変換前圧縮データaの圧縮方式は、例えばMPEG−2であり、変換後圧縮データbの圧縮方式は、例えばHEVCであってもよい。
【符号の説明】
【0092】
1、1A・・・映像圧縮フォーマット変換装置
10・・・変換前復号処理部
20、20A・・・変換処理部
21、21A・・・第2の予測値生成部
211・・・画像解析部
212、212A・・・予測方法候補決定部
213・・・単位予測値生成部
214・・・コスト値算出部
215・・・予測方法決定部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13