(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024027758
(43)【公開日】2024-03-01
(54)【発明の名称】マルチレイヤ符号化装置、シングルレイヤ符号化装置、及びプログラム
(51)【国際特許分類】
H04N 19/30 20140101AFI20240222BHJP
H04N 19/46 20140101ALI20240222BHJP
【FI】
H04N19/30
H04N19/46
【審査請求】未請求
【請求項の数】12
【出願形態】OL
(21)【出願番号】P 2022130836
(22)【出願日】2022-08-19
(71)【出願人】
【識別番号】000004352
【氏名又は名称】日本放送協会
(74)【代理人】
【識別番号】110001106
【氏名又は名称】弁理士法人キュリーズ
(72)【発明者】
【氏名】市ヶ谷 敦郎
(72)【発明者】
【氏名】井口 和久
(72)【発明者】
【氏名】岩村 俊輔
(72)【発明者】
【氏名】根本 慎平
(72)【発明者】
【氏名】近藤 雄一
(72)【発明者】
【氏名】新井 大地
【テーマコード(参考)】
5C159
【Fターム(参考)】
5C159MA04
5C159MA05
5C159MA17
5C159MA31
5C159MC11
5C159ME01
5C159PP04
5C159RC11
5C159SS26
5C159UA02
5C159UA05
5C159UA16
(57)【要約】
【課題】マルチレイヤ符号化を用いる場合における開発コストの増大を抑制することを可能とする。
【解決手段】マルチレイヤ符号化を行うマルチレイヤ符号化装置1は、入力映像信号を符号化することでビットストリームを出力する第1シングルレイヤ符号化部10と、第1シングルレイヤ符号化部10の後段に設けられた第2シングルレイヤ符号化部20と、を備える。第2シングルレイヤ符号化部20は、第1シングルレイヤ符号化部10により得られたビットストリームをベースレイヤのビットストリームとして出力し、第1シングルレイヤ符号化部10により得られたビットストリームに対する復号処理を行って導出されたパラメータを用いて入力映像信号を符号化し、エンハンスメントレイヤのビットストリームを出力する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
マルチレイヤ符号化を行うマルチレイヤ符号化装置であって、
入力映像信号を符号化することでビットストリームを出力する第1シングルレイヤ符号化手段と、
前記第1シングルレイヤ符号化手段の後段に設けられた第2シングルレイヤ符号化手段と、を備え、
前記第2シングルレイヤ符号化手段は、
前記第1シングルレイヤ符号化手段により得られた前記ビットストリームをベースレイヤのビットストリームとして出力し、
前記第1シングルレイヤ符号化手段により得られた前記ビットストリームに対する復号処理を行って導出されたパラメータを用いて前記入力映像信号を符号化し、エンハンスメントレイヤのビットストリームを出力する
マルチレイヤ符号化装置。
【請求項2】
前記第2シングルレイヤ符号化手段は、前記第1シングルレイヤ符号化手段により得られた前記ビットストリームに含まれるプロファイル情報を含む高位シンタックス情報を、前記マルチレイヤ符号化の情報に付け替える
請求項1に記載のマルチレイヤ符号化装置。
【請求項3】
前記第1シングルレイヤ符号化手段での符号化の所要時間に応じた時間において前記入力映像信号をバッファするバッファ手段をさらに備え、
前記第2シングルレイヤ符号化手段は、前記バッファ手段が出力する前記入力映像信号を符号化することで前記エンハンスメントレイヤのビットストリームを出力する
請求項1に記載のマルチレイヤ符号化装置。
【請求項4】
前記入力映像信号の解像度を低下させるダウンコンバートを行うダウンコンバート手段をさらに備え、
前記第1シングルレイヤ符号化手段は、前記ダウンコンバート手段が出力する前記入力映像信号を符号化することで前記ビットストリームを出力する
請求項1乃至3のいずれか1項に記載のマルチレイヤ符号化装置。
【請求項5】
前記第2シングルレイヤ符号化手段は、
前記第1シングルレイヤ符号化手段により得られた前記ビットストリームを前記ベースレイヤのビットストリームとして出力し、
前記第1シングルレイヤ符号化手段により得られた前記ビットストリームに対する復号処理を行って導出されたパラメータに対してアップサンプリング処理を行い、アップサンプリング処理の結果を用いて前記入力映像信号を符号化し、前記エンハンスメントレイヤのビットストリームを出力する
請求項4に記載のマルチレイヤ符号化装置。
【請求項6】
前記第1シングルレイヤ符号化手段及び前記第2シングルレイヤ符号化手段は、共通の構成を有し、
前記共通の構成は、
前段にある他のシングルレイヤ符号化手段が出力するビットストリームに対する復号処理を行う復号処理手段と、
当該シングルレイヤ符号化手段がベースレイヤの符号化に用いられる場合において、前記復号処理手段を無効化するととともに、前記入力映像信号を符号化することでビットストリームを出力するビットストリーム生成手段と、を備え、
当該シングルレイヤ符号化手段がエンハンスメントレイヤの符号化に用いられる場合において、
前記前段にある他のシングルレイヤ符号化手段により得られた前記ビットストリームを前記ベースレイヤのビットストリームとして出力し、
前記復号処理手段を有効化するとともに、前記復号処理を行って導出されたパラメータを用いて前記ビットストリーム生成手段が前記入力映像信号を符号化することでエンハンスメントレイヤのビットストリームを出力する
請求項1に記載のマルチレイヤ符号化装置。
【請求項7】
前記共通の構成は、当該シングルレイヤ符号化手段が前記エンハンスメントレイヤの符号化に用いられる場合において、前記前段にある他のシングルレイヤ符号化手段が出力するビットストリームに含まれるプロファイル情報を含む高位シンタックス情報を、前記マルチレイヤ符号化の情報に付け替える付け替え手段をさらに備え、
当該シングルレイヤ符号化手段が前記ベースレイヤの符号化に用いられる場合において、前記付け替え手段を無効化する
請求項6に記載のマルチレイヤ符号化装置。
【請求項8】
コンピュータを請求項1に記載のマルチレイヤ符号化装置として機能させる
プログラム。
【請求項9】
シングルレイヤ符号化装置であって、
入力されたビットストリームに対する復号処理を行う復号処理手段と、
入力映像信号を符号化することでビットストリームを出力するビットストリーム生成手段と、
前記ビットストリームの入力を有効にするか否かのモードを切り替えるスイッチ手段と、を備え、
前記ビットストリームの入力が無効にされた場合には、前記復号処理を行わずに前記ビットストリーム生成手段によってシングルレイヤ符号化を行うよう動作し、
前記ビットストリームの入力が有効にされた場合には、自シングルレイヤ符号化装置を含む複数のシングルレイヤ符号化装置の直列接続構成によってマルチレイヤ符号化を行うよう動作する
シングルレイヤ符号化装置。
【請求項10】
前記ビットストリームの入力が有効にされた場合において、前記入力されたビットストリームに含まれるプロファイル情報を含む高位シンタックス情報を前記マルチレイヤ符号化の情報に付け替える付け替え手段をさらに備える
請求項9に記載のシングルレイヤ符号化装置。
【請求項11】
前記ビットストリームの入力が有効にされた場合において、
前記復号処理手段は、前段にある他のシングルレイヤ符号化装置が出力するビットストリームに対する前記復号処理を行い、
前記ビットストリーム生成手段は、前記復号処理を行って導出されたパラメータを用いて前記入力映像信号を符号化し、エンハンスメントレイヤのビットストリームを生成する
請求項9又は10に記載のシングルレイヤ符号化装置。
【請求項12】
コンピュータを請求項9に記載のシングルレイヤ符号化装置として機能させる
プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、マルチレイヤ符号化装置、シングルレイヤ符号化装置、及びプログラムに関する。
【背景技術】
【0002】
放送の映像伝送では、基本的に1チャンネル1映像しか伝送できないモードを用いてきた。例えば、現在の4K8K衛星放送で用いられているHEVC(High Efficiency Video Coding)と呼ばれる符号化方式では、Main10プロファイルと呼ばれる符号化ツール群を用いて映像が伝送されている。また、HEVCでは、複数の映像をレイヤ状に伝送するScalable Main 10プロファイルと呼ばれるツール群が存在する。これは、ベースレイヤとしてMain10プロファイル相当の映像を伝送しながら、上位レイヤ(エンハンスメントレイヤ)として追加的な映像を重畳することができる符号化の仕組みである。同様に、最新の符号化方式であるVVC(Versatile Video Coding)においても、Main10プロファイルに加えて、複数レイヤの映像伝送を実現するMultilayer Main10プロファイルが開発されている。
【0003】
このようなマルチレイヤ符号化の技術では、ベースレイヤを基本のストリームとし、その差分映像をエンハンスメントレイヤとして伝送する。マルチレイヤ符号化は、階層符号化又はスケーラブル符号化と称されることもある。復号側は、ベースレイヤ単体での復号に加え、ベースレイヤ及びエンハンスメントレイヤを組み合わせて復号することも可能である。マルチレイヤ符号化によれば、例えば、複数のレイヤのビットストリームを利用して復号すると高解像度あるいは高い品質の映像が再生されるのに対し、一部のレイヤ(ベースレイヤ)のビットストリームのみを復号しても低解像度あるいは低い品質の映像が再生可能である。
【0004】
マルチレイヤ符号化の第1の応用例として、ベースレイヤに対して品質向上のためのエンハンスメントレイヤを伝送することで、品質の異なる(低品質、高品質)映像サービスを実現するSNRスケーラブルがある。第2の応用例として、ベースレイヤ(低解像度映像)に対して解像度向上のためのエンハンスメントレイヤ(高解像度映像)を伝送する空間スケーラブルがある。空間スケーラブルによれば、2K映像と4K映像とのセットや、4K映像と8K映像とのセット等、異なる解像度の放送サービスを効率的に同時に伝送可能である。
【0005】
特許文献1には、マルチレイヤ符号化(特に、SNRスケーラブル)を応用して映像の上乗せサービスを実現する技術が記載されている。具体的には、主映像をベースレイヤとして符号化するとともに、字幕や解説映像等の上乗せ情報(すなわち、副映像)を主映像に重畳した映像をエンハンスメントレイヤとして符号化し、ベースレイヤ及びエンハンスメントレイヤのそれぞれのビットストリームを送出する。このような方法によれば、ベースレイヤのみを受信する受信装置は主映像のみを再生可能である一方、ベースレイヤ及びエンハンスメントレイヤを受信する受信装置は、ベースレイヤのみの復号を行うことで主映像を、ベースレイヤ及びエンハンスメントレイヤの両方を復号することで副映像付きの主映像をそれぞれ再生可能となり、受信したいサービスの選択を受信装置側で行うことが可能となる。
【先行技術文献】
【特許文献】
【0006】
【発明の概要】
【発明が解決しようとする課題】
【0007】
マルチレイヤ符号化では、すでに符号化済みの一方の映像(ベースレイヤ:BL)を他方(エンハンスメントレイヤ:EL)の信号予測に用いることで効率的な符号化を実現している。ここで、ELは1つとは限らず、異なる解像度又は異なる品質のELは複数あってもよい。マルチレイヤ符号化は個別に符号化するよりもレイヤ間の信号相関を用いることで符号化効率に優れるが、その一方で、単一の符号化装置として複数の解像度の映像又は複数の品質の映像を符号化する能力を持たなければならない。
【0008】
例えばリアルタイム符号化装置を実現するにあたり、1つのBL及び1つのELからなる2レイヤの場合、単位時間あたりに2入力の映像信号をマルチレイヤ符号化装置が符号化しなければならず、非マルチレイヤ符号化に対して2倍の処理能力が必要となり、開発コストが増大する。このように、マルチレイヤ符号化においては、マルチレイヤのレイヤ数に応じた複雑度のマルチレイヤ符号化装置を開発しなければならないという問題がある。
【0009】
そこで、本発明は、マルチレイヤ符号化を用いる場合における開発コストの増大を抑制することを可能とするマルチレイヤ符号化装置、シングルレイヤ符号化装置、及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0010】
第1の態様に係るマルチレイヤ符号化装置は、マルチレイヤ符号化を行う装置である。前記マルチレイヤ符号化装置は、入力映像信号を符号化することでビットストリームを出力する第1シングルレイヤ符号化手段と、前記第1シングルレイヤ符号化手段の後段に設けられた第2シングルレイヤ符号化手段と、を備える。前記第2シングルレイヤ符号化手段は、前記第1シングルレイヤ符号化手段により得られた前記ビットストリームをベースレイヤのビットストリームとして出力し、前記第1シングルレイヤ符号化手段により得られた前記ビットストリームに対する復号処理を行って導出されたパラメータを用いて前記入力映像信号を符号化し、エンハンスメントレイヤのビットストリームを出力する。
【0011】
第2の態様に係るプログラムは、コンピュータを第1の態様に係るマルチレイヤ符号化装置として機能させる。
【0012】
第3の態様に係るシングルレイヤ符号化装置は、入力されたビットストリームに対する復号処理を行う復号処理手段と、入力映像信号を符号化することでビットストリームを出力するビットストリーム生成手段と、前記ビットストリームの入力を有効にするか否かのモードを切り替えるスイッチ手段と、を備え、前記ビットストリームの入力が無効にされた場合には、前記復号処理を行わずに前記ビットストリーム生成手段によってシングルレイヤ符号化を行うよう動作し、前記ビットストリームの入力が有効にされた場合には、自シングルレイヤ符号化装置を含む複数のシングルレイヤ符号化装置の直列接続構成によってマルチレイヤ符号化を行うよう動作する。
【0013】
第4の態様に係るプログラムは、コンピュータを第3の態様に係るシングルレイヤ符号化装置として機能させる。
【発明の効果】
【0014】
本発明によれば、マルチレイヤ符号化を用いる場合における開発コストの増大を抑制することを可能とするマルチレイヤ符号化装置、シングルレイヤ符号化装置、及びプログラムを提供できる。
【図面の簡単な説明】
【0015】
【
図1】第1実施形態に係るマルチレイヤ符号化装置の構成を示す図である。
【
図2】第1実施形態に係る第2シングルレイヤ符号化部の構成を示す図である。
【
図3】第1実施形態の変更例に係るマルチレイヤ符号化装置の構成を示す図である。
【
図4】第2実施形態に係るマルチレイヤ符号化装置の構成を示す図である。
【
図5】第2実施形態に係る第2シングルレイヤ符号化部の構成を示す図である。
【
図6】第2実施形態の変更例に係るマルチレイヤ符号化装置の構成を示す図である。
【
図7】第3実施形態に係るマルチレイヤ符号化装置の構成を示す図である。
【
図8】第3実施形態に係るマルチレイヤ符号化装置の構成を示す図である。
【発明を実施するための形態】
【0016】
図面を参照して、実施形態について説明する。以下の図面の記載において、同一又は類似の部分には同一又は類似の符号を付している。
【0017】
(第1実施形態)
図1は、第1実施形態に係るマルチレイヤ符号化装置1の構成を示す図である。
【0018】
第1実施形態に係るマルチレイヤ符号化装置1は、マルチレイヤ符号化を行う装置である。具体的には、マルチレイヤ符号化装置1は、マルチレイヤ符号化により入力映像信号からベースレイヤ(BL)のビットストリーム(以下、「BLストリーム」と称する)及びエンハンスメントレイヤ(EL)のビットストリームを(以下、「ELストリーム」と称する)生成し、BLストリーム及びELストリームで構成される出力ビットストリームを出力する。ここで、マルチレイヤ符号化装置1は、BLストリーム及びELストリームを含む1本のストリームとして出力する態様であってもよいし、BLストリームとn個のELストリームとのそれぞれを別経路で複数本のストリームとして出力する態様であってもよい。そのため、用語「出力ビットストリーム」とは、両者の態様を含むものとする。なお、後者の態様の場合、後述のストリーム合成部を必ずしも設けなくてもよい。
【0019】
マルチレイヤ符号化装置1は、直列接続構成の複数のシングルレイヤ符号化部を含んで構成される。1段目のシングルレイヤ符号化部はBLストリームを生成し、2段目以降の各シングルレイヤ符号化部はELストリームを生成する。以下において、マルチレイヤ符号化装置1が生成及び出力するELストリームが1つである一例について説明するが、マルチレイヤ符号化装置1が2つ以上のELストリームを生成及び出力するよう構成してもよい。
【0020】
このように、マルチレイヤ符号化装置1を直列接続構成の複数のシングルレイヤ符号化部によって構成することにより、各シングルレイヤ符号化部が単一のレイヤのビットストリームを生成すればよくなり、各シングルレイヤ符号化部の処理能力及び複雑度を低減できる。そのため、各シングルレイヤ符号化部は、複数のレイヤを同時に処理するマルチレイヤ符号化部を開発する場合に比べて、少ない開発コストで開発可能である。よって、マルチレイヤ符号化を用いる場合における開発コストの増大を抑制することが可能になる。
【0021】
第1実施形態に係るマルチレイヤ符号化装置1では、同じ解像度の映像を用いるスケーラブル符号化、すなわち、SNRスケーラブルを行う。なお、符号化方式としてVVCを用いる一例について主として説明するが、符号化方式はVVC以外の方式、例えばHEVC等であってもよい。
【0022】
図1に示すように、第1実施形態に係るマルチレイヤ符号化装置1は、第1シングルレイヤ符号化部10と、第1シングルレイヤ符号化部10の後段に設けられた第2シングルレイヤ符号化部20と、バッファ部30とを有する。第1シングルレイヤ符号化部10は、BL用のシングルレイヤ符号化部に相当し、第2シングルレイヤ符号化部20は、EL用のシングルレイヤ符号化部に相当する。
【0023】
第1シングルレイヤ符号化部10は、入力映像信号(原画像)を符号化することでビットストリームを生成し、生成したビットストリームを第2シングルレイヤ符号化部20に出力する。第1シングルレイヤ符号化部10は、一般的な符号化部で構成可能である。例えば、第1シングルレイヤ符号化部10は、マルチレイヤ符号化のプロファイルとは異なる一般的なプロファイル(例えば、Main10プロファイル)による符号化を行う符号化部である。
【0024】
第2シングルレイヤ符号化部20は、第1シングルレイヤ符号化部10により得られたビットストリームをBLストリームとして出力する。第2シングルレイヤ符号化部20は、第1シングルレイヤ符号化部10により得られたビットストリームに含まれるプロファイル情報などの高位シンタックス情報を、マルチレイヤ符号化用の高位シンタックス情報に付け替える。例えば、第2シングルレイヤ符号化部20は、シングルレイヤ符号化のプロファイル情報をマルチレイヤ符号化のプロファイル情報などに付け替える。
【0025】
また、第2シングルレイヤ符号化部20は、第1シングルレイヤ符号化部10により得られたビットストリームに対する復号処理を行って、復号映像、及びBLストリームに記録されたパラメータ情報を導出し、入力映像信号をEL信号として符号化し、ELストリームを生成及び出力する。具体的には、第2シングルレイヤ符号化部20は、第1シングルレイヤ符号化部10により得られたビットストリームに対する復号処理を行うことにより、マルチレイヤ符号化(インターレイヤ符号化)に必要な映像信号及びパラメータを取得し、当該映像信号およびパラメータを用いてELストリームを生成及び出力する。ここで、第2シングルレイヤ符号化部20は、Multilayer Main10プロファイルによりELストリームを生成する。
【0026】
第2シングルレイヤ符号化部20に入力される入力映像信号(原画像)は、バッファ部30により一時的に保持された入力映像信号である。具体的には、バッファ部30は、第1シングルレイヤ符号化部10での符号化の所要時間に応じた時間において入力映像信号をバッファする。第2シングルレイヤ符号化部20は、バッファ部30が出力する入力映像信号を符号化することでELストリームを生成及び出力する。バッファ部30は第2シングルレイヤ符号化部20に内蔵されてもよいが、ビットストリームと原画像のELエンコード処理との遅延差を吸収し、適切なタイミングで第2シングルレイヤ符号化部20がELの符号化処理を行えるようにする。
【0027】
図2は、第1実施形態に係る第2シングルレイヤ符号化部20の構成を示す図である。
【0028】
第2シングルレイヤ符号化部20は、バッファ部30が出力する入力映像信号(原映像)に加え、第1シングルレイヤ符号化部10から出力されたビットストリームを入力とする。第2シングルレイヤ符号化部20は、復号処理部21と、HLS(High Level Syntax)付け替え部22と、ビットストリーム生成部200と、ストリーム合成部28とを有する。
【0029】
復号処理部21は、第1シングルレイヤ符号化部10から出力されたビットストリームに対する復号処理を行い、復号画像をビットストリーム生成部200のDPB(復号ピクチャバッファ)24に出力し、復号画像及び動きベクトルをビットストリーム生成部200の符号化処理部25に出力する。復号処理部21は、例えば、イントラ予測又はインター予測により予測画像を生成する予測処理を行う予測手段と、量子化変換係数に対する逆量子化処理を行って変換係数を出力する逆量子化手段と、変換係数に対する逆変換処理を行って予測残差を出力する逆変換手段と、予測画像に予測残差を加算して復号画像(再構成画像)を出力する加算手段と、復号画像に対するループフィルタ処理を行うループフィルタ手段とを含む。
【0030】
HLS付け替え部22は、第1シングルレイヤ符号化部10が出力するビットストリームに含まれるプロファイル情報などの高位シンタックス情報をマルチレイヤ符号化信号として適切な情報に付け替え、当該付け替え後のビットストリームをBLストリームとしてストリーム合成部28に出力する。HLS付け替え部22は、例えばBLがマルチレイヤ符号化と異なるプロファイル(例えばMain 10プロファイル)で符号化されている場合、プロファイル情報をマルチレイヤプロファイルに変更し、ELと組み合わせて使うストリームであることを示す各種の高位シンタックスを修正する。ここで、BLストリームはHLSの付け替えのみを行い符号化処理を行わないため、きわめて軽量且つ高速に処理が行える。
【0031】
ビットストリーム生成部200は、復号処理部21が出力する各種パラメータ(復号画像及び動きベクトル等)を用いて、バッファ部30が出力する入力映像信号(原映像)からELストリームを生成及び出力する。ビットストリーム生成部200は、並べ替え部23と、DPB24と、符号化処理部25と、復号処理部26と、エントロピー符号化部27とを有する。
【0032】
並べ替え部23は、符号化効率を向上するために映像フレーム(原画像)を表示順と異なる順序に並べ替え、並べ替え後の映像フレームを符号化処理部25に出力する。
【0033】
DPB24は、復号処理部21及び26が出力する復号画像を参照用の画像として蓄積し、当該参照画像を符号化処理部25に出力する。
【0034】
符号化処理部25は、DPB24が出力する参照画像を用いて、並べ替え部23が出力する映像フレーム(原画像)に対する符号化処理を行って量子化変換係数を生成し、量子化変換係数を復号処理部26及びエントロピー符号化部27に出力する。符号化処理部25は、例えば、イントラ予測又はインター予測により予測画像を生成する予測処理を行う予測手段と、原画像に対する予測画像の予測残差を生成する減算手段と、予測残差に対する変換処理を行って変換係数を出力する変換手段と、変換係数に対する量子化処理を行って量子化変換係数を出力する量子化手段とを含む。
【0035】
復号処理部26は、符号化処理部25が出力する量子化変換係数に対する復号処理を行って復号画像を生成し、復号画像をDPB24に出力する。復号処理部26は、例えば、量子化変換係数に対する逆量子化処理を行って変換係数を出力する逆量子化手段と、変換係数に対する逆変換処理を行って予測残差を出力する逆変換手段と、予測信号を復号済み信号から生成する予測手段と、生成した予測画像に予測残差を加算して復号画像(再構成画像)を出力する加算手段と、復号画像に対するループフィルタ処理を行うループフィルタ手段とを含む。再構成画像は、符号化処理部に予測参照信号として出力するとともに、インター予測のための参照信号としてDPB24に格納する。例えば、復号処理部26は、VVCやHEVCの復号処理を行う。
【0036】
エントロピー符号化部27は、符号化処理部25が出力する量子化変換係数に対するエントロピー符号化処理を行ってビットストリームを生成し、当該ビットストリームをELストリームとしてストリーム合成部28に出力する。
【0037】
ストリーム合成部28は、BLストリーム及びELストリームを符号化方式で規定された順序に合成し、1つのストリームにして出力する。
【0038】
このように、第1実施形態に係るマルチレイヤ符号化装置1によれば、第1シングルレイヤ符号化部10と第2シングルレイヤ符号化部20とを直接に接続して構成する。第1シングルレイヤ符号化部10及び第2シングルレイヤ符号化部20のそれぞれは、単一のレイヤのビットストリームを生成すればよくなる。そのため、複数のレイヤを同時に処理するマルチレイヤ符号化部を構成する場合に比べて、第1シングルレイヤ符号化部10及び第2シングルレイヤ符号化部20のそれぞれの処理能力及び複雑度を低減でき、少ない開発コストで開発可能である。ここで、第1シングルレイヤ符号化部10としては、マルチレイヤ符号化のプロファイルに非対応の一般的な符号化部(すなわち、既存の符号化部)を用いることができる。
【0039】
また、第1実施形態に係る第2シングルレイヤ符号化部20は、一般的な符号化部に比べて復号処理部21及びHLS付け替え部22が追加で必要となるものの、BL符号化処理部を備える必要がなく、大幅に装置に求める性能を下げることができ、開発コストを低減できる。
【0040】
(第1実施形態の変更例)
第1実施形態の変更例について、上述の第1実施形態との相違点を主として説明する。
図3は、第1実施形態の変更例に係るマルチレイヤ符号化装置1の構成を示す図である。
【0041】
本変更例では、上述の第1実施形態に係る第1シングルレイヤ符号化部10及び第2シングルレイヤ符号化部20として、共通のハードウェア構成を有するシングルレイヤ符号化部を用いる。具体的には、上述の第1実施形態に係る第2シングルレイヤ符号化部20の一部の機能を無効化したものを第1シングルレイヤ符号化部10として用いる。「無効化」とは、当該一部の機能を使用しないことを意味し、当該一部の機能の「ディスエーブル」と称されてもよい。例えば、この無効化の切り替えはスイッチ部201(201a及び201b)により行う。スイッチ部201(201a及び201b)は、物理的スイッチあるいは論理的スイッチであり、スイッチ部201(201a及び201b)を切り替えることでモードの切り替えを実現できる。
【0042】
すなわち、上述の第1実施形態に係る第2シングルレイヤ符号化部20を基本の共通装置として用いて、当該基本の共通装置を直列に接続することでマルチレイヤ符号化装置1を構成する。これにより、マルチレイヤ符号化装置1をより効率的に構成可能になる。本変更例において、上述の第1実施形態に係る第1シングルレイヤ符号化部10として用いる当該基本の共通装置を、「シングルレイヤ符号化装置20a」と称し、上述の第1実施形態に係る第2シングルレイヤ符号化部20として用いる当該基本の共通装置を、「シングルレイヤ符号化装置20b」と称する。
【0043】
図3に示すように、シングルレイヤ符号化装置20a及びシングルレイヤ符号化装置20bのそれぞれは、外部入力にストリームを入力とし、デコード処理を内蔵した符号化装置であって、モード切替用のスイッチ部201(201a及び201b)を物理的又は論理的に持ち、ストリーム入力を無効にした場合はシングルレイヤの符号化装置として動作可能であり、一方、ストリーム入力を有効にした場合は直列接続構成によってマルチレイヤ対応の動作を行う。本変更例では、シングルレイヤ符号化装置20aは、スイッチ部201aによってストリーム入力を無効にしており、シングルレイヤの符号化装置として動作する。これに対し、シングルレイヤ符号化装置20bは、スイッチ部201bによってストリーム入力を有効にしており、マルチレイヤ対応の動作を行う。
【0044】
具体的には、シングルレイヤ符号化装置20a及びシングルレイヤ符号化装置20bは、共通の構成を有する。当該共通の構成は、前段にある他のシングルレイヤ符号化装置が出力するビットストリームに対する復号処理を行う復号処理部21(21a、21b)と、当該シングルレイヤ符号化装置がBLの符号化に用いられる場合において、復号処理部21aを無効化するととともに、入力映像信号を符号化することでビットストリームを出力するビットストリーム生成部200(200a、200b)と、を有する。また、当該共通の構成は、HLS付け替え部22(22a、22b)を有する。当該シングルレイヤ符号化装置がBLの符号化に用いられる場合において、HLS付け替え部22aを無効化する。また、符号化処理部においては復号処理部21aからの入力がないため、インターレイヤ予測を無効化する。
【0045】
一方、当該シングルレイヤ符号化装置がELの符号化に用いられる場合においては、当該シングルレイヤ符号化装置は、復号処理部21及びHLS付け替え部22を有効化する。当該シングルレイヤ符号化装置は、前段にある他のシングルレイヤ符号化部により得られたビットストリームをBLストリームとして出力し、復号処理を行って導出されたパラメータを用いてビットストリーム生成部200が入力映像信号を符号化することでELストリームを出力する。
【0046】
具体的には、BL用のシングルレイヤ符号化装置20aは、復号処理部21a及びHLS付け替え部22aを有するものの、復号処理部21a及びHLS付け替え部22aを無効化する。BL用のシングルレイヤ符号化装置20aのビットストリーム生成部200aは、入力映像信号からBLのビットストリームを生成及び出力する。ビットストリーム生成部200aは、並べ替え部23aと、DPB24aと、符号化処理部25aと、復号処理部26aと、エントロピー符号化部27aとを有する。並べ替え部23aは、符号化効率を向上するために映像フレーム(原画像)を表示順と異なる順序に並べ替え、並べ替え後の映像フレームを符号化処理部25aに出力する。DPB24aは、復号処理部26aが出力する復号画像を参照用の画像として蓄積し、当該参照画像を符号化処理部25aに出力する。符号化処理部25aは、DPB24aが出力する参照画像を用いて、並べ替え部23aが出力する映像フレーム(原画像)に対する符号化処理を行って量子化変換係数を生成し、量子化変換係数を復号処理部26a及びエントロピー符号化部27aに出力する。復号処理部26aは、符号化処理部25aが出力する量子化変換係数に対する復号処理を行って復号画像を生成し、復号画像をDPB24aに出力する。エントロピー符号化部27aは、符号化処理部25aが出力するELに関するHLSや量子化パラメータ、量子化変換係数や動きベクトルなど予測制御情報などの符号化情報に対するエントロピー符号化処理を行ってビットストリームを生成し、当該ビットストリームを出力する。
【0047】
一方、EL用のシングルレイヤ符号化装置20bでは、復号処理部21b及びHLS付け替え部22bを有効化する。復号処理部21bは、シングルレイヤ符号化装置20aから出力されたビットストリームに対する復号処理を行い、復号画像をビットストリーム生成部200bのDPB24bに出力し、復号画像及び動きベクトルなどをビットストリーム生成部200bの符号化処理部25bに出力する。HLS付け替え部22bは、シングルレイヤ符号化装置20aが出力するビットストリームに含まれるプロファイル情報などの高位シンタックスを、マルチレイヤ符号化を示す情報(例えばプロファイル情報、対応レイヤ情報など)に付け替え、当該付け替え後のビットストリームをBLストリームとして出力する。ビットストリーム生成部200bは、入力映像信号からBLのビットストリームを生成及び出力する。ビットストリーム生成部200bは、並べ替え部23bと、DPB24bと、符号化処理部25bと、復号処理部26bと、エントロピー符号化部27bとを有する。並べ替え部23bは、符号化効率を向上するために映像フレーム(原画像)を表示順と異なる順序に並べ替え、並べ替え後の映像フレームを符号化処理部25bに出力する。DPB24bは、復号処理部21及び26が出力する復号画像を参照用の画像として蓄積し、当該参照画像を符号化処理部25bに出力する。符号化処理部25bは、DPB24bが出力する参照画像を用いて、並べ替え部23bが出力する映像フレーム(原画像)に対する符号化処理を行って量子化変換係数を生成し、量子化変換係数などを復号処理部26b及びエントロピー符号化部27bに出力する。復号処理部26bは、符号化処理部25bが出力する量子化変換係数などに対する復号処理を行って復号画像を生成し、復号画像をDPB24bに出力する。エントロピー符号化部27bは、符号化処理部25bが出力する量子化変換係数などに対するエントロピー符号化処理を行ってビットストリームを生成し、当該ビットストリームをELストリームとして出力する。
【0048】
このように、本変更例によれば、共通の構成を有する基本の共通装置を直列に接続することでマルチレイヤ符号化装置1を構成する。これにより、マルチレイヤ符号化装置1をより効率的に構成可能になる。具体的には、上述の第1実施形態のように第1シングルレイヤ符号化部10及び第2シングルレイヤ符号化部20のそれぞれを個別に製造・管理等する必要がなくなり、マルチレイヤ符号化装置1を容易に実装することが可能になる。
【0049】
(第2実施形態)
第2実施形態について、上述の第1実施形態との相違点を主として説明する。
図4は、第2実施形態に係るマルチレイヤ符号化装置1の構成を示す図である。第2実施形態に係るマルチレイヤ符号化装置1では、異なる解像度の映像を用いるスケーラブル符号化、すなわち、空間スケーラブルを行う。
【0050】
図4に示すように、第2実施形態に係るマルチレイヤ符号化装置1は、入力映像信号の解像度を低下させるダウンコンバートを行うダウンコンバート部40をさらに有する。例えば、ダウンコンバート部40は、4K映像である入力映像信号を2K映像にダウンコンバートする、或いは、8K映像である入力映像信号を4K映像にダウンコンバートする。第1シングルレイヤ符号化部10は、ダウンコンバート部40が出力するダウンコンバート後の入力映像信号を符号化することでビットストリームを出力する。
【0051】
第2シングルレイヤ符号化部20は、第1シングルレイヤ符号化部10により得られたビットストリームをBLストリームとして出力する。また、第2シングルレイヤ符号化部20は、第1シングルレイヤ符号化部10により得られたビットストリームに対する復号処理を行って、復号映像、及びBLストリームに記録されたパラメータ情報を導出し、これらに対してアップサンプリング処理を行う。第2シングルレイヤ符号化部20は、当該アップサンプリング処理の結果を用いて、バッファ部30が出力する入力映像信号を符号化し、ELストリームを生成及び出力する。
【0052】
図5は、第2実施形態に係る第2シングルレイヤ符号化部20の構成を示す図である。
【0053】
第2実施形態に係る第2シングルレイヤ符号化部20は、復号処理部21が出力する復号画像をアップサンプリングするアップサンプリング部202と、復号処理部21が出力する動きベクトルをアップサンプリングするアップサンプリング部203とをさらに有する。アップサンプリング部202及び203は、解像度の違いに適したスケールにするようアップサンプリング処理を行う。アップサンプリング部202は、アップサンプリング後の復号画像をDPB24及び符号化処理部25に出力する。アップサンプリング部203は、アップサンプリング後の復号画像を符号化処理部25に出力する。その他の構成については、上述の第1実施形態と同様である。
【0054】
(第2実施形態の変更例)
第2実施形態の変更例について、上述の第2実施形態との相違点を主として説明する。
図6は、第2実施形態の変更例に係るマルチレイヤ符号化装置1の構成を示す図である。
【0055】
本変更例に係るマルチレイヤ符号化装置1は、上述の第1実施形態の変更例と同様に、第1シングルレイヤ符号化部10及び第2シングルレイヤ符号化部20として共通のハードウェア構成を有するシングルレイヤ符号化部を用いる。具体的には、上述の第2実施形態に係る第2シングルレイヤ符号化部20の一部の機能を無効化したものを第1シングルレイヤ符号化部10として用いる。
【0056】
すなわち、上述の第2実施形態に係る第2シングルレイヤ符号化部20を基本の共通装置として用いて、当該基本の共通装置を直列に接続することでマルチレイヤ符号化装置1を構成する。本変更例において、上述の第2実施形態に係る第1シングルレイヤ符号化部10として用いる当該基本の共通装置を、「シングルレイヤ符号化装置20a」と称し、上述の第2実施形態に係る第2シングルレイヤ符号化部20として用いる当該基本の共通装置を、「シングルレイヤ符号化装置20b」と称する。
【0057】
BL用のシングルレイヤ符号化装置20aは、復号処理部21a、HLS付け替え部22a、アップサンプリング部202a、及びアップサンプリング部203aを有するものの、復号処理部21a、HLS付け替え部22a、アップサンプリング部202a、及びアップサンプリング部203aを無効化する。シングルレイヤ符号化装置20aは、ダウンコンバート部40が出力するダウンコンバート後の入力映像信号を符号化することでビットストリームを出力する。
【0058】
一方、EL用のシングルレイヤ符号化装置20bでは、復号処理部21b、HLS付け替え部22b、アップサンプリング部202b、及びアップサンプリング部203bを有効化する。シングルレイヤ符号化装置20bは、シングルレイヤ符号化装置20aにより得られたビットストリームをBLストリームとして出力する。また、シングルレイヤ符号化装置20bは、シングルレイヤ符号化装置20aにより得られたビットストリームに対する復号処理を行って導出されたパラメータに対してアップサンプリング部202b及びアップサンプリング部203bがアップサンプリング処理を行い、当該アップサンプリング処理の結果を用いて、バッファ部30が出力する入力映像信号を符号化し、ELストリームを生成及び出力する。
【0059】
(第3実施形態)
上述の実施形態及びその変更例において、シングルレイヤ符号化部(シングルレイヤ符号化装置)を2段直列に接続した構成のマルチレイヤ符号化装置1について主として説明した。しかしながら、シングルレイヤ符号化部(シングルレイヤ符号化装置)を3段以上直列に接続した構成であってもよい。
図7及び
図8は、第3実施形態に係るマルチレイヤ符号化装置1の構成を示す図である。
【0060】
図7に示すように、第3実施形態に係るマルチレイヤ符号化装置1は、第1シングルレイヤ符号化部10と、第1シングルレイヤ符号化部10の後段に設けられた第2シングルレイヤ符号化部20Aと、第2シングルレイヤ符号化部20Aの後段に設けられた第3シングルレイヤ符号化部20Bと、バッファ部30A及び30Bとを有する。第1シングルレイヤ符号化部10は、BL用のシングルレイヤ符号化部に相当し、第2シングルレイヤ符号化部20A及び第3シングルレイヤ符号化部20Bのそれぞれは、EL用のシングルレイヤ符号化部に相当する。
【0061】
第1シングルレイヤ符号化部10は、入力映像信号(原画像)を符号化することでビットストリームを生成し、生成したビットストリームを第2シングルレイヤ符号化部20Aに出力する。第1シングルレイヤ符号化部10は、上述の第2実施形態と同様に、ダウンコンバート後の入力映像信号を符号化してもよい(
図8参照)。第1シングルレイヤ符号化部10は、一般的な符号化部で構成可能である。例えば、第1シングルレイヤ符号化部10は、マルチレイヤ符号化のプロファイルとは異なる一般的なプロファイル(例えば、Main10プロファイル)による符号化を行う符号化部である。
【0062】
或いは、第1シングルレイヤ符号化部10は、第2シングルレイヤ符号化部20A及び第3シングルレイヤ符号化部20Bのそれぞれとハードウェア構成が共通化されていてもよい。第1シングルレイヤ符号化部10は、当該共通の構成における一部の機能が無効化されたものであってもよい(上述の変更例を参照)。
【0063】
第2シングルレイヤ符号化部20Aは、上述の実施形態に係る第2シングルレイヤ符号化部20と同様に構成されている。第2シングルレイヤ符号化部20Aは、第1シングルレイヤ符号化部10により得られたビットストリームをBLストリームとして第3シングルレイヤ符号化部20Bに出力する。但し、第1シングルレイヤ符号化部10がマルチレイヤ符号化と異なる符号化プロファイルによる符号化を行う場合において、第2シングルレイヤ符号化部20Aは、第1シングルレイヤ符号化部10により得られたビットストリームに含まれるプロファイル情報を含む高位シンタックス情報をマルチレイヤ符号化の情報に付け替える。
【0064】
また、第2シングルレイヤ符号化部20Aは、第1シングルレイヤ符号化部10により得られたビットストリームに対する復号処理を行って導出されたパラメータを用いて、バッファ部30Aが出力する入力映像信号を符号化し、ELストリーム1を生成及び出力する。第2シングルレイヤ符号化部20Aは、ダウンコンバート後の入力映像信号を符号化してもよい(
図8参照)。第2シングルレイヤ符号化部20Aは、第1シングルレイヤ符号化部10により得られたビットストリームに対する復号処理を行うことにより、マルチレイヤ符号化(インターレイヤ符号化)に必要なパラメータを取得し、当該パラメータを用いてELストリーム1を生成及び出力する。例えば、第2シングルレイヤ符号化部20Aは、Multilayer Main10プロファイルにより、ELストリーム1を生成し、BLストリーム及びELストリーム1を合成したビットストリームを出力する。
【0065】
第3シングルレイヤ符号化部20Bは、上述の実施形態に係る第2シングルレイヤ符号化部20と同様に構成されている。第3シングルレイヤ符号化部20Bは、第2シングルレイヤ符号化部20Aが出力するBLストリームをそのまま出力する。また、第3シングルレイヤ符号化部20Bは、第2シングルレイヤ符号化部20Aが出力するBLストリームに対する復号処理を行って導出されたパラメータを用いて、バッファ部30Bが出力する入力映像信号を符号化し、ELストリーム2を生成及び出力する。具体的には、第3シングルレイヤ符号化部20Bは、第2シングルレイヤ符号化部20Aが出力するBLストリームに対する復号処理を行うことにより、マルチレイヤ符号化(インターレイヤ符号化)に必要なパラメータを取得し、当該パラメータを用いてELストリーム2を生成及び出力する。例えば、第2シングルレイヤ符号化部20Aは、Multilayer Main10プロファイルにより、ELストリーム2を生成し、BLストリームとELストリーム1とELストリーム2とを合成したビットストリームを出力する。
【0066】
第2シングルレイヤ符号化部20Aに入力される入力映像信号(原画像)は、バッファ部30Aにより一時的に保持された入力映像信号である。具体的には、バッファ部30Aは、第1シングルレイヤ符号化部10での符号化の所要時間に応じた時間において入力映像信号をバッファする。第2シングルレイヤ符号化部20Aは、バッファ部30Aが出力する入力映像信号を符号化することでELストリーム1を生成及び出力する。バッファ部30Aは第2シングルレイヤ符号化部20Aに内蔵されてもよいが、ビットストリームと原画像のELエンコード処理との遅延差を吸収し、適切なタイミングで第2シングルレイヤ符号化部20AがELの符号化処理を行えるようにする。
【0067】
第3シングルレイヤ符号化部20Bに入力される入力映像信号(原画像)は、バッファ部30Bにより一時的に保持された入力映像信号である。具体的には、バッファ部30Bは、第2シングルレイヤ符号化部20Aでの符号化の所要時間に応じた時間において、バッファ部30Aが出力する入力映像信号をバッファする。第3シングルレイヤ符号化部20Bは、バッファ部30Bが出力する入力映像信号を符号化することでELストリーム2を生成及び出力する。バッファ部30Bは第3シングルレイヤ符号化部20Bに内蔵されてもよいが、適切なタイミングで第3シングルレイヤ符号化部20BがELの符号化処理を行えるようにする。
【0068】
なお、
図8の構成例では、入力映像信号をダウンコンバートして第1シングルレイヤ符号化部10に出力するダウンコンバート部40Aと、バッファ部30Aが出力する入力映像信号をダウンコンバートして第2シングルレイヤ符号化部20Aに出力するダウンコンバート部40Bと、を有する。例えば、入力映像信号が8K映像信号である場合において、ダウンコンバート部40Aは2Kにダウンコンバートした映像信号を第1シングルレイヤ符号化部10に出力し、ダウンコンバート部40Bは4Kにダウンコンバートした映像信号を第2シングルレイヤ符号化部20Aに出力してもよい。
【0069】
(その他の実施形態)
マルチレイヤ符号化装置1又はシングルレイヤ符号化装置(シングルレイヤ符号化部)20が行う各処理をコンピュータに実行させるプログラムが提供されてもよい。プログラムは、コンピュータ読取り可能媒体に記録されていてもよい。コンピュータ読取り可能媒体を用いれば、コンピュータにプログラムをインストールすることが可能である。ここで、プログラムが記録されたコンピュータ読取り可能媒体は、非一過性の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、CD-ROMやDVD-ROM等の記録媒体であってもよい。
【0070】
例えば、プログラムは、コンピュータをマルチレイヤ符号化装置1として機能させる。具体的には、当該プログラムは、コンピュータに、入力映像信号を符号化することでビットストリームを出力する第1シングルレイヤ符号化手順と、第1シングルレイヤ符号化手順の後段に設けられた第2シングルレイヤ符号化手順と、を実行させる。第2シングルレイヤ符号化手順は、第1シングルレイヤ符号化手順により得られたビットストリームをBLストリームとして出力する手順と、第1シングルレイヤ符号化手順により得られたビットストリームに対する復号処理を行って導出されたパラメータを用いて入力映像信号を符号化し、ELストリームを出力する手順と、を含む。
【0071】
或いは、プログラムは、コンピュータをシングルレイヤ符号化装置20として機能させるシングルレイヤ符号化プログラムモジュールであってもよい。具体的には、当該プログラムモジュールは、コンピュータに、前段にある他のシングルレイヤ符号化プログラムモジュールにより得られたビットストリームに対する復号処理を行う復号処理手順と、当該プログラムモジュールがベースレイヤの符号化に用いられる場合において、当該復号処理手順を無効化するととともに、入力映像信号を符号化することでビットストリームを出力するビットストリーム生成手順と、を実行させる。当該プログラムモジュールがエンハンスメントレイヤの符号化に用いられる場合において、当該プログラムモジュールは、前段にある他のシングルレイヤ符号化プログラムモジュールにより得られたビットストリームをBLストリームとして出力し、当該復号処理手順を有効化するととともに、復号処理を行って導出されたパラメータを用いて入力映像信号を符号化し、ELストリームを出力する。
【0072】
マルチレイヤ符号化装置1又はシングルレイヤ符号化装置20が行う各処理を実行する回路を集積化し、マルチレイヤ符号化装置1又はシングルレイヤ符号化装置20を半導体集積回路(チップセット、SoC)として構成してもよい。
【0073】
本開示で使用されている「に基づいて(based on)」、「に応じて(depending on/in response to)」という記載は、別段に明記されていない限り、「のみに基づいて」、「のみに応じて」を意味しない。「に基づいて」という記載は、「のみに基づいて」及び「に少なくとも部分的に基づいて」の両方を意味する。同様に、「に応じて」という記載は、「のみに応じて」及び「に少なくとも部分的に応じて」の両方を意味する。「含む(include)」、「備える(comprise)」、及びそれらの変形の用語は、列挙する項目のみを含むことを意味せず、列挙する項目のみを含んでもよいし、列挙する項目に加えてさらなる項目を含んでもよいことを意味する。また、本開示において使用されている用語「又は(or)」は、排他的論理和ではないことが意図される。さらに、本開示で使用されている「第1」、「第2」などの呼称を使用した要素へのいかなる参照も、それらの要素の量又は順序を全般的に限定するものではない。これらの呼称は、2つ以上の要素間を区別する便利な方法として本明細書で使用され得る。したがって、第1及び第2の要素への参照は、2つの要素のみがそこで採用され得ること、又は何らかの形で第1の要素が第2の要素に先行しなければならないことを意味しない。本開示において、例えば、英語でのa,an,及びtheのように、翻訳により冠詞が追加された場合、これらの冠詞は、文脈から明らかにそうではないことが示されていなければ、複数のものを含むものとする。
【0074】
以上、図面を参照して実施形態について詳しく説明したが、具体的な構成は上述のものに限られることはなく、要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。
【符号の説明】
【0075】
1 :マルチレイヤ符号化装置
10 :第1シングルレイヤ符号化部
20 :第2シングルレイヤ符号化部(シングルレイヤ符号化装置)
20A :第2シングルレイヤ符号化部
20B :第3シングルレイヤ符号化部
20a :シングルレイヤ符号化装置
20b :シングルレイヤ符号化装置
21 :復号処理部
21a :復号処理部
21b :復号処理部
22 :HLS付け替え部
22a :HLS付け替え部
22b :HLS付け替え部
23 :並べ替え部
23a :並べ替え部
23b :並べ替え部
25 :符号化処理部
25a :符号化処理部
25b :符号化処理部
26 :復号処理部
26a :復号処理部
26b :復号処理部
27 :エントロピー符号化部
27a :エントロピー符号化部
27b :エントロピー符号化部
28 :ストリーム合成部
28a :ストリーム合成部
28b :ストリーム合成部
30 :バッファ部
30A :バッファ部
30B :バッファ部
40 :ダウンコンバート部
40A :ダウンコンバート部
200 :ビットストリーム生成部
200a :ビットストリーム生成部
200b :ビットストリーム生成部
201a :スイッチ部
201b :スイッチ部
202 :アップサンプリング部
202a :アップサンプリング部
202b :アップサンプリング部
203 :アップサンプリング部
203a :アップサンプリング部
203b :アップサンプリング部