(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024166153
(43)【公開日】2024-11-28
(54)【発明の名称】受信装置及びプログラム
(51)【国際特許分類】
H04N 19/30 20140101AFI20241121BHJP
【FI】
H04N19/30
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2024079426
(22)【出願日】2024-05-15
(31)【優先権主張番号】P 2023080936
(32)【優先日】2023-05-16
(33)【優先権主張国・地域又は機関】JP
(71)【出願人】
【識別番号】000004352
【氏名又は名称】日本放送協会
(74)【代理人】
【識別番号】110001106
【氏名又は名称】弁理士法人キュリーズ
(72)【発明者】
【氏名】岩村 俊輔
(72)【発明者】
【氏名】河村 侑輝
(72)【発明者】
【氏名】根本 慎平
(72)【発明者】
【氏名】井口 和久
(72)【発明者】
【氏名】市ヶ谷 敦郎
【テーマコード(参考)】
5C159
【Fターム(参考)】
5C159MA04
5C159MA05
5C159MA17
5C159MA21
5C159MA31
5C159MC11
5C159ME01
5C159PP04
5C159RC11
5C159UA02
5C159UA05
(57)【要約】 (修正有)
【課題】上位のレイヤのビットストリームに欠損が生じた場合でも、復号処理を初期化することなく復号処理を継続し、且つ、コストの増大を抑制する受信装置及びプログラムを提供する。
【解決手段】受信装置200は、第1レイヤのビットストリームを受信する第1受信部211Aと、第2レイヤのビットストリームを受信する第2受信部211Bと、第1レイヤのビットストリーム及び第2レイヤのビットストリームを結合するレイヤ結合処理を行ってマルチレイヤビットストリームを出力するレイヤ結合部220と、第2受信部における受信状態について判定する受信状態判定部240と、を備える。レイヤ結合部220は、第2レイヤのビットストリームの一部が欠損した旨を判定手段が判定した場合、当該欠損した部分のビットストリームに対して差し替え用データを差し替えたうえでレイヤ結合処理を行う。
【選択図】
図4
【特許請求の範囲】
【請求項1】
マルチレイヤ符号化における第1レイヤのビットストリームを受信する第1受信手段と、
前記第1レイヤよりも上位の第2レイヤのビットストリームを受信する第2受信手段と、
前記第1レイヤのビットストリーム及び前記第2レイヤのビットストリームを結合するレイヤ結合処理を行ってマルチレイヤビットストリームを出力する結合手段と、
前記第2受信手段における受信状態について判定する判定手段と、を備え、
前記結合手段は、前記第2レイヤのビットストリームの一部が欠損した旨を前記判定手段が判定した場合、当該欠損した部分のビットストリームに対して差し替え用データを差し替えたうえで前記レイヤ結合処理を行う
受信装置。
【請求項2】
前記第2レイヤにおける前記差し替えに用いる前記差し替え用データを保持するメモリ手段をさらに備え、
前記差し替え用データは、
前記第1レイヤにおける復号映像を前記第2レイヤにおける表示解像度に拡大した予測画像を生成させる予測モード情報と、
前記第2レイヤにおける各画像ブロックについて予測残差が含まれていないことを示す無残差情報と、を含む
請求項1に記載の受信装置。
【請求項3】
前記第1受信手段及び前記第2受信手段のそれぞれは、フレーム単位でビットストリームの受信処理を行い、
前記判定手段は、前記第2レイヤのビットストリームのうち前記欠損した部分に対応する欠損フレームを差し替えフレームとして判定し、
前記結合手段は、前記差し替えフレームに対して前記差し替え用データを差し替えたうえで前記レイヤ結合処理を行う
請求項1又は2に記載の受信装置。
【請求項4】
前記判定手段は、前記欠損フレームと、前記欠損フレームを参照画像として用いるフレームと、を差し替えフレーム群として判定し、
前記結合手段は、前記差し替えフレーム群を構成する各フレームに対して前記差し替え用データを差し替えたうえで前記レイヤ結合処理を行う
請求項3に記載の受信装置。
【請求項5】
前記第1受信手段及び前記第2受信手段のそれぞれは、複数のフレームをまとめたチャンク単位でビットストリームの受信処理を行い、
前記判定手段は、前記第2レイヤのビットストリームのうち前記欠損した部分を含む欠損チャンクを差し替えチャンクとして判定し、
前記結合手段は、前記差し替えチャンクに対して前記差し替え用データを差し替えたうえで前記レイヤ結合処理を行う
請求項1又は2に記載の受信装置。
【請求項6】
前記判定手段は、前記欠損チャンク内の各フレームと、前記欠損チャンク内のフレームを参照画像として用いるフレームと、を差し替えフレーム群として判定し、
前記結合手段は、前記差し替えフレーム群を構成する各フレームに対して前記差し替え用データを差し替えたうえで前記レイヤ結合処理を行う
請求項5に記載の受信装置。
【請求項7】
前記第1レイヤのビットストリームは、第1伝送路を介して伝送され、
前記第2レイヤのビットストリームは、前記第1伝送路と異なる第2伝送路を介して伝送される
請求項1又は2に記載の受信装置。
【請求項8】
コンピュータを請求項1に記載の受信装置として機能させる
プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、受信装置及びプログラムに関する。
【背景技術】
【0002】
近年、放送やストリーミングサービスなどの視聴においては、大型テレビやモバイル端末、タブレットなど、映像視聴に用いるデバイスが多様化している。これらのデバイスは映像処理能力や表示解像度などが様々であるため、それぞれのデバイスに適した解像度・フレームレートの映像を伝送することが好ましい。
【0003】
最新の映像符号化方式であるVVC(Versatile Video Coding)では、上記のような複数の映像を効率的に符号化するマルチレイヤ符号化機能が採用されている(例えば、非特許文献1参照)。
【0004】
マルチレイヤ符号化においては、符号化対象の複数の入力映像をレイヤ構造で符号化する。最も下位のレイヤ(L0)をまず符号化し、L0の復号映像を上位のレイヤ(L1,L2,…)の符号化処理による予測に用いることで、上位のレイヤの予測効率が向上し、それぞれを独立して符号化する場合に比べて符号化効率が向上する効果がある。特に、L0として低解像度映像を符号化し、低解像度映像の復号画像を用いて高解像度映像であるL1を符号化する空間スケーラビル符号化はマルチレイヤ符号化の典型的なユースケースである。
【0005】
現在の地上デジタル放送・ワンセグ放送などの例のように、放送サービスにおいては対象となる視聴端末の受信能力に応じて異なる放送方式が用いられることがある。例えば携帯電話などのように移動しながらの視聴が想定される視聴端末に対してはC/N比が低い場合にも受信・復号可能な放送方式を採用し、家庭での固定受信などの視聴が想定される端末に対してはC/N比が高い環境でのみ受信・復号可能とする放送方式を採用することが考えられる。
【0006】
VVCのマルチレイヤ符号化によって符号化されたマルチレイヤビットストリームのうち、低解像映像を符号化したL0ビットストリームを伝送容量は小さいが雑音に強い伝送路Aで伝送し、高解像度映像を符号化したL1ビットストリームを雑音に強くないが伝送容量の大きい別の伝送路Bで伝送することで、モバイル端末などの移動体受信を前提とした視聴端末では低解像度映像を、家庭での固定受信を行う大型テレビなどの視聴端末では、高解像度映像を視聴可能になる。
【先行技術文献】
【非特許文献】
【0007】
【非特許文献1】ISO/IEC 23090-3、”Information technology - Coded representation of immersive media - Part 3: Versatile video coding”
【発明の概要】
【発明が解決しようとする課題】
【0008】
L0ビットストリームとL1ビットストリームを異なる伝送路で伝送する場合、受信装置側で、それぞれの伝送路から伝送されたL0ビットストリーム及びL1ビットストリームを合成し、送信側のエンコーダが出力したマルチレイヤビットストリームを復元してデコーダに入力する必要がある。上述のように、L1ビットストリームを伝送容量が大きいが雑音に弱い伝送方式で伝送した場合、荒天の場合の降雨減衰などにより、固定受信であってもL1ビットストリームに欠損が生じる場合がある。
【0009】
このような場合、L1ビットストリームのデータに欠損がある部分については、高解像度映像を復号不可能となるため、デコーダはL0ビットストリームを復号し、低解像度映像を表示する必要がある。この場合、受信装置側の復号処理では、それまでの映像出力であるL1ビットストリームを復号した高解像度映像から、L0ビットストリームを復号した低解像度映像に映像出力の画面解像度を変更する必要があるため、復号処理を初期化する必要性がある。このため、受信側で映像が一度途切れてしまう問題が生じる可能性がある。また、L0ビットストリームの復号により得られる低解像度映像を、それまで表示していた高解像度映像の解像度に拡大(アップコンバート)するための解像度変換処理をデコーダと別に追加で受信装置に実装する必要があり、コストの増大につながる問題も生じる。
【0010】
そこで、本発明は、上位のレイヤのビットストリームに欠損が生じた場合でも、復号処理を初期化することなく復号処理を継続可能であって、且つコストの増大を抑制可能な受信装置及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0011】
第1の態様に係る受信装置は、マルチレイヤ符号化における第1レイヤのビットストリームを受信する第1受信手段と、前記第1レイヤよりも上位の第2レイヤのビットストリームを受信する第2受信手段と、前記第1レイヤのビットストリーム及び前記第2レイヤのビットストリームを結合するレイヤ結合処理を行ってマルチレイヤビットストリームを出力する結合手段と、前記第2受信手段における受信状態について判定する判定手段と、を備える。前記結合手段は、前記第2レイヤのビットストリームの一部が欠損した旨を前記判定手段が判定した場合、当該欠損した部分のビットストリームに対して差し替え用データを差し替えたうえで前記レイヤ結合処理を行う。
【0012】
第2の態様に係るプログラムは、コンピュータを第1の態様に係る受信装置として機能させる。
【発明の効果】
【0013】
本発明によれば、上位のレイヤのビットストリームに欠損が生じた場合でも、復号処理を初期化することなく復号処理を継続可能であって、且つコストの増大を抑制可能な受信装置及びプログラムを提供できる。
【図面の簡単な説明】
【0014】
【
図1】実施形態に係る伝送システムを示す図である。
【
図2】第1実施形態に係る送信装置の構成を示す図である。
【
図3】マルチレイヤビットストリームの一例を示す図である。
【
図4】第1実施形態に係る受信装置の構成を示す図である。
【
図5】第1実施形態に係る受信装置における通常の復号処理を示す図である。
【
図6】第1実施形態に係る受信装置におけるL1伝送誤り発生時の復号処理を示す図である。
【
図7】第1実施形態に係る受信状態判定部の動作を説明するための図である。
【
図8】第1実施形態に係る受信状態判定部がフレーム単位で判定を行う一例を示す図である。
【
図9】第1実施形態に係る受信状態判定部がチャンク単位で判定を行う一例を示す図である。
【
図10】第1実施形態の第1変更例を説明するための図である。
【
図11】第2実施形態に係る送信装置の構成を示す図である。
【
図12】第2実施形態に係る受信装置の構成を示す図である。
【発明を実施するための形態】
【0015】
図面を参照しながら、実施形態について説明する。図面の記載において、同一又は類似の部分には同一又は類似の符号を付している。
【0016】
(1)第1実施形態
図1乃至
図9を参照して、第1実施形態について説明する。
【0017】
(1.1)伝送システム
図1は、第1実施形態に係る伝送システム10を示す図である。
図1に示すように、伝送システム10は、送信装置100と、受信装置200とを有する。
【0018】
伝送システム10では、マルチレイヤ符号化に対応する映像符号化方式が採用されてもよい。マルチレイヤ符号化においては、符号化対象の複数の入力映像をレイヤ構造で符号化する。最も下位のレイヤ(L0)をまず符号化し、L0の復号映像を上位のレイヤ(L1,L2,…)の符号化処理による予測に用いることで、上位のレイヤの予測効率が向上し、それぞれを独立して符号化する場合に比べて符号化効率が向上する効果がある。
【0019】
マルチレイヤ符号化に対応する映像符号化方式では、ベースレイヤ(「L0」とも称する)として低解像度映像を符号化し、低解像度映像の復号画像を用いて高解像度映像であるエンハンスメントレイヤ(「L1」とも称する)を符号化する空間スケーラビル符号化が適用されてもよい。例えば、送信装置100は、2K解像度の映像をL0として符号化し、2K解像度の映像を用いて4K解像度の映像の予測処理を行い、高解像度映像と予測画像との差分情報を予測情報とともにエンハンスメントレイヤ(「L1」とも称する)として符号化してもよい。
【0020】
マルチレイヤ符号化に対応する映像符号化方式としては、MPEGによって標準化されたVVCが用いられてもよい。VVCは、ISO/IEC 23090-3で規定される方式であると考えてもよい。VVCでは、2K/4Kの2レイヤの解像度に関するスケーラビリティに加えて、2K/4K/8Kの3レイヤの解像度に関するスケーラビリティがサポートされ、アップコンバートではなくエンハンスメントレイヤをテロップやサブ映像等の付加情報の重畳に用いることもサポートされてもよい。
【0021】
伝送システム10では、伝送方式として、RTP(Realtime Transport Protocol)が採用されてもよく、MMT(MPEG Media Transport)が採用されてもよい。RTPは、IETF RFC 3550で規定される方式であると考えてもよい。MMTは、ISO/IEC 23008-1で規定される方式であると考えてもよく、ARIB STD-B60で規定される方式であると考えてもよい。
【0022】
ベースレイヤ(L0)及びエンハンスメントレイヤ(L1)は異なる伝送路500で送信されてもよい。例えば、マルチレイヤ符号化によって符号化されたマルチレイヤビットストリームのうち、低解像映像を符号化したL0ビットストリームを伝送容量は小さいが雑音に強い伝送路500Aで伝送し、高解像度映像を符号化したL1ビットストリームを雑音に強くないが伝送容量の大きい別の伝送路500Bで伝送する。このように伝送することで、モバイル端末などの移動体受信を前提とした受信装置200では低解像度映像を、家庭での固定受信を行う大型テレビなどの受信装置200では、高解像度映像を視聴可能になる。
【0023】
L0ビットストリームとL1ビットストリームを異なる伝送路500で伝送する場合、受信装置200側で、それぞれの伝送路から伝送されたL0ビットストリーム及びL1ビットストリームを合成し、送信側のエンコーダが出力したマルチレイヤビットストリームを復元してデコーダに入力する必要がある。L1ビットストリームを伝送容量が大きいが雑音に弱い伝送方式で伝送した場合、荒天の場合の降雨減衰などにより、固定受信であってもL1ビットストリームに欠損が生じる場合がある。
【0024】
なお、伝送路500A及び伝送路500Bは、光回線伝送路であってもよく、無線伝送路であってもよい。特に限定されるものではないが、伝送路500A及び伝送路500Bは、同じタイプの伝送路であってもよく、異なるタイプの伝送路であってもよい。例えば、伝送路500Aは、放送伝送路であり、伝送路500Bは、通信伝送路であってもよい。伝送路500Aは、地上波の放送伝送路であり、伝送路500Bは、衛星波の放送伝送路であってもよい。
【0025】
但し、伝送路500Aの誤り発生率は、伝送路500Bの誤り発生率よりも低くてもよい。誤り発生率は、波長、周波数、変調方式、誤り耐性などの各種パラメータによって定義される。例えば、伝送路500A及び伝送路500Bがいずれも地上波の放送伝送路であるケースを例に挙げると、伝送路500Aでは、64QAM(Quadrature Amplitude Modulation)が変調方式として用いられ、伝送路500Bでは、1024QAMが変調方式として用いられてもよい。
【0026】
(1.2)第1実施形態に係る構成
第1実施形態に係る構成について説明する。
【0027】
(1.2.1)送信装置の構成
図2は、第1実施形態に係る送信装置100の構成を示す図である。第1実施形態に係る送信装置100は、マルチレイヤ符号化部110と、レイヤ分離部120と、送信手段130と、を有する。
【0028】
マルチレイヤ符号化部110は、ベースレイヤ(L0)を構成する各ユニットを符号化し、L0ビットストリームを生成する。マルチレイヤ符号化部110は、エンハンスメントレイヤ(L1)を構成する各ユニットを符号化し、L1ビットストリームを生成する。ユニットは、NAL(Network Abstraction Layer)ユニットと称されてもよい。マルチレイヤ符号化部110は、所定順序で各ユニットを符号化し、
図3に示すようなマルチレイヤビットストリームをレイヤ分離部120に出力する。
【0029】
レイヤ分離部120は、ユニットのヘッダに含まれるレイヤID(例えば、nuh_layer_id)に基づいて、ユニットがベースレイヤを構成するかエンハンスメントレイヤを構成するかを判定する。レイヤ分離部120は、ベースレイヤを構成するユニットからなるL0ビットストリームを送信手段130Aに出力し、エンハンスメントレイヤを構成するユニットからなるL1ビットストリームを送信手段130Bに出力する。
【0030】
送信手段130は、レイヤ分離部120が出力するビットストリームを、伝送路500を介して送信する。第1実施形態では、送信手段130Aは、レイヤ分離部120が出力するL0ビットストリームを、伝送路500Aを介して送信する。送信手段130Bは、レイヤ分離部120が出力するL1ビットストリームを、伝送路500Bを介して送信する。
【0031】
送信手段130は、パケタイズ部131と、送信部132とを有する。パケタイズ部131は、ユニットをパケット化してパケットを生成する。パケットは、RTPに準拠するパケットであってもよい。例えば、パケットは、IPパケットであってもよい。IPパケットは、IPヘッダ、UDPヘッダ、RTPヘッダ及びペイロードを含んでもよい。
【0032】
具体的には、パケタイズ部131Aは、ベースレイヤを構成するユニットに対応するパケットを生成する。当該パケットは、ベースレイヤに対応するユニットをペイロードとして含む。パケタイズ部131Bは、エンハンスメントレイヤを構成するユニットに対応するパケットを生成する。当該パケットは、エンハンスメントレイヤに対応するユニットをペイロードとして含む。
【0033】
送信部132は、伝送路500を介して、パケタイズ部131によって生成されたパケットを送信する。具体的には、送信部132Aは、伝送路500Aを介して、パケタイズ部131Aによって生成されたパケットを送信する。送信部132Bは、伝送路500Bを介して、パケタイズ部131Bによって生成されたパケットを送信する。なお、送信部132A及び送信部132Bは、光回線用のONU(Optical Network Unit)を含んでもよく、無線用の変調部を含んでもよい。
【0034】
(1.2.2)受信装置の構成
図4は、第1実施形態に係る受信装置200の構成を示す図である。第1実施形態に係る受信装置200は、受信手段210と、レイヤ結合部220と、メモリ部230と、受信状態判定部240と、マルチレイヤ復号部250と、を有する。
【0035】
受信手段210は、伝送路500を介して、ビットストリームを受信する。第1実施形態では、受信手段210Aは、伝送路500Aを介して伝送されるL0ビットストリームを受信する。受信手段210Bは、伝送路500Bを介して伝送されるL1ビットストリームを受信する。受信装置200は、受信部211と、デパケタイズ部212と、バッファ部213とを有する。
【0036】
受信部211は、伝送路500を介して、ビットストリームを構成する各パケットを受信する。受信部211Aは、伝送路500Aを介して、ベースレイヤを構成するユニットに対応するパケットを受信する。受信手段210Bは、伝送路500Bを介して、エンハンスメントレイヤを構成するユニットに対応するパケットを受信する。
【0037】
デパケタイズ部212は、受信部211によって受信されたパケットをデパケット化してユニットを取り出す。具体的には、デパケタイズ部212Aは、受信部211Aによって受信されたパケットから、ベースレイヤを構成するユニットを取り出す。デパケタイズ部212Bは、受信部211Bによって受信されたパケットから、エンハンスメントレイヤを構成するユニットを取り出す。
【0038】
バッファ部213は、デパケタイズ部212によって取り出されたユニットを蓄積する。バッファ部213は、FIFO(First-In First-Out)型のバッファ部であってもよい。バッファ部213は、伝送遅延の誤差を吸収するために用いられる。具体的には、バッファ部213Aは、ベースレイヤを構成するユニットを蓄積する。バッファ部213Bは、エンハンスメントレイヤを構成するユニットを蓄積する。
【0039】
レイヤ結合部220は、受信手段210Aによって受信されたL0ビットストリーム及び受信手段210Bによって受信されたL1ビットストリームを結合するレイヤ結合処理を行ってマルチレイヤビットストリームをマルチレイヤ復号部250に出力する。具体的には、レイヤ結合部220は、バッファ部213に蓄積されるユニットの内部を解析するとともに、マルチレイヤ符号化部110と同様の所定順序でユニットを並び替え、マルチレイヤ符号化部110と同様の所定順序でユニット(マルチレイヤビットストリーム)をマルチレイヤ復号部250に出力する。
【0040】
特に限定されるものではないが、レイヤ結合部220は、ユニットに含まれるピクチャヘッダのPOC(Picture Order Count)を復号した上で、POCに基づいてユニットを並び変えてもよい。POCの復号は、ユニットの内部の解析の一例であると考えてもよい。なお、ユニットの内部の解析方法は、ユニットの符号化/復号の方式に応じて適切な方法が採用されてもよい。
【0041】
メモリ部230は、L1ビットストリームにおける差し替えに用いる差し替え用データを保持しており、差し替え用データをレイヤ結合部220に出力する。差し替え用データの具体例については後述する。メモリ部230は、エンハンスメントレイヤにおける解像度ごとに異なる差し替えデータを保持してもよい。この場合、メモリ部230は、エンハンスメントレイヤにおける現在の解像度に対応する差し替えデータをレイヤ結合部220に出力してもよい。
【0042】
受信状態判定部240は、受信手段210Bにおける受信状態(すなわち、L1ビットストリームの受信状態)について判定する。受信状態判定部240は、L1ビットストリームにおいて伝送誤りによって生じたパケット損失の有無について判定してもよい。受信状態判定部240は、損失したパケットに対応するフレーム(「ピクチャ」とも称する)を判定してもよいし、損失したパケットに対応するチャンクを判定してもよい。
【0043】
なお、チャンク(chunk)は、複数のフレームをまとめた単位であって、映像を符号化する際に一定の長さのビットストリームに分割した単位である。チャンクは、フレームを一定の数だけグループ化してビットストリームを形成することで、ストリームの伝送や再生をより効率的に行うことができる。チャンクは、フレームのサイズやビットレートに基づいて決定されてもよい。一般的には、チャンクのサイズを小さくすると、ビットストリームの遅延が少なくなるが、ビットレートが高くなる。
【0044】
マルチレイヤ復号部250は、マルチレイヤ符号化部110と同様の所定順序でレイヤ結合部220から出力されるユニット(マルチレイヤビットストリーム)を復号し、復号映像を出力する。マルチレイヤ復号部250は、受信装置200の外部の装置、例えば表示装置に設けられてもよい。
【0045】
このように構成された受信装置200において、レイヤ結合部220は、L1ビットストリームの一部が欠損した旨を受信状態判定部240が判定した場合、当該欠損した部分のL1ビットストリームに対して差し替え用データを差し替えたうえでレイヤ結合処理を行う。このように、レイヤ結合部220は、欠損した部分のL1ビットストリームに対して差し替え用データを差し替えたうえでレイヤ結合処理を行うことで、L1ビットストリームに欠損が無い場合と同じ形式のマルチレイヤビットストリームをマルチレイヤ復号部250に出力できる。
【0046】
そのため、マルチレイヤ復号部250は、L1ビットストリームに欠損が生じた場合でも、復号処理を初期化する必要性が無く、映像が一度途切れてしまうことを回避できる。また、L0ビットストリームの復号により得られる低解像度映像を、それまで表示していた高解像度映像の解像度に拡大(アップコンバート)するための解像度変換処理をデコーダと別に追加で受信装置200に実装する必要が無く、コストの増大を抑制できる。
【0047】
(1.3)受信装置の動作
図5は、第1実施形態に係る受信装置200における通常の復号処理を示す図である。
【0048】
レイヤ結合部220は、L0ビットストリーム及びL1ビットストリームを結合してマルチレイヤビットストリームをマルチレイヤ復号部250に出力する。
【0049】
マルチレイヤ復号部250は、L0の復号処理においては、L0ビットストリームからL0予測モード情報及びL0予測残差を取得し、L0予測モード情報に基づいてL0予測画像を生成し、L0予測残差とL0予測画像とを合成することでL0復号画像を得る。
【0050】
マルチレイヤ復号部250は、L1の復号処理においては、L1ビットストリームからL1予測モード情報及びL1予測残差を取得し、L1予測モード情報に基づいてL0復号画像を用いてL1予測画像を生成し、L1予測残差とL1予測画像とを合成することでL1復号画像を得る。L0復号画像からL1予測画像を生成する予測を、VVCではインターレイヤ予測と称し、インターレイヤ予測では、異なる解像度の画像間の予測のためRPR(Reference Picture Resampling)と称する技術が用いられる。具体的には、L0復号画像をL1の復号画像の解像度に拡大しながら、インター予測を行う処理である。
【0051】
図6は、第1実施形態に係る受信装置200におけるL1伝送誤り発生時の復号処理を示す図である。
【0052】
レイヤ結合部220は、L1ビットストリームが欠損した場合、欠損したL1ビットストリームに対して、メモリ部230が保持する差し替え用データを差し替えたマルチレイヤビットストリームをマルチレイヤ復号部250に出力する。
【0053】
差し替え用データは、L0における復号映像をL1における表示解像度に拡大した予測画像を生成させる予測モード情報と、L1における各画像ブロックについて予測残差が含まれていないことを示す無残差情報と、を含む。
【0054】
具体的には、差し替え用データでは、予測モード情報として、L0復号画像をインターレイヤ予測する際に用いる動きベクトル(MV)として、全てのブロックにおいてゼロベクトルを格納した情報が格納されている。また、予測残差として、すべてのブロックにおける予測残差がゼロとなるような情報が格納されている。
【0055】
これにより、マルチレイヤ復号部250は、L0復号画像を動き情報がゼロの動きベクトルを用いてインターレイヤ予測を行うことで得られたL0復号画像の拡大画像を、差し替え用データを用いて復号した際のL1復号画像として生成する。よって、L1ビットストリームの欠損によるマルチレイヤ復号部250の停止や初期化を防ぐことが可能となり、マルチレイヤ復号部250における別途の解像度拡大処理も不要となる。
【0056】
なお、差し替え用データは、動き情報がゼロである動きベクトル(ゼロベクトル)と残差信号がないことを示す無予測残差とを含む一例を説明した。さらに、差し替え用データでは、符号化対象の画像のブロック分割を極力行わないようにする(例えば、画面端以外はCTU以下の分割を行わないなど)。このような差し替え用データとすることで、データサイズを小さくし、受信装置200に必要なメモリ容量を削減できる。
【0057】
図7乃至
図9は、受信状態判定部240の動作を説明するための図である。これらの図において、L0ビットストリーム及びL1ビットストリームのそれぞれが複数のチャンク(Chunk0、Chunk1、Chunk2・・・)により構成されているものとする。各チャンクにおいて、「IDR」で示すフレームは、Instantaneous Decoder Refreshを意味し、「CRA」で示すフレームは、Clean Random Accessを意味する。このようなフレームは、CRAフレームは、Iフレーム(Iピクチャ)のような参照フレームを必要としないフレームであってもよい。
【0058】
図7に示すように、受信手段210のそれぞれは、フレーム単位且つチャンク単位でビットストリームの受信処理を行う。例えば、受信手段210Bは、フレーム単位且つチャンク単位でL1ビットストリームの受信処理を行う。受信状態判定部240は、欠損したパケットを含む欠損フレーム及び/又は欠損フレームを含むチャンクを判定する。
【0059】
図8は、受信状態判定部240がフレーム単位で判定を行う一例を示す図である。
【0060】
受信状態判定部240は、L1ビットストリームのうち欠損した部分(1つ又は複数のパケット)に対応する欠損フレームを差し替えフレームとして判定する。図示の例では、受信状態判定部240は、Chunk2に含まれる1つのBピクチャに欠損が発生し、これを差し替えフレームとして判定する。この場合、レイヤ結合部220は、当該差し替えフレームに対して差し替え用データを差し替えたうえでレイヤ結合処理を行う。
【0061】
さらに、受信状態判定部240は、欠損フレームと、当該欠損フレームを参照画像として用いるフレームと、を差し替えフレーム群として判定してもよい。図示の例では、受信状態判定部240は、Chunk2において欠損したBピクチャと、当該Bピクチャを参照する前後のBピクチャと、を差し替えフレーム群として判定している。この場合、レイヤ結合部220は、差し替えフレーム群を構成する各フレームに対して差し替え用データを差し替えたうえでレイヤ結合処理を行う。
【0062】
このように、フレーム単位で差し替えフレームを判定することで、差し替え対象となるフレームの数が少なく済み、L0復号画像の拡大映像が表示される時間を最小限に抑えることが可能となる。
【0063】
図9は、受信状態判定部240がチャンク単位で判定を行う一例を示す図である。
【0064】
受信状態判定部240は、L1ビットストリームのうち欠損した部分(1つ又は複数のパケット)を含む欠損チャンクを差し替えチャンクとして判定する。図示の例では、受信状態判定部240は、Chunk2に含まれるフレームに欠損が発生し、Chunk2を差し替えチャンクして判定する。この場合、レイヤ結合部220は、差し替えチャンク(Chunk2)に対して差し替え用データを差し替えたうえでレイヤ結合処理を行う。
【0065】
さらに、受信状態判定部240は、欠損チャンク内の各フレームと、当該欠損チャンク内のフレームを参照画像として用いるフレームと、を差し替えフレーム群として判定してもよい。この場合、レイヤ結合部220は、差し替えフレーム群を構成する各フレームに対して差し替え用データを差し替えたうえでレイヤ結合処理を行う。
【0066】
このように、受信状態判定部240は、欠損したフレームだけでなく、そのフレームが属するチャンクそのものを欠損したチャンクとして判定する。受信状態判定部240は、欠損したチャンク及び当該チャンクを参照するフレームを差し替えフレーム群として判定してもよい。チャンク単位での欠損の判定はシステムレイヤのみであるため、容易に行うことができる。また、差し替えを行う範囲の判定も用意であり、例えば、次に現れるCRA・IDRピクチャまでが全て差し替えフレームとして判定してもよい。
【0067】
(1.4)第1実施形態のまとめ
第1実施形態に係る受信装置200は、伝送路500Aを介して伝送されるビットストリームであってマルチレイヤ符号化における第1レイヤ(L0)ビットストリームを受信する受信手段210Aと、伝送路500Aと異なる伝送路500Bを介して伝送されるビットストリームであってL0よりも上位の第2レイヤ(L0)ビットストリームを受信する受信手段210Bと、L0ビットストリーム及びL1ビットストリームを結合するレイヤ結合処理を行ってマルチレイヤビットストリームを出力するレイヤ結合部220と、受信手段210Bにおける受信状態について判定する受信状態判定部240と、を有する。レイヤ結合部220は、L1ビットストリームの一部が欠損した旨を受信状態判定部240が判定した場合、当該欠損した部分のビットストリームに対して差し替え用データを差し替えたうえでレイヤ結合処理を行う。
【0068】
これにより、レイヤ結合部220は、L1ビットストリームに欠損が生じた場合でも、L1ビットストリームに欠損が無い場合と同じ形式のマルチレイヤビットストリームをマルチレイヤ復号部250に出力できる。そのため、マルチレイヤ復号部250は、L1ビットストリームに欠損が生じた場合でも、復号処理を初期化する必要性が無く、映像が一度途切れてしまうことを回避できる。また、L0ビットストリームの復号により得られる低解像度映像を、それまで表示していた高解像度映像の解像度に拡大(アップコンバート)するための解像度変換処理をデコーダと別に追加で受信装置200に実装する必要が無く、コストの増大を抑制できる。
【0069】
(1.5)第1実施形態の第1変更例
上述の第1実施形態では、L0及びL1が異なる解像度である一例を想定していたが、L0及びL1が同一解像度であってもよい。例えば、
図10に示すように、送信装置100のマルチレイヤ符号化部110は、番組映像を構成する第1画像をL0として符号化して得たL0ビットストリームを出力するとともに、第1画像にサブコンテンツ(例えば、字幕)が上乗せされた第2画像をL1として符号化して得たL0ビットストリームを出力してもよい。ここで、第1画像及び第2画像は、解像度が等しい。これにより、受信装置200では、L0のみを復号する場合は番組映像を再生可能であり、L0及びL1を復号する場合はサブコンテンツ付きの番組映像を再生可能である。後者の場合において、L1ビットストリームが欠損した場合でも、L0の復号映像をシームレスに表示できる。
【0070】
(1.6)第1実施形態の第2変更例
上述の第1実施形態では、レイヤ結合部220が、L1ビットストリームの一部が欠損した旨を受信状態判定部240が判定した場合、当該欠損した部分のビットストリームに対して差し替え用データを差し替えたうえでレイヤ結合処理を行う一例について主として説明したが、これに限定されない。レイヤ結合部220は、L1ビットストリームの全てを受信できている場合にも差し替え用データによる差し替えを行ってもよい。このような動作をすることにより、上述のようなサブコンテンツ符号化において、L1復号画像(サブコンテンツ付き映像)とL0復号画像(サブコンテンツ無し映像)とのシームレスな表示切り替えにも用いることが可能となる。
【0071】
(1.7)第1実施形態の第3変更例
上述の第1実施形態では特に触れていないが、伝送されるビットストリームはAPS(Adaptation Parameter Set)を含む。欠損したフレームでAPSが伝送された場合、後段のBフレーム(Bピクチャ)で当該欠損したAPSが参照される可能性がある。そのため、APSは、L0側の伝送路500A、すなわち、パケット損失の生じない伝送路500で伝送することが好ましい。
【0072】
(1.8)第1実施形態の第4変更例
上述の第1実施形態では特に触れていないが、伝送方式としてMMTが用いられる場合に、ISOBMFF(ISO Base Media File Format)メタデータが用いられてもよい。このようなケースにおいて、送信装置100のパケタイズ部131は、ISOBMFFメタデータを生成する機能を有しており、ISOBMFFメタデータをMPUメタデータ又はMFUデータとしてMMTパケットに多重してもよい。ここで、ISOBMFFは、CMAF(Common Media Application Format)であってもよい。CMAFセグメント(チャンク)は、初期化セグメント及びメディアセグメントを含んでもよい。初期化セグメントは、復号機能の初期化に必要な大域的なメタデータ(”moov”)を含む。メディアセグメントは、短尺に区切られた映像のメディアデータ(”mdat”)及びそれに対応する局所的なメタデータ(”moof”)を含む。このようなケースにおいて、受信装置200側で差し替え用データによる差し替えがされた場合、CMAFにおけるmoofに記述されるデータのサイズを示す記述子が、差し替え後のデータのサイズと一致しない可能性がある。よって、受信装置200は、差し替え用データによる差し替えを行う場合、moofのデータサイズの書き換えをすることが好ましい。
【0073】
(2)第2実施形態
図11及び
図12を参照して、第2実施形態について、第1実施形態との相違点を主として説明する。
【0074】
(2.1)第2実施形態の概要
伝送路500Aは、ベースレイヤを構成するユニットに対応するパケットの伝送に用いられるため、一般的に、伝送路500Aの誤り耐性は、伝送路500Bの誤り耐性よりも高いことが想定される。すなわち、伝送路500B(エンハンスメントレイヤ)では、伝送路500A(ベースレイヤ)よりも伝送誤りが生じる可能性が高い。
【0075】
誤り耐性は、伝送路500そのものの伝送特性(伝送路の種別、伝送路の伝送容量など)によって変化し得る。誤り耐性は、伝送路500で適用される誤り訂正の強度によって変化し得る。
【0076】
このような背景下において、発明者等は、鋭意検討の結果、エンハンスメントレイヤで誤りが生じた場合に、誤りが生じた部位によって再生品質に与える影響が異なることに着目し、エンハンスメントレイヤに対応する伝送路の誤り発生率が一定である条件下においても、エンハンスメントレイヤに関する再生品質を向上し得ることを見出した。
【0077】
第2実施形態に係る送信装置は、ベースレイヤ及び前記ベースレイヤを拡張するエンハンスメントレイヤを符号化する符号化部と、第1伝送路を介して第1パケットを送信する第1送信部と、第2伝送路を介して第2パケットを送信する第2送信部と、前記エンハンスメントレイヤを構成するユニットのうち、特定重要度を有する特定ユニットを前記第1伝送路に振り分け、前記特定ユニット以外のユニットを前記第2伝送路に振り分ける制御部と、を備え、前記第1パケットは、前記ベースレイヤを構成するユニット及び前記特定ユニットを含み、前記第2パケットは、前記エンハンスメントレイヤを構成するユニットのうち、前記特定ユニット以外のユニットを含む。
【0078】
第2実施形態に係る受信装置は、第1伝送路を介して受信する第1パケットを蓄積する第1バッファ部と、第2伝送路を介して受信する第2パケットを蓄積する第2バッファ部と、ベースレイヤ及び前記ベースレイヤを拡張するエンハンスメントレイヤを復号する復号部と、前記第1パケット及び前記第2パケットに付与されたシーケンス番号、パケットカウンタの値、拡張カウンタの値及びタイムスタンプの少なくともいずれか1つに基づいて、前記第1パケット及び前記第2パケットを前記復号部に出力するデパケタイズ部と、を備え、前記シーケンス番号、パケットカウンタの値、拡張カウンタの値及び前記タイムスタンプの少なくともいずれか1つは、符号化部からユニットが出力される順序に基づいて付与され、前記第1パケットは、前記ベースレイヤを構成するユニットに加えて、前記エンハンスメントレイヤを構成するユニットのうち、特定重要度を有する特定ユニットを含み、前記第2パケットは、前記エンハンスメントレイヤを構成するユニットのうち、前記特定ユニット以外のユニットを含む。
【0079】
第2実施形態によれば、送信装置は、第1伝送路を介して、エンハンスメントレイヤを構成するユニットのうち、特定重要度を有する特定ユニットを送信する。このような構成によれば、エンハンスメントレイヤに対応する伝送路(すなわち、第2伝送路)の誤り発生率が一定である条件下においても、エンハンスメントレイヤを構成する特定ユニットに関する誤り発生率を第1伝送路と同レベルに抑制することができ、エンハンスメントレイヤに関する再生品質を向上できる。
【0080】
第2実施形態によれば、受信装置は、第1パケット及び第2パケットに付与されたシーケンス番号、パケットカウンタの値、拡張カウンタの値及びタイムスタンプの少なくともいずれか1つに基づいて、第1パケット及び第2パケットを復号部に出力する。このような構成によれば、エンハンスメントレイヤを構成する特定ユニットが第1伝送路を介して受信される場合であっても、ベースレイヤ及びエンハンスメントレイヤを適切に復号できる。
【0081】
(2.2)第2実施形態に係る構成
第2実施形態に係る構成について説明する。
【0082】
(2.2.1)送信装置の構成
図11は、第2実施形態に係る送信装置100の構成を示す図である。第2実施形態に係る送信装置100は、マルチレイヤ符号化部101と、レイヤID分離部103と、重要度評価部104と、パケタイズ部105と、送信部132と、を有する。
【0083】
マルチレイヤ符号化部101は、マルチレイヤ符号化部110と同様に、ベースレイヤ及びエンハンスメントレイヤを構成するユニットを符号化する。ユニットは、NALユニットと称されてもよい。マルチレイヤ符号化部101は、所定順序でユニットを符号化する。
【0084】
レイヤID分離部103は、レイヤ分離部120と同様に、ユニットのヘッダに含まれるレイヤID(例えば、nuh_layer_id)に基づいて、ユニットがベースレイヤを構成するかエンハンスメントレイヤを構成するかを判定する。レイヤID分離部103は、ベースレイヤを構成するユニットをパケタイズ部105に出力し、エンハンスメントレイヤを構成するユニットを重要度評価部104に出力する。
【0085】
重要度評価部104は、エンハンスメントレイヤを構成するユニットの重要度を評価する。具体的には、重要度評価部104は、エンハンスメントレイヤを構成するユニットのうち、特定重要度を有する特定ユニットを送信部132A(伝送路500A)に振り分け、特定ユニット以外のユニットを送信部132B(伝送路500B)に振り分ける。
【0086】
特定重要度は、以下に示すオプションに従って判定されてもよい。
【0087】
オプション1では、重要度評価部104は、パラメータセットを含むユニットを特定ユニットとして送信部132A(伝送路500A)に振り分けてもよい。具体的には、重要度評価部104は、ユニットのヘッダ(例えば、NALユニットタイプ(nal_unit_type))を参照して、パラメータセットを含むユニットを特定ユニットとして特定してもよい。例えば、重要度評価部104は、Sequence Parameter Set、Picture Parameter Set、Adaptation Parameter Setを含むユニットを特定ユニットとして特定してもよい。
【0088】
オプション1によれば、パラメータセットを含むユニットの誤りを抑制することによって、伝送路500Bの誤り発生率が一定である条件下においても、エンハンスメントレイヤを全く再生できない事態を抑制できる。
【0089】
オプション2では、重要度評価部104は、先頭ピクチャを構成するユニットを特定ユニットとして送信部132A(伝送路500A)に振り分けてもよい。具体的には、重要度評価部104は、SOP(Structure Of Picture)の復号において先頭ピクチャを構成するユニットを特定ユニットとして特定してもよい。先頭ピクチャは、GOP(Group Of Picture)のI(Intra-coded)ピクチャであると考えてもよい。なお、GOPの先頭ピクチャについて、ベースレイヤは単独で復号可能なIピクチャのデータであるのに対して、これを拡張するエンハンスメントレイヤ(特定ユニットに該当)は、ベースレイヤの復号結果をもとにレイヤ間予測したあとの差分情報を符号化したP(Predictive-coded)ピクチャ相当のデータであってもよい。
【0090】
オプション2によれば、先頭ピクチャを構成するユニットの誤りを抑制することによって、伝送路500Bの誤り発生率が一定である条件下においても、先頭ピクチャを参照するピクチャ群の全体を全く再生できない事態を抑制できる。
【0091】
オプション3では、重要度評価部104は、他のピクチャから参照されないピクチャを構成するユニットを特定ユニット以外のユニットとして送信部132B(伝送路500B)に振り分けてもよい。具体的には、重要度評価部104は、SOPの復号において他のピクチャから参照されないピクチャを構成するユニットを特定ユニット以外のユニットとして特定してもよい。言い換えると、重要度評価部104は、SOPの復号において他のピクチャから参照されるピクチャを構成するユニットを特定ユニットとして特定してもよい。
【0092】
オプション3では、他のピクチャから参照されないピクチャの誤りを許容しつつ、エンハンスメントレイヤの品質の劣化を抑制できる。
【0093】
なお、上述のオプション1-3の中から選択された2以上のオプションが組み合わされてもよい。
【0094】
パケタイズ部105は、パケタイズ部131と同様に、ユニットをパケット化してパケットを生成する。パケットは、RTPに準拠するパケットであってもよい。例えば、パケットは、IPパケットであってもよい。IPパケットは、IPヘッダ、UDPヘッダ、RTPヘッダ及びペイロードを含んでもよい。
【0095】
第2実施形態では、パケタイズ部105は、ベースレイヤを構成するユニット及びエンハンスメントレイヤを構成する特定ユニットに対応するパケットを生成する。パケタイズ部105は、生成されたパケットを送信部132Aに出力する。一方で、パケタイズ部105は、エンハンスメントレイヤを構成する特定ユニット以外のユニットに対応するパケットを生成する。パケタイズ部105は、生成されたパケットを送信部132Bに出力する。
【0096】
第2実施形態では、パケタイズ部105は、マルチレイヤ符号化部101からユニットが出力される順序に基づいて、シーケンス番号及びタイムスタンプの少なくともいずれか1つをパケットに付与してもよい。
【0097】
例えば、パケタイズ部105は、シーケンス番号をカウントするシーケンス番号カウンタを有してもよい。シーケンス番号カウンタは、パケットの生成毎に1つずつインクリメントされるカウンタであってもよい。
【0098】
例えば、パケタイズ部105は、タイムスタンプを付与するためのクロックカウンタを有してもよい。クロックカウンタは、一定の周波数でカウントアップするカウンタであってもよい。
【0099】
なお、パケタイズ部105は、シーケンス番号及びタイムスタンプの双方をパケットに付与してもよい。このようなケースにおいて、タイムスタンプは、パケットの並び変えに用いられ、シーケンス番号は、パケットの欠損検知に用いられてもよい。
【0100】
第2実施形態では、既存の送信装置と比べて、送信装置100が重要度評価部104を有するが、重要度評価部104の処理遅延が小さいため、パケタイズ部105から出力されるパケットを構成するユニットの順序は、マルチレイヤ符号化部101でユニットを符号化(出力)する所定順序と同様であることに留意すべきである。すなわち、パケットに付与されるシーケンス番号及びタイムスタンプの少なくともいずれか1つを参照すれば、マルチレイヤ符号化部101でユニットを符号化(出力)する所定順序が入れ替わることがないことに留意すべきである。
【0101】
特に限定されるものではないが、パケタイズ部105は、1のユニットを分割して2以上のパケットに格納するフラグメント処理を実行してもよく、パケタイズ部105は、2以上のユニットを1つのパケットに格納するアグリゲーション処理を実行してもよい。
【0102】
送信部132は、送信部132と同様に、伝送路500を介して、パケタイズ部105によって生成されたパケットを送信する。具体的には、送信部132Aは、伝送路500Aを介して、パケタイズ部105Aによって生成されたパケットを送信する。送信部132Bは、伝送路500Bを介して、パケタイズ部105Bによって生成されたパケットを送信する。
【0103】
第2実施形態では、送信部132Aから送信されるパケットは、第1パケットと称されてもよい。第1パケットは、ベースレイヤを構成するユニット及び特定ユニットを含む。送信部132Bから送信されるパケットは、第2パケットと称されてもよい。第2パケットは、エンハンスメントレイヤを構成するユニットのうち、特定ユニット以外のユニットを含む。
【0104】
(2.2.2)受信装置の構成
図12は、第2実施形態に係る受信装置200の構成を示す図である。第2実施形態に係る受信装置200は、受信部201と、バッファ部203と、比較部205と、デパケタイズ部207と、マルチレイヤ復号部209と、を有する。
【0105】
受信部201は、伝送路500を介して、パケットを受信する。具体的には、受信部201Aは、伝送路500Aを介して、第1パケットを受信する。受信部201Bは、第2パケットを受信する。
【0106】
バッファ部203は、受信部201によって受信されたパケットを蓄積する。バッファ部203は、FIFO型のバッファ部であってもよい。バッファ部203は、伝送遅延の誤差を吸収するために用いられる。具体的には、バッファ部203Aは、受信部201Aによって受信された第1パケットを蓄積する。バッファ部203Bは、受信部201Bによって受信された第2パケットを蓄積する。
【0107】
比較部205は、バッファ部203に蓄積されるパケットに付与されるシーケンス番号及びタイムスタンプの少なくともいずれか1つに基づいて、バッファ部203に蓄積されるパケットの出力を指示する。
【0108】
例えば、比較部205は、バッファ部203Aに蓄積される第1パケット及びバッファ部203Bに蓄積される第2バッファ部のうち、シーケンス番号が小さい方のパケットの出力をバッファ部203A又はバッファ部203Bに指示してもよい。
【0109】
例えば、比較部205は、バッファ部203Aに蓄積される第1パケット及びバッファ部203Bに蓄積される第2バッファ部のうち、タイムスタンプが早い方のパケットの出力をバッファ部203A又はバッファ部203Bに指示してもよい。
【0110】
デパケタイズ部207は、バッファ部203から出力されるパケットをデパケット化してユニットを取り出す。具体的には、デパケタイズ部207は、バッファ部203Aに蓄積された第1パケットから、ベースレイヤを構成するユニット及びエンハンスメントレイヤを構成する特定ユニットを取り出す。デパケタイズ部207は、バッファ部203Bに蓄積された第2パケットから、エンハンスメントレイヤを構成する特定ユニット以外のユニットを取り出す。
【0111】
ここで、バッファ部203に蓄積されたパケットが比較部205によって指示された順序で指示されることから、デパケタイズ部207は、マルチレイヤ符号化部101と同様の所定順序でユニットを並び替え、マルチレイヤ符号化部101と同様の所定順序でユニットを出力する。
【0112】
第2実施形態では、バッファ部203に蓄積されたパケットが比較部205によって指示された順序で指示されることから、デパケタイズ部207は、各ユニットの内部を解析するまでもなく、マルチレイヤ符号化部101と同様の所定順序でユニットを出力できる。従って、ユニットの符号化/復号の方式に応じて、受信装置200の回路又はプログラムを変更する必要がないことに留意すべきである。
【0113】
マルチレイヤ復号部209は、マルチレイヤ符号化部101と同様の所定順序でデパケタイズ部207から出力されるユニットを復号する。
【0114】
第2実施形態では、受信部201Aによって受信されるパケットは、第1パケットと称されてもよい。第1パケットは、ベースレイヤを構成するユニット及び特定ユニットを含む。受信部201Bによって受信されるパケットは、第2パケットと称されてもよい。第2パケットは、エンハンスメントレイヤを構成するユニットのうち、特定ユニット以外のユニットを含む。
【0115】
(2.3)第2実施形態のまとめ
第2実施形態では、マルチレイヤ符号化部101は、ベースレイヤ及びベースレイヤを拡張するエンハンスメントレイヤを符号化する符号化部を構成する。送信部132Aは、第1伝送路(伝送路500A)を介して第1パケットを送信する第1送信部を構成する。送信部132Bは、第2伝送路(伝送路500B)を介して第2パケットを送信する第2送信部を構成する。重要度評価部104は、エンハンスメントレイヤを構成するユニットのうち、特定重要度を有する特定ユニットを第1伝送路(伝送路500A)に振り分け、特定ユニット以外のユニットを第2伝送路(伝送路500B)に振り分ける制御部を構成する。パケタイズ部105は、第1伝送路(伝送路500A)及び第2伝送路(伝送路500B)を介して送信されるパケットを生成するパケタイズ部を構成する。
【0116】
第2実施形態では、受信部201Aは、第1伝送路(伝送路500A)を介して第1パケットを受信する第1受信部を構成する。受信部201Bは、第2伝送路(伝送路500B)を介して第2パケットを受信する第2受信部を構成する。マルチレイヤ復号部209は、ベースレイヤ及びベースレイヤを拡張するエンハンスメントレイヤを復号する復号部を構成する。デパケタイズ部207は、第1パケット及び第2パケットに付与されたシーケンス番号及びタイムスタンプの少なくともいずれか1つに基づいて、第1パケット及び第2パケットを復号部に出力するデパケタイズ部を構成する。デパケタイズ部は、比較部205を含んでもよい。
【0117】
上述の第2実施形態では、伝送方式としてRTPについて主として説明した。しかしながら、上述の開示はこれに限定されるものではない。伝送方式としては、MMTを用いてもよい。MMTパケットのヘッダは、RTPと同様に、シーケンス番号及びタイムスタンプの少なくともいずれか1つを含んでもよい。
【0118】
第2実施形態では、送信装置100は、第1伝送路を介して、エンハンスメントレイヤを構成するユニットのうち、特定重要度を有する特定ユニットを送信する。このような構成によれば、エンハンスメントレイヤに対応する伝送路(すなわち、伝送路500B)の誤り発生率が一定である条件下においても、エンハンスメントレイヤを構成する特定ユニットに関する誤り発生率を伝送路500Aと同レベルに抑制することができ、エンハンスメントレイヤに関する再生品質を向上できる。
【0119】
第2実施形態では、受信装置200は、第1パケット及び第2パケットに付与されたシーケンス番号及びタイムスタンプの少なくともいずれか1つに基づいて、第1パケット及び第2パケットを復号部に出力する。このような構成によれば、エンハンスメントレイヤを構成する特定ユニットが伝送路500Aを介して受信される場合であっても、ベースレイヤ及びエンハンスメントレイヤを適切に復号できる。
【0120】
(2.4)第2実施形態の第1変更例
第2実施形態の第1変更例について説明する。以下においては、第2実施形態に対する相違点について主として説明する。
【0121】
第2実施形態では、伝送方式がRTPであるケースについて主として説明した。これに対して、第1変更例では、伝送方式がMMTであるケースについて説明する。
【0122】
第1に、第1変更例では、上述のシーケンス番号に代えて、パケットカウンタの値が用いられてもよい。言い換えると、シーケンス番号カウンタに代えて、パケットカウンタが用いられてもよい。
【0123】
具体的には、MMTでは、パケットカウンタは、2以上のパケットID(以下、PID)を通じてパケットをカウントアップするカウンタが用いられてもよい。
【0124】
このようなケースにおいて、送信装置100のパケタイズ部105は、マルチレイヤ符号化部101からユニットが出力される順序に基づいて、パケットカウンタの値をパケットに付与してもよい。受信装置200の比較部205は、バッファ部203Aに蓄積される第1パケット及びバッファ部203Bに蓄積される第2バッファ部のうち、パケットカウンタの値が小さい方のパケットの出力をバッファ部203A又はバッファ部203Bに指示してもよい。
【0125】
なお、第1変更例では、パケットカウンタの値とともにシーケンス番号が用いられてもよい。このようなケースにおいて、伝送路500毎にPIDが異なっており、PID毎にシーケンス番号がカウントされてもよい。シーケンス番号は、伝送路500毎のパケットの欠損検知に用いられてもよい。
【0126】
第2に、第1変更例では、上述のシーケンス番号に代えて、拡張カウンタの値が用いられてもよい。言い換えると、シーケンス番号カウンタに代えて、拡張カウンタが用いられてもよい。
【0127】
具体的には、MMTパケットの拡張ヘッダに拡張カウンタのフィールドが新たに定義されてもよい。拡張カウンタは、重要度評価部104の導入に伴うユニットの並び変えに専用で用いるカウンタである。
【0128】
このようなケースにおいて、送信装置100のパケタイズ部105は、マルチレイヤ符号化部101からユニットが出力される順序に基づいて、拡張カウンタの値をパケットに付与してもよい。受信装置200の比較部205は、バッファ部203Aに蓄積される第1パケット及びバッファ部203Bに蓄積される第2バッファ部のうち、拡張カウンタの値が小さい方のパケットの出力をバッファ部203A又はバッファ部203Bに指示してもよい。
【0129】
なお、第1変更例では、拡張カウンタの値とともにシーケンス番号が用いられてもよい。このようなケースにおいて、伝送路500毎にPIDが異なっており、PID毎にシーケンス番号がカウントされてもよい。シーケンス番号は、伝送路500毎のパケットの欠損検知に用いられてもよい。
【0130】
なお、第1変更例では、パケットカウンタフラグが”0”であるとして運用され、拡張カウンタの値とともにパケットカウンタの値が用いられなくてもよい。或いは、第1変更例では、パケットカウンタフラグが”1”であるとして運用され、拡張カウンタの値とともにパケットカウンタの値が他の用途に用いられてもよい。
【0131】
(2.5)第2実施形態の他の変更例
上述の第2実施形態では特に触れていないが、伝送方式としてRTPが用いられる場合に、MPEG-2 TS(Transport Stream)などの多重化方式を用いて、音声又は他のメディアコンポーネントと映像が多重化されてもよい。このようなケースにおいて、送信装置100のパケタイズ部105は、TS多重化機能を有しており、1つのユニットを2以上に分割してTSパケットに格納した上で、2以上のTSパケットを1つのパケットに格納してもよい。
【0132】
上述の第2実施形態では特に触れていないが、伝送方式としてMMTが用いられる場合に、ISOBMFF(ISO Base Media File Format)メタデータが用いられてもよい。このようなケースにおいて、送信装置100のパケタイズ部105は、ISOBMFFメタデータを生成する機能を有しており、ISOBMFFメタデータをMPUメタデータ又はMFUデータとしてMMTパケットに多重してもよい。
【0133】
ここで、ISOBMFFは、CMAF(Common Media Application Format)であってもよい。CMAFセグメント(チャンク)は、初期化セグメント及びメディアセグメントを含んでもよい。初期化セグメントは、復号機能の初期化に必要な大域的なメタデータ(”moov”)を含む。メディアセグメントは、短尺に区切られた映像のメディアデータ(”mdat”)及びそれに対応する局所的なメタデータ(”moof”)を含む。このようなケースにおいて、送信装置100の重要度評価部104は、ベースレイヤ及びエンハンスメントレイヤに共通する初期化セグメントのパラメータセットを含むユニットを特定ユニットとして伝送路500Aに振り分けてもよい。初期化セグメントは、MPUデータとしてMMTパケットに多重されてもよい。パラメータセットは、初期化セグメントのメタデータに含まれてもよく、メディアセグメントのメディアデータ(”mdat”)に含まれてもよい。
【0134】
上述の第2実施形態では特に触れていないが、シーケンス番号、パケットカウンタ及びタイムスタンプは、4バイト(32ビット)のフィールドであってもよい。4バイトのフィールドを符号なしの整数で扱うケースを想定すると、フィールドは、0~4294967295までの値を表現できる。シーケンス番号カウンタのオーバーフローが生じた場合には、シーケンス番号カウンタの値は0に戻る。クロックカウンタのオーバーフローが生じた場合には、クロックカウンタは0に近い値に戻る。このようなオーバーフローを想定して、32ビットよりも上位ビットの状態を仮想的に保持するなどの手法でオーバーフローを検知することによって、オーバーフローに伴う大小比較の誤りが抑制されてもよい。また、拡張カウンタは、4バイトのケース以外に、2バイト(16ビット)など、任意のフィールド長であってもよい。これらの場合も、同様の原理によりオーバーフローを検知して大小比較の誤りが抑制されてもよい。
【0135】
(3)その他の実施形態
上述の実施形態では、L0(ベースレイヤ)のビットストリームを伝送路500Aで伝送し、L1(エンハンスメントレイヤ)のビットストリームを伝送路500Bで伝送する一例を説明したが、これに限定されない。これらのビットストリームを同一の伝送路500で伝送する場合であっても、L1側のビットストリームのデータが欠落した場合に、欠落を検出して、差し替え用データに差し替えることで、復号処理を初期化することなく、復号処理を継続可能である。よって、L0(ベースレイヤ)のビットストリーム及びL1(エンハンスメントレイヤ)のビットストリームを同一の伝送路500で伝送してもよい。
【0136】
上述の実施形態では、符号化方式としてVVCについて主として例示した。しかしながら、上述の実施形態はこれに限定されるものではない。符号化方式としては、HEVC(High Efficiency Video Coding)のマルチレイヤ拡張が用いられてもよい。符号化方式としては、ユニットのヘッダによってレイヤを識別可能な方式が用いられてもよい。
【0137】
上述の実施形態では、2レイヤであるケースについて主として説明した。しかしながら、上述の実施形態はこれに限定されるものではない。上述の実施形態は、3以上のレイヤに適用されてもよい。このようなケースにおいて、レイヤの数に相当する数の送信手段、伝送路、及び受信手段が設けられてもよい。
【0138】
送信装置100又は受信装置200が行う各処理をコンピュータに実行させるプログラムが提供されてもよい。プログラムは、コンピュータ読取り可能媒体に記録されていてもよい。コンピュータ読取り可能媒体を用いれば、コンピュータにプログラムをインストールすることが可能である。ここで、プログラムが記録されたコンピュータ読取り可能媒体は、非一過性の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、CD-ROMやDVD-ROM等の記録媒体であってもよい。また、送信装置100又は受信装置200が行う各処理を実行する回路を集積化し、送信装置100又は受信装置200の少なくとも一部を半導体集積回路(チップセット、SoC)として構成してもよい。
【0139】
本開示で使用されている「に基づいて(based on)」、「に応じて(depending on/in response to)」という記載は、別段に明記されていない限り、「のみに基づいて」、「のみに応じて」を意味しない。「に基づいて」という記載は、「のみに基づいて」及び「に少なくとも部分的に基づいて」の両方を意味する。同様に、「に応じて」という記載は、「のみに応じて」及び「に少なくとも部分的に応じて」の両方を意味する。「含む(include)」、「備える(comprise)」、及びそれらの変形の用語は、列挙する項目のみを含むことを意味せず、列挙する項目のみを含んでもよいし、列挙する項目に加えてさらなる項目を含んでもよいことを意味する。また、本開示において使用されている用語「又は(or)」は、排他的論理和ではないことが意図される。さらに、本開示で使用されている「第1」、「第2」等の呼称を使用した要素へのいかなる参照も、それらの要素の量又は順序を全般的に限定するものではない。これらの呼称は、2つ以上の要素間を区別する便利な方法として本明細書で使用され得る。したがって、第1及び第2の要素への参照は、2つの要素のみがそこで採用され得ること、又は何らかの形で第1の要素が第2の要素に先行しなければならないことを意味しない。本開示において、例えば、英語でのa,an,及びtheのように、翻訳により冠詞が追加された場合、これらの冠詞は、文脈から明らかにそうではないことが示されていなければ、複数のものを含むものとする。
【0140】
以上、図面を参照して実施形態について詳しく説明したが、具体的な構成は上述のものに限られることはなく、要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。
【0141】
(4)付記
上述の実施形態の特徴に関して付記する。
【0142】
(4.1)付記1
上述の第1実施形態は、以下に示すように表現されてもよい。
【0143】
第1実施形態に係る第1の特徴は、マルチレイヤ符号化における第1レイヤのビットストリームを受信する第1受信手段と、前記第1レイヤよりも上位の第2レイヤのビットストリームを受信する第2受信手段と、前記第1レイヤのビットストリーム及び前記第2レイヤのビットストリームを結合する結合処理を行ってマルチレイヤビットストリームを出力する合成手段と、前記第2受信手段における受信状態について判定する判定手段と、を備え、前記結合手段は、前記第2レイヤのビットストリームの一部が欠損した旨を前記判定手段が判定した場合、当該欠損した部分のビットストリームに対して差し替え用データを差し替えたうえで前記結合処理を行う、受信装置である。
【0144】
第1実施形態に係る第2の特徴は、第1の特徴において、前記第2レイヤにおける前記差し替えに用いる前記差し替え用データを保持するメモリ手段をさらに備え、前記差し替え用データは、前記第1レイヤにおける復号映像を前記第2レイヤにおける表示解像度に拡大した予測画像を生成させる予測モード情報と、前記第2レイヤにおける各画像ブロックについて予測残差が含まれていないことを示す無残差情報と、を含む、受信装置である。
【0145】
第1実施形態に係る第3の特徴は、第1又は2の特徴において、前記第1受信手段及び前記第2受信手段のそれぞれは、フレーム単位でビットストリームの受信処理を行い、前記判定手段は、前記第2レイヤのビットストリームのうち前記欠損した部分に対応する欠損フレームを差し替えフレームとして判定し、前記結合手段は、前記差し替えフレームに対して前記差し替え用データを差し替えたうえで前記結合処理を行う、受信装置である。
【0146】
第1実施形態に係る第4の特徴は、第3の特徴において、前記判定手段は、前記欠損フレームと、前記欠損フレームを参照画像として用いるフレームと、を差し替えフレーム群として判定し、前記結合手段は、前記差し替えフレーム群を構成する各フレームに対して前記差し替え用データを差し替えたうえで前記結合処理を行う、受信装置である。
【0147】
第1実施形態に係る第5の特徴は、第1又は2の特徴において、前記第1受信手段及び前記第2受信手段のそれぞれは、複数のフレームをまとめたチャンク単位でビットストリームの受信処理を行い、前記判定手段は、前記第2レイヤのビットストリームのうち前記欠損した部分を含む欠損チャンクを差し替えチャンクとして判定し、前記結合手段は、前記差し替えチャンクに対して前記差し替え用データを差し替えたうえで前記結合処理を行う、受信装置である。
【0148】
第1実施形態に係る第6の特徴は、第5の特徴において、前記判定手段は、前記欠損チャンク内の各フレームと、前記欠損チャンク内のフレームを参照画像として用いるフレームと、を差し替えフレーム群として判定し、前記結合手段は、前記差し替えフレーム群を構成する各フレームに対して前記差し替え用データを差し替えたうえで前記結合処理を行う、受信装置である。
【0149】
第1実施形態に係る第7の特徴は、第1乃至第6の特徴のいずれかにおいて、前記第1レイヤのビットストリームは、第1伝送路を介して伝送され、前記第2レイヤのビットストリームは、前記第1伝送路と異なる第2伝送路を介して伝送される、受信装置である。
【0150】
第1実施形態に係る第8の特徴は、コンピュータを第1の特徴の受信装置として機能させる、プログラムである。
【0151】
(4.2)付記2
上述の第2実施形態は、以下に示すように表現されてもよい。
【0152】
第2実施形態に係る第1の特徴は、ベースレイヤ及び前記ベースレイヤを拡張するエンハンスメントレイヤを符号化する符号化部と、第1伝送路を介して第1パケットを送信する第1送信部と、第2伝送路を介して第2パケットを送信する第2送信部と、前記エンハンスメントレイヤを構成するユニットのうち、特定重要度を有する特定ユニットを前記第1伝送路に振り分け、前記特定ユニット以外のユニットを前記第2伝送路に振り分ける制御部と、を備え、前記第1パケットは、前記ベースレイヤを構成するユニット及び前記特定ユニットを含み、前記第2パケットは、前記エンハンスメントレイヤを構成するユニットのうち、前記特定ユニット以外のユニットを含む、送信装置である。
【0153】
第2実施形態に係る第2の特徴は、第1の特徴において、前記制御部は、パラメータセットを含むユニットを前記特定ユニットとして前記第1伝送路に振り分ける、送信装置である。
【0154】
第2実施形態に係る第3の特徴は、第1の特徴又は第2の特徴において、前記制御部は、先頭ピクチャを構成するユニットを前記特定ユニットとして前記第1伝送路に振り分ける、送信装置である。
【0155】
第2実施形態に係る第4の特徴は、第1の特徴乃至第3の特徴のいずれか1つにおいて、前記制御部は、他のピクチャから参照されないピクチャを構成するユニットを前記特定ユニット以外のユニットとして前記第2伝送路に振り分ける、送信装置である。
【0156】
第2実施形態に係る第5の特徴は、第1の特徴乃至第4の特徴のいずれか1つにおいて、前記第1伝送路及び前記第2伝送路を介して送信されるパケットを生成するパケタイズ部を備え、前記パケタイズ部は、前記符号化部からユニットが出力される順序に基づいて、シーケンス番号、パケットカウンタの値、拡張カウンタの値及びタイムスタンプの少なくともいずれか1つを前記パケットに付与する、送信装置である。
【0157】
第2実施形態に係る第6の特徴は、第1伝送路を介して受信する第1パケットを蓄積する第1バッファ部と、第2伝送路を介して受信する第2パケットを蓄積する第2バッファ部と、ベースレイヤ及び前記ベースレイヤを拡張するエンハンスメントレイヤを復号する復号部と、前記第1パケット及び前記第2パケットに付与されたシーケンス番号、パケットカウンタの値、拡張カウンタの値及びタイムスタンプの少なくともいずれか1つに基づいて、前記第1パケット及び前記第2パケットを前記復号部に出力するデパケタイズ部と、を備え、前記シーケンス番号、パケットカウンタの値、拡張カウンタの値及び前記タイムスタンプの少なくともいずれか1つは、符号化部からユニットが出力される順序に基づいて付与され、前記第1パケットは、前記ベースレイヤを構成するユニットに加えて、前記エンハンスメントレイヤを構成するユニットのうち、特定重要度を有する特定ユニットを含み、前記第2パケットは、前記エンハンスメントレイヤを構成するユニットのうち、前記特定ユニット以外のユニットを含む、受信装置である。
【0158】
第2実施形態に係る第7の特徴は、第6の特徴において、前記第1パケットは、前記エンハンスメントレイヤを構成するパケットのうち、パラメータセットを含むユニットを含む、受信装置である。
【0159】
第2実施形態に係る第8の特徴は、第6の特徴又は第7の特徴において、前記第1パケットは、前記エンハンスメントレイヤを構成するパケットのうち、先頭ピクチャを構成するユニットを含む、受信装置である。
【0160】
第2実施形態に係る第9の特徴は、第6の特徴乃至第8の特徴の少なくともいずれか1つにおいて、前記第2パケットは、記エンハンスメントレイヤを構成するパケットのうち、他のピクチャから参照されないピクチャを構成するユニットを含む、受信装置である。
【符号の説明】
【0161】
10 :伝送システム
100 :送信装置
101 :マルチレイヤ符号化部
103 :レイヤID分離部
104 :重要度評価部
105 :パケタイズ部
110 :マルチレイヤ符号化部
120 :レイヤ分離部
130 :送信手段
131 :パケタイズ部
132 :送信部
200 :受信装置
201 :受信部
203 :バッファ部
205 :比較部
207 :デパケタイズ部
209 :マルチレイヤ復号部
210 :受信手段
211 :受信部
212 :デパケタイズ部
213 :バッファ部
220 :レイヤ結合部
230 :メモリ部
240 :受信状態判定部
250 :マルチレイヤ復号部
500 :伝送路