特許第5993453号(P5993453)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ テレフオンアクチーボラゲット エル エム エリクソン(パブル)の特許一覧

特許5993453クリーンランダムアクセス画像に最下レイヤ識別情報を割り当てるための符号器およびその方法
<>
  • 特許5993453-クリーンランダムアクセス画像に最下レイヤ識別情報を割り当てるための符号器およびその方法 図000005
  • 特許5993453-クリーンランダムアクセス画像に最下レイヤ識別情報を割り当てるための符号器およびその方法 図000006
  • 特許5993453-クリーンランダムアクセス画像に最下レイヤ識別情報を割り当てるための符号器およびその方法 図000007
  • 特許5993453-クリーンランダムアクセス画像に最下レイヤ識別情報を割り当てるための符号器およびその方法 図000008
  • 特許5993453-クリーンランダムアクセス画像に最下レイヤ識別情報を割り当てるための符号器およびその方法 図000009
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5993453
(24)【登録日】2016年8月26日
(45)【発行日】2016年9月14日
(54)【発明の名称】クリーンランダムアクセス画像に最下レイヤ識別情報を割り当てるための符号器およびその方法
(51)【国際特許分類】
   H04N 19/105 20140101AFI20160901BHJP
   H04N 19/31 20140101ALI20160901BHJP
【FI】
   H04N19/105
   H04N19/31
【請求項の数】14
【全頁数】15
(21)【出願番号】特願2014-520163(P2014-520163)
(86)(22)【出願日】2012年6月26日
(65)【公表番号】特表2014-526180(P2014-526180A)
(43)【公表日】2014年10月2日
(86)【国際出願番号】SE2012050712
(87)【国際公開番号】WO2013012372
(87)【国際公開日】20130124
【審査請求日】2015年5月26日
(31)【優先権主張番号】61/508,179
(32)【優先日】2011年7月15日
(33)【優先権主張国】US
(73)【特許権者】
【識別番号】598036300
【氏名又は名称】テレフオンアクチーボラゲット エルエム エリクソン(パブル)
(74)【代理人】
【識別番号】100109726
【弁理士】
【氏名又は名称】園田 吉隆
(74)【代理人】
【識別番号】100101199
【弁理士】
【氏名又は名称】小林 義教
(72)【発明者】
【氏名】フェーバリ, リキャルド
(72)【発明者】
【氏名】サムエルソン, ヨナタン
【審査官】 堀井 啓明
(56)【参考文献】
【文献】 米国特許出願公開第2008/0267287(US,A1)
【文献】 特表2014−511652(JP,A)
【文献】 Heiko SCHWARZ,et.al.,Defect report for ITU-T Rec.H.264|ISO/IEC 14496-10(revision 3),31ST JVT MEETING (DOCUMENT: JVT-AE011R3),米国,JVT,2009年 7月 5日,JVT-AE011r3,P.1-P.22
(58)【調査した分野】(Int.Cl.,DB名)
H04N19/00−19/98
(57)【特許請求の範囲】
【請求項1】
動画ストリームの画像を符号化する方法であって、
クリーンランダムアクセス(CRA)画像として符号化される画像にレイヤ識別子を割り当てるステップ(301)を含み、CRA画像が自己完結型であり参照画像に依存せずに復号化され、復号化順序および出力順序の両方で一つのCRA画像に後続するすべての符号化画像が、前記CRA画像に先行する任意の画像に基づくインター予測を使用することができず、記レイヤ識別子は最下レイヤ識別情報に設定される、方法。
【請求項2】
画像のレイヤ識別子が最下レイヤ識別情報であるときは、前記画像はCRA画像である、請求項1に記載の方法。
【請求項3】
号器、スライスヘッダ、NALユニットヘッダ、および動画ペイロードを含むネットワーク抽出レイヤ(NAL)ユニットを出力し、前記画像がCRA画像であるかどうかを示す情報と、レイヤ識別子情報とが、前記NALユニットヘッダ中に含まれて送信される、請求項1または2に記載の方法。
【請求項4】
前記符号器がHEVC符号器である、請求項に記載の方法。
【請求項5】
前記レイヤ識別子が時間識別子である、請求項1から4のいずれか一項に記載の方法。
【請求項6】
前記符号器がマルチビュー符号器である、請求項に記載の方法。
【請求項7】
前記レイヤ識別子がビュー識別子である、請求項6に記載の方法。
【請求項8】
動画ストリームの画像を符号化するための符号器(500)であって、クリーンランダムアクセス(CRA)画像として符号化される画像にレイヤ識別子をり当てるプロセッサ(501)を備え、CRA画像が自己完結型であり参照画像に依存せずに復号化され、復号化順序および出力順序の両方で一つのCRA画像に後続するすべての符号化画像は、出力順序で前記CRA画像に先行する任意の画像に基づくインター予測を使用することができず、前記プロセッサ(501)は前記レイヤ識別子を最下レイヤ識別情報に設定するよう構成される、符号器。
【請求項9】
画像のレイヤ識別子が最下レイヤ識別情報であるときは、前記画像はCRA画像である、請求項8に記載の符号器。
【請求項10】
前記符号器は、スライスヘッダ、NALユニットヘッダ、および動画ペイロードを含むネットワーク抽出レイヤ(NAL)ユニットを出力するように構成され、前記画像がCRA画像であるかどうかを示す情報と、レイヤ識別子情報とが、前記NALユニットヘッダ中に含まれて送信される、請求項8または9に記載の符号器。
【請求項11】
前記符号器がHEVC符号器である、請求項8から10のいずれか一項に記載の符号器。
【請求項12】
前記レイヤ識別子が時間識別子である、請求項8から11のいずれか一項に記載の符号器。
【請求項13】
前記符号器がマルチビュー符号器である、請求項8から10のいずれか一項に記載の符号器。
【請求項14】
前記レイヤ識別子がビュー識別子である、請求項13に記載の符号器。
【発明の詳細な説明】
【背景技術】
【0001】
H.264は、Moving Picture Experts Group−4(MPEG−4)Advanced Video Coding (AVC)とも称される動画像符号化方式である。時間的予測および空間的予測を利用するブロックベースのハイブリッド動画符号化方式からなる。
【0002】
高効率動画符号化(HEVC)は、Joint Collaborative Team−Video Coding(JCT−VC)で現在開発されている新しい動画符号化規格である。JCT−VCは、MPEGと国際電気通信連合電気通信標準化セクタ(ITU−T)との共同プロジェクトである。現在、作業原案(WD)が、大きなマクロブロック(最大符号化単位(Largest Coding Unit)をLCUと略す)と多数の他の新しいツールとを備えるように定義され、H.264/AVCよりも有効である。
【0003】
動画伝送では、受信器の復号器は、画像を表すビットストリーム、すなわち、圧縮データの動画データパケットを受信する。圧縮データは、ペイロードおよび制御情報を備える。制御情報は、例えば、どの参照画像を参照画像バッファ内に格納すべきかについての情報を備える。この情報は、以前に受信した画像に対する相対参照(relative reference)である。さらに、復号器は、受信したビットストリームを復号化し、復号化した画像を表示する。さらに、復号化した画像は、制御情報に従い、参照画像バッファに格納される。これらの格納された参照画像は、後続の画像を復号化する場合に、復号器によって使用される。
【0004】
H.264/AVCで設計されるような受信器で実行される方式の簡易フローチャートを図1に示す。画像が実際に復号化される前に、スライスヘッダ内のframe_numが100でパースされ、シーケンスパラメータセット(SPS:Sequence Parameter Set)構文要素gaps_in_frame_num_value_allowed_flagが1である場合、110でframe_numにおいて起こり得るギャップを検出する。frame_numは、復号化順序を示す。frame_numにおけるギャップが検出された場合、「存在しない」フレームが120および130で作り出され、復号画像バッファ(DPB:Decoded Picture Buffer)とも称される参照画像バッファに挿入される。その場合、スライディングウィンドウ処理およびバンピング処理が適用される。
【0005】
frame_num内にギャップがあろうとなかろうと、次のステップは、現在の画像を160で実際に復号化することである。170で、画像のスライスヘッダが、メモリ管理制御操作(MMCO:Memory Management Control Operation)コマンドを含む場合、参照画像バッファに格納される画像に対する相対参照を取得するために画像を復号化した後、適応メモリ管理制御処理(adaptive memory control process)が180で適用され、そうでない場合、参照画像バッファに格納される画像に対する相対参照を取得するために、スライディングウィンドウ処理が190で適用される。最終ステップとして、「バンピング」処理が200で適用され、正しい順序で画像を送出する。
【0006】
HEVCはまた、画像が属する時間レイヤに対応する、各画像に対するtemporal_idを定義する。temporal_id tIdAを有する画像Aは、temporal_id tIdBがtIdAよりも高い場合の参照として、tIdBを有する画像Bを使用することができない。
【0007】
さらに、HEVCは、時間レイヤ交換点の概念を備える。時間レイヤ交換点は、交換点より前のより高い時間レイヤからの画像が復号化されなかった場合でさえも、より高い時間レイヤからの画像の復号化を開始することが可能である、符号化されたビットストリーム内の画像である。このことは、時間レイヤ交換点が復号化された場合、「予測には不使用」としてより高い時間レイヤ内のすべての画像をマーキングすることによって、HEVCで実現される。したがって、時間レイヤ交換点とは、符号器が制御情報を送信して、予測には不使用としてより高い画像をマーキングすることを符号器から復号器に対して保証する。時間レイヤ交換点に関連する復号器の動作はない。
【0008】
HEVC作業原案は、クリーンランダムアクセス(CRA:clean random access)アクセスユニットを含む。クリーンランダムアクセス(CRA)アクセスユニットとは、符号化画像がCRA画像であるアクセスユニットである。CRA画像はまた、クリーン復号リフレッシュ(CDR:Clean Decoding Refresh)画像または遅延復号リフレッシュ(DDR:Deferred Decoding Refresh)画像と称される可能性もあることに留意されたい。さらに、クリーンランダムアクセス(CRA)画像は、すべてのブロックに対してイントラ予測を使用する自己完結型符号化画像であり、それにより、CRA画像は、参照画像に依存することなく復号化されるのに十分な情報を備える。CRA画像は、対応するネットワークアダプションレイヤ(NAL:Network Adaptation Layer)ユニット種類を有するHEVCに導入される新しい画像種類である。CRA画像は、復号器が正確にCRA画像、および復号化順序と表示順序の両方でCRA画像に続くすべての画像の復号化を開始することを可能にする、ビットストリーム内のポイントを示すために使用される、ランダムアクセスポイントである。
【0009】
画像がCRA画像として符号化された場合、標準の復号器動作を、CRA画像である画像の検出に対して実行しないことが提案される。前述のように、時間レイヤ交換点とは、符号器が制御情報を送信して、予測には不使用としてより高い画像をマーキングすることを符号器から復号器に対して保証する。
【0010】
各CRAは、独自のNALユニット種類を有し、各NALユニットは、時間識別子などのレイヤ識別子と関連づけられる。レイヤ識別情報Aを有するNALユニットは、A<Bである場合、レイヤ識別情報Bを有するNALユニットを参照のために使用しない可能性がある。
【発明の概要】
【発明が解決しようとする課題】
【0011】
本文では、表示順序は、表示順序に関連した値を扱う可変画像順序カウント(POC:Picture Order Count)によって示され、復号化順序は、可変復号化順序によって示されることに留意されたい。CRA画像Aが、frame_num fA、POC pAおよびtemporal_id tIdAを有する符号器で符号化される場合、復号器は、frame_num fB>fAおよびPOC pB>pAである第1の画像Bを復号化する前に、A以外のすべての参照画像を「参照には不使用」としてマーキングする。temporal_id tIdC<tIdA、frame_num fC>fAおよびPOC pC>pAを満たす第1の画像Cが復号化される場合、参照に使用可能な参照画像は存在しない。これは、Cより高いtemporal_idを有しており、さらにtIdC以下のtemporal_idを有する他のすべての画像が、Bが復号化される前に、「予測には不使用」のマーキングをされているため、Aを使用することができないためである。この例におけるBは、Cと同じ画像であるか、または、tIdA以上のtemporal_idを有する他の画像である可能性がある。
【0012】
Cが予測のために使用可能な画像を有しないため、イントラ予測のみを使用して符号化しなければならず、したがって、非常にコストがかかる。
【0013】
したがって、上記の問題を解決することが望まれる。
【課題を解決するための手段】
【0014】
上記の問題は、CRA画像、またはランダムアクセスポイントとして識別可能な対応する自己完結型画像が最下レイヤに属さなければならない、という要件をビットストリームに課すことによって解決される。自己完結型画像は、本明細書では、参照画像を使用することなく復号化可能である画像を意味する。しかしながら、自己完結型画像は、復号化するための情報をすべて備える必要はない。自己完結型画像はまた、イントラ画像とも称される可能性がある。
【0015】
時間レイヤ構造に対し、このことは、CDR NALに設定されたNALユニット種類を有するどんなNALユニットも、temporal_id=0となる可能性があることを意味する。
【0016】
したがって、本発明の実施形態の第1の態様によれば、動画ストリームの画像を符号化する方法が提供される。前記方法では、レイヤ識別子は、自己完結型であり、一種のランダムアクセスポイント画像として識別可能である画像に割り当てられ、復号化順序ならびに出力順序の両方でその種類のランダムアクセスポイント画像に続くすべての符号化画像は、出力順序で前記種類のランダムアクセスポイント画像に先行するどんな画像に基づくインター予測も使用することができない。ここでは、レイヤ識別子は、最下レイヤ識別情報に設定される。
【0017】
したがって、本発明の実施形態の第2の態様によれば、動画ストリームの画像を符号化する符号器が提供される。前記符号器は、自己完結型であり、さらに一種のランダムアクセスポイント画像として識別可能である画像にレイヤ識別子を割り当てるためのプロセッサを備え、ランダムアクセスポイント画像に対し、復号化順序および出力順序の両方でその種類のランダムアクセスポイント画像に続くすべての符号化画像が、出力順序で前記種類のランダムアクセスポイント画像に先行する任意の画像に基づくインター予測を使用することができず、プロセッサは、最下レイヤ識別情報に設定されるレイヤ識別子を設定するよう構成される。
【0018】
本発明の実施形態を用いる利点は、CDR画像の使用をよりクリアにするという要件をビットストリームに課すことである。実施形態はまた、予測のために利用可能な参照画像が存在するので、CDR画像に続く他の画像をイントラ予測のみを使用して符号化する必要がなくなるため、動画シーケンスを符号化するために必要なビットレートを減らすことができる。
【図面の簡単な説明】
【0019】
図1】先行技術によるH.264/AVC参照バッファ方式の簡易フローチャートである。
図2】先行技術による2つの時間レイヤを有する符号化構造の一例である。
図3】一実施形態による符号器によって実行される方法のフローチャートである。
図4】一実施形態による画像の符号化表現である。
図5】本発明の実施形態による符号器の模式図である。
【発明を実施するための形態】
【0020】
図面全体を通して、同じ参照番号は、同様または対応する要素に対して使用される。
【0021】
本実施形態は、一般に、動画ストリームの、本技術ではフレームとも称される画像の符号化に関し、さらに、特に、実施形態は、CRA画像とも称されるIスライスのみを含む自己完結型画像の管理に関する。CRA画像は、一種のランダムアクセスポイント画像として識別可能であり、復号化順序ならびに出力順序の両方でその種類のランダムアクセスポイント画像に続くすべての符号化画像は、出力順序でその種類のランダムアクセスポイント画像に先行するどんな画像に基づくインター予測も使用することができない。
【0022】
H.264/MPEG−4AVCおよびHEVCによって表されるような動画符号化は、予測または基準として参照画像を使用して、現在の画像のピクセルデータを符号化および復号化する。このことは、一般に、インター符号化と称され、画像は、そのような参照画像を基準として符号化および復号化される。それにより、符号化画像を復号化することを可能にするために、復号器は、どの参照画像を現在の符号化画像に対して使用するかを認識する必要があり、これらの参照画像にアクセスする必要がある。
【0023】
動画符号化および復号化は、スケーラブルまたはレイヤ状に行うことができる。例えば、時間スケーラビリティは、サブシーケンスの定義、SVCにおけるtemporal_idの使用、および「存在しない」フレームの挿入を通じてH.264/MPEG−4AVCおよびスケーラブル映像符号化(SVC:Scalable Video Coding)でサポートされる。しかしながら、時間スケーラビリティをサポートするために、より高い時間レイヤ内の画像は、メモリ管理制御操作(MMCO)を使用する場合に制限される。符号器は、1つの時間レイヤ内のMMCOが、時間レイヤが欠落し、「存在しない」画像が挿入され、スライディングウィンドウ処理が適用された場合に比較されるさまざまなより下の時間レイヤの画像に影響しないことを確実にする役割を担う。
【0024】
このことは、符号化構造の選択および参照画像の使用時に符号器に制限を課す。例えば、図2の例を考える。参照画像バッファ内の参照フレームの最大数(max_num_ref_frames)は、各画像がインター予測のために2つの参照画像のみを使用するにもかかわらず、3であるとする。これは、各画像が、次の画像によるインター予測のために使用される他の時間レイヤから1つの余分な画像を保持しなければならないからである。
【0025】
画像POC=4を復号化する場合に利用可能な画像POC=0および画像POC=2を有するために、画像POC=3は、利用不可能なものとしてコマンドマーキング画像1をマーキングする明確な参照画像を有する必要があるc。
【0026】
しかしながら、時間レイヤ1が、(例えば、ネットワークノードによって)除去された場合、すべての奇数番号のframe_numにギャップが生じる。「存在しない」画像がこれらの画像に対して作られ、スライディングウィンドウ処理が適用されるであろう。それにより、利用不可能なものとして画像POC=0をマーキングする「存在しない」画像POC=3を有することになる。したがって、画像POC=4を復号化する場合、予測のために利用することができない。符号器は、この2つの場合に対して復号化処理を同じにすることができないため、すべての画像が復号化される場合、および最下レイヤのみが復号化される場合、図2の符号化構造例は、先行技術による時間スケーラビリティに対して使用することができない。
【0027】
複数のレイヤにグループ化された画像を有するスケーラブル動画ストリームの場合では、画像識別子および時間レイヤ情報により、参照画像が属する複数のレイヤの1レイヤを識別することが提供される。バッファ記述情報とも称される参照画像セットは、その場合、参照画像の少なくとも1つの画像識別子および時間レイヤ情報に基づいて生成される。このことは、参照画像セットが、参照画像の少なくとも1つの画像識別子および時間レイヤ情報を定義することを意味する。
【0028】
例えば、temporal_idなどの時間レイヤ情報は、参照画像セットを含むバッファ記述内の各画像に対して含まれ、temporal_idの通知を行うために上限(log2(max_temporal_layers_minus1))ビットを使用して通知される。時間スケーラビリティは、本実施形態を適用可能なマルチレイヤ動画の単なる一例である。他の種類にはマルチビュー動画があり、各画像が画像識別子およびビュー識別子を有する。
【0029】
さらに、上記のように、CRA画像の現在の定義は、temporal_idに対する制限または規則を含まない。
【0030】
CRA画像Aが、frame_num fA、POC pAおよびtemporal_id tIdAを有する符号器で符号化される場合、符号器は復号器に対し、復号器が、frame_num fB>fAおよびPOC pB>pAである第1の画像Bを復号化する前に、A以外のすべての参照画像を「参照には不使用」としてマーキングするよう通知する。temporal_id tIdC<tIdA、frame_num fC>fAおよびPOC pC>pAを満たす第1の画像Cが復号化される場合、参照に使用可能な参照画像は存在しない。これは、Cより高いtemporal_idを有しており、さらにtIdC以下のtemporal_idを有する他のすべての画像が、Bが復号化される前に、「予測には不使用」のマーキングをされているため、Aを使用することができないためである。(この例におけるBは、Cと同じ画像であるか、または、tIdA以上のtemporal_idを有する他の画像である可能性がある)。
【0031】
Cが予測のために使用可能な画像を有しないため、イントラ予測のみを使用して符号化しなければならず、したがって、非常にコストがかかる。
【0032】
上記の問題は、ビットストリームに、CRA画像が最下レイヤに属さなければならないという要件を課すことによって解決される。
【0033】
したがって、符号器によって実行される方法は、図3のフローチャートに描かれるように提供される。本方法では、動画ストリームの画像は符号化される。画像が、自己完結型であり、一種のランダムアクセスポイント画像(RAP)として識別可能であり、復号化順序ならびに出力順序の両方でその種類のランダムアクセスポイント画像に続くすべての符号化画像が300で出力順序で前記種類のランダムアクセスポイント画像に先行するどんな画像に基づくインター予測も使用することができない場合、レイヤ識別子は、画像に301で割り当てられ、ここでは、レイヤ識別子は、最下レイヤ識別情報、例えば、0に設定される。他の画像には、302で、レイヤが除去され、画像を復号化することをそれでも可能とする他の規則に従って、レイヤ識別子を割り当てることができる。これらの他の規則は、本発明の実施形態の範囲内ではない。
【0034】
画像がCRA画像として符号化されたかどうかを示す情報は、図4で示すようにNALユニットヘッダで搬送することができ、レイヤ識別子情報もまた、NALユニットヘッダで搬送することができる。NALユニットヘッダは、符号器から復号器へ送信される制御情報の一種である。したがって、図4は、画像の符号化表現60の一例を示す。符号化表現60は、スライス内のピクセルブロックの符号化ピクセルデータを表す動画ペイロードデータを備える。符号化表現60はまた、制御情報を搬送するスライスヘッダ65を備える。スライスヘッダ65は、動画ペイロード、およびネットワーク抽出レイヤ(NAL:Network Abstraction Layer)ヘッダ64と共に符号器から出力される要素であるNALユニットを形成する。これに対し、リアルタイムトランスポートプロトコル(RTP:Real−time Transport Protocol)ヘッダ63、ユーザデータグラムプロトコル(UDP:User Datagram Protocol)ヘッダ62およびインターネットプロトコル(IP:Internet Protocol)ヘッダ61といったNALユニット追加ヘッダを、符号器から復号器に送信することができるデータパケットを形成するために追加することができる。
【0035】
Iスライスのみを含む自己完結型画像であるCRA画像は、nal_unit_type=4であるCRA画像のスライスのNALユニットを符号化することによってCRA画像として識別することができる。したがって、復号化順序および出力順序の両方でCRA画像に続くすべての符号化画像は、復号化順序または出力順序のいずれかでCRA画像に先行するどんな画像に基づくインター予測も使用するべきではなく、復号化順序でCRA画像に先行するどんな画像も、出力順序でCRA画像に先行する。
【0036】
CRAアクセスユニットは、符号化画像がCRA画像であるアクセスユニットとして定義することができる。(アクセスユニットは、画像を含み、さらに、SEIまたはパラメータセットNALユニットなどの非画像NALユニットを含むこともできる)。したがって、CRA画像は、すべてのブロックに対してイントラ予測を使用する符号化画像であり、ランダムアクセスポイントとして識別可能であり、各スライスがnal_unit_type=4を有することができる。復号化順序および出力順序の両方でCRA画像に続くすべての符号化画像は、復号化順序または出力順序のいずれかでCRA画像に先行するどんな画像に基づくインター予測も使用するべきではなく、復号化順序でCRA画像に先行するどんな画像も、出力順序でCRA画像に先行する。
【0037】
以下の表は、NALユニット種類コードおよびNALユニット種類クラスを示す。
【0038】
これに応じて、nal_unit_type=4で示された画像は、本明細書において、CRA画像と称される。特定の画像のスライスを含むNALユニットに対して、nal_unit_typeの値が4である場合、その特定の画像のVCL NALユニットのすべては、nal_unit_type=4を有する。
【0039】
一実施形態によれば、temporal_idまたはlayer_idと称されるパラメータは、NALユニットのレイヤ識別情報を示し、temporal_idは、NALユニットに対する時間識別子を特定する。temporal_idの値は、アクセスユニットの全NALユニットに対して同じにしなければならない。アクセスユニットが、nal_unit_type=4を有する任意のNALユニットを含む場合、アクセスユニットの全NALユニットに対するtemporal_idは、0に等しくしなければならない。さらに、IDR画像として識別される5のnal_unit_typeを有する任意のNALユニットを含むアクセスユニットは、temporal_id=0であるべきである。しかしながら、nal_unit_type=5を有するアクセスユニットは、復号器を「リセットする」IDR画像を含む。IDR画像、および復号化順序でそれに続くすべては、復号化順序でIDR画像に先行するデータ無しに正確に復号化することができる(すなわち、参照のための画像を使用しない)。したがって、IDR画像とCRA画像との差は、異なるNALユニット種類であり、参照画像バッファが空であることをIDR画像が受け取り、したがって、IDR画像には参照画像セットがない場合、IDR画像はPOC=0である。さらに、復号化順序および出力順序でIDR画像に続く画像は、復号化順序でIDR画像に続く参照画像である可能性があるが、出力順序で進む。それは、CRA画像に対しては不可能である。上記の表によれば、nal_unit_typeが3に等しい場合、時間レイヤアクセス(TLA:Temporal Layer Access)画像であることを意味し、temporal_idが0であってはならない。
【0040】
前述のように、符号器は、CRA画像として符号化されたすべての画像が、layer_id=0とされ、ビットストリーム要件を確実に満たすように構成される。
【0041】
「予測には不使用」という画像のマーキングは、復号化順序および表示順序でCRA画像に続く第1の画像を復号化する前には実行されない可能性がある。代わりに、「予測には不使用」という画像のマーキングは、復号化順序および表示順序でCRA画像に続く第1の画像を復号化した後に復号器によって実行され、復号化順序および表示順序でCRA画像に続く第1の画像は、参照のためにCRA画像のみを使用するという追加の規則がある。このマーキングは、符号器および復号器の両方によって実行され、これは、符号器が内部復号器を有し、符号器が送信したビットストリームについて復号器が行ったことを追跡するためであることに留意されたい。
【0042】
CRA画像に対して現在使用されているNALユニット種類の解釈は変更することができ、その結果、そのNALのlayer_idがゼロになった場合にCRA画像のみを示すことにも留意されたい。CRA画像に対して現在使用されているNALユニット種類の解釈が変更され、その結果、layer_idがゼロになった場合にCRA画像のみを示した場合、CRAを定義するために現在使用されているNALユニット種類は、layer_idがゼロより大きい場合に、レイヤ交換点を示すことができる。この場合、復号器は、これらの構文要素の両方をパースし、画像がCRA画像であるかどうかを推定しなければならず、さらに復号器は、これらの要素両方をパースし、画像がレイヤ交換点を構成するかどうかを推定しなければならない。layer_idがCRA画像に対して0ではないことを復号器が検出した場合、復号器は、ビットストリームが有効ではないことを検出する。その場合、復号器は、ビットストリームが無効であることを隠す、または報告することができる。あるいは、復号器は、その画像を非CRA画像として扱い、復号化を続けることができる。
【0043】
代替として、CRA指示、すなわち、画像がCRA画像であるとNALユニット種類が示すことは、復号器について規範的効果を有しない。代わりに、CRA指示は符号器によって使用されて、復号器またはネットワークノードに対し、復号化順序および表示順序でCRA画像に続く画像は、符号化順序または表示順序でCRA画像に先行する基準のための参照画像を使用しないことを示す。
【0044】
さらに、符号器および復号器は、HEVC符号器および各HEVC復号器とすることができるが、本実施形態は、HEVCコーデックおよび/またはNALユニットに限定されないことに留意されたい。通知は、NALユニットヘッダを介して行われることに限定されないが、スライスヘッダ、スライスパラメータセット、画像ヘッダ、または画像パラメータセットを含むがこれらに限定されない、任意の適切なデータ構造で行うことができる。
【0045】
本発明の代替実施形態において、動画コーデックは、時間レイヤ動画コーデックであり、上記layer_idは、temporal_idによって置き換えられ、レイヤ交換点は時間レイヤ交換点である。
【0046】
本発明のさらなる代替実施形態では、動画コーデックは、マルチビューコーデックであり、view_idは、上記において、layer_idと置き換わる。それに対応して、レイヤは、ビューによって置き換えられる。
【0047】
同様に、本実施形態は、任意のレイヤ化された動画符号化スキーム、例えば、これらに限定されないが、空間スケーラビリティ、SNRスケーラビリティ、ビット深度スケーラビリティ、およびクロマフォーマットスケーラビリティに適用することができる。ここでの画像は、バッファ記述における構文要素を通じてレイヤと関連づけられ、レイヤは並べられ、レイヤがより高いレイヤに属する画像を認識しないという特性を有する。レイヤの組合せは、上記のlayer_idが、すべてのレイヤ化されたID(例えば、temporal_idおよびview_id)が画像に対するレイヤの種類に対して最下レイヤを示す場合に、ゼロに設定された変数によって置き換えられることを意味する。
【0048】
図5は、例えば、上記の機能を実行するよう構成されたビデオカメラの符号器500を示す。
【0049】
図5の符号器500は、符号化対象のビットストリーム506を受け取るよう構成された入力部501を備える。符号器のプロセッサ502は、300で、自己完結型であり、さらに一種のランダムアクセスポイント画像(例えば、NALユニット種類=4)として識別可能である画像にレイヤ識別子を割り当てるよう構成され、ランダムアクセスポイント画像に対し、復号化順序および出力順序の両方でその種類のランダムアクセスポイント画像に続くすべての符号化画像が、出力順序で前記種類のランダムアクセスポイント画像に先行する任意の画像に基づくインター予測を使用することができず、301で、レイヤ識別子が画像に割り当てられ、プロセッサは、最下レイヤ識別情報にレイヤ識別子を設定するよう構成される。さらに、符号器500は、符号化ビットストリーム505を出力するよう構成された出力部503を備える。符号器はまた、参照画像セットの情報などの符号化処理で使用される情報を格納するメモリ504を備えることもできる。さらに、例えば、ビデオカメラ内の復号器はまた、符号器と関連づけることができ、符号器は、符号器が送信したビットストリームについて復号器が行ったことを追跡することができる。
【0050】
一実施形態によれば、プロセッサは、すべてのブロックに対してイントラ予測で符号化された、すなわち、自己完結型、およびCRA画像としてランダムアクセスポイントとして識別可能な画像を符号化するよう構成することができる。
【0051】
符号器は、スライスヘッダ、NALユニットヘッダ、および動画ペイロードを含むNALユニットと、画像がCRA画像であるかどうかを示す情報とを出力し、NALユニットヘッダにレイヤ識別子挿入するよう構成することができ、
【0052】
一実施形態によれば、符号器は、FIEVC符号器であり、レイヤ識別子は、時間識別子である。代替実施形態によれば、符号器は、マルチビュー符号器であり、レイヤ識別子は、ビュー識別子である。
【0053】
図6の復号器は、復号対象の符号化ビットストリームを受け取るよう構成された入力部を備える。復号器のプロセッサは、復号化機能を実行するよう構成され、出力部は、表示対象の復号化ビットストリームを出力する。復号器はまた、復号化プロセスで使用される情報、例えば、参照画像を格納するメモリも備えることができる。
図1
図2
図3
図4
図5