(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-10-21
(45)【発行日】2024-10-29
(54)【発明の名称】並列処理を許容している符号化概念、トランスポートデマルチプレクサおよびビデオビットストリーム
(51)【国際特許分類】
H04N 19/436 20140101AFI20241022BHJP
H04N 19/70 20140101ALI20241022BHJP
H04N 19/91 20140101ALI20241022BHJP
【FI】
H04N19/436
H04N19/70
H04N19/91
【外国語出願】
(21)【出願番号】P 2022116409
(22)【出願日】2022-07-21
(62)【分割の表示】P 2020104966の分割
【原出願日】2013-01-21
【審査請求日】2022-08-22
(32)【優先日】2012-01-20
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】515089080
【氏名又は名称】ジーイー ビデオ コンプレッション エルエルシー
【住所又は居所原語表記】1 Research Circle,Niskayuna,NY 12309,USA
(74)【代理人】
【識別番号】100079577
【氏名又は名称】岡田 全啓
(72)【発明者】
【氏名】シーアル トーマス
(72)【発明者】
【氏名】ジョージ ヴァレーリ
(72)【発明者】
【氏名】グルーエネベルク カルステン
(72)【発明者】
【氏名】キルヒホッファー ハイナー
(72)【発明者】
【氏名】ヘンケル アナスタージア
(72)【発明者】
【氏名】マルペ デトレフ
【審査官】鉢呂 健
(56)【参考文献】
【文献】特許第6808341(JP,B2)
【文献】MISRA, Kiran and SEGALL, ANDREW,On CABAC Init IDC,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 7th Meeting: Geneva, CH, 21-30 November, 2011, [JCTVC-G716],JCTVC-G716 (version 2),ITU-T,2011年11月24日,<URL:http://phenix.it-sudparis.eu/jct/doc_end_user/documents/7_Geneva/wg11/JCTVC-G716-v2.zip>: JCTVC-G716.doc: pp.1-7
(58)【調査した分野】(Int.Cl.,DB名)
H04N 19/00-19/98
(57)【特許請求の範囲】
【請求項1】
ビデオの符号化された画像を表すデータを復号化するように構成される復号化器であって、前記復号化器は、
前記符号化された画像を表すデータをコンテキスト適応型二値算術符号化(CABAC)エントロピー復号化を用いて復号化して、前記画像に関連付けられた残差信号を得るように構成されたエントロピー復号化器であって、前記画像はウェーブフロント並列処理(WPP)サブストリームとして符号化され、前記画像のWPPサブストリームは複数の切片を含み、各切片は前記WPPサブストリーム内の前記切片の境界を示すヘッダを有し、且つ前記WPPサブストリーム内の前記切片をCABACエントロピー復号化する際のCABAC確率適合に影響するフラグを含み、前記エントロピー復号化器はCABACエントロピー復号化を使用して前記WPPサブストリームの前記複数の切片のうちの現在の切片をエントロピー復号化するように構成され、前記CABACエントロピー復号化は、(a)前記現在の切片が前記WPPサブストリームの冒頭から始まること、および前記現在の切片の前記ヘッダ内の前記フラグが第1の値であることに応じて、前記現在の切片について前記CABAC確率適合をリセットすること、および(b)前記現在の切片が前記WPPの冒頭から始まらないこと、および前記現在の切片の前記ヘッダ内の前記フラグが第2の値であることに応じて、前記WPPサブストリーム内の前記複数の切片における先行する切片から、前記先行する切片の境界を越えて、前記WPPサブストリーム内の前記現在の切片まで前記CABAC確率適合を継続することを含む、エントロピー復号化器と、
前記残差信号と予測信号とを結合して前記画像を再構築するための結合器と、
を備える、復号化器。
【請求項2】
前記復号化器は、各切片について、それぞれの前記切片が属するWPPストリームを識別することによって、前記WPPサブストリームの前記複数の切片をデインターリーブするように構成される、請求項1に記載の復号化器。
【請求項3】
前記切片は、各パケットが前記画像の各WPPサブストリームの1つの切片、または前記画像の前記WPPサブストリームのサブセットを含むように、複数のパケットにパケット化され、前記複数のパケットは前記WPPサブストリーム間で定義された順序に配列され、各パケットはそれぞれの前記パケットにパックされた前記切片の位置および/または長さを明らかにする情報を含むヘッダ、または前記各パケット内の前記切片を互いに分離させるマーカを含み、前記復号化器は、前記パケット内の前記切片にアクセスするために前記ヘッダが含む前記情報または前記マーカを用いるように構成される、請求項1に記載の復号化器。
【請求項4】
前記画像の前記WPPサブストリームの、前記WPPサブストリーム間で定義された前記順序で最初の切片を含むパケットは低遅延特性インジケータを含み、前記画像の前記WPPサブストリームの、前記WPPサブストリーム間で定義された前記順序で2番目以降の切片を含むパケットは連続性インジケータを含む、請求項3に記載の復号化器。
【請求項5】
前記パケットはNALユニットである、請求項3に記載の復号化器。
【請求項6】
ビデオの画像を符号化するように構成される符号化器であって、前記符号化器は、
予想信号に基づいて、前記画像に関連付けられた残差信号を決定するように構成される残差決定器と、
前記画像に関連付けられた前記残差信号をコンテキスト適応型二値算術符号化(CABAC)エントロピー符号化を用いてデータストリームに符号化するように構成されるエントロピー符号化器であって、前記画像はWPPサブストリームとして符号化され、前記画像のWPPサブストリームは複数の切片を含み、各切片は前記WPPサブストリーム内の前記切片の境界を示すヘッダを有し、且つ前記WPPサブストリーム内の前記切片をCABACエントロピー復号化する際のCABAC確率適合に影響するフラグを含み、前記エントロピー符号化器はCABACエントロピー符号化を使用して前記WPPサブストリームの前記複数の切片のうちの現在の切片をエントロピー符号化するように構成され、前記CABACエントロピー符号化は、(a)前記現在の切片が前記WPPサブストリームの冒頭から始まること、および前記現在の切片の前記ヘッダ内の前記フラグが第1の値であることに応じて、前記現在の切片について前記CABAC確率適合をリセットすること、および(b)前記現在の切片が前記WPPサブストリームの冒頭から始まらないこと、および前記現在の切片の前記ヘッダ内の前記フラグが第2の値であることに応じて、前記WPPサブストリーム内の前記複数の切片における先行する切片から、前記先行する切片の境界を越えて、前記WPPサブストリーム内の前記現在の切片まで、前記CABAC確率適合を継続することを含む、エントロピー符号化器と、
を備える、符号化器。
【請求項7】
前記符号化器は、各切片が最大送信単位であるように、前記複数の切片を形成するように構成される、請求項6に記載の符号化器。
【請求項8】
各切片について、それぞれの前記切片が属するWPPサブストリームを示す識別情報を提供することによって、前記WPPサブストリームの前記複数の切片をインターリーブするように構成される、請求項6に記載の符号化器。
【請求項9】
前記切片は、各パケットが前記画像の各WPPサブストリームの1つの切片、または前記画像の前記WPPサブストリームのサブセットを含むように、複数のパケットにパケット化され、前記複数のパケットは前記WPPサブストリーム間で定義された順序に配列され、各パケットはそれぞれの前記パケットにパックされた前記切片の位置および/または長さを明らかにする情報を含むヘッダ、または前記各パケット内の前記切片を互いに分離させるマーカを含む、請求項6に記載の符号化器。
【請求項10】
前記画像の前記WPPサブストリームの、前記WPPサブストリーム間で定義された前記順序で最初の切片を含むパケットは低遅延特性インジケータを含み、前記画像の前記WPPサブストリームの、前記WPPサブストリーム間で定義された前記順序で2番目以降の切片を含むパケットは連続性インジケータを含む、請求項9に記載の符号化器。
【請求項11】
前記パケットはNALユニットである、請求項9に記載の
符号化器。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、例えば発展しているHEVC(High Efficiency Video Coding)、トランスポートデマルチプレクサおよびビデオビットストリーム等において並列処理を許容する符号化概念に関する。
【背景技術】
【0002】
符号化器および復号化器の並列化は、HEVC規格により増加した処理要求のためのみならず、ビデオ解像度の予想される増加によっても非常に重要である。マルチコアアーキテクチャは、様々な現代の電子装置において利用できるようになっている。従って、複数のマルチコアアーキテクチャの利用を可能にする効率的な方法が、必要とされる。
【0003】
LCU(largest coding unit)(複数)の符号化または復号化は、ラスタースキャンで生じ、それにより、CABAC(Context based Adaptive Binary Arithmetic Coding)確率は各画像の特性に適合される。空間依存性が、隣接するLCU(複数)の間に存在する。異なる構成要素、たとえば動きベクトル、予測、イントラ予測およびその他のために、各LCUは、その左の、上の、左上のおよび右上の隣接するLCU(複数)に依存する。復号化の並列化を可能にするために、これらの依存性は、概して中断されることを必要とするか、あるいは最新のアプリケーションで中断される。
【0004】
並列化、すなわち、エントロピースライス[3]を使用している波面処理、サブストリーム[2][4],〔11〕を使用している波面並列処理(WPP)動作、またはタイル[5]のいくつかの概念が、提案された。後者が、必ずしも復号化器または符号化器で並列化を許容するための波面処理と結合される必要があるわけではない。この観点から、タイルは、WPPサブストリームと類似している。エントロピースライス概念の更なる研究のための我々の最初の動機付けは、技術を実行することであり、それは符号化効率損失を低下させて、符号化器および復号化器の並列化方法のためのビットストリーム上の負担を軽減させる。
【0005】
より良い理解を提供するために、特にLCU(複数)の使用の中で、H.264/AVC[1]の構造に、最初に目を通すことができる。
【0006】
H.264/AVCの符号化ビデオシーケンスは、NAL(Network Abstruction Layer)ユニットストリームにおいて集められる一連のアクセスユニットから成り、それらは1つのシーケンスパラメータセットのみを使用する。各ビデオシーケンスは、独立に復号化されうる。符号化シーケンスは、一連の符号化画像から成る。符号化フレームは、全フレームまたは単一フィールドでありうる。各画像は、固定サイズのマクロブロックに分割される(HEVC[5]において:LCU(複数))。いくつかのマクロブロックまたはLCU(複数)は、一緒に1枚のスライスに併合されうる。1枚の画像は、従って、一つ以上のスライスの集まりである。このデータ分離の目的は、画像のエリアのサンプルの独立復号化を可能にすることであり、それは、他のスライスからのデータを使用せずに、スライスにより表される。
【0007】
"エントロピースライス"[3]としばしば呼称される技術は、付加的なサブスライスへの従来のスライスの分割である。具体的には、それは、単一のスライスのエントロピー符号化データの分割を意味する。スライスにおけるエントロピースライスの配列は、異なる種類を有しうる。最も単純なものは、1枚のエントロピースライスとしてフレームにおけるLCU(複数)/マクロブロックの各行を使用することである。代わりに、列または別々の領域が、エントロピースライスとして利用されえて、それは例えば、
図1のスライス1のように各々により中断さえでき、互いに切り換えさえできる。
【0008】
エントロピースライス概念の明らかな目的は、復号化プロセス時間を改善するために、すなわちプロセスをスピードアップするために、並列CPU/GPUおよびマルチコアアーキテクチャの利用を可能にすることである。現在のスライスは、他のスライスデータに関係なく、分析でき再構成されうるパーティションに分割されうる。いくつかの効果がエントロピースライス法により達成されうるにもかかわらず、これにより、いくつかの不利益が現れる。
【0009】
〔2〕、〔10〕、[11]において提案され、部分的に〔5〕に組み込まれたように、エントロピースライス概念は、サブストリーム波面処理(WPP)まで更に拡張された。ここで、サブストリームの反復スキームが、定義される。それは、エントロピースライスと比較して線ごとに改良されたエントロピー状態初期化を有する。
【0010】
タイル概念は、画像情報の分離が符号化されるのを可能とし、その一方で、各タイトルは、それ自身のラスタースキャン順序を有する。タイルは一般の構造により定義され、それはフレーム内で繰り返される。タイルは、LCU(複数)またはCU(複数)に関して特定の列幅および線高を有することもできる。タイトルは、独立に符号化されることもでき、復号器スレッドは、アクセスユニットのタイルを完全に、または、少なくとも独立した方法、すなわちエントロピー符号化および変換符号化、におけるいくらかの符号化動作ステップのために処理しうるように、タイトルが他のタイルとの共同処理を必要としない方法に符号化されることもできる。
【0011】
従って、タイルは、後者の場合、例えばHEVCコーデックのフィルタステージに対するuでは、タイル符号化器および復号化器が完全に、または、部分的に独立して、並行して実行するのと同様に動作するのを大いに可能とする。
【0012】
キャプチャ、符号化、伝送、復号化、および一連のビデオ通信システムのプレゼンテーションチェーン、あるいは類似のシステムにおける並列化技術の完全な使用を行うために、通信参加者間のデータの転送およびアクセスは、全部のエンドツーエンドの遅延注入のために重要かつ時間を要するステップである。これは、並列化技術、例えばタイル、サブストリームまたはエントロピースライス等、を使用する場合に、特に問題である。
【0013】
WPPサブストリームのデータアプローチは、パーティションの符号化データが処理される場合、データ局所性を持たない、すなわちアクセスユニットを復号化している単一スレッドは、次のWPPサブストリームラインのデータにアクセスするために潜在的に大きいメモリ部分を飛び越える必要があることを意味する。完全に並列化された方法で動作するために、マルチスレッド復号化システムは、特定のデータ、すなわちWPPサブストリームの伝送を待つ必要があり、波面処理を利用する。
【0014】
ビデオストリーミングにおいて、より高い解像度(フルHD、クアッドHD等)を可能にすることは、伝送されるべきデータがより大きな量となることにつながる。時間感受性シナリオのために、いわゆる低遅延使用の場合、例えばテレビ会議(<145ms)、またはゲームアプリケーション(<40ms)の非常に低いエンドツーエンドの遅延が、必要とされる。従って、伝送時間は、重要な要素になる。テレビ会議アプリケーションのためのADSLのアップロードリンクを考慮されたい。ここで、ストリームのいわゆるランダムアクセスポイントは、通常、これらは、Iフレームを参照し、伝送中に、ボトルネックを生じる候補であろう。
【0015】
HEVCは、復号化器側と同様に符号化器で、タイル処理と同様にいわゆる波面処理を可能とする。これは、エントロピースライス、WPPサブストリームまたはそれらの均一な組合せを用いて可能にされる。並列処理は、並列タイル符号化および復号化により可能とされもする。
【0016】
「非並列化ターゲッティング」の場合において、全スライスのデータが、一度に配信され、それ故、スライスの最後のCUは、それが送信された場合、復号化器によりアクセス可能である。単一スレッドの復号化器がある場合、これは問題ではない。
【0017】
マルチスレッドのケースにおいて、複数のCPUまたはコアが使用されうる場合、復号化プロセスは、しかしながら、符号化されたデータが波面復号化器またはタイル復号化器スレッドに到着すると、すぐに開始することを希望する。
【0018】
このように、符号化効率において著しい減少の少ない並列処理環境の符号化遅延を減少可能にする概念を有することは、好ましい。
【発明の概要】
【発明が解決しようとする課題】
【0019】
従って、並列処理環境において、より効果的な、低遅延符号化を可能にする符号化概念、伝送デマルチプレクス概念およびビデオビットストリームを提供することが、本発明の目的である。
【課題を解決するための手段】
【0020】
この目的は、添付の独立クレームの主題により達成される。
【0021】
本出願の第1の態様によれば、スライス、WPPサブストリームまたはタイルにおける1枚の画像を表現しているローバイトシーケンスペイロード、およびコンテキスト適応型二値算術符号化を用いた符号化は、コンテキスト適応型二値算術符号化確率適合を継続しながら切片(tranche)境界全体にわたって切片に再分割されるか切断される。この手法により、スライス、WPPサブストリームまたはタイルの範囲内で付加的に導入された切片境界は、これらの要素のエントロピー符号化効率の減少をもたらさない。しかしながら、一方で、切片は、元のスライス、WPPサブストリームまたはタイルより小さく、そして、したがってそれらは、切断されていない元の実体、すなわちスライス、WPPサブストリームまたはタイルより早く、すなわちより少ない遅延により、伝送されうる。
【0022】
第1の態様と組み合わせ可能な別の態様によれば、サブストリームマーカーNALユニットは、トランスポートデマルチプレクサがNALユニット内のスライスのデータを対応するサブストリームまたはタイルに割り当て、対応するサブストリームまたはタイルでマルチスレッド復号化器を並行して提供できるように、ビデオビットストリームのNALユニットのシーケンス内で使用されている。
【0023】
有利な実施態様は、従属クレームの主題である。更に、本発明の好ましい実施例は、図について以下で更に詳細に説明される。
【図面の簡単な説明】
【0024】
【
図1】
図1はエントロピースライスの可能な合成物を例示している概略図を示す。
【
図2】
図2は3枚のスライスの上に広がる3つのタイルを例示している概略図を示す。
【
図3】
図3は4つの可変長切片サイクルインターリーブスキームの切片のインターリーブの例を示している概略図を示す。
【
図4】
図4はエントロピースライスデータの符号化、セグメンテーション、インターリーブおよび復号化を示している概略図を示す。
【
図5】
図5は常にマーカーコードを使用していて、複数のNALユニット上の実際のスライスデータの中で広がっているスキームを周期的にインターリーブする4つの可変長切片の切片のインターリーブ実施例を例示している概略図を示す。パーティションが存在しない場合であっても、マーカーコードが用いられる。これは、切片識別子を使用し、マーカーに追従し、切片数を示すことで、更に強化しうる。これは、周期的モードのために必要とされるように、これは常にマーカーを送信する必要性を減少させる。
【
図6A】
図6AはNALユニットシンタックスを例示している疑似コードの表を示す。
【
図6B】
図6BはNALユニットシンタックスを例示している疑似コードの表を示す。
【
図7】
図7はシーケンスパラメータセットシンタックスを例示している疑似コードの表を示す。
【
図8】
図8は低遅延スライス層RBSPシンタックスを例示している疑似コードの表を示す。
【
図9】
図9はスライスヘッダシンタックスを例示している疑似コードの表を示す。
【
図10】
図10はサブストリームマーカーシンタックスを例示している疑似コードの表を示す。
【
図11】
図11はエントロピースライスデータの単純なカプセル化のための実施例を例示している概略図を示す(AFは、MPEG-2 TS アダプションフィールドである)。
【
図12】
図12はエントロピースライスデータの単一のES(Elementary Stream)カプセル化のための他の実施例を例示している概略図を示す。
【
図13】
図13はエントロピースライスデータのパックドマルチESカプセル化のための他の実施例を例示している概略図を示す。
【
図14】
図14は単一のESのためのトランスポートデマルチプレクサを示している概略ブロック図を示す。
【
図15】
図15はマルチESのためのトランスポートデマルチプレクサを示している概略ブロック図を示す。
【
図16】
図16は符号化器を示している概略ブロック図を示す。
【
図17】
図17は復号化器を示している概略ブロック図を示す。
【
図18】
図18は復号化器により実行されるステップのフローチャートを示す。
【
図19】
図19はRTPを使用しているマルチESのための実施例を例示している概略図を示す。
【発明を実施するための形態】
【0025】
時間を短縮するために、並列復号化器スレッドは、開始でき、フレームのそのデータを終了でき、下記の実施例は、データのセグメンテーション、並列化のための構造化、例えば一つ以上のタイルのデータまたは低遅延インターリーブアプローチによる小さい切片への一つ以上のWPPサブストリームのデータ、を使用する。
【0026】
従って、符号化器は、LCU(複数)の特定セットまたはサブストリームの少なくともバイト配列部分またはタイルまたはそれらの部分に一致して、切片の形で符号化器から復号化器まで伝送パスを介して復号化器にデータを配信しうる。
【0027】
切片が完全なWPPサブストリームまたはタイルより小さくて、および/または伝送パスの実際の最大の転送ユニット(MTU)に適しうるので、複数のWPPストリームまたは切片は完全なアクセス装置のファイナライズの前に、符号化器および復号化器の間に転送ユニットにおいて配置されることができ、復号化器側の復号化は、アクセスユニットの完全なWPPサブストリームまたはタイルのシーケンシャル伝送を使用する場合よりも、非常に以前に始めうる。
【0028】
これは、明らかに、復号化器における切片のより速い伝送および並列復号化プロセスのより早いスタートに結果的になる。その方法は、例えば波面法において、次のフレームの(複数の)スライスまたは(複数の)エントロピースライスが、次のフレームのエントロピースライスを復号化するための必要な情報がフレーム間参照の有効性によるとの知見に基づいて、すでに復号化されうる場合、フレーム境界を通じても適用されうる。復号化順序における後続のフレームのそれらのすでに復号化可能なデータは、データパーツの依存性を先行する(複数の)フレーム、またはパラメータセット等の順序固定位置において信号伝送された使用された位置を示す固定参照方式、において示しているストリームにおける最大限許容された/信号伝送された動きベクトル長または付加的情報から導出しうる。
【0029】
画像は、最大符号化ユニット(LCU)-行(複数)につき1枚のエントロピースライスにより、またはWPPサブストリームを用いて、または、分離されたエントロピースライスにおいてさらに含まれうる行につき1つのWPPサブストリームとしての組合せさえも、符号化されうる。この種のデータ構造は、復号化器側で波面処理テクニックを利用するために必要である。または、タイルは、並列処理を許容するために使用しうる。
【0030】
符号化プロセスの間、WPPストリームまたはタイルのデータを含む各スライスのビットストリームは、符号化器および復号化器の間で、最大転送ユニットサイズに合致するために、可変サイズの切片に分割しうる。そのとき、結果として生じた切片は、インターリーブされて、伝送のために通過でき、MTUサイズのパケットに入れられる。
【0031】
復号化器側で処理を許容するために、各切片の前か後に、マーカーコードは、挿入されうる。HEVCのための適切なマーカーコードは、"0x00 00 02"でありえて、それは、スタートコードエミュレーション防止さえ通過する。複数の切片を含むパケットを受信した後、レシーバまたは復号化器は、追加的な分析ステップを必要としないために、スタートコードエミュレーション防止プロセスの間、実際に含まれたビットストリームを分析しうる。例えば、切片識別のための2つのモードが、存在しうる。1に等しいtranche_id(切片識別子)を有する切片から始まり、nに等しいtranche_idを有する切片まで、切片の周期的配列が、常に存在しうる。これは、第2の一般的な方法に安全にデータを信号伝送しうる。代替方式は、例えば8ビット値として、tranche_idを示している、マーカーに続く、特定のヘッダでもよい。
【0032】
インターリーブされた切片データをデインターリーブすることは、パケットにつき切片の数についての知識に基づいて適用可能で、それはNALユニットパケットでもよい。従って、WPPサブストリームまたはタイルの切片へのマッピングが、さらに存在しうる。このマッピングは、タイルの数/WPPサブストリームの数に暗に由来しうる、またはSPSにおいて直接信号伝送されうる。マッピングは、デインターリーブプロセスにとって重要であり、その結果、特定のWPPサブストリームまたはタイルのデータは、WPPサブストリームまたは問題のタイルを復号化することを担って波面または並列復号化器スレッドを確認されえて、役立ちうる。
【0033】
低遅延カプセル化のためのインターリーブスキームの使用に関して、復号化器に知らせるために、NALユニットヘッダにおいて低遅延フラグが、存在しうる。
【0034】
他のモードは、トランスポート層上、すなわち、RTP[8][9][13]または MPEG-2 トランスポートストリーム[7]層の復号化プロセスの外側での、インターリーブおよびデインターリーブでもよい:
【0035】
従って、ヘッダはパケットの前に置かれうる、そして、現在の切片につきサイズ情報をバイトに含んでいるフラグにより切片の存在を示す。トランスポート層が復号化プロセスから切り離されるので、トランスポート層の付加的情報が復号化器にそれらのデータを通過する前に常に削除される必要があるという理由で、マーカーコードを集積する必要性があるとはできない。トランスポート層は、それからまた、復号化器にビットストリーム送出のためのデータを並べ換える。
【0036】
可変長ヘッダが、余分な多重化層に使用されうる。この多重化層は、コーデックの一部でもよく、復号化器の実際のローバイトシーケンスデータ(RBSP)アクセスの前に導入されることもできる。1つのヘッダ方式は、
図3で見出しうる。しかし、そのインジケータと同様に1つのヘッダが、直接、長さを示している各切片の前にも存在しうる。すでに上述したように、インジケータをビットストリーム構造にマップする必要性が依然として存在する。
【0037】
切片サイズは、恒常的なサイズ、例えば切片につきxバイトでもよい。これは、例えば
図4に示される等、単純な多重化方式に結果としてなる。
【0038】
セグメントの恒常的なサイズは、その可変長のためビットストリームの終りで課題をもたらしうる。
【0039】
実行可能な2つの一般的な解答が、存在する。最初の1つは、周期的x-バイトセグメント(通常、スライスのビットストリーム表現は、バイト整列される)の生成および各復号化器エンジンによる、各バイトの消費の制御、すなわち、復号化器は、エントロピースライスの、または、マーカーコードを示す完成を見出す。
【0040】
図示されるように、ヘッダにおける切片が可変長である場合、第2の方法は、切片長を信号伝送する。
【0041】
セグメントおよびインターリーブモードのサイズは、1つのSEI(Supplemental Enhancement Information)-メッセージにおいて、または、SPS(Sequence Parameter Set)において信号伝送されうる。
【0042】
【0043】
他の興味深い方法は、パケット、例えばNALまたはスライスパケット、の切片のセットの終りでファイナライズコードまたはマーカーコードを使用することである。この場合、可変長セグメントが可能であり、従って、ビットストリームの完全な分析が、必要とされる。メモリアクセスをここで制限するために、多重化のためのこの付加的な分析方法は、スタートコードエミュレーション防止分析と結合されうる、そして、NALユニットに含まれるRBSPデータにアクセスする前の第1段階として必要である。この種のマーカー方式は、
図5に示される。
【0044】
ここにあるアイデアは、データを切片にインターリーブする間、例えば現実のスライス、エントロピースライスや類似のもの等、より高レベル構造を、例えばWPPサブストリームやタイル等、その含まれたより低レベルのデータ構造に、インターリーブ方法において分割することにある。各々がより低レベルの構造、例えば特定のWPPサブストリームまたはタイル、に属するこれらの切片は、低遅延パケットにおいてインターリーブされ、それは特定のNALユニットであり、低遅延インターリーブフラグにより付加的に信号伝送されるNALユニット、またはスライスでさえ、または図において"NALユニット♯1"として示されるように、フラグまたはスライスタイプにより低遅延インターリーブアプローチを示す軽量スライスヘッダでありうる、それ故、復号化器は、"シングル"スレッド復号化器に対し、整理機能を適用することを通知し、それは、復号化器における元の/デインターリーブされた順序における切片の順次処理を使用する。低遅延特性を得るために複数パケット上にインターリーブされた切片として現実のスライスを分割するために、トランスポート層は、最大MTU(Maximum Transmission Unit)サイズのネットワークパケットへの低遅延インターリーブされたデータを含む前記NALユニットを断片化しうる。複数のNALユニットへの現実のスライスデータの断片化は、符号化層によっても直接適用されうる、それ故、
図5において"NALユニット♯2"に示されるように、スライスの継続を含むNALユニットのその種のタイプを信号伝送する必要がある。NALユニット等の複数のパケットにおいて、インターリーブされたデータのファイナライズを検出するために、図において"NALユニット♯2"にも示されるように、特定のファイナライズコード、またはスライスまたはNALヘッダにおける完了を示すフラグの必要性が存在しうる。
【0045】
NALパケットが消失した場合、消失を検出する必要性も存在しうる。これは、ヘッダ、例えば軽量スライスヘッダ、例えば含まれた切片の第1のMB等、または特定の切片#1のみにおける追加情報に適用されうる。例えばWPPサブストリームまたは切片の現実のサイズのためのオフセット等の情報を持った後、ファイナライズコードおよび先行NALユニットとともにNALユニットを受信した後、サニティチェックを行うために、誰もがこれらのサイズ値(特定のWPPサブストリームまたはタイルのオフセット値)を使用しうる。
【0046】
即ち、記載されているように、切片は、各パケット300が、WPPサブストリームまたはタイルの間で定義された順序♯で配列された画像の各WPPサブストリームまたはタイルの1つの切片T♯または画像の複数のWPPサブストリームまたは複数のタイルの1つのサブセットから構成される方法で(その理由は、例えば、ある特定のWPPサブストリームまたはタイルは、先行するパケットにより既に完全に運ばれているからである)パケット300にパケット化され得て、各パケットは、それぞれのパケット300にパックされた切片T♯の位置、および/または、長さを示す情報を有するヘッダ302、あるいはそれぞれのパケット300内で切片T♯を互いに分離するマーカー304、を有し、復号化器は、ローバイトシーケンスペイロードを受信するにあたり、パケット内の切片にアクセスするためにヘッダ302またはマーカー304により構成された情報を使用するように構成されうる。画像のWPPサブストリームまたはタイルの第1の-WPPサブストリームまたはタイルの間で定義された順序に従って-切片を有するパケット300aは、低遅延特性インジケータ306を有しうる。かつ、画像のWPPサブストリームまたはタイルの第2またはそれ以降の-WPPサブストリームまたはタイルの間で定義された順序に従って-切片T♯、を有するパケット300bは、連続性インジケータ308を有しうる。パケット300は、NALユニットまたはスライスでありうる。
【0047】
以下に、切片への低遅延インターリーブのためのシンタックスおよびセマンティックスを信号伝送するための実施例が、提供されている。
【0048】
それにもかかわらず、上述したように、切片データ、例えばWPPサブストリームまたはタイルのデータ等、を分割することは、スライスレベルまたは下記にも適用されうる。
【0049】
現在、1つの方法が示され、そして、それは付加的な処理ステップを減少するためにスタートコードエミュレーション防止のための分析と結合されうる。従って、インターリーブは、HEVCコーデックのRBSPレベルで適用される。
【0050】
一つの切片は、低遅延データアクセスのためにNALユニットペイロード部において分割RBSPデータをインターリーブされるべきセクションに分割するとみなされうる。一つの切片のファイナライズは、コード0x000002により示されうる、かつ、8ビットの切片識別子tranche_idが続きうる。前記切片は、周期的態様でインターリーブされうる、その結果、前記切片エンドコードは、暗に導出されるtranche_idにより後続されない。単一切片におけるRbspデータは、タイルのデータ、サブストリームのデータ、スライスのデータかエントロピー・スライスのデータに対応する。
【0051】
NALユニットシンタックスにおいて、"low delay encapsulation_flag"により示された低遅延インターリーブのための2つのモードが許容されうる。それは、切片の周期的配置であり、また、NALユニットヘッダにおける例えば"low delay cyclic_flag"等のフラグによるマーカーコーダに続く付加的な識別子"tranche_id"による切片の指示でもある。これら2つのフラグは、Sequence Parameter SetsまたはAPSにさえも存在しうる。周期的切片配置のために、分析の間、例えばSPSにおいて"num_low_delay_tranches"として設けられたように、切片の数を知っている必要が依然存在しうる。
【0052】
NALユニットにおいて、インターリーブされた"LD_rbsp_byte"(複数)は、NALシンタックスにおける最後のforループにおける現実の逐次RBSP順序への並べ換えが、パーサにより読まれる:
for ( i= 0, i++, i < num_low_delay_tranches)[
for ( j= 0, j++, j < NumBytesInRBSP[i] )[
rbsp_byte[NumBytesInRBSP++] = LD_rbsp_byte[j][i]
]
"low_delay_tranche_lenght_minus1"に示されたように、循環的に配置された切片の固定サイズのためにSPSまたはAPSにおける明確な信号伝送も存在しうる。後者は、NALユニットシンタックスの実施例において使用されていないが、
図4に示されるように、パケット化を念頭においた場合、容易である。
図6のNALユニットシンタックスにおいて、
図5に示すようなパケット化および上述の議論は、基本的であった。
【0053】
複数のパケット、例えばスライスおよび/またはNALユニット等の上の切片のこのインターリーブ特性を可能にするために、グローバルバッファ、例えば切片のためのLD_rbsp_byteのアレイ、のための要求が、既に受信されたNALユニットのRBSPデータに繰り返しアクセスするために、存在しうる。
【0054】
エラー回復を可能にするために、確定コードを受信した後、または、切片の受信バイト数の合計が切片サイズに等しい場合、これは、含まれる切片データに提供されるオフセット値、例えば、問題の切片が一部であるそれぞれのWPPサブストリームまたはタイルに関するデータから導き出すことができる。
【0055】
インターリーブされた低遅延切片に配置されたWPPサブストリームのための重要な要求は、切片n+1により切片nからのデータのみがアクセスされ、それは、既に切片n内に与えられ、既に蓄積されるか復号化器で利用可能である。
【0056】
スライスレベル上の再順序化/デインターリーブのための低遅延スライス層RBSPシンタックスは、次のように設計されうる。特に、前記シンタックスは、その場合にNALユニット層上のようにほとんど同じ振る舞いを有するべきであるが、前記並べ換えは、前記スライスレベル上で定義されねばならない。
図8は、低遅延スライス層RBSPシンタックスを示す。
【0057】
インターリーブされた切片をパケット化するためにスライスヘッダを使用する場合、新たなスライスを受信した場合、CABAC状態をリセットするのではなく、例えばWPPサブストリームの切片のエントロピー符号化が割り込まれるべきではないので、コーデックレベルを示す必要が存在しうる。スライスのCABACをリセットしないことは、スライスヘッダにおいて"no_cabac_reset_flag"として示される。示されるスライスヘッダは、低遅延スライスに適しており、従って、entropy_sliceの特徴は、また存在しなければならない。対応するスライスヘッダシンタックスは、
図9に示される。
【0058】
前記トランスポート層は、符号化層におけるサブストリーム/タイル/切片(トランスポート層上で、我々は、サブストリーム、またはタイル、またはサブストリームまたはタイルの一部、またはビットストリームの一部により表されうる抽象的存在を仮定し、それは類似の機能、即ち、並列復号化または漸進的な復号化器のリフレッシュを可能にする)の数が互いに独立に処理されうる場合その事実に基づいて、復号化器ユニットに転送されるデータのスケジューリングの最適化を可能にする。1つの可能性は、いくつかの復号化装置に並行して切片を最小遅延で送り始めることである。前記ビットストリームは、トランスポート層上で独立に取り扱うことが可能な最小の項目である一連のNALユニットからなる。それ故、トランスポート層上で取り扱う次の方法は、セパレートスライスまたはエントロピースライスNALユニットに含まれるサブストリーム/タイル/切片に基づく。
【0059】
トランスポート層は、符号化層が漸次復号化器リフレッシュを使用する場合その事実に基づき復号化器性能および誤り回復力も最適化すべきである。1つの選択肢は、ビットストリームの前の部分が例えば伝送エラーにより正しく受信されない場合、あるいは例えば伝送チャンネル間のスイッチにより全く受信されなかった場合、ビットストリームの無関係の部分を捨てることである。
【0060】
この種の開発/最適化を許可するために、さまざまな情報が、トランスポート層に信号伝送される。
【0061】
一般的なサイド情報は、記述子を用いて信号伝送される。
-サブストリーム/タイルの個数、そこでは"1"は、全てのビデオフレームを含む 唯一のストリーム/タイルが存在することを意味する
-全てのサブストリーム/タイルに共通する情報、例えば、全てのサブストリーム /タイルが同じサイズか、あるいは、バッファ要求が同じか
-各サブストリーム/タイルに関する独立した情報、例えば、サブストリーム/タ イルが異なるサイズか、あるいはそのバッファ要求が異なるか
-逐次復号化器リフレッシュステップの個数、そこでは"1"は、逐次復号化器リフ レッシュ要求が使用されないことを意味する
-これらのサブストリーム/タイルが、低遅延並列処理が可能かを示す1つのフラグ
【0062】
サブストリーム/タイルの個数が>1の場合、各シンタックス要素は、ストリーム内のあるサブストリーム/タイルを含む各データブロックの前に挿入される。これらのシンタックス要素は、NALユニットシンタックスに続くが、符号化層(例えばnal_unit_type=0x19またはnal_unit_type=0x1F)により使用されない一意的なNALユニットタイプを使用し、次にサブストリームマーカーと呼ばれる。
【0063】
これらシンタックス要素は、マーカーとして使用され、少なくともサブストリーム/タイルと同一視されるデータフィールドに続くデータブロックに関してキャリー情報として使用される。
【0064】
漸次復号化器リフレッシュステップの個数>1の場合、これらシンタックス要素もサブストリーム/タイルがイントラ符号化された(逐次復号化器リフレッシュを可能にする)旨を示すフラグを掲げる。
【0065】
対応するシンタックスは、
図10に示される。以下の拘束が適用されうる。
forbidden_zero_bitは、0に等しい。
nal_ref_flagは、0に等しい。
nal_unit_typeは、0x19に等しい。
substream_ID:画像に属する第1のスライスのための0から始まるカウンタ値、同じ画像に属する各更なるスライスまたはエントロピースライスにより増加する。is_intra:'1'である場合、以下のNALユニットは、イントラ符号化スライスまたはイントラ符号化エントロピースライスを含む。
【0066】
トランスポートマルチプレックスにおけるビデオストリームのカプセル化のための方法は、
図11に示され、そこでは、各スライスまたはエントロピースライスがトランスポートストリームパケットの整数個において別に伝送される。ペイロードのサイズが固定サイズのTSパケットの利用できるバイトに正確に一致しない場合、最後のTSパケットは、適応フィールドを含む。
【0067】
MPEG-2トランスポートストリームのエレメンタリーストリームの類似のビヘイビアが、
図19にて示したように、リアルタイム転送プロトコルのRTPセッションまたはRTPストリームにより設けられうる点に留意すべきである。RTP[8]において、RTPストリーム(SDP[12]に示すように、メディアタイプおよびペイロードタイプにより確認される)は、それ自身のRTPセッションに含まれうる、そこにおいて、RTPセッションは、(IP)ネットワークアドレス、(UDP)ポート、その上にソース識別子(SSRC)により確認される。SPDにおいて示されたメディアセッションは、複数のRTPセッションを含みうる、そして、各々が異なるメディアタイプを含む。しかし、異なるRTPストリームの同じメディアストリーム(例えばビデオ)を転送することも、可能であり、そこにおいて、RTPストリームは、同じRTPセッション(下の1に類似している)に含まれうるか、またはそれらのRTPセッション(下の2に類似している)に含まれうる。
図19は、ケース2を例示する。
【0068】
RTPペイロードフォーマット[9][13]は、復号化順序番号(DON)を有し、それらは、[9][13]にて説明されたように、エラー回復力目的のために復号化順序から故意に外れて送信される場合に、レシーバでNALユニットの復号化順序を回復するのを可能にする。追加マーカーMKRは、従って、必要でない。WPPサブストリームまたはタイルの切片を転送する場合に、それらが符号化プロセスから利用可能になるときの順で、前記DONは、それらを単一の復号化器に提供する前に、切片の復号化順序を回復するために用いることもできる。しかし、この場合において、追加の遅延は、復号化プロセスの前に別々のデインターリーブプロセスのために、復号化器で導入される。本明細書に記載されているシステムは、データがレシーバに到達する間に、符号化された切片を直接、異なるWPPサブストリームまたはタイルの復号化プロセスに提供しうる。RTPヘッダにおけるRTPシーケンス番号により示されるように、WPPサブストリームまたはタイルに関連した切片の識別は、スライスセグメントのスライスセグメントヘッダおよびパケットの伝送順序のスライスアドレスにより導出されうる。このシナリオにおいて、DONが、下位互換性、すなわち、復号化器が、到着したとき復号化順序外で送信されたWPPサブストリームまたはタイルの切片を復号化する改良された能力を備えない、用途のみに使われる。復号化順序外の切片データの送信は、WPPサブストリームおよびタイルのレベルに関してちょうど適用される、すなわち伝送データにおいて、単一のWPPサブストリームまたはタイルの切片は、復号化順序において伝送され、異なるWPPサブストリームまたはタイルのデータがインターリーブされる。
【0069】
2つの考えられるオプションが、存在する:
1.すべてのスライスおよびエントロピースライスは、同じ基本ストリームに含ま れる、すなわち同じPIDが、そのビデオストリームのすべてのTSパケットに割り 当てられる;
以下のテキストで、この方法は、一回のESカプセル化に言及される。
2.異なるPIDは、同じビデオビットストリームのスライスおよびエントロピー スライスに割り当てられる;以下のテキストで、この方法は、マルチESカプセル化に 言及される。
【0070】
第1のオプションが、同じPIDをすべてのESに設定することでより一般の構造の特例として扱われる場合、
図11は両方のオプションに有効である。
【0071】
単一のESのカプセル化のためのより効率的な方法は、
図12に示される。ここで、画像につき多くとも1つの適応フィールドが、必要である。
【0072】
複数のESのカプセル化のためのより効率的な方法は、
図13に示される。ここで、適応フィールドは回避される。代わりに別のスライス、例えば次の図の連結されたタイルが同じトランスポートストリームパケットにおいて、すぐに開始される。
【0073】
マルチスレッドの復号化器を対象としている1つの単一の基本ストリーム(ES)を有するカプセル化のためのトランスポートデマルチプレクサの考えられる構造は、
図14に示される。図のエントロピースライスは、特定のWPPサブストリームまたはタイルのデータを含みうる。
【0074】
トランスポートバッファ(TB)は、トランスポートパケットに属するデータを集めて、マルチプレックスバッファ(MB)に、それを転送する。MBの出力で、NALユニットヘッダは評価され、サブストリームマーカーは、低下される。その一方で、サブストリームマーカーにおいて運ばれるデータは、格納される。各スライスまたはエントロピースライスのデータは、一旦復号化器スレッドが利用できるならば、それがマルチスレッド復号化器により取り出されるところから、別々のスライスバッファ(SB)に格納される。
【0075】
マルチスレッド復号化器をターゲットとしている複数の基本ストリームを有するカプセル化のためのトランスポートデマルチプレクサの考えうる構造は、
図15に示される。
【0076】
上記の概説された概念は、換言すれば再び以下で記載される。下記の説明は、従って、個々に上記説明の付加的な詳細により、結合可能である。
【0077】
図16は、本出願の実施例による符号化器の一般的な構造を示す。符号化器10は、マルチスレッド法、あるいはそうでない、すなわち単にシングルスレッドで作動が可能であるように実装しうる。すなわち、符号化器10は、例えば、複数のCPUカーネルを使用して実装しうる。換言すれば、符号化器10は並列処理をサポートしうるが、そうしなければならないことはない。本出願の符号化概念は、並列処理符号化器が、しかしながら、圧縮効率を低下させることのない並列処理を効率的に適用しうる。並列処理能力に関して、類似の記載は復号化器に当てはまり、それは
図17に関して後ほど記載されている。
【0078】
符号化器10はビデオ符号化器であるが、一般に、符号化器10は画像符号化器でもよい。ビデオ14の画像12は、入力16で符号化器10に入力するとして示される。
【0079】
符号化器10は、ハイブリッド符号化器、すなわち、画像12が予測器18で予測され、残差決定器22、例えば減算器等、により得られた予測残差20が、変換/量子化モジュール24において、変換、例えばDCTのようなスペクトル分解、および量子化を受ける。こうして得られた量子化残差26は、エントロピー符号化器28においてエントロピー符号化、すなわちコンテキスト適応型二値算術符号化を受ける。復号化器が利用できる残差の再構成的なバージョン、すなわち、逆量子化および再変換残差信号30は、再変換および再量子化モジュール31により回復され、合成器33により予測器18の予測信号32と合成され、それにより画像12の再構成34が得られる。しかしながら、符号化器10は、ブロックベースで動作する。従って、再構成された信号34は、ブロック境界で不連続性が生じ、従って、フィルタ36は、予測器18が後続の符号化画像を予測するための参照画像38を生じるために、再構成された信号34に適用されうる。
図16の破線により示されたように、予測器18は、しかしながら、再構成された信号34もフィルタ36または中間バージョンなしで直接利用する。画像を符号化する場合において、フィルタ36は、放置しうる。
【0080】
予測器18は、画像12のあるブロックを予測するために、異なる予測モードの間から選択しうる。以前に符号化された画像に基づきどのブロックが予測されたかに応じた一時的予測モード、どのブロックが同じ画像の以前に符号化されたブロックに基づき予測されたかに応じた空間予測モード、より上位層、例えばより上位の空間分解能でまたはさらなるビューポイントから、場面を示す画像のどのブロックが、より下位層、例えばより下位の空間分解能でまたは他のビューポイントから、この場面を示す対応画像に基づき予測されたかに基づく層間予測モードが存在しうる。
【0081】
あるシンタックスが、量子化残差データ26、すなわち、変換係数レベルおよび他の残差データ、のみならず例えば予測器18により決定された画像12の個々のブロックのための予測モードおよび予測パラメータを含んでいる符号化モードデータをコンパイルするために使用され、かつ、これらのシンタックス要素は、エントロピー符号化器28によるエントロピー符号化に依存する。従って、エントロピー符号化器28により出力された、得られたデータストリームは、ローバイトシーケンスペイロード40と呼ばれる。
【0082】
図16の符号化器10の要素は、
図16に示されるように相互接続される。
【0083】
図17は、
図16の符号化器に適合する復号化器を示し、すなわち、ローバイトシーケンスペイロードを復号しうる。
図17の復号化器は、一般に参照符号50により示され、エントロピー復号化器52、再変換/逆量子化モジュール54、合成器56、フィルタ58および予測器60からなる。エントロピー復号化器42は、ローバイトシーケンスペイロード40を受信し、残差信号62および符号化パラメータ64を回復するために、コンテキスト適応型二値算術復号化を用いてエントロピー復号化を行う。前記再変換/逆量子化モジュール54は、残差信号62の逆量子化および再変換を行い、こうして得られた残差信号を合成器56に転送する。合成器56は、合成器56により予測信号66および残差信号65を合成することで決定された再構成された信号68に基づき符号化パラメータ64を用いて前記予測信号66を順に形成する予測器60から予測信号66も受信する。
図16に関し、既に上記で説明したように、予測器60は、再構成された信号68のフィルタリングされたバージョンまたはそのいくつかの中間バージョンを、代わりにまたは付加的に使用しうる。最終的に再生され復号化器50の出力70から出力されるべき画像は、合成信号68のフィルタされないバージョンまたはいくつかのフィルタされたバージョンの上で、同様に決定されうる。
【0084】
タイルの概念に従って、画像12は、タイルに再分割され、かつこれらタイル内の少なくともブロックの予測は、空間予測の基礎として、単に同じタイルに関するデータの使用を制限される。この測定により、少なくとも予測は、個々のタイルに対し並列に実行しうる。例証目的のみで、
図16は、9つのタイルに再分割されたものとして画像12を示す。
図16に示すように、各タイルの9つのブロックへの再分割も、単に実施例としての機能を果たす。さらに、完全性のために、タイルを別々に符号化する方法は、空間予測(イントラ予測)に制限されえない点に留意すべきである。むしろ、タイルの境界にわたってそれぞれのタイルの符号化パラメータの任意の予測およびそれぞれのタイルの境界にわたってそれぞれのタイルのエントロピー符号化におけるコンテキストセレクションの任意の依存性は、同じタイルのデータのみに依存するように制限されるために、禁じられうる。従って、前記復号化器は、ちょうど述べた操作を並列に、すなわち、タイルを単位にして、実行しうる。
【0085】
いくつかの伝送チャネルにより伝送するために、シンタックス要素は、エントロピー符号化器28によりスライス方向にエントロピー符号化されなければならない。この目的を達成するため、エントロピー符号化器28は、タイルのブロックを、第1のタイルのブロックを最初に横断してスキャンし、その後、タイル順その他に次のタイルのブロックに進める。ラスタースキャン順は、例えば、タイル内でタイルごとにブロックをスキャンするために用いうる。スライスは、その後、伝送の最小単位であるNALユニットにパックされる。スライスをエントロピー符号化する前に、エントロピー符号器28は、そのCABAC確率、すなわち、そのスライスのシンタックス要素を算術符号化するのに使用される確率、を初期化する。前記エントロピー復号化器52は、同じこと、すなわち、スライス開始での確率を初期化する。確率は、様々なコンテキストの現実のシンボル確率統計値に連続的に適合され、従ってCABAC確率のリセットは、適合状態からの偏差を示すので、各初期化は、しかしながら、エントロピー符号化効率に悪影響を与える。当業者に知られているように、確率が現実のシンボル確率統計値に適合する場合のみに、エントロピー符号化は、最適圧縮につながる。
【0086】
従って、復号化器は、本出願の実施例に一致して、
図18に示されるように動作する。前記復号化器は、ステップ80において、タイルにおける切片内にタイル82における画像12を描くローバイトシーケンスペイロードを受信する。
図18において、タイル順84における前記第1のタイル82は、切頂されあるいは2つの切片86aおよび86bに分割されるように、模範的に示され、各々はタイル内のブロックのシーケンスのサブシーケンスを模範的に覆う。そのとき、ステップ82において、切片86aおよび86bは、エントロピー復号化される。しかしながら、切片86aおよび86bのエントロピー復号化において、CABAC確率適応は、切片境界にわたって連続している。すなわち、切片86aを復号化している間、CABAC確率は、連続的に現実のシンボル統計に適合され、かつエントロピー復号化切片86aの終りの状態は、エントロピー復号化切片86bの開始に適合される。ステップ90において、ローバイトシーケンスペイロード、従ってエントロピー復号化、は、画像12を得るために復号化される。
【0087】
タイル82の内部に位置する切片境界92を横断してCABAC確率適合を継続することにより、これら切片境界は、画像12の再分割を越えてタイル82へのエントロピー符号化効率に悪影響を与えない。他方では、タイル並列処理は、依然可能である。そのうえ、切片を個々に送信することは、可能であり、かつ、切片は、完璧なタイル82より小さいので、それぞれのタイルの第1の切片が受信されエントロピー復号化されるとすぐに、ステップ90における各タイルの復号化が、開始できる。
【0088】
図16から18の記述は、第1に、タイルの使用に関係する。上述したように、タイルは、画像の空間分割から生じる。タイルと同様に、スライスも画像を空間的に再分割する。スライスは、従って、並列符号化/復号化を可能とする手段でもある。タイルと同様、スライスが個々に復号化可能なように、予測等は、禁止される。従って、
図16から18の記述も、スライスを切片に分割するのに有効である。
【0089】
WPPサブストリームを使用する際、同上があてはまる。WPPサブストリームも、画像12の空間分割、即ちWPPサブストリームへの分割を表す。タイルおよびスライスと対照的に、WPPサブストリームは、予測上に制限を課さず、WPPサブストリームを越えてセレクションに接触しない。WPPサブストリームは、
図4に示すように、例えばLCU行のようなブロック行に沿って伸長する、そして、並列処理を可能にするために、単に1つの妥協が、WPPサブストリーム(
図4参照)92間に定義されたようにかつ第1のWPPサブストリームを除く各WPPサブストリーム92に対しCABACエントロピー符号化に関して順になされ、CABAC確率は、完全にリセットされないが、導入され、あるいは、等しく設定され、CABAC確率は、各WPPサブストリームに対し、画像12の同じ側、
図4に示されたように、例えば左側などで、LCU順序が開始するとともに、第2のLCU94まですぐ先行するWPPサブストリームをエントロピー復号化された後に生じる。従って、WPPサブストリームのシーケンスの間でのいくらかの符号化遅延に従い、これらWPPサブストリーム92は、画像12が並列に、すなわち同時に復号化される部分が、左から右へ傾いた態様で画像を横断して動くある種の波面96を形成するように、並列に復号化しうる。
【0090】
すなわち、
図16から18の記述をWPPサブストリームへ送信する際に、任意のWPPサブストリーム92(
図4)も、それぞれのWPPサブストリーム92の内部におけるこれら切片98aおよび98bの間の境界100におけるCABAC確率適合の割り込みなしで切片98aおよび98bに再分割され、それにより、両切片98aおよび98bの個々の伝送能力によるエントロピー符号化効率に関するペナルティを避けるが波面並列処理の使用能力を維持し、切片は完全なWPPサブストリーム92より小さいためこの波面並列処理を早く開始できる。
【0091】
図1ないし15に関し、上述したように、NALユニットに切片をパケット化して伝送するいくつかの可能性が存在する。参照が、
図3になされ、その切片またはサブストリームのタイルまたはサブストリームまたはスライスが、各サブストリームまたはタイルの第n切片に先行し、切片境界が局在するのを可能にする情報を示すヘッダとともに算術符号化領域において切片に分割される。他の実施例は、
図9において示されるものである。そこで、タイルまたはWPPサブストリームの切片への再分割が、スライス構造をわずかに変更することで実行される:スライスは、タイルまたはWPPサブストリーム境界で開始される、すなわち、タイルまたはWPPサブストリームの最初で開始される。No_cabac_reset_flagがゼロにセットされ、それにより、通常のCABAC確率は、初期化/リセットを引き起こす。しかしながら、タイルまたはWPPサブストリームの内部で始まる切片を運ぶスライスは、1にセットされるno_cabac_reset_flagを有し、それにより前述のCABAC確率適応の継続を引き起こす。
【0092】
デインターリーブに関する限り、それは、レセプションステップ80において行われる、例えば、各切片に対し、どのWPPサブストリームまたはタイルに関して、それぞれの切片が属するかが決定される。例えば、現在の画像のWPPサブストリームまたはタイルの数を通した総当り循環など異なる可能性が、上述される。その代わりに、前記切片を運ぶためにスライスヘッダを使用する場合に、前記スライスヘッダは、現在の画像12の範囲内でそれぞれのスライスの開始を特定しうる指示からなる。
【0093】
この点に関し、スライス、WPPサブストリームまたはタイルの切片への分解は、各スライス、WPPサブストリーム、またはタイル内で定義された復号化順序に沿って実行されることが指摘される。すなわち、各スライス、WPPサブストリームまたはタイル内において、それぞれのスライス、WPPサブストリームまたはタイルによって空間的にカバーされた画像の部分は、その復号化順序においてそれぞれのスライス、WPPサブストリームまたはタイルに符号化され/から復号化され、それぞれのスライス、WPPサブストリームまたはタイルの各切片は、その復号化順序に沿ってそれぞれのスライス、WPPサブストリームまたはタイルの連続的な部分を覆う。こうして、同じスライス、WPPサブストリーム、またはタイルに属する切片の間での順序、すなわち、符号化/復号化の順序が定義され、各切片はその順序内でランクを持つことになる。WPPサブストリームまたはタイルへの画像の再分割は復号化器に信号伝送されるので、前記復号化器は再分割について知ることになる。従って、各切片をそれぞれのWPPサブストリームまたはタイルに関連付けるために、例えば、各切片が一部を成すタイル/WPPサブストリームの符号化/復号化順序を用いてそれぞれの切片が連続的に画像を覆う開始位置を識別する開始アドレスを有していれば十分となる。所定のタイルあるいはWPPサブストリームに属する切片間の順序でさえ、例えば開始位置を用いれば転送デマルチプレクサまたは復号化器によって再構成しうる。しかしながら、再ソートするためには、RTP伝送に関し上述したように、低位OSI(Open Systems Interconnection)層の転送パケットヘッダの情報は、例えば、復号化順序番号、すなわちDONと同様に使用しうる。上記タイプの転送デマルチプレクサは、上記転送デマルチプレクサと同様に構成して、等しいWPPサブストリームまたはタイルの切片のデータを1つのスライスバッファに、そしてWPPサブストリームまたは異なるWPPサブストリームに関連付けられたタイルまたはタイルの切片のデータを異なるスライスバッファに格納することができる。上述したように、スライス構造、すなわちスライスヘッダは、切片を運ぶのに使用しうる。
【0094】
次に、
図11から15の実施例が、再度換言するために、参照される。これらの図面に記述されたように、スライスSiはNALユニットへパケット化され、各NALユニット110(
図11参照)は、NALユニットヘッダ112を有する。スライスSiはノーマルのスライスもしくは
図9に従い切片を運ぶスライスでありうる点に留意すべきである。従って、これらスライスは、単に1つのWPPサブストリームに関するデータまたは現在の画像のタイル、すなわち、第iのWPPサブストリームのデータまたはタイルをそれぞれ運ぶ。断片化のために、前記NALユニット110は、トランスポートストリーム(TS)パケット114、すなわちそのペイロードセクション116により伝送される。そうするために、各NALユニット110および前記対応するスライスSiは、iを示すそれぞれのサブストリームマーカーMKR、すなわち、NALユニット110に直接後続する直接後続するスライスが属する前記WPPサブストリームまたはタイルにより先行される。
【0095】
異なるWPPサブストリームまたはタイルに属するスライスを運ぶNALユニット110は、
図11から13に説明されたように、1つ以上の基本ストリームES上にまたは同じ基本ストリーム上に分配されうる。上述したように、"基本ストリーム"は、それ自身のRTPセッション中の分離RTPストリームも特定しうる。
【0096】
図14および15に関して説明したように、トランスポートデマルチプレクサは、マルチプレックスバッファMB、スライスバッファSBおよび転送バッファTBを有しうる。スライスバッファSBは、WPPサブストリームまたはタイルの画像を並列復号化しうるマルチスレッド復号器MTDにより引き込まれる。転送バッファTBは、ビデオビットストリームの所定の基本ストリームのTSパケットに属するデータを集め、そのデータをマルチプレックスバッファMBに転送するように構成されている。転送デマルチプレクサは、マルチプレックスバッファMBの出力でTSパケットにパケット化されたNALユニットシーケンスのNALユニットのNALユニットヘッダを評価し、サブストリームマーカーNALユニット内に運ばれたサブストリームマーカーデータを蓄積するとともにサブストリームマーカーNALユニットMKRを落とし、サブストリームマーカーNALユニットに続くNALユニット内のサブストリームのスライスまたはタイルのデータ、ひとつの、すなわち同じスライスバッファSB内の等しいWPPサブストリームまたはタイルとみなすデータフィールド、および、サブストリームマーカーNALユニットに続くNALユニット内のWPPサブストリームまたはタイルのスライスのデータ、異なるスライスバッファSBにおける異なるWPPサブストリームまたはタイルと見なすデータフィールド、を蓄積するように構成されている。
図15に示されるように、トランスポートデマルチプレクサは、
図15におけるTS demuxと呼ばれるデマルチプレクサからなり、ビデオビットストリームを受信し、ビデオビットストリームのTSパケットを異なる基本ストリームに分割、すなわち、ビデオビットストリームのTSパケットを異なる基本ストリームに分配する。前記デマルチプレクサは、この分割または分配を、各基本ストリームが他の基本ストリームのTSパケットのPADと異なるPADのTSパケットからなるように、TSパケットのTSヘッダに含まれる複数のPID(
図15中ではPIDsと記す)に従って実行する。
【0097】
すなわち、スライスが
図9の実施例の意味で切片と対応する場合に、それぞれのWPPサブストリームまたはタイルの対応するスライスバッファSBがそこに含まれるデータを有すると同時に、前記MTD、すなわち、前記マルチスレッド復号化器が、現在の画像の1つ以上のWPPサブストリームまたはタイルを処理開始しうる、その結果、遅延が減少する。
【0098】
若干の態様が、装置に関連して記載されているが、これらの態様は、対応する方法の記載も表すことは明らかである。ここで、1ブロックまたはデバイスは、方法ステップまたは方法ステップの特徴に対応する。類似して、方法ステップに関連して記載されている形態は、対応するブロックまたは項目または対応する装置の特徴の説明を表す。方法のステップのいくつかまたは全てが、例えば、マイクロプロセッサ、プログラミング可能なコンピュータ、または電子回路のようなハードウェア装置により(または使用して)実行されうる。若干の実施の形態において、最も重要な方法ステップの若干またはより多くは、そのような装置により実行されうる。
【0099】
発明の符号化されたビットストリームは、デジタル記憶メディア上に記憶され、または、例えば無線伝送メディアなどの伝送メディアまたはインターネットなどの有線伝送メディア上に伝送されうる。
【0100】
この上記貢献は、それ故、例えばタイル、波面並列処理(WPP)サブストリーム、スライスまたはエントロピースライスなどにおける構造化、とりわけ低遅延カプセル化および新たなHEVC符号化規格により提供されるような構造化ビデオデータの伝送のための方法を記述する。技術は、とりわけエントロピースライス/スライス/タイル/サブストリームのインターリーブされた伝送を介した並列処理符号化器-トランスミッタ-レシーバ-復号化器環境における低遅延伝送を可能にするものを提供する。明細書の導入部で概説されたボトルネック問題を解決するために、および伝送遅延および復号化時間、すなわちエンドツーエンド遅延を最小化するために、並列伝送および処理のためのインターリーブされたエントロピースライススキームのための技術が、とりわけ提供される。
【0101】
特定の実現要求に応じて、本発明の実施の形態は、ハードウェアにおいて、または、ソフトウェアにおいて、実行されうる。その実施態様は、それぞれの方法が実行されるように、プログラミング可能なコンピュータシステムと協働するか(または、協働しうる)、そこに格納された電子的に読み込み可能な制御信号を有するデジタル記憶媒体、例えば、フロッピー(登録商標)ディスク、DVD、ブルーレイ、CD、ROM、PROM、EPROM、EEPROM、またはFLASHメモリを使用して実行されうる。従って、デジタル記憶媒体は、コンピュータ読み込み可能でもよい。
【0102】
本発明による若干の実施の形態は、本願明細書において記載される方法のうちの1つが実行されるように、プログラミング可能なコンピュータシステムと協働することができる電子的に読み込み可能な制御信号を有するデータキャリアを含む。
【0103】
通常、本発明の実施の形態は、プログラムコードを有するコンピュータプログラム製品として実施され、コンピュータプログラム製品がコンピュータ上で実行する場合、プログラムコードは、方法のうちの1つを実行するために作動される。プログラムコードは、機械可読キャリアに、例えば、格納されうる。
【0104】
他の実施の形態は、機械可読キャリアに格納され、本願明細書において記載される方法のうちの1つを実行するためのコンピュータプログラムを含む。
【0105】
換言すれば、従って、コンピュータプログラムがコンピュータ上で実行する場合、本発明の方法の実施の形態は、本願明細書において記載される方法のうちの1つを実行するためのプログラムコードを有するコンピュータプログラムである。
【0106】
従って、本発明の方法の更なる実施の形態は、その上に記録され、本願明細書において記載される方法のうちの1つを実行するためのコンピュータプログラムを含むデータキャリア(または、デジタル記憶媒体、またはコンピュータ可読媒体)である。データキャリア、デジタル記憶媒体または記録された媒体は、一般的には、有形でありおよび/または、非過渡的である。
【0107】
従って、本発明の方法の更なる実施の形態は、本願明細書において記載される方法のうちの1つを実行するためのコンピュータプログラムを表しているデータストリームまたは一連の信号である。例えば、データストリームまたは一連の信号は、データ通信接続、例えば、インターネットを介して転送されるように構成されうる。
【0108】
更なる実施の形態は、本願明細書において記載される方法のうちの1つを実行するために構成され、または適応される処理手段、例えば、コンピュータ、またはプログラミング可能な論理回路を含む。
【0109】
更なる実施の形態は、その上にインストールされ、本願明細書において記載される方法のうちの1つを実行するためのコンピュータプログラムを有するコンピュータを含む。
【0110】
本発明による更なる実施の形態は、レシーバに本願明細書に記載される方法のうちの1つを実行するためのコンピュータプログラムを(例えば、電子的にまたは光学的に)転送するために構成される装置またはシステムを含む。レシーバは、例えば、コンピュータ、モバイル機器、メモリ素子等でもよい。装置またはシステムは、例えば、レシーバにコンピュータプログラムを転送するためのファイルサーバを含む。
【0111】
いくつかの実施の形態において、プログラミング可能な論理回路(例えば、フィールドプログラマブルゲートアレイ)が、本願明細書において記載される方法のいくつかのまたは全ての機能を実行するために使用されうる。いくつかの実施の形態において、フィールドプログラマブルゲートアレイは、本願明細書において記載される方法の1つを実行するために、マイクロプロセッサと協働しうる。一般に、方法は、いくつかのハードウェア装置により、好ましくは実行される。
【0112】
上述した実施の形態は、本発明の原則の例を表すだけである。本願明細書において記載される装置の修正および配置の変更および詳細は、他の当業者にとって明らかであるものと理解される。従って、既決の特許請求の範囲だけによりのみ制限され、ならびに、本願発明の記述および説明により表された明細書の詳細な記載によっては、制限されない。
【0113】
文献
[1]Thomas Wiegand, Gary J. Sullivan, Gisle Bjontegaard, Ajay Luthra, "Overvie
w of the H.264/AVC Video Coding Standard", IEEE Trans. Circuits Syst. Vide
o Technol., vol. 13, N7, July 2003.
[2]JCTVC-E196,"Wavefront Parallel Processing", 5th JCT-VC Meeting, Geneva 2011.
[3]JCTVC-D070, "Lightweight slicing for entropy coding", 4th Meeting, Daegu,
2011.
[4]JCTVC-D073, "Periodic initialization for wavefront coding functionality",
4th Meeting, Daegu, 2011.
[5]HEVC WD5: Working Draft 5 of High-Efficiency Video Coding JTCVC-G1103, 5th
JCT-VC Meeting, Geneva Meeting November 2011.
[6]JTCVC-D243, "Analysis of entropy slices approaches", 4th Meeting, Daegu, 2011.
[7]ISO/IEC13818-1/2011, MPEG-2 Transport Stream including AMDs 1-6.
[8]IETF Real-time transport protocol, RTP RFC 3550.
[9]IETF RTP Payload Format, IETF RFC 6184.
[10]JCTVC-F275, Wavefront and Cabac Flush: Different Degrees of Parallelism
Without Transcoding, , Torino Meeting
[11]JCT-VC-F724, Wavefront Parallel Processing for HEVC Encoding and Decodin
g,Torino Meeting** at end of description
[12]IETF Session Description Protocol (SDP), RFC 4566
[13]IETF RTP Payload Format for High Efficiency Video Coding, draft-schierl- payload-h265