IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ エルジー エレクトロニクス インコーポレイティドの特許一覧

特開2023-158102映像/ビデオコーディングのための映像情報処理方法及び装置
<>
  • 特開-映像/ビデオコーディングのための映像情報処理方法及び装置 図1
  • 特開-映像/ビデオコーディングのための映像情報処理方法及び装置 図2
  • 特開-映像/ビデオコーディングのための映像情報処理方法及び装置 図3
  • 特開-映像/ビデオコーディングのための映像情報処理方法及び装置 図4
  • 特開-映像/ビデオコーディングのための映像情報処理方法及び装置 図5
  • 特開-映像/ビデオコーディングのための映像情報処理方法及び装置 図6
  • 特開-映像/ビデオコーディングのための映像情報処理方法及び装置 図7
  • 特開-映像/ビデオコーディングのための映像情報処理方法及び装置 図8
  • 特開-映像/ビデオコーディングのための映像情報処理方法及び装置 図9
  • 特開-映像/ビデオコーディングのための映像情報処理方法及び装置 図10
  • 特開-映像/ビデオコーディングのための映像情報処理方法及び装置 図11
  • 特開-映像/ビデオコーディングのための映像情報処理方法及び装置 図12
  • 特開-映像/ビデオコーディングのための映像情報処理方法及び装置 図13
  • 特開-映像/ビデオコーディングのための映像情報処理方法及び装置 図14
  • 特開-映像/ビデオコーディングのための映像情報処理方法及び装置 図15
  • 特開-映像/ビデオコーディングのための映像情報処理方法及び装置 図16
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023158102
(43)【公開日】2023-10-26
(54)【発明の名称】映像/ビデオコーディングのための映像情報処理方法及び装置
(51)【国際特許分類】
   H04N 19/70 20140101AFI20231019BHJP
   H04N 19/107 20140101ALI20231019BHJP
   H04N 19/157 20140101ALI20231019BHJP
   H04N 19/174 20140101ALI20231019BHJP
【FI】
H04N19/70
H04N19/107
H04N19/157
H04N19/174
【審査請求】有
【請求項の数】3
【出願形態】OL
(21)【出願番号】P 2023144160
(22)【出願日】2023-09-06
(62)【分割の表示】P 2022525896の分割
【原出願日】2020-11-05
(31)【優先権主張番号】62/931,147
(32)【優先日】2019-11-05
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】502032105
【氏名又は名称】エルジー エレクトロニクス インコーポレイティド
【氏名又は名称原語表記】LG ELECTRONICS INC.
【住所又は居所原語表記】128, Yeoui-daero, Yeongdeungpo-gu, 07336 Seoul,Republic of Korea
(74)【代理人】
【識別番号】100099759
【弁理士】
【氏名又は名称】青木 篤
(74)【代理人】
【識別番号】100123582
【弁理士】
【氏名又は名称】三橋 真二
(74)【代理人】
【識別番号】100165191
【弁理士】
【氏名又は名称】河合 章
(74)【代理人】
【識別番号】100114018
【弁理士】
【氏名又は名称】南山 知広
(74)【代理人】
【識別番号】100159259
【弁理士】
【氏名又は名称】竹本 実
(72)【発明者】
【氏名】パルリ シータル
(72)【発明者】
【氏名】ヘンドリー ヘンドリー
(72)【発明者】
【氏名】キム スンファン
(72)【発明者】
【氏名】チャオ チエ
(57)【要約】
【課題】ビデオデコーディング方法の提供。
【解決手段】方法は、ビットストリームから映像情報を取得するステップ、ここで、前記映像情報は、現在ピクチャと関連したピクチャヘッダを含み、前記現在ピクチャは、複数個のスライスを含む、デコーディングプロセスのためのインター予測動作に必要な情報が前記ピクチャヘッダに存在するかを示す第1のフラグまたは前記デコーディングプロセスのためのイントラ予測動作に必要な情報が前記ピクチャヘッダに存在するかを示す第2のフラグのうち少なくとも一つを前記ピクチャヘッダからパーシングするステップ、前記第1のフラグまたは前記第2のフラグのうち少なくとも一つに基づいて、前記現在ピクチャ内のスライスに対してイントラ予測またはインター予測のうち少なくとも一つを実行して予測サンプルを生成するステップ、及び前記予測サンプルに基づいて復元サンプルを生成するステップを含む。
【選択図】図12
【特許請求の範囲】
【請求項1】
ビデオデコーディング装置により実行されるビデオデコーディング方法において、
現在ピクチャに対するピクチャヘッダを含むビットストリームを受信するステップと、
インタースライスのための情報が前記ピクチャヘッダに存在するかどうかに関連した第1のフラグ、又は、イントラスライスのための情報が前記ピクチャヘッダに存在するかどうかに関連した第2のフラグの少なくとも一つを前記ピクチャヘッダからパーシングするステップと、
前記第1のフラグ又は前記第2のフラグの少なくとも一つに基づいて、前記現在ピクチャ内のスライス内のブロックに対する予測サンプルを導出するステップであって、前記予測サンプルは、イントラ予測又はインター予測の少なくとも一つを実行することにより導出される、ステップと、
前記予測サンプルに基づいて復元サンプルを生成するステップと、を含み、
前記第1のフラグの値が1に等しいことに基づいて、
クアッドツリー分割に起因する最小サイズの底が2の対数と、前記現在ピクチャ内の前記インタースライス内の最小コーディングブロックサイズの底が2の対数との間の差を表す第1シンタックスエレメントと、
前記現在ピクチャ内の前記インタースライス内のマルチタイプツリー分割に起因するコーディングユニットに対する最大階層深さを表す第2シンタックスエレメントと、
の少なくとも一つを含む前記インタースライスのための前記情報は、前記ピクチャヘッダに含まれる、ビデオデコーディング方法。
【請求項2】
前記第1のフラグの値が0であることに基づいて、前記現在ピクチャ内のスライスは、Iスライスのタイプを有する、請求項1に記載のビデオデコーディング方法。
【請求項3】
前記第1のフラグの値が1であることに基づいて、前記現在ピクチャ内の0個以上のスライスは、PスライスまたはBスライスのタイプを有する、請求項1に記載のビデオデコーディング方法。
【請求項4】
ビデオエンコーディング装置により実行されるビデオエンコーディング方法において、
現在ピクチャ内のスライスのタイプを決定するステップであって、前記現在ピクチャは、前記スライスを含む、ステップと、
インタースライスのための情報が前記現在ピクチャと関連したピクチャヘッダに存在するかどうかに関連した第1のフラグ、又は、イントラスライスのための情報が前記ピクチャヘッダに存在するかどうかに関連した第2のフラグの少なくとも一つを生成するステップと、
前記第1のフラグ又は前記第2のフラグの少なくとも一つを含む映像情報をエンコーディングするステップと、を含み、
前記第1のフラグ及び前記第2のフラグは、前記映像情報の前記ピクチャヘッダに含まれ、
前記第1のフラグの値が1に等しいことに基づいて、
クアッドツリー分割に起因する最小サイズの底が2の対数と、前記現在ピクチャ内の前記インタースライス内の最小コーディングブロックサイズの底が2の対数との間の差を表す第1シンタックスエレメントと、
前記現在ピクチャ内の前記インタースライス内のマルチタイプツリー分割に起因するコーディングユニットに対する最大階層深さを表す第2シンタックスエレメントと、
の少なくとも一つを含む前記インタースライスのための前記情報は、前記ピクチャヘッダに含まれる、ビデオエンコーディング方法。
【請求項5】
前記現在ピクチャ内の全てのスライスがIスライスのタイプを有することに基づいて、前記第1のフラグの値は、0である、請求項4に記載のビデオエンコーディング方法。
【請求項6】
前記現在ピクチャ内の1個以上のスライスがPスライスまたはBスライスのタイプを有することに基づいて、前記第1のフラグの値は、1である、請求項4に記載のビデオエンコーディング方法。
【請求項7】
ビデオのためのデータの送信方法であって、
前記ビデオのためのビットストリームを取得するステップであって、前記ビットストリームは、
現在ピクチャ内のスライスの種類を決定するステップであって、前記現在ピクチャは、前記スライスを含む、ステップと、
インタースライスのための情報が前記現在ピクチャと関連したピクチャヘッダに存在するかどうかに関連した第1のフラグ、又は、イントラスライスのための情報が前記ピクチャヘッダに存在するかどうかに関連した第2のフラグの少なくとも一つを生成するステップと、
前記第1のフラグ又は前記第2のフラグの少なくとも一つを含む映像情報をエンコーディングするステップと、
に基づいて生成される、ステップと、
前記ビットストリームを含む前記データを送信するステップと、を含み、
前記第1のフラグ及び前記第2のフラグは、前記映像情報の前記ピクチャヘッダに含まれ、
前記第1のフラグの値が1に等しいことに基づいて、
クアッドツリー分割に起因する最小サイズの底が2の対数と、前記現在ピクチャ内の前記インタースライス内の最小コーディングブロックサイズの底が2の対数との間の差を表す第1シンタックスエレメントと、
前記現在ピクチャ内の前記インタースライス内のマルチタイプツリー分割に起因するコーディングユニットに対する最大階層深さを表す第2シンタックスエレメントと、
の少なくとも一つを含む前記インタースライスのための前記情報は、前記ピクチャヘッダに含まれる、方法。
【発明の詳細な説明】
【技術分野】
【0001】
本技術は、映像/ビデオをコーディングするにあたっての映像情報を処理する方法及び装置に関する。
【背景技術】
【0002】
最近、UHD(Ultra High Definition)映像/ビデオのような4Kまたは8K以上の高解像度、高品質の映像/ビデオに対する需要が多様な分野で増加している。映像/ビデオデータが高解像度、高品質になるほど、既存の映像/ビデオデータに比べて相対的に送信される情報量またはビット量が増加するため、既存の有無線広帯域回線のような媒体を利用して映像データを送信し、または既存の格納媒体を利用して映像/ビデオデータを格納する場合、送信費用と格納費用が増加する。
【0003】
また、近年、VR(Virtual Reality)、AR(Artificial Realtiy)コンテンツやホログラムなどの実感メディア(Immersive Media)に対する関心及び需要が増加しており、ゲーム画像のように、現実画像と異なる画像特性を有する画像/ビデオに対する放送が増加している。
【0004】
これにより、前記のような様々な特性を有する高解像度・高品質の画像/ビデオの情報を効果的に圧縮して送信するか、格納し、再生するために高効率の画像/ビデオ圧縮技術が求められる。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本文書の技術的課題は、映像/ビデオのコーディング効率を上げる方法及び装置を提供することにある。
【0006】
本文書の他の技術的課題は、映像/ビデオのコーディングにおいて、効率的にインター予測(inter prediction)及び/またはイントラ予測(intra prediction)を実行する方法及び装置を提供することにある。
【0007】
本文書の他の技術的課題は、映像/ビデオをコーディングするにあたっての不要なシグナリングを防止する方法及び装置を提供することにある。
【0008】
本文書の他の技術的課題は、映像/ビデオの情報を伝達するにあたってのインター予測及び/またはイントラ予測に不要なシグナリングを省略する方法及び装置を提供することにある。
【課題を解決するための手段】
【0009】
本文書の一実施例によると、ビデオデコーディング装置により実行されるビデオデコーディング方法は、ビットストリームから映像情報を取得するステップ、ここで、前記映像情報は、現在ピクチャと関連したピクチャヘッダを含み、前記現在ピクチャは、複数個のスライスを含む、デコーディングプロセスのためのインター予測動作に必要な情報が前記ピクチャヘッダに存在するかを示す第1のフラグまたは前記デコーディングプロセスのためのイントラ予測動作に必要な情報が前記ピクチャヘッダに存在するかを示す第2のフラグのうち少なくとも一つを前記ピクチャヘッダからパーシングするステップ、前記第1のフラグまたは前記第2のフラグのうち少なくとも一つに基づいて、前記現在ピクチャ内のスライスに対してイントラ予測またはインター予測のうち少なくとも一つを実行して予測サンプルを生成するステップ、及び前記予測サンプルに基づいて復元サンプルを生成するステップを含む。
【0010】
本文書の他の実施例によると、ビデオエンコーディング装置により実行されるビデオエンコーディング方法は、現在ピクチャ内の現在ブロックの予測モードを決定するステップ、ここで、前記現在ピクチャは、複数個のスライスを含む、前記予測モードに基づいて前記現在ブロックに対する予測サンプルを生成するステップ、前記予測モードに基づいて、デコーディングプロセスのためのインター予測動作に必要な情報が前記現在ピクチャと関連したピクチャヘッダに存在するかを示す第1の情報または前記デコーディングプロセスのためのイントラ予測動作に必要な情報が前記ピクチャヘッダに存在するかを示す第2の情報のうち少なくとも一つを生成するステップ、及び前記第1の情報または前記第2の情報のうち少なくとも一つを含む映像情報をエンコーディングするステップを含み、前記第1の情報と前記第2の情報は、前記映像情報の前記ピクチャヘッダに含まれる。
【0011】
本文書の他の実施例によると、コンピュータ読み取り可能なデジタル格納媒体であって、前記デジタル格納媒体は、デコーディング装置によりビデオデコーディング方法を実行するようにする情報を含み、前記デコーディング方法は、映像情報を取得するステップ、ここで、前記映像情報は、現在ピクチャと関連したピクチャヘッダを含み、前記現在ピクチャは、複数個のスライスを含む、デコーディングプロセスのためのインター予測動作に必要な情報が前記ピクチャヘッダに存在するかを示す第1のフラグまたは前記デコーディングプロセスのためのイントラ予測動作に必要な情報が前記ピクチャヘッダに存在するかを示す第2のフラグのうち少なくとも一つを前記ピクチャヘッダからパーシングするステップ、前記第1のフラグまたは前記第2のフラグのうち少なくとも一つに基づいて、前記現在ピクチャ内のスライスに対してイントラ予測またはインター予測のうち少なくとも一つを実行して予測サンプルを生成するステップ、及び前記予測サンプルに基づいて復元サンプルを生成するステップを含む。
【発明の効果】
【0012】
本文書の一実施例によると、全般的な映像/ビデオの圧縮効率を向上させることができる。
【0013】
本文書の一実施例によると、映像/ビデオをコーディングするとき、効率的にインター予測及び/またはイントラ予測を実行することができる。
【0014】
本文書の一実施例によると、映像/ビデオをコーディングするとき、不要なシグナリングが省略されることができる。
【0015】
本文書の一実施例によると、映像/ビデオを送信するとき、インター予測またはイントラ予測に不要なシンタックス要素のシグナリングが防止されることができる。
【図面の簡単な説明】
【0016】
図1】本文書の実施例が適用できるビデオ/映像コーディングシステムの例を概略的に示す。
図2】本文書の実施例が適用できるビデオ/映像エンコーディング装置の構成を概略的に説明する図である。
図3】本文書の実施例が適用できるビデオ/映像デコーディング装置の構成を概略的に説明する図面である。
図4】イントラ予測ベースのビデオ/映像エンコーディング方法の例を示す。
図5】エンコーディング装置内のイントラ予測部を概略的に示す。
図6】イントラ予測ベースのビデオ/映像デコーディング方法の例を示す。
図7】デコーディング装置内のインター予測部を概略的に示す。
図8】インター予測ベースのビデオ/映像エンコーディング方法の例を示す。
図9】エンコーディング装置内のインター予測部を概略的に示す。
図10】インター予測ベースのビデオ/映像デコーディング方法の例を示す。
図11】デコーディング装置内のインター予測部を概略的に示す。
図12】本文書の実施例に係るビデオ/映像エンコーディング方法及び関連コンポーネントの一例を概略的に示す。
図13】本文書の実施例に係るビデオ/映像エンコーディング方法及び関連コンポーネントの一例を概略的に示す。
図14】本文書の実施例に係るビデオ/映像デコーディング方法及び関連コンポーネントの一例を概略的に示す。
図15】本文書の実施例に係るビデオ/映像デコーディング方法及び関連コンポーネントの一例を概略的に示す。
図16】本文書に開示された実施例が適用されることができるコンテンツストリーミングシステムの例を示す。
【発明を実施するための形態】
【0017】
本文書の開示は様々な変更を加えることができ、様々な実施例が有することができるため、特定の実施例を図面に例示し、詳細に説明しようとする。本文書で使用する用語は、単に特定の実施例を説明するために使用されたものであって、本文書の技術的思想を限定しようとする意図で使用されるものではない。単数の表現は、文脈上明白に異なる意味を有しない限り、「少なくとも1つ」の表現を含む。本文書において「含む」又は「有する」などの用語は、明細書上に記載された特徴、数字、ステップ、動作、構成要素、部品、またはこれらを組み合わせたものが存在することを指定しようとするものであり、1つ又はそれ以上の他の特徴や数字、ステップ、動作、構成要素、部品、またはこれらを組み合わせたものなどの存在又は付加可能性を予め排除しないことと理解されるべきである。
【0018】
一方、本文書において説明される図面上の各構成は、互いに異なる特徴的な機能に関する説明の便宜のために独立的に図示されたものであって、各構成が互いに別個のハードウェアや別個のソフトウェアで実現されるということを意味するものではない。例えば、各構成のうち、2つ以上の構成が結合されて1つの構成をなすこともでき、1つの構成を複数の構成に分けることもできる。各構成が統合及び/又は分離された実施例も本文書において開示された方法の本質から逸脱しない限り、本文書の開示範囲に含まれる。
【0019】
本文書は、ビデオ(video)/映像(image)コーディングに関する。例えば、この文書において開示された方法/実施例は、VVC(versatile video coding)標準に開示される方法に適用できる。また、この文書において開示された方法/実施例は、EVC(essential video coding)標準、AV1(AOMedia Video 1)標準、AVS2(2nd generation of audio video coding standard)又は次世代ビデオ/映像コーディング標準(ex.H.267、H.268など)に開示される方法に適用できる。
【0020】
本文書においてはビデオ/映像コーディングに関する様々な実施例が提示され、他に言及がない限り、前記実施例は互いに組み合わせて行われることもできる。
【0021】
この文書においてビデオ(video)は、時間の流れによる一連の映像(image)の集合を意味し得る。ピクチャ(picture)は、一般に特定の時間帯の1つの映像を示す単位を意味し、スライス(slice)/タイル(tile)はコーディングにおいてピクチャの一部を構成する単位である。スライス/タイルは、1つ以上のCTU(coding tree unit)を含む。1つのピクチャは1つ以上のスライス/タイルで構成される。1つのピクチャは1つ以上のタイルグループで構成される。1つのタイルグループは1つ以上のタイルを含む。ブリックはピクチャ内のタイル内のCTU行の四角領域を示す(a brick may represent a rectangular region of CTU rows within a tile in a picture)。タイルは多数のブリックによりパーティショニングされ、各ブリックは前記タイル内の1つ以上のCTU行で構成される(A tile may be partitioned into multiple bricks, each of which consisting of one or more CTU rows within the tile)。複数のブリックにパーティショニングされていないタイルもブリックと呼ばれてもよい(A tile that is not partitioned into multiple bricks may be also referred to as a brick)。ブリックスキャンはピクチャをパーティショニングするCTUの特定の順次オーダリングを示し、前記CTUはブリック内においてCTUラスタスキャンで整列され、タイル内のブリックは前記タイルの前記ブリックのラスタスキャンで連続的に整列され、そして、ピクチャ内のタイルは前記ピクチャの前記タイルのラスタスキャンで連続的に整列される(A brick scan is a specific sequential ordering of CTUs partitioning a picture in which the CTUs are ordered consecutively in CTU raster scan in a brick, bricks within a tile are ordered consecutively in a raster scan of the bricks of the tile, and tiles in a picture are ordered consecutively in a raster scan of the tiles of the picture)。タイルは特定タイル列及び特定タイル列以内のCTUの四角領域である(A tile is a rectangular region of CTUs within a particular tile column and a particular tile row in a picture)。前記タイル列はCTUの四角領域であり、前記四角領域は前記ピクチャの高さと同じ高さを有し、幅はピクチャパラメータセット内のシンタックス要素により明示される(The tile column is a rectangular region of CTUs having a height equal to the height of the picture and a width specified by syntax elements in the picture parameter set)。前記タイル行はCTUの四角領域であり、前記四角領域はピクチャパラメータセット内のシンタックス要素により明示される幅を有し、高さは前記ピクチャの高さと同一であり得る(The tile row is a rectangular region of CTUs having a height specified by syntax elements in the picture parameter set and a width equal to the width of the picture)。タイルスキャンはピクチャをパーティショニングするCTUの特定の順次オーダリングを示し、前記CTUはタイル内のCTUラスタスキャンで連続的に整列され、ピクチャ内のタイルは前記ピクチャの前記タイルのラスタスキャンで連続的に整列される(A tile scan is a specific sequential ordering of CTUs partitioning a picture in which the CTUs are ordered consecutively in CTU raster scan in a tile whereas tiles in a picture are ordered consecutively in a raster scan of the tiles of the picture)。スライスはピクチャの整数個のブリックを含み、前記整数個のブリックは1つのNALユニットに含まれる(A slice includes an integer number of bricks of a picture that may be exclusively contained in a single NAL unit)。スライスは複数の完全なタイルで構成され、または、1つのタイルの完全なブリックの連続的なシーケンスであり得る(A slice may consists of either a number of complete tiles or only a consecutive sequence of complete bricks of one tile)。この文書において、タイルグループとスライスは混用されてもよい。例えば、本文書において、tile group/tile group headerはslice/slice headerと呼ばれてもよい。
【0022】
ピクセル(pixel)またはペル(pel)は、1つのピクチャ(または、映像)を構成する最小の単位を意味することができる。また、ピクセルに対応する用語として「サンプル(sample)」が使用されることができる。サンプルは、一般的にピクセルまたはピクセルの値を示すことができ、ルマ(luma)成分のピクセル/ピクセル値のみを示すこともでき、クロマ(chroma)成分のピクセル/ピクセル値のみを示すこともできる。または、サンプルは、空間ドメインでのピクセル値を意味することもでき、このようなピクセル値が周波数ドメインに変換されると、周波数ドメインでの変換係数を意味することもできる。
【0023】
ユニット(unit)は、映像処理の基本単位を示すことができる。ユニットは、ピクチャの特定領域及び当該領域に関連した情報のうち少なくとも1つを含むことができる。1つのユニットは、1つのルマブロック及び2つのクロマ(例えば、cb、cr)ブロックを含むことができる。ユニットは、場合によって、ブロック(block)または領域(area)などの用語と混用して使用されることができる。一般的な場合、M×Nブロックは、M個の列とN個の行からなるサンプル(または、サンプルアレイ)、または変換係数(transform coefficient)の集合(または、アレイ)を含むことができる。
【0024】
この文書において、「/」と「、」は「及び/又は」と解釈される。例えば,「A/B」は「A及び/又はB」と解釈され,「A、B」は「A及び/又はB」と解釈される。追加的に、「A/B/C」は「A、B及び/又はCの少なくとも1つ」を意味する。また、「A、B、C」も「A、B及び/又はCの少なくとも1つ」を意味する(In this document, the term "/" and "," should be interpreted to indicate "and/or". For instance, the expression "A/B" may mean "A and/or B." Further, "A, B" may mean "A and/or B." Further, "A/B/C" may mean "at least one of A, B, and/or C." Also, "A/B/C" may mean "at least one of A, B, and/or C.")。
【0025】
追加的に、本文書において、「又は」は「及び/又は」と解釈される。例えば、「A又はB」は、1)「A」のみを意味し、2)「B」のみを意味するか、3)「A及びB」を意味し得る。言い換えれば、本文書の「又は」は「追加的に又は代替的に(additionally or alternatively)」を意味し得る(Further, in the document, the term "or" should be interpreted to indicate "and/or." For instance, the expression "A or B" may comprise 1)only A, 2)only B, and/or 3)both A and B. In other words, the term "or" in this document should be interpreted to indicate "additionally or alternatively.")。
【0026】
また、本文書で使われる括弧は、「例えば(for example)」を意味することができる。具体的に、「予測(イントラ予測)」で表示された場合、「予測」の一例として「イントラ予測」が提案されたことである。即ち、本文書の「予測」は、「イントラ予測」に制限(limit)されずに、「イントラ予測」が「予測」の一例として提案されたことである。また、「予測(即ち、イントラ予測)」で表示された場合にも、「予測」の一例として「イントラ予測」が提案されたことである。
【0027】
以下、添付した図面を参照して、本文書の実施例をより詳細に説明する。以下、図面上の同一の構成要素に対しては同一の参照符号を使用し、同一の構成要素に関して重複する説明は省略する。
【0028】
図1は、本文書の実施例が適用できるビデオ/映像コーディングシステムの例を概略的に示す。
【0029】
図1に示すように、ビデオ/映像コーディングシステムは、第1の装置(ソースデバイス)及び第2の装置(受信デバイス)を備える。ソースデバイスは、エンコーディングされたビデオ(video)/映像(image)情報又はデータをファイル又はストリーミング形態でデジタル格納媒体又はネットワークを介して受信デバイスに伝達することができる。
【0030】
前記ソースデバイスは、ビデオソース、エンコーディング装置、送信部を含むことができる。前記受信デバイスは、受信部、デコーディング装置、及びレンダラを含むことができる。前記エンコーディング装置は、ビデオ/映像エンコーディング装置と呼ばれることができ、前記デコーディング装置は、ビデオ/映像デコーディング装置と呼ばれることができる。送信機は、エンコーディング装置に含まれることができる。受信機は、デコーディング装置に含まれることができる。レンダラは、ディスプレイ部を含むこともでき、ディスプレイ部は、別個のデバイスまたは外部コンポーネントで構成されることもできる。
【0031】
ビデオソースは、ビデオ/映像のキャプチャ、合成または生成過程などを介してビデオ/映像を取得することができる。ビデオソースは、ビデオ/映像キャプチャデバイス及び/またはビデオ/映像生成デバイスを含むことができる。ビデオ/映像キャプチャデバイスは、例えば、1つ以上のカメラ、以前にキャプチャされたビデオ/映像を含むビデオ/映像アーカイブなどを含むことができる。ビデオ/映像生成デバイスは、例えば、コンピュータ、タブレット、及びスマートフォンなどを含むことができ、(電子的に)ビデオ/映像を生成することができる。例えば、コンピュータなどを介して仮想のビデオ/映像が生成されることができ、この場合、ビデオ/映像キャプチャ過程を関連データが生成される過程に代替されることができる。
【0032】
エンコーディング装置は、入力ビデオ/映像をエンコーディングすることができる。エンコーディング装置は、圧縮及びコーディング効率のために、予測、変換、量子化など、一連の手順を実行することができる。エンコーディングされたデータ(エンコーディングされたビデオ/映像情報)は、ビットストリーム(bitstream)形態で出力されることができる。
【0033】
送信部は、ビットストリーム形態で出力されたエンコーディングされたビデオ/映像情報またはデータをファイルまたはストリーミング形態でデジタル格納媒体またはネットワークを介して受信デバイスの受信部に伝達できる。デジタル格納媒体は、USB、SD、CD、DVD、ブルーレイ、HDD、SSDなど、多様な格納媒体を含むことができる。送信部は、予め決められたファイルフォーマットを介してメディアファイルを生成するためのエレメントを含むことができ、放送/通信ネットワークを介した送信のためのエレメントを含むことができる。受信部は、前記ビットストリームを受信/抽出してデコーディング装置に伝達できる。
【0034】
デコーディング装置は、エンコーディング装置の動作に対応する逆量子化、逆変換、予測など、一連の手順を実行してビデオ/映像をデコーディングすることができる。
【0035】
レンダラは、デコーディングされたビデオ/映像をレンダリングすることができる。レンダリングされたビデオ/映像は、ディスプレイ部を介してディスプレイされることができる。
【0036】
本文書において、一つの図面内で個別的に説明される技術的特徴は、個別的に具現されることもでき、同時に具現されることもできる。
【0037】
図2は、本文書の実施例が適用できるビデオ/映像エンコーディング装置の構成を概略的に説明する図である。以下、ビデオエンコーディング装置とは、映像エンコーディング装置を含む。
【0038】
図2に示すように、エンコーディング装置200は、画像分割部(image partitioner)210、予測部(predictor)220、レジデュアル処理部(residual processor)230、エントロピーエンコーディング部(entropy encoder)240、加算部(adder)250、フィルタリング部(filter)260、及びメモリ(memory)270を備えて構成されることができる。予測部220は、インター予測部221及びイントラ予測部222を備えることができる。レジデュアル処理部230は、変換部(transformer)232、量子化部(quantizer)233、逆量子化部(dequantizer)234、逆変換部(inverse transformer)235を備えることができる。レジデュアル処理部230は、減算部(subtractor、231)をさらに備えることができる。加算部250は、復元部(reconstructor)または復元ブロック生成部(recontructged block generator)と呼ばれることができる。上述した画像分割部210、予測部220、レジデュアル処理部230、エントロピーエンコーディング部240、加算部250、及びフィルタリング部260は、実施形態によって1つ以上のハードウェアコンポーネント(例えば、エンコーダチップセットまたはプロセッサ)によって構成されることができる。また、メモリ270は、DPB(decoded picture buffer)を備えることができ、デジタル格納媒体によって構成されることもできる。前記ハードウェアコンポーネントは、メモリ270を内/外部コンポーネントとしてさらに備えることもできる。
【0039】
画像分割部210は、エンコーディング装置200に入力された入力画像(または、ピクチャ、フレーム)を1つ以上の処理ユニット(processing unit)に分割することができる。一例として、前記処理ユニットは、コーディングユニット(coding unit、CU)と呼ばれることができる。この場合、コーディングユニットは、コーディングツリーユニット(coding tree unit、CTU)または最大コーディングユニット(largest coding unit、LCU)からQTBTTT(Quad-tree binary-tree ternary-tree)構造によって再帰的に(recursively)分割されることができる。例えば、1つのコーディングユニットは、クアッドツリー構造、バイナリツリー構造、及び/またはターナリ構造に基づいて下位(deeper)デプスの複数のコーディングユニットに分割されることができる。この場合、例えば、クアッドツリー構造が先に適用され、バイナリツリー構造及び/またはターナリ構造がその後に適用されることができる。または、バイナリツリー構造が先に適用されることもできる。それ以上分割されない最終コーディングユニットに基づいて本開示に係るコーディング手順が行われ得る。この場合、画像特性によるコーディング効率などに基づいて、最大コーディングユニットが最終コーディングユニットとして使用されることができ、または、必要に応じてコーディングユニットは、再帰的に(recursively)もっと下位デプスのコーディングユニットに分割されて最適のサイズのコーディングユニットが最終コーディングユニットとして使用されることができる。ここで、コーディング手順とは、後述する予測、変換、及び復元などの手順を含むことができる。他の例として、前記処理ユニットは、予測ユニット(PU:Prediction Unit)または変換ユニット(TU:Transform Unit)をさらに備えることができる。この場合、前記予測ユニット及び前記変換ユニットは、各々上述した最終コーディングユニットから分割またはパーティショニングされることができる。前記予測ユニットは、サンプル予測の単位であることができ、前記変換ユニットは、変換係数を導く単位及び/または変換係数からレジデュアル信号(residual signal)を導く単位であることができる。
【0040】
ユニットは、場合によって、ブロック(block)または領域(area)などの用語と混用して使用されることができる。一般的な場合、M×Nブロックは、M個の列とN個の行からなるサンプルまたは変換係数(transform coefficient)等の集合を示すことができる。サンプルは、一般的にピクセルまたはピクセルの値を示すことができ、輝度(luma)成分のピクセル/ピクセル値のみを示すことができ、彩度(chroma)成分のピクセル/ピクセル値のみを示すこともできる。サンプルは、1つのピクチャ(または、画像)をピクセル(pixel)またはペル(pel)に対応する用語として使用することができる。
【0041】
エンコーディング装置200は、入力映像信号(原本ブロック、原本サンプルアレイ)からインター予測部221又はイントラ予測部222から出力された予測信号(予測されたブロック、予測サンプルアレイ)を減算してレジデュアル信号(residual signal、残余ブロック、残余サンプルアレイ)を生成し、生成されたレジデュアル信号は変換部232に送信される。この場合、図示されているように、エンコーダ200内において入力映像信号(原本ブロック、原本サンプルアレイ)から予測信号(予測ブロック、予測サンプルアレイ)を減算するユニットは、減算部231と呼ばれる。予測部220は、処理対象ブロック(以下、現在ブロックという)に対する予測を行い、前記現在ブロックに対する予測サンプルを含む予測されたブロック(predicted block)を生成することができる。予測部220は、現在ブロック又はCU単位でイントラ予測が適用されるか又はインター予測が適用されるかを決定する。予測部220は、各予測モードに関する説明において後述するように予測モード情報などの予測に関する様々な情報を生成してエントロピーエンコーディング部240に伝達することができる。予測に関する情報はエントロピーエンコーディング部240においてエンコーディングされてビットストリームの形態で出力されることができる。
【0042】
イントラ予測部222は、現在ピクチャ内のサンプルを参照して現在ブロックを予測することができる。前記参照されるサンプルは、予測モードによって前記現在ブロックの隣接(neighbor)に位置することができ、または、離れて位置することもできる。イントラ予測で予測モードは、複数の非方向性モードと複数の方向性モードとを含むことができる。非方向性モードは、例えば、DCモード及びプラナーモード(Planarモード)を含むことができる。方向性モードは、予測方向の細かい程度によって、例えば、33個の方向性予測モードまたは65個の方向性予測モードを含むことができる。ただし、これは、例示であり、設定によってそれ以上またはそれ以下の個数の方向性予測モードが使用され得る。イントラ予測部222は、隣接ブロックに適用された予測モードを用いて、現在ブロックに適用される予測モードを決定することもできる。
【0043】
インター予測部221は、参照ピクチャ上で動きベクトルにより特定される参照ブロック(参照サンプルアレイ)に基づいて、現在ブロックに対する予測されたブロックを導くことができる。このとき、インター予測モードで送信される動き情報の量を減らすために、隣接ブロックと現在ブロックとの間の動き情報の相関性に基づいて、動き情報をブロック、サブブロック、またはサンプル単位で予測することができる。前記動き情報は、動きベクトル及び参照ピクチャインデックスを含むことができる。前記動き情報は、インター予測方向(L0予測、L1予測、Bi予測等)情報をさらに含むことができる。インター予測の場合に、隣接ブロックは、現在ピクチャ内に存在する空間的隣接ブロック(spatial neighboring block)と参照ピクチャに存在する時間的隣接ブロック(temporal neighboring block)とを含むことができる。前記参照ブロックを含む参照ピクチャと前記時間的隣接ブロックを含む参照ピクチャとは同じであることができ、異なることもできる。前記時間的隣接ブロックは、同一位置参照ブロック(collocated reference block)、同一位置CU(col CU)などの名前で呼ばれることができ、前記時間的隣接ブロックを含む参照ピクチャは、同一位置ピクチャ(collocated picture、colPic)と呼ばれることもできる。例えば、インター予測部221は、隣接ブロックに基づいて動き情報候補リストを構成し、前記現在ブロックの動きベクトル及び/または参照ピクチャインデックスを導出するために、どの候補が使用されるかを指示する情報を生成することができる。様々な予測モードに基づいてインター予測が行われ得るし、例えば、スキップモードとマージモードとの場合に、インター予測部221は、隣接ブロックの動き情報を現在ブロックの動き情報として利用することができる。スキップモードの場合、マージモードとは異なり、レジデュアル信号が送信されないことがある。動き情報予測(motion vector prediction、MVP)モードの場合、隣接ブロックの動きベクトルを動きベクトル予測子(motion vector predictor)として用い、動きベクトル差分(motion vector difference)をシグナリングすることにより、現在ブロックの動きベクトルを指示することができる。
【0044】
予測部220は、後述する様々な予測方法に基づいて予測信号を生成する。例えば、予測部200は、1つのブロックに対する予測のためにイントラ予測又はインター予測を適用できるだけでなく、イントラ予測とインター予測を同時に適用することができる。これは、combined inter and intra prediction(CIIP)と呼ばれる。また、予測部は、ブロックに対する予測のためにイントラブロックコピー(intra block copy:IBC)予測モードに基づくこともあり又はパレットモード(palette mode)に基づくこともある。前記IBC予測モード又はパレットモードは、例えば、SCC(screen content coding)のようにゲームなどのコンテンツ映像/動画コーディングのために使用されることができる。IBCは、基本的に現在ピクチャ内において予測を行うが、現在ピクチャ内において参照ブロックを導出する点でインター予測と類似して行われる。すなわち、IBCは、本文書において説明されるインター予測技法のうち少なくとも1つを利用することができる。パレットモードは,イントラコーディング又はイントラ予測の一例と見なすことができる。パレットモードが適用される場合、パレットテーブル及びパレットインデックスに関する情報に基づいてピクチャ内のサンプル値をシグナリングすることができる。
【0045】
前記予測部(インター予測部221及び/又は前記イントラ予測部222を含む)を介して生成された予測信号は、復元信号を生成するために用いられるか、レジデュアル信号を生成するために用いられることができる。
【0046】
変換部232は、レジデュアル信号に変換技法を適用して変換係数(transform coefficients)を生成することができる。例えば、変換技法は、DCT(Discrete Cosine Transform)、DST(Discrete Sine Transform)、GBT(Graph-Based Transform)、又はCNT(Conditionally Non-linear Transform)の少なくとも1つを含む。ここで、GBTは、ピクセル間の関係情報をグラフで表現する時、このグラフから得られた変換を意味する。CNTは、以前に復元された全てのピクセル(all previously reconstructed pixel)を用いて予測信号を生成し、それに基づいて取得される変換を意味する。また、変換過程は、正方形の同一のサイズを有するピクセルブロックに適用されてもよく、正方形ではない可変サイズのブロックに適用されてもよい。
【0047】
量子化部233は、変換係数を量子化してエントロピーエンコーディング部240に送信し、エントロピーエンコーディング部240は、量子化された信号(量子化された変換係数に関する情報)をエンコーディングしてビットストリームとして出力する。前記量子化された変換係数に関する情報は、レジデュアル情報と呼ばれてもよい。量子化部233は、係数スキャン順序(scan order)に基づいてブロック形態の量子化された変換係数を1次元ベクトル形態で再整列し、前記1次元ベクトル形態の量子化された変換係数に基づいて前記量子化された変換係数に関する情報を生成することもできる。
【0048】
エントロピーエンコーディング部240は、例えば、指数ゴロム(exponential Golomb)、CAVLC(context-adaptive variable length coding)、CABAC(context-adaptive binary arithmetic coding)などの様々なエンコーディング方法を行うことができる。エントロピーエンコーディング部240は、量子化された変換係数の他に、ビデオ/イメージ復元に必要な情報(例えば、シンタックス要素(syntax elements)の値など)を共に又は別途にエンコーディングすることもできる。エンコーディングされた情報(例えば、エンコーディングされたビデオ/映像情報)は、ビットストリーム形態でNAL(network abstraction layer)ユニット単位で送信又は格納されることができる。前記ビデオ/映像情報は、アダプテーションパラメータセット(APS)、ピクチャパラメータセット(PPS)、シーケンスパラメータセット(SPS)、又はビデオパラメータセット(VPS)など、様々なパラメータセットに関する情報をさらに含む。また、前記ビデオ/映像情報は、一般制限情報(general constraint information)をさらに含んでもよい。本文書において、エンコーディング装置からデコーディング装置に伝達/シグナリングされる情報及び/又はシンタックス要素は、ビデオ/映像情報に含まれる。前記ビデオ/映像情報は、前述のエンコーディング手順を介してエンコーディングされて前記ビットストリームに含まれる。前記ビットストリームは、ネットワークを介して送信されてもよく、またはデジタル格納媒体に格納されてもよい。ここで、ネットワークは、放送網及び/又は通信網などを含み、デジタル格納媒体は、USB、SD、CD、DVD、ブルーレイ、HDD、SSDなど、様々な格納媒体を含む。エントロピーエンコーディング部240から出力された信号を送信する送信部(図示せず)及び/又は格納する格納部(図示せず)がエンコーディング装置200の内/外部エレメントとして構成されてもよく、又は送信部はエントロピーエンコーディング部240に含まれてもよい。
【0049】
量子化部233から出力された量子化された変換係数は、予測信号を生成するために用いられることができる。例えば、量子化された変換係数に逆量子化部234及び逆変換部235を介して逆量子化及び逆変換を適用することにより、レジデュアル信号(レジデュアルブロック又はレジデュアルサンプル)を復元する。加算部250が復元されたレジデュアル信号をインター予測部221又はイントラ予測部222から出力された予測信号に加えることにより、復元(reconstructed)信号(復元ピクチャ、復元ブロック、復元サンプルアレイ)が生成される。スキップモードが適用された場合のように、処理対象ブロックに対するレジデュアルがない場合、予測されたブロックが復元ブロックとして使用されることができる。加算部250は、復元部又は復元ブロック生成部と呼ばれてもよい。生成された復元信号は、現在ピクチャ内の次の処理対象ブロックのイントラ予測のために使用され、後述するように、フィルタリングを経て次のピクチャのインター予測のために使用されることもできる。
【0050】
一方、ピクチャエンコーディング及び/又は復元過程においてLMCS(luma mapping with chroma scaling)が適用されることもできる。
【0051】
フィルタリング部260は、復元信号にフィルタリングを適用して主観的/客観的画質を向上させることができる。例えば、フィルタリング部260は、復元ピクチャに様々なフィルタリング方法を適用して修正された(modified)復元ピクチャを生成し、前記修正された復元ピクチャをメモリ270、具体的に、メモリ270のDPBに格納する。前記様々なフィルタリング方法は、例えば、デブロッキングフィルタリング、サンプル適応的オフセット(sample adaptive offset)、適応的ループフィルタ(adaptive loop filter)、両方向フィルタ(bilateral filter)などを含む。フィルタリング部260は、各フィルタリング方法に関する説明において後述するように、フィルタリングに関する様々な情報を生成してエントロピーエンコーディング部240に伝達する。フィルタリングに関する情報は、エントロピーエンコーディング部240においてエンコーディングされてビットストリーム形態で出力される。
【0052】
メモリ270に送信された修正された復元ピクチャは、インター予測部221において参照ピクチャとして使用されることができる。エンコーディング装置は、これによりインター予測が適用される場合、エンコーディング装置100とデコーディング装置における予測ミスマッチを避けることができ、符号化効率も向上させることができる。
【0053】
メモリ270のDPBは、修正された復元ピクチャをインター予測部221での参照ピクチャとして使用するために格納することができる。メモリ270は、現在ピクチャ内の動き情報が導出された(または、エンコーディングされた)ブロックの動き情報及び/または既に復元されたピクチャ内のブロックの動き情報を格納することができる。前記格納された動き情報は、空間的隣接ブロックの動き情報または時間的隣接ブロックの動き情報として活用するためにインター予測部221に伝達できる。メモリ270は、現在ピクチャ内の復元されたブロックの復元サンプルを格納することができ、イントラ予測部222に伝達できる。
【0054】
図3は、本文書の実施例が適用できるビデオ/映像デコーディング装置の構成を概略的に説明する図である。
【0055】
図3に示すように、デコーディング装置300は、エントロピーデコーディング部(entropy decoder)310、レジデュアル処理部(residual processor)320、予測部(predictor)330、加算部(adder)340、フィルタリング部(filter)350、及びメモリ(memoery)360を備えて構成されることができる。予測部330は、インター予測部331及びイントラ予測部332を備えることができる。レジデュアル処理部320は、逆量子化部(dequantizer)321及び逆変換部(inverse transformer)321を備えることができる。上述したエントロピーデコーディング部310、レジデュアル処理部320、予測部330、加算部340、及びフィルタリング部350は、実施形態によって1つのハードウェアコンポーネント(例えば、デコーダチップセットまたはプロセッサ)により構成されることができる。また、メモリ360は、DPB(decoded picture buffer)を備えることができ、デジタル格納媒体により構成されることもできる。前記ハードウェアコンポーネントは、メモリ360を内/外部コンポーネントとしてさらに備えることもできる。
【0056】
ビデオ/画像情報を含むビットストリームが入力されれば、デコーディング装置300は、図3のエンコーディング装置でビデオ/画像情報が処理されたプロセスに対応して画像を復元することができる。例えば、デコーディング装置300は、前記ビットストリームから取得したブロック分割関連情報に基づいてユニット/ブロックを導出することができる。デコーディング装置300は、エンコーディング装置で適用された処理ユニットを用いてデコーディングを行うことができる。したがって、デコーディングの処理ユニットは、例えば、コーディングユニットであることができ、コーディングユニットは、コーディングツリーユニットまたは最大コーディングユニットからクアッドツリー構造、バイナリツリー構造、及び/またはターナリツリー構造にしたがって分割されることができる。コーディングユニットから1つ以上の変換ユニットが導出され得る。そして、デコーディング装置300を介してデコーディング及び出力された復元画像信号は、再生装置を介して再生されることができる。
【0057】
デコーディング装置300は、図2のエンコーディング装置から出力された信号をビットストリームの形態で受信し、受信された信号はエントロピーデコーディング部310によりデコーディングされる。例えば、エントロピーデコーディング部310は、前記ビットストリームをパーシング(parsing)して映像復元(又はピクチャ復元)に必要な情報(例えば、ビデオ/映像情報)を導出することができる。前記ビデオ/映像情報は、アダプテーションパラメータセット(APS)、ピクチャパラメータセット(PPS)、シーケンスパラメータセット(SPS)又はビデオパラメータセット(VPS)などの様々なパラメータセットに関する情報をさらに含んでもよい。また、前記ビデオ/映像情報は一般制限情報(general constraint information)をさらに含んでもよい。デコーディング装置は、前記パラメータセットに関する情報及び/又は前記一般制限情報をさらに基づいてピクチャをデコーディングすることができる。本文書において後述されるシグナリング/受信される情報及び/又はシンタックス要素は、前記デコーディング手順を介してデコーディングされて前記ビットストリームから取得できる。例えば、エントロピーデコーディング部310は、指数ゴロム符号化、CAVLC(context-adaptive variable length coding)又はCABAC(context-adaptive arithmetic coding)などのコーディング方法に基づいてビットストリーム内の情報をデコーディングし、映像復元に必要なシンタックスエレメントの値、レジデュアルに関する変換係数の量子化された値を出力する。より詳細に、CABACエントロピーデコーディング方法は、ビットストリームにおいて各構文要素に該当するビン(bin)を受信し、デコーディング対象構文要素情報と周辺及びデコーディング対象ブロックのデコーディング情報あるいは以前ステップでデコーディングされたシンボル/ビンの情報を利用して文脈(コンテキスト、context)モデルを決定し、決定された文脈モデルに応じてビンの発生確率を予測してビンの算術デコーディング(arithmetic decoding)を実行して各構文要素の値に該当するシンボルを生成することができる。この時、CABACエントロピーデコーディング方法は、文脈モデル決定の後、次のシンボル/ビンの文脈モデルのためにデコーディングされたシンボル/ビンの情報を利用して文脈モデルをアップデートすることができる。エントロピーデコーディング部310においてデコーディングされた情報のうち予測に関する情報は予測部(インター予測部332及びイントラ予測部331)に提供され、エントロピーデコーディング部310においてエントロピーデコーディングが行われたレジデュアル値、すなわち、量子化された変換係数及び関連パラメータ情報はレジデュアル処理部320に入力されることができる。
【0058】
レジデュアル処理部320は、レジデュアル信号(レジデュアルブロック、レジデュアルサンプル、レジデュアルサンプルアレイ)を導出することができる。また、エントロピーデコーディング部310においてデコーディングされた情報のうちフィルタリングに関する情報はフィルタリング部350に提供される。一方、エンコーディング装置から出力された信号を受信する受信部(図示せず)がデコーディング装置300の内/外エレメントとしてさらに構成されてもよく、また、受信部はエントロピーデコーディング部310の構成要素であってもよい。一方、本文書によるデコーディング装置はビデオ/映像/ピクチャデコーディング装置と呼ばれてもよく、前記デコーディング装置は情報デコーダ(ビデオ/映像/ピクチャ情報デコーダ)及びサンプルデコーダ(ビデオ/映像/ピクチャサンプルデコーダ)に区分することもできる。前記情報デコーダは前記エントロピーデコーディング部310を含み、前記サンプルデコーダは前記逆量子化部321、逆変換部322、加算部340、フィルタリング部350、メモリ360、インター予測部332及びイントラ予測部331の少なくとも1つを含む。
【0059】
逆量子化部321では、量子化された変換係数を逆量子化して変換係数を出力することができる。逆量子化部321は、量子化された変換係数を2次元のブロック形態で再整列することができる。この場合、前記再整列は、エンコーディング装置で行われた係数スキャン順序に基づいて再整列を行うことができる。逆量子化部321は、量子化パラメータ(例えば、量子化ステップサイズ情報)を用いて量子化された変換係数に対する逆量子化を行い、変換係数(transform coefficient)を取得することができる。
【0060】
逆変換部322では、変換係数を逆変換してレジデュアル信号(レジデュアルブロック、レジデュアルサンプルアレイ)を取得するようになる。
【0061】
予測部330は、現在ブロックに対する予測を行い、前記現在ブロックに対する予測サンプルを含む予測されたブロック(predicted block)を生成する。予測部330は、エントロピーデコーディング部310から出力された前記予測に関する情報に基づいて前記現在ブロックにイントラ予測が適用されるか又はインター予測が適用されるかを決定することができ、具体的なイントラ/インター予測モードを決定することができる。
【0062】
予測部330は、後述する多様な予測方法に基づいて予測信号を生成することができる。例えば、予測部は、1つのブロックに対する予測のためにイントラ予測又はインター予測を適用できるだけでなく、イントラ予測とインター予測を同時に適用することができる。これは、combined inter and intra prediction(CIIP)と呼ばれてもよい。また、予測部は、ブロックに対する予測のためにイントラブロックコピー(intra block copy:IBC)予測モードに基づいてもよく又はパレットモード(palette mode)に基づいてもよい。前記IBC予測モード又はパレットモードは、例えば、SCC(screen content coding)のように、ゲームなどのコンテンツ映像/動画コーディングのために使用できる。IBCは基本的に現在ピクチャ内において予測を行うが、現在ピクチャ内において参照ブロックを導出する点でインター予測と類似して行われることができる。すなわち、IBCは、本文書において説明されるインター予測技法のうち少なくとも1つを利用することができる。パレットモードは,イントラコーディング又はイントラ予測の一例と見なすことができる。パレットモードが適用される場合、パレットテーブル及びパレットインデックスに関する情報が前記ビデオ/映像情報に含まれてシグナリングされる。
【0063】
イントラ予測部331は現在ピクチャ内のサンプルを参照して現在ブロックを予測することができる。前記参照されるサンプルは、予測モードによって前記現在ブロックの周辺(neighbour)に位置してもよく、又は、離れて位置してもよい。イントラ予測において予測モードは複数の非方向性モードと複数の方向性モードを含む。イントラ予測部331は、周辺ブロックに適用された予測モードを用いて、現在ブロックに適用される予測モードを決定することもできる。
【0064】
インター予測部332は、参照ピクチャ上において動きベクトルにより特定される参照ブロック(参照サンプルアレイ)に基づいて、現在ブロックに対する予測されたブロックを誘導することができる。その時、インター予測モードで送信される動き情報の量を減らすために周辺ブロックと現在ブロック間の動き情報の相関性に基づいて動き情報をブロック、サブブロック又はサンプル単位で予測することができる。前記動き情報は、動きベクタ及び参照ピクチャインデックスを含む。前記動き情報は、インター予測方向(L0予測、L1予測、Bi予測など)情報をさらに含んでもよい。インター予測の場合、周辺ブロックは現在ピクチャ内に存在する空間的周辺ブロック(spatial neighbouring block)と参照ピクチャに存在する時間的周辺ブロック(temporal neighbouring block)を含む。例えば、インター予測部332は、周辺ブロックに基づいて動き情報候補リストを構成し、受信した候補選択情報に基づいて前記現在ブロックの動きベクトル及び/又は参照ピクチャインデックスを導出することができる。様々な予測モードに基づいてインター予測が行われることができ、前記予測に関する情報は、前記現在ブロックに対するインター予測モードを指示する情報を含む。
【0065】
加算部340は、取得されたレジデュアル信号を予測部(インター予測部332及び/又はイントラ予測部331を含む)から出力された予測信号(予測されたブロック、予測サンプルアレイ)に加えることにより復元信号(復元ピクチャ、復元ブロック、復元サンプルアレイ)を生成することができる。スキップモードが適用された場合のように処理対象ブロックに対するレジデュアルがない場合、予測されたブロックが復元ブロックとして使用されることができる。
【0066】
加算部340は、復元部または復元ブロック生成部と呼ばれることができる。生成された復元信号は、現在ピクチャ内の次の処理対象ブロックのイントラ予測のために使われることができ、後述するように、フィルタリングを経て出力されることもでき、または、次のピクチャのインター予測のために使われることもできる。
【0067】
一方、ピクチャデコーディング過程でLMCS(luma mapping with chroma scaling)が適用されることもできる。
【0068】
フィルタリング部350は、復元信号にフィルタリングを適用して主観的/客観的画質を向上させることができる。例えば、フィルタリング部350は、復元ピクチャに多様なフィルタリング方法を適用して修正された(modified)復元ピクチャを生成することができ、前記修正された復元ピクチャをメモリ60、具体的に、メモリ360のDPBに送信できる。前記多様なフィルタリング方法は、例えば、デブロッキングフィルタリング、サンプル適応的オフセット(sample adaptive offset)、適応的ループフィルタ(adaptive loop filter)、両方向フィルタ(bilateral filter)などを含むことができる。
【0069】
メモリ360のDPBに格納された(修正された)復元ピクチャは、インター予測部332において参照ピクチャとして使用できる。メモリ360は、現在ピクチャ内の動き情報が導出された(又はデコーディングされた)ブロックの動き情報及び/又は既に復元されたピクチャ内のブロックの動き情報を格納することができる。前記格納された動き情報は、空間的周辺ブロックの動き情報又は時間的周辺ブロックの動き情報として活用するためにインター予測部221に伝達する。メモリ360は、現在ピクチャ内の復元されたブロックの復元サンプルを格納でき、イントラ予測部331に伝達することができる。
【0070】
本文書において、エンコーディング装置200のフィルタリング部260、インター予測部221、及びイントラ予測部222で説明された実施例は、各々、デコーディング装置300のフィルタリング部350、インター予測部332、及びイントラ予測部331にも同一または対応されるように適用されることができる。
【0071】
本文書によるビデオ/映像コーディング方法は、次のようなパーティショニング構造に基づいて実行されることができる。具体的に、後述する予測、レジデュアル処理((逆)変換、(逆)量子化等)、シンタックス要素コーディング、フィルタリングなどの手順は、前記パーティショニング構造に基づいて導出されたCTU、CU(及び/またはTU、PU)に基づいて実行されることができる。ブロックパーティショニング手順は、前述したエンコーディング装置の映像分割部210で実行され、パーティショニング関連情報がエントロピーエンコーディング部240で(エンコーディング)処理されてビットストリーム形態でデコーディング装置に伝達されることができる。デコーディング装置のエントロピーデコーディング部310は、前記ビットストリームから取得した前記パーティショニング関連情報に基づいて現在ピクチャのブロックパーティショニング構造を導出し、これに基づいて映像デコーディングのための一連の手順(例えば、予測、レジデュアル処理、ブロック/ピクチャ復元、インループフィルタリング等)を実行することができる。CUサイズとTUサイズが同じこともあり、またはCU領域内に複数のTUが存在することもある。一方、CUサイズとは、一般的にルマ成分(サンプル)CB(coding block)サイズを示すことができる。TUサイズとは、一般的にルマ成分(サンプル)TB(transform block)サイズを示すことができる。クロマ成分(サンプル)CBまたはTBサイズは、ピクチャ/映像のカラーフォーマット(クロマフォーマット、例えば、4:4:4、4:2:2、4:2:0等)による成分比によってルマ成分(サンプル)CBまたはTBサイズに基づいて導出されることができる。前記TUサイズは、maxTbSizeに基づいて導出されることができる。例えば、前記CUサイズが前記maxTbSizeより大きい場合、前記CUから前記maxTbSizeの複数のTU(TB)が導出され、前記TU(TB)単位で変換/逆変換が実行されることができる。また、例えば、イントラ予測が適用される場合、イントラ予測モード/タイプは、前記CU(または、CB)単位で導出され、周辺参照サンプル導出及び予測サンプル生成手順は、TU(または、TB)単位で実行されることができる。この場合、一つのCU(または、CB)領域内に一つまたは複数のTU(または、TB)が存在でき、この場合、前記複数のTU(または、TB)は、同じイントラ予測モード/タイプを共有することができる。
【0072】
また、本文書によるビデオ/イメージのコーディングにおいて、映像処理単位は、階層的構造を有することができる。一つのピクチャは、一つ以上のタイル、ブリック、スライス及び/またはタイルグループに区分されることができる。一つのスライスは、一つ以上のブリックを含むことができる。一つのブリックは、タイル内の一つ以上のCTU行(row)を含むことができる。スライスは、ピクチャの整数個のブリックを含むことができる。一つのタイルグループは、一つ以上のタイルを含むことができる。一つのタイルは、一つ以上のCTUを含むことができる。前記CTUは、一つ以上のCUに分割されることができる。タイルは、ピクチャ内で特定タイル行及び特定タイル列内のCTUsを含む四角領域である(A rectangular region of CTUs within a particular tile column and a particular tile row in a picture)。タイルグループは、ピクチャ内のタイルラスタースキャンによる整数個のタイルを含むことができる。スライスヘッダは、該当スライス(スライス内のブロック)に適用されることができる情報/パラメータを運ぶことができる。エンコーディング/デコーディング装置がマルチコアプロセッサを有する場合、前記タイル、スライス、ブリック及び/またはタイルグループに対するエンコーディング/デコーディング手順は、並列処理されることができる。本文書において、スライスまたはタイルグループは、混用されることができる。即ち、タイルグループヘッダは、スライスヘッダと呼ばれることができる。ここで、スライスは、intra(I)slice、predictive(P)slice、及びbi-predictive(B)sliceを含むスライスタイプのうち一つのタイプを有することができる。Iスライス内のブロックに対しては、予測のためにインター予測は使われずにイントラ予測のみが使われることができる。もちろん、この場合にも予測無しで原本サンプル値をコーディングしてシグナリングすることもできる。Pスライス内のブロックに対してはイントラ予測またはインター予測が使われることができ、インター予測が使われる場合には単(uni)予測のみが使われることができる。一方、Bスライス内のブロックに対してはイントラ予測またはインター予測が使われることができ、インター予測が使われる場合には最大対(bi)予測まで使われることができる。
【0073】
エンコーダでは、ビデオ映像の特性(例えば、解像度)によってまたはコーディングの効率または並列処理を考慮してタイル/タイルグループ、ブリック、スライス、最大及び最小コーディングユニット大きさを決定し、これに対する情報またはこれを誘導することができる情報がビットストリームに含まれることができる。
【0074】
デコーダでは、現在ピクチャのタイル/タイルグループ、ブリック、スライス、タイル内のCTUが多数のコーディングユニットに分割されたか等を示す情報を取得することができる。このような情報は、特定条件下でのみ取得するように(送信されるように)すると、効率を上げることができる。
【0075】
ピクチャは、コーディングツリーユニット(CTUs)のシーケンスに分割されることができる(divided into a sequence)。CTUは、コーディングツリーブロック(CTB)に対応されることができる。または、CTUは、ルマサンプルのコーディングツリーブロックと、対応するクロマサンプルの二つのコーディングツリーブロックと、を含むことができる。即ち、三つのサンプルアレイを含むピクチャに対して、CTUは、ルマサンプルのN×Nブロックとクロマサンプルの二つの対応ブロックとを含むことができる。
【0076】
コーディング及び予測などのためのCTUの最大許容サイズは、変換のためのCTUの最大許容サイズと異なることがある。例えば、CTU内のルマブロックの最大許容サイズは、128×128である。
【0077】
CTUは、クアッドツリー(quad-tree、QT)構造に基づいてCUに分割されることができる。クアッドツリー構造は、クァターナリ(quaternary)ツリー構造と呼ばれることができる。これは多様な局地的特徴(local characteristic)を反映するためである。一方、本文書において、CTUは、クアッドツリーだけでなく、バイナリツリー(binary-tree、BT)、及びターナリツリー(ternary-tree、TT)を含むマルチタイプツリー構造分割に基づいて分割されることができる。以下、QTBT構造とは、クアッドツリー及びバイナリツリーベースの分割構造を含むことができ、QTBTTTとは、クアッドツリー、バイナリツリー、及びターナリツリーベースの分割構造を含むことができる。または、QTBT構造は、クアッドツリー、バイナリツリー、及びターナリツリーベースの分割構造を含むこともできる。コーディングツリー構造において、CUは、正方形または長方形の形状を有することができる。まず、CTUは、クアッドツリー構造に分割されることができる。以後、クアッドツリー構造のリーフノードは、マルチタイプツリー構造によりさらに分割されることができる。例えば、マルチタイプツリー構造で概略的に4個の分割タイプを含むことができる。
【0078】
前記4個の分割タイプは、垂直バイナリ分割(vertical binary splitting、SPLIT_BT_VER)、水平バイナリ分割(horizontal binary splitting、SPLIT_BT_HOR)、垂直ターナリ分割(vertical ternary splitting、SPLIT_TT_VER)、水平ターナリ分割(horizontal ternary splitting、SPLIT_TT_HOR)を含むことができる。前記マルチタイプツリー構造のリーフノードは、CUと呼ばれることができる。このようなCUは、予測及び変換手順のために使われることができる。本文書において、一般的に、CU、PU、TUは、同じブロックサイズを有することができる。ただし、最大許容変換長さ(maximum supported transform length)がCUのカラー成分(colour component)の幅または高さより小さい場合には、CUとTUが互いに異なるブロックサイズを有することができる。
【0079】
一方、前述したように、一つのピクチャは、複数のスライスを含むことができ、一つのスライスは、スライスヘッダ及びスライスデータを含むことができる。この場合、一つのピクチャ内の複数のスライス(スライスヘッダ及びスライスデータ集合)に対して一つのピクチャヘッダがさらに付加されることができる。前記ピクチャヘッダ(ピクチャヘッダシンタックス)は、前記ピクチャに共通的に適用できる情報/パラメータを含むことができる。前記スライスヘッダ(スライスヘッダシンタックス)は、前記スライスに共通的に適用できる情報/パラメータを含むことができる。APS(adaptation parameter set)またはPPS(picture parameter set)は、一つ以上のピクチャに共通的に適用できる情報/パラメータを含むことができる。SPS(sequence parameter set)は、一つ以上のシーケンスに共通的に適用できる情報/パラメータを含むことができる。VPS(video parameter set)は、多重レイヤに共通的に適用できる情報/パラメータを含むことができる。DPS(decoding parameter set)は、ビデオ全般に共通的に適用できる情報/パラメータを含むことができる。前記DPSは、CVS(coded video sequence)のconcatenationに関連した情報/パラメータを含むことができる。
【0080】
本文書において、上位レベルシンタックスとは、前記APSシンタックス、PPSシンタックス、SPSシンタックス、VPSシンタックス、DPSシンタックス、ピクチャヘッダシンタックス、スライスヘッダシンタックスのうち少なくとも一つを含むことができる。
【0081】
また、例えば、前記タイル/タイルグループ/ブリック/スライスの分割及び構成などに関する情報は、前記上位レベルシンタックスを介してエンコーディング端で構成されてビットストリーム形態でデコーディング装置に伝達されることができる。
【0082】
本文書において、量子化/逆量子化及び/または変換/逆変換のうち少なくとも一つは省略されることができる。前記量子化/逆量子化が省略される場合、前記量子化された変換係数は、変換係数と呼ばれることができる。前記変換/逆変換が省略される場合、前記変換係数は、係数またはレジデュアル係数と呼ばれることもでき、または表現の統一性のために、依然として変換係数と呼ばれることもできる。
【0083】
本文書において、量子化された変換係数及び変換係数は、各々、変換係数及びスケーリングされた(scaled)変換係数と称されることができる。この場合、レジデュアル情報は、変換係数に関する情報を含むことができ、前記変換係数に関する情報は、レジデュアルコーディングシンタックスを介してシグナリングされることができる。前記レジデュアル情報(または、前記変換係数に関する情報)に基づいて変換係数が導出されることができ、前記変換係数に対する逆変換(スケーリング)を介してスケーリングされた変換係数が導出されることができる。前記スケーリングされた変換係数に対する逆変換(変換)に基づいてレジデュアルサンプルが導出されることができる。これは本文書の他の部分でも同様に適用/表現されることができる。
【0084】
前述した内容のように、エンコーディング装置は、例えば、指数ゴロム(exponential Golomb)、CAVLC(Context-Adaptive Variable Length Coding)、CABAC(Context-Adaptive Binary Arithmetic Coding)などのような多様なエンコーディング方法を実行することができる。また、デコーディング装置は、指数ゴロム符号化、CAVLCまたはCABACなどのコーディング方法に基づいてビットストリーム内の情報をデコーディングし、映像復元に必要なシンタックス要素の値、レジデュアルに関する変換係数の量子化された値を出力することができる。例えば、前述したコーディング方法は、後述する内容のように実行されることができる。
【0085】
本文書において、イントラ予測は、現在ブロックが属するピクチャ(以下、現在ピクチャ)内の参照サンプルに基づいて、現在ブロックに対する予測サンプルを生成する予測を示すことができる。現在ブロックにイントラ予測が適用される場合、現在ブロックのイントラ予測に使用する周辺参照サンプルが導出されることができる。前記現在ブロックの周辺参照サンプルは、nW×nH大きさの現在ブロックの左側(left)境界に隣接したサンプル及び左下側(bottom-left)に隣接した総2×nH個のサンプル、現在ブロックの上側(top)境界に隣接したサンプル及び右上側(top-right)に隣接した総2×nW個のサンプル、及び現在ブロックの左上側(top-left)に隣接した1個のサンプルを含むことができる。または、前記現在ブロックの周辺参照サンプルは、複数列の上側周辺サンプル及び複数行の左側周辺サンプルを含むこともできる。また、前記現在ブロックの周辺参照サンプルは、nW×nH大きさの現在ブロックの右側(right)境界に隣接した総nH個のサンプル、現在ブロックの下側(bottom)境界に隣接した総nW個のサンプル、及び現在ブロックの右下側(bottom-right)に隣接した1個のサンプルを含むこともできる。
【0086】
ただし、現在ブロックの周辺参照サンプルのうち一部は、まだデコーディングされない、または利用可能でない場合がある 。この場合、デコーディング装置は、利用可能なサンプルとして利用可能でないサンプルを代替(substitution)して予測に使用する周辺参照サンプルを構成することができる。または、利用可能なサンプルの補間(interpolation)を介して予測に使用する周辺参照サンプルを構成することができる。
【0087】
周辺参照サンプルが導出された場合、(i)現在ブロックの周辺(neighboring)参照サンプルの平均(average)またはインターポレーション(interpolation)に基づいて予測サンプルを誘導することができ、(ii)現在ブロックの周辺参照サンプルのうち予測サンプルに対して特定(予測)方向に存在する参照サンプルに基づいて前記予測サンプルを誘導することもできる。(i)の場合は非方向性モードまたは非角度モード、(ii)の場合は方向性(directional)モードまたは角度(angular)モードと呼ばれることができる。また、前記周辺参照サンプルのうち前記現在ブロックの予測サンプルを基準にして、前記現在ブロックのイントラ予測モードの予測方向の反対方向に位置する前記第2の周辺サンプルと前記第1の周辺サンプルとの補間を介して前記予測サンプルが生成されることもできる。前述した場合は、線形補間イントラ予測(Linear interpolation intra prediction、LIP)と呼ばれることができる。また、線形モデル(linear model)を利用してルマサンプルに基づいてクロマ予測サンプルが生成されることもできる。この場合は、LMモードと呼ばれることができる。また、フィルタリングされた周辺参照サンプルに基づいて前記現在ブロックの臨時予測サンプルを導出し、前記既存の周辺参照サンプル、即ち、フィルタリングされない周辺参照サンプルのうち、前記イントラ予測モードによって導出された少なくとも一つの参照サンプルと前記臨時予測サンプルとを加重和(weighted sum)して前記現在ブロックの予測サンプルを導出することもできる。前述した場合は、PDPC(Position dependent intra prediction)と呼ばれることができる。また、現在ブロックの周辺多重参照サンプルラインの中から、最も予測正確度が高い参照サンプルラインを選択して該当ラインで予測方向に位置する参照サンプルを利用して予測サンプルを導出し、このとき、使われた参照サンプルラインをデコーディング装置に指示(シグナリング)する方法でイントラ予測符号化を実行することができる。前述した場合は、multi-reference line(MRL)intra predictionまたはMRLベースのイントラ予測と呼ばれることができる。また、現在ブロックを垂直または水平のサブパーティションに分けて同じイントラ予測モードに基づいてイントラ予測を実行し、前記サブパーティション単位で周辺参照サンプルを導出して利用できる。即ち、この場合、現在ブロックに対するイントラ予測モードが前記サブパーティションに同一に適用され、前記サブパーティション単位で周辺参照サンプルを導出して利用することによって、場合によって、イントラ予測性能を高めることができる。このような予測方法は、ISP(intra sub-partitions)またはISPベースのイントラ予測と呼ばれることができる。前述したイントラ予測方法は、イントラ予測モードと区分してイントラ予測タイプと呼ばれることができる。前記イントラ予測タイプは、イントラ予測技法または付加イントラ予測モードなど、多様な用語で呼ばれることができる。例えば、前記イントラ予測タイプ(または、付加イントラ予測モードなど)は、前述したLIP、PDPC、MRL、ISPのうち少なくとも一つを含むことができる。前記LIP、PDPC、MRL、ISPなどの特定イントラ予測タイプを除外した一般イントラ予測方法は、ノーマルイントラ予測タイプと呼ばれることができる。ノーマルイントラ予測タイプは、前記のような特定イントラ予測タイプが適用されない場合に一般的に適用されることができ、前述したイントラ予測モードに基づいて予測が実行されることができる。一方、必要によって導出された予測サンプルに対する後処理フィルタリングが実行されることもできる。
【0088】
具体的に、イントラ予測手順は、イントラ予測モード/タイプ決定ステップ、周辺参照サンプル導出ステップ、イントラ予測モード/タイプベースの予測サンプル導出ステップを含むことができる。また、必要によって導出された予測サンプルに対する後処理フィルタリング(post-filtering)ステップが実行されることもできる。
【0089】
一方、前述したイントラ予測タイプ外にもALWIP(affine linear weighted intra prediction)が使われることができる。前記ALWIPは、LWIP(linear weighted intra prediction)またはMIP(matrix weighted intra predictionまたはmatrix based intra prediction)と呼ばれることもできる。前記MIPが現在ブロックに対して適用される場合、i)アベレージング(averaging)手順が実行された周辺参照サンプルを利用して、ii)マトリクスベクトルマルチプリケーション(matrix-vector-multiplication)手順を実行し、iii)必要によって、水平/垂直補間(interpolation)手順をさらに実行することで、前記現在ブロックに対する予測サンプルを導出することができる。前記MIPのために使われるイントラ予測モードは、前述したLIP、PDPC、MRL、ISPイントラ予測や、ノーマルイントラ予測で使われるイントラ予測モードと異なるように構成されることができる。前記MIPのためのイントラ予測モードは、MIPイントラ予測モード、MIP予測モード、またはMIPモードと呼ばれることができる。例えば、前記MIPのためのイントラ予測モードによって、前記マトリクスベクトルマルチプリケーションで使われるマトリクス及びオフセットが異なるように設定されることができる。ここで、前記マトリクスは、(MIP)加重値マトリクスと呼ばれることができ、前記オフセットは、(MIP)オフセットベクトルまたは(MIP)バイアス(bias)ベクトルと呼ばれることができる。
【0090】
イントラ予測に基づくビデオ/映像エンコーディング手順は、概略的に、例えば、下記を含むことができる。
【0091】
図4は、イントラ予測ベースのビデオ/映像エンコーディング方法の例を示し、図5は、エンコーディング装置内のイントラ予測部を概略的に示す。
【0092】
図4及び図5を参照すると、S400は、エンコーディング装置のイントラ予測部222により実行されることができ、S410乃至S430は、エンコーディング装置のレジデュアル処理部230により実行されることができる。具体的に、S410は、エンコーディング装置の減算部231により実行されることができ、S420は、エンコーディング装置の変換部232及び量子化部233により実行されることができ、S430は、エンコーディング装置の逆量子化部234及び逆変換部235により実行されることができる。S400において、予測情報がイントラ予測部222により導出され、エントロピーエンコーディング部240によりエンコーディングされることができる。S410及びS420を介してレジデュアル情報が導出され、エントロピーエンコーディング部240によりエンコーディングされることができる。前記レジデュアル情報は、前記レジデュアルサンプルに関する情報である。前記レジデュアル情報は、前記レジデュアルサンプルに対する量子化された変換係数に関する情報を含むことができる。前述したように、前記レジデュアルサンプルは、エンコーディング装置の変換部232を介して変換係数として導出され、前記変換係数は、量子化部233を介して量子化された変換係数として導出されることができる。前記量子化された変換係数に関する情報がレジデュアルコーディング手順を介してエントロピーエンコーディング部240でエンコーディングされることができる。
【0093】
エンコーディング装置は、現在ブロックに対するイントラ予測を実行する(S400)。エンコーディング装置は、現在ブロックに対するイントラ予測モードを導出し、現在ブロックの周辺参照サンプルを導出することができ、前記イントラ予測モード及び前記周辺参照サンプルに基づいて前記現在ブロック内の予測サンプルを生成する。ここで、イントラ予測モード決定、周辺参照サンプル導出及び予測サンプル生成手順は、同時に実行されることもでき、ある一手順が他の手順より先に実行されることもできる。例えば、エンコーディング装置のイントラ予測部222は、予測モード/タイプ決定部222_1、参照サンプル導出部222_2、予測サンプル導出部222_3を含むことができ、予測モード/タイプ決定部222_1で前記現在ブロックに対するイントラ予測モード/タイプを決定し、参照サンプル導出部222_2で前記現在ブロックの周辺参照サンプルを導出し、前記予測サンプル導出部222_3で前記現在ブロックの動きサンプルを導出することができる。一方、後述する予測サンプルフィルタリング手順が実行される場合、イントラ予測部222は、予測サンプルフィルタ部(図示せず)をさらに含むこともできる。エンコーディング装置は、複数のイントラ予測モードのうち前記現在ブロックに対して適用されるモードを決定することができる。エンコーディング装置は、前記イントラ予測モードに対するRD costを比較して前記現在ブロックに対する最適のイントラ予測モードを決定することができる。
【0094】
一方、エンコーディング装置は、予測サンプルフィルタリング手順を実行することもできる。予測サンプルフィルタリングは、ポストフィルタリングと呼ばれることができる。前記予測サンプルフィルタリング手順により前記予測サンプルのうち一部または全部がフィルタリングされることができる。場合によって、前記予測サンプルフィルタリング手順は省略されることができる。
【0095】
エンコーディング装置は、予測サンプルに基づいて前記現在ブロックに対するレジデュアルサンプルを導出する(S410)。エンコーディング装置は、現在ブロックの原本サンプルで前記予測サンプルを位相に基づいて比較して、前記レジデュアルサンプルを導出することができる。
【0096】
エンコーディング装置は、前記レジデュアルサンプルを変換/量子化して量子化された変換係数を導出し(S420)、以後前記量子化された変換係数をまた逆量子化/逆変換処理して(修正された)レジデュアルサンプルを導出することができる(S430)。このように変換/量子化後に再び逆量子化/逆変換を実行する理由は、前述したように、デコーディング装置で導出されるレジデュアルサンプルと同じレジデュアルサンプルを導出するためである。
【0097】
エンコーディング装置は、前記予測サンプルと前記(修正された)レジデュアルサンプルに基づいて前記現在ブロックに対する復元サンプルを含む復元ブロックを生成することができる(S440)。前記復元ブロックに基づいて前記現在ピクチャに対する復元ピクチャが生成されることができる。
【0098】
エンコーディング装置は、前記イントラ予測に関する予測情報(例えば、予測モードを示す予測モード情報)及び前記イントラ/前記レジデュアルサンプルに関するレジデュアル情報を含む映像情報をエンコーディングし、エンコーディングされた映像情報をビットストリーム形態で出力できることは前述の通りである。前記レジデュアル情報は、レジデュアルコーディングシンタックスを含むことができる。エンコーディング装置は、前記レジデュアルサンプルを変換/量子化して量子化された変換係数を導出することができる。前記レジデュアル情報は、前記量子化された変換係数に対する情報を含むことができる。
【0099】
イントラ予測に基づくビデオ/映像デコーディング手順は、概略的に、例えば、下記を含むことができる。
【0100】
図6は、イントラ予測ベースのビデオ/映像デコーディング方法の例を示し、図7は、デコーディング装置内のイントラ予測部を概略的に示す。
【0101】
デコーディング装置は、エンコーディング装置で実行された動作と対応される動作を実行することができる。
【0102】
図6及び図7を参照すると、S600乃至S610は、デコーディング装置のイントラ予測部331により実行されることができ、S600の予測情報及びS630のレジデュアル情報は、デコーディング装置のエントロピーデコーディング部310によりビットストリームから取得されることができる。デコーディング装置のレジデュアル処理部320は、前記レジデュアル情報に基づいて現在ブロックに対するレジデュアルサンプルを導出することができる。具体的に、前記レジデュアル処理部320の逆量子化部321は、前記レジデュアル情報に基づいて導出された量子化された変換係数に基づいて、逆量子化を実行して変換係数を導出し、前記レジデュアル処理部の逆変換部322は、前記変換係数に対する逆変換を実行して前記現在ブロックに対するレジデュアルサンプルを導出することができる。S640は、デコーディング装置の加算部340または復元部により実行されることができる。
【0103】
具体的に、デコーディング装置は、受信された予測情報に基づいて現在ブロックに対するイントラ予測モードを導出することができる(S600)。デコーディング装置は、前記現在ブロックの周辺参照サンプルを導出することができる(S610)。デコーディング装置は、前記イントラ予測モード及び前記周辺参照サンプルに基づいてイントラ予測を実行して前記現在ブロック内の予測サンプルを生成する(S620)。この場合、デコーディング装置は、予測サンプルフィルタリング手順を実行することができる。予測サンプルフィルタリングは、ポストフィルタリングと呼ばれることができる。前記予測サンプルフィルタリング手順により前記予測サンプルのうち一部または全部がフィルタリングされることができる。場合によって、予測サンプルフィルタリング手順は省略されることができる。
【0104】
デコーディング装置は、受信されたレジデュアル情報に基づいて前記現在ブロックに対するレジデュアルサンプルを生成する(S630)。デコーディング装置は、前記予測サンプル及び前記レジデュアルサンプルに基づいて前記現在ブロックに対する復元サンプルを生成し、前記復元サンプルを含む復元ブロックを導出することができる(S640)。前記復元ブロックに基づいて前記現在ピクチャに対する復元ピクチャが生成されることができる。
【0105】
ここで、デコーディング装置のイントラ予測部331は、予測モード/タイプ決定部331_1、参照サンプル導出部331_2、及び予測サンプル導出部331_3を含むことができる。前記予測モード/タイプ決定部331_1は、デコーディング装置のエントロピーデコーディング部310で取得した予測モード情報に基づいて前記現在ブロックに対するイントラ予測モードを決定し、前記参照サンプル導出部331_2は、前記現在ブロックの周辺参照サンプルを導出し、前記予測サンプル導出部331_3は、前記現在ブロックの予測サンプルを導出することができる。一方、前述した予測サンプルフィルタリング手順が実行される場合、イントラ予測部331は、予測サンプルフィルタ部(図示せず)をさらに含むこともできる。
【0106】
前記予測情報は、イントラ予測モード情報及び/またはイントラ予測タイプ情報を含むことができる。前記イントラ予測モード情報は、例えば、MPM(most probable mode)が前記現在ブロックに適用されるか、またはリメイニングモード(remaining mode)が適用されるかを示すフラグ情報(例えば、intra_luma_mpm_flag)を含むことができ、前記MPMが前記現在ブロックに適用される場合、前記予測モード情報は、前記イントラ予測モード候補(MPM候補)のうち一つを指すインデックス情報(例えば、intra_luma_mpm_idx)をさらに含むことができる。前記イントラ予測モード候補(MPM候補)は、MPM候補リストまたはMPMリストで構成されることができる。また、前記MPMが前記現在ブロックに適用されない場合、前記イントラ予測モード情報は、前記イントラ予測モード候補(MPM候補)を除外した残りのイントラ予測モードのうち一つを指すリメイニングモード情報(例えば、intra_luma_mpm_remainder)をさらに含むことができる。デコーディング装置は、前記イントラ予測モード情報に基づいて前記現在ブロックのイントラ予測モードを決定することができる。前述したMIPのために別途のMPMリストが構成されることができる。
【0107】
また、前記イントラ予測タイプ情報は、多様な形態で具現されることができる。一例として、前記イントラ予測タイプ情報は、前記イントラ予測タイプのうち一つを指示するイントラ予測タイプインデックス情報を含むことができる。他の例として、前記イントラ予測タイプ情報は、前記MRLが前記現在ブロックに適用されるか、及び、適用される場合には何番目の参照サンプルラインが利用されるかを示す参照サンプルライン情報(例えば、intra_luma_ref_idx)、前記ISPが前記現在ブロックに適用されるかを示すISPフラグ情報(例えば、intra_subpartitions_mode_flag)、前記ISPが適用される場合にサブパーティションが分割タイプを指示するISPタイプ情報(例えば、intra_subpartitions_split_flag)、PDCPの適用可否を示すフラグ情報またはLIPの適用可否を示すフラグ情報のうち少なくとも一つを含むことができる。また、前記イントラ予測タイプ情報は、前記現在ブロックにMIPが適用されるかどうかを示すMIPフラグを含むことができる。
【0108】
前記イントラ予測モード情報及び/または前記イントラ予測タイプ情報は、本文書で説明したコーディング方法を介してエンコーディング/デコーディングされることができる。例えば、前記イントラ予測モード情報及び/または前記イントラ予測タイプ情報は、truncated(rice)binary codeに基づいてエントロピーコーディング(例えば、CABAC、CAVLC)を介してエンコーディング/デコーディングされることができる。
【0109】
一方、インター予測に基づくビデオ/映像エンコーディング手順は、概略的に、例えば、下記を含むことができる。
【0110】
図8は、インター予測ベースのビデオ/映像エンコーディング方法の例を示し、図9は、エンコーディング装置内のインター予測部を概略的に示す。
【0111】
図8及び図9を参照すると、エンコーディング装置は、現在ブロックに対するインター予測を実行する(S800)。エンコーディング装置は、現在ブロックのインター予測モード及び動き情報を導出し、前記現在ブロックの予測サンプルを生成することができる。ここで、インター予測モード決定、動き情報導出、及び予測サンプル生成手順は、同時に実行されることもでき、ある一手順が他の手順より先に実行されることもできる。例えば、エンコーディング装置のインター予測部221は、予測モード決定部221_1、動き情報導出部221_2、及び予測サンプル導出部221_3を含むことができ、予測モード決定部221_1で前記現在ブロックに対する予測モードを決定し、動き情報導出部221_2で前記現在ブロックの動き情報を導出し、予測サンプル導出部221_3で前記現在ブロックの予測サンプルを導出することができる。例えば、エンコーディング装置のインター予測部は、動き推定(motion estimation)を介して参照ピクチャの一定領域(サーチ領域)内で前記現在ブロックと類似するブロックをサーチし、前記現在ブロックとの差が最小または一定基準以下である参照ブロックを導出することができる。これに基づいて前記参照ブロックが位置する参照ピクチャを指す参照ピクチャインデックスを導出し、前記参照ブロックと前記現在ブロックの位置差に基づいて動きベクトルを導出することができる。エンコーディング装置は、多様な予測モードのうち前記現在ブロックに対して適用されるモードを決定することができる。エンコーディング装置は、前記多様な予測モードに対するRD(rate-distortion)費用(コスト、cost)を比較して前記現在ブロックに対する最適の予測モードを決定することができる。
【0112】
例えば、エンコーディング装置は、前記現在ブロックにスキップモードまたはマージモードが適用される場合、マージ候補リストを構成し、前記マージ候補リストに含まれているマージ候補が指す参照ブロックのうち前記現在ブロックとの差が最小または一定基準以下である参照ブロックを導出することができる。この場合、前記導出された参照ブロックと関連したマージ候補が選択され、前記選択されたマージ候補を指すマージインデックス情報が生成されてデコーディング装置にシグナリングされることができる。前記選択されたマージ候補の動き情報を利用して前記現在ブロックの動き情報が導出することができる。
【0113】
他の例として、エンコーディング装置は、前記現在ブロックに(A)MVPモードが適用される場合、(A)MVP候補リストを構成し、前記(A)MVP候補リストに含まれているmvp(motion vector predictor)候補の中から選択されたmvp候補の動きベクトルを前記現在ブロックのmvpとして利用できる。この場合、例えば、前述した動き推定により導出された参照ブロックを指す動きベクトルが前記現在ブロックの動きベクトルとして利用されることができ、前記mvp候補のうち前記現在ブロックの動きベクトルとの差が最も小さい動きベクトルを有するmvp候補が、前記選択されたmvp候補になることができる。前記現在ブロックの動きベクトルから前記mvpを引いた差分であるMVD(motion vector difference)が導出されることができる。この場合、前記MVDに関する情報がデコーディング装置にシグナリングされることができる。また、(A)MVPモードが適用される場合、前記参照ピクチャインデックスの値は、参照ピクチャインデックス情報で構成されて別途に前記デコーディング装置にシグナリングされることができる。
【0114】
エンコーディング装置は、前記予測サンプルに基づいてレジデュアルサンプルを導出することができる(S810)。エンコーディング装置は、前記現在ブロックの原本サンプルと前記予測サンプルの比較を介して前記レジデュアルサンプルを導出することができる。
【0115】
エンコーディング装置は、予測情報及びレジデュアル情報を含む映像情報をエンコーディングする(S820)。エンコーディング装置は、エンコーディングされた映像情報をビットストリーム形態で出力できる。前記予測情報は、前記予測手順に関連した情報であって、予測モード情報(例えば、skip flag、merge flag or mod eindex等)及び動き情報に関する情報を含むことができる。前記動き情報に関する情報は、動きベクトルを導出するための情報である候補選択情報(例えば、merge index、mvp flag or mvp index)を含むことができる。また、前記動き情報に関する情報は、前述したMVDに関する情報及び/または参照ピクチャインデックス情報を含むことができる。また、前記動き情報に関する情報は、L0予測、L1予測、または対(bi)予測が適用されるかどうかを示す情報を含むことができる。前記レジデュアル情報は、前記レジデュアルサンプルに関する情報である。前記レジデュアル情報は、前記レジデュアルサンプルに対する量子化された変換係数に関する情報を含むことができる。
【0116】
出力されたビットストリームは、(デジタル)格納媒体に格納されてデコーディング装置に伝達されることもでき、または、ネットワークを介してデコーディング装置に伝達されることもできる。
【0117】
一方、前述したように、エンコーディング装置は、前記参照サンプル及び前記レジデュアルサンプルに基づいて復元ピクチャ(復元サンプル及び復元ブロックを含む)を生成することができる。これはデコーディング装置で実行されることと同じ予測結果をエンコーディング装置で導出するためであり、これを介してコーディング効率を上げることができるためである。したがって、エンコーディング装置は、復元ピクチャ(または、復元サンプル、復元ブロック)をメモリに格納し、インター予測のための参照ピクチャとして活用できる。前記復元ピクチャにインループフィルタリング手順などがさらに適用されることができることは、前述の通りである。
【0118】
インター予測に基づくビデオ/映像デコーディング手順は、概略的に、例えば、下記を含むことができる。
【0119】
図10は、インター予測ベースのビデオ/映像デコーディング方法の例を示し、図11は、デコーディング装置内のインター予測部を概略的に示す。
【0120】
デコーディング装置は、前記エンコーディング装置で実行された動作と対応される動作を実行することができる。デコーディング装置は、受信された予測情報に基づいて現在ブロックに予測を実行して予測サンプルを導出することができる。
【0121】
具体的に、図10及び図11を参照すると、デコーディング装置は、ビットストリームから受信された予測情報に基づいて前記現在ブロックに対する予測モードを決定することができる(S1000)。デコーディング装置は、前記予測情報内の予測モード情報に基づいて前記現在ブロックにどのようなインター予測モードが適用されるかを決定することができる。
【0122】
例えば、マージフラグ(merge flag)に基づいて前記現在ブロックにマージモードが適用されるか、または(A)MVPモードが決定されるかを決定することができる。または、前記マージインデックスに基づいて多様なインター予測モード候補の中から一つを選択することができる。前記インター予測モード候補は、スキップモード、マージモード及び/または(A)MVPモードなど、多様なインター予測モードを含むことができる。
【0123】
デコーディング装置は、前記決定されたインター予測モードに基づいて前記現在ブロックの動き情報を導出する(S1010)。例えば、デコーディング装置は、前記現在ブロックにスキップモードまたはマージモードが適用される場合、後述するマージ候補リストを構成し、前記マージ候補リストに含まれているマージ候補の中から一つのマージ候補を選択することができる。前記選択は、前述した選択情報(merge index)に基づいて実行されることができる。前記選択されたマージ候補の動き情報を利用して前記現在ブロックの動き情報が導出されることができる。前記選択されたマージ候補の動き情報が前記現在ブロックの動き情報として利用されることができる。
【0124】
他の例として、デコーディング装置は、前記現在ブロックに(A)MVPモードが適用される場合、(A)MVP候補リストを構成し、前記(A)MVP候補リストに含まれているmvp(motion vector predictor)候補の中から選択されたmvp候補の動きベクトルを前記現在ブロックのmvpとして利用できる。前記選択は、前述した選択情報(mvp flag or mvp index)に基づいて実行されることができる。この場合、前記MVDに関する情報に基づいて前記現在ブロックのMVDを導出することができ、前記現在ブロックのmvpと前記MVDに基づいて前記現在ブロックの動きベクトルを導出することができる。また、前記参照ピクチャインデックス情報に基づいて前記現在ブロックの参照ピクチャインデックスを導出することができる。前記現在ブロックに関する参照ピクチャリスト内で前記参照ピクチャインデックスが指すピクチャが、前記現在ブロックのインター予測のために参照される参照ピクチャとして導出されることができる。
【0125】
一方、候補リスト構成無しで前記現在ブロックの動き情報が導出されることができ、この場合、前述したような候補リスト構成は省略されることができる。
【0126】
デコーディング装置は、前記現在ブロックの動き情報に基づいて前記現在ブロックに対する予測サンプルを生成することができる(S1020)。この場合、前記現在ブロックの参照ピクチャインデックスに基づいて前記参照ピクチャを導出し、前記現在ブロックの動きベクトルが前記参照ピクチャ上で指す参照ブロックのサンプルを利用して前記現在ブロックの予測サンプルを導出することができる。この場合、後述するように、場合によって、前記現在ブロックの予測サンプルのうち全部または一部に対する予測サンプルフィルタリング手順がさらに実行されることができる。
【0127】
例えば、デコーディング装置のインター予測部332は、予測モード決定部332_1、動き情報導出部332_2、及び予測サンプル導出部332_3を含むことができ、予測モード決定部332_1で受信された予測モード情報に基づいて前記現在ブロックに対する予測モードを決定し、動き情報導出部332_2で受信された動き情報に関する情報に基づいて前記現在ブロックの動き情報(動きベクトル及び/または参照ピクチャインデックス等)を導出し、予測サンプル導出部332_3で前記現在ブロックの予測サンプルを導出することができる。
【0128】
デコーディング装置は、受信されたレジデュアル情報に基づいて前記現在ブロックに対するレジデュアルサンプルを生成する(S1030)。デコーディング装置は、前記予測サンプル及び前記レジデュアルサンプルに基づいて前記現在ブロックに対する復元サンプルを生成し、これに基づいて復元ピクチャを生成することができる(S1040)。以後前記復元ピクチャにインループフィルタリング手順などがさらに適用されることができることは、前述の通りである。
【0129】
一方、前述したように、HLS(high level syntax)がビデオ/映像コーディングのためにコーディング/シグナリングされることができる。コーディングされたピクチャは、一つ以上のスライスで構成されることができる。コーディングされたピクチャを記述するパラメータは、ピクチャヘッダ内でシグナリングされ、スライスを記述するパラメータは、スライスヘッダ内でシグナリングされる。ピクチャヘッダは、自体NALユニット形態で運搬される。スライスヘッダは、スライス(即ち、スライスデータ)のペイロードを含むNALユニットの開始部分に存在する。
【0130】
各々のピクチャは、ピクチャヘッダと関連付けられている。ピクチャは、互いに異なるタイプのスライス(イントラコーディングされたスライス(即ち、Iスライス)及びインターコーディングされたスライス(即ち、Pスライス及びBスライス))で構成されることができる。したがって、ピクチャヘッダは、ピクチャのイントラスライス及びピクチャのインタースライスに必要なシンタックス要素を含むことができる。例えば、ピクチャヘッダのシンタックスは、以下の表1の通りである。
【0131】
【表1-1】
【0132】
【表1-2】
【0133】
【表1-3】
【0134】
【表1-4】
【0135】
【表1-5】
【0136】
【表1-6】
【0137】
【表1-7】
【0138】
【表1-8】
【0139】
表1のシンタックス要素のうち、その名称に「intra_slice」を含むシンタックス要素(例えば、pic_log2_diff_min_qt_min_cb_intra_slice_luma)は、該当ピクチャのIスライスで使われるシンタックス要素であり、その名称に「inter_slice」を含むシンタックス要素(例えば、pic_log2_diff_min_qt_min_cb_inter_sliceとmvp、mvd、mmvd、mergeなどに関連したシンタックス要素(例えば、pic_temporal_mvp_enabled_flag)は、該当ピクチャのPスライス及び/またはBスライスで使われるシンタックス要素である。
【0140】
即ち、上記ピクチャヘッダは、全ての単一ピクチャに対してイントラコーディングされたスライスに必要なシンタックス要素とインターコーディングされたスライスに必要なシンタックス要素とを全て含む。しかし、これは混合されたタイプのスライスを含むピクチャ(イントラコーディングされたスライスとインターコーディングされたスライスとを全て含むピクチャ)に対してのみ有用である。一般的な場合、ピクチャには混合されたタイプのスライスが含まれないため(即ち、一般的なピクチャは、イントラコーディングされたスライスのみを含み、またはインターコーディングされたスライスのみを含む)、全てのデータ(イントラコーディングされたスライスで使われるシンタックス要素及びインターコーディングされたスライスで使われるシンタックス要素)をシグナリングすることは不要である。
【0141】
以下の図面は、本文書の具体的な一例を説明するために作成された。図面に記載された具体的な装置の名称や具体的な信号/情報の名称は、例示的に提示されたものであるため、本明細書の技術的特徴が以下の図面に使われた具体的な名称に制限されない。
【0142】
本文書は、前述した問題を解決するために下記の方法を提供する。各方法の項目は、個別的に適用され、または互いに組み合わせて適用されることができる。
【0143】
1.イントラコーディングされたスライスにのみ必要なシンタックス要素がピクチャヘッダ内に存在するかどうかを示すピクチャヘッダ内のフラグ(a flag in picture header to specify whether syntax elements that are needed only by intra coded slices are present in the picture header)がシグナリングされることができる。前記フラグは、intra_signalling_present_flagと呼ばれることができる。
【0144】
a)intra_signalling_present_flagが1である場合、イントラコーディングされたスライスに必要なシンタックス要素がピクチャヘッダに存在する(When intra_signalling_present_flag is equal to 1,syntax elements that are needed by intra coded slices are present in the picture header)。同様に、intra_signalling_present_flagが0である場合、イントラコーディングされたスライスに必要なシンタックス要素がピクチャヘッダに存在しない(Likewise,when intra_signalling_present_flag is equal to 0,syntax elements that are needed by intra coded slices are not present in the picture header)。
【0145】
b)前記ピクチャヘッダと関連したピクチャが少なくても一つのイントラコーディングされたスライスを有する場合、前記ピクチャヘッダ内のintra_signalling_present_flagの値は1である(The value of intra_signalling_present_flag in a picture header shall be equal to 1 on the picture associated with the picture header has at least one intra coded slice)。
【0146】
c)前記ピクチャヘッダと関連したピクチャがイントラコーディングされたスライスを有しない場合にも、前記ピクチャヘッダ内のintra_signalling_present_flagの値は1である(The value of intra_signalling_present_flag in a picture header may be equal to 1 even when the picture associated with the picture header does not have intra coded slice)。
【0147】
d)ピクチャがイントラコーディングされたスライスのみを含む一つ以上のサブピクチャを有し、前記一つ以上のサブピクチャが抽出され、一つ以上のインターコーディングされたスライスを含むサブピクチャと併合されることと予想される場合、intra_signalling_present_flagの値は1に設定される(When a picture has one or more subpicture(s)containing intra coded slices only and it is anticipated that one or more of the subpicture(s) may be extracted and merged with subpictures which contains one or more inter coded slices,the value of intra_signalling_present_flag should be set equal to 1)。
【0148】
2.インターコーディングされたスライスにのみ必要なシンタックス要素がピクチャヘッダ内に存在するかどうかを示すピクチャヘッダ内のフラグ(a flag in picture header to specify whether syntax elements that are needed only by inter coded slices are present in the picture header)がシグナリングされることができる。前記フラグは、inter_signalling_present_flagと呼ばれることができる。
【0149】
a)inter_signalling_present_flagが1である場合、インターコーディングされたスライスに必要なシンタックス要素がピクチャヘッダに存在する(When inter_signalling_present_flag is equal to 1,syntax elements that are needed by inter coded slices are present in the picture header)。同様に、intra_signalling_present_flagが0である場合、インターコーディングされたスライスに必要なシンタックス要素がピクチャヘッダに存在しない(Likewise,when inter_signalling_present_flag is equal to 0,syntax elements that are needed by inter coded slices are not present in the picture header)。
【0150】
b)前記ピクチャヘッダと関連したピクチャが少なくても一つのインターコーディングされたスライスを有する場合、前記ピクチャヘッダ内のinter_signalling_present_flagの値は1である(The value of inter_signalling_present_flag in a picture header shall be equal to 1 on the picture associated with the picture header has at least one inter coded slice)。
【0151】
c)前記ピクチャヘッダと関連したピクチャがインターコーディングされたスライスを有しない場合にも、前記ピクチャヘッダ内のinter_signalling_present_flagの値は1である。(The value of inter_signalling_present_flag in a picture header may be equal to 1 even when the picture associated with the picture header does not have inter coded slice)。
【0152】
d)ピクチャがインターコーディングされたスライスのみを含む一つ以上のサブピクチャを有し、前記一つ以上のサブピクチャが抽出され、一つ以上のイントラコーディングされたスライスを含むサブピクチャと併合されることと予想される場合、inter_signalling_present_flagの値は1に設定される(When a picture has one or more subpicture(s) containing inter coded slices only and it is anticipated that one or more of the subpicture(s) may be extracted and merged with subpictures which contains one or more intra coded slices,the value of inter_signalling_present_flag should be set equal to 1)。
【0153】
3.前記フラグ(intra_signalling_present_flag及びinter_signalling_present_flag)は、ピクチャヘッダの代わりにピクチャパラメータセット(PPS)などの他のパラメータセットでシグナリングされることができる(the above flags(intra_signalling_present_flag and inter_signalling_present_flag)may be signalled in other parameter set such as picture parameter set(PPS)instead of in picture header)。
【0154】
4.前記フラグのシグナリングのための他の代案は、下記の通りである(An other alternative for signalling the above flags can be as follow)。
【0155】
a)イントラコーディングされたスライスに必要なシンタックス要素とインターコーディングされたスライスに必要なシンタックス要素が、各々ピクチャヘッダに存在するかどうかを示す二つの変数IntraSignallingPresentFlag及びInterSignallingPresentFlag(two variables IntraSignallingPresentFlag and InterSignallingPresentFlag which specify whether syntax elements needed by intra coded slices and syntax element needed by inter coded slices,respectively,present in the picture header or not)が定義されることができる。
【0156】
b)ピクチャヘッダ内のmixed_slice_types_present_flagと呼ばれるフラグ(a flag called mixed_slice_types_present_flag in the picture header)をシグナリングすることができる。mixed_slice_types_present_flagが1である場合、IntraSignallingPresentFlag及びInterSignallingPresentFlagの値は1に設定される(When mixed_slice_types_present_flag is equal to 1,the value of IntraSignallingPresentFlag and InterSignallingPresentFlag are set to be equal to 1)。
【0157】
c)mixed_slice_types_present_flagが0である場合、intra_slice_only_flagと呼ばれる追加フラグがピクチャヘッダにシグナリングされて次が適用されることができる(When mixed_slice_types_present_flag is equal to 0,additional flag called intra_slice_only_flag may be signalled in the picture header and the following applies)。intra_slice_only_flagが1である場合、IntraSignallingPresentFlag値は1に設定され、InterSignallingPresentFlag値は0に設定される(If intra_slice_only_flag is equal to 1,the value of IntraSignallingPresentFlag is set equal to 1 and the value of InterSignallingPresentFlag is set equal to 0)。そうでない場合、IntraSignallingPresentFlag値は0に設定され、InterSignallingPresentFlag値は1に設定される(Otherwise,the value of IntraSignallingPresentFlag is set equal to 0 and the value of InterSignallingPresentFlag is set equal to 1)。
【0158】
5.次の情報を示すslice_types_idcと呼ばれるピクチャヘッダ内の固定長さシンタックス要素(a fixed length syntax element in picture header,which may be called slice_types_idc,that specifies the following information)がシグナリングされることができる。
【0159】
a)ピクチャヘッダと関連したピクチャがイントラコーディングされたスライスのみを含むかどうか(Whether the picture associated with the picture header contain intra coded slices only)。このタイプの場合、slice_types_idcの値は0に設定されることができる(For this type,the value of slice_types_idc may be set equal to 0)。
【0160】
b)ピクチャヘッダと関連したピクチャがインターコーディングされたスライスのみを含むかどうか(Whether the picture associated with the picture header contain inter coded slices only)。slice_types_idcの値は1に設定されることができる(The value of slice_types_idc may be set equal to 1)。
【0161】
c)ピクチャヘッダと関連したピクチャがイントラコーディングされたスライス及びインターコーディングされたスライスを含むかどうか(Whether the picture associated with the picture header may contain intra coded slices and inter coded slices)。slice_types_idcの値は2に設定されることができる(The value of slice_types_idc may be set equal to 2)。
【0162】
slice_types_idcの値が2である場合にも、ピクチャにイントラコーディングされたスライスのみが含まれ、またはインターコーディングされたスライスのみが含まれることができる(Note that when slice_types_idc has value equal to 2,it is still possible that the picture contains intra coded slices only or inter coded slices only)。
【0163】
d)slice_types_idcの他の値は、今後使用のために予約されることができる(Other values of slice_types_idc may be reserved for future use)。
【0164】
6.ピクチャヘッダのslice_types_idcセマンティクスに対して次の制約が追加で指定されることができる(For slice_types_idc semantics in a picture header,the following constraints may be further specified)。
【0165】
a)ピクチャヘッダと関連したピクチャが一つ以上のイントラコーディングされたスライスを有する時、slice_types_idcの値は1になることができない(When the picture associated with the picture header has one or more intra coded slice,the value of slice_types_idc shall not be equal to 1)。
【0166】
b)ピクチャヘッダと関連したピクチャが一つ以上のインターコーディングされたスライスを有する時、slice_types_idcの値は0になることができない(When the picture associated with the picture header has one or more inter coded slice,the value of slice_types_idc shall not be equal to 0)。
【0167】
7.slice_types_idcは、ピクチャヘッダの代わりにピクチャパラメータセット(PPS)のような他のパラメータセットでシグナリングされることができる(slice_types_idc may be signalled in other parameter set such as picture parameter set(PPS)instead of in picture header)。
【0168】
一実施例として、エンコーディング装置及びデコーディング装置は、上記の1及び2の方法に基づいて以下の表2及び表3をピクチャヘッダのシンタックス及びセマンティクスとして使用することができる。
【0169】
【表2-1】
【0170】
【表2-2】
【0171】
【表2-3】
【0172】
【表3】
【0173】
表2及び表3を参照すると、intra_signalling_present_flagの値が1である場合、これはイントラコーディングされたスライスでのみ使われるシンタックス要素がピクチャヘッダに存在することを示すことができる。intra_signalling_present_flagの値が0である場合、これはイントラコーディングされたスライスでのみ使われるシンタックス要素がピクチャヘッダに存在しないことを示す。したがって、ピクチャヘッダに関連したピクチャがIスライスのスライスタイプを有するスライスを一つ以上含む場合、intra_signalling_present_flagの値は1になる。そして、ピクチャヘッダに関連したピクチャがIスライスのスライスタイプを有するスライスを含まない場合、intra_signalling_present_flagの値は0になる。
【0174】
inter_signalling_present_flagの値が1である場合、これはインターコーディングされたスライスでのみ使われるシンタックス要素がピクチャヘッダに存在することを示すことができる。inter_signalling_present_flagの値が0である場合、これはインターコーディングされたスライスでのみ使われるシンタックス要素がピクチャヘッダに存在しないことを示す。したがって、ピクチャヘッダに関連したピクチャがPスライス及び/またはBスライスのスライスタイプを有するスライスを一つ以上含む場合、inter_signalling_present_flagの値は1になる。そして、ピクチャヘッダに関連したピクチャがPスライス及び/またはBスライスのスライスタイプを有するスライスを含まない場合、inter_signalling_present_flagの値は0になる。
【0175】
また、インターコーディングされたスライスを含む一つ以上のサブピクチャと併合されることができるイントラコーディングされたスライスを含む一つ以上のサブピクチャを含むピクチャの場合、intra_signalling_present_flagの値とinter_signalling_present_flagの値は、全て1に設定される。
【0176】
例えば、エンコーディング装置は、現在ピクチャにインターコーディングされたスライス(Pスライス及び/またはBスライス)のみが含まれる場合、inter_signalling_present_flagの値を1に決定し、intra_signalling_present_flagの値を0に決定できる。
【0177】
他の例として、エンコーディング装置は、現在ピクチャにイントラコーディングされたスライス(Iスライス)のみが含まれる場合、inter_signalling_present_flagの値を0に決定し、intra_signalling_present_flagの値を1に決定できる。
【0178】
他の例として、エンコーディング装置は、現在ピクチャに少なくとも一つのインターコーディングされたスライスが含まれ、または少なくとも一つのイントラコーディングされたスライスが含まれる場合、inter_signalling_present_flagの値とintra_signalling_present_flagの値を全て1に決定できる。
【0179】
intra_signalling_present_flagの値が0に決定される場合、エンコーディング装置は、イントラスライスに必要なシンタックス要素を除外または省略し、ピクチャヘッダにインタースライスに必要なシンタックス要素のみを含む映像情報を生成することができる。もし、inter_signalling_present_flagの値が0に決定される場合、エンコーディング装置は、インタースライスに必要なシンタックス要素を除外または省略し、ピクチャヘッダにイントラスライスに必要なシンタックス要素のみを含む映像情報を生成することができる。
【0180】
デコーディング装置は、映像情報内のピクチャヘッダから取得したinter_signalling_present_flagの値が1である場合、該当ピクチャに少なくとも一つのインターコーディングされたスライスが含まれることと判断し、前記ピクチャヘッダからイントラ予測に必要なシンタックス要素をパーシングすることができる。もし、inter_signalling_present_flagの値が0である場合、該当ピクチャにイントラコーディングされたスライスのみが含まれることと判断し、前記ピクチャヘッダからイントラ予測に必要なシンタックス要素をパーシングすることができる。映像情報内のピクチャヘッダから取得したintra_signalling_present_flagの値が1である場合、デコーディング装置は、該当ピクチャに少なくとも一つのイントラコーディングされたスライスが含まれることと判断し、前記ピクチャヘッダからイントラ予測に必要なシンタックス要素をパーシングすることができる。もし、intra_signalling_present_flagの値が0である場合、該当ピクチャにインターコーディングされたスライスのみが含まれることと判断し、前記ピクチャヘッダからインター予測に必要なシンタックス要素をパーシングすることができる。
【0181】
他の実施例として、エンコーディング装置及びデコーディング装置は、上記の5及び6の方法に基づいて以下の表4及び表5をピクチャヘッダのシンタックス及びセマンティクスとして使用することができる。
【0182】
【表4-1】
【0183】
【表4-2】
【0184】
【表4-3】
【0185】
【表4-4】
【0186】
【表5】
【0187】
表4及び表5を参照すると、slice_types_idcの値が0である場合、これはピクチャヘッダに関連したピクチャ内の全てのスライスのタイプがIスライスであることを示す。slice_types_idcの値が1である場合、これはピクチャヘッダに関連したピクチャ内の全てのスライスのタイプがPまたはBスライスであることを示す。slice_types_idcの値が2である場合、これはピクチャヘッダに関連したピクチャ内のスライスのスライスタイプがI、P及び/またはBスライスであることを示す。
【0188】
例えば、エンコーディング装置は、現在ピクチャにイントラコーディングされたスライスのみが含まれる場合、slice_types_idcの値を0に決定し、ピクチャヘッダにイントラスライスのデコーディングに必要なシンタックス要素のみを含ませることができる。即ち、この場合、前記ピクチャヘッダにはインタースライスに必要なシンタックス要素が含まれない。
【0189】
他の例として、エンコーディング装置は、現在ピクチャにインターコーディングされたスライスのみが含まれる場合、slice_types_idcの値を1に決定し、ピクチャヘッダにインタースライスのデコーディングに必要なシンタックス要素のみを含ませることができる。即ち、この場合、前記ピクチャヘッダに、イントラスライスに必要なシンタックス要素は含まれない。
【0190】
他の例として、エンコーディング装置は、現在ピクチャに少なくとも一つのインターコーディングされたスライスと少なくとも一つのイントラコーディングされたスライスが含まれる場合、slice_types_idcの値を2に決定し、ピクチャヘッダにインタースライスのデコーディングに必要なシンタックス要素とイントラスライスのデコーディングに必要なシンタックス要素を全て含ませることができる。
【0191】
デコーディング装置は、映像情報内のピクチャヘッダから取得したslice_types_idcの値が0である場合、該当ピクチャにイントラコーディングされたスライスのみが含まれることと判断し、前記ピクチャヘッダからイントラコーディングされたスライスのデコーディングに必要なシンタックス要素をパーシングすることができる。もし、slice_types_idcの値が1である場合、デコーディング装置は、該当ピクチャにインターコーディングされたスライスのみが含まれることと判断し、前記ピクチャヘッダからインターコーディングされたスライスのデコーディングに必要なシンタックス要素をパーシングすることができる。もし、slice_types_idcの値が2である場合、デコーディング装置は、該当ピクチャに少なくとも一つのイントラコーディングされたスライスと少なくとも一つのインターコーディングされたスライスが含まれることと判断し、前記ピクチャヘッダからイントラコーディングされたスライスのデコーディングに必要なシンタックス要素とインターコーディングされたスライスのデコーディングに必要なシンタックス要素をパーシングすることができる。
【0192】
他の実施例として、エンコーディング装置及びデコーディング装置は、ピクチャがイントラ及びインターコーディングされたスライスを含むかを示す一つのフラグを使用することができる。前記フラグが真(true)、即ち、前記フラグの値が1である場合、該当ピクチャにイントラスライスとインタースライスが全て含まれることができる。この場合、以下の表6及び表7がピクチャヘッダのシンタックス及びセマンティクスとして使用することができる。
【0193】
【表6-1】
【0194】
【表6-2】
【0195】
【表6-3】
【0196】
【表6-4】
【0197】
【表7】
【0198】
表6及び表7を参照すると、mixed_slice_signalling_present_flagの値が1である場合、これは該当ピクチャヘッダと関連したピクチャが互いに異なるタイプを有する一つ以上のスライスを有することができることを示す。mixed_slice_signalling_present_flagの値が0である場合、これは該当ピクチャヘッダと関連したピクチャが単一スライスタイプにのみ関連したデータを含むことを示す。
【0199】
変数InterSignallingPresentFlag及びIntraSignallingPresentFlagは、各々、イントラコーディングされたスライスに必要なシンタックス要素とインターコーディングされたスライスに必要なシンタックス要素とが該当ピクチャヘッダに存在するかどうかを示す。mixed_slice_signalling_present_flagの値が1である場合、IntraSignallingPresentFlag及びInterSignallingPresentFlagの値は1に設定される。
【0200】
intra_slice_only_flagの値が1に設定される場合、IntraSignallingPresentFlagの値は1に設定され、InterSignallingPresentFlagの値は0に設定されることを示す。intra_slice_only_flagの値が0である場合、IntraSignallingPresentFlagの値が0に設定され、InterSignallingPresentFlagの値が1に設定されることを示す。
【0201】
ピクチャヘッダと関連したピクチャが、スライスタイプがIスライスである一つ以上のスライスを有すると、IntraSignallingPresentFlagの値は1に設定される。ピクチャヘッダと関連したピクチャが、スライスタイプがPまたはBスライスである一つ以上のスライスを有すると、InterSignallingPresentFlagの値は1に設定される。
【0202】
例えば、エンコーディング装置は、現在ピクチャにイントラコーディングされたスライスのみが含まれる場合、mixed_slice_signalling_present_flagの値を0に決定し、intra_slice_only_flagの値を1に決定し、IntraSignallingPresentFlagの値を1に決定し、InterSignallingPresentFlagの値を0に決定できる。
【0203】
他の例として、エンコーディング装置は、現在ピクチャにインターコーディングされたスライスのみが含まれる場合、mixed_slice_signalling_present_flagの値を0に決定し、intra_slice_only_flagの値を0に決定し、IntraSignallingPresentFlagの値を0に決定し、InterSignallingPresentFlagの値を1に決定できる。
【0204】
他の例として、エンコーディング装置は、現在ピクチャに少なくとも一つのイントラコーディングされたスライスと少なくとも一つのインターコーディングされたスライスとが含まれる場合、mixed_slice_signalling_present_flag、IntraSignallingPresentFlag、及びInterSignallingPresentFlagの値を1に決定できる。
【0205】
デコーディング装置は、映像情報内のピクチャヘッダから取得したmixed_slice_signalling_present_flagの値が0である場合、該当ピクチャにイントラコーディングされたスライスまたはインターコーディングされたスライスのみが含まれることと判断できる。この場合、ピクチャヘッダから取得したintra_slice_only_flagの値が0である場合、デコーディング装置は、前記ピクチャヘッダからインターコーディングされたスライスのデコーディングに必要なシンタックス要素のみをパーシングすることができる。intra_slice_only_flagの値が1である場合、デコーディング装置は、前記ピクチャヘッダからイントラコーディングされたスライスのデコーディングに必要なシンタックス要素のみをパーシングすることができる。
【0206】
もし、映像情報内のピクチャヘッダから取得したmixed_slice_signalling_present_flagの値が1である場合、デコーディング装置は、該当ピクチャに少なくとも一つのイントラコーディングされたスライスと少なくとも一つのインターコーディングされたスライスとが含まれることと判断し、ピクチャヘッダからインターコーディングされたスライスのデコーディングに必要なシンタックス要素とイントラコーディングされたスライスのデコーディングに必要なシンタックス要素とをパーシングすることができる。
【0207】
図12及び図13は、本文書の実施例に係るビデオ/映像エンコーディング方法及び関連コンポーネントの一例を概略的に示す。
【0208】
図12に開示されたビデオ/映像エンコーディング方法は、図2及び図13に開示された(ビデオ/映像)エンコーディング装置200により実行されることができる。具体的に、例えば、図12のS1200及びS1210は、エンコーディング装置200の予測部220により実行されることができ、S1220及びS1230は、エンコーディング装置200のエントロピーエンコーディング部240により実行されることができる。図12に開示されたビデオ/映像エンコーディング方法は、本文書で詳述した実施例を含むことができる。
【0209】
具体的に、図12及び図13を参照すると、エンコーディング装置の予測部220は、現在ピクチャ内の現在ブロックの予測モードを決定することができる(S1200)。前記現在ピクチャは、複数個のスライスを含むことができる。エンコーディング装置の予測部220は、前記予測モードに基づいて前記現在ブロックに対する予測サンプル(予測されたブロック)を生成することができる(S1210)。ここで、前記予測モードは、インター予測モード及びイントラ予測モードを含むことができる。前記現在ブロックの予測モードがインター予測モードである場合、前記予測サンプルは、予測部220のインター予測部221で生成されることができる。前記現在ブロックの予測モードがイントラ予測モードである場合、前記予測サンプルは、予測部220のイントラ予測部222で生成されることができる。
【0210】
エンコーディング装置のレジデュアル処理部230は、前記予測サンプルと原本ピクチャ(原本ブロック、原本サンプル)に基づいてレジデュアルサンプル及びレジデュアル情報を生成することができる。ここで、前記レジデュアル情報は、前記レジデュアルサンプルに関する情報であって、前記レジデュアルサンプルに対する(量子化された)変換係数に関する情報を含むことができる。
【0211】
エンコーディング装置の加算部(または、復元部)は、レジデュアル処理部230で生成されたレジデュアルサンプルとインター予測部221またはイントラ予測部222で生成された予測サンプルとを加えることによって復元(reconstructed)サンプル(復元ピクチャ、復元ブロック、復元サンプルアレイ)を生成することができる。
【0212】
一方、エンコーディング装置のエントロピーエンコーディング部240は、前記予測モードに基づいて、デコーディングプロセスのためのインター予測動作に必要な情報が前記現在ピクチャと関連したピクチャヘッダに存在するかを示す第1の情報または前記デコーディングプロセスのためのイントラ予測動作に必要な情報が前記現在ピクチャと関連したピクチャヘッダに存在するかを示す第2の情報を生成することができる(S1220)。ここで、前記第1の情報及び前記第2の情報は、前記映像情報のピクチャヘッダに含まれる情報であって、前述したintra_signalling_present_flag、inter_signalling_present_flag、slice_type_idc、mixed_slice_signalling_present_flag、intra_slice_only_flag、IntraSignallingPresentFlag及び/またはInterSignallingPresentFlagに該当できる。
【0213】
一例として、エンコーディング装置のエントロピーエンコーディング部240は、現在ピクチャにインターコーディングされたスライスが含まれるにつれて前記現在ピクチャと関連したピクチャヘッダにデコーディングプロセスのためのインター予測動作に必要な情報が含まれる場合、前記第1の情報の値を1に決定できる。また、前記現在ピクチャにイントラコーディングされたスライスが含まれるにつれて該当ピクチャヘッダにデコーディングプロセスのためのイントラ予測動作に必要な情報が含まれる場合、エンコーディング装置のエントロピーエンコーディング部240は、前記第2の情報の値を1に決定できる。この場合、前記第1の情報は、inter_signalling_present_flagに該当でき、前記第2の情報は、intra_signalling_present_flagに該当できる。前記第1の情報は、第1のフラグ、インタースライスに使われるシンタックス要素が前記ピクチャヘッダに存在するかに関する情報、前記インタースライスに使われるシンタックス要素が前記ピクチャヘッダに存在するかに関するフラグ、前記現在ピクチャ内のスライスがインタースライスであるかに関する情報、前記スライスがインタースライスであるかに関するフラグなどと呼ばれることができる。前記第2の情報は、第2のフラグ、イントラスライスに使われるシンタックス要素が前記ピクチャヘッダに存在するかに関する情報、前記イントラスライスに使われるシンタックス要素が前記ピクチャヘッダに存在するかに関するフラグ、前記現在ピクチャ内のスライスがイントラスライスであるかに関する情報、前記スライスがイントラスライスであるかに関するフラグなどと呼ばれることができる。
【0214】
一方、エンコーディング装置のエントロピーエンコーディング部240は、前記ピクチャにイントラコーディングされたスライスのみが含まれるにつれて該当ピクチャヘッダにイントラ予測動作に必要な情報のみが含まれる場合、前記第1の情報の値を0に決定し、前記第2の情報の値を1に決定できる。そして、エンコーディング装置のエントロピーエンコーディング部240は、前記ピクチャにインターコーディングされたスライスのみが含まれるにつれて該当ピクチャヘッダにインター予測動作に必要な情報のみが含まれる場合、前記第1の情報の値を1に決定し、前記第2の情報の値を0に決定できる。したがって、前記第1の情報の値が0である場合、前記現在ピクチャ内の全てのスライスは、Iスライスタイプを有することができる。前記第2の情報の値が0である場合、前記現在ピクチャ内の全てのスライスは、PスライスタイプまたはBスライスタイプを有することができる。ここで、前記イントラ予測動作に必要な情報は、イントラスライスのデコーディングに使われるシンタックス要素を含み、前記インター予測動作に必要な情報は、インタースライスのデコーディングに使われるシンタックス要素を含むことができる。
【0215】
他の例として、エンコーディング装置のエントロピーエンコーディング部240は、現在ピクチャ内の全てのスライスがIスライスタイプを有する場合、スライスタイプに関する情報の値を0に決定し、前記現在ピクチャ内の全てのスライスがPスライスタイプまたはBスライスタイプを有する場合、前記スライスタイプに関する情報の値を1に決定し、前記現在ピクチャ内の全てのスライスがIスライスタイプ、Pスライスタイプ及び/またはBスライスタイプを有する場合(即ち、ピクチャ内のスライスのスライスタイプが混合された場合)、前記スライスタイプに関する情報の値を2に決定できる。この場合、前記スライスタイプに関する情報は、slice_type_idcに該当できる。
【0216】
他の例として、エンコーディング装置のエントロピーエンコーディング部240は、現在ピクチャ内の全てのスライスが互いに同じスライスタイプを有する場合、スライスタイプに関する情報の値を0に決定し、前記現在ピクチャ内のスライスが互いに異なるスライスタイプを有する場合、前記スライスタイプに関する情報の値を1に決定できる。この場合、前記スライスタイプに関する情報は、mixed_slice_signalling_present_flagに該当できる。
【0217】
前記スライスタイプに関する情報の値が0に決定される場合、該当ピクチャヘッダには前記スライスにイントラスライスが含まれるかに関する情報が含まれることができる。前記スライスにイントラスライスが含まれるかに関する情報は、intra_slice_only_flagに該当できる。もし、前記ピクチャ内の全てのスライスがIスライスタイプを有する場合、エンコーディング装置のエントロピーエンコーディング部240は、前記スライスにイントラスライスが含まれるかに関する情報の値を1に決定し、イントラスライスに使われるシンタックス要素が前記ピクチャヘッダに存在するかに関する情報の値を1に決定し、インタースライスに使われるシンタックス要素が前記ピクチャヘッダに存在するかに関する情報の値を0に決定できる。前記ピクチャ内の全てのスライスのスライスタイプがPスライス及び/またはBスライスタイプである場合、エンコーディング装置のエントロピーエンコーディング部240は、前記スライスにイントラスライスが含まれるかに関する情報の値を0に決定し、前記イントラスライスに使われるシンタックス要素が前記ピクチャヘッダに存在するかに関する情報の値を0に決定し、前記インタースライスに使われるシンタックス要素が前記ピクチャヘッダに存在するかに関する情報の値を1に決定できる。
【0218】
エンコーディング装置のエントロピーエンコーディング部240は、レジデュアル情報、予測関連情報などと共に前述した第1の情報、第2の情報、スライスタイプに関する情報などを含む映像情報をエンコーディングすることができる(S1230)。例えば、前記映像情報は、パーティショニング関連情報、予測モードに関する情報、レジデュアル情報、インループフィルタリング関連情報、第1の情報、第2の情報、スライスタイプに関する情報などを含むことができ、それに関する多様なシンタックス要素を含むことができる。一例として、前記映像情報は、アダプテーションパラメータセット(APS)、ピクチャパラメータセット(PPS)、シーケンスパラメータセット(SPS)またはビデオパラメータセット(VPS)等、多様なパラメータセットに関する情報を含むことができる。また、前記映像情報は、ピクチャヘッダシンタックス、ピクチャヘッダ構造シンタックス、スライスヘッダシンタックス、コーディングユニットシンタックスなどのような多様な情報を含むことができる。前述した第1の情報、第2の情報、スライスタイプに関する情報、前記イントラ予測動作に必要な情報、及び前記インター予測動作に必要な情報は、前記ピクチャヘッダ内のシンタックスに含まれることができる。
【0219】
エンコーディング装置のエントロピーエンコーディング部240でエンコーディングされた情報は、ビットストリーム形態で出力されることができる。前記ビットストリームは、ネットワークまたは格納媒体を介してデコーディング装置に送信されることができる。
【0220】
図14及び図15は、本文書の実施例に係るビデオ/映像デコーディング方法及び関連コンポーネントの一例を概略的に示す。
【0221】
図14に開示されたビデオ/映像デコーディング方法は、図3及び図15に開示された(ビデオ/映像)デコーディング装置300により実行されることができる。具体的に、例えば、図14のS1400及びS1410は、デコーディング装置のエントロピーデコーディング部310で実行されることができ、S1420は、デコーディング装置300の予測部330で実行されることができ、S1430は、デコーディング装置300の加算部340で実行されることができる。図14に開示されたビデオ/映像デコーディング方法は、本文書で詳述した実施例を含むことができる。
【0222】
図14及び図15を参照すると、デコーディング装置のエントロピーデコーディング部310は、ビットストリームから映像情報を取得することができる(S1400)。前記映像情報は、現在ピクチャと関連したピクチャヘッダを含むことができる。前記現在ピクチャは、複数個のスライスを含むことができる。
【0223】
一方、デコーディング装置のエントロピーデコーディング部310は、デコーディングプロセスのためのインター予測動作に必要な情報が前記現在ピクチャと関連したピクチャヘッダに存在するかを示す第1のフラグ及び/または前記デコーディングプロセスのためのイントラ予測動作に必要な情報が前記現在ピクチャと関連したピクチャヘッダに存在するかを示す第2のフラグを前記ピクチャヘッダからパーシングできる(S1410)。ここで、前記第1のフラグ及び前記第2のフラグは、前述したintra_signalling_present_flag、inter_signalling_present_flag、slice_type_idc、mixed_slice_signalling_present_flag、intra_slice_only_flag、IntraSignallingPresentFlag及び/またはInterSignallingPresentFlagに該当できる。デコーディング装置のエントロピーデコーディング部310は、前述した表2、表4及び表6のうちいずれか一つのピクチャヘッダシンタックスに基づいて、前記映像情報のピクチャヘッダに含まれているシンタックス要素をパーシングすることができる。
【0224】
デコーディング装置は、前記第1のフラグ、前記第2のフラグ、スライスタイプに関する情報などに基づいて、現在ピクチャ内のスライスに対してイントラ予測またはインター予測のうち少なくとも一つを実行して予測サンプルを生成することができる(S1420)。
【0225】
具体的に、デコーディング装置のエントロピーデコーディング部310は、前記第1のフラグ、前記第2のフラグ、及び/またはスライスタイプに関する情報等に基づいて、現在ピクチャと関連したピクチャヘッダからデコーディングプロセスのためのイントラ予測動作に必要な情報またはインター予測動作に必要な情報のうち少なくとも一つをパーシング(または、取得)することができる。デコーディング装置の予測部330は、前記イントラ予測動作に必要な情報または前記インター予測に対する情報のうち少なくとも一つに基づいて、イントラ予測及び/またはインター予測を実行して予測サンプルを生成することができる。ここで、前記イントラ予測動作に必要な情報は、イントラスライスのデコーディングに使われるシンタックス要素を含むことができ、前記インター予測動作に必要な情報は、インタースライスのデコーディングに使われるシンタックス要素を含むことができる。
【0226】
一例として、デコーディング装置のエントロピーデコーディング部310は、前記第1のフラグの値が0である場合、前記ピクチャヘッダ内に前記インター予測に使われるシンタックス要素が存在しないことと決定(または、判断)し、前記ピクチャヘッダから前記イントラ予測動作に必要な情報のみをパーシングすることができる。もし、前記第1のフラグの値が1である場合、デコーディング装置のエントロピーデコーディング部310は、前記ピクチャヘッダ内に前記インター予測に使われるシンタックス要素が存在することと決定(または、判断)し、前記ピクチャヘッダから前記インター予測動作に必要な情報をパーシングすることができる。この場合、前記第1のフラグは、inter_signalling_present_flagに該当できる。
【0227】
また、デコーディング装置のエントロピーデコーディング部310は、前記第2のフラグの値が0である場合、前記ピクチャヘッダ内に前記イントラ予測に使われるシンタックス要素が存在しないことと決定(または、判断)し、前記ピクチャヘッダから前記インター予測動作に必要な情報のみをパーシングすることができる。もし、前記第2のフラグの値が1である場合、デコーディング装置のエントロピーデコーディング部310は、前記ピクチャヘッダ内に前記イントラ予測に使われるシンタックス要素が存在することと決定(または、判断)し、前記ピクチャヘッダから前記イントラ予測動作に必要な情報をパーシングすることができる。この場合、前記第2のフラグは、intra_signalling_present_flagに該当できる。
【0228】
前記第1のフラグの値が0である場合、デコーディング装置は、前記現在ピクチャ内の全てのスライスがIスライスのタイプを有することと判断できる。前記第1のフラグの値が1である場合、デコーディング装置は、前記現在ピクチャ内の0個以上のスライスがPスライスまたはBスライスのタイプを有することと判断できる。即ち、前記第1のフラグの値が1である場合、前記現在ピクチャ内にはPスライスまたはBスライスのタイプを有するスライスが含まれることもあり、または含まれないこともある。
【0229】
また、前記第2のフラグの値が0である場合、デコーディング装置は、前記現在ピクチャ内の全てのスライスがPスライスまたはBスライスのタイプを有することと判断できる。前記第2のフラグの値が1である場合、デコーディング装置は、前記現在ピクチャ内の0個以上のスライスがIスライスのタイプを有することと判断できる。即ち、前記第2のフラグの値が1である場合、前記現在ピクチャ内にはIスライスのタイプをスライスが含まれることもあり、または含まれないこともある。
【0230】
他の例として、デコーディング装置のエントロピーデコーディング部310は、前記スライスタイプに関する情報の値が0である場合、前記現在ピクチャ内の全てのスライスがIスライスタイプを有することと判断し、前記ピクチャヘッダから前記イントラ予測動作に必要な情報のみをパーシングすることができる。前記スライスタイプに関する情報が1である場合、デコーディング装置のエントロピーデコーディング部310は、該当ピクチャ内の全てのスライスがPスライスタイプまたはBスライスタイプを有することと判断し、前記ピクチャヘッダから前記インター予測動作に必要な情報のみをパーシングすることができる。前記スライスタイプに関する情報の値が2である場合、デコーディング装置のエントロピーデコーディング部310は、前記該当ピクチャ内のスライスがIスライスタイプ、Pスライスタイプ及び/またはBスライスタイプが混合されたスライスタイプを有することと判断し、前記ピクチャヘッダから前記インター予測動作に必要な情報と前記イントラ予測動作に必要な情報を全てパーシングできる。この場合、前記スライスタイプに関する情報は、slice_type_idcに該当できる。
【0231】
他の例として、デコーディング装置のエントロピーデコーディング部310は、前記スライスタイプに関する情報の値が0である場合、ピクチャ内の全てのスライスが互いに同じスライスタイプを有することと判断し、前記スライスタイプに関する情報の値が1である場合、前記ピクチャ内のスライスが互いに異なるスライスタイプを有することと判断できる。この場合、前記スライスタイプに関する情報は、mixed_slice_signalling_present_flagに該当できる。
【0232】
デコーディング装置のエントロピーデコーディング部310は、前記スライスタイプに関する情報の値が0である場合、前記ピクチャヘッダから前記スライスにイントラスライスが含まれるかに関する情報をパーシングすることができる。前記スライスにイントラスライスが含まれるかに関する情報は、前述したintra_slice_only_flagに該当できる。前記スライスにイントラスライスが含まれるかに関する情報が1である場合、前記ピクチャ内の全てのスライスは、Iスライスタイプを有することができる。
【0233】
デコーディング装置のエントロピーデコーディング部310は、前記スライスにイントラスライスが含まれるかに関する情報の値が1である場合、前記ピクチャヘッダから前記イントラ予測動作に必要な情報のみをパーシングすることができる。前記スライスにイントラスライスが含まれるかに関する情報の値が0である場合、デコーディング装置のエントロピーデコーディング部310は、前記ピクチャヘッダから前記インター予測動作に必要な情報のみをパーシングすることができる。
【0234】
デコーディング装置のエントロピーデコーディング部310は、前記スライスタイプに関する情報の値が1である場合、前記ピクチャヘッダから前記インター予測動作に必要な情報と前記イントラ予測動作に必要な情報とを全てパーシングできる。
【0235】
一方、デコーディング装置のレジデュアル処理部320は、エントロピーデコーディング部310で取得されたレジデュアル情報に基づいてレジデュアルサンプルを生成することができる。
【0236】
デコーディング装置の加算部340は、予測部330で生成された予測サンプルとレジデュアル処理部320で生成されたレジデュアルサンプルとに基づいて復元サンプルを生成することができる(S1430)。そして、デコーディング装置の加算部340は、前記復元サンプルに基づいて復元ピクチャ(復元ブロック)を生成することができる。
【0237】
以後、必要によって、主観的/客観的画質を向上させるためにデブロッキングフィルタリング、SAO及び/またはALF手順のようなインループフィルタリング手順が前記復元ピクチャに適用されることができる。
【0238】
前述した実施例において、方法は、一連のステップまたはブロックで流れ図に基づいて説明されているが、該当実施例は、ステップの順序に限定されるものではなく、あるステップは、前述と異なるステップと、異なる順序にまたは同時に発生できる。また、当業者であれば、流れ図に示すステップが排他的でなく、他のステップが含まれ、または流れ図の一つまたはそれ以上のステップが本文書の実施例の範囲に影響を及ぼさずに削除可能であることを理解することができる。
【0239】
前述した本文書の実施例による方法は、ソフトウェア形態で具現されることができ、本文書によるエンコーディング装置及び/またはデコーディング装置は、例えば、TV、コンピュータ、スマートフォン、セットトップボックス、ディスプレイ装置などの映像処理を実行する装置に含まれることができる。
【0240】
本文書において、実施例がソフトウェアで具現される時、前述した方法は、前述した機能を遂行するモジュール(過程、機能など)で具現されることができる。モジュールは、メモリに格納され、プロセッサにより実行されることができる。メモリは、プロセッサの内部または外部にあり、よく知られた多様な手段でプロセッサと連結されることができる。プロセッサは、ASIC(application-specific integrated circuit)、他のチップセット、論理回路及び/またはデータ処理装置を含むことができる。メモリは、ROM(read-only memory)、RAM(random access memory)、フラッシュメモリ、メモリカード、格納媒体及び/または他の格納装置を含むことができる。即ち、本文書で説明した実施例は、プロセッサ、マイクロプロセッサ、コントローラまたはチップ上で具現されて実行されることができる。例えば、各図面で示す機能ユニットは、コンピュータ、プロセッサ、マイクロプロセッサ、コントローラまたはチップ上で具現されて実行されることができる。この場合、具現のための情報(例えば、information on instructions)またはアルゴリズムがデジタル格納媒体に格納されることができる。
【0241】
また、本文書の実施例が適用されるデコーディング装置及びエンコーディング装置は、マルチメディア放送送受信装置、モバイル通信端末、ホームシネマビデオ装置、デジタルシネマビデオ装置、監視用カメラ、ビデオ対話装置、ビデオ通信のようなリアルタイム通信装置、モバイルストリーミング装置、格納媒体、カムコーダ、注文型ビデオ(VoD)サービス提供装置、OTTビデオ(Over the top video)装置、インターネットストリーミングサービス提供装置、3次元(3D)ビデオ装置、VR(virtual reality)装置、AR(argumente reality)装置、画像電話ビデオ装置、運送手段端末(例えば、車両(自律走行車両を含む)端末、飛行機端末、船舶端末等)、及び医療用ビデオ装置などに含まれることができ、ビデオ信号またはデータ信号を処理するために使われることができる。例えば、OTTビデオ(Over the top video)装置として、ゲームコンソール、ブルーレイプレーヤ、インターネット接続TV、ホームシアターシステム、スマートフォン、タブレットPC、DVR(Digital Video Recorder)などを含むことができる。
【0242】
また、本文書の実施例が適用される処理方法は、コンピュータで実行されるプログラムの形態で生産されることができ、コンピュータが読み取り可能な記録媒体に格納されることができる。また、本文書の実施例によるデータ構造を有するマルチメディアデータもコンピュータが読み取り可能な記録媒体に格納されることができる。前記コンピュータが読み取り可能な記録媒体は、コンピュータで読みだすことができるデータが格納される全ての種類の格納装置及び分散格納装置を含む。前記コンピュータが読み取り可能な記録媒体は、例えば、ブルーレイディスク(BD)、汎用直列バス(USB)、ROM、PROM、EPROM、EEPROM、RAM、CD-ROM、磁気テープ、フロッピーディスク、及び光学的データ格納装置を含むことができる。また、前記コンピュータが読み取り可能な記録媒体は、搬送波(例えば、インターネットを介した送信)の形態で具現されたメディアを含む。また、エンコーディング方法で生成されたビットストリームがコンピュータが読み取り可能な記録媒体に格納され、または、有無線通信ネットワークを介して送信されることができる。
【0243】
また、本文書の実施例は、プログラムコードによるコンピュータプログラム製品で具現されることができ、前記プログラムコードは、本文書の実施例によりコンピュータで実行されることができる。前記プログラムコードは、コンピュータにより読み取り可能なキャリア上に格納されることができる。
【0244】
図16は、本文書に開示された実施例が適用されることができるコンテンツストリーミングシステムの例を示す。
【0245】
図16を参照すると、本文書の実施例が適用されるコンテンツストリーミングシステムは、大いに、エンコーディングサーバ、ストリーミングサーバ、ウェブサーバ、メディア格納所、ユーザ装置、及びマルチメディア入力装置を含むことができる。
【0246】
前記エンコーディングサーバは、スマートフォン、カメラ、カムコーダなどのようなマルチメディア入力装置から入力されたコンテンツをデジタルデータで圧縮してビットストリームを生成し、これを前記ストリーミングサーバに送信する役割をする。他の例として、スマートフォン、カメラ、カムコーダなどのようなマルチメディア入力装置がビットストリームを直接生成する場合、前記エンコーディングサーバは省略されることができる。
【0247】
前記ビットストリームは、本文書の実施例に適用されるエンコーディング方法またはビットストリーム生成方法により生成されることができ、前記ストリーミングサーバは、前記ビットストリームを送信または受信する過程で一時的に前記ビットストリームを格納することができる。
【0248】
前記ストリーミングサーバは、ウェブサーバを介したユーザ要請に基づいてマルチメディアデータをユーザ装置に送信し、前記ウェブサーバは、ユーザにどのようなサービスがあるかを知らせる媒介体役割をする。ユーザが前記ウェブサーバに所望のサービスを要請すると、前記ウェブサーバは、これをストリーミングサーバに伝達し、前記ストリーミングサーバは、ユーザにマルチメディアデータを送信する。このとき、前記コンテンツストリーミングシステムは、別途の制御サーバを含むことができ、この場合、前記制御サーバは、前記コンテンツストリーミングシステム内の各装置間の命令/応答を制御する役割をする。
【0249】
前記ストリーミングサーバは、メディア格納所及び/またはエンコーディングサーバからコンテンツを受信することができる。例えば、前記エンコーディングサーバからコンテンツを受信するようになる場合、前記コンテンツをリアルタイムで受信することができる。この場合、円滑なストリーミングサービスを提供するために、前記ストリーミングサーバは、前記ビットストリームを一定時間の間格納することができる。
【0250】
前記ユーザ装置の例として、携帯電話、スマートフォン(smart phone)、ノートブックコンピュータ(laptop computer)、デジタル放送用端末、PDA(personal digital assistants)、PMP(portable multimedia player)、ナビゲーション、スレートPC(slate PC)、タブレットPC(tablet PC)、ウルトラブック(ultrabook)、ウェアラブルデバイス(wearable device、例えば、ウォッチ型端末(smartwatch)、グラス型端末(smart glass)、HMD(head mounted display)、デジタルTV、デスクトップコンピュータ、デジタルサイニジがある。
【0251】
前記コンテンツストリーミングシステム内の各サーバは、分散サーバとして運営されることができ、この場合、各サーバで受信するデータは、分散処理されることができる。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
【手続補正書】
【提出日】2023-09-06
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
ビデオデコーディング装置により実行されるビデオデコーディング方法において、
現在ピクチャに対するピクチャヘッダを含むビットストリームを受信するステップと、
インタースライスのための情報が前記ピクチャヘッダに存在するかどうかに関連した第1のフラグ、又は、イントラスライスのための情報が前記ピクチャヘッダに存在するかどうかに関連した第2のフラグの少なくとも一つを前記ピクチャヘッダからパーシングするステップと、
前記第1のフラグ又は前記第2のフラグの少なくとも一つに基づいて、前記現在ピクチャ内のスライス内のブロックに対する予測サンプルを導出するステップであって、前記予測サンプルは、イントラ予測又はインター予測の少なくとも一つを実行することにより導出される、ステップと、
前記予測サンプルに基づいて復元サンプルを生成するステップと、を含み、
前記第1のフラグの値が1に等しいことは、前記インタースライスのための前記情報が前記ピクチャヘッダ内に存在することに関連し、
前記第2のフラグの値が1に等しいことは、前記イントラスライスのための前記情報が前記ピクチャヘッダ内に存在することに関連し、
前記第1のフラグの前記値が1に等しいことに基づいて、
クアッドツリー分割に起因する最小サイズの底が2の対数と、前記現在ピクチャ内の前記インタースライス内の最小コーディングブロックサイズの底が2の対数との間の差を表す第1シンタックスエレメントと、
前記現在ピクチャ内の前記インタースライス内のマルチタイプツリー分割に起因するコーディングユニットに対する最大階層深さを表す第2シンタックスエレメントと、
の少なくとも一つを含む前記インタースライスのための前記情報は、前記ピクチャヘッダに含まれる、ビデオデコーディング方法。
【請求項2】
ビデオエンコーディング装置により実行されるビデオエンコーディング方法において、
現在ピクチャ内のスライスのタイプを決定するステップであって、前記現在ピクチャは、前記スライスを含む、ステップと、
インタースライスのための情報が前記現在ピクチャと関連したピクチャヘッダに存在するかどうかに関連した第1のフラグ、又は、イントラスライスのための情報が前記ピクチャヘッダに存在するかどうかに関連した第2のフラグの少なくとも一つを生成するステップと、
前記第1のフラグ又は前記第2のフラグの少なくとも一つを含む映像情報をエンコーディングするステップと、を含み、
前記第1のフラグ及び前記第2のフラグは、前記映像情報の前記ピクチャヘッダに含まれ、
前記第1のフラグの値が1に等しいことは、前記インタースライスのための前記情報が前記ピクチャヘッダ内に存在することに関連し、
前記第2のフラグの値が1に等しいことは、前記イントラスライスのための前記情報が前記ピクチャヘッダ内に存在することに関連し、
前記第1のフラグの前記値が1に等しいことに基づいて、
クアッドツリー分割に起因する最小サイズの底が2の対数と、前記現在ピクチャ内の前記インタースライス内の最小コーディングブロックサイズの底が2の対数との間の差を表す第1シンタックスエレメントと、
前記現在ピクチャ内の前記インタースライス内のマルチタイプツリー分割に起因するコーディングユニットに対する最大階層深さを表す第2シンタックスエレメントと、
の少なくとも一つを含む前記インタースライスのための前記情報は、前記ピクチャヘッダに含まれる、ビデオエンコーディング方法。
【請求項3】
ビデオのためのデータの送信方法であって、
前記ビデオのためのビットストリームを取得するステップであって、前記ビットストリームは、
現在ピクチャ内のスライスのタイプを決定するステップであって、前記現在ピクチャは、前記スライスを含む、ステップと、
インタースライスのための情報が前記現在ピクチャと関連したピクチャヘッダに存在するかどうかに関連した第1のフラグ、又は、イントラスライスのための情報が前記ピクチャヘッダに存在するかどうかに関連した第2のフラグの少なくとも一つを生成するステップと、
前記第1のフラグ又は前記第2のフラグの少なくとも一つを含む映像情報をエンコーディングするステップと、
に基づいて生成される、ステップと、
前記ビットストリームを含む前記データを送信するステップと、を含み、
前記第1のフラグ及び前記第2のフラグは、前記映像情報の前記ピクチャヘッダに含まれ、
前記第1のフラグの値が1に等しいことは、前記インタースライスのための前記情報が前記ピクチャヘッダ内に存在することに関連し、
前記第2のフラグの値が1に等しいことは、前記イントラスライスのための前記情報が前記ピクチャヘッダ内に存在することに関連し、
前記第1のフラグの前記値が1に等しいことに基づいて、
クアッドツリー分割に起因する最小サイズの底が2の対数と、前記現在ピクチャ内の前記インタースライス内の最小コーディングブロックサイズの底が2の対数との間の差を表す第1シンタックスエレメントと、
前記現在ピクチャ内の前記インタースライス内のマルチタイプツリー分割に起因するコーディングユニットに対する最大階層深さを表す第2シンタックスエレメントと、
の少なくとも一つを含む前記インタースライスのための前記情報は、前記ピクチャヘッダに含まれる、方法。