特許7582576 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ホアウェイ・テクノロジーズ・カンパニー・リミテッドの特許一覧

特許7582576算術エンコーディング及びデコーディングにおける末尾ビットの操作

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7A
7B
7C
7D
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-11-05

(45)【発行日】2024-11-13

(54)【発明の名称】算術エンコーディング及びデコーディングにおける末尾ビットの操作

(51)【国際特許分類】

H04N 19/13 20140101AFI20241106BHJP

【ＦＩ】

H04N19/13

【請求項の数】 28

(21)【出願番号】P 2023548750

(86)(22)【出願日】2021-04-26

(65)【公表番号】

(43)【公表日】2024-03-11

(86)【国際出願番号】 RU2021000172

(87)【国際公開番号】W WO2022231451

(87)【国際公開日】2022-11-03

【審査請求日】2023-09-22

(73)【特許権者】

【識別番号】504161984

【氏名又は名称】ホアウェイ・テクノロジーズ・カンパニー・リミテッド

(74)【代理人】

【識別番号】110000877

【氏名又は名称】弁理士法人ＲＹＵＫＡ国際特許事務所

(72)【発明者】

【氏名】シチェフ、マキシムボリソヴィチ

(72)【発明者】

【氏名】ソロカ、アンドレイ

(72)【発明者】

【氏名】アルシナ、エレナアレクサンドロヴナ

(72)【発明者】

【氏名】イコニン、セルゲイユリエビッチ

【審査官】松元伸次

(56)【参考文献】

【文献】特表２０１６－５０８３３１（ＪＰ，Ａ）

【文献】特開２０２０－０１７９９３（ＪＰ，Ａ）

【文献】米国特許出願公開第２０２１／００９２４５４（ＵＳ，Ａ１）

【文献】特開２０１８－１９８４４７（ＪＰ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｈ０４Ｎ１９／００－１９／９８

(57)【特許請求の範囲】

【請求項1】

入力データをビットストリームに算術エンコーディングするための方法であって、
前記入力データをコーディング済みビット及び末尾ビットに算術エンコーディングする段階；
前記ビットストリームに前記コーディング済みビットを含める段階；
算術エンコーディングされた前記入力データの区間の最小値及び最大値を決定する段階；
連続する末尾ビットであり、
決定された前記最大値を表す第１最上位ビットＭＳＢ内において、決定された前記最小値を表す第２ＭＳＢ内と同一の値を有する
先行末尾ビットの量を決定する段階；及び
前記先行末尾ビットの決定された前記量の指示、及び
前記先行末尾ビット
を前記ビットストリームに含める段階
を備える方法。

【請求項2】

前記先行末尾ビットの前記量、ＮｕｍＴｒａｉｌｉｎｇＢｉｔｓが、
ＮｕｍＴｒａｉｌｉｎｇＢｉｔｓ＝ＣＬＺ（（ＬＯＷ＋ＲＡＮＧＥ－１）ＸＯＲＬＯＷ）
によって決定され、
ＣＬＺ（）は、先行０の数であり、ＬＯＷは、前記区間の前記最小値であり、ＲＡＮＧＥは、前記区間のレンジである、
請求項１に記載の方法。

【請求項3】

前記先行末尾ビットの前記量の前記指示は、前記ビットストリーム内において、前記コーディング済みビット及び前記先行末尾ビットに先行する、請求項１または２に記載の方法。

【請求項4】

前記ビットストリームに含める前記段階の前に、前記先行末尾ビットに対して、１の値を有する１ビットが後部に付加される、請求項１から３のいずれか一項に記載の方法。

【請求項5】

算術エンコーディングする前記段階、区間の最小値及び最大値を決定する前記段階、及び、先行末尾ビットの量を決定する前記段階は、第１サブストリーム及び第２サブストリームについて別個に実行され、結果として、第１コーディング済みビット、第２コーディング済みビット、第１先行末尾ビット、及び第２先行末尾ビットを生じさせ；
前記方法は、前記第１先行末尾ビット及び前記第２先行末尾ビットが後に続く前記第１コーディング済みビット及び前記第２コーディング済みビットを前記ビットストリームに挿入する段階を備える、
請求項１から４のいずれか一項に記載の方法。

【請求項6】

前記第１コーディング済みビットの長さを示す第１長さ指示、及び、前記第２コーディング済みビットの長さを示す第２長さ指示と共に、前記第１コーディング済みビット及び前記第２コーディング済みビットを前記ビットストリームに多重化する段階を更に備える、請求項５に記載の方法。

【請求項7】

前記第１長さ指示は、前記ビットストリーム内において、前記第１コーディング済みビットに先行し、
前記第２長さ指示は、前記ビットストリーム内において、前記第２コーディング済みビットに先行する、
請求項６に記載の方法。

【請求項8】

前記第２長さ指示は、前記ビットストリーム内において前記第１コーディング済みビットに先行する、請求項７に記載の方法。

【請求項9】

前記第２先行末尾ビットの前記量の前記指示は、前記ビットストリーム内において、前記第１コーディング済みビットに先行する、請求項８に記載の方法。

【請求項10】

ビットストリーム長をバイトの予め定められた量の整数倍と一致させるようにアラインするために、予め定められた値を有するビットで、前記第１コーディング済みビット、前記第２コーディング済みビット、前記第１先行末尾ビット、及び、前記第２先行末尾ビットを含む前記ビットストリームをパディングする段階を更に備える、請求項５から９のいずれか一項に記載の方法。

【請求項11】

前記算術エンコーディングは、第１算術エンコーダを用いて前記第１サブストリームをエンコーディングすること、及び、第２算術エンコーダを用いて前記第２サブストリームをエンコーディングすることを含み、
前記第１算術エンコーダ及び前記第２算術エンコーダを用いる前記算術エンコーディングは、少なくとも部分的に並列に実行される、
請求項５から１０のいずれか一項に記載の方法。

【請求項12】

前記算術エンコーディングはレンジエンコーディングである、請求項１から１１のいずれか一項に記載の方法。

【請求項13】

前記算術エンコーディングの間に、前記区間の現在の最小値及び前記現在の最大値が予め構成されたサイズのメモリに格納され；
前記コーディング済みビットを前記ビットストリームに含める前記段階は、安定ビットのうちのビットの予め定義された量を前記メモリから前記ビットストリームに移動させる段階を含み；
前記安定ビットは、前記現在の最小値及び前記現在の最大値の２進表現のＭＳＢにおいて同一の値を有する連続ビットである、
請求項１１に記載の方法。

【請求項14】

前記算術エンコーディングの間に、前記先行末尾ビットの量、及び、前記安定ビットのうちのビットの予め定義された量の間の差が、予め定義された閾値より下である場合に；
末尾コーディング済みビットは、前記安定ビットのうちのビットの予め定義された量まで０が後に続く、１の値を有する１ビットを後部に付加することによって、前記先行末尾ビットから生成され；
前記末尾コーディング済みビットは、前記コーディング済みビットを前記ビットストリームに含める前記段階の前に、前記コーディング済みビットに含められ；
０の先行末尾ビットの指示が前記ビットストリームに含められる、
請求項１３に記載の方法。

【請求項15】

ビットストリームからデータを算術デコーディングするための方法であって、
先行末尾ビットの量の指示を前記ビットストリームから抽出する段階；
複数のコーディング済みビットを前記ビットストリームから抽出する段階；
抽出された、前記先行末尾ビットの前記量の前記指示によって指定された前記先行末尾ビットを前記ビットストリームから抽出する段階；
抽出された前記先行末尾ビットに、末尾ビットの予め定められた最大長までの０を後部に付加する段階を含む、前記末尾ビットを決定する段階；及び
前記コーディング済みビット及び決定された前記末尾ビットを含むビットによって表されるコーディング済みの値を算術デコーディングすることにより、前記データを取得する段階
を備える方法。

【請求項16】

前記末尾ビットを決定する前記段階は、前記末尾ビットの前記予め定められた最大長までの０が後に続く、１の値を有する１ビットで、抽出された前記先行末尾ビットの後部に付加することから成る、請求項１５に記載の方法。

【請求項17】

前記先行末尾ビットの前記量の前記指示は、前記ビットストリーム内において、前記コーディング済みビット及び前記先行末尾ビットに先行する、請求項１５または１６に記載の方法。

【請求項18】

前記方法は、
第１先行末尾ビット及び第２先行末尾ビットが後に続く第１コーディング済みビット及び第２コーディング済みビットを前記ビットストリームから抽出する段階、
前記第１コーディング済みビット及び前記第１先行末尾ビットは第１サブストリームを形成する段階、
前記第２コーディング済みビット及び前記第２先行末尾ビットは第２サブストリームを形成する段階；
前記第１サブストリームについて第１末尾ビットを決定する段階、
前記第２サブストリームについて第２末尾ビットを決定する段階、
前記第１コーディング済みビット及び決定された前記第１末尾ビットを含む第１ビットによって表される第１のコーディング済みの値を算術デコーディングする段階；及び
前記第２コーディング済みビット及び決定された前記第２末尾ビットを含む第２ビットによって表される第２のコーディング済みの値を算術デコーディングする段階、
を備える、請求項１５から１７のいずれか一項に記載の方法。

【請求項19】

前記第１コーディング済みビットの長さを示す第１長さ指示、及び、前記第２コーディング済みビットの長さを示す第２長さ指示と共に、前記第１コーディング済みビット及び前記第２コーディング済みビットを前記ビットストリームから抽出する段階を更に備える、請求項１８に記載の方法。

【請求項20】

前記第１長さ指示は、前記ビットストリーム内において前記第１コーディング済みビットに先行し、
前記第２長さ指示は、前記ビットストリーム内において前記第２コーディング済みビットに先行する、
請求項１９に記載の方法。

【請求項21】

前記第２長さ指示は、前記ビットストリーム内において前記第１コーディング済みビットに先行する、請求項２０に記載の方法。

【請求項22】

前記第２先行末尾ビットの前記量の前記指示は、前記ビットストリーム内において前記第１コーディング済みビットに先行する、請求項２１に記載の方法。

【請求項23】

前記第１コーディング済みビット、前記第２コーディング済みビット、前記第１先行末尾ビット、及び前記第２先行末尾ビットを抽出した後に、前記ビットストリームの残りのビットを破棄する段階を更に備える、請求項１８から２２のいずれか一項に記載の方法。

【請求項24】

前記算術デコーディングは、第１算術デコーダを用いて前記第１サブストリームをデコーディングすること、及び、第２算術デコーダを用いて前記第２サブストリームをデコーディングすることを含み、
前記第１算術デコーダ及び前記第２算術デコーダを用いる前記算術デコーディングは、少なくとも部分的に並列に実行される、
請求項１８から２３のいずれか一項に記載の方法。

【請求項25】

前記算術デコーディングはレンジデコーディングである、請求項１５から２４のいずれか一項に記載の方法。

【請求項26】

１又は複数のプロセッサ上で実行されるときに、請求項１から２５のいずれか一項に記載の方法の段階を前記１又は複数のプロセッサに実行させるコード命令を含み、非一時的媒体に格納されるコンピュータプログラム。

【請求項27】

入力データをビットストリームに算術エンコーディングするための装置であって、
前記入力データをコーディング済みビット及び末尾ビットに算術エンコーディングすること；
前記コーディング済みビットを前記ビットストリームに含めること、
算術エンコーディングされた前記入力データの区間の最小値及び最大値を決定すること；
連続末尾ビットであり、
決定された前記最大値を表す第１ＭＳＢ内において、決定された前記最小値を表す第２ＭＳＢ内と同一の値を有する
先行末尾ビットの量を決定すること；及び
前記先行末尾ビットの決定された前記量の指示、及び、
前記先行末尾ビット
を前記ビットストリームに含めること
を行うよう構成されている処理回路を備える装置。

【請求項28】

ビットストリームからデータを算術デコーディングするための装置であって、
先行末尾ビットの量の指示を前記ビットストリームから抽出すること；
複数のコーディング済みビットを前記ビットストリームから抽出すること；
抽出された前記先行末尾ビットの前記量の前記指示によって指定される前記先行末尾ビットを前記ビットストリームから抽出すること；
抽出された前記先行末尾ビットに、末尾ビットの予め定められた最大長までの０を付加することを含む、前記末尾ビットを決定すること；及び
前記コーディング済みビット及び決定された前記末尾ビットを含むビットによって表されるコーディング済みの値を算術デコーディングすることによって、前記データを取得すること
を行うよう構成されている処理回路を備える装置。

【発明の詳細な説明】

【技術分野】

【0001】

本開示は算術エンコーディング及びデコーディングに関する。特に、本開示は、末尾ビットの操作、特に、ビットストリーム内へのそれらの包含、及び、ビットストリームからのパースに関する。

【背景技術】

【0002】

ビデオコーディング（ビデオエンコーディング及びデコーディング）は、広範な範囲のデジタルビデオ用途、例えば、デジタルテレビ放送、インターネット及びモバイルネットワークを通じたビデオ伝送、ビデオチャット、ビデオ会議ＤＶＤ、及びブルーレイディスクなどのリアルタイム会話用途、ビデオコンテンツ取得及び編集システム、モバイルデバイスビデオ記録、及び、セキュリティ用途のカムコーダにおいて使用される。

【0003】

１９９０年のＨ．２６１規格におけるブロックベースハイブリッドビデオコーディング手法の開発以来、新しいビデオコーディング技法及びツールが開発され、新しいビデオコーディング規格の基礎を形成した。ほとんどのビデオコーディング規格の目標の１つは、画質を犠牲にすることなく、以前のものと比較してビットレートの減少を達成することであった。更なるビデオコーディング規格は、ＭＰＥＧ－１ビデオ、ＭＰＥＧ－２ビデオ、ＶＰ８、ＶＰ９、ＡＶ１、ＩＴＵ－ＴＨ．２６２／ＭＰＥＧ－２、ＩＴＵ－ＴＨ．２６３、ＩＴＵ－ＴＨ．２６４／ＭＰＥＧ－４、Ｐａｒｔ１０、アドバンスドビデオコーディング（ＡＶＣ）、ＩＴＵ－ＴＨ．２６５、高効率ビデオコーディング（ＨＥＶＣ）、ＩＴＵ－ＴＨ．２６６、バーサタイルビデオコーディング（ＶＶＣ）、及び、これらの規格の拡張、例えば、スケーラビリティ及び／又は３次元（３Ｄ）拡張などを含む。

【0004】

比較的短いビデオを描画するのであっても、必要とされるビデオデータの量は、かなりのものであり得、その結果、限定的な帯域幅容量を有する通信ネットワークを介してデータがストリーミングされるか又は別の形で通信されることになる場合に困難が生じる場合がある。従って、ビデオデータは一般に、現代の遠隔通信ネットワークを介して通信される前に圧縮される。ビデオのサイズは、メモリリソースが限定的である場合があるので、ビデオがストレージデバイス上に保存される場合にも問題となり得る。ビデオ圧縮デバイスは、しばしば、ソースにおけるソフトウェア及び／又はハードウェアを使用して、伝送又は保存の前にビデオデータをコーディングし、それによりデジタルビデオイメージを表現するのに必要なデータの量を低減させる。その後、圧縮データは、デスティネーションにおいて、ビデオデータをデコーディングするビデオ解凍デバイスによって受信される。限定的なネットワークリソース及び増大し続ける高ビデオ品質の需要に鑑みて、画像品質をほとんど又は全く犠牲にせずに圧縮比を改善する、改善された圧縮及び解凍技法が望まれている。

【0005】

ビデオのエンコーディング及びデコーディングは、例えば、Ｈ．２６４／ＡＶＣ、ＨＥＶＣ（Ｈ．２６５）、ＶＶＣ（Ｈ．２６６）、又は他のビデオコーディング技術に適合する標準的なビデオエンコーダ及びデコーダによって実行され得る。また、ビデオコーディング又はその一部がニューラルネットワークによって実行され得る。

【0006】

任意のエンコーディング又はデコーディング又は静止画像又はイメージ、又は、ニューラルネットワークの特徴チャネルなどの他のソース信号において、エントロピーコーディングが広く使用されてきた。特に、算術コーディングは、より新しいコーディング手法において重要性を獲得してきた。従って、エントロピーコーディングの効率を改善することが望ましいことがあり得る。

【発明の概要】

【0007】

本開示の実施形態は、データをビットストリームに算術エンコーディングする、及び、データをビットストリームから算術デコーディングするための装置及び方法を提供し、ビットストリームは、コーディング済みビット及び先行末尾ビットを含む。

【0008】

本発明の実施形態は、独立請求項の特徴によって定義され、実施形態の更なる有利な実装は、従属請求項の特徴によって定義される。

【0009】

実施形態によれば、入力データをビットストリームに算術エンコーディングするための方法が提供され、方法は、入力データをコーディング済みビット及び末尾ビットに算術エンコーディングする段階；ビットストリームにコーディング済みビットを含める段階；算術エンコーディングされた入力データの区間の最小値及び最大値を決定する段階；連続する末尾ビットであり、決定された最大値を表す第１最上位ビットＭＳＢ内において、決定された最小値を表す第２ＭＳＢ内と同一の値を有する先行末尾ビットの量を決定する段階；及び、ビットストリームに、先行末尾ビットの決定された量の指示、及び先行末尾ビットを含める段階を備える。

【0010】

完全末尾ビットではなく先行末尾ビットをビットストリームに含めることは、ビットストリーム内のビットの量を低減し得、従って、例えば、同一品質でレートを低減する。言い換えれば、決定された（残りの末尾ビット無しの）先行末尾ビットだけでも、レンジ区間を定義するのに十分であり、従って、残りの末尾ビットは、ビットストリームに含まれる必要がなく、先行末尾ビットの示された量に基づいてデコーダで再構築され得る。これにより、品質を低下させることなくレートを節約し得る。

【0011】

実装例によれば、方法は段階を備え、ここで、先行末尾ビットの量ＮｕｍＴｒａｉｌｉｎｇＢｉｔｓが、ＮｕｍＴｒａｉｌｉｎｇＢｉｔｓ＝ＣＬＺ（（ＬＯＷ＋ＲＡＮＧＥ－１）ＸＯＲＬＯＷ）によって決定され、ＣＬＺ（）は、先行０の数であり、ＬＯＷは、区間の最小値であり、ＲＡＮＧＥは、区間のレンジである。

【0012】

先行末尾ビットの量は、例えば、最も近いバイト境界に丸めるのではなく、厳密に決定され得る。これにより、ビットストリーム内のビットの量が更に低減され得る。

【0013】

例えば、先行末尾ビットの量の指示は、ビットストリーム内において、コーディング済みビット及び先行末尾ビットに先行する。

【0014】

ビットストリーム内においてコーディング済みビット及び先行末尾ビットに先行する先行ビットの量の指示は、ビットストリーム全体をバッファリングすることなく、ビットストリームからの効率的な抽出を可能にし得る。

【0015】

実装例において、ビットストリームに含める前に、先行末尾ビットに対して、１の値を有する１ビットが後部に付加される。

【0016】

そのような手法は、１値ビットを除去する代わりに使用され得る。詳細な説明において言及されるように、現在、ビデオコーデックなどのいくつかの既知のコーデックにおいて、１値ビットはビットストリームにおいて示される。

【0017】

特に、算術エンコーディングする段階、区間の最小値及び最大値を決定する段階、及び、先行末尾ビットの量を決定する段階は、第１サブストリーム及び第２サブストリームについて別個に実行され、結果として、第１コーディング済みビット、第２コーディング済みビット、第１先行末尾ビット、及び第２先行末尾ビットを生じさせ；方法は、第１先行末尾ビット及び第２先行末尾ビットが後に続く第１コーディング済みビット及び第２コーディング済みビットをビットストリームに挿入する段階を備える。

【0018】

２つの別個のサブストリームに対する方法のそのような独立の適用は、並列化のための必須条件を提供する。

【0019】

例えば、方法は、第１コーディング済みビットの長さを示す第１長さ指示、及び、第２コーディング済みビットの長さを示す第２長さ指示と共に、第１コーディング済みビット及び第２コーディング済みビットをビットストリームに多重化する段階を更に備える。

【0020】

ビットストリームにおけるサブストリームの長さを示すことにより、異なるサイズを有するサブストリームを提供することが可能となり、従って、より柔軟なビットストリーム構成を達成することを助け得る。

【0021】

実装例において、第１長さ指示は、ビットストリーム内において第１コーディング済みビットに先行し、第２長さ指示は、ビットストリーム内において第２コーディング済みビットに先行する。

【0022】

このビットストリーム構造の利点は、複数のサブストリーム及びそれぞれの指示をバッファリングすることを必要としない、サブストリームの即時エンコーディング又はデコーディングが可能であることであり得る。

【0023】

例えば、第２長さ指示は、ビットストリーム内において、第１コーディング済みビットに先行する。

【0024】

コーディング済みビットの前に連結された長さ指示を提供することにより、ビットストリームの個々の一部のより速い抽出を可能にし得る。

【0025】

例えば、第２先行末尾ビットの量の指示は、ビットストリーム内において第１コーディング済みビットに先行する。

【0026】

そのようなビットストリーム構造は、ビットストリームの個々の一部の更により速い抽出を可能にし、ビットストリームを並列デコーディングに対してより好適なものにする。

【0027】

実装例において、方法は更に、ビットストリーム長をバイトの予め定められた量の整数倍と一致させるようにアラインするために、予め定められた値を有するビットで、第１コーディング済みビット、第２コーディング済みビット、第１先行末尾ビット、及び、第２先行末尾ビットを含むビットストリームをパディングする段階を更に備える。

【0028】

そのような手法は、例えば、ネットワーク適応層ユニット又は他のパケットへのカプセル化など、更なる処理のために適切にアラインされたビットストリームを提供し得る。

【0029】

更に、算術エンコーディングは、第１算術エンコーダを用いて第１サブストリームをエンコーディングすること、及び、第２算術エンコーダを用いて第２サブストリームをエンコーディングすることを含み、第１算術エンコーダ及び第２算術エンコーダを用いる算術エンコーディングは、少なくとも部分的に並列に実行される。

【0030】

上で言及されたように、少なくとも２つのサブストリームに対してエンコーディング方法を別個に実行することが可能であることにより、並列エンコーディングが可能になる。これは、エンコーディング効率の改善を促進することを助け得る。

【0031】

実装例において、算術エンコーディングはレンジエンコーディングである。

【0032】

レンジエンコーディングは、限定されたレジスタ又は一般に高速メモリサイズを有するハードウェア及びソフトウェアアーキテクチャに特に好適であり得る。

【0033】

例えば、算術エンコーディング中に、区間の現在の最小値及び現在の最大値は予め構成されたサイズのメモリに格納され；コーディング済みビットをビットストリームに含めることは、安定ビットのうちのビットの予め定義された量をメモリからビットストリーム内に移動させることを含み；安定ビットは、現在の最小値及び現在の最大値の２進表現のＭＳＢにおいて同一の値を有する連続ビットである。

【0034】

部分的に１ビットより大きいコーディング済みビットを出力することにより、より効率的なソフトウェア及び／又は実装を提供し得る。

【0035】

実装例において、算術エンコーディング中に、先行末尾ビットの量は、安定ビットのうちのビットの予め定義された量に近く；末尾コーディング済みビットは、安定ビットのうちのビットの予め定義された量まで０が後に続く、１の値を有する１ビットを後部に付加することによって、先行末尾ビットから生成され；末尾コーディング済みビットは、コーディング済みビットをビットストリームに含める前にコーディング済みビットに含められ；０の先行末尾ビットの指示がビットストリームに含められる。

【0036】

従って、末尾ビットの量の指示と共に多くの先行末尾ビットをシグナリングする労力の増加が回避され得る。代わりに、より多くのコーディング済みビットを有し、０先行末尾ビットをシグナリングするためのシグナリングの労力は低減され得る。

【0037】

実施形態によれば、ビットストリームからデータを算術デコーディングするための方法が提供され、方法は、先行末尾ビットの量の指示をビットストリームから抽出する段階；複数のコーディング済みビットをビットストリームから抽出する段階；抽出された、先行末尾ビットの量の指示によって指定された先行末尾ビットをビットストリームから抽出する段階；抽出された先行末尾ビットに、末尾ビットの予め定められた最大長までの０を後部に付加する段階を含む、末尾ビットを決定する段階；及び、コーディング済みビット及び決定された末尾ビットを含むビットによって表されるコーディング済みの値を算術デコーディングすることにより、上記データを取得する段階を備える。

【0038】

先行末尾ビットからの末尾ビットの再構築は、ビットストリーム内のより小さい量のビットを使用することによって、コーディング済みビット及び末尾ビットからのデコーディングを提供する。

【0039】

例えば、末尾ビットを決定する段階は、末尾ビットの予め定められた最大長までの０が後に続く、１の値を有する１ビットで、抽出された先行末尾ビットの後部に付加することから成る。

【0040】

この手法は、算術エンコーダの完全な出力を再構築することを可能にし、これにより、特に適切な入力を算術デコーダに提供する。

【0041】

実装例において、先行末尾ビットの量の指示は、ビットストリーム内において、コーディング済みビット及び先行末尾ビットに先行する。

【0042】

このビットストリーム構造は、ビットストリームからのより効率的な抽出を提供し得る。

【0043】

実装例において、方法は、第１先行末尾ビット及び第２先行末尾ビットが後に続く第１コーディング済みビット及び第２コーディング済みビットをビットストリームから抽出する段階、第１コーディング済みビット及び第１先行末尾ビットは第１サブストリームを形成する段階、第２コーディング済みビット及び第２先行末尾ビットは第２サブストリームを形成する段階；第１サブストリームについて第１末尾ビットを決定する段階、第２サブストリームについて第２末尾ビットを決定する段階、第１コーディング済みビット及び決定された第１末尾ビットを含む第１ビットによって表される第１のコーディング済みの値を算術デコーディングする段階；及び、第２コーディング済みビット及び決定された第２末尾ビットを含む第２ビットによって表される第２のコーディング済みの値を算術デコーディングする段階を備える。

【0044】

２つの別個のサブストリームに対する方法のそのような独立の適用は、より効率的なデコーディングプロセスをもたらし得、並列化のための必須条件を提供する。

【0045】

例えば、方法は、第１コーディング済みビットの長さを示す第１長さ指示、及び、第２コーディング済みビットの長さを示す第２長さ指示と共に、第１コーディング済みビット及び第２コーディング済みビットをビットストリームから抽出する段階を更に備える。

【0046】

ビットストリームにおけるサブストリームの長さを示すことにより、異なるサイズを有するサブストリームを提供することが可能となり、従って、より柔軟なビットストリーム構成をもたらし得る。

【0047】

【0048】

このビットストリーム構造の利点は、複数のサブストリーム及びそれぞれの指示をバッファリングすることを必要とすることなく、サブストリームの即時デコーディングを可能にすることであり得る。これにより、処理フローを促進することが達成され得る。

【0049】

例えば、第２長さ指示は、ビットストリーム内において、第１コーディング済みビットに先行する。

【0050】

コーディング済みビットの前に連結された長さ指示を提供することにより、ビットストリームの個々の一部のより速い抽出を可能にし得る。

【0051】

例えば、第２先行末尾ビットの量の指示は、ビットストリーム内において第１コーディング済みビットに先行する。

【0052】

そのようなビットストリーム構造は、ビットストリームの個々の一部のより速い抽出の更なる可能性を提供する。

【0053】

実装例において、方法は更に、第１コーディング済みビット、第２コーディング済みビット、第１先行末尾ビット、及び第２先行末尾ビットを抽出した後に、ビットストリームの残りのビットを破棄する段階を備える。

【0054】

【0055】

例えば、算術デコーディングは、第１算術デコーダを用いて第１サブストリームをデコーディングすること、及び、第２算術デコーダを用いて第２サブストリームをデコーディングすることを含み、第１算術デコーダ及び第２算術デコーダを用いる算術デコーディングは、少なくとも部分的に並列に実行される。

【0056】

サブストリームの並列デコーディングは、全ビットストリームのより速いデコーディングをもたらし得る。

【0057】

実装例において、算術デコーディングはレンジデコーディングである。

【0058】

【0059】

実装例において、コンピュータプログラムは、非一時的媒体に格納され、１又は複数のプロセッサ上で実行されるとき、上で説明された方法のいずれかの段階を１又は複数のプロセッサに実行させるコード命令を含む。

【0060】

実施形態によれば、入力データをビットストリームに算術エンコーディングするための装置が提供され、装置は、入力データをコーディング済みビット及び末尾ビットに算術エンコーディングすること；コーディング済みビットをビットストリームに含めること；算術エンコーディングされた入力データの区間の最小値及び最大値を決定すること；連続末尾ビットであり、決定された最大値を表す第１ＭＳＢ内において、決定された最小値を表す第２ＭＳＢ内と同一の値を有する先行末尾ビットの量を決定すること；及び、先行末尾ビットの決定された量の指示、及び、先行末尾ビットをビットストリームに含めることを行うよう構成されている処理回路を備える。

【0061】

実施形態によれば、ビットストリームからデータを算術デコーディングするための装置が提供され、装置は、先行末尾ビットの量の指示をビットストリームから抽出すること；複数のコーディング済みビットをビットストリームから抽出すること；抽出された先行末尾ビットの量の指示によって指定される先行末尾ビットをビットストリームから抽出すること；抽出された先行末尾ビットに、末尾ビットの予め定められた最大長までの０を付加することを含む、末尾ビットを決定すること；及び、コーディング済みビット及び決定された末尾ビットを含むビットによって表されるコーディング済みの値を算術デコーディングすることによって、上記データを取得することを行うよう構成されている処理回路を備える。

【0062】

装置は、上で説明された方法の利点を提供する。

【0063】

発明は、ハードウェア（ＨＷ）及び／又はソフトウェア（ＳＷ）において、又は、それらの任意の組み合わせにおいて実装され得る。また、ＨＷベースの実装は、ＳＷベースの実装と組み合わされ得る。

【0064】

１又は複数の実施形態の詳細は、添付図面及び以下の説明に記載されている。本明細書、図面、及び特許請求の範囲から、他の特徴、目的、及び利点が明らかになるであろう。

【図面の簡単な説明】

【0065】

以下では、本発明の実施形態が、添付の図及び図面を参照して、より詳細に説明される。

【0066】

【図1】算術コーディングを用いる、２個のシンボルを有するアルファベットを使用するメッセージのエンコーディングを図示する概略図である。

【0067】

【図2】８個のシンボルを有するアルファベットを使用するメッセージの算術（レンジ）コーディングの第１段階の概略図である。

【0068】

【図3】８個のシンボルを有するアルファベットを使用するメッセージの算術（レンジ）コーディングの第２段階の概略図である。

【0069】

【図4】８個のシンボルを有するアルファベットを使用するメッセージの算術（レンジ）コーディングの第３段階の概略図である。

【0070】

【図5】８個のシンボルを有するアルファベットを使用するメッセージの算術（レンジ）コーディングの第４段階の概略図である。

【0071】

【図6】８個のシンボルを有するアルファベットを使用するメッセージの算術（レンジ）コーディングの最終段階の概略図である。

【0072】

【図7A】２進数として表現される、コーディング段階中のレンジの最小及び最大の値を図示する概略図である。

【図7B】２進数として表現される、コーディング段階中のレンジの最小及び最大の値を図示する概略図である。

【図7C】２進数として表現される、コーディング段階中のレンジの最小及び最大の値を図示する概略図である。

【図7D】２進数として表現される、コーディング段階中のレンジの最小及び最大の値を図示する概略図である。

【0073】

【図8】例示的な算術デコーディングを図示する概略図である。

【0074】

【図9】例示的なエンコーディング方法を図示するフロー図である。

【0075】

【図10】例示的なデコーディング方法を図示するフロー図である。

【0076】

【図11】画像エンコーディングにおいていくつかの実施形態の算術エンコーディングを採用することを図示するブロック図である。

【0077】

【図12】画像デコーディングにおいていくつかの実施形態の算術エンコーディングを採用することを図示するブロック図である。

【0078】

【図13】入力データのチャネルを単一ストリームにエンコーディングする単一エンコーダの概略図である。

【0079】

【図14】入力データのチャネルをサブストリームにエンコーディングし、サブストリームをビットストリームに連結するマルチコアエンコーダの概略図である。

【0080】

【図15】入力データのチャネルをサブストリームにインターリーブ及びエンコーディングし、サブストリームをビットストリームに連結するマルチコアエンコーダの概略図である。

【0081】

【図16】同一の先行末尾ビットの決定を図示する概略図である。

【0082】

【図17】長さ指示、コーディング済みビット、及び先行末尾ビットを含むビットストリームの概略図である。

【0083】

【図18】入力データから同一サイズのチャネルを取得するための前処理、及び、インターリーブ及びエンコーディングされたサブストリームを形成するシャッフルプロセスの概略図である。

【0084】

【図19】本発明の実施形態を実装するよう構成されているビデオコーディングシステムの例を示すブロック図である。

【0085】

【図20】本発明の実施形態を実装するよう構成されているビデオコーディングシステムの別の例を示すブロック図である。

【0086】

【図21】エンコーディング装置又はデコーディング装置の例を図示するブロック図である。

【0087】

【図22】エンコーディング装置又はデコーディング装置の別の例を図示するブロック図である。

【発明を実施するための形態】

【0088】

以下の説明では、本開示の一部を形成し、本発明の実施形態の特定の態様又は本発明の実施形態を使用することができる特定の態様を例示として示す添付の図面を参照する。本発明の実施形態は他の態様で用いられてよく、図面に示されていない構造上又は論理上の変更を含んでよいことが理解される。したがって、以下の詳細な説明は、限定の意味で解釈されるべきではなく、本発明の範囲は、添付の特許請求の範囲によって定義される。

【0089】

例えば、説明された方法に関連する開示は、方法を実行するように構成された対応するデバイス又はシステムにも当てはまり得、逆もまた同様であることが理解される。例えば、１又は複数の特定の方法の段階が説明される場合、対応するデバイスが、説明された１又は複数の方法の段階を実行するための１又は複数のユニット（例えば、１又は複数の段階を実行する１つのユニット、又は、複数の段階の１又は複数を各々実行する複数のユニット）、例えば機能ユニットを、そのような１又は複数のユニットが図において明示的に説明又は図示されていない場合でも、含み得る。一方、例えば、特定の装置が１又は複数のユニット、例えば、機能ユニットに基づいて説明された場合、対応する方法が１又は複数のユニットの機能を実行する１つの段階（例えば、１又は複数のユニットの機能を実行する１つの段階、又は、複数のユニットのうちの１又は複数の機能を各々実行する複数の段階）を、そのような１又は複数の段階が図において明示的に説明または図示されていない場合でも、含み得る。更に、本明細書に記載の様々な例示的な実施形態及び／又は態様の特徴は、特に明記しない限り、互いに組み合わせることができることが理解される。

【0090】

ビデオコーディングは典型的には、ビデオ又はビデオシーケンスを形成する一連の画像の処理を意味する。画像という用語の代わりに、フレーム又はイメージという用語が、ビデオコーディングの分野での同義語として使用されてもよい。ビデオコーディングは、ビデオエンコーディングとビデオデコーディングの２つの部分を含む。ビデオエンコーディングは、ソース側で実行され、典型的には、元のビデオ画像を（例えば、圧縮により）処理して、（より効率的な保存及び／又は伝送のために、）ビデオ画像を表すために必要とされるデータの量を低減することを含む。ビデオデコーディングは、デスティネーション側で実行され、典型的には、ビデオ画像を再構築するために、エンコーダと比較して逆の処理を含む。ビデオ画像（又は後で説明する一般的な画像）の「コーディング」に言及する実施形態は、ビデオ画像の「エンコーディング」及び「デコーディング」の両方に関連すると理解されるべきである。エンコーディング部分とデコーディング部分との組み合わせは、コーデック（コーディング及びデコーディング）とも称される。

【0091】

無損失ビデオコーディングの場合は、元のビデオ画像を再構築でき、すなわち、再構築されたビデオ画像は、元のビデオ画像と同一品質を有する（保存又は伝送中に伝送エラー又は他のデータ損失が無いと想定する）。有損失ビデオコーディングの場合は、例えば、量子化による更なる圧縮を実行して、ビデオ画像を表現するデータの量を低減する。ビデオ画像はデコーダで完全に再構築することができない、すなわち、再構築されたビデオ画像の品質は、元のビデオ画像の品質と比較して低い又は悪い。

【0092】

算術エンコーディング
エントロピーコーディングは、典型的には、無損失コーディングとして採用される。算術コーディングは、メッセージを表す区間（レンジ）内の２進実数としてメッセージをエンコーディングするエントロピーコーディングの一種である。本明細書において、メッセージという用語は、シンボルのシーケンスを指す。シンボルは、シンボルの予め定義されたアルファベットから選択される。例えば、アルファベットは、２つの値０及び１から成ることがあり得る。したがって、そのようなアルファベットを使用するメッセージは、ビットのシーケンスである。シンボル（０及び１）は、相互に異なる頻度でメッセージ内に発生し得る。言い換えれば、シンボル確率は不均一であり得る。実際に、分布が均一でないほど、一般的にエントロピーコーディング、特に算術コーディングによって達成可能な圧縮が高くなる。算術コーディングは、アルファベットの各シンボルについてシンボル確率を指定する、先験的確率モデルを使用する。

【0093】

アルファベットはバイナリである必要はない。むしろ、アルファベットは、例えば０～７の８個の値から成り得る。一般的に、任意のサイズを有する任意のアルファベットが使用され得る。典型的には、アルファベットは、コーディング済みデータの値レンジによって与えられる。

【0094】

メッセージを表す区間は、メッセージがコーディングされるアルファベットシンボルの確率に従って初期レンジを分離することによって取得される。

【0095】

例えば、現在の区間を最初の初期区間［０，１）とする。メッセージの各シンボルについて、以下２つの段階が実行される。
１）可能なアルファベットシンボルの各々について１つとなるように、現在の区間を部分区間に細分化する。シンボルの部分区間のサイズは、（シンボルソースの）確率モデルに従ってシンボルがメッセージにおける次のシンボルである推定確率に比例する。
２）メッセージにおいて次に実際に発生するシンボルに対応する部分区間を選択し、選択された部分区間を新しい現在の区間にする。

【0096】

第３段階として、現在の区間を他のすべての可能な区間から区別するために十分なビットが出力される。この段階は既に、段階１及び２におけるエンコーディング中に、又は、メッセージ全体のエンコーディングの後に実行され得る。メッセージの全部のシンボルについて段階１）及び２）を繰り返した後に取得される区間の長さは、メッセージにおけるシンボルの特定のシーケンスの確率でもある、個別のシンボルの確率の積に明らかに等しい。

【0097】

理論上、算術コーダは、０から１の区間を再帰的に分離して任意の長さのメッセージをエンコーディングし、結果として、区間が徐々に小さくなる。実際には、システムは、有限のビット深度によって限定され、離散値のみが表現可能である。従って、区間が小さいほど、より高い精度の算術が必要となるであろう。また、メッセージ全体が読み取られるまで、出力は生成されない。これらの問題の両方に対する解決策は、いくつかのビットを、分かったらすぐに出力し、各出力ビットの現在の区間の長さを２倍にし、区間の（まだ）未知の部分のみを反映するようにすることであり得る。実際には、算術は、浮動小数点数又は厳密な有理数ではなく、十分に長い整数において、現在の区間を格納することによって行われ得る。

【0098】

区間［０，１）ではなく、有限レンジの整数、例えば０～２５５使用する、実際の使用のために改善された算術コーダの変形は、レンジコーダと称される。このレンジは、アルファベットシンボルの確率に従って分離される。これらの確率に従って全部のアルファベットシンボルを記述するべく、残りのレンジが小さくなり過ぎた場合、レンジは再正規化され得る。

【0099】

本明細書において採用される用語に関して、現在の区間は、その最小値（ＬＯＷとして示される）及びその最大値（ＨＩＧＨとして示される）によって与えられる。区間の長さは、ＲＡＮＧＥとして示される。一般的に、ＨＩＧＨ＝ＬＯＷ＋ＲＡＮＧＥであり、ＲＡＮＧＥは、最小サイズの（区別可能な）部分区間の数で表現される。シンボルをエンコーディングするための最小レンジはＢＯＴＴＯＭである。この最小レンジは、もっとも可能性の低いシンボルでも少なくとも１の有効レンジを有することを確実にする。言い換えれば、ＢＯＴＴＯＭは、全部のアルファベットシンボルに対応する区別可能な区間にレンジをなお分割できることを確実にするために、アルファベットシンボル及びそれらの確率に基づいて決定され得る設計パラメータである。

【0100】

ＨＩＧＨ位置は、初期最大レンジをカバーするためにいくつのビットが必要であるかを示す。ＢＯＴＴＯＭ位置は、別のシンボルをエンコーディングするための最小レンジをカバーするためにいくつのビットが必要であるかを示す。ＨＩＧＨ位置及び予め定められたＴＯＰ位置の間のビットの量は、ビットストリームにストリーミング（挿入）され得、コーディング済みビットになるビットの最小部分に対応する。

【0101】

図１は、算術コーディングの例示的な手順を概略的に図示する。コーディングされるメッセージは、２つの可能なシンボルＡ及びＢを有するアルファベットにおいて提供される、アルファベットのシンボル｛Ａ，Ｂ｝は、確率Ｐ（Ａ）＝２／３及びＰ（Ｂ）＝１／３を有する。エンコーディングされるメッセージは、ＡＡＢＡと読める。

【0102】

最初はＬＯＷ＝０であるので（段階０において、ｌｏｗ_０＝０）、段階０は、ここでＨＩＧＨに対応する長さＲａｎｇｅ_０１１０を有する初期区間を示す。Ｒａｎｇｅ_０の下半分において、Ｒａｎｇｅ_０内の数の２進表現の先行ビットは、１１１１であり、一方、Ｒａｎｇｅ_０の上半分において、先行ビットは０１１２である。言い換えれば、初期レンジの上半分に属する、段階のいずれかにおける現在の区間は、第１先行ビット０を有し、一方、初期レンジの下半分に属する現在の区間は、第１先行ビット１を有する。ここで、例えば、初期レンジ内の任意の数（コード値）は、８ビットによって表現可能であると想定すると、レンジは０～２５５であり、その結果、ＨＩＧＨ＝２５５である。

【0103】

段階１において、Ｒａｎｇｅ_０は、確率に従って、第１シンボルＡ_０をエンコーディングするために分割される。この例において、初期区間は、サイズ１／３１２２（シンボルＢ_０に対応する）及び２／３１２１（シンボルＡ_０に対応する）の合計レンジサイズを有する２つの区間に分離される。確率に従う分割は、初期区間が、アルファベットにおけるシンボルの数（ここでは、２つのシンボルＡ及びＢ）に等しい数の部分区間に分離されることを意味し、区間のサイズは、区間によって表されるシンボルのそれぞれの確率に比例する。メッセージシンボルＡ_０に対応する上側部分区間Ｒａｎｇｅ_１＝Ｐ（Ａ_０）＊Ｒａｎｇｅ_０は次に、次の段階のための現在の区間として選択される。

【0104】

段階２において、シンボルＡ_０のレンジＲａｎｇｅ_１１２０は、確率に従って分割される。次のメッセージシンボルはＡである。メッセージＡ_０Ａ_１１３１を記述する残りのＲａｎｇｅ_２＝Ｐ（Ａ_１）＊Ｒａｎｇｅ_１は、ビット０でエンコーディングされるＲａｎｇｅ_０の上半分内に完全に存在するので、ビット０をエンコーディング済みのビットストリームに追加することが実行される。この特定の実装例において、ビットはできるだけ早くビットストリームに追加され、分解能を２倍にするために再正規化１４０が実行される。ここで現在の最大レンジは、段階０の初期レンジの上半分である。この現在の最大レンジの上半分は、ビット０に割り当てられ、現在の最大レンジの下半分は、ビット１に割り当てられる。

【0105】

段階３におけるメッセージＡ_０Ａ_１Ｂ_２１４１はまだ明確にエンコーディングできない。なぜなら、Ｒａｎｇｅ_３がビット１（現在の最大レンジの対応する下半分）及びビット０（現在の最大レンジの対応する上半分）に重なり、従って、キャリー１５０が実行されるからである。何もストリーミングされない（どのビットもビットストリームに含められない）。Ｒａｎｇｅ_３は、アルファベットのシンボルの確率に従って段階４において分割される。

【0106】

ここで、エンコーディングされるメッセージは、Ａ_０Ａ_１Ｂ_２Ａ_３１５１と読める。Ｒａｎｇｅ_４はなお、両方の可能なビットに重なり、エンコーディングされる更なるシンボルが無いので、段階５及び６において、ファイナライズ１６０が実行される。これは、メッセージＡＡＢＡについて明確なコード００１１を作成するために実行される複数の再正規化を含む。

【0107】

図２から７は、アルファベットの８個のシンボル２２０｛０，１，２，３，４，５，６，７｝が、標準正規分布についての確率密度関数ＰＤＦ２３０に従う確率を有する、レンジエンコーダについての例を示す。シンボルは、累積分布関数ＣＤＦ２４０によって、レンジ上にマッピングされる。エンコーディングされるメッセージは、４４２０と読める。エンコーディングについての最大開始レンジＨＩＧＨは、この例において、２５５のコード値に対応する８ビットによって表される。シンボルをエンコーディングするための最小レンジは、この例において、ＢＯＴＴＯＭ＝１６である。この最小レンジは、もっとも可能性の低いシンボル「０」及び「７」でも、累積分布関数が適用されるとき、少なくとも１の有効レンジをなお有することを確実にする。例えば、正規分布は、８個のシンボルあたりの最小区間の以下の数、すなわち、１，１，２，３，４，２，２，１をもたらす。

【0108】

図２は、初期レンジ２１０Ｒａｎｇｅ_０＝ＨＩＧＨ＝２５５＝１１１１１１１１．ｂであることを図示し、ここで、ｂは、数の２進表現であり、ガウシアン確率密度関数ＰＤＦ２３０に従って、アルファベットのシンボル２２０上にマッピングされる。Ｒａｎｇｅ_０の区分化は、累積分布関数ＣＤＦ２４０から取得される。これは、エンコーディングされるメッセージの第１シンボル、すなわち「４」が、下端点２５０Ｌｏｗ_１＝７１＝０１０００１１１．ｂ、及び、Ｒａｎｇｅ_１＝１２８に対応する、除外される上端点２６０＝Ｌｏｗ_１＋Ｒａｎｇｅ_１＝１９９＝１１０００１１１．ｂを有する区間におけるコード値のいずれかによって表されることを示唆する。合計＝定数＝１６２７０は、１／１６の動作精度を示唆する。これは、もっとも可能性の低いシンボルに割り当てられるサブレンジが現在のレンジの１／合計＝１／１６であることを示す。合計２７０は累積分布関数によって決定される。

【0109】

この区間の２進表現は、ＨＩＧＨ、ＴＯＰ、及びＢＯＴＴＯＭ位置の指示と共に図７Ａにおいて示される。ＨＩＧＨ位置７４０は、初期最大レンジ（この場合８）をカバーするためにいくつのビットが必要であるかを示す。ＢＯＴＴＯＭ位置７６０は、別のシンボルをエンコーディングするための最小レンジ（この場合４）をカバーするためにいくつのビットが必要であるかを示す。ＨＩＧＨ位置７４０及び予め定められたＴＯＰ位置７５０の間のビットの量は、ビットストリームにストリーミング（挿入）され得、その後コーディング済みビットになるビットの最小部分に対応する。図１を参照して上で説明される算術コーディングについては、ＨＩＧＨ位置７４０及びＴＯＰ位置７５０の間に１ビットのみがある。この例のレンジコーディングについては、ＨＩＧＨ位置７４０及びＴＯＰ位置７５０の間に２ビットがある。図７Ａ、（及び図７Ｂ～７Ｄ）において、区間７２０ａ～ｄの最小値及び区間７１０ａ～ｄの最大値は、バイナリで表される。これは実際には、現在の区間、従って、エンコーディングの現在の結果を格納することを目的として使用される２つのレジスタに対応し得る。

【0110】

図３において、累積分布関数ＣＤＦ３４０は、Ｌｏｗ_１＝７１から開始するＲａｎｇｅ_１＝１２８に適用され、アルファベット２２０のシンボルをレンジ上にマッピングする。メッセージの次のシンボルは「４」である。これは、メッセージ４４を表す新しい現在の区間３５０～３６０をもたらす。図７Ｂに示されるこの区間は、新しい下限（現在の最小値）７２０ｂＬｏｗ_２＝１０６＝０１１０１０１０．ｂ及び新しい上限（現在の最大値）７１０ｂＬｏｗ_２＋Ｒａｎｇｅ_２＝１７０＝１０１０１０１０．ｂを有する。新しいＲａｎｇｅ_２３２０は６４に等しい。

【0111】

図４及び図７Ｃは、エンコーディング手順の次の段階を示す。Ｒａｎｇｅ_２３２０はなお、ＢＯＴＴＯＭより大きいので、このレンジは、累積分布関数４４０に従って再び分割される。これにより、シンボル２について、Ｌｏｗ_３＝１１１＝０１１０１１１１．ｂのＬｏｗ値７２０ｃ、及び、Ｒａｎｇｅ_３＝４４１０が生じる。従って、メッセージ４４２は、Ｌｏｗ_３～Ｌｏｗ_３＋Ｒａｎｇｅ_３＝１１５＝０１１１００１１．ｂ７１０ｃのレンジによって表される。

【0112】

ＨＩＧＨ及びＴＯＰ位置の間の２ビット７３０は等しいので、それらは、コーディング済みビットとしてストリーム７３１に出力され得る。図７Ｄを参照されたい。

【0113】

図５は、Ｒａｎｇｅ_３＝４４１０がＢＯＴＴＯＭ＝１６より小さく、従って、再正規化手順が必要であるので、レンジ上へのシンボルの適切なマッピングが可能でないことを図示する。図７Ｄは、新しいＲａｎｇｅ_４がＢＯＴＴＯＭより大きい又はそれに等しくなるまで、全部のビット表現が左にシフトされることを示す。従って、それが新しいＲａｎｇｅ_４＝（４＜＜２）＝１６６１０に到達する。新しい上限７１０ｅが、２回の左シフトの後に、現在のもの７１０ｄから取得される。既にストリームＬｏｗ_４＝１８８＝１０１１１１００．ｂ７２０ｄの一部である、２つのコーディング済みビットを除いて、同一のシフトがＬｏｗ_３に適用される。

【0114】

ここで、メッセージ４４２は、４４４＝０１１０１１１１００．ｂ及び４６０＝０１１１００１１００．ｂの間の値のいずれかによってエンコーディングされる。

【0115】

図６は、最後のシンボル「０」のエンコーディングを示す。確率分布は、区間のより低い値Ｌｏｗ_５＝１８８＝１０１１１１００．ｂ６５０及びＲａｎｇｅ_５＝１６２０を生じさせる。エンコーディングされるシンボルが更に無いので、Ｌｏｗ_５及びＲａｎｇｅ_５は、（コーディング済みビットと共に）エンコーディングメッセージを表す末尾ビットのレンジ区間を記述する。一般的に、区間からの任意の値が、区間を、ひいては、コーディング済みメッセージ（シンボルのシーケンス）も表すために使用され（ビットストリームに含まれ）得る。従って、末尾ビットは、この最終レンジ区間から恣意的に選択され得る。本例において、Ｒａｎｇｅ_５＝１６２０は、末尾ビットについての単一の値、すなわち、Ｌｏｗ_５＝１８８＝１０１１１１００．ｂ６５０を生じさせる。従って、メッセージ４４２０は、末尾ビットをコーディング済みビットに付加することによってエンコーディングされ、結果として、コーディング済みの値４４４＝０１１０１１１１００．ｂがもたらされる。

【0116】

算術デコーディング
図８は、例示的なデコーディングプロセスを示す。デコーダは、コーディング済みの値（ビット）を順次に受信する。受信されたコーディング済みの値８２０は、全Ｒａｎｇｅ_０＝ＨＩＧＨ＝２５５８１０内にある。確率分布関数は、デコーダ側において既知であり、従って、累積分布関数８３０によるレンジ上へのシンボル２２０のマッピングは既知である。デコーダは、このマッピングの逆を知らないので、従って、シンボルの決定には検索プロセスが必要である。デコーダは、もっとも可能性の高いシンボル「４」を選択することによって、エンコーディングされたシンボルについての第１推測を行い８４０、このシンボルに対応するレンジのＬｏｗ値８４１を計算し、受信されたコーディング済みの値８２０がこのＬｏｗ値８４１より高いかどうかをチェックする。

【0117】

受信されたコーディング済みの値８２０は、第１推測８４０のＬｏｗ値８４１より小さいので、次の推測８５０は、レンジ内のより低い値にマッピングされるシンボル、すなわちシンボル「０」、「１」、「２」、又は「３」の１つである。シンボルの残りの区間の概ね中央においてＬｏｗ値を選択することは、より速いデコーディングプロセスをもたらす。なぜなら、正確なシンボルを取得するために必要な段階が少ないからである。この例において、比較のために選択される次のＬｏｗ値８５１はシンボル「２」に対応する。

【0118】

シンボル「２」のテストは、受信されたコーディング済みの値が、シンボル「２」をエンコーディングするレンジのＬｏｗ８５１より高いことを生じさせる。従って、受信されたコーディング済みの値は、シンボル「２」又は「３」を表し得る。最終チェック８６０は、「３」に対応するレンジのＬｏｗ値８６１が、コーディング済みの値８２０より高いことを明らかにする。そのために、受信されたコーディング済みの値８２０はシンボル「２」としてデコーディングされる。

【0119】

複数のチャネルのエントロピーコーディング
図１３は、単一エンコーダ１３２０のスキームを示す。ここで、用語「単一エンコーダ」は、エンコーダが直列に動作する、すなわち、入力を並列ではなく順次にエンコーディングするという事実を指す。入力データは、複数のチャネル１３１０から成り得る、又は、それらを含み得る。従って、この例示的エンコーディングプロセスにおいて、チャネルの各々の部分は、順次にエンコーディングされる。チャネル１３３０の各々からの第１部分サイズの部分がエンコーディングされ（異なるチャネルからの同一の第１サイズの部分の多重化をもたらす）、続いて、チャネル１３４０の各々からの第２部分サイズの部分がエンコーディングされる（異なるチャネルからの同一の第２サイズの部分の多重化をもたらす）。最後の部分のエンコーディング後にエンコーダに残る末尾ビット１３５０は、主な単一ストリームの後部に付加される。

【0120】

単一（又はシングルコア）エントロピーエンコーダにおいて、コーディングの最後に１つのファイナライズ段階のみがあり、アラインされたバイトにするためにストリームは０ビットによってパディングされる。余分な数ビットをシグナリングすることに問題は無い。しかしながら、そのようなエンコーディングを並列化すること、また、それに対応して、デコーディングを並列化することは難しい。

【0121】

図１４は、並列（例えばマルチコア）エンコーダ１４２０の例示的スキームを示す。入力データチャネル１４１０の各々は、コーディング済みビット１４３０～１４３３及び末尾ビット１４４０～１４４３を含む個々のサブストリームにエンコーディングされ得る。サブストリーム１４５０の長さはシグナリングされる。

【0122】

並列処理実装において、ビットストリームは、最終段階において連結される複数のサブストリームから成る。サブストリームの各々はファイナライズされる必要がある。この理由は、１つのサブストリームのエンコーディングが（従って、デコーディングも）、別の１又は複数のサブストリームの前のエンコーディング（又はデコーディング）を必要としないように、サブストリームが互いに独立してエンコーディングされるからである。

【0123】

エントロピーエンコーディング、特に算術エンコーディングのファイナライズは、末尾ビットの１又は複数をビットストリームにエンコーディングすること、及び／又は、最も近いバイト境界、又は、ビットの予め定義された量の境界までパディングすることを含み得る。しかしながら、複数のサブストリームが並列にエンコーディングされるとき、パディングは、大量の無意味なパディングビットの含有をもたらし得る。この問題は、各スレッドにおける末尾ビットの数が最も近いバイト境界に丸められない場合に解決され得るが、上位先行ビットは、末尾ビットの間で決定され、それらの量はビットストリーム内で指定される。

【0124】

これは図１５に例示的に示され、ここで、末尾ビット１５４０～１５４３は、コーディング済みデータ１５３０～１５３３の後に直接的に、ビットストリーム１５７０に追加される。末尾ビット１５６０の長さは、ビットストリーム１５７０にも含まれる。この例示的実施形態におけるマルチコアエンコーダは、複数の入力データチャネル１５１０の部分を、当該部分を複数のサブストリームにエンコーディングする前に、多重化し、場合によりシャッフルする。

【0125】

サブストリームを生成するための完全な部分多重化は、サブストリームのエンコーディング前に形成される必要がないことに留意されたい。反対に、エントロピーエンコーダは、異なるチャネルから部分を部分ごとに直接受信し、それらを処理してサブストリームにし得る。シャッフルという用語は、多重化内（また、結果として、多重化をエンコーディングした後のサブストリーム内）の部分のシーケンス（順序）を指す。

【0126】

入力データチャネルは、ニューラルネットワークによっていくつかのデータを処理することによって取得されるチャネルを指し得る。例えば、入力データは、ニューラルネットワークの出力チャネル又は潜在表現チャネルなどの特徴チャネルであり得る。実装例において、ニューラルネットワークは、ディープニューラルネットワーク、及び／又は、畳み込みニューラルネットワーク、又は同様のものであり得る。ニューラルネットワークは、（静止又は動画）画像を処理するように訓練され得る。処理は、画像エンコーディング及び再構築、又は、物体認識、分類、セグメンテーション又は同様のものなどのコンピュータビジョンについてのものであり得る。一般的に、本開示は、任意の特定の種類のタスク又はニューラルネットワークに限定されない。本開示は、ニューラルネットワークのチャネルのエンコーディング及びデコーディングに容易に適用可能であるが、それは、そのような適用に限定されない。むしろ、本開示は、概してデータの任意のソースとして理解される、複数のチャネルから来る任意の種類のデータをエンコーディングするために適用可能である。また、チャネルは、ソースデータの前処理によって提供され得る。

【0127】

図１８は、異なるサイズを有する、Ｃｈ０、Ｃｈ１、Ｃｈ２、及びＣｈ３によって示される、入力データチャネル１８１０の前処理を、それらの対応する確率分布１８２０（ＰｒｏｂＣｈ０、ＰｒｏｂＣｈ１、ＰｒｏｂＣｈ２、及びＰｒｏｂＣｈ３として示される）と共に例示的に示す。ここでのサイズという用語は、チャネルのビット、シンボル、又は要素の数（量）を指す。一般的に、ニューラルネットワークチャネルなどのチャネルは、縦及び水平などのより多くの次元を有し得るが、これらは典型的には、チャネル要素について直列的に（順次に）実行されるエントロピーコーディングにおいて役割を果たさない。エントロピーコーディング及びチャネルタイプに応じて、エンコーディングは、チャネルビット、チャネルシンボル、又は一般的に、チャネル要素に基づき得る（例えば、確率モデルが提供され得る）。しかしながら、本開示はまた、チャネルを１より多くの次元の同一サイズの新しいチャネルに分離することに適用可能であり得る。

【0128】

異なるサイズのこれらの入力チャネル１８１０は、事前処理され、同一サイズ１８３０のチャネルが取得される。従って、必要なサイズより大きい入力チャネルは分離され得る１８１２。図１８から分かるように、例えば、チャネルの少なくとも１つ（ここでは、２つのチャネルＣｈ１及びＣｈ２）は、２つのチャネル（例えば、ｃｈ０ａ及びｃｈ０ｂ、並びに、ｃｈ２ａ及びｃｈ２ｂ）に分離される。分離は、任意の想定される方式で生じ得る。例えば、チャネルがｎ個に分割される（ｎは、連続する部分より大きい整数である）。代替的に、部分は連続せず、むしろ、チャネルからの各シンボル又は各ｋ個のシンボルを、１つの又は新しいチャネルに繰り返し割り当てる（チャネル部分を新しいチャネルにインターリーブする）ことによって形成される。

【0129】

分離されるチャネルＣｈ０及びＣｈ２の対応する確率分布は、同一サイズの新しいチャネルｃｈ０ａ、ｃｈ０ｂ、ｃｈ２ａ、及びｃｈ２ｂに適合される。言い換えれば、新しいチャネル（例えば、ｃｈ０ａ及びｃｈ０ｂ）は、それらが導き出された元のチャネル（例えば、Ｃｈ０）の分布とは異なる分布を有し得る。

【0130】

チャネル（例えば、Ｃｈ３）が、上記同一サイズより小さい場合、それは、０１８１３でパディングされ得、結果として、分離後に同一サイズの新しいチャネルをもたらす。代替的に、パディングは、分離後に実行され得る。例えば、分離チャネルの最後の部分が同一サイズより小さい場合、それは、図１８に示されるように０でパディングされ得る。しかしながら、パディングは、最後の新しいチャネルのみで行われる必要はなく、より多くの新しいチャネルに挿入され得、例えば、新しいチャネルの間に分散される。

【0131】

例えば、チャネル（Ｃｈ０及びＣｈ２など）がｎ個の新しいチャネルに分離されるが、ｎによって割り切れない（例えば、図１８の場合、２によって割り切れない）サイズを有し得る。そのような場合、チャネル（Ｃｈ０又はＣｈ２）からのデータのみを用いて同一サイズのｎ個のチャネルを形成することが可能でない。この問題を克服するべく、当該チャネル又はｎ個の新しいチャネルのうちの１又は複数は、パディングされ得る。いくつかの実装例において、パディングについての追加の理由があり得ることに留意されたい。例えば、チャネル（Ｃｈ０又はＣｈ２）からのデータは、ビットを基礎とするのではなく、例えば、バイト又はシンボルなどのシンボル又は他のサイズを基礎として、新しいチャネル（ｃｈ０ａ、ｃｈ０ｂ、ｃｈ２ａ、及びｃｈ２ｂ）に分離され得る。そこで、ビットの単位ではなく、シンボルの単位のチャネルサイズが、ｎによって割り切れる必要がある。

【0132】

０によるパディングは単に１つの例示的な選択肢である。パディングは、任意の値のビット又はシンボルによって実行され得る。それは、チャネルビット又はシンボル、又は同様のものの反復によってパディングされ得る。

【0133】

デコーダ側において、新しいチャネルはデコーディングされる。異なるサイズのチャネル（例えばＣｈ０及びＣｈ２）を形成するべく、パディングは、デコーダ側で除去されるものとする。これを達成するべく、デコーダは、これらの前処理段階に関する情報を必要とする。例えば、デコーダは、異なるサイズのチャネルのサイズの知識に基づいてパディングを除去するよう構成されている。例えば、チャネルサイズは、規格によって定義され得るか、又は、サイド情報又は同様のものによって構成され得る。前処理段階に関する情報はまた、新しいチャネルのサイズを含み得る。

【0134】

前処理に続いて、同一サイズのチャネルの各々は部分に分割される。第１段階において、第１サイズの部分１８４０は、チャネルの各々から取得され、（場合によっては対応する分布を有する）これらの部分は多重化される。この多重化は、第１サブストリーム１５３０へのエントロピーエンコーディングである。更に、それぞれのチャネルからの第２サイズの部分１８４１は多重化され、その後、第２サブストリーム１５３１にエンコーディングされる。第１サイズ及び第２サイズは同一であり得るか、又は、異なり得る。エントロピーエンコーディングは、第１サブストリーム１５３０を生成するために、及び、第２サブストリーム１５３１を生成するために、別個に実行される。上で言及されたように、チャネル部分は、それぞれの確率モデルサイド情報と共に多重化され得る。例示的な実施形態において、そのようなサイド情報は、超事前分布サブネットワークを有する、変形自動エンコーダによって取得された超事前分布に対応し得る。しかしながら、確率モデルが、チャネル部分と共に多重化されたサイド情報として提供される必要がない実施形態及び実装があり得る。例えば、確率モデルは、前にエンコーディング及び／又はデコーディングされたデータ又は同様のものに基づいて、コンテキスト適合方式で更新され得る。

【0135】

各チャネルを別個にエンコーディングするのではなく、異なるチャネルからの部分を多重化及びエンコーディングすることにより、完全なサブストリームをより速く生じさせる、及び／又は、個々のサブストリームの長さを制御する、例えば、サブストリームのより均一な長さを取得する可能性を提供する。これにより、複数のサブストリームについて並列にエントロピーエンコーディング及び／又はエントロピーデコーディングを実行する可能性が開かれる。

【0136】

本開示は、同一サイズの部分のみ、又は、第１サイズ及び第１サイズとは異なる第２サイズの部分を提供することに限定されない。加えて、他のサイズ、例えば、第３サイズ１８４２及び／又は第４サイズ１８４３の部分が第１サブストリーム又は第２サブストリームに含まれ得る。この第３サイズは、第１サイズ又は第２サイズに等しいことがあり得る。これは、図１８において図示され、ここで、第ｉチャネルｃｈ_ｉは、４個の部分、すなわち、部分．ｉ０、部分．ｉ１、部分．ｉ２、及び部分．ｉ３に分割される。同一サイズの部分における全部のチャネルを分割し、次に、異なるチャネルからの部分を含むサブストリームを形成することによって、サブストリームサイズが制御され得る。これは動的区分化と称され得る。

【0137】

例えば、個々のサブストリームは、より多くの部分を含むことよって、それらの長さを延長でき、所望の長さになお調節できる。第１サブストリーム及び第２サブストリームを形成するための部分の多重化は、同一サイズを有し得るが、エントロピーエンコーディングの後に、第１サブストリーム及び第２サブストリームは異なるサイズを有し得る。従って、例えば、多重化に含める部分のサイズ及び／又は数を構成することによって、サブストリームサイズを適合してそれらの相違を低減することが望ましいことがあり得る。例えば、より長い個々のサブストリームが少ない場合、より少ない長さ指示がシグナリングされる必要があるか、又は、より少ないパディングが必要とされる。

【0138】

エントロピーエンコーディングは算術エンコーディング又はレンジエンコーディングであり得る。これらの場合において、エンコーディングは、コーディング済みビット１５３０～１５３３及び（存在する場合）末尾ビット１５４０～１５４３をもたらす。これらの末尾ビットは、最後の部分のエンコーディング後のエンコーダのステータスである。本開示は、コーディング済みビット及び末尾ビットをビットストリームに別個に組み込むことに限定されないことに留意されたい。全部のビットをビットストリームにコーディング済みビットとして出力するエンコーダがあり得る。独立のエンコーディング及びデコーディングに基づく本サブストリームは、そのようなエンコーダ及びデコーダにも適用可能である。

【0139】

サブストリームは、それぞれのサブストリームの長さを示すサブストリーム長指示１５５０と共にビットストリーム１５７０に多重化される。

【0140】

（図１５に示されるように）実施形態において、サブストリーム長指示１５５０は、ビットストリーム１５７０内においてそれぞれのサブストリームに先行する。加えて、第２サブストリーム長指示はまた、第１サブストリーム１５３０に先行し得、すなわち、複数のサブストリーム長指示は連結され、複数のサブストリームの前にビットストリーム１５７０に含まれる。複数のサブストリームは、例えば、１つの画像又は画像部分、又は、予め定められた数の画像、又は、チャネルデータの別のコンテナに関連する、チャネルから生成されたサブストリームの一部又は全部であり得る。複数のものにサブストリームがいくつ含まれるかも、構成可能であり得るか、又は、同一サイズのチャネルの数に対応し得るが対応する必要はない予め定義された数に固定され得る。

【0141】

加えて、末尾ビットは、長さ指示と共にシグナリングされ得る。各サブストリームに末尾ビット、すなわち第１末尾ビット及び第２末尾ビットがある。従って、第１末尾ビット長指示及び第２末尾ビット長指示がビットストリーム１５７０に含まれ得る。末尾ビット長指示１５６０は、ビットストリーム１５７０内においてそれらのそれぞれのサブストリームに先行し得る。第２末尾ビット長指示はまた、第１サブストリーム１５３０に先行し得る。従って、連結された末尾ビット長指示１５６０は、第１サブストリーム１５３０に先行する。サブストリーム長指示及び末尾ビット長指示の順序は、予め定義され、その結果、エンコーダ及びデコーダの両方は、適合的にビットストリームを形成及びパースすることが可能である。

【0142】

これらの長さ指示の全部をビットストリームに含めることにより、個々のサブストリーム及び／又は末尾ビットのパディングを回避する。特に、いくつかの実装において、パディングは、複数のサブストリームの後に実行され得、対応する指示は、ビットストリームに含まれ得る。しかしながら、ビット又はシンボルの特定のラスタへのそのようなアライメントを必要としないビットストリーム構造又はプロトコルがあり得るので、本開示は、パディングを必要としない。

【0143】

複数のサブストリームについての指示を集中させることに代えて、実施形態において、第１サブストリーム１５４０の末尾ビットは、第１サブストリーム１５３０に続くビットストリームに含められ得、第２サブストリーム１５４１の末尾ビットは、ビットストリーム１５７０内において第２サブストリーム１５３１に続き得る。このビットストリーム構造の利点は、複数のサブストリーム及びそれぞれの指示のバッファリングを必要とすることなく、サブストリームの即時エンコーディング又はデコーディングを可能にすることであり得る。更に、第１末尾ビット１５４０は第２サブストリーム１５３１に続き得る。

【0144】

バイト、ワード、又はダブルワード、又は同様のものなど、ビットの予め定められた量の整数倍と一致するようにビットストリーム長をアラインするべく、上記の例示的実施形態のいずれかのように構築されたビットストリーム１５７０は、パディングされ得る。そのような手法は、例えば、ネットワーク適応層ユニット又は他のパケットへのカプセル化などの更なる処理のために適切にアラインされたビットストリームを提供し得る。

【0145】

複数のチャネル１５１０のデータは、例えばビットであるシンボルから成る。第１サブストリーム１５３０に含まれる全部の部分、及び、第２サブストリーム１５３１に含まれる全部の部分は、これらのシンボルの整数Ｋ倍であり得、Ｋは１より大きい。

【0146】

サブストリームサイズのより均一な分布を達成するべく、部分はシャッフルされ得る。シャッフルは、図１８を参照して既に言及された。それは、エンコーディング及びデコーディング側で同期的に実行される部分のインターリーブに対応し、すなわち、エンコーディング及びデコーディング側で同一の規則を使用して、エンコーディング及びデコーディングの間の適合性を確実にする。シャッフル方法は、予め定義された方法のセットから選択され、その後、第１サイズの部分及び第２サイズの部分の順序を指定するために適用される。部分１８６０（例えば、部分０ａ０、部分０ｂ０、部分１ａ０、部分２ａ０、部分２ｂ０、及び部分３ａ０）は同期的にシャッフルされる。図１８における例示的スキームは、部分の巡回置換１８５０を示す。また、それぞれの部分に関連付けられた、対応する確率分布１８６１（例えば、Ｐｒｏｂｐｒｔ．０ａ０、Ｐｒｏｂｐｒｔ．０ｂ０、Ｐｒｏｂｐｒｔ．１ａ０、Ｐｒｏｂｐｒｔ．２ａ０、Ｐｒｏｂｐｒｔ．２ｂ０及びＰｒｏｂｐｒｔ．３ａ０）は、エントロピーコーディング（例えば算術コーディング）のために適用される。従って、部分及び関連付けられた確率部分（モデル）は、同期的にシャッフルされるものとみなされ得る。

【0147】

シャッフル（及び、場合により、シャッフル方法選択）は、エンコーディングされる部分に対して繰り返し実行され得、エンコーディングされた第１サブストリーム及びエンコーディングされた第２サブストリームの間、一般的に、サブストリーム間の長さの差を経時的に低減する。したがって、シャッフル方法は、現在の（例えば、第１又は第２）サブストリームの長さ、及び、過去のサブストリームの長さに基づく統計値の間の差、及び／又は、現在のサブストリームの長さ、及び、過去のサブストリームの長さに基づく統計値の間の差を考慮し得る。そのようなシャッフル方法は、部分の任意の恣意的なシャッフル１８５２、すなわち、任意の可能な並び替えをもたらし得る。

【0148】

これは、過去のサブストリームの長さの分布を取得するべく、過去のサブストリームの統計測定を収集することを含み得る。この分布は、エンコーダ及びデコーダ側上で同時に取得及び使用され得る。なぜなら、両方の側が以前に同一のサブストリームを処理したからである。

【0149】

統計値は例えば、過去及び／又は現在のサブストリームの長さの推定された平均値、中央値、最小値、又は最大値、又は、サブストリームの長さの増大の速度、又は、サブストリームの長さの減少の速度、又は、それらの組み合わせ、又は、別の統計測定（推定量）に基づき得る。

【0150】

エントロピーエンコーディングが算術エンコーディングである場合、シャッフル方法はまた、算術エンコーディングプロセスにおいてレンジ区間の現在の状態を考慮し得る。

【0151】

レンジ区間の現在の状態はまた、サブストリーム長の詳細情報を提供し得、特定のチャネルに基づくサブストリームの増大の速度の推定を考慮し得る。特に、レンジ区間の現在の状態が小さいとき、それは、サブストリーム長がより大きいことの指示であり、逆も同様である。そのような増大の推定に基づいて、適切なシャッフル方法が選択され得る。

【0152】

上で言及されたように、適切なシャッフルは、以下の例において図示されるように、いくつかの利点を提供し得る。ここで、シャッフルはチャネルの循環ローテーション（巡回置換）であり得ると想定する。この例では、サブストリームサイズ（ここでは長さとも称される）の増大の速度がそれぞれ異なる３個のチャネルＣｈ１、Ｃｈ２、Ｃｈ３がある。サブストリームは、Ｃｈ１からの部分あたり１０バイト、Ｃｈ２からの部分あたり２バイト、Ｃｈ３からの部分あたり２０バイト増大する。従って、まず３つの部分を並列にサブストリームＳ１、Ｓ２、及びＳ３にシャッフル無しでエンコーディングした後に、以下のストリーム長が達成される：
各チャネルからの第１部分が、Ｃｈ１、Ｃｈ２、及びＣｈ３の順序で、シャッフル無しでエンコーディングされる。この結果、Ｓ１、Ｓ２、及びＳ３のそれぞれについて、３つのそれぞれ並列の１０、２、２０バイトのストリームサイズがもたらされる。
第２部分がＣｈ１、Ｃｈ２、及びＣｈ３の同一順序で、シャッフル無しでエンコーディングされる場合、３個のチャネルの各々からの第２部分を含めた後に、２０、４、及び４０バイトの並列ストリームサイズが達成される。
第３部分がＣｈ１、Ｃｈ２、及びＣｈ３の同一順序で、シャッフル無しでエンコーディングされる場合、３個のチャネルの各々からの第３部分を含めた後に、３０、６、及び６０の並列ストリームサイズが取得される。

【0153】

この例において分かるように、並列サブストリームは、長さが大きく異なる。これは、いくつかの適用に対して望ましくないことがあり得る。この状況を改善するべく、シャッフルが実行され得る。特に、各チャネルから部分が取得される順序が変更され得る。

【0154】

同一の増大速度を有する、上で言及されるものと同一のチャネルＣｈ１、Ｃｈ２、及びＣｈ３を想定し得る。チャネル順序Ｃｈ１、Ｃｈ２、Ｃｈ３の循環シフトによるシャッフルが実行される場合、以下の結果がもたらされる。
第１部分が、ここで上の例と同一順序で３個のチャネルから取得される。すなわち、順序はＣｈ１、Ｃｈ２、Ｃｈ３である。この結果、１０、２、及び２０バイトの同一の並列ストリームサイズがもたらされる。
第２部分が、シャッフルされた順序で、特に、循環シフト（右に１シフト）された順序、Ｃｈ３、Ｃｈ１、及びＣｈ２で取得される。この結果、３０、１２、及び２２バイトのそれぞれのストリームサイズがもたらされる。これらのストリームサイズは、前の段階からの長さ１０、２及び２０バイトのストリームに、シャッフルされたチャネルに対応する２０、１０、及び２のサイズを追加することによって取得される。見て分かるように、第２部分の後に、３０、１２及び２２をシャッフルした後のサイズは、２０、４、及び４０バイトをシャッフルしない前の例からのサイズより低い変動を示す。
第３部分が、この例では、繰り返される右への巡回シフトによって、再びシャッフルされた順序で取得され、結果として、チャネルＣｈ２、Ｃｈ３、及びＣｈ１の順序になる。結果として得られる、３つの並列ストリームのストリームサイズは３２、３２、及び３２である。このサイズは、先行する段階（第２部分の追加）のストリームサイズ３０、１２及び２２バイトに、それぞれ２、２０及び１０バイトを更に追加する結果である。見て分かるように、第２シャッフルの後に、（上で説明されるサブストリームに対応する）並列ストリームの長さが均等化される。

【0155】

実際の適用において、増大はそこまで容易ではなく、正確に推定可能でないことがあり得る。特に、必ずしも上の例のように定常でない。それでも、シャッフルは、サブストリーム長（サイズ）の均等化を改善し得る。それを行うべく、増大の速度の推定がパフォーマンスに寄与し得る。上で説明されるように、（エンコーディングされた）サブストリームの増大は、前にコーディングされた（デコーディングされた）部分又はサブストリームに基づいて推定され得る。しかしながら、レンジ区間の現在の状態によって、更により近い指示が提供され得る。レンジ区間が大きい場合、サブストリームの長さがより小さく、増大の速度への寄与が低いことが示される。レンジ区間が小さい場合、サブストリームのより大きい長さが示され、これは、増大の速度へのより大きい寄与に対応する。言い換えれば、レンジ区間の長さは、ストリームの増大の速度に反比例する。比例は必ずしも線形でない。

【0156】

したがって、エンコーディング及びデコーディングの間に、シャッフル機構が適用され得る。シャッフルは、上で説明されたものと同様であり得る。例えば、ｋ番目のチャネルにおける各チャネルからの第ｋ部分をエンコーディング（又はデコーディング）した後に、各チャネルからの第（ｋ＋１）部分が、（ｋ－１）番目のチャネルにおいてエンコーディングされる。実装例において、（ｋ＋１）番目は、ｋ番目を巡回シフトすることによってｋ番目から取得される。巡回シフトは、右又は左であり得る。それは、シフトが１チャネルである場合に有利であり得る。しかしながら、本開示は、それに限定されず、シフトのステップは１とは異なり得る。上で既に言及されたように、シャッフル順序はまた、具体的に選択されシグナリングされ得る。

【0157】

別の例示的実施形態において、より大きい長さ及びより高い増大速度を有するサブストリームにエンコーディングされるチャネルの部分は、より小さい長さ及びより低い増大速度を有するサブストリームにエンコーディングされるチャネルの部分と交換、すなわちシャッフルされ得る。特に、方法は、サブストリームの長さ、及び、サブストリームの長さの増大の速度を決定し得る。この決定の結果に基づいて、方法は部分をシャッフルする。上の例に関して、これは、チャネルＣｈ２及びチャネルＣｈ３の交換に対応する。この交換は、より高い増大の速度（部分あたり２０バイト）に寄与するＣｈ３からの部分を、より小さい長さのサブストリームＳ２にエンコーディングする。より小さい増大の速度（部分あたり５バイト）に寄与するＣｈ２からの部分は、より大きい長さのサブストリームＳ３にエンコーディングされる。これは、Ｓ２の増大の増加、及び、Ｓ３の増大の低減をもたらす。従って、エンコーディングされたサブストリームの間の長さの上で言及された差は低減され得る。実際の適用において、増大は、上の例のように必ずしも定常でないことがあり得る。

【0158】

第１サブストリーム１５３０及び第２サブストリーム１５３１へのエントロピーエンコーディングは、例えば、図１４及び１５におけるマルチコアエンコーダ１４２０、１５２０の１つによって並列に実行され得る。いくつかの実装において、エントロピーエンコーディングの一部のみが並列に実行され得る。

【0159】

デコーディング方法は、第１サブストリーム１５３０及び第２サブストリーム１５３１を多重化部分にエントロピーデコーディングすることを伴う。エントロピーデコーディングは、第１及び第２サブストリームについて別個に実行され得る。複数のチャネル１８１０は、第１サイズの部分１８４０及び第２サイズの部分１８４１を逆多重化することから取得され得る。第１サイズ及び第２サイズは同一であり得る。同一サイズ１６２０のチャネルは、異なるサイズ１８１０の複数のチャネルを取得するために後処理され得る。この後処理は、分離されたチャネルを追加（連結）することを伴う。０でパディングされたチャネルは、入力データを取得するべく、クリッピングされ、すなわち、パディングが除去される。これらの段階に関する情報は同一サイズのチャネルに含まれ得る。任意のサイズのチャネルは、ニューラルネットワークの出力チャネル又は潜在表現チャネルであり得る。

【0160】

エントロピーデコーディングは、例えば、上の算術エンコーディングのセクションにおいて説明されるような、算術デコーディング又はレンジデコーディングであり得る。しかしながら、サブストリームの形成に関する本開示は、算術エンコーダ及びデコーダの適用に限定されない。むしろ、任意のエントロピーコーディング及び／又はランレングスコーディング、又は同様のものは、チャネルデータに適用され得る。エントロピーコーディングは、コンテキスト適合性であり得る。これらの実施形態は、上で説明されたエンコーディング例に対応する。

【0161】

サブストリームは、第１サブストリームの長さを示す第１サブストリーム長指示、及び、第２サブストリームの長さを示す第２サブストリーム長指示と共にビットストリーム１５７０から抽出される。例えば、サブストリームは、サブストリームの長さ指示が抽出前に分かっているときに抽出され得る。

【0162】

従って、サブストリーム長指示１５５０は、ビットストリーム１５７０において、それらのそれぞれのサブストリームに先行し得る。加えて、第２サブストリーム長指示はまた、第１サブストリーム１５３０に先行し得る。

【0163】

サブストリームの前の連結された長さ指示をシグナリングすることによって、デコーダは、サブストリームを同時に抽出し得る。

【0164】

第１末尾ビットの長さを示す第１末尾ビット長指示及び第２末尾ビットの長さを示す第２末尾ビット長指示は、ビットストリーム１５７０から抽出され得る。末尾ビット長指示１５６０は、ビットストリーム１５７０内においてそれらのそれぞれのサブストリームに先行し得る。第２末尾ビット長指示はまた、第１サブストリーム１５３０に先行し得る。

【0165】

第１サブストリーム１５４０の末尾ビットは、第１サブストリーム１５３０に続くビットストリームに含まれ得、第２サブストリーム１５４１の末尾ビットは、ビットストリーム１５７０内の第２サブストリーム１５３１に続き得る。更に、第１末尾ビット１５４０は第２サブストリーム１５３１に続き得る。

【0166】

複数のチャネル１５１０のデータは、ビットであり得るシンボルから成る。第１サブストリーム１５３０からデコーディング及び逆多重化された全部の部分、及び、第２サブストリーム１５３１からデコーディング及び逆多重化された全部の部分は、これらのシンボルの整数Ｋ倍であり得、Ｋは１より大きい。

【0167】

第１サブストリーム長指示、第２サブストリーム長指示、第１末尾ビット長指示、第２末尾ビット長指示、第１サブストリーム１５３０、第２サブストリーム１５３１、第１末尾ビット１５４１、及び第２末尾ビット１５４１の抽出の後に、残りのビットがあり得る。最後の末尾ビットの抽出後にビットストリーム１５７０に残されたビットは、例えばネットワーク適応層ユニット又は他のパケットへのカプセル化などの更なる処理のために適切にアラインされたビットストリームを提供するべく、ビットストリーム全体１５７０をパディングして予め定められた数のビットの整数に一致させた結果である。残りのビットは破棄され得る。

【0168】

エンコーディングプロセスにおける部分の多重化の間に、適用されるシャッフル方法があり得る。例えば、この方法は、ビットストリームに含まれる制御情報内においてシグナリングされる。従って、デコーダは、ビットストリームからシャッフル方法指示をパースし得る。指示は、例えば、規格によって定義され得る、又は、規格に従って構成可能でありビットストリームにおいてシグナリング可能であり得るシャッフル方法のリストに対するインデックスであり得、場合によりシャッフル方法指示自体より頻度が低い。

【0169】

従って、シャッフル方法は、予め定義されたシャッフル方法の設定から決定され、第１サイズの部分１８４０及び第２サイズの部分１８４１の逆多重化に適用され得る。シャッフル方法は、サブストリーム内の部分の順序を指定する。加えて、シャッフル方法はまた、部分の長さが変動し得る実装例におけるサブストリームの部分の長さを定義し得る。いくつかの実施形態において、部分の長さは、チャネルにわたって、及び／又は、サブストリームにわたって同一であり得る。

【0170】

エントロピーデコーディングは、例えばマルチコアデコーダによって並列に実行され得る。加えて、エントロピーデコーディングの一部のみが並列に実行され得る。

【0171】

末尾ビットの操作
図９は、入力データをビットストリーム１７５０に算術コーディングするための例示的な方法を図示するフロー図である。エンコーディング済みのビットストリーム１７５０の例が図１７に与えられる。

【0172】

方法は、エンコーダによって使用される初期レンジＳ９１０を初期化し得る。例えば、そのような初期レンジは、上に説明されるように、図２における初期レンジ２１０に対応し得る。エンコーディングは、エンコーディングされるメッセージの第１シンボルで開始し、メッセージの全部のシンボルを進み、コーディング済みビットを取得する。

【0173】

段階Ｓ９２０において、例えば図２から７を参照して説明されるように、メッセージからの現在のシンボルが算術コーディングを用いてコーディングされる。

【0174】

コーディングループＳ９２０～Ｓ９５０の後に、コーディング済みビットがビットストリーム１５７０に含まれる。しかしながら、エンコーダのステータスを示す末尾ビットがレジスタ内になお残る。末尾ビットを記述する区間は、最後のシンボルをエンコーディングしてコーディング済みビット１７３０～１７３１をストリーミングした後に残る現在のレンジである。コーディング済みビット１７３０～１７３１と共に算術コーディング済みデータを形成する末尾ビットは一般的に、この区間から恣意的に選択され得る。

【0175】

しかしながら、末尾ビットは、先行末尾ビット内の末尾の０の量を最大化するように選択され得る。これらの末尾の０は、ビットストリーム１７５０に含まれないことがあり得、従って、クリッピングされ得る。

【0176】

この区間の決定された最小及び最大値Ｓ９６０は、同一である最上位ビットＭＳＢの量を含み得る。これらの同一の先行ビットは、連続する末尾ビットであり、すなわち、それらは継続的な末尾ビットのセットを形成する。これらの先行末尾ビット１７４０～１７４１の量は決定され得るＳ９７０。

【0177】

これらの同一の先行ビット及び先行末尾ビットの決定された量の指示は、ビットストリームに含められ得るＳ９８０。

【0178】

先行末尾ビットの量ＮｕｍＴｒａｉｌｉｎｇＢｉｔｓは以下のように決定される。ＮｕｍＴｒａｉｌｉｎｇＢｉｔｓ＝ＣＬＺ（（ＬＯＷ＋ＲＡＮＧＥ－１）ＸＯＲＬＯＷ）、ここで、ＣＬＺ（）は、先行０の数であり、ＬＯＷは、区間の最小値であり、ＲＡＮＧＥは、区間のレンジである。ＸＯＲは、排他的論理ＯＲの演算を示す。

【0179】

同一の先行ビット１７４０～１７４１及びそれらの量の決定についての例が図１６において図示される。最後のシンボルをエンコーディングし、コーディング済みビット１７３０～１７３１をビットストリーム１７５０に含めた後に、エンコーダ内に１６の末尾ビットが残っている。末尾ビットは、現在の最小値１６１０Ｌｏｗ＝１１２３及び現在の区間１６２０のレンジＲａｎｇｅ＝６７によって表される。図１６において、これらの値は２進表現で与えられる。現在の最大値１６３０Ｈｉｇｈ－１＝（Ｌｏｗ＋Ｒａｎｇｅ－１）＝（１１２３＋６７－１）は、現在の最小値１６１０及び現在のレンジ１６２０から決定される。（Ｈｉｇｈ－１）ＸＯＲＬｏｗ１６４０は、ＬＯＷ１６１０及びＨＩＧＨ－１１６３０におけるビットが同一である位置に０ビットをもたらし、そうでなければビット１をもたらす。

【0180】

この値１６４０内の先行０は、末尾ビット内の同一の先行ビットを示す。従って、先行０の数ＣＬＺ（）は、ＣＬＺ（（ｌｏｗ＋ｒａｎｇｅ－１）ＸＯＲｌｏｗ）＝８をもたらす。

【0181】

この例では、８個の同一の先行ビットがある。現在の区間内の末尾ビット１６５０は、Ｌｏｗ及びＨｉｇｈ－１において異なる第１ビットの後の全部のビットを０にすることによって、Ｌｏｗ及びＨｉｇｈ－１の間の値として選択され、従って、０ｂ．００００．０１００．１０００．００００１６５０が生じる。

【0182】

上で言及されたように、末尾の０１６８０は、Ｌｏｗ及びＨｉｇｈ－１において異なる第１ビットであるビット１１６７０と共にクリッピングされ得る。なぜなら、このビットは常に１であり、シグナリングされる必要がないからである。従って、この例における先行末尾ビット１６６０は、８ビット０００００１００によって形成される。

【0183】

先行０の決定された数は、先行ビットの量の指示に含まれる。この指示は、ビットストリーム１７５０内において、コーディング済みビット１７３０～１７３１及び先行末尾ビット１７４０～１７４１に先行する１７２０。

【0184】

しかしながら、先行末尾ビット１７４０～１７４１は、先行末尾ビット１６６０のすぐ後に追加される値１のビット１６７０と共にビットストリーム１５７０に含められ得る。この後部に付加されたビットは、Ｌｏｗ及びＨｉｇｈ－１において異なる第１ビットである。先行末尾ビット１７２０の量の指示は、この場合、追加ビット１を含む。

【0185】

算術コーディングのための方法は、複数のサブストリーム上で別個に実行され得る。例示的な実施形態が図１４において与えられる。上で説明された方法は、例示的に、第１サブストリーム及び第２サブストリームに適用され、第１コーディング済みビット１４３０ａ、第２コーディング済みビット１４３１、第１先行末尾ビット１４４０ａ、及び第２先行末尾ビット１４４１を生じさせる。第１先行末尾ビット１７４０及び第２先行末尾ビット１７４１が後に続く第１コーディング済みビット１７３０及び第２コーディング済みビット１７３１をビットストリーム１７５０に挿入することによって、ビットストリーム１７５０が、図１７に概略的に図示されるこれらのピースから形成される。第１先行末尾ビット１７４０は、第２のコーディング済みビット１７３１のすぐ後に続き、パディングは必要ない。

【0186】

第１及び第２サブストリームから形成されるビットストリーム１７５０はまた、第１コーディング済みビット１７１０及び第２コーディング済みビット１７１１の長さ指示を含み得る。これらの第１及び第２長さ指示１７１０～１７１１はそれぞれ、ビットストリーム１７５０内においてコーディング済みビット１７３０～１７３１に先行し得る。

【0187】

加えて、第２長さ指示１７１１はまた、第１コーディング済みビット１７３０に先行し得る。これは図１７において例示的に示される。長さ指示１７１０～１７１１は、コーディング済みビット１７３０～１７３１の各々について連結され、コーディング済みビット１７３０～１７３１の前のビットストリームに含められる。

【0188】

第２先行末尾ビットの量の指示１７２１は、ビットストリーム１７５０内において第１コーディング済みビット１７３０に先行し得る。図１７における例は、第１コーディング済みビット１７３０～１７３１がすぐ後に続く、連結された指示１７２０～１７２１を含む。

【0189】

例えばワード又はダブルワードであり得る、バイトの予め定められた量の整数倍と一致させるようにビットストリーム長をアラインするために、上の例示的な実施形態のいずれかのように共に繋がれたビットストリーム１７５０はパディングされ得る。

【0190】

第１及び第２サブストリームの算術エンコーディングは、例えば、図１４及び１５におけるマルチコアエンコーダ１４２０、１５２０の１つによって、並列に実行され得る。いくつかの実装において、算術エンコーディングの一部のみが並列に実行され得る。

【0191】

上で言及されたように、算術エンコーディングの方法は、レンジコーディングとして実現され得る。このレンジコーディングは、予め定義された合計レンジを有し得；メモリの予め構成されたサイズは、合計レンジを表すビットの数（合計レンジのｌｏｇ＿２）に等しいか、又は、それより大きい。

【0192】

メモリは、現在のレンジ区間の最小値及び最大値を保持し得る。例えば、有限のレジスタにおけるそのような最小値は、図７Ａ～図７Ｄにおける２進表現７２０ｃに対応し得、有限のレジスタにおけるそのような最大値は、２進表現７１０ｃを有し得る。エンコーディングループの１又は複数の反復の後に、安定ビットがあり得、これは、現在の最小値及び現在の最大値の２進表現のＭＳＢにおいて同一の値を有する連続ビットである。これらの安定ビットの予め定められた量は、メモリからビットストリームに移動させられる。これは例えば、図７Ａ～図７ＤにおけるＨＩＧＨ及びＴＯＰ位置の間の２ビットに対応する。実装例において、ＨＩＧＨ及びＴＯＰ位置の間に１６ビットがあり得る。本発明は、これらの例のいずれかに限定されない。

【0193】

先行末尾ビットの量、及び、ＨＩＧＨ及びＴＯＰ位置の間の安定ビットのうちのビットの予め定義された量の間の差が予め定義された閾値より下であることが起こり得、例えば、ＨＩＧＨ及びＴＯＰ位置の間に１６ビット、及び、１５の先行末尾ビットがあり得る。この場合、先行末尾ビットをコーディング済みビットに含めることがより効率的である。したがって、末尾コーディング済みビットが先行末尾ビットから生成される。ビット１１６７０が先行末尾ビット１６６０に追加される必要があり、ビットは、安定ビットの予め定義された数に到達するように、０でパディングされ得る。従って、末尾ビットの量の指示を伴う、多くの先行末尾ビットの高コストのシグナリングが回避される。例えば、１５の先行末尾ビットの量をシグナリングするために、少なくとも４ビットが必要である。代わりに、より多くのコーディング済みビットを有し、０の先行末尾ビットをシグナリングすることは、より低コストであり得る。例えば、頻繁に発生する場合には、それらは効率的にエンコーディングされ得る。

【0194】

上で言及された、予め定義された閾値は、例えば、ＨＩＧＨ及びＴＯＰ位置の間のビットの量、及び、先行末尾ビットの長さを示すために使用されるシグナリングの量を考慮して、経験的に決定され得る。

【0195】

図１０は、ビットストリーム１７５０からのデータの算術デコーディングのための例示的方法を図示するフロー図である。デコーダは、ビットストリームを受信し得Ｓ１０１０、そこからコーディング済みビットの長さの指示が抽出され得るＳ１０２０。コーディング済みビット１７３０～１７３１は、ビットストリームから抽出され、継続的にデコーディングされるＳ１０４０～Ｓ１０６０。全部のコーディング済みビットがデコーディングされるとき、先行末尾ビット１７４０～１７４１は、またビットストリームから抽出され得るＳ１０３０、それらの量の指示１７２０～１７２１に従って抽出されるＳ１０７０。先行末尾ビット１６６０から、完全末尾ビット１６５０は、デコーディングされるべく復元される必要があるＳ１０８０。先行末尾ビット１６６０は、末尾ビットの予め定義された最大長まで０でパディングされる。復元された末尾ビットはデコーディングされ得るＳ１０９０。

【0196】

別の実装例では、利用可能なメモリが十分ある場合、デコーディングの前にサブストリーム全体が形成され得る。コーディング済みビット及び先行末尾ビットはビットストリームから抽出される。末尾ビットは、上で説明されたように復元され得る。サブストリームについてのコーディング済みビット及び決定された末尾ビット。サブストリーム全体はその後デコーディングされる。

【0197】

しかしながら、本発明は、これらの実装例のいずれかに限定されない。

【0198】

末尾ビット１６５０内の同一の先行ビット１６６０の後に続くビット１１６７０がシグナリングされなかった場合、それは、末尾ビットの決定プロセスに含まれる必要がある。ビット１１６７０は、パディング１６８０の前の先行末尾ビット１６６０に付加される。

【0199】

先行末尾ビットの量の指示１７２０～１７２１は、ビットストリーム１７５０内において、先行末尾ビット１７４０～１７４１だけでなく、コーディング済みビット１７３０～１７３１にも先行し得る。

【0200】

算術デコーディングのための方法はまた、複数のサブストリーム上で別個に実行され得る。デコーディングのために個々のサブストリームを復元するべく、第１先行末尾ビット１７４０及び第２先行末尾ビット１７４１が後に続く第１コーディング済みビット１７３０及び第２コーディング済みビット１７３１が抽出される。第１コーディング済みビット１７３０及び第１先行末尾ビット１７４０は第１サブストリームを形成し、第２コーディング済みビット１７３１及び第２先行末尾ビット１７４１は第２サブストリームを形成する。各サブストリームについて、末尾ビットは、単一のサブストリームについて、上で説明されたように決定される。各サブストリームは個別にデコーディングされる。

【0201】

第１コーディング済みビット１７３０及び第２コーディング済みビット１７３１は、第１長さ指示１７１０及び第２長さ指示１７２０と称される、それらのそれぞれの長さについての指示と共に抽出され得る。

【0202】

コーディング済みビット１７１０の第１長さ指示は、ビットストリーム１７５０内において第１コーディング済みビット１７３０に先行し得、第２長さ指示１７１１は第２コーディング済みビット１７３１に先行する。加えて、第２長さ指示１７１１はまた、第１コーディング済みビット１７３０に先行し得る。

【0203】

第２末尾ビットの量の指示１７２１はまた、第１コーディング済みビット１７３０に先行し得る。

【0204】

第１コーディング済みビット１７３０、第２コーディング済みビット１７３１、第１先行末尾ビット１７４０、及び第２先行末尾ビット１７４１の抽出後、破棄され得る残りのビットがあり得る。最後の末尾ビットの抽出の後にビットストリーム１７５０に残るビットは、ビットの予め定められた数の整数と一致させるためにビットストリーム全体１７５０をパディングした結果である。

【0205】

算術デコーディングは、例えばマルチコアデコーダによって並列に実行され得る。加えて、算術デコーディングの一部のみが並列に実行され得る。

【0206】

算術デコーディングの方法は、レンジコーディングとして実現され得る。

【0207】

本開示の算術コーディングは、ニューラルネットワークの特徴マップのエンコーディング、又は、従来の画像（静止又はビデオ）エンコーディング及びデコーディングに容易に適用され得る。ニューラルネットワークは任意の目的のために、特に、画像（静止又は動画）のエンコーディング及びデコーディング、又は、モーションフロー又はモーションベクトル又は他のパラメータなどの画像関連データのエンコーディング及びデコーディングのために使用され得る。ニューラルネットワークはまた、イメージの分類、深度検出、セグメンテーションマップ決定、身分証の物体認識、又は同様のものなどの、コンピュータビジョンの適用のために使用され得る。

【0208】

上のセクションにおいて説明される複数のチャネルのエントロピーコーディングの方法は、本セクションにおいて説明される末尾ビットの操作と組み合わされ得る。第１及び第２サブストリームはそれぞれ、多重化及びエンコーディングされた部分を含む第１及び第２コーディング済みビットによって形成される。「複数のチャネルのエントロピーコーディング」において参照される末尾ビットは、先行エンコーダステータスビットである先行末尾ビットに対応し得る。先行エンコーダステータスビットの決定された量は、末尾ビット長指示において示される。

【0209】

画像コーディング内の実装
１つの可能なデプロイメントが図１１及び１２に見られ得る。

【0210】

図１１は、本願の技法を実装するように構成されている例示のビデオエンコーダ２０の概略ブロック図を示している。図１１の例において、ビデオエンコーダ２０は、入力２０１（又は入力インタフェース２０１）と、残差計算ユニット２０４と、変換処理ユニット２０６と、量子化ユニット２０８と、逆量子化ユニット２１０と、逆変換処理ユニット２１２と、再構築ユニット２１４と、ループフィルタユニット２２０と、デコーディング済み画像用バッファ（ＤＰＢ）２３０と、モード選択ユニット２６０と、エントロピーエンコーディングユニット２７０と、出力２７２（又は出力インタフェース２７２）とを備える。エントロピーコーディング２７０は、上で説明されたような算術コーディング方法又は装置を実装し得る。

【0211】

モード選択ユニット２６０は、インター予測ユニット２４４、イントラ予測ユニット２５４、及び区分化ユニット２６２を含み得る。インター予測ユニット２４４は、動き推定ユニット及び動き補償ユニット（図示せず）を含み得る。図１１に示されるようなビデオエンコーダ２０はまた、ハイブリッドビデオコーデックによるハイブリッドビデオエンコーダ又はビデオエンコーダと称され得る。

【0212】

エンコーダ２０は、例えば、入力２０１を介して、画像１７（又は画像データ１７）、例えば、ビデオ又はビデオシーケンスを形成する一連の画像のうちの画像を受信するように構成されてよい。受信された画像又は画像データは、前処理済みの画像１９（又は前処理済みの画像データ１９）であってもよい。簡潔さのために、以下の説明では画像１７が参照される。（特に、ビデオコーディングにおいて、現在の画像を他の画像、例えば、同じビデオシーケンス、すなわち、現在の画像も含むビデオシーケンスの以前にエンコーディングされた及び／又はデコーディングされた画像と区別するために、）画像１７は、現在の画像又はコーディングされる画像とも称され得る。

【0213】

（デジタル）画像は、強度値を持つサンプルの２次元アレイ又はマトリックスであるか、それとみなされ得る。アレイ内のサンプルは、画素（画像要素の省略形）又はペルとも称され得る。アレイ又は画像の水平及び垂直方向（又は軸）におけるサンプルの数により、画像のサイズ及び／又は解像度が定まる。色の表現のために、典型的には、３つの色成分が使用される。すなわち、画像は、３つのサンプルアレイとして表され得るか、又はそれらを含み得る。ＲＧＢ形式又は色空間では、画像は対応する赤、緑、青のサンプルアレイを含む。しかしながら、ビデオコーディングでは、各画素は典型的には、ルミナンス及びクロミナンス形式又は色空間、例えば、Ｙ（場合によっては、代わりにＬも用いられる）により示されるルミナンス成分と、Ｃｂ及びＣｒにより示される２つのクロミナンス成分とを含むＹＣｂＣｒで表される。ルミナンス（又は略して、ルマ）成分Ｙは、明るさ又は（例えば、グレースケール画像でのような）グレーレベルの強度を表し、一方、２つのクロミナンス（又は略して、クロマ）成分Ｃｂ及びＣｒは、色度成分又は色情報成分を表す。したがって、ＹＣｂＣｒ形式の画像は、ルミナンスサンプル値（Ｙ）のルミナンスサンプルアレイと、クロミナンス値（Ｃｂ及びＣｒ）の２つのクロミナンスサンプルアレイとを含む。ＲＧＢ形式の画像は、ＹＣｂＣｒ形式へ換算又は変換されてよく、逆も同様であり、この処理は、色変換又は色換算としても知られている。画像がモノクロである場合、この画像は、ルミナンスサンプルアレイのみを含み得る。したがって、画像は例えば、単色形式のルマサンプルのアレイ、又は、４：２：０、４：２：２、及び、４：４：４のカラーフォーマットであるルマサンプルのアレイ、及び、クロマサンプルの２つの対応するアレイであり得る。

【0214】

ビデオエンコーダ２０の実施形態は、画像１７を複数の（典型的には非重複）画像ブロック２０３に区分化するように構成されている画像区分化ユニット（図１１には示されない）を備え得る。これらのブロックは、ルートブロック、マクロブロック（Ｈ．２６４／ＡＶＣ）又はコーディングツリーブロック（ＣＴＢ）又はコーディングツリーユニット（ＣＴＵ）（Ｈ．２６５／ＨＥＶＣ及びＶＶＣ）とも称され得る。画像区分化ユニットは、ビデオシーケンスの全ての画像とブロックサイズを定義する対応するグリッドとに同じブロックサイズを使用するか、画像間又は画像のサブセット又はグループ間でブロックサイズを変更し、各画像を対応するブロックに区分化するように構成されてよい。ＡＶＣという略称は、アドバンスドビデオコーディングを表す。

【0215】

更なる実施形態において、ビデオエンコーダは、画像１７のブロック２０３、例えば、画像１７を形成する１つ、いくつか、又は全てのブロックを直接受信するように構成されてよい。画像ブロック２０３は、現在の画像ブロック又はコーディングされる画像ブロックとも称され得る。

【0216】

画像１７と同様にここでも、画像ブロック２０３は、画像１７よりも寸法が小さいが、強度値（サンプル値）を持つサンプルの２次元アレイ又はマトリックスであるか、又は、それとみなすことができる。言い換えると、ブロック２０３は、例えば、１つのサンプルアレイ（例えば、モノクロ画像１７の場合にはルマアレイ、又は、カラー画像の場合にはルマアレイ又はクロマアレイ）、又は、３つのサンプルアレイ（例えば、カラー画像１７の場合には１つのルマアレイ及び２つのクロマアレイ）、又は、適用されるカラーフォーマットに応じた任意の他の数及び／又は種類のアレイを含み得る。ブロック２０３の水平及び垂直方向（又は軸）におけるサンプルの数により、ブロック２０３のサイズが定まる。したがって、ブロックは、例えば、サンプルのＭ×Ｎ（Ｍ列×Ｎ行）アレイ、又は変換係数のＭ×Ｎアレイであってよい。

【0217】

図１１に示すようなビデオエンコーダ２０の実施形態は、画像１７をブロック毎にエンコーディングするように構成され得、例えば、エンコーディング及び予測は、ブロック２０３毎に実行される。

【0218】

図１１に示されるようなビデオエンコーダ２０の実施形態は更に、スライス（ビデオスライスとも称される）を使用して画像を区分化及び／又はエンコーディングするよう構成され得、ここで、画像は、１又は複数のスライス（典型的には重複無し）を使用して区分化又はエンコーディングされ得、各スライスは、１又は複数のブロック（例えばＣＴＵ）を含み得る。

【0219】

図１１に示されるようなビデオエンコーダ２０の実施形態は更に、タイルグループ（ビデオタイルグループとも称される）及び／又はタイル（ビデオタイルとも称される）を使用して画像を区分化及び／又はエンコーディングするよう構成され得、ここで、画像は、１又は複数のタイルグループ（典型的には重複無し）を使用して区分化又はエンコーディングされ得、各タイルグループは、例えば、１又は複数のブロック（例えばＣＴＵ）又は１又は複数のタイルを含み得、ここで、各タイルは、例えば、矩形形状であり得、１又は複数のブロック（例えば、ＣＴＵ）、例えば、完全又は部分的ブロックを含み得る。

【0220】

図１２は、この本願の技法を実装するように構成されているビデオデコーダ３０の例を示している。ビデオデコーダ３０は、例えばエンコーダ２０によりエンコーディングされたエンコーディング済み画像データ２１（例えば、エンコーディング済みのビットストリーム２１）を受信して、デコーディングされた画像３３１を取得するように構成される。エンコーディング済み画像データ又はビットストリームは、エンコーディング済み画像データをデコーディングするための情報、例えば、エンコーディング済みのビデオスライス（及び／又はタイルグループ又はタイル）の画像ブロック及び関連するシンタックス要素を表すデータを含む。

【0221】

エントロピーデコーディングユニット３０４は、ビットストリーム２１（又は一般にエンコーディング済み画像データ２１）をパースし、例えば、エンコーディング済み画像データ２１にエントロピーデコーディングを実行して、例えば量子化係数３０９及び／又はデコーディングされたコーディングパラメータ（図１２には図示せず）、例えば、インター予測パラメータ（例えば、参照画像インデックス及び動きベクトル）、イントラ予測パラメータ（例えば、イントラ予測モード又はインデックス）、変換パラメータ、量子化パラメータ、ループフィルタパラメータ、及び／又は他のシンタックス要素のいずれか又は全てを取得するように構成されている。エントロピーデコーディングユニット３０４は、エンコーダ２０のエントロピーエンコーディングユニット２７０に関して記載されたエンコーディングスキームに対応するデコーディングアルゴリズム又はスキームを適用するように構成されてよい。エントロピーデコーディングユニット３０４は、インター予測パラメータ、イントラ予測パラメータ、及び／又は他のシンタックス要素をモード適用ユニット３６０に、また他のパラメータをデコーダ３０の他のユニットに提供するように更に構成されてよい。ビデオデコーダ３０は、シンタックス要素をビデオスライスレベル及び／又はビデオブロックレベルで受信し得る。スライス及びそれぞれのシンタックス要素に追加的に、又は代替的に、タイルグループ及び／又はタイル、ならびに、それぞれのシンタックス要素が受信及び／又は使用され得る。エントロピーデコーディングは、上で言及された算術デコーディング方法又は装置のいずれかを実装し得る。

【0222】

再構築ユニット３１４（例えば、加算器又は合算器３１４）は、再構築された残差ブロック３１３を予測ブロック３６５に加算し、例えば、再構築された残差ブロック３１３のサンプル値と予測ブロック３６５のサンプル値とを加算することによって、サンプル領域における再構築されたブロック３１５を取得するように構成されてよい。

【0223】

図１２に示されるようなビデオデコーダ３０の実施形態は、スライス（ビデオスライスとも称される）を使用して画像を区分化及び／又はデコーディングするよう構成され得、ここで、画像は、１又は複数のスライス（典型的には重複無し）を使用して区分化又はデコーディングされ得、各スライスは、１又は複数のブロック（例えばＣＴＵ）を含み得る。

【0224】

図１２に示されるようなビデオデコーダ３０の実施形態は、タイルグループ（ビデオタイルグループとも称される）及び／又はタイル（ビデオタイルとも称される）を使用して画像を区分化及び／又はデコーディングするよう構成され得、ここで、画像は、１又は複数のタイルグループ（典型的には重複無し）を使用して区分化又はデコーディングされ得、各タイルグループは、例えば、１又は複数のブロック（例えばＣＴＵ）又は１又は複数のタイルを含み得、ここで、各タイルは、例えば、矩形形状であり得、１又は複数のブロック（例えば、ＣＴＵ）、例えば、完全又は部分的ブロックを含み得る。

【0225】

ビデオデコーダ３０の他の変形を、エンコーディング済み画像データ２１をデコーディングするのに用いることができる。例えば、デコーダ３０は、ループフィルタリングユニット３２０なしに、出力ビデオストリームを生成できる。例えば、非変換ベースデコーダ３０は、特定のブロック又はフレームのための逆変換処理ユニット３１２なしに、残差信号を直接的に逆量子化できる。別の実装において、ビデオデコーダ３０は、単一のユニットへと組み合わされた逆量子化ユニット３１０及び逆変換処理ユニット３１２を有し得る。

【0226】

エンコーダ２０及びデコーダ３０において、現在の段階の処理結果は、更に処理されて、その後、次の段階に出力されてよいことが理解されるべきである。例えば、補間フィルタリング、動きベクトル導出又はループフィルタリングの後、補間フィルタリング、動きベクトル導出又はループフィルタリングの処理結果に対して、Ｃｌｉｐ又はシフトなどのさらなる演算が実行され得る。

【0227】

ハードウェア及びソフトウェアにおける実装
ハードウェア及びソフトウェアにおけるいくつかのの更なる実装が以下で説明される。

【0228】

図１９～２２を参照して上で説明されたエンコーディングデバイスのいずれかは、入力データをコーディング済みビット及び先行末尾ビットに算術エンコーディングすることを実行するための手段を提供し得る。これらの例示的なデバイスのいずれかにおける処理回路は、入力データをエンコーディングするように、及び、上で説明された方法に従ってコーディング済みビットの最後のビットをエンコーディングした後に、エンコーダステータスの先行末尾ビットを決定するよう構成されている。

【0229】

図１９～２２のいずれかにおけるデコーディングデバイスは、デコーディング方法を実行するように適合された処理回路を含み得る。上で説明された方法は、それらのそれぞれの量の指示と共にコーディング済みビット及び先行末尾ビットを抽出することを含む。末尾ビットは、先行末尾ビットから再構築され、それらは、データを取得するために、コーディング済みビットと共にデコーディングされ得る。

【0230】

まとめると、方法及び装置は、データをビットストリームにエンコーディングし、データをビットストリームからデコーディングすることが説明されている。方法は、エンコーディングプロセスの末尾ビット内に、関連する上位ビットのみを含めることによってビットストリームの長さを低減することが可能である。これらの先行末尾ビットの量は決定され、最低の量を有する末尾ビットが構築され得る。先行末尾ビットの量の指示はビットストリームに含められる。したがって、パディングは必要なく、結果として、シグナリングされる必要があるビットが少なくなる。

【0231】

実施形態によれば、同一サイズの複数のチャネルのデータをビットストリームにエントロピーエンコーディングするためのエンコーディング方法が提供され、方法は、複数のチャネルのうちのチャネルの各々からの第１サイズの部分を多重化し、その後、第１サイズの多重化部分を第１サブストリームにエンコーディングする段階；複数のチャネルのうちのチャネルの各々からの第２サイズの部分を多重化し、その後、第２サイズの多重化部分を第２サブストリームにエンコーディングする段階を含み；ここで、エンコーディングは、独立に実行される、第１サブストリーム及び第２サブストリームへのエントロピーエンコーディングである。

【0232】

【0233】

実装例において、エンコーディング方法は更に、異なるサイズの複数のチャネルのデータを前処理して同一サイズの上記複数のチャネルを取得する段階を含む、同一サイズの複数のチャネルを生成する段階を備える。

【0234】

任意のサイズのチャネルから同一サイズのチャネルを取得する選択肢は、異なる種類の入力データに対する方法の適用性を提供する。

【0235】

例えば、エンコーディング方法は更に、第１サブストリーム及び第２サブストリームを、第１サブストリームの長さを示す第１サブストリーム長指示、及び、第２サブストリームの長さを示す第２サブストリーム長指示と共に、ビットストリームに多重化する段階を備える。

【0236】

【0237】

例示的な実施形態において、第１サブストリーム長指示は、ビットストリーム内において第１サブストリームに先行し、第２サブストリーム長指示は、ビットストリーム内において第２サブストリームに先行する。

【0238】

この特徴は、個々のサブストリームを抽出するべく、全ビットストリームをバッファリングする必要性を回避する。

【0239】

例えば、第２サブストリーム長指示は、ビットストリーム内において、第１サブストリームに先行する。

【0240】

第１サブストリームの前の連結された長さ指示を含む、このビットストリーム構造は、ビットストリームからのサブストリームのより効率的な抽出を提供し得る。

【0241】

実装例において、エントロピーエンコーディングは算術エンコーディングである。

【0242】

算術エンコーディングは、レートの低減に寄与し得る効率的なエントロピーコーディングである。

【0243】

実装例において、エンコーディング方法は更に、第１サブストリーム及び第２サブストリームを、第１サブストリームの第１末尾ビットの長さを示す第１末尾ビット長指示、及び、第２サブストリームの第２末尾ビットの長さを示す第２末尾ビット長指示と共に、ビットストリームに多重化する段階を備える。

【0244】

最後の部分をエンコーディングした後のエンコーダのステータスである末尾ビットは、サブストリームとは別個にシグナリングされ得る。これは、末尾ビットの追加的処理の可能性を提供する。

【0245】

例えば、第１末尾ビット長指示は、ビットストリーム内において第１サブストリームに先行し、第２末尾ビット長指示は、ビットストリーム内において第２サブストリームに先行する。

【0246】

このビットストリーム構造の利点は、複数のサブストリーム及びそれぞれの指示をバッファリングすることを必要としない、サブストリームの即時エンコーディングの可能性であり得る。

【0247】

例えば、第２末尾ビット長指示は、ビットストリーム内において、第１サブストリームに先行する。

【0248】

そのようなビットストリーム構造は、ビットストリームの個々の一部のより速い抽出のための更なる可能性を提供する。

【0249】

実装例において、エンコーディング方法は更に、第１サブストリームに続くビットストリームに第１末尾ビットを付加する段階、及び、第２サブストリームに続くビットストリームに第２末尾ビットを付加する段階を備える。

【0250】

このビットストリーム構造は、別のサブストリームの抽出無しで、第１サブストリーム及び対応する末尾ビットをデコーディングすることを可能にする。

【0251】

例えば、第１末尾ビットは、ビットストリーム内において、第２サブストリームの後に続く。

【0252】

そのようなビットストリーム構造は、ビットストリームから末尾ビットを抽出する前に、個々のサブストリームのデコーディングを開始することを可能にする。

【0253】

実装例において、エンコーディング方法は更に、バイトの予め定められた量の整数倍と一致させるようにビットストリーム長をアラインするために、第１サブストリーム長指示、第２サブストリーム長指示、第１末尾ビット長指示、第２末尾ビット長指示、第１サブストリーム、第２サブストリーム、第１末尾ビット、及び第２末尾ビットを含むビットストリームを、予め定められた値を有するビットでパディングする段階を備える。

【0254】

この実装は、例えば、ネットワーク適応層ユニット又は他のパケットへのカプセル化など、更なる処理のために適切にアラインされたビットストリームを提供し得る。

【0255】

例えば、第１サイズは第２サイズに等しい。

【0256】

同一サイズの部分を使用する結果、より効率的なパフォーマンスが生じ得る。なぜなら、例えば、ハードウェア及びソフトウェア実装に好適なメモリユニットが使用され得るからである。

【0257】

実装例において、第１サブストリームに含まれる全部の部分、及び、第２サブストリームに含まれる全部の部分は、複数のチャネルの上記データのシンボルの整数Ｋ倍であり、Ｋは１より大きい。

【0258】

そのような手法は、ソフトウェア及び／又はハードウェアにおける効率的な実装を提供し得る。

【0259】

例えば、シンボルはビットである。

【0260】

実装例において、エンコーディング方法は更に、第１サイズの部分及び第２サイズの部分を多重化するためのシャッフル方法を選択し、その後に適用する段階を備え、ここで、シャッフル方法は、予め定義されたシャッフル方法のセットから選択され、第１サイズの部分及び第２サイズの部分の順序を指定する。

【0261】

サブストリームサイズのより均一な分布を達成するべく、部分はシャッフルされ得る。

【0262】

例えば、シャッフル方法は、第１サイズの部分に関して、第２サイズの部分の巡回置換を実行する。

【0263】

そのようなシャッフル方法により、より均一な長さのサブストリームが容易に実装され得る。

【0264】

例えば、エンコーディング方法は、繰り返し実行され、ここで、シャッフル方法は、現在の第１サブストリームの長さ、及び、過去の第１サブストリームの長さに基づく統計値の間の差、及び／又は、現在の第２サブストリームの長さ、及び、過去の第２サブストリームの長さに基づく統計値の間の差に従って選択される。

【0265】

シャッフルは、エンコーディングされる部分に対して繰り返し実行され得、サブストリームの間の長さの差が経時的に低減する。

【0266】

例えば、統計値は、推定される平均値、中央値、最小値、最大値、又は増大速度の少なくとも１つに基づく。

【0267】

これらの統計は、シャッフル、従って、サブストリームサイズを制御するための好適な手段を提供し得る。加えて、これは、ストリーミングプロセス中のより均一な負荷を可能にし得る。

【0268】

実装例において、エントロピーエンコーディングは算術エンコーディングであり、シャッフル方法は、算術エンコーディングにおけるレンジ区間の現在の状態に従って選択される。

【0269】

この方法は、算術エンコーダの区間の現在のレンジの値が、エンコーディングのための予め定められた最小レンジに近いかどうかを考慮し得る。これにより、エンコーディング中の再正規化を回避し得る。

【0270】

実装例において、エントロピーエンコーディングは、第１エントロピーエンコーダを用いて第１サブストリームを生成し、第２エントロピーエンコーダを用いて第２サブストリームを生成することを含み、第１エントロピーエンコーダ及び第２エントロピーエンコーダを用いるエントロピーエンコーディングは、少なくとも部分的に並列に実行される。

【0271】

サブストリームの並列エンコーディングの結果、全ビットストリームのより速いエンコーディングがもたらされ得る。

【0272】

例えば、チャネルは、ニューラルネットワークの出力チャネル又は潜在表現チャネルである。

【0273】

ニューラルネットワークは典型的には、同一サイズ又は少なくとも固定サイズのチャネルを提供し、これにより、これらのチャネルに対して、上記の実施形態及び例を特に好適にし、より容易に適用可能にする。

【0274】

実装例において、エントロピーエンコーディングは算術エンコーディングであり、第１サブストリーム又は第２サブストリームへの多重化部分のエンコーディングのための方法は、多重化部分をコーディング済みビット及びエンコーダステータスビットに算術エンコーディングする段階、ここで、コーディング済みビットは、サブストリームを形成する；算術エンコーディングされた入力データ区間の最小値及び最大値を決定する段階；連続するエンコーダステータスビットである、決定された最大値を表す第１最上位ビットＭＳＢ内において、決定された最小値を表す第２ＭＳＢ内と同一の値を有する先行末尾ビットの量を決定する段階、ここで、末尾ビットは先行エンコーダステータスビットである；末尾ビット長指示内の先行エンコーダステータスビットの決定された量を示す段階を備える。

【0275】

完全末尾ビットではなく先行末尾ビットをビットストリームに含めることにより、ビットストリーム内のビットの量を低減し得、従って、レートを低減し、例えば、同一品質で、シグナリングされるビットの量、レートを低減する。

【0276】

例えば、先行エンコーダステータスビットＮｕｍＴｒａｉｌｉｎｇＢｉｔｓの量は、ＮｕｍＴｒａｉｌｉｎｇＢｉｔｓ＝ＣＬＺ（（ＬＯＷ＋ＲＡＮＧＥ－１）ＸＯＲＬＯＷ）によって決定され、ＣＬＺ（）は、先行０の数であり、ＬＯＷは、区間の最小値であり、ＲＡＮＧＥは、区間のレンジである。

【0277】

先行末尾ビットの量は、例えば最も近いバイト境界に丸められるのではなく、厳密に決定され得、これにより、ビットストリーム内のビットの量が更に低減し得る。

【0278】

実装例において、ビットストリームに含める前に、先行エンコーダステータスビットに対して、１の値を有する１ビットが後部に付加される。

【0279】

そのような手法は、１値ビットを除去するために代替的に使用され得る通常の慣行に従い得る。

【0280】

【0281】

２つの別個のサブストリームに対する、方法のそのような独立の適用は、並列化のための必須条件を提供する。

【0282】

実装例において、算術エンコーディング中に、先行エンコーダステータスの量、及び、安定ビットのうちのビットの予め定義された量の間の差が、予め定義された閾値より下である場合；末尾コーディング済みビットは、安定ビットのうちのビットの予め定義された量まで０が後に続く１の値を有する１ビットを後部に付加することによって、先行エンコーダステータスビットから生成され；末尾コーディング済みビットは、コーディング済みビットをビットストリームに含める前に、コーディング済みビットに含められ；０の先行エンコーダステータスビットの指示がビットストリームに含められる。

【0283】

従って、末尾ビットの量の指示を共に伴う多くの先行末尾ビットの高コストのシグナリングが回避され得る。代わりに、より多くのコーディング済みビットを有し、０の先行末尾ビットをシグナリングすることは、より低コストであり得る。

【0284】

実装例において、算術エンコーディングはレンジエンコーディングである。

【0285】

【0286】

実施形態によれば、ビットストリームを同一サイズの複数のチャネルのデータにエントロピーデコーディングするためのデコーディング方法が提供され、方法は、第２サブストリームとは独立に第１サブストリームをエントロピーデコーディングする段階；第１サブストリーム及び第２サブストリームからの第１サイズの部分及び第２サイズの部分を同一サイズの複数のチャネルに逆多重化する段階を備える。

【0287】

各チャネルを別個にエンコーディングするのではなく、異なるチャネルからの部分を多重化及びエンコーディングすることにより、より均一な長さのサブストリームをデコーディングする可能性を提供する。これは、複数のサブストリームについて並列にエントロピーデコーディングを実行する可能性を切り開く。

【0288】

例えば、デコーディング方法は更に、同一サイズの複数のチャネルを後処理して、異なるサイズの複数のチャネルのデータを取得する段階を含む。

【0289】

同一サイズのチャネルから任意のサイズのチャネルのデータを取得する選択肢は、異なる種類のデータに対する方法の適用を提供する。

【0290】

実装例において、デコーディング方法は更に、第１サブストリームの長さを示す第１サブストリーム長指示、及び、第２サブストリームの長さを示す第２サブストリーム長指示と共に、第１サブストリーム及び第２サブストリームをビットストリームから抽出する段階を含む。

【0291】

【0292】

例示的な実装例において、第１サブストリーム長指示は、ビットストリーム内において第１サブストリームに先行し、第２サブストリーム長指示は、ビットストリーム内において第２サブストリームに先行する。

【0293】

このビットストリーム構造の利点は、複数のサブストリーム及びそれぞれの指示をバッファリングすることを必要としない、サブストリームの即時エンコーディング又はデコーディングの可能性であり得る。

【0294】

例えば、第２サブストリーム長指示は、ビットストリーム内において、第１サブストリームに先行する。

【0295】

サブストリームの前に連結された長さ指示を提供することは、ビットストリームの個々の一部のより速い抽出を可能にし得る。

【0296】

実装例において、エントロピーデコーディングは算術デコーディングである。

【0297】

算術エンコーディングは、レートの低減に寄与し得る効率的なエントロピーコーディングである。

【0298】

実装例において、デコーディング方法は更に、第１サブストリーム及び第２サブストリームを、第１サブストリームの第１末尾ビットの長さを示す第１末尾ビット長指示、及び、第２サブストリームの第２末尾ビットの長さを示す第２末尾ビット長指示と共に、ビットストリームから抽出する段階を備える。

【0299】

【0300】

【0301】

このビットストリーム構造の利点は、複数のサブストリーム及びそれぞれの指示をバッファリングすることを必要としない、サブストリームの即時デコーディングの可能性であり得る。

【0302】

例えば、第２末尾ビット長指示は、ビットストリーム内において、第１サブストリームに先行する。

【0303】

そのようなビットストリーム構造は、ビットストリームの個々の一部のより速い抽出のための更なる可能性を提供する。

【0304】

実装例において、第１末尾ビットは、ビットストリーム内において第１サブストリームの後に続き、第２末尾ビットは、ビットストリーム内において第２サブストリームの後に続く。

【0305】

【0306】

例えば、第１末尾ビットは、ビットストリーム内において、第２サブストリームの後に続く。

【0307】

【0308】

実装例において、第１サイズは、第２サイズに等しい。

【0309】

【0310】

例えば、第１サブストリームに含まれる全部の部分、及び、第２サブストリームに含まれる全部の部分は、複数のチャネルの上記データのシンボルの整数Ｋ倍であり、Ｋは１より大きい。

【0311】

そのような手法は、ソフトウェア及び／又はハードウェアにおける効率的な実装を提供し得る。

【0312】

例えば、シンボルはビットである。

【0313】

実装例において、エンコーディング方法は更に、第１サブストリーム長指示、第２サブストリーム長指示、第１末尾ビット長指示、第２末尾ビット長指示、第１サブストリーム、第２サブストリーム、第１末尾ビット、及び第２末尾ビットを抽出した後に、ビットストリームの残りのビットを破棄する段階を備える。

【0314】

【0315】

実装例において、デコーディング方法は更に、第１サイズの部分及び第２サイズの部分の逆多重化のためのシャッフル方法を決定及び適用する段階を備え、ここで、シャッフル方法は、予め定義されたシャッフル方法のセットのうちの１つであり、第１サイズの部分及び第２サイズの部分の順序を指定する。

【0316】

サブストリームサイズのより均一な分布を達成するべく、部分はシャッフルされ得る。

【0317】

例えば、シャッフル方法の決定は、ビットストリームに含まれる制御情報に基づく。

【0318】

デコーダ側で部分を正確にシャッフルするべく、エンコーダ側で使用されるシャッフル方法は、ビットストリーム内においてシグナリングされ得る。

【0319】

実装例において、エントロピーデコーディングは、第１エントロピーデコーダを用いて第１サブストリームをデコーディングすること、及び、第２エントロピーデコーダを用いて第２サブストリームをデコーディングすることを含み、第１エントロピーデコーダ及び第２エントロピーデコーダを用いたエントロピーデコーディングは少なくとも部分的に並列に実行される。

【0320】

サブストリームの並列デコーディングは、全ビットストリームのより速いデコーディングをもたらし得る。

【0321】

例えば、チャネルは、ニューラルネットワークの出力チャネル又は潜在表現チャネルである。

【0322】

【0323】

実装例において、エントロピーデコーディングは算術デコーディングであり、第１サブストリーム又は第２サブストリームから多重化部分をデコーディングするための方法は、末尾ビット長指示からの先行エンコーダステータスビットの量を抽出する段階、ここで、サブストリームはコーディング済みビットを含み、末尾ビットは先行エンコーダステータスビットである；エンコーダステータスビットの予め定められた最大長まで、抽出された先行エンコーダステータスビットに０を後部に付加することを含む、エンコーダステータスビットを決定する段階；及び、コーディング済みビット及び決定されたエンコーダステータスビットを含むビットから多重化部分を算術デコーディングする段階を備える。

【0324】

先行エンコーダステータスビットからの末尾ビットの再構築は、ビットストリーム内のより小さい量のビットを使用することによって、コーディング済みビット及び末尾ビットからのデコーディングを提供する。

【0325】

例えば、エンコーダステータスビットの決定は、抽出された先行エンコーダステータスビットに対して、１の値の１ビットを、それに続けて、エンコーダステータスビットの予め定められた最大長まで０を後部に付加することから成る。

【0326】

この手法は、算術エンコーダの完全な出力を再構築することを可能にし、従って、適切な入力を算術デコーダに提供する。

【0327】

実装例において、算術デコーディングはレンジデコーディングである。

【0328】

【0329】

【0330】

実施形態によれば、同一サイズの複数のチャネルのデータをビットストリームにエントロピーエンコーディングするための装置は、複数のチャネルのうちのチャネルの各々からの第１サイズの部分を多重化し、その後、第１サイズの多重化部分を第１サブストリームにエンコーディングすること；複数のチャネルのうちのチャネルの各々からの第２サイズの部分を多重化し、その後、第２サイズの多重化部分を第２サブストリームにエンコーディングすることを行うよう構成されている処理回路を備え、ここで、エンコーディングは、独立に実行される、第１サブストリーム及び第２サブストリームへのエントロピーエンコーディングである。

【0331】

実施形態によれば、ビットストリームを同一サイズの複数のチャネルのデータへエントロピーデコーディングするための装置は、第２サブストリームから独立に第１サブストリームをエントロピーデコーディングし、第１サブストリーム及び第２サブストリームからの第１サイズの部分及び第２サイズの部分を同一サイズの複数のチャネルに逆多重化するよう構成される処理回路を備える。装置は、上に説明された方法の利点を提供する。

【0332】

図１９～２２を参照して上で説明されたエンコーディングデバイスのいずれかは、チャネルの各々からの第１サイズの部分の多重化、及び、チャネルの各々からの第２サイズの部分の多重化を実行するための手段を提供し得る。これら例示的なデバイスのいずれかにおける処理回路は、その後、多重化部分をサブストリームにエンコーディングし、第１サブストリーム及び第２サブストリームへのこのエントロピーコーディングを独立に実行するよう構成されている。

【0333】

図１９～２２のいずれかにおけるデコーディングデバイスは、デコーディング方法を実行するように適合された処理回路を含み得る。上で説明されるような方法は、第２サブストリームから独立して第１サブストリームをエントロピーデコーディングする段階、及び、第１サブストリーム及び第２サブストリームからの第１サイズの部分及び第２サイズの部分を複数のチャネルのデータに逆多重化する段階を備える。

【0334】

まとめると、方法及び装置は、データをビットストリームにエンコーディングし、データをビットストリームからデコーディングすることが説明されている。方法は、並列エンコーディング及びデコーディングを効率的に実行することが可能であり、サブストリームのパディングを回避し、従って、ビットストリーム内のビットの量を低減する。入力データチャネルの部分は多重化され、サブストリームにエンコーディングされる。多重化中に、より均一な長さのサブストリームを取得するべくシャッフル方法が適用される。サブストリーム内のビットの量は、エンコーディングプロセスの末尾ビット内に、関連する上位ビットのみを含めることによって更に低減され得る。

【0335】

ビデオコーディングシステム１０の以下の実施形態において、ビデオエンコーダ２０及びビデオデコーダ３０は、上で言及された図１１及び１２、又は、ニューラルネットワークベースのエンコーダ及びデコーダなどの他のエンコーダ及びデコーダを参照して、図１９及び２０に基づいて説明される。

【0336】

図１９は、コーディングシステム１０、例えば、この本願の技法を利用し得るビデオコーディングシステム１０（又は略してコーディングシステム１０）の例を図示する概略ブロック図である。ビデオコーディングシステム１０のビデオエンコーダ２０（又は略してエンコーダ２０）及びビデオデコーダ３０（又は略してデコーダ３０）は、本願において説明される様々な例に従って技法を実行するように構成され得るデバイスの例を表す。

【0337】

図１９に示されるように、コーディングシステム１０は、例えば、エンコーディング済み画像データ１３をデコーディングするためにデスティネーションデバイス１４に対してエンコーディング済み画像データ２１を提供するよう構成されるソースデバイス１２を含む。

【0338】

ソースデバイス１２は、エンコーダ２０を備え、加えて、すなわち任意選択で、画像ソース１６と、プリプロセッサ（又は前処理ユニット）１８、例えば画像プリプロセッサ１８と、通信インタフェース又は通信ユニット２２とを備えてよい。

【0339】

画像ソース１６は、任意の種類の画像捕捉デバイス、例えば、現実世界の画像を捕捉するカメラ、及び／又は、任意の種類の画像生成デバイス、例えば、コンピュータアニメーション化画像を生成するコンピュータグラフィックプロセッサ、又は、現実世界の画像、コンピュータ生成画像（例えば、スクリーンコンテンツ、仮想現実（ＶＲ）画像）、及び／又はそれらの任意の組み合わせ（例えば、拡張現実（ＡＲ）画像）を取得及び／又は提供する任意の種類の他のデバイスを含むか又はそれらのデバイスであってよい。画像ソースは、上述の画像のいずれかを格納する任意の種類のメモリ又はストレージであってよい。

【0340】

プリプロセッサ１８及び前処理ユニット１８によって実行される処理と区別するように、画像又は画像データ１７は、生画像又は生画像データ１７とも称され得る。

【0341】

プリプロセッサ１８は、（生）の画像データ１７を受信するとともに、画像データ１７に対して前処理を実行して、前処理済みの画像１９又は前処理済みの画像データ１９を取得するように構成されている。プリプロセッサ１８により実行される前処理は、例えば、トリミング、カラーフォーマット換算（例えば、ＲＧＢからＹＣｂＣｒへのもの）、色補正又はノイズ除去を含み得る。前処理ユニット１８は任意選択的なコンポーネントであってよいことが理解できる。

【0342】

ビデオエンコーダ２０は、前処理済みの画像データ１９を受信し、エンコーディング済み画像データ２１を提供するよう構成されている（更なる詳細は、例えば、図１１に基づいて上で説明された）。

【0343】

ソースデバイス１２の通信インタフェース２２は、通信チャネル１３を介して、エンコーディング済み画像データ２１を受信するとともに、エンコーディング済み画像データ２１（又はその任意の更なる処理バージョン）を、保存又は直接の再構築のために、別のデバイス、例えばデスティネーションデバイス１４又は任意の他のデバイスに送信するよう構成されてよい。

【0344】

デスティネーションデバイス１４は、デコーダ３０（例えばビデオデコーダ３０）を備え、加えて、すなわち任意選択で、通信インタフェース又は通信ユニット２８と、ポストプロセッサ３２（又は後処理ユニット３２）と、ディスプレイデバイス３４とを備えてよい。

【0345】

デスティネーションデバイス１４の通信インタフェース２８は、エンコーディング済み画像データ２１（又はその任意の更なる処理バージョン）を、例えばソースデバイス１２から直接又は任意の他のソース、例えばストレージデバイス、例えばエンコーディング済み画像データストレージデバイスから受信するとともに、エンコーディング済み画像データ２１をデコーダ３０に提供するように構成されている。

【0346】

通信インタフェース２２及び通信インタフェース２８は、ソースデバイス１２とデスティネーションデバイス１４との間で、直接的な通信リンク、例えば、直接的な有線又は無線接続を介して、又は、任意の種類のネットワーク、例えば、有線又は無線ネットワーク又はそれらの任意の組み合わせ、又は、任意の種類のプライベート及びパブリックネットワーク又はそれらの任意の種類の組み合わせを介して、エンコーディング済み画像データ２１又はエンコーディング済みのデータを送信又は受信する（１３）ように構成されてよい。

【0347】

通信インタフェース２２は、例えば、エンコーディング済み画像データ２１を適切な形式に、例えばパケットにパッケージ化する、及び／又は、通信リンク又は通信ネットワークを介した伝送のための任意の種類の伝送エンコーディング又は処理を用いて、エンコーディング済み画像データを処理するように構成されてよい。

【0348】

通信インタフェース２２のカウンターパートをなす通信インタフェース２８は、例えば、伝送されたデータを受信するとともに、任意の種類の対応する送信デコーディング又は処理及び／又はデパッケージングを用いて伝送データを処理して、エンコーディング済み画像データ２１を取得するように構成されてよい。

【0349】

通信インタフェース２２及び通信インタフェース２８の両方は、ソースデバイス１２からデスティネーションデバイス１４を指す図１９における通信チャネル１３の矢印によって示される一方向性通信インタフェースとして、又は、双方向性通信インタフェースとして構成され得、例えばメッセージを送信及び受信し、例えば接続をセットアップし、通信リンク及び／又はデータ伝送、例えばエンコーディング済み画像データ伝送に関する任意の他の情報を確認及び交換するよう構成され得る。

【0350】

デコーダ３０は、エンコーディング済み画像データ２１を受信し、デコーディング済み画像データ３１又はデコーディング済み画像３１を提供するよう構成される（更なる詳細は、例えば図１２に基づいて上で説明された）。

【0351】

デスティネーションデバイス１４のポストプロセッサ３２は、デコーディングされた画像データ３１（再構築された画像データとも呼ばれる）、例えばデコーディング済み画像３１を後処理して、後処理済みの画像データ３３、例えば後処理済みの画像３３を取得するように構成されている。後処理ユニット３２により実行される後処理は、例えば、デコーディングされた画像データ３１を、例えば、ディスプレイデバイス３４による表示のために準備する目的で、例えば、カラーフォーマット換算（例えば、ＹＣｂＣｒからＲＧＢへのもの）、色補正、トリミング又は再サンプリング又は任意の他の処理を含んでよい。

【0352】

デスティネーションデバイス１４のディスプレイデバイス３４は、画像を例えばユーザ又は視聴者に表示するために、後処理済みの画像データ３３を受信するように構成されている。ディスプレイデバイス３４は、再構築された画像を表すための任意の種類のディスプレイ、例えば、一体型又は外付けのディスプレイ又はモニタであってもよく、これを備えてもよい。ディスプレイは、例えば、液晶ディスプレイ（ＬＣＤ）、有機発光ダイオード（ＯＬＥＤ）ディスプレイ、プラズマディスプレイ、プロジェクタ、マイクロＬＥＤディスプレイ、液晶オンシリコン（ＬＣｏＳ）、デジタル光プロセッサ（ＤＬＰ）、又は任意の種類の他のディスプレイを含んでよい。

【0353】

図１９は、ソースデバイス１２及びデスティネーションデバイス１４を別個のデバイスとして示しているが、デバイスの実施形態は、両方又は両方の機能、ソースデバイス１２又は対応する機能及びデスティネーションデバイス１４又は対応する機能も含み得る。そのような実施形態では、ソースデバイス１２又は対応する機能及びデスティネーションデバイス１４又は対応する機能は、同じハードウェア及び／又はソフトウェアを用いて、又は別個のハードウェア及び／又はソフトウェア又はそれらの任意の組み合わせにより実装され得る。

【0354】

説明に基づいて当業者には明らかとなるように、異なるユニットの機能、又は、図１９に示されるソースデバイス１２及び／又はデスティネーションデバイス１４内の機能の存在及び（厳密な）分離は、実際のデバイスと適用に応じて変動し得る。

【0355】

エンコーダ２０（例えばビデオエンコーダ２０）又はデコーダ３０（例えばビデオデコーダ３０）又はエンコーダ２０及びデコーダ３０の両方は、１又は複数のマイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、ディスクリートロジック、ハードウェア、専用ビデオコーディング、又は、それらの任意の組み合わせなど、図２０に示されるような処理回路を介して実装され得る。エンコーダ２０は、図１１のエンコーダ２０及び／又は本明細書に記載の任意の他のエンコーダシステム又はサブシステムに関連して説明される様々なモジュールを具現するために処理回路４６を介して実装されてよい。デコーダ３０は、図１２のデコーダ３０及び／又は本明細書において説明される任意の他のデコーダシステム又はデコーダサブシステムに関連して説明される様々なモジュールを具現化するために、処理回路４６を介して実装され得る。処理回路は、後で説明されるような様々な演算を実行するように構成され得る。図２２に示されるように、これらの技法が部分的にソフトウェア内に実装される場合、デバイスは、ソフトウェアに対する命令を好適な非一時的コンピュータ可読記憶媒体に格納してよく、１又は複数のプロセッサを用いてハードウェア内の命令を実行して、本開示の技法を実行し得る。ビデオエンコーダ２０及びビデオデコーダ３０のいずれかは、例えば図２０に示されるように、単一デバイスにおいて、組み合わされたエンコーダ／デコーダ（コーデック）の一部として統合され得る。

【0356】

ソースデバイス１２及びデスティネーションデバイス１４は、任意の種類のハンドヘルド又はステーショナリデバイス、例えば、ノートブック又はラップトップコンピュータ、携帯電話、スマートフォン、タブレット又はタブレットコンピュータ、カメラ、デスクトップコンピュータ、セットトップボックス、テレビ、ディスプレイデバイス、デジタルメディアプレイヤ、ビデオゲーミングコンソール、ビデオストリーミングデバイス（コンテンツサービスサーバ又はコンテンツ配信サーバ等）、ブロードキャスト受信機デバイス、ブロードキャスト送信機デバイス等を含む、広範な範囲のデバイスのいずれかを備えてよく、オペレーティングシステムを用いない又は任意の種類のオペレーティングシステムを用いてよい。いくつかの場合、ソースデバイス１２及びデスティネーションデバイス１４は、無線通信用に備え付けられ得る。したがって、ソースデバイス１２及びデスティネーションデバイス１４は、無線通信デバイスであってよい。

【0357】

いくつかの場合において、図１９に図示されるビデオコーディングシステム１０は単に例であり、本願の技法は、エンコーディング及びデコーディングデバイスの間の任意のデータ通信を必ずしも含まないビデオコーディング設定（例えば、ビデオエンコーディング又はビデオデコーディング）に適用し得る。他の例において、データは、ローカルメモリから取得される、又はネットワークを介してストリーミングされる等である。ビデオエンコーディングデバイスは、データをメモリにエンコーディング及び格納してよく、及び／又は、ビデオデコーディングデバイスは、データをメモリから取得してデコーディングしてよい。いくつかの例において、エンコーディング及びデコーディングは、互いに通信しないが、単にデータをメモリへエンコーディングし、及び／又は、メモリからデータを取得及びデコーディングするデバイスにより実行される。

【0358】

説明の便宜上、本発明の実施形態は、例えば、高効率ビデオコーディング（ＨＥＶＣ）又はバーサタイルビデオコーディング（ＶＶＣ）の参照ソフトウェア、ＩＴＵ－Ｔビデオコーディングエキスパートグループ（ＶＣＥＧ）及びＩＳＯ／ＩＥＣモーションピクチャエキスパートグループ（ＭＰＥＧ）のビデオコーディングに関するジョイントコラボレーションチーム（ＪＣＴ－ＶＣ）によって開発された次世代ビデオコーディング規格を参照することによって、本明細書に記載される。当業者であれば、本発明の実施形態がＨＥＶＣ又はＶＶＣに限定されないことを理解するであろう。

【0359】

図２１は、本開示の実施形態に係るビデオコーディングデバイス４００の概略図である。ビデオコーディングデバイス４００は、本明細書において説明される本開示の実施形態を実装するのに好適である。実施形態において、ビデオコーディングデバイス４００は、図１９のビデオデコーダ３０などのデコーダ又は図１９のビデオエンコーダ２０などのエンコーダであり得る。

【0360】

ビデオコーディングデバイス４００は、データを受信するための入口ポート４１０（又は、入力ポート４１０）及び受信器ユニット（Ｒｘ）４２０と、データを処理するためのプロセッサ、ロジックユニット、又は中央処理装置（ＣＰＵ）４３０と、データを送信するための送信器ユニット（Ｔｘ）４４０及び出口ポート４５０（又は出力ポート４５０）と、データを保存するためのメモリ４６０とを備える。ビデオコーディングデバイス４００は、光信号又は電気信号の出口又は入口のために、入口ポート４１０、受信器ユニット４２０、送信器ユニット４４０及び出口ポート４５０に結合された光／電気（ＯＥ）コンポーネント及び電気／光（ＥＯ）コンポーネントも備え得る。

【0361】

プロセッサ４３０は、ハードウェア及びソフトウェアによって実装される。プロセッサ４３０は、１又は複数のＣＰＵチップ、（例えば、マルチコアプロセッサとしての）コア、ＦＰＧＡ、ＡＳＩＣ及びＤＳＰとして実装され得る。プロセッサ４３０は、入口ポート４１０、受信器ユニット４２０、送信器ユニット４４０、出口ポート４５０、及びメモリ４６０と通信する。プロセッサ４３０は、コーディングモジュール４７０を含む。コーディングモジュール４７０は、上述の開示される実施形態を実装する。例えば、コーディングモジュール４７０は、様々なコーディング操作を実装、処理、準備又は提供する。したがって、コーディングモジュール４７０を含むことで、ビデオコーディングデバイス４００の機能に対する実質的な改善が提供され、ビデオコーディングデバイス４００の異なる状態への変換をもたらす。代替的に、コーディングモジュール４７０は、メモリ４６０に格納されてプロセッサ４３０により実行される命令として実装される。

【0362】

メモリ４６０は、１又は複数のディスク、テープドライブ、及びソリッドステートドライブを備えてよく、プログラムが実行のために選択された場合に係るプログラムを保存するとともに、プログラムの実行中に読み取られる命令及びデータを保存するために、オーバフローデータストレージデバイスとして使用されてよい。メモリ４６０は例えば、揮発性及び／又は非揮発性であり得、リードオンリメモリ（ＲＯＭ）、ランダムアクセスメモリ（ＲＡＭ）、三値連想メモリ（ＴＣＡＭ）、及び／又は、スタティックランダムアクセスメモリ（ＳＲＡＭ）であり得る。

【0363】

図２２は、例示的な実施形態に従って、図１９からのソースデバイス１２及びデスティネーションデバイス１４のいずれか又は両方として使用され得る装置５００の簡略的なブロック図である。

【0364】

装置５００におけるプロセッサ５０２は、中央処理装置とすることができる。代替的に、プロセッサ５０２は、現存するか又は今後開発される、情報を操作又は処理できる任意の他のタイプのデバイス又は複数のデバイスであってよい。開示される実装は、示されているような単一のプロセッサ、例えばプロセッサ５０２を用いて実施され得るが、速度及び効率上の利点は、１つよりも多くのプロセッサを用いて実現され得る。

【0365】

装置５００におけるメモリ５０４は、実装において、リードオンリメモリ（ＲＯＭ）デバイス又はランダムアクセスメモリ（ＲＡＭ）デバイスとすることができる。任意の他の好適なタイプのストレージデバイスが、メモリ５０４として用いられ得る。メモリ５０４は、バス５１２を用いてプロセッサ５０２によりアクセスされるコード及びデータ５０６を含み得る。メモリ５０４は、オペレーティングシステム５０８及びアプリケーションプログラム５１０を更に含んでよく、アプリケーションプログラム５１０は、本明細書において説明される方法をプロセッサ５０２が実行することを可能にする少なくとも１つのプログラムを含む。例えば、アプリケーションプログラム５１０は、上で説明された算術コーディングを使用してエンコーディング及びデコーディングすることを含む、本明細書に説明される方法を実行するビデオコーディングアプリケーションを更に含むアプリケーション１～Ｎを含み得る。

【0366】

装置５００は、ディスプレイ５１８等の、１又は複数の出力デバイスも備えることができる。ディスプレイ５１８は、一例において、ディスプレイと、タッチ入力を検知するように動作可能なタッチセンサ式要素とを組み合わせたタッチセンサ式ディスプレイであってよい。ディスプレイ５１８は、バス５１２を介してプロセッサ５０２に結合され得る。

【0367】

単一のバスとして本明細書に示したが、装置５００のバス５１２は、複数のバスから構成することができる。更に、セカンダリストレージ５１４は、装置５００の他のコンポーネントに直接的に結合されてもよく、ネットワークを介してアクセスされてもよく、メモリカードなどの単一の統合されたユニット又は複数のメモリカードなどの複数のユニットを備えてよい。従って、装置５００は、多種多様な構成で実装することができる。

【0368】

本発明の実施形態は主にビデオコーディングに基づいて説明されてきたが、コーディングシステム１０、エンコーダ２０、及びデコーダ３０（及びそれに対応してシステム１０）の実施形態ならびに本明細書に記載の他の実施形態はまた、静止画像処理又はコーディング、すなわち、ビデオコーディングのようにいずれかの先行する又は連続する画像とは無関係の個々の画像の処理又はコーディングのために構成され得ることに留意されたい。一般的に、画像処理コーディングが単一の画像１７に限定される場合、インター予測ユニット２４４（エンコーダ）及び３４４（デコーダ）のみが利用可能ではないことがある。ビデオエンコーダ２０及びビデオデコーダ３０の全ての他の機能（ツール又は技術とも称される）は、静止画像処理、例えば、残差計算２０４／３０４、変換２０６、量子化２０８、逆量子化２１０／３１０、（逆）変換２１２／３１２、区分化２６２／３６２、イントラ予測２５４／３５４、及び／又はループフィルタリング２２０、３２０ならびにエントロピーコーディング２７０及びエントロピーデコーディング３０４に等しく用いられ得る。

【0369】

例えばエンコーダ２０及びデコーダ３０の実施形態、並びに、例えばエンコーダ２０及びデコーダ３０を参照して本明細書に記載された機能は、ハードウェア、ソフトウェア、ファームウェア、又はそれらの任意の組み合わせで実装されてよい。ソフトウェアに実装される場合、これらの機能は、コンピュータ可読媒体に格納されてもよく、通信媒体を介して１又は複数の命令又はコードとして送信され、ハードウェアベース処理ユニットにより実行されてもよい。コンピュータ可読媒体は、データ記憶媒体などの有形の媒体に対応するコンピュータ可読記憶媒体、又は、例えば通信プロトコルに従った、１つの場所から別の場所へのコンピュータプログラムの転送を容易にする任意の媒体を含む通信媒体を含み得る。このように、コンピュータ可読媒体は、一般に、（１）非一時的な有形コンピュータ可読記憶媒体、又は、（２）信号又は搬送波等の通信媒体に対応してよい。データ記憶媒体は、本開示において説明された技法の実装のための命令、コード及び／又はデータ構造を取得するために１又は複数のコンピュータ又は１又は複数のプロセッサによりアクセスされ得る任意の利用可能な媒体であってよい。コンピュータプログラム製品は、コンピュータ可読媒体を含み得る。

【0370】

限定ではなく例として、そのようなコンピュータ可読記憶媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ、ＣＤ－ＲＯＭ又は他の光ディスクストレージ、磁気ディスクストレージ、又は他の磁気ストレージデバイス、フラッシュメモリ、又は命令又はデータ構造の形態で所望のプログラムコードを格納するために使用することができ、コンピュータによってアクセスすることができる任意の他の媒体を含むことができる。また、任意の接続が、適宜コンピュータ可読媒体と称される。例えば、同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者線（ＤＳＬ）、又は赤外線、電波及びマイクロ波などの無線技術を用いて、ウェブサイト、サーバ又は他のリモートソースから命令が送信される場合、同軸ケーブル、光ファイバケーブル、ツイストペア、ＤＳＬ、又は赤外線、電波及びマイクロ波などの無線技術は、媒体の定義に含まれる。しかしながら、コンピュータ可読記憶媒体及びデータ記憶媒体は、接続、搬送波、信号又は他の一時的媒体を含まないが、代わりに、非一時的な有形のストレージ媒体を対象とすることを理解されたい。本明細書において用いられるようなディスク（ｄｉｓｋ及びｄｉｓｃ）は、コンパクトディスク（ＣＤ）、レーザディスク、光ディスク、デジタル多用途ディスク（ＤＶＤ）、フロッピーディスク及びブルーレイディスクを含み、ディスク（ｄｉｓｋ）は通常、データを磁気的に再現するが、ディスク（ｄｉｓｃ）は、データをレーザで光学的に再現する。上記のものの組み合わせも、コンピュータ可読媒体の範囲内に含まれるべきである。

【0371】

命令は、１又は複数のデジタル信号プロセッサ（ＤＳＰ）、汎用マイクロプロセッサ、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルロジックアレイ（ＦＰＧＡ）、又は他の等価な集積又はディスクリート論理回路等の、１又は複数のプロセッサによって実行されてよい。したがって、本明細書において用いられる「プロセッサ」という用語は、前述の構造のいずれか、又は本明細書において説明された技法の実装に好適な任意の他の構造を指し得る。加えて、いくつかの態様では、本明細書において説明された機能は、エンコーディング及びデコーディングのために構成された専用のハードウェアモジュール及び／又はソフトウェアモジュール内で提供されてもよく、又は、組み合わされたコーデックに組み込まれてもよい。また、本技法は、１又は複数の回路又はロジック要素において完全に実装することができる。

【0372】

本開示の技法は、無線ハンドセット、集積回路（ＩＣ）又はＩＣのセット（例えば、チップセット）を含む、多種多様なデバイス又は装置において実装してよい。様々なコンポーネント、モジュール又はユニットが、開示されている技法を実行するように構成されたデバイスの機能態様を強調するために本開示において説明されているが、異なるハードウェアユニットによる実現を必ずしも必要としない。むしろ、上述したように、好適なソフトウェア及び／又はファームウェアと連動して、様々なユニットがコーデックハードウェアユニットにして組み合わされるか、又は、上述したように、１又は複数のプロセッサを含む相互運用ハードウェアユニットの集合によって提供されてよい。
（他の可能な項目）
（項目１）
入力データをビットストリーム（１７５０）に算術エンコーディングするための方法であって、
前記入力データをコーディング済みビット（１７３０～１７３１）及び末尾ビットに算術エンコーディングする段階；
前記ビットストリーム（１７５０）に前記コーディング済みビット（１７３０～１７３１）を含める段階（Ｓ９４０）；
算術エンコーディングされた前記入力データの区間の最小値（１６１０）及び最大値（１６３０）を決定する段階（Ｓ９６０）；
連続する末尾ビットであり、
決定された前記最大値（１６３０）を表す第１最上位ビットＭＳＢ内において、決定された前記最小値（１６１０）を表す第２ＭＳＢ内と同一の値を有する
先行末尾ビットの量を決定する段階（Ｓ９７０）；及び
前記先行末尾ビットの決定された前記量の指示（１７２０～１７２１）、及び
前記先行末尾ビット（１７４０～１７４１）
を前記ビットストリーム（１７５０）に含める段階（Ｓ９８０）
を備える方法。
（項目２）
前記先行末尾ビット（１７４０～１７４１）の前記量、ＮｕｍＴｒａｉｌｉｎｇＢｉｔｓが、
ＮｕｍＴｒａｉｌｉｎｇＢｉｔｓ＝ＣＬＺ（（ＬＯＷ＋ＲＡＮＧＥ－１）ＸＯＲＬＯＷ）
によって決定され、
ＣＬＺ（）は、先行０の数であり、ＬＯＷは、前記区間の前記最小値（１６１０）であり、ＲＡＮＧＥは、前記区間のレンジ（１６２０）である、
項目１に記載の方法。
（項目３）
前記先行末尾ビットの前記量の前記指示（１７２０～１７２１）は、前記ビットストリーム内において、前記コーディング済みビット（１７３０～１７３１）及び前記先行末尾ビット（１７４０～１７４１）に先行する、項目１または２に記載の方法。
（項目４）
前記ビットストリームに含める前記段階の前に、前記先行末尾ビット（１６６０）に対して、１の値を有する１ビット（１６７０）がポストペンドされる、項目１から３のいずれか一項に記載の方法。
（項目５）
算術エンコーディングする前記段階、区間の最小値及び最大値を決定する前記段階（Ｓ９６０）、及び、先行末尾ビットの量を決定する前記段階（Ｓ９７０）は、第１サブストリーム及び第２サブストリームについて別個に実行され、結果として、第１コーディング済みビット（１７３０）、第２コーディング済みビット（１７３１）、第１先行末尾ビット（１７４０）、及び第２先行末尾ビット（１７４１）を生じさせ；
前記方法は、前記第１先行末尾ビット（１７４０）及び前記第２先行末尾ビット（１７４１）が後に続く前記第１コーディング済みビット（１７３０）及び前記第２コーディング済みビット（１７３１）を前記ビットストリームに挿入する段階を備える、
項目１から４のいずれか一項に記載の方法。
（項目６）
前記第１コーディング済みビット（１７３０）の長さを示す第１長さ指示（１７１０）、及び、前記第２コーディング済みビット（１３１）の長さを示す第２長さ指示（１７１１）と共に、前記第１コーディング済みビット（１７３０）及び前記第２コーディング済みビット（１７３１）を前記ビットストリーム（１７５０）に多重化する段階を更に備える、項目５に記載の方法。
（項目７）
前記第１長さ指示（１７１０）は、前記ビットストリーム（１７５０）内において、前記第１コーディング済みビット（１７３０）に先行し、
前記第２長さ指示（１７１１）は、前記ビットストリーム（１７５０）内において、前記第２コーディング済みビット（１７３１）に先行する、
項目６に記載の方法。
（項目８）
前記第２長さ指示（１７１１）は、前記ビットストリーム（１７５０）内において前記第１コーディング済みビット（１７３０）に先行する、項目７に記載の方法。
（項目９）
前記第２先行末尾ビットの前記量の前記指示（１７２１）は、前記ビットストリーム（１７５０）内において、前記第１コーディング済みビット（１７３０）に先行する、項目８に記載の方法。
（項目１０）
ビットストリーム長をバイトの予め定められた量の整数倍と一致させるようにアラインするために、予め定められた値を有するビットで、前記第１コーディング済みビット（１７３０）、前記第２コーディング済みビット（１７３１）、前記第１先行末尾ビット（１７４０）、及び、前記第２先行末尾ビット（１７４１）を含む前記ビットストリーム（１７５０）をパディングする段階を更に備える、項目５から９のいずれか一項に記載の方法。
（項目１１）
前記算術エンコーディングは、第１算術エンコーダを用いて前記第１サブストリームをエンコーディングすること、及び、第２算術エンコーダを用いて前記第２サブストリームをエンコーディングすることを含み、
前記第１算術エンコーダ及び前記第２算術エンコーダを用いる前記算術エンコーディングは、少なくとも部分的に並列に実行される、
項目５から１０のいずれか一項に記載の方法。
（項目１２）
前記算術エンコーディングはレンジエンコーディングである、項目１から１１のいずれか一項に記載の方法。
（項目１３）
前記算術エンコーディングの間に、前記区間の現在の最小値（７２０ａ～ｄ）及び前記現在の最大値（７１０ａ～ｄ）が予め構成されたサイズのメモリに格納され；
前記コーディング済みビットを前記ビットストリームに含める前記段階は、安定ビット（７３０）のうちのビットの予め定義された量を前記メモリから前記ビットストリームに移動させる段階を含み；
前記安定ビット（７３０）は、前記現在の最小値（７２０ａ～ｄ）及び前記現在の最大値（７１０ａ～ｄ）の２進表現のＭＳＢにおいて同一の値を有する連続ビットである、
項目１１に記載の方法。
（項目１４）
前記算術エンコーディングの間に、前記先行末尾ビットの量、及び、前記安定ビット（７３０）のうちのビットの予め定義された量の間の差が、予め定義された閾値より下である場合に；
末尾コーディング済みビットは、前記安定ビット（７３０）のうちのビットの予め定義された量まで０が後に続く、１の値を有する１ビット（１６７０）をポストペンドすることによって、前記先行末尾ビット（１６６０）から生成され；
前記末尾コーディング済みビットは、前記コーディング済みビットを前記ビットストリームに含める前記段階の前に、前記コーディング済みビットに含められ；
０の先行末尾ビットの指示が前記ビットストリームに含められる、
項目１３に記載の方法。
（項目１５）
ビットストリーム（１７５０）からデータを算術デコーディングするための方法であって、
先行末尾ビットの量の指示（１７２０～１７２１）を前記ビットストリーム（１７５０）から抽出する段階（Ｓ１０３０）；
複数のコーディング済みビット（１７３０～１７３１）を前記ビットストリーム（１７５０）から抽出する段階（Ｓ１０４０）；
抽出された、前記先行末尾ビットの前記量の前記指示（１７２０～１７２１）によって指定された前記先行末尾ビット（１７４０～１７４１）を前記ビットストリーム（１７５０）から抽出する段階（Ｓ１０７０）；
抽出された前記先行末尾ビットに、前記末尾ビットの予め定められた最大長までの０をポストペンドする段階を含む、末尾ビットを決定する段階（Ｓ１０８０）；及び
前記コーディング済みビット及び決定された前記末尾ビットを含むビットによって表されるコーディング済みの値を算術デコーディングすることにより、前記データを取得する段階
を備える方法。
（項目１６）
前記末尾ビット（１６５０）を決定する前記段階は、前記末尾ビットの前記予め定められた最大長までの０（１６５０）が後に続く、１の値を有する１ビット（１６７０）で、抽出された前記先行末尾ビットにポストペンドすることから成る、項目１５に記載の方法。
（項目１７）
前記先行末尾ビットの前記量の前記指示（１７２０～１７２１）は、前記ビットストリーム（１７５０）内において、前記コーディング済みビット（１７３０～１７３１）及び前記先行末尾ビット（１７４０～１７４１）に先行する、項目１５または１６に記載の方法。
（項目１８）
前記方法は、第１先行末尾ビット（１７４０）及び第２先行末尾ビット（１７４１）が後に続く第１コーディング済みビット（１７３０）及び第２コーディング済みビット（１７３１）を前記ビットストリーム（１７５０）から抽出する段階を備え、
前記第１コーディング済みビット（１７３０）及び前記第１先行末尾ビット（１７４０）は第１サブストリームを形成し、
前記第２コーディング済みビット（１７３１）及び前記第２先行末尾ビット（１７４１）は第２サブストリームを形成し；
前記第１サブストリームについて第１末尾ビットを決定し、
前記第２サブストリームについて第２末尾ビットを決定し、
前記第１コーディング済みビット及び決定された前記第１末尾ビットを含む第１ビットによって表される第１のコーディング済みの値を算術デコーディングし；
前記第２コーディング済みビット及び決定された前記第２末尾ビットを含む第２ビットによって表される第２のコーディング済みの値を算術デコーディングする、
項目１５から１７のいずれかに記載の方法。
（項目１９）
前記第１コーディング済みビットの長さを示す第１長さ指示（１７１０）、及び、前記第２コーディング済みビットの長さを示す第２長さ指示（１７１１）と共に、前記第１コーディング済みビット（１７３０）及び前記第２コーディング済みビット（１７３１）を前記ビットストリーム（１７５０）から抽出する段階を更に備える、項目１８に記載の方法。
（項目２０）
前記第１長さ指示（１７１０）は、前記ビットストリーム内において前記第１コーディング済みビット（１７３０）に先行し、
前記第２長さ指示（１７１１）は、前記ビットストリーム内において前記第２コーディング済みビット（１７３１）に先行する、
項目１９に記載の方法。
（項目２１）
前記第２長さ指示（１７１１）は、前記ビットストリーム（１７５０）内において前記第１コーディング済みビット（１７３０）に先行する、項目２０に記載の方法。
（項目２２）
前記第２先行末尾（１７１２）ビットの前記量の前記指示は、前記ビットストリーム（１７５０）内において前記第１コーディング済みビット（１７３０）に先行する、項目２１に記載の方法。
（項目２３）
前記第１コーディング済みビット（１７３０）、前記第２コーディング済みビット（１７３１）、前記第１先行末尾ビット（１７４０）、及び前記第２先行末尾ビット（１７４１）を抽出した後に、前記ビットストリーム（１７５０）の残りのビットを破棄する段階を更に備える、項目１８から２２のいずれか一項に記載の方法。
（項目２４）
前記算術デコーディングは、第１算術デコーダを用いて前記第１サブストリームをデコーディングすること、及び、第２算術デコーダを用いて前記第２サブストリームをデコーディングすることを含み、
前記第１算術デコーダ及び前記第２算術デコーダを用いる前記算術デコーディングは、少なくとも部分的に並列に実行される、
項目１８から２３のいずれか一項に記載の方法。
（項目２５）
前記算術デコーディングはレンジデコーディングである、項目１５から２４のいずれか一項に記載の方法。
（項目２６）
１又は複数のプロセッサ上で実行されるときに、項目１から２５のいずれか一項に記載の方法の段階を前記１又は複数のプロセッサに実行させるコード命令を含み、非一時的媒体に格納されるコンピュータプログラム。
（項目２７）
入力データをビットストリームに算術エンコーディングするための装置であって、
前記入力データをコーディング済みビット及び末尾ビットに算術エンコーディングすること；
前記コーディング済みビット（１７３０～１７３１）を前記ビットストリーム（１７５０）に含めること、
算術エンコーディングされた前記入力データの区間の最小値（１６１０）及び最大値（１６３０）を決定すること；
連続末尾ビットであり、
決定された前記最大値（１６３０）を表す第１ＭＳＢ内において、決定された前記最小値（１６１０）を表す第２ＭＳＢ内と同一の値を有する
先行末尾ビット（１７４０～１７４１）の量を決定すること；及び
前記先行末尾ビットの決定された前記量の指示（１７２０～１７２１）、及び、
前記先行末尾ビット（１７３０～１７３１）
を前記ビットストリーム（１７５０）に含めること
を行うよう構成されている処理回路を備える装置。
（項目２８）
ビットストリーム（１７５０）からデータを算術デコーディングするための装置であって、
先行末尾ビットの量の指示（１７２０～１７２１）を前記ビットストリーム（１７５０）から抽出すること；
複数のコーディング済みビット（１７３０～１７３１）を前記ビットストリーム（１７５０）から抽出すること；
抽出された前記先行末尾ビットの前記量の前記指示（１７２０～１７２１）によって指定される前記先行末尾ビット（１７４０～１７４１）を前記ビットストリーム（１７５０）から抽出すること；
抽出された前記先行末尾ビットに、前記末尾ビットの予め定められた最大長までの０を付加することを含む、末尾ビットを決定すること；
前記コーディング済みビット及び決定された前記末尾ビットを含むビットによって表されるコーディング済みの値を算術デコーディングすることによって、前記データを取得すること
を行うよう構成されている処理回路を備える装置。

【図1】