(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-09-02
(45)【発行日】2024-09-10
(54)【発明の名称】データを圧縮する方法および装置
(51)【国際特許分類】
H03M 7/30 20060101AFI20240903BHJP
H03M 7/40 20060101ALI20240903BHJP
G06F 12/04 20060101ALI20240903BHJP
G06F 9/34 20180101ALI20240903BHJP
【FI】
H03M7/30 Z
H03M7/40
G06F12/04 530
G06F9/34 350A
【外国語出願】
(21)【出願番号】P 2020030252
(22)【出願日】2020-02-26
【審査請求日】2022-12-26
(32)【優先日】2019-02-27
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】519410758
【氏名又は名称】モヴィディウス リミテッド
(74)【代理人】
【識別番号】100107766
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100091214
【氏名又は名称】大貫 進介
(72)【発明者】
【氏名】ヴァレンティナ リゴ
(72)【発明者】
【氏名】デヴィッド バーナード
(72)【発明者】
【氏名】ピーター マクグリン
【審査官】川口 貴裕
(56)【参考文献】
【文献】特開2018-061199(JP,A)
【文献】米国特許出願公開第2002/0097172(US,A1)
【文献】特開平11-284518(JP,A)
【文献】特開平05-344162(JP,A)
【文献】特開2001-045479(JP,A)
【文献】特開平08-107360(JP,A)
【文献】特開平10-232838(JP,A)
【文献】特開2004-200893(JP,A)
【文献】特開平07-212242(JP,A)
【文献】Xiaoke Qin et al.,Decoding-Aware Compression of FPGA Bitstreams,IEEE Transactions on Very Large Scale Integration (VLSI) Systems,2011年,Vol. 19, No. 3,pp. 411-419
(58)【調査した分野】(Int.Cl.,DB名)
H03M 3/00 - 9/00
G06F 12/04
G06F 9/34
IEEE Xplore
(57)【特許請求の範囲】
【請求項1】
メモリと、
データセットを複数のブロック
のデータに分割するデータスライサと、
データプロセッサであって、
前記ブロックのデータが同じ値に対応するかどうかを決定することと、
前記ブロックのデータが同じ値に対応すると決定することに応答して、第1の圧縮技術を使用して前記
ブロックを圧縮して第1の圧縮データブロックを生成する第1の圧縮器と、
前記ブロックのデータが同じ値に対応しないと決定することに応答して、第2の圧縮技術を使用して前記
ブロックを圧縮して第2の圧縮データブロックを生成する第2の圧縮器
であって、前記第2の圧縮データブロックが圧縮技術なしよりも多くのデータをもたらす場合に、前記第2の圧縮データブロックを破棄して、前記ブロックのデータを保持する第2の圧縮器と、
前記第1の圧縮技術を特定する第1のヘッダ
を生成し、前記第2の圧縮データブロックが破棄されているどうかに従って、前記第2の圧縮技術
又は圧縮技術なしを特定する第2のヘッダを生成するヘッダ生成器と、
前記
メモリに記憶される、前記第1のヘッダを伴う前記第1の圧縮データブロックおよび前記第2のヘッダを伴う前記第2の圧縮データブロック
又は前記第2のヘッダを伴う前記ブロックのデータを送信するインターフェースと、を含む装置。
【請求項2】
前記第1の圧縮技術は、
RLE圧縮技術
であり、前記第2の圧縮技術は、ハフマン圧縮技術である、請求項1に記載の装置。
【請求項3】
前記第
2の圧縮器は、前記第
2の圧縮データブロックを第
2の圧縮データのサブブロックに分割するものである、請求項1に記載の装置。
【請求項4】
前記第
2の圧縮データのサブブロックは、サイズが不均一である、請求項
3に記載の装置。
【請求項5】
前記サブブロックにパターンを追加することによって、該パターンで前記サブブロックをパッドする1つ以上のパッダをさらに含む、請求項
3に記載の装置。
【請求項6】
前
記ブロックは、サイズが均一である、請求項1に記載の装置。
【請求項7】
前記第1の圧縮器および前記第2の圧縮器は、前記第1の圧縮技術および前記第2の圧縮技術をそれぞれのブロックに対して並列に実行するものである、請求項1に記載の装置。
【請求項8】
実行されると、少なくとも機械に、
データセットを複数のブロック
のデータに分割し、
前記ブロックのデータが同じ値に対応するかどうかを決定し、
前記ブロックのデータが同じ値に対応すると決定することに応答して、第1の圧縮技術を使用して前記
ブロックを圧縮して第1の圧縮データブロックを生成し、
前記ブロックのデータが同じ値に対応しないと決定することに応答して、第2の圧縮技術を使用して前記
ブロックを圧縮して第2の圧縮データブロックを生成し、
前記第2の圧縮データブロックが圧縮技術なしよりも多くのデータをもたらす場合に、前記第2の圧縮データブロックを破棄して、前記ブロックのデータを保持し、
前記第1の圧縮技術を特定する第1のヘッダ
を生成し、前記第2の圧縮データブロックが破棄されているどうかに従って、前記第2の圧縮技術
又は圧縮技術なしを特定する第2のヘッダを生成し、
前記第1のヘッダを伴う前記第1の圧縮データブロックおよび前記第2のヘッダを伴う前記第2の圧縮データブロック
又は前記第2のヘッダを伴う前記ブロックのデータを
メモリに記憶する、
ことをさせる命令を含む
プログラム。
【請求項9】
前記第1の圧縮技術は、RLE圧縮技術
であり、前記第2の圧縮技術は、ハフマン圧縮技術である、請求項
8に記載の
プログラム。
【請求項10】
前記命令は、前記機械に、前記第
2の圧縮データブロックを第
2の圧縮データのサブブロックに分割させる、請求項
8に記載の
プログラム。
【請求項11】
前記第
2の圧縮データのサブブロックは、サイズが不均一である、請求項
10に記載の
プログラム。
【請求項12】
前記命令は、前記機械に、前記サブブロックにパターンを追加することによって、該パターンで前記サブブロックをパッドさせる、請求項
10に記載の
プログラム。
【請求項13】
前
記ブロックは、サイズが均一である、請求項
8に記載の
プログラム。
【請求項14】
前記命令は、前記機械に、前記第1の圧縮技術および前記第2の圧縮技術をそれぞれのブロックに対して並列に実行させる、請求項
8に記載の
プログラム。
【請求項15】
データセットを複数のブロック
のデータに分割することと、
前記ブロックのデータが同じ値に対応するかどうかを決定することと、
前記ブロックのデータが同じ値に対応すると決定することに応答して、第1の圧縮技術を使用して前記
ブロックを圧縮して第1の圧縮データブロックを生成することと、
前記ブロックのデータが同じ値に対応しないと決定することに応答して、第2の圧縮技術を使用して前記
ブロックを圧縮して第2の圧縮データブロックを生成すること
であって、前記第2の圧縮データブロックが圧縮技術なしよりも多くのデータをもたらす場合に、前記第2の圧縮データブロックを破棄して、前記ブロックのデータを保持することと、
前記第1の圧縮技術を特定する第1のヘッダ
を生成し、前記第2の圧縮データブロックが破棄されているどうかに従って、前記第2の圧縮技術
又は圧縮技術なしを特定する第2のヘッダを生成することと、
前記第1のヘッダを伴う前記第1の圧縮データブロックおよび前記第2のヘッダを伴う前記第2の圧縮データブロック
又は前記第2のヘッダを伴う前記ブロックのデータを
メモリに記憶することと、を含む方法。
【請求項16】
前記第1の圧縮技術は、
RLE圧縮技術
であり、第2の圧縮技術は、ハフマン圧縮技術である、請求項
15に記載の方法。
【請求項17】
前記第
2の圧縮データブロックを、第
2の圧縮データのサブブロックに分割することをさらに含む、請求項
15に記載の方法。
【請求項18】
前記第
2の圧縮データのサブブロックは、サイズが不均一である、請求項
17に記載の方法。
【請求項19】
前記サブブロックにパターンを追加することによって、該パターンで前記サブブロックをパッドすることをさらに含む、請求項
17に記載の方法。
【請求項20】
前
記ブロックは、サイズが均一である、請求項
15に記載の方法。
【請求項21】
前記第1の圧縮技術および前記第2の圧縮技術が、それぞれのブロックに対して並列に実行される、請求項
15に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
この開示は、概してプロセッサに関し、より詳細には、データを圧縮する方法および装置に関する。
【背景技術】
【0002】
近年、プロセッサチップ上に(例えば、オンチップで)実装されるハードウェアベースのニューラルネットワークが、種々のデータ処理システムにおいて人気が高まっている。ニューラルネットワークは、機械学習アルゴリズムが連帯して、大規模および/または複雑なデータを処理するためのフレームワークを提供する。いくつかの例では、ニューラルネットワークは、オンチップのニューラルネットワークの利用可能な容量を増大させるために、オフチップメモリ(例えば、プロセッサチップ外に位置するメモリ)に接続されている。
【図面の簡単な説明】
【0003】
【
図1】例示的なデータ圧縮器およびデータ伸長器を含む図のブロック実装である。
【
図2】
図1のデータ圧縮器およびデータ伸長器の例示的な実装のブロック図である。
【
図3】
図1および/または
図2の例示的なデータ圧縮器を実装してデータセットを圧縮するために実行され得る例示的な機械読み取り可能命令を表すフローチャートである。
【
図4】
図1および/または
図2の例示的なデータ圧縮器を実装してデータセットを圧縮するために実行され得る例示的な機械読み取り可能命令を表すフローチャートである。
【
図5】
図1および/または
図2の例示的なデータ伸長器を実行して圧縮データセットを伸長するために実行され得る例示的な機械読み取り可能命令を表すフローチャートである。
【
図6】
図1および/または
図2のデータ伸長器によって実行され得る例示的なデータ伸長プロセスを示す。
【
図7】
図1および/または
図2の例示的なデータ圧縮器を実装するために、
図3~
図4の命令を実行するように構成された例示的な処理プラットフォームのブロック図である。
【
図8】
図1および/または
図2の例示的なデータ伸長器を実装するために、
図5の命令を実行するように構成された例示的な処理プラットフォームのブロック図である。
【0004】
図面は縮尺通りではない。一般に、同一または類似の部分を参照するために図面および添付の発明を実施するための形態の全体を通じて、同一の参照番号を使用する。
【発明を実施するための形態】
【0005】
パーソナルコンピュータおよび/またはモバイルデバイスを含む典型的なコンピューティングシステムは、先進的な画像処理またはコンピュータビジョンアルゴリズムを採用して、人間の視覚が行うことができるタスクを自動化する。コンピュータビジョンタスクには、デジタル画像の取得、処理、分析、および/または理解が含まれる。このようなタスクは、部分的に、デジタル画像から寸法データを抽出し、数値情報および/または記号情報を生成することを容易にする。コンピュータビジョンアルゴリズムは、数値情報および/または記号情報を使用して、意思決定を行い、そうでなければ、とりわけ3次元(3-D)姿勢推定、イベント検出、オブジェクト認識、ビデオトラッキング等に関連する動作を実行する。したがって、拡張現実(AR)、仮想現実(VR)、ロボット工学および/または他の用途をサポートするためには、このようなタスクを迅速に(例えばリアルタイムまたはほぼリアルタイムで)かつ効率的に実行することが重要である。
【0006】
高度な画像処理またはコンピュータビジョンアルゴリズムは、ハードウェアアクセラレータおよび/または畳み込みニューラルネットワーク(CNNまたはConvNet)を採用することがある。ハードウェアアクセラレータは、汎用中央処理装置(CPU)によって実装されるソフトウェアよりも効率的に機能(例えば、画像の分類、画像のクラスタ化、オブジェクト認識の実行等)を実行するハードウェア構成要素である。CNNは、画像の分類、類似性による画像のクラスタ化(例えば、フォトサーチ)、および/または畳み込みを使用した画像内での物体認識の実行に使用できるディープ人工ニューラルネットワークである。本明細書で使用されるように、畳み込みは、一方の関数の形状が他方の関数の形状によってどのように修飾されるかを表現する積分によって、2つの与えられた関数から導出される関数であると定義される。したがって、CNNは、入力画像内の画像特徴の一致を特定するために、入力画像の画像特徴(例えば、水平線、2次元(2-D)形状等)に対応する1つ以上のフィルタの出力を通すことによって、入力画像に含まれる顔、個人、道路標識、動物等を特定するために使用され得る。
【0007】
いくつかのハードウェアアクセラレータおよび/またはCNNは制限されたメモリ容量を有する。したがって、プロセッサチップに配置されたこのようなハードウェアアクセラレータおよび/またはCNNは、メモリ(例えば、ダイナミックランダムアクセスメモリ(DRAM)のようなオフチップメモリ)に接続されてもよく、メモリハードウェアアクセラレータおよび/またはCNNの増加したデータ処理パワーをサポートする容量を増加させる。しかし、オフチップメモリからオンチップハードウェアアクセラレータおよび/またはCNNへのデータの転送は、限定された帯域幅に対応するボトルネック効果を生成し、ハードウェアアクセラレータおよび/またはCNNの処理パワーを制限する。いくつかの技術は、オンチップハードウェアアクセラレータおよび/またはCNNに移動される必要があるデータ量を低減する可逆圧縮技術(例えば、ハフマン圧縮)を使用して、オフチップメモリインターフェースの帯域幅要件を低減する。しかし、このような技術は、いくつかのハードウェアアクセラレータおよび/またはCNNが動作する周波数および/または復号器が動作する必要がある周波数とは互換性がない。
【0008】
本明細書で開示する例は、ハードウェアアクセラレータおよび/またはCNNの周波数と互換性のあるハードウェア伸長実装を可能にしながら、可逆符号化技術によって提供される帯域幅改善を最適化するためのオフチップデータ圧縮技術を含む。本明細書で開示する例は、オフチップメモリに格納されるデータをある数のデータのブロックに分割(例えば、グループ化)し、各ブロックのデータの特性に基づいてブロックごとに圧縮技術(例えば、ランレングス符号化、一部ハフマン符号化、無符号化、および/または任意の他の可逆圧縮技術)を適用することを含む。
【0009】
たとえば、ブロック内の全てのデータが同じ文字(例えば、全ての「0」、全ての「1」、全ての「a」)に対応する場合、本明細書で開示する実施例はRLE符号化を使用してブロックを圧縮する。RLE符号化は、全てのブロックデータを、元のブロックの文字数の情報を含むブロックの全ての値を表す単一の値に圧縮する可逆データ圧縮である。例えば、ブロックが16文字のデータブロックであり、各文字が「0」に対応する場合、RLE符号化は、データブロックの元のサイズを示す文字(例えば16)を含む16個の「0」の文字を表す単一の文字「0」にサブブロックを圧縮する。
【0010】
ブロック内のデータが全て同じ文字に対応するわけではない場合、本明細書に開示された実施例は、ハフマン技術(例えば、完全ハフマン技術または一部ハフマン技術)を実施してもよい。ハフマン技術は、可変長符号を入力文字に割り当てる可逆データ圧縮/符号化アルゴリズムであり、符号の長さは、対応する入力文字の周波数に基づいている。従って、ハフマン技術は、不均一な長さコードをもたらす。例えば、ブロックの頻度の高い文字は、ブロックの頻度の低い文字よりも短い長さコードに割り当てられる。従って、ハフマン技術は、繰り返し文字を備えたデータブロックのサイズを低減する。ハフマン符号化を適用するために、データセット内の各文字の出現頻度に基づいてハフマンツリーを生成する。データブロックの各文字は、ハフマンツリーに基づくコードに割り当てられる。ほとんどの場合、ハフマン符号化技術を使用してデータを符号化すると、可逆データ圧縮をもたらす。
【0011】
一部ハフマン符号化技術は、ハフマン符号化技術をプリセットされた文字数のみに適用し、残りの文字は非符号化のままとする。次いで、各文字は、符号化されたあるいは符号化されていないとしてマークまたはタグ付けされる。このようにして、復号時間は短縮され、ハフマン符号化データを復号するために必要とされるハフマンテーブルのサイズは縮小される。ハフマンテーブルのサイズを縮小すると、符号化データと共に復号器に送信される必要のあるデータ量が低減される。追加的に、ハフマンテーブルを縮小すると、復号速度を増加させるハードウェア解決を容易にする。本明細書に開示された実施例は、概して、一部ハフマン技術に対応する。しかし、完全ハフマン技術を代替的に使用することができる。
【0012】
追加的に、本明細書に開示された例は、ハフマン符号化データブロックを符号化データサブブロックに分割する。このような符号化データサブブロックは、各サブブロックの末端にプリセットされたコードを追加することによってパディングされ、オンチップ復号器は並列復号のためにサブブロックを分割することができ、それによって計算帯域幅を増加させることができる。いくつかの例では、ブロック内に繰り返し文字がほとんどないか、またはまったくないような場合に、一部ハフマン技術は、含まれるヘッダに対応するオーバーヘッド量のために、データブロックのサイズを縮小しないことがある。従って、本明細書で開示された例は、一部ハフマン技術がデータブロックのサイズを縮小しないブロックについては、いかなる圧縮/符号化技術も実行しない。
【0013】
本明細書に開示された例を用いて、ユーザは、より高い圧縮比を達成する特定のアプリケーションデータプロファイルに合わせた圧縮スキームを調整することができる。追加的に、本明細書に開示された例は、ハードウェアメモリ制限および速度要件と互換性があるように、ハフマン符号化ルックアップテーブルの要件を低減する。追加的に、本明細書に開示された例は、復号および/または符号並列化を可能にし、それによって高い復号帯域幅に対応する。
【0014】
図1は、例示的なオフチップ構成要素100および例示的なオンチップ構成要素102のブロック図である。例示的なオフチップ構成要素100は、データ/データセットを記憶する例示的なオフチップメモリ104と、ハードウェアベースの処理のために例示的なオンチップ構成要素102に送信する前に、例示的なオフチップメモリ104に記憶されたデータセットを圧縮するレジ的なデータ圧縮器106とを含む。例示的なオンチップ構成要素102は、圧縮データセットを伸長する例示的なデータ伸長器108と、データセットを処理する例示的なハードウェアアクセラレータ/ニューラルネットワークエンジン110とを含む。
図1の例示的なブロック図は、オフチップ構成要素100を含むが、例示的なオフチップメモリ104および/または例示的なデータ圧縮器106は、例示的なオンチップ構成要素102と同じチップに配置されてもよい(例えば、
図1の全ての構成要素が同じチップに配置されてもよい)。
【0015】
図1の例示的なオフチップ構成要素100は、ハードウェアアクセラレータ/ニューラルネットワーク110によって処理されるデータを記憶するオフチップメモリ104(例えば、DRAM)を含む。例示的なオフチップメモリ104は、ハードウェアアクセラレータ/ニューラルネットワーク110によって処理され得る追加データを記憶する追加メモリを提供することによって、例示的なハードウェアアクセラレータ/ニューラルネットワーク110のメモリ容量を増加させる。上述のように、オフチップメモリ104からハードウェアアクセラレータ/ニューラルネットワーク110へ非圧縮データを転送すると、オフチップメモリ104(例えばDRAM)の帯域幅制限によりボトルネックを生成する。従って、例示的なデータ圧縮器106は、オンチップ構成要素102に送信する前に、オフチップメモリ104に記憶され、かつ/あるいは既に記憶されているデータを圧縮して、データのサイズを縮小し、ボトルネックの問題を低減および/または除去する。例示的なデータ圧縮器106は、記憶されたデータをデータのブロックに分割し、ブロックのデータの特性に基づいて3つの圧縮/符号化技術を使用してデータを圧縮する。追加的に、例示的なデータ圧縮器106は、使用される圧縮/符号化技術を特定するブロックのヘッダ(例えば、第1のブロックに対する第1のヘッダ、第2のブロックに対する第2のヘッダ等)を生成し、例示的なデータ伸長器108がブロックを伸長するのに使用することができる情報(例えば、ブロックサイズ、符号化テーブル、サブブロックサイズ等)を提供する。このようにして、例示的なデータ伸長器108が圧縮データを適切に伸長することができる。圧縮されると、例示的なデータ圧縮器106は、例示的なオフチップメモリ104に圧縮データを記憶する。このようにして、オフチップメモリ104は、例示的なハードウェアアクセラレータ/ニューラルネットワーク110によって処理される圧縮データを送信することができる。いくつかの例では、データ圧縮器106は、複数のデータブロックを並列に圧縮する複数のプロセッサを含み、それによって計算帯域幅を増加させる。例示的なデータ圧縮器106は、
図2に関連して以下にさらに説明される。
【0016】
図1の例示的なオンチップ構成要素102は、オフチップ構成要素100とインターフェースで接続して、オフチップメモリ104から圧縮データを受信し、ハードウェアアクセラレータ/ニューラルネットワーク110に送信される前に圧縮データを伸長するデータ伸長器108を含む。いくつかの例では、データ伸長器108はハードウェアアクセラレータである。例示的なデータ伸長器108は、圧縮データを受信し、圧縮データのブロックのヘッダを特定して、圧縮技術を決定する。このようにして、データ伸長器108は、各ブロックのヘッダで特定された圧縮技術に基づいて圧縮されたブロックを伸長する。伸長されると、例示的なデータ伸長器108は、例示的なハードウェアアクセラレータ/ニューラルネットワーク110に伸長データを送信する。例示的なハードウェアアクセラレータ/ニューラルネットワーク110は、ハードウェアアクセラレータ/ニューラルネットワーク110の設定に基づいて伸長データを処理する。例示的なデータ伸長器108は、
図2に関連して以下にさらに説明する。
【0017】
図2は、例示的なデータ圧縮器106の実装例のブロック図と、
図1の例示的なデータ伸長器108の実装例のブロック図である。例示的なデータ圧縮器106は、例示的なメモリインターフェース200と、例示的なデータスライサ202と、例示的なデータプロセッサ204と、例示的な圧縮器206と、例示的なヘッダ生成器208と、例示的なパッダ210と、例示的な圧縮データアセンブラ212とを含む。例示的なデータ伸長器108は、例示的なオフチップインターフェース218と、例示的なヘッダプロセッサ220と、例示的なデータスプリッタ221と、例示的な伸長器222と、例示的な伸長データアセンブラ224と、例示的なハードウェアアクセラレータ/ニューラルネットワークインターフェース226とを含む。
【0018】
図2の例示的なメモリインターフェース200は、圧縮され、例示的なオンチップデータ伸長器108に送信されるデータを
図1の例示的なオフチップメモリ104から受信する。データ圧縮器106がデータを圧縮すると、
図2の例示的なメモリインターフェース200は、例示的なオフチップメモリ104に圧縮データを送信し、圧縮データが
図1のオンチップ構成要素102によって検索され得るようにする。
【0019】
メモリインターフェース200が例示的なオフチップメモリ104からデータを取得すると、例示的なデータスライサ202は、データをデータブロックに分割(例えばスライス)する。いくつかの例では、データスライサ202がデータを均一な固定サイズブロックに分割する。追加的に、データスライサ202が符号化データ(例えば、一部ハフマン圧縮を使用して符号化されたブロック)を符号化データサブブロックにスライスして、以下にさらに説明するように、例示的なデータ伸長器108の並列伸長処理を可能にしてもよい。いくつかの例では、データスライサ202は、2つのデータスライサを含む。例えば、元のデータをデータブロックに分割する第1のデータスライサと、ハフマン符号化データを符号化データサブブロックに分割する第2のデータスライサとがある。
【0020】
図2の例示的なデータプロセッサ204は、ブロックのデータの特性に基づいて、データブロックに使用する圧縮技術(例えば、RLE符号化、ハフマン符号化、符号化なし、および/または、任意の他の可逆圧縮技術)を決定(例えば、選択)する1つ以上のデータプロセッサである。例えば、データプロセッサ(複数可)204がブロックを取得する場合に、データプロセッサ204は、ブロックの全てのデータが同じ値および/または文字(例えば、全ての「0」、全て「1」、全て「a」等)に対応するかどうかを決定する。データプロセッサ204が、ブロックのデータは同じ値/文字に対応すると決定した場合、データプロセッサ204は、情報の損失なしにブロックを圧縮するために、RLE符号化技術がブロックに適用され得ると決定する。データプロセッサ204が、ブロックのデータは異なる値/文字に対応すると決定した場合、データプロセッサ204は、(例えば、一部または完全)ハフマン符号化または符号化なしがブロックに適用されるべきであると決定し得る。上述したように、ハフマン符号化技術をいくつかのブロックに適用すると、(例えば、ブロックが繰り返される値/文字をほとんどあるいは全く持たない場合に)より大きなデータ量をもたらすことがある。したがって、いくつかの例において、例示的なデータプロセッサ204がデータブロックを処理して、データブロックの一部ハフマン符号化技術は、より小さなあるいはより大きなデータ量をもたらすかどうかを決定してもよい。このような例において、例示的なデータプロセッサ204が、データブロックの一部ハフマン符号化が、(例えば、確率的モデリングを使用して)符号化なしよりも多くのデータをもたらすと決定した場合、データプロセッサ204は、符号化なしがデータブロックに適用されると決定する。他の例では、圧縮器206は、一部ハフマン符号化をデータに適用し、データプロセッサ204は、結果が、圧縮技術を適用しない場合(例えば、符号化なし)よりも大きいか小さいかを決定する。データプロセッサ204が、結果が圧縮技術を適用しない場合よりも大きいと決定した場合、データプロセッサ204は、ハフマン符号化データを破棄し、それによってデータブロックを非符号化のまま(例えば、非圧縮)にする。データプロセッサ204は、単一のデータプロセッサであってもよく、複数のデータプロセッサあってもよい。例えば、複数のデータプロセッサ204が、データブロックを並列に処理するために利用され得る。
【0021】
図2の例示的な圧縮器206は、データプロセッサ204によって選択された技術に基づいて、データブロックに対して圧縮技術(例えば、RLE符号化、ハフマン符号化、および/または任意の他の可逆圧縮技術)を実行する。上述のように、データプロセッサ204は、ブロックの全てのデータが同じ値および/または文字(例えば、全ての「0」、全ての「1」、全ての「a」等)に対応する場合に、RLE符号化を選択する。データプロセッサ204がデータブロックに対してRLEを選択する場合に、データプロセッサ204は、ヘッダ生成器208に、ブロックの繰り返し値および/または値の繰り返し数を特定するヘッダまたはデータパケットを生成するように指示する。例えば、ブロックが、各ビットが「1」に対応する8文字ブロックである場合、データプロセッサ204は、ヘッダ生成器208に、8文字の各々が「1」の値に対応し、「1」が8回繰り返されることの表示を特定するヘッダを生成するように指示する。
【0022】
図2のデータプロセッサ204がハフマン符号化または一部ハフマン符号化を選択する場合に、例示的な圧縮器206はハフマン符号化または一部ハフマン符号化をデータブロックに適用する。上述のように、ハフマン符号化を適用するために、ハフマンツリーがデータセットにおける各文字の出現頻度に基づいて生成される。ブロックのデータの各文字は、ハフマンツリーに基づいて符号に割り当てられる。ほとんどの場合、ハフマン符号化技術を使用してデータを符号化すると、可逆データ圧縮をもたらす。一部ハフマン符号化技術には、ハフマン符号化技術をプリセットされた文字数にだけ適用し、残りの文字は非符号化のままにすることが含まれ、それによって復号時間を短縮し、ハフマン符号化データを復号するのに必要なハフマンテーブルのサイズを縮小する。符号化データ内の文字の前には、その文字が符号化されているかどうかを特定するマーカーが付加される。いくつかの例では、データプロセッサ204は、ヘッダオーバヘッドとデータ圧縮との間のトレードオフを含めたハフマン符号化においてどれをプリセットされた文字にするか、かつ/あるいはいくつプリセットされた文字にするかを決定する。例えば、データプロセッサ204が、一部ハフマン技術は236個の可能な文字のうちの8文字のみに適用され得ると決定してもよい。従って、データプロセッサ204は、最も頻繁に繰り返されるデータのうちの8つの文字を決定し、圧縮器206は、8つの決定された文字を使用した一部ハフマン符号化を適用するために、8つの決定された文字に対してシンボルを適用する。一部ハフマン符号化技術を適用することにより、より高速な圧縮が可能となり、メモリ104は、ハフマン符号化技術を使用して圧縮されたブロックを伸長(例えば、復号)するために使用されるより小さなハフマンテーブルを送信することが可能となる。圧縮器206は、単一の圧縮器であってもよく、複数の圧縮器であってもよい。例えば、複数の圧縮器206が、データブロックを並列に符号化(例えば、圧縮)するために利用されてもよい。
【0023】
図2の例示的なヘッダ生成器208は、データのブロックを符号化および/または圧縮するために使用される、符号化および/または圧縮タイプ(例えば、RLE符号化、ハフマン符号化、符号化なし、および/または、任意の他の可逆圧縮技術)を特定するヘッダおよび/またはデータパケットを生成する。たとえば、ブロックの圧縮タイプがRLE圧縮である場合、ヘッダ生成器208はRLC圧縮並びにRLE圧縮に対応する繰り返し文字、およびその文字が繰り返しされる回数を特定するヘッダおよび/またはデータパケットを生成する。ブロックの圧縮タイプがハフマン圧縮または一部ハフマン圧縮である場合、ヘッダ生成器208は、ハフマン圧縮および/または一部ハフマン圧縮技術に対応するヘッダおよび/またはデータパケットを生成する。例えば、ヘッダ生成器208は、ブロックがハフマン符号化されていること、データを復号するテーブル、符号化データのサイズ、サブブロックのサイズ、および/またはサブブロックが符号化されているかどうかを示す文字マーカーを含むヘッダを生成してもよい。ブロックの圧縮タイプが符号化および/または圧縮されていない場合、例示的なヘッダ生成器208は、圧縮なしおよび/または符号化なしに対応すると共に、非符号化のデータのサイズに対応するヘッダおよび/またはデータパケットを生成する。例示的なヘッダ生成器208は、符号化または非符号化ブロックにヘッダおよび/またはデータパケットを追加する。このようにして、例示的なデータ伸長器108は、各ブロックに対してどの圧縮技術が使用されたかを特定し、圧縮技術に基づいて圧縮ブロックを伸長することができる。ヘッダ生成器208は、単一のヘッダ生成器であってもよく、複数のヘッダ生成器であってもよい。例えば、ヘッダ生成器208は、並列にデータのブロックに対するヘッダを生成するために利用され得る。
【0024】
ハフマン符号化または一部ハフマン符号化が、ブロックデータに適用されてハフマン符号化データを生成する場合、
図2の例示的なスライサ202は、ハフマン符号化データを、N個の符号化サブブロックに対応するプリセット数の符号化サブブロックにスライス(例えば、グループ化)する。例えば、符号化データが27ハフマン符号を含み、符号化サブブロックのプリセット数は9である場合、スライサ202は、各サブブロックに対して3ハフマン符号をグループ化する。符号化サブブロックのプリセット数は、データ伸長器108の並列プロセッサの数に基づいてもよい。このようにして、各並列プロセッサは、各符号化サブブロックまたはN個のサブブロックを並列に処理することができる。符号化サブブロックにスライスされると、例示的なパッダ210は、サブブロックの終わりを表す定義済みのコードパターンで個々のサブブロックをパッドする。上述するように、ハフマン符号は、長さが可変(例えば、不均一)である。例えば、第1の16ビットのサブブロックの第1のハフマン符号は8ビットの長さであってもよい一方で、第2の16ビットのサブブロックの第2のハフマン符号は10ビットの長さであってもよい。したがって、1つ以上のハフマン符号をグループ化することは、可変(例えば、不均一)長さ符号化サブブロックに対応する。したがって、パッダ210は、サブブロックの終わりに定義済みのコードを追加し、ヘッダ生成器208は、ヘッダにパディングされたサブブロックのサイズを含み、例示的なデータ伸長器108が、ヘッダで特定されているサイズに基づいて、個々の符号化サブブロックを分割して、並列復号を容易にするようにする。パッダ210は、単一のパッダであっても、複数のパッダあってもよい。例えば、パッダ210が、並列に符号化サブブロックにパッドするために利用されてもよい。
【0025】
図2の例示的な圧縮データアセンブラ212は、生成されたヘッダと共に順番にパディングされた符号化サブブロックをアセンブルして、データブロックのハフマン符号化を完了する。追加的に、例示的な圧縮データアセンブラ212は、符号化(例えば圧縮)または非符号化(例えば非圧縮)データブロックをアセンブルして、例示的なデータ伸長器108に送信される圧縮データ全体を生成する。いくつかの例において、データブロックが並列に処理されてもよい。したがって、圧縮データアセンブラ212は、データブロックが符号化の前に並べられたのと同じ順序で、符号化ブロックを組み立てることができるようにブロックをモニタする。
【0026】
図2の例示的なオフチップインターフェース218は、例示的なオフチップメモリ104から圧縮データを取得する。圧縮データが取得されると、例示的なヘッダプロセッサ220は圧縮データを処理して圧縮データのブロックのヘッダを特定する。上述のように、ヘッダは、圧縮データの各ブロックを圧縮するために使用された符号化技術を特定する情報を含む。したがって、ヘッダプロセッサ220は、データブロックの伸長のためのヘッダを特定することによって圧縮ブロックを分割することができる。
【0027】
図2の例示的な伸長器222は、対応する各ブロックのヘッド内で特定された対応する圧縮情報に基づいてデータブロックを伸長する。例えば、符号化データの第1のブロックの第1のヘッダがRLE圧縮に対応する場合、伸長器222は第1のヘッダを処理して、どの文字が繰り返されているかと、その文字が何回繰り返されるかを特定し、決定された繰り返された文字の数を伸長データアセンブラ224に渡す。回数は、プリセットされていてもよいし、ヘッダ内で特定されていてもよい。符号化データの第2のブロックの第2のヘッダが符号化なしに対応する場合、伸長器222は、ヘッダを削除し、そのデータを伸長(例えば復号)せずに非符号化データを伸長データアセンブラに渡す。符号化データの第3のブロックの第3のヘッダが(例えば、一部または完全)ハフマン符号化に対応する場合、伸長器222は、ハフマン符号に対応するブロックのヘッダからハフマンテーブルを使用して、符号化データの第3のブロックを伸長する。いくつかの例では、データスプリッタ221は、ヘッダ内で特定されるサブブロックサイズに基づいて、圧縮データ圧縮データのブロックをサブブロックに分割する。この点、各サブグループが、複数の伸長器222によって並列処理されることができる。伸長されると、伸長器222は、伸長サブブロックを例示的な伸長データアセンブラ224に渡す。
【0028】
図2の例示的な伸長データアセンブラ224は、復号サブブロックをアセンブルして、データブロックのハフマン復号を完了する。例えば、ハフマン符号化サブブロックを並列に復号する複数の伸長器222がある場合、伸長データアセンブラ224は、伸長サブブロックを並べて伸長ブロックデータを生成することができるように並列プロセッサをモニタする。追加的に、例示的な伸長データアセンブラ224は、復号(例えば伸長)データブロックをアセンブルして、例示的なハードウェアアクセラレータ/ニューラルネットワーク110に送信される伸長データ全体を生成する。いくつかの例では、データブロックは並列に処理される(例えば、伸長および/または復号される)。したがって、伸長データアセンブラ224は、データブロックが受信されたのと同じ順序で、復号ブロックをアセンブルすることができるようにブロックをモニタする。
図2のハードウェアアクセラレータ/ニューラルネットワークインターフェース226は、
図1のオンチップ構成要素102の例示的なハードウェアアクセラレータ/ニューラルネットワーク110にフルセットの伸長データを送信する。
【0029】
図2に、
図1の例示的なデータ圧縮器106および例示的なデータ伸長器108を実装する例示的な方法が示されているが、
図2に示された要素、プロセスおよび/またはデバイスのうちの1つ以上が、組み合わされ、分割され、再配置され、省略され、除去され、および/または他の方法で実装されてもよい。さらに、
図2の例示的なメモリインターフェース200、例示的なデータスライサ202、例示的なデータプロセッサ204、例示的な圧縮器206、例示的なヘッダ生成器208、例示的なパッダ210、例示的な圧縮データアセンブラ212、例示的なオフチップインターフェース218、例示的なヘッダプロセッサ220、例示的なデータスプリッタ221、例示的な伸長器222、例示的な伸長データアセンブラ224、例示的なハードウェアアクセラレータ/ニューラルネットワークインターフェース226、および/またはより一般的には、例示的なデータ圧縮器106および/または例示的なデータ伸長器108が、ハードウェア、ソフトウェア、ファームウェア、および/またはハードウェア、ソフトウェア、および/またはファームウェアの任意の組み合わせによって実装されてもよい。従って、例えば、
図2の例示的なメモリインターフェース200、例示的なデータスライサ202、例示的なデータプロセッサ204、例示的な圧縮器206、例示的なヘッダ生成器208、例示的なパッダ210、例示的な圧縮データアセンブラ212、例示的なオフチップインターフェース218、例示的なヘッダプロセッサ220、例示的なデータスプリッタ221、例示的な伸長器222、例示的な伸長データアセンブラ224、例示的なハードウェアアクセラレータ/ニューラルネットワークインターフェース226、および/またはより一般的には、例示的なデータ圧縮器106および/または例示的なデータ伸長器108は、1つ以上のアナログまたはデジタル回路、論理回路、プログラマブルプロセッサ、プログラマブルコントローラ、グラフィックス処理ユニット(GPU)、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、プログラマブル論理デバイス(PLD)、および/またはフィールドプログラマブル論理デバイス(FPLD)によって実現することができる。純粋にソフトウェアおよび/またはファームウェアの実装をカバーするために、この特許の装置またはシステムの請求項のいずれかを読むと、
図2の例示的なメモリインターフェース200、例示的なデータスライサ202、例示的なデータプロセッサ204、例示的な圧縮器206、例示的なヘッダ生成器208、例示的なパッダ210、例示的な圧縮データアセンブラ212、例示的なオフチップインターフェース218、例示的なヘッダプロセッサ220、例示的なデータスプリッタ221、例示的な伸長器222、例示的な伸長データアセンブラ224、例示的なハードウェアアクセラレータ/ニューラルネットワークインターフェース226、および/またはより一般的には、例示的なデータ圧縮器106および/または例示的なデータ伸長器108は、メモリ、デジタル多用途ディスク(DVD)、コンパクトディスク(CD)、ブルーレイ(登録商標)ディスク等、ソフトウェアおよび/またはファームウェアを含む非一時的なコンピュータ読み取り可能記憶デバイスまたは記憶ディスクを含むように本明細書に明確に定義されている。さらに、
図2の例示的なデータ圧縮器106および/またはデータ伸長器108が、
図2に示すものに加えて、あるいはその代わりに、1つ以上の要素、プロセスおよび/またはデバイスを含んでもよく、および/または図示の要素、プロセスおよびデバイスのいずれかまたは全てのうちの2つ以上を含んでもよい。本明細書で使用する「通信中」という語句は、その変形を含み、1つ以上の中間構成要素を介した直接的な通信および/または間接的な通信を包含し、直接的な物理的(例えば有線)通信および/または常時通信を必要とせず、むしろ、周期的な間隔、スケジュールされた間隔、非周期的な間隔、および/またはワンタイムイベントにおける選択的な通信を追加的に含む。
【0030】
図1および/または
図2の例示的なデータ圧縮器106を実装するための、例示的なハードウェア論理、機械読み取り可能命令、ハードウェア実装状態機械、および/またはそれらの任意の組み合わせを表すフローチャートを
図3~4に示す。
図1および/または
図2の例示的なデータ伸長器108を実装するための、例示的なハードウェア論理、機械読み取り可能命令、ハードウェア実装状態機械、および/またはそれらの任意の組み合わせを表すフローチャートを
図5に示す。機械読み取り可能命令が、
図7および/または
図8に関連して下記に論じる例示的なプロセッサプラットフォーム700、800に示されるプロセッサ712、812のようなコンピュータプロセッサによる実行のための実行可能プログラムまたは実行可能プログラムの一部であってもよい。プログラムが、CD-ROM、フロッピーディスク、ハードドライブ、DVD、ブルーレイディスク、プロセッサ712、812に関連付けられたメモリ等の非一時的なコンピュータ読み取り可能な記憶媒体に記憶されたソフトウェアで具体化されてよいが、プログラム全体および/またはその一部は、代替的に、プロセッサ712、812以外のデバイスによって実行され、かつ/あるいはファームウェアまたは専用ハードウェアで具体化することができる。さらに、例示的なプログラムが
図3~
図5に示すフローチャートを参照して説明されているが、
図2の例示的なデータ圧縮器106および/またはデータ伸長器108を実装する多くの他の方法が代替的に使用されてもよい。例えば、ブロックの実行順序が変更されてもよく、かつ/あるいは説明したブロックのいくつかが変更、削除、または組み合わせられてもよい。追加的または代替的に、ブロックの任意または全部が、ソフトウェアまたはファームウェアを実行することなく対応する動作を実行するように構成された1つ以上のハードウェア回路(例えば、離散および/または集積アナログおよび/またはデジタル回路、FPGA、ASIC、比較器、演算増幅器(op-amp)、論理回路など)によって実装されてもよい。
【0031】
上述したように、
図3~
図5の例示的なプロセスが、ハードディスクドライブ、フラッシュメモリ、読み出し専用メモリ、コンパクトディスク、デジタル汎用ディスク、キャッシュ、ランダムアクセスメモリ、および/または情報が任意の期間(例えば、長期間、永久的、短時間、一時的なバッファリング、および/または情報のキャッシュ)記憶される任意の他の記憶デバイスまたは記憶ディスク等の非一時的なコンピュータおよび/または機械読み取り可能媒体に記憶される実行可能な命令(例えば、コンピュータおよび/または機械読み取り可能な命令)を使用して実装されてもよい。本明細書で使用される非一時的なコンピュータ読み取り可能媒体という用語は、任意のタイプのコンピュータ読み取り可能記憶デバイスおよび/または記憶ディスクを含み、伝搬信号を排除し、伝送媒体を排除するように明確に定義される。
【0032】
本明細書において「含む(including)」および「含む(comprising)」(ならびにその全ての形式および時制)は、オープンエンドの用語として使用される。したがって、「含む(include)」または「含む(comprise)」のいずれかの形式(例えば、comprises、includes、comprising、including、having等)を請求項がプリアンブルとして、あるいは任意の種類の請求項の規定内に採用する場合にはいつでも、追加の要素、用語等が、対応する請求項または規定の範囲外に該当することなく存在してよいと理解されるべきである。本明細書で使用される、例えば、請求項のプリアンブルにおいて「少なくとも」という語句が移行句として使用される場合に、「含む(comprising)」および「含む(including)」という語句がオープンエンドであるのと同様に、オープンエンドである。A、B、および/またはCのような形式で「および/または」という用語が使用される場合には、(1)Aのみ、(2)Bのみ、(3)Cのみ、(4)AとB、(5)AとC、(6)BとC、(7)AとBとC等、A,B,Cの任意の組み合わせまたはサブセットを指す。
【0033】
図3は、
図1のオンチップ構成要素102に送信される前に、オフチップに記憶されたデータを圧縮する、
図1および/または
図2のデータ圧縮器106の例示的な実装によって実行され得る機械読み取り可能命令を表す例示的なフローチャート300である。
図3のフローチャート300は、
図1および/または
図2の例示的なデータ圧縮器106に関連して説明されているが、代わりに、他のタイプのデータ圧縮器および/または他のタイプのプロセッサが利用されてもよい。
図3の例示的なフローチャート300は、RLE圧縮、ハフマン圧縮、および/または圧縮なしに関連して説明されているが、他の圧縮技術が追加的または代替的に使用されてもよい。
【0034】
ブロック302において、例示的なデータスライサ202は、例示的なメモリインターフェースを介して、例示的なオフチップメモリ104からデータセットを取得する。データセットは、データセットのハードウェアベースの処理を実行する
図1の例示的なオンチップハードウェアアクセラレータ/ニューラルネットワーク110によって使用される例示的なオフチップメモリ104に記憶されるデータセットである。ブロック304において,データスライサ202は、データセットをN個のデータブロックに分割する。ブロックのサイズおよび/または数が、ユーザおよび/または製造業者の好みに基づいてもよい。N個のデータブロックは、サイズが均一であってもなくてもよい。ブロック306において、例示的なデータ圧縮器106は、
図4に関連して後述されるように、データブロックを圧縮する。
【0035】
ブロック308において、例示的な圧縮データアセンブラ212は、圧縮されたブロックをアセンブルして圧縮データセットを生成する。例えば、データ圧縮器106が順序通りにブロックを圧縮する場合、データアセンブラ212は、ブロックが圧縮された順序と同じ順序で圧縮ブロックを取り付ける。データ圧縮器106がブロックを順序通りではなく、あるいは並列に圧縮する場合、データアセンブラ212は、圧縮データブロックをデータセットからのデータと同じ順序で再アセンブルすることができるように圧縮をモニタする。ブロック310において、例示的なインターフェース202は、圧縮データセットを図のオフチップメモリ104に送信し、圧縮データとして記憶される。
【0036】
図4は、
図3に関連して上述したように、データのブロックを圧縮するために、
図1および/または
図2のデータ圧縮器106の例示的な実装によって実行され得る、例示的な機械読み取り可能命令の例示的なフローチャート306である。
図4のフローチャート306は、
図1および/または
図2の例示的なデータ圧縮器106に関連して説明されているが、代わりに、他のタイプのデータ圧縮器および/または他のタイプのプロセッサが使用されてもよい。
図4の例示的なフローチャート306は、(例えば、並列データスライサ202、データプロセッサ204、圧縮器206、ヘッダ生成器208、および/またはパッダ210によって)線形および/または並列に、データの複数のブロックに対して実行されてもよい。
図4の例示的なフローチャート306は、RLE圧縮、ハフマン圧縮、および/または、圧縮なしに関連して説明されているが、他の圧縮技術が追加的または代替的に使用されてもよい。
【0037】
データのNブロックの各々について(ブロック402~430)、例示的なデータプロセッサ204は、データブロックの全てのデータが同じ値および/または文字に対応するかどうかを決定する(ブロック404)。例えば、データブロックが全て「a」であるものを含む場合、例示的なデータプロセッサ204は、データブロックの全てのデータが同じ文字に対応すると決定する。
【0038】
例示的なデータプロセッサ204が、ブロックの全てのデータが同じ値および/または文字に対応すると決定した場合(ブロック404:YES)、例示的な圧縮器206は、ブロックのデータを符号化/圧縮するRLE圧縮技術を実行する(ブロック406)。例えば、圧縮器206が、ヘッダ生成器208に、その文字がデータのブロック内で繰り返される繰り返し文字および/またはその文字の繰り返し数を特定するデータパケットを生成するように指示してもよい。ブロック408において、例示的なヘッダ生成器208は、データブロックがRLE圧縮技術を用いて圧縮されたことを特定する圧縮データに含めるためのデータパケットおよび/またはヘッダを生成する。このようにして、例示的なデータ伸長器108は、ブロックをRLE圧縮に対応するものとして特定し、RLE伸長技術に基づいてブロックを伸長することができる。
【0039】
例示的なデータプロセッサ204が、ブロックのデータの全てが同じ値および/または文字に対応していないと決定した場合(ブロック404:NO)、例示的な圧縮器206は、一部ハフマン符号化技術を実行して、データブロックを符号化/圧縮する(ブロック412)。いくつかの例では、圧縮器206が、完全ハフマン符号化技術を実行してもよい。上述したように、ハフマン符号化を適用するために、例示的な圧縮器206は、データのセットにおける各文字の出現頻度に基づいてハフマンツリーを生成する。圧縮器206は、ハフマンツリーに基づいてブロックのデータの各文字にコードを割り当てる。ほとんどの場合、ハフマン符号化技術を用いてデータを符号化すると、無符号化よりもサイズが小さい可逆データ圧縮が生じる。一部ハフマン符号化技術を適用するために、例示的な圧縮器206は、ハフマン符号化技術をプリセットされた文字数にのみ適用し、残りの文字を非符号化のまま残し、それによって、符号化および/または復号時間を増加させ、ハフマン符号化データを復号するのに必要なハフマンテーブルのサイズを低減させる。追加的に、例示的な圧縮器206が、各文字を符号化または非符号化としてマークを付ける。
【0040】
ブロック414において、例示的なデータプロセッサ204は、符号化データおよびヘッダが、非符号化データよりも多くのビットに対応するかどうかを決定する。上述したように、ハフマンまたは一部ハフマン圧縮技術は、ブロック内の文字の繰り返しがほとんどあるいは全くないデータブロックについてはより多くのデータに対応することがある。いくつかの例において、データプロセッサ204が、ブロック内のデータの繰り返しに基づいて、ハフマン圧縮または一部ハフマン圧縮が、圧縮を実行する前(例えば、ブロック412の前)に、より多くのビットをもたらすかどうかを決定してもよい。
【0041】
例示的なデータプロセッサ204が符号化データおよびヘッダが、非符号化データよりも多くのビットに対応すると決定した場合(ブロック414:YES)、例示的なデータプロセッサ204は、符号化データを破棄する(ブロック416)。ブロック418において、例示的なヘッダ生成器208は、符号化なしに対応するヘッダを生成する。このようにして、例示的なデータ伸長器108は、ブロックのデータが非符号化および/または非圧縮と決定することができる。ブロック420において、例示的なヘッダ生成器208は、生成されたヘッダを伴ったブロックの非符号化データを例示的な圧縮データアセンブラ212に渡す。
【0042】
例示的なデータプロセッサ204が、符号化データは非符号化デーよりも多くのビットに対応していないと決定した場合(ブロック414:NO)、例示的なヘッダ生成器208は、ハフマンおよび/または一部ハフマン(PF)符号化に対応するヘッダを生成する(ブロック422)。このようにして、例示的なデータ伸長器108は、ハフマンおよび/またはPH圧縮に対応するブロックを特定し、ハフマンおよび/またはPH伸長技術に基づいてブロックを伸長する。ブロック424において、例示的なデータスライサ202は、符号化データを符号化サブブロックにスライス、分割および/またはグループ化する。サブブロックは、1つ以上のハフマン符号を含んでもよい。サブブロック当たりのハフマンコードの数は、プリセットされており、カスタマイズ可能であり、かつ/あるいはユーザおよび/または製造業者の好みに基づいてもよい。例えば、サブブロック当たりのハフマン符号の数は、例示的なデータ伸長器108における並列プロセッサの数に対応してもよく、それによって、データ伸長器108の処理能力を最適化する。
【0043】
ブロック424において、例示的なパッダ210は、定義済みのパターンを使用して符号化サブブロックをパッドする。上述のように、異なるハフマン符号が、符号化処理プロセスの結果として不均一(例えば、異なる)長さに対応してもよい。例えば、第1のハフマン符号が2ビットのデータであってもよく、第2のハフマン符号が4ビットのデータであってもよい。従って、スライスされたサブブロックのサイズが、不均一な(例えば、異なる)長さに対応することがある。したがって、例示的なパッダ210は、サブブロックの終わりに対応して定義済みのパターンで、符号化サブブロックの各々をパッドする。いくつかの例では、パディングは、各可変サイズのサブブロックが同じ長さ(例えば、選択された長さ)であることを保証する。このようにして、例示的なデータ伸長器108は、選択されたサブブロック長に基づいてサブブロックを分割することによって、並列伸長のために圧縮サブブロックを分割することができる。いくつかの例では、パディングされたサブブロックは異なる長さである。このような例では、データ伸長器108は、ヘッダ内の指定されたパディングに基づいて、符号化ブロックをサブブロックに分割する。ブロック428において、例示的なパッダ210は、
図2の例示的なオンチップ構成要素102を送信する前に、ヘッダを伴うパディングされたサブブロックを、アセンブルされるように例示的な圧縮データアセンブラ212に渡す。
【0044】
図5は、
図1の例示的なオフチップ構成要素100から圧縮データを伸長する
図1および/または
図2のデータ伸長器108の例示的な実装によって実行され得る例示的な機械読み取り可能命令を表す例示的なフローチャート500である。
図5のフローチャート500は、
図1および/または
図2の例示的なデータ伸長器108に関連して説明されているが、代わりに、他のタイプのデータ伸長器および/または他のタイプのプロセッサが利用されてもよい。フローチャート500が、圧縮ブロックの連続伸長に関連して説明されているが、フローチャートは、各ブロックが並列に処理される並列伸長プロセスに関連して使用されてよい。
【0045】
ブロック502において、例示的なヘッダプロセッサ220は、例示的なオフチップインターフェース218から圧縮データセットを取得する。圧縮データセットは、本明細書に開示された技術を使用して例示的なデータ圧縮器106によって圧縮された例示的なオフチップメモリ104に記憶されたデータに対応する。圧縮データブロックの各々について(ブロック504~530)(例えば、単一の伸長器222で順次処理される)、例示的なヘッダプロセッサ220は、データの符号化ブロックに対応する利用可能な圧縮ブロックのヘッダを特定する(ブロック506)。上述のように、データの圧縮中、各圧縮データブロックは、データブロックを圧縮するために使用される圧縮のタイプを特定するヘッダを含む。したがって、ブロック508において、例示的なヘッダプロセッサ220は、符号化ブロックのヘッダに基づいて圧縮および/または符号化タイプを決定する。
図5の例示的なフローチャート500は、RLE圧縮、ハフマン圧縮、および/または圧縮なしを使用して圧縮されたデータに関連して説明されているが、ヘッダは、追加的および/または代替的な圧縮技術に対応してもよい。このような実施例では、データ伸長器108は、このような付加的および/または代替的な圧縮技術に基づいてデータを伸長する。
【0046】
圧縮データブロックの各々について(ブロック508~530)(例えば、例示的なデータスプリッタ221によって分割され、単一の伸長器222によって順次処理される)の各々について、例示的な伸長器222は、圧縮タイプがRLE符号化および/または圧縮に対応するかどうか決定する(ブロック510)。例示的な伸長器222が、圧縮タイプはRLE符号化に対応すると決定した場合(ブロック510:YES)、例示的な伸長器222は、ヘッダ情報に基づいてデータを復号するためにRLE伸長を実行する(ブロック512)。例えば、ヘッダ情報がデータのブロックが16回繰り返された「a」に対応することを特定する場合、伸長器222は、データを伸長して16回繰り返された「a」を生成する。ブロック514において、例示的な伸長器222は、伸長データ(例えば、上記の例における16回繰り返された「a」)を例示的な伸長データアセンブラ224に渡す。
【0047】
例示的な伸長器222が、圧縮タイプはRLE符号化に対応していないと決定した場合(ブロック510:NO)、例示的な伸長器222は、圧縮タイプが非符号化データに対応するかどうかを決定する(ブロック516)。例示的な伸長器222が圧縮タイプは非符号化データに対応すると決定した場合(ブロック516:YES)、例示的な伸長器222は、非符号化データを伸長データアセンブラ224に渡す。例示的な伸長器222が、圧縮タイプは非符号化データに対応していないと決定した場合(ブロック516:NO)、例示的な伸長器222は、ヘッダにおいて特定されるサイズのサブブロックに基づいて、ハフマンまたは一部ハフマン符号化データブロックの符号化サブブロックを決定する(ブロック520)。上述したように、例示的なデータ圧縮器106は、データブロックのサブブロックの終わりを定義済みのエンドパターンでパッドする。このようにして、例示的な伸長器222は、ヘッダにおいて特定されたサブブロックサイズに基づいてブロックをサブブロックに分割することができる。
【0048】
各符号化サブブロックについて(ブロック520~528)(例えば、例示的なデータスプリッタ221によってサブブロックに分割され、単一の伸長器222を使用して線形に、あるいは複数の伸長器222を使用して並列に処理される)、例示的な伸長器222は、符号化サブブロックにブロック(例えば、一部または完全ハフマン)復号を実行する。例えば、伸長器222が、伸長データを表す文字にハフマン符号を対応させたハフマンテーブルを利用して、符号化としてマークが付けられた文字を伸長および/または復号し、非符号化としてマークが付けられた文字を変えないままにしてもよい。ブロック526において、例示的な伸長器222は、復号サブブロックを伸長データアセンブラ224に渡す。ブロック529において、例示的な伸長データアセンブラ224は、サブブロックを伸長ブロックにアセンブルする。
【0049】
ブロック532において、例示的な伸長データアセンブラ224は、例示的なオフチップメモリ104に記憶されたデータセットに対応する順序で、復号ブロックを伸長データセットにアセンブルする。ブロック534において、例示的なハードウェアアクセラレータ/ニューラルネットワークインターフェース226は、
図1のハードウェアアクセラレータ/ニューラルネットワーク110に伸長データセットを送信する。
【0050】
図6は、
図1および/または
図2の例示的なデータ圧縮器106を使用して、
図1の例示的なオフチップ構成要素100からのデータの例示的なデータ伸長プロセス600を示す。例示的な伸長プロセス600は、例示的なデータセット601、例示的なデータブロック602、例示的な決定ブロック604、614、例示的なRLE圧縮606、例示的なヘッダ608、616、620、例示的な圧縮データセット610、例示的な符号化ブロック612、例示的なハフマン圧縮613、例示的な符号化データブロック616、例示的な非符号化データブロック618、例示的な符号化ブロック622、例示的なスライシング624、例示的な符号化サブブロック626、および例示的なパディング628を含む。
【0051】
図6の例示的なデータセット601は、例示的なオフチップメモリ100に記憶されるデータに対応する。例示的なデータスライサ202は、例示的なデータブロック602を含む複数のデータブロックにデータセット601をスライスする。スライスされると、例示的なデータプロセッサ204は、決定ブロック604においてデータブロック602のデータの特性に基づいて符号化技術を選択する。データプロセッサ204が、ブロックの全てのデータは同じであると決定した場合、データプロセッサ204は、RLE圧縮606を選択して、データブロック602を圧縮する。データプロセッサ204が、ブロックの全てのデータは同じというわけではないと判断した場合、データプロセッサ204は、一部ハフマン圧縮(または完全ハフマン圧縮)613を選択する。
【0052】
RLE圧縮606が選択される場合、例示的なヘッダ生成器208は、RLE圧縮技術に対応する例示的なヘッダ608を生成し、データブロック内の全てのデータを表す値と、ヘッダにおいて特定された繰り返し数とを特定する。従って、例示的なヘッダ608は、圧縮データセット610内の符号化データブロック612として含まれる。一部ハフマン圧縮613が選択される場合、圧縮器206が一部ハフマン圧縮613を実行すると、データプロセッサ204は、符号化データおよびヘッダが閾値(例えば、非符号化データブロック602に対応するデータ量に対応する閾値)より大きいかどうかを決定する。データプロセッサ204が、符号化データおよび対応するヘッダは閾値より大きいと決定する場合、圧縮器206は符号化データブロックを破棄し、ヘッダ生成器208が符号化なしに対応する例示的なヘッダ616を生成し、圧縮データセット610の符号化ブロック612として非符号化データブロック602を伴うヘッダ616を含める。
【0053】
データプロセッサ204が、符号化データおよび対応するヘッダが閾値よりも小さいと決定した場合、例示的なヘッダ生成器208は、一部ハフマン圧縮613を特定する例示的なヘッダ620を生成する。追加的に、例示的なデータスライサ202は、例示的なスライシングブロック624においてハフマン符号化データ622をスライスして、符号化サブブロック626を生成する。符号化データサブブロック626は、不均一サイズであってもよいため(例えば、各データサブブロック626は、異なるサイズに対応してもよい)、例示的なパッダ210は、例示的なパディングブロック628において選択されたパターンで符号化データサブブロック626をパッドする。さらに、ヘッダ生成器208は、各サブブロックのサイズをヘッダに追加する。このようにして、例示的なデータ伸長器108は、特定されたサイズに基づいて、符号化ブロック612を例示的な符号化データサブブロック626に分割することができる。パディングされると、ヘッダ620、パディングされたサブブロックおよび対応するヘッダは、符号化ブロック612として、例示的な圧縮データセット610に含まれる。
【0054】
図7は、
図2の例示的なデータ圧縮器106を実装する
図3~4の命令を実行するように構成された例示的なプロセッサプラットフォーム700のブロック図である。プロセッサプラットフォーム700は、例えば、サーバ、パーソナルコンピュータ、ワークステーション、自己学習機械(例えばニューラルネットワーク)、モバイルデバイス(例えば、携帯電話、スマートフォン、iPad(登録商標)のようなタブレット)、または任意の他の種類のコンピューティングデバイスとすることができる。
【0055】
図示された例のプロセッサプラットフォーム700は、プロセッサ712を含む。図示された例のプロセッサ712は、ハードウェアである。例えば、プロセッサ712は、1つ以上の集積回路、論理回路、マイクロプロセッサ、GPU、DSP、または任意の所望のファミリーまたは製造業者のコントローラによって実装されることができる。ハードウェアプロセッサが半導体ベース(例えば、シリコンベース)デバイスであってもよい。この例では、プロセッサは、
図2の例示的なメモリインターフェース200、例示的なデータスライサ202、例示的なデータプロセッサ204、例示的な圧縮器206、例示的なヘッダ生成器208、例示的なパッダ210および/または例示的な圧縮データアセンブラ212を実装する。
【0056】
図示された例のプロセッサ712は、ローカルメモリ713(例えば、キャッシュ)を含む。いくつかの例では、ローカルメモリ713は、例示的な結果ストレージ218を実装する。図示された例のプロセッサ712は、バス718を介して、揮発性メモリ714および不揮発性メモリ716を含むメインメモリと通信している。揮発性メモリ714が、SDRAM(同期ダイナミック・ランダム・アクセス・メモリ)、DRAM(ダイナミック・ランダム・アクセス・メモリ)、RDRAM(登録商標)(RAMBUS(登録商標)ダイナミック・ランダム・アクセス・メモリ)および/または任意の他のタイプのランダムアクセスメモリデバイスによって実装されてもよい。不揮発性メモリ716が、フラッシュメモリおよび/または任意の他の所望のタイプのメモリデバイスによって実装されてもよい。メインメモリ714、716へのアクセスはメモリコントローラによって制御される。
【0057】
図示された例のプロセッサプラットフォーム700は、インターフェース回路720も含む。インターフェース回路720が、Ethernet(登録商標)インターフェース、ユニバーサルシリアルバス(USB)、Bluetooth(登録商標)インターフェース、近距離無線通信(NFC)インターフェースおよび/またはPCIエクスプレスインターフェース等、任意のタイプのインターフェース規格によって実装されてもよい。
【0058】
図示された例では、1つ以上の入力デバイス722がインターフェース回路720に接続されている。入力デバイス722は、ユーザがデータおよび/またはコマンドをプロセッサ712に入力することを可能にする。入力デバイスは、例えば、オーディオセンサ、マイクロホン、カメラ、(スチルまたはビデオ)キーボード、ボタン、マウス、タッチスクリーン、トラックパッド、トラックボール、アイソポイント、および/または音声認識システムによって実装されることができる。
【0059】
1つ以上の出力デバイス724も、図示された例のインターフェース回路720に接続されている。出力デバイス724は、例えば、ディスプレイデバイス(例えば、発光ダイオード(LED)、有機発光ダイオード(OLED)、液晶ディスプレイ(LCD)、陰極線管ディスプレイ(CRT)、IPS(in-place switching)ディスプレイ、タッチスクリーン等)、触覚出力デバイス、プリンタおよび/またはスピーカによって実装されることができる。したがって、図示された例のインターフェース回路720は、典型的には、グラフィックスドライバカード、グラフィックスドライバチップおよび/またはグラフィックスドライバプロセッサを含む。
【0060】
図示された例のインターフェース回路720は、送信機、受信機、トランシーバ、モデム、住宅用ゲートウェイ、無線アクセスポイント、ネットワークインターフェース、ネットワーク726を介して外部機械(例えば任意の種類の計算デバイス)とのデータの交換を容易にするネットワークインターフェース等の通信デバイスも含む。通信は、例えば、Ethernet接続、デジタル加入者回線(SDL)接続、電話回線接続、同軸ケーブルシステム、衛星システム、ラインオブサイト無線システム、セルラー電話システム等を介することができる。
【0061】
図示された例のプロセッサプラットフォーム700は、ソフトウェアおよび/またはデータを記憶するための1つ以上のマスストレージデバイス728も含む。このようなマスストレージデバイス728の例には、フロッピーディスクドライブ、ハードドライブディスク、コンパクトディスクドライブ、ブルーレイディスクドライブ、RAID(redundant array of independent disks)、およびデジタル多用途ディスク(DVD)ドライブが含まれる。
【0062】
図3~
図4の機械実行可能命令732は、大容量ストレージ72デバイス8内、揮発性メモリ714内、不揮発性メモリ716内、および/またはCD、DVD等のリムーバブル非一時的なコンピュータ読み取り可能記憶媒体上に記憶され得る。
【0063】
図8は、
図2の例示的なデータ圧縮器106を実施する
図5の命令を実行するように構成された例示的なプロセッサプラットフォーム800のブロック図である。プロセッサプラットフォーム800は、例えば、サーバ、パーソナルコンピュータ、ワークステーション、自己学習機械(例えば、ニューラルネットワーク)、モバイルデバイス(例えば、携帯電話、スマートフォン、iPadのようなタブレット)、または任意の他のタイプのコンピューティングデバイスとすることができる。
【0064】
図示された例のプロセッサプラットフォーム800は、プロセッサ812を含む。図示された例のプロセッサ812はハードウェアである。例えば、プロセッサ812は、1つ以上の集積回路、論理回路、マイクロプロセッサ、GPU、DSP、または任意の所望のファミリーまたは製造業者のコントローラによって実装されることができる。ハードウェアプロセッサが半導体ベース(例えばシリコンベース)デバイスであってもよい。この例では、プロセッサは、
図2の例示的なオフチップインターフェース218、例示的なヘッダプロセッサ220、例示的なデータスプリッタ221、例示的な伸長器222、例示的な伸長データアセンブラ224、および/または例示的なハードウェアアクセラレータ/ニューラルネットワークインターフェース226を実装する。
【0065】
図示された例のプロセッサ812は、ローカルメモリ813(例えば、キャッシュ)を含む。いくつかの例では、ローカルメモリ813は、例示的な結果ストレージ218を実装する。図示された例のプロセッサ812は、バス818を介して、揮発性メモリ814および不揮発性メモリ816を含むメインメモリと通信している。揮発性メモリ814が、SDRAM(同期ダイナミック・ランダム・アクセス・メモリ)、DRAM(ダイナミック・ランダム・アクセス・メモリ)、RDRAM(RAMBUSダイナミック・ランダム・アクセス・メモリ)および/または任意の他のタイプのランダムアクセスメモリデバイスによって実装されてもよい。不揮発性メモリ816が、フラッシュメモリおよび/または任意の他の所望のタイプのメモリデバイスによって実装されてもよい。メインメモリ814、816へのアクセスは、メモリコントローラによって制御される。
【0066】
図示された例のプロセッサプラットフォーム800は、インターフェース回路820も含む。インターフェース回路820が、Ethernetインターフェース、ユニバーサルシリアルバス(USB)、Bluetoothインターフェース、近距離無線通信(NFC)インターフェースおよび/またはPCIエクスプレスインターフェース等、任意のタイプのインターフェース規格によって実装されてもよい。
【0067】
図示された例では、1つ以上の入力デバイス822がインターフェース回路820に接続されている。入力デバイス822は、ユーザがデータおよび/またはコマンドをプロセッサ812に入力することを可能にする。入力デバイスは、例えば、オーディオセンサ、マイクロホン、カメラ(スチルまたはビデオ)、キーボード、ボタン、マウス、タッチスクリーン、トラックパッド、トラックボール、アイソポイント、および/または音声認識システムによって実装されることができる。
【0068】
1つ以上の出力デバイス824も、図示された例のインターフェース回路820に接続されている。出力デバイス824は、例えば、ディスプレイデバイス(例えば、発光ダイオード(LED)、有機発光ダイオード(OLED)、液晶ディスプレイ(LCD)、陰極線管ディスプレイ(CRT)、PS(in-place switching)ディスプレイ、タッチスクリーン等)、触覚出力デバイス、プリンタおよび/またはスピーカによって実装されることができる。したがって、図示された例のインターフェース回路820は、典型的には、グラフィックスドライバカード、グラフィックスドライバチップおよび/またはグラフィックスドライバプロセッサを含む。
【0069】
図示された例のインターフェース回路720は、送信機、受信機、トランシーバ、モデム、住宅用ゲートウェイ、無線アクセスポイント、ネットワークインターフェース、ネットワーク726を介して外部機械(例えば任意の種類の計算デバイス)とのデータの交換を容易にするネットワークインターフェース等の通信デバイスも含む。通信は、例えば、Ethernet接続、デジタル加入者回線(SDL)接続、電話回線接続、同軸ケーブルシステム、衛星システム、ラインオブサイト無線システム、セルラー電話システム等を介することができる。
【0070】
図示された例のプロセッサプラットフォーム800は、ソフトウェアおよび/またはデータを記憶するための1つ以上の大容量ストレージデバイス828も含む。このようなマスストレージデバイス728の例には、フロッピーディスクドライブ、ハードドライブディスク、コンパクトディスクドライブ、ブルーレイディスクドライブ、RAID(redundant array of independent disks)、およびデジタル多用途ディスク(DVD)ドライブが含まれる。
【0071】
図5の機械実行可能命令832は、大容量ストレージデバイス828内、揮発性メモリ814内、不揮発性メモリ816内、および/またはCDまたはDVDのようなリムーバブル非一時的なコンピュータ読み取り可能記憶媒体上に記憶され得る。
【0072】
データを圧縮する例示的な方法、装置、システム、および製造物品が本明細書に開示されている。さらなる実施例およびそれらの組み合わせは、以下を含む。
【0073】
実施例1は、データを記憶するオフチップメモリと、データセットを複数のデータブロックに分割するデータスライサと、データプロセッサであって、複数のデータブロックのうちの第1のブロックに対する第1の圧縮技術を、第1のブロックの第1の特性に基づいて選択し、複数のデータブロックのうちの第2のブロックに対する第2の圧縮技術を、第2のブロックの第2の特性に基づいて選択する、データプロセッサと、第1の圧縮技術を使用して第1のブロックを圧縮して第1の圧縮データブロックを生成する第1の圧縮器と、第2の圧縮技術を使用して第2のブロックを圧縮して第2の圧縮データブロックを生成する第2の圧縮器と、第1の圧縮技術を特定する第1のヘッダおよび第2の圧縮技術を特定する第2のヘッダを生成するヘッダ生成器と、オフチップメモリに記憶される、第1のヘッダを伴う第1の圧縮データブロックおよび第2のヘッダを伴う第2の圧縮データブロックを送信するインターフェースと、を含む装置を含む。
【0074】
実施例2は、実施例1の装置を含み、データプロセッサは、ブロックのデータが同じ値に対応する場合に、第1の圧縮技術を選択し、ブロックのデータが少なくとも1つの異なる値を含む場合に第2の圧縮技術を選択するものである。
【0075】
実施例3は、実施例1の装置を含み、第1の圧縮技術は、ハフマン圧縮技術、RLE圧縮技術または圧縮技術なしのうちの少なくとも1つである。
【0076】
実施例4は、実施例3の装置を含み、データプロセッサは、ハフマン圧縮技術が圧縮技術なしよりも多くのデータをもたらす場合に、第1の圧縮技術を圧縮技術なしと選択するものである。
【0077】
実施例5は、実施例1の装置を含み、圧縮器は、第1の圧縮データブロックを第1の圧縮データのサブブロックに分割するものである。
【0078】
実施例6は、実施例5の装置を含み、第1の圧縮データのサブブロックは、サイズが不均一である。
【0079】
実施例7は、実施例5の装置を含み、サブブロックにパターンを追加することによって、パターンでサブブロックをパッドする1つ以上のパッダをさらに含む。
【0080】
実施例8は、実施例1の装置を含み、データブロックは、サイズが均一である。
【0081】
実施例9は、実施例1の装置を含み、第1の圧縮器および第2の圧縮器は、第1の圧縮技術および第2の圧縮技術をそれぞれのブロックに対して並列に実行するものである。
【0082】
実施例10は、実施例1の装置を含み、圧縮器は、選択された第1の圧縮技術が圧縮技術なしよりも多くのデータをもたらす場合に、第1の圧縮データブロックを破棄し、非圧縮のデータブロックを保持するものである。
【0083】
実施例11は、実施例10の装置を含み、第1のヘッダは、圧縮技術なしを特定する。
【0084】
実施例12は、実行されると、少なくとも機械に、データセットを複数のデータブロックに分割し、複数のデータブロックのうちの第1のブロックに対する第1の圧縮技術を、第1のブロックの第1の特性に基づいて選択し、複数のデータブロックのうちの第2のブロックに対する第2の圧縮技術を、第2のブロックの第2の特性に基づいて選択し、第1の圧縮技術を使用して第1のブロックを圧縮して第1の圧縮データブロックを生成し、第2の圧縮技術を使用して第2のブロックを圧縮して第2の圧縮データブロックを生成し、第1の圧縮技術を特定する第1のヘッダおよび第2の圧縮技術を特定する第2のヘッダを生成し、第1のヘッダを伴う第1の圧縮データブロックおよび第2のヘッダを伴う第2の圧縮データブロックをチップメモリに記憶する、ことをさせる命令を含む非一時的なコンピュータ読み取り可能記憶媒体を含む。
【0085】
実施例13は、実施例12のコンピュータ読み取り可能な記憶媒体を含み、命令は、ブロックのデータが同じ値に対応する場合に、機械に第1の圧縮技術を選択させ、ブロックのデータが少なくとも1つの異なる値を含む場合に、第2の圧縮技術を選択させる。
【0086】
実施例14は、実施例12のコンピュータ読み取り可能な記憶媒体を含み、第1の圧縮技術は、ハフマン圧縮技術、RLE圧縮技術または圧縮技術なしのうちの少なくとも1つである。
【0087】
実施例15は、実施例14のコンピュータ読み取り可能な記憶媒体を含み、命令は、機械に、ハフマン圧縮技術が圧縮技術なしよりも多くのデータをもたらす場合に、第1の圧縮技術を圧縮技術なしと選択させる。
【0088】
実施例16は、実施例12のコンピュータ読み取り可能な記憶媒体を含み、命令は、機械に、第1の圧縮データブロックを第1の圧縮データのサブブロックに分割させる。
【0089】
実施例17は、実施例16のコンピュータ読み取り可能な記憶媒体を含み、第1の圧縮データのサブブロックは、サイズが不均一である。
【0090】
実施例18は、実施例16のコンピュータ読み取り可能な記憶媒体を含み、命令は、機械に、サブブロックにパターンを追加することによって、該パターンでサブブロックをパッドさせる。
【0091】
実施例19は、実施例12のコンピュータ読み取り可能な記憶媒体を含み、データブロックは、サイズが均一である。
【0092】
実施例20は、実施例12のコンピュータ読み取り可能な記憶媒体を含み、命令は、機械に、第1の圧縮技術および第2の圧縮技術をそれぞれのブロックに対して並列に実行させる。
【0093】
実施例21は、実施例12のコンピュータ読み取り可能な記憶媒体を含み、命令は、機械に、選択された第1の圧縮技術が圧縮技術なしよりも多くのデータをもたらす場合に、第1の圧縮データブロックを破棄させ、非圧縮データブロックを保持させる。
【0094】
実施例22は、実施例20のコンピュータ読み取り可能な記憶媒体を含み、第1のヘッダは、圧縮技術なしを特定する。
【0095】
実施例23は、データセットを複数のデータブロックに分割することと、複数のデータブロックのうちの第1のブロックに対する第1の圧縮技術を、第1のブロックの第1の特性に基づいて選択することと、複数のデータブロックのうちの第2のブロックに対する第2の圧縮技術を、第2のブロックの第2の特性に基づいて選択することと、第1の圧縮技術を使用して第1のブロックを圧縮して第1の圧縮データブロックを生成することと、第2の圧縮技術を使用して第2のブロックを圧縮して第2の圧縮データブロックを生成することと、第1の圧縮技術を特定する第1のヘッダおよび第2の圧縮技術を特定する第2のヘッダを生成することと、第1のヘッダを伴う第1の圧縮データブロックおよび第2のヘッダを伴う第2の圧縮データブロックをチップメモリに記憶することと、を含む方法を含む。
【0096】
実施例24は、実施例23の方法を含み、第1の圧縮技術は、ブロックのデータが同じ値に対応する場合に選択され、第2の圧縮技術は、ブロックのデータが少なくとも1つの異なる値を含む場合に選択される。
【0097】
実施例25は、実施例23の装置を含み、第1の圧縮技術は、ハフマン圧縮技術、RLE圧縮技術または無圧縮技術なしのうちの少なくとも1つである。
【0098】
実施例26は、実施例25の装置を含み、第1の圧縮技術は、ハフマン圧縮技術が圧縮技術なしよりも多くのデータをもたらす場合に、圧縮技術なしと選択される。
【0099】
実施例27は、実施例23の装置を含み、第1の圧縮データブロックを、第1の圧縮データのサブブロックに分割することをさらに含む。
【0100】
実施例28は、実施例27の装置を含み、第1の圧縮データのサブブロックは、サイズが不均一である。
【0101】
実施例29は、実施例27の装置を含み、サブブロックにパターンを追加することによって、該パターンでサブブロックをパッドすることをさらに含む。
【0102】
実施例30は、実施例23の装置を含み、データブロックは、サイズが均一である。
【0103】
実施例31は、実施例23の装置を含み、第1の圧縮技術および第2の圧縮技術が、それぞれのブロックに対して並列に実行される。
【0104】
実施例32は、実施例23の装置を含み、選択された第1の圧縮技術が、圧縮技術なしよりも多くのデータをもたらす場合に、第1の圧縮データブロックを廃棄し、非圧縮データブロックを保持することをさらに含む。
【0105】
実施例33は、実施例32の装置を含み、第1のヘッダは、圧縮技術なしを特定する。
【0106】
実施例34は、実行されると、少なくとも機械に、実行のための第2の命令を配布、設定、アセンブル、インストール、インスタンス化、検索、伸長および復号することのうちの少なくとも1つを実行させる第1の命令と、実行されると、少なくとも機械に、データセットを複数のデータブロックに分割し、複数のデータブロックのうちの第1のブロックに対する第1の圧縮技術を、第1のブロックの第1の特性に基づいて選択し、複数のデータブロックのうちの第2のブロックに対する第2の圧縮技術を、第2のブロックの第2の特性に基づいて選択し、第1の圧縮技術を使用して第1のブロックを圧縮して第1の圧縮データブロックを生成し、第2の圧縮技術を使用して第2のブロックを圧縮して第2の圧縮データブロックを生成し、第1の圧縮技術を特定する第1のヘッダおよび第2の圧縮技術を特定する第2のヘッダを生成し、第1のヘッダを伴う第1の圧縮データブロックおよび第2のヘッダを伴う第2の圧縮データブロックをチップメモリに記憶する、ことをさせる第2の命令とを含む例示的なコンピュータ読み取り可能記憶媒体。
【0107】
実施例35は、実施例34のコンピュータ読み取り可能記憶媒体を含み、命令は、ブロックのデータが同じ値に対応する場合に、機械に第1の圧縮技術を選択させ、ブロックのデータが少なくとも1つの異なる値を含む場合に、第2の圧縮技術を選択させる。
【0108】
実施例36は、実施例34のコンピュータ読み取り可能記憶媒体を含み、第1の圧縮技術は、ハフマン圧縮技術、RLE圧縮技術または圧縮技術なしのうちの少なくとも1つである。
【0109】
実施例37は、実施例36のコンピュータ読み取り可能記憶媒体を含み、命令は、機械に、ハフマン圧縮技術が圧縮技術なしよりも多くのデータをもたらす場合に、第1の圧縮技術を圧縮技術なしと選択させる。
【0110】
実施例38は、実施例34のコンピュータ読み取り可能記憶媒体を含み、命令は、機械に、第1の圧縮データブロックを第1の圧縮データのサブブロックに分割させる。
【0111】
実施例39は、実施例38のコンピュータ読み取り可能記憶媒体を含み、第1の圧縮データのサブブロックは、サイズが不均一である。
【0112】
実施例40は、実施例38のコンピュータ読み取り可能記憶媒体を含み、命令は、機械に、サブブロックにパターンを追加することによって、該パターンでサブブロックをパッドさせる。
【0113】
実施例41は、実施例34のコンピュータ読み取り可能記憶媒体を含み、データブロックは、サイズが均一である。
【0114】
実施例42は、実施例34のコンピュータ読み取り可能記憶媒体を含み、命令は、機械に、第1の圧縮技術および第2の圧縮技術をそれぞれのブロックに対して並列に実行させる。
【0115】
実施例43は、実施例34のコンピュータ読み取り可能記憶媒体を含み、命令は、機械に、選択された第1の圧縮技術が圧縮技術なしよりも多くのデータをもたらす場合に、第1の圧縮データブロックを破棄させ、非圧縮データブロックを保持させる。
【0116】
実施例44は、実施例42のコンピュータ読み取り可能記憶媒体を含み、第1のヘッダは、圧縮技術なしを特定する。
【0117】
以上から、オンチップニューラルネットワークおよび/またはハードウェアアクセラレータに送信される前に、オフチップメモリに記憶されたデータを圧縮する例示的な方法、装置および製造物品が開示されていることが理解されるであろう。開示された方法、装置および製造物品は、オンチップのニューラルネットワークおよび/またはハードウェアアクセラレータと共にオフチップメモリの利用を容易にし、メモリ容量を増加させることによって、計算デバイスの効率を改善する。本明細書に開示された例を用いて、ユーザは、より高い圧縮比を達成するために、特定のアプリケーションデータプロファイルに圧縮スキームを仕立てるができる。オフチップ構成要素からオンチップ構成要素にデータを転送する前にデータを圧縮することによって、本明細書に開示された実施例は、圧縮なしでデータを送信することのボトルネック効果を防ぐ、そうでなければ低減する。追加的に、データをデータのブロックおよび/またはサブブロックに分割することによって、本明細書に開示された実施例は、オンチップ構成要素を使用するデータの並列復号を容易にし、それによってオンチップ構成要素の処理帯域幅を増加させる。本明細書に開示された一部ハフマン符号化スキームの例を使用することにより、ハードウェアメモリの制限および速度の要件と互換性があるようにハフマン符号化ルックアップテーブルの要件を低減する。従って、開示された方法、装置、および製造物品は、コンピュータの機能における1つまたは複数の改良に向けられている。
【0118】
一定の例示的な方法、装置および製造物品が本明細書に開示されているが、本特許がカバーする範囲はそれに限定されない。それどころか、この特許は、この特許の特許請求の範囲内にある全ての方法、装置および製造物品をカバーする。