特許7688981 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ アーム・リミテッドの特許一覧

特許7688981方法及びデータ処理システム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9a
9b
10a
10b
11
12
13
14

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2025-05-28

(45)【発行日】2025-06-05

(54)【発明の名称】方法及びデータ処理システム

(51)【国際特許分類】

H03M 7/40 20060101AFI20250529BHJP

【ＦＩ】

H03M7/40

【請求項の数】 15

【外国語出願】

(21)【出願番号】P 2021017501

(22)【出願日】2021-02-05

(65)【公開番号】P2021141576

(43)【公開日】2021-09-16

【審査請求日】2023-12-14

(31)【優先権主張番号】16/809,086

(32)【優先日】2020-03-04

(33)【優先権主張国・地域又は機関】US

(73)【特許権者】

【識別番号】500395107

【氏名又は名称】アーム・リミテッド

(74)【代理人】

【識別番号】100107456

【弁理士】

【氏名又は名称】池田成人

(74)【代理人】

【識別番号】100162352

【弁理士】

【氏名又は名称】酒巻順一郎

(74)【代理人】

【識別番号】100123995

【弁理士】

【氏名又は名称】野田雅一

(72)【発明者】

【氏名】ペルソン，エリック

(72)【発明者】

【氏名】ヒューゴソン，スヴェンオラヨハネス

【審査官】原田聖子

(56)【参考文献】

【文献】米国特許出願公開第２０１９／０３７０６６７（ＵＳ，Ａ１）

【文献】国際公開第２０１０／０００６６２（ＷＯ，Ａ１）

【文献】特開２０１７－１１８５４７（ＪＰ，Ａ）

【文献】A. Chandra , K. Chakrabarty，System-on-a-chip test-data compression and decompression architectures based on Golomb codes，IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems，2001年03月，vol. 20, no. 3，pp. 355-368

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｈ０３Ｍ７／４０

(57)【特許請求の範囲】

【請求項1】

処理要素による使用のための方法であって、
複数の可変長符号を取得することであって、各々の可変長符号は、可変長の単項部分及び固定長の仮数部分を有する、取得することと、
前記可変長符号を前記可変長符号の単項部分及び前記可変長符号の仮数部分に分離することと、
前記可変長符号の前記単項部分からのデータを含むデータストリームの各々のチャンクに対し、前記単項部分からの前記データが、前記データストリームに追加されないで残っている前記可変長符号の前記単項部分の量に基づいて判定されたサイズを有する前記データストリームのチャンク内のサブストリームを形成するように、選択されたチャンク構造を使用して、前記チャンク内の前記データストリームを形成することと、
を備えた、方法。

【請求項2】

前記可変長符号の前記仮数部分は、切り捨てられた二値部分である、請求項１に記載の方法。

【請求項3】

各々の可変長符号の前記単項部分は、前記可変長符号によって表される元の値の商を表す、請求項１または２に記載の方法。

【請求項4】

各々の可変長符号の前記仮数部分は、前記可変長符号によって表される値の余りを表す固定長の二値符号である、請求項１～３のいずれか１項に記載の方法。

【請求項5】

前記可変長符号は、ゴロムライス符号である、請求項１～４のいずれか１項に記載の方法。

【請求項6】

前記データストリームの各々のチャンクは、
前記可変長符号の前記単項部分からのデータ及び前記可変長符号の前記仮数部分からのデータを含むこと、
前記可変長符号の前記単項部分からのデータを含み且つ前記可変長符号の前記仮数部分からのデータを含まないこと、または
前記可変長符号の前記仮数部分からのデータを含み且つ前記可変長符号の前記単項部分からのデータを含まないこと
が可能である、請求項１～５のいずれか１項に記載の方法。

【請求項7】

前記データストリームは、予め定められた長さのセルから形成され、
前記データストリームに追加されないで残っている前記可変長符号の前記単項部分の前記量は、前記データストリームに追加されないで残っているセルと関連付けられた前記可変長符号の前記単項部分のビットの数である、請求項１に記載の方法。

【請求項8】

前記データストリームは、予め定められた長さのセルから形成され、
前記データストリームの各々のセルは、ヘッダ及び複数のチャンクを有し、
前記ヘッダは、前記セルの長さ及び前記セル内の前記可変長符号の前記単項部分の長さを示す、請求項１～７のいずれか１項に記載の方法。

【請求項9】

第２の複数の可変長符号を取得することと、
前記第２の複数の可変長符号を前記可変長符号の単項部分及び前記可変長符号の仮数部分に分離することと、を更に備え、
チャンク内のデータストリームを形成することは、
第１の複数の可変長符号及び第２の複数の可変長符号のうちの少なくとも１つの単項部分からのデータを含む前記データストリームの各々のチャンクに対し、前記第１の複数の可変長符号の単項部分の数及び前記第２の複数の可変長符号の単項部分の数を前記チャンクに含めること
を含む、請求項１に記載の方法。

【請求項10】

データストリームを形成することは、チャンクに含まれた前記第１の複数の可変長符号の単項部分の数と、チャンクに含まれた前記第２の複数の可変長符号の単項部分の数との間の差を記録するバランス値を維持することを含み、
前記バランス値は、チャンクに含まれる前記第１の複数の可変長符号の前記単項部分の数及び前記第２の複数の可変長符号の前記単項部分の数を判定するために使用される、請求項９に記載の方法。

【請求項11】

前記複数の可変長符号は、ニューラルネットワークにおける使用のための重み値を表す、請求項１～１０のいずれか１項に記載の方法。

【請求項12】

前記複数の可変長符号は、ニューラルネットワークの層の出力である活性化ストリーム内の値を表す、請求項１～１１のいずれか１項に記載の方法。

【請求項13】

データストリームを復号する方法であって、
複数の可変長符号に関連するデータを含むデータストリームを取得することであって、各々の可変長符号は、可変長の単項部分及び固定長の仮数部分を有し、前記データストリームは、チャンク内で形成され、前記データストリームの少なくとも１つのチャンクは、前記可変長符号の単項部分から形成されたデータのサブストリームを含む、取得することと、
前記データストリームから抽出されないで残っている前記可変長符号の単項部分の量に基づいて選択されたチャンク構造を使用して、前記データストリームの前記チャンク内の前記サブストリームを識別及び抽出することと、
を備えた、方法。

【請求項14】

前記可変長符号の各々の単項部分は、ストップビットを有する単項データとして符号化され、前記方法は、
前記データストリームの複数のチャンクから、複数の識別及び抽出されたサブストリームを取得することと、
各々の抽出されたサブストリームを、前記サブストリーム内のストップビットのビット位置のリストを表す中間形式に変換することと、
複数の前記変換されたサブストリームを組み合わせて、ビット位置の拡大されたリストを形成することと、
ビット位置の前記拡大されたリスト内の前記ストップビットの間の距離を測定して、前記データストリーム内の前記可変長符号の前記単項部分の値を回復することと、
を更に備えた、請求項１３に記載の方法。

【請求項15】

処理要素及び記憶装置を備えたデータ処理システムであって、前記記憶装置は、符号部分を記憶し、前記符号部分は、前記処理要素によって実行されるとき、前記データ処理システムに、
複数の可変長符号を取得することであって、各々の可変長符号は、可変長の単項部分及び固定長の仮数部分を有する、取得することと、
前記可変長符号を前記可変長符号の単項部分及び前記可変長符号の仮数部分に分離することと、
前記可変長符号の前記単項部分からのデータを含むデータストリームの各々のチャンクに対し、前記単項部分からの前記データが、前記データストリームに追加されないで残っている前記可変長符号の前記単項部分の量に基づいて判定されたサイズを有する前記データストリームのチャンク内のサブストリームを形成するように、選択されたチャンク構造を使用して、前記チャンク内の前記データストリームを形成することと、
を実行させる、データ処理システム。

【発明の詳細な説明】

【技術分野】

【0001】

[0001]本発明は、データ処理システムに関し、特に、可変長符号を処理するデータ処理システムに関する。

【背景技術】

【0002】

[0002]当業者に既知である可逆圧縮データ圧縮を実行する１つの方式は、値をゴロムライス符号に変換することである。数値をゴロムライス符号に変換するために、除数として知られるパラメータが選択される。ゴロムライス符号を生成するために、数値が除数によって除算されて２つの部分を生成する。第１の部分は、除数が完全に数値に何回除算したかである商である。第２の部分は、除数を完全に数値に除算した後、存在する場合の残りの数である余りである。

【0003】

[0003]ゴロムライス符号の例が図１に示される。図１に示される例では、０～１０の値がゴロムライス符号として示される。ゴロムライス符号の第１の部分、商は、単項フォーマットにおいて表される。このフォーマットでは、商の値に等しい「１」の数と、それに続いて「０」であるストップビットによって数が表される。例えば、数９の単項部分は、３が９に３回除算されることを理由に、３つの「１」とストップビット「０」がそれに続く「１１１０」である。ゴロムライス符号の第２の部分は、固定長二値部分である。この例における除数が「３」であるので、余りは、０、１、または２のみであることがある。したがって、これは、２ビットの固定長二値によって表されることがある。ゴロムライス符号の各々における最後の２ビットは、二値形式において余りを表す。余りは、ゴロムライス符号の単項部分のストップビットの後に現れることを理由に、ゴロムライス符号の「仮数」と称されることがある。

【0004】

[0004]ゴロムライス符号の単項部分のサイズが変化するので、ゴロムライス符号は、可変長符号のタイプである。各々の符号が復号のために別個に考えられる必要があることを理由に、そのような可変長符号がプロセッサにおいて復号するのに低速であることがある。

【発明の概要】

【0005】

[0005]第１の態様に従って、処理要素による使用のための方法が提供され、方法は、複数の可変長符号を取得することであって、各々の可変長符号は、可変長の第１の部分及び第２の部分を有する、取得することと、可変長符号を可変長符号の第１の部分及び可変長符号の第２の部分に分離することと、可変長符号の第１の部分からのデータを含む処理済みストリームの各々のチャンクに対し、第１の部分からのデータが、制御ルールに従って判定されたサイズを有する処理済みストリームのチャンク内のサブストリームを形成するように、制御ルールのセットを使用して、チャンク内の処理済みストリームを形成することと、を含む。

【0006】

[0006]第２の態様に従って、処理済みデータストリームを復号する方法が提供され、方法は、複数の可変長符号に関連するデータを含む処理済みデータストリームを取得することであって、各々の可変長符号は、可変長の第１の部分及び第２の部分を有し、処理済みストリームは、チャンク内で形成され、処理済みストリームの少なくとも１つのチャンクは、可変長符号の第１の部分から形成されたデータのサブストリームを含む、取得することと、フロー制御ルールのセットを使用して、処理済みデータストリームのチャンク内のサブストリームを識別及び抽出することと、を含む。

【0007】

[0007]第３の態様に従って、処理要素及び記憶装置を含むデータ処理システムが提供され、記憶装置は、符号部分を記憶し、符号部分は、処理要素によって実行されるとき、データ処理システムに、複数の可変長符号を取得させ、各々の可変長符号は、可変長の第１の部分及び第２の部分を有し、可変長符号を可変長符号の第１の部分及び可変長符号の第２の部分に分離させ、可変長符号の第１の部分からのデータを含む処理済みストリームの各々のチャンクに対し、第１の部分からのデータが、制御ルールに従って判定されたサイズを有する処理済みストリームのチャンク内のサブストリームを形成するように、制御ルールのセットを使用して、チャンク内の処理済みストリームを形成させる。

【0008】

[0008]添付図面に示されるような実施例を例としてのみ参照して、本技術が更に説明される。

【図面の簡単な説明】

【0009】

【図1】[0009]図１は、３の除数を使用して０～１０の値のゴロムライス符号を示す表である。

【0010】

【図2】[0010]図２は、活性化データを記憶装置に書き込むニューラル処理ユニットの構成要素を示す。

【0011】

【図3】[0011]図３は、記憶のためにゴロムライス符号のストリームを処理することを示すフローチャートである。

【0012】

【図4】[0012]図４は、ゴロムライス符号の分離の間のデータのストリームの構造を示す。

【0013】

【図5】[0013]図５は、エンコーダ及びデコーダによって使用される複数のチャンク構造を示す。

【0014】

【図6】[0014]図６は、エンコーダによって実行されるステップを示すフローチャートである。

【0015】

【図7】[0015]図７は、エンコーダによって符号化されたストリームの第１のチャンクを復号するときのチャンク構造を決定するステップを示すフローチャートである。

【0016】

【図8】[0016]図８は、エンコーダによって符号化されたストリームの後続のチャンクを復号するときのチャンク構造を決定するステップを示すフローチャートである。

【0017】

【図9a】[0017]図９ａは、単項データを復号するステップを示すフローチャートである。

【0018】

【図9b】[0018]図９ｂは、単項値の集合を復号するときのビット処理を示す。

【0019】

【図10a】[0019]図１０ａは、モバイルデバイスを示す。

【0020】

【図10b】[0020]図１０ｂは、モバイルデバイスのハードウェアを示す図である。

【0021】

【図11】[0021]図１１は、モバイルデバイスにインストールされたシステムアーキテクチャを示す図である。

【0022】

【図12】[0022]図１２は、ニューラル処理ユニットの構成要素を示す図である。

【0023】

【図13】[0023]図１３は、重み値に関連する単項データを符号化するためのフロー制御ルールを示す表である。

【0024】

【図14】[0024]図１４は、重み値に関連する単項データを復号するためのフロー制御ルールを示す表である。

【発明を実施するための形態】

【0025】

[0025]添付図面を参照して実施形態を議論する前に、実施形態及び関連する利点の以下の説明が提供される。

【0026】

[0026]一実施形態に従って、処理要素による使用のための方法が提供され、方法は、複数の可変長符号を取得することであって、各々の可変長符号は、可変長の第１の部分及び第２の部分を有する、取得することと、可変長符号を可変長符号の第１の部分及び可変長符号の第２の部分に分離することと、可変長符号の第１の部分からのデータを含む処理済みストリームの各々のチャンクに対し、第１の部分からのデータが、制御ルールに従って判定されたサイズを有する処理済みストリームのチャンク内のサブストリームを形成するように、制御ルールのセットを使用して、チャンク内の処理済みストリームを形成することと、を含む。このようにして、処理済みストリームは、制御ルールから予測可能である可変長符号の第１の部分のサブストリームを有することができる。これは、プロセッサによる可変長符号の第１の部分のより効率的な処理を可能にすることができる。

【0027】

[0027]可変長符号の第１の部分は、単項部分であってもよく、可変長符号の第２の部分は、仮数部分であってもよい。いくつかのケースでは、可変長符号の仮数部分は、切り捨てられた二値部分である。各々の可変長符号の単項部分は、可変長符号によって表される元の値の商を表してもよい。更に、いくつかのケースでは、各々の可変長符号の仮数部分は、可変長符号によって表される元の値の余りを表す固定長の二値符号である。いくつかの実装態様では、可変長符号は、ゴロムライス符号である。

【0028】

[0028]処理済みストリームの各々のチャンクは、可変長符号の第１の部分からのデータ及び可変長符号の第２の部分からのデータを含んでもよく、可変長符号の第１の部分からのデータを含んでもよく、及び可変長符号の第２の部分からのデータを含まなくてもよく、または可変長符号の第２の部分からのデータを含んでもよく、及び可変長符号の第１の部分からのデータを含まなくてもよい。

【0029】

[0029]制御ルールは、各々のチャンク内の単項サブストリームのサイズを直列に判定するように構成されてもよい。いくつかのケースでは、制御ルールは、処理済みストリームに追加されないで残っている可変長符号の単項部分の量に基づいて、各々のチャンク内の単項サブストリームのサイズのサイズを判定するように構成されている。いくつかの実装態様に対し、処理済みストリームは、予め定められた長さのセルから形成され、処理済みストリームに追加されないで残っている可変長符号の単項部分の測定は、処理済みストリームに追加されないで残っているセルと関連付けられた可変長符号の単項部分のビットの数である。セル内のデータを処理することによって、フロー制御ルールは、単項サブストリームのサイズがデコーダによって予測されることを可能にすることができる。

【0030】

[0030]制御ルールは、予め定められたチャンク構造のセットの間で選択するルールであってもよい。各々のチャンク構造は、チャンク内の各々の位置にあるべきであるデータのタイプを定義してもよい。チャンク構造のセットは、セル内の第１のチャンクに対する少なくとも１つのチャンク構造を含んでもよい。セル内の第１のチャンクに対する少なくとも１つのチャンク構造は、セルに含まれるデータに関する情報を含むヘッダ部分を含んでもよい。

【0031】

[0031]第１の実施形態に従ったいくつかの方法では、処理済みストリームは、予め定められた長さのセルから形成され、処理済みストリームの各々のセルは、ヘッダ及び複数のチャンクを有し、ヘッダは、セルの長さ及びセル内の可変長符号の単項部分の長さを示す。これは、復号の間にセルに残っている単項データの量をデコーダが追跡することを可能にすることができる。

【0032】

[0032]第１の実施形態は、第２の複数の可変長符号を取得することと、第２の複数の可変長符号を可変長符号の第１の部分及び可変長符号の第２の部分に分離することと、を更に含んでもよく、チャンク内の処理済みストリームを形成するステップは、第１の複数の可変長符号及び第２の複数の可変長符号のうちの少なくとも１つの第１の部分からのデータを含む処理済みストリームの各々のチャンクに対し、フロー制御ルールが第１の複数の可変長符号の第１の部分の数及び第２の複数の可変長符号の第１の部分の数がチャンクに含まれると判定するように、制御ルールのセットを使用する。

【0033】

[0033]いくつかの実装態様では、処理済みストリームを形成することは、チャンクに含まれた第１の複数の可変長符号の第１の部分の数とチャンクに含まれた第２の複数の可変長符号の第１の部分の数との間の差を記録するバランス値を維持することを含み、フロー制御ルールは、バランス値に基づいて、チャンクに含まれる第１の複数の可変長符号の第１の部分の数及び第２の複数の可変長の第１の部分の数を判定する。

【0034】

[0034]いくつかの用途では、複数の可変長符号は、ニューラルネットワークにおける使用のための重み値を表す。他の用途では、複数の可変長符号は、ニューラルネットワークの層の出力である活性化ストリーム内の値を表す。

【0035】

[0035]第２の実施形態に従って、処理済みデータストリームを復号する方法が提供され、方法は、複数の可変長符号に関連するデータを含む処理済みデータストリームを取得することであって、各々の可変長符号は、可変長の第１の部分及び第２の部分を有し、処理済みストリームは、チャンク内で形成され、処理済みストリームの少なくとも１つのチャンクは、可変長符号の第１の部分から形成されたデータのサブストリームを含む、取得することと、フロー制御ルールのセットを使用して、処理済みデータストリームのチャンク内のサブストリームを識別及び抽出することと、を含む。

【0036】

[0036]いくつかの実装態様では、可変長符号の各々の第１の部分は、ストップビットを有する単項データとして符号化される。方法は、処理済みデータの複数のチャンクから、複数の識別及び抽出されたサブストリームを取得することと、各々の抽出されたサブストリームを、サブストリーム内のストップビットのビット位置のリストを表す中間形式に変換することと、複数の変換されたサブストリームを組み合わせて、ビット位置の拡大されたリストを形成することと、ビット位置の拡大されたリスト内のストップビットの間の距離を測定して、第１のストリーム内の可変長符号の第１の部分の値を回復することと、を更に含んでもよい。

【0037】

[0037]いくつかの実施形態では、フロー制御ルールは、処理済みストリームから復号されないで残っている可変長符号の単項部分の量に基づいて、復号されることになる各々のチャンク内の単項サブストリームのサイズを判定するように構成されている。処理済みストリームは、予め定められた長さのセルから形成されてもよく、処理済みストリームから復号されないで残っている可変長符号の単項部分の量は、処理済みストリームから復号されないで残っているセルと関連付けられた可変長符号の単項部分のビットの数であってもよい。

【0038】

[0038]他の実施形態では、処理済みストリームは加えて、第２の複数の可変長符号に属する可変長符号の第１の部分を含んでもよい。フロー制御ルールは、複数の可変長符号及び第２の複数の可変長符号のうちの少なくとも１つの第１の部分のデータを含む、復号されることになる処理済みストリームの各々のチャンクに対し、フロー制御ルールが、複数の可変長符号の第１の部分の数及び第２の複数の可変長符号の第１の部分の数が復号されることになるチャンクに含まれると判定するように構成されてもよい。

【0039】

[0039]処理済みストリームのチャンク内のサブストリームを識別及び抽出することは、処理済みストリームから抽出された複数の可変長符号の第１の部分の数と処理済みストリームから抽出された第２の複数の可変長符号の第１の部分の数との間の差を記録するバランス値を維持することを含んでもよい。フロー制御ルールは、バランス値に基づいて、チャンクから抽出されるべき複数の可変長符号の第１の部分の数及び第２の複数の可変長符号の第１の部分の数を判定するために使用されてもよい。

【0040】

[0040]第３の実施形態に従って、符号部分を記憶した非一時的コンピュータ可読記憶媒体が提供され、符号部分は、処理要素上で実行されるとき、複数の可変長符号を取得することであって、各々の可変長符号は、可変長の第１の部分及び第２の部分を有する、取得すること、可変長符号を可変長符号の第１の部分及び可変長符号の第２の部分に分離すること、並びに可変長符号の第１の部分からのデータを含む処理済みストリームの各々のチャンクに対し、第１の部分からのデータが、制御ルールに従って判定されたサイズを有する処理済みストリームのチャンク内のサブストリームを形成するように、制御ルールのセットを使用して、チャンク内の処理済みストリームを形成すること、の方法を処理要素に実行させる。

【0041】

[0041]第４の実施形態に従って、符号部分を記憶した非一時的コンピュータ可読記憶媒体が提供され、符号部分は、処理要素上で実行されるとき、処理済みデータストリームを復号する方法を処理要素に実行させ、方法は、複数の可変長符号に関連するデータを含む処理済みデータストリームを取得することであって、各々の可変長符号は、可変長の第１の部分及び第２の部分を有し、処理済みストリームは、チャンク内で形成され、処理済みストリームの少なくとも１つのチャンクは、可変長符号の第１の部分から形成されたデータのサブストリームを含む、取得することと、フロー制御ルールのセットを使用して、処理済みデータストリームのチャンク内のサブストリームを識別及び抽出することと、を含む。

【0042】

[0042]第５の実施形態に従って、処理要素及び記憶装置を含むデータ処理システムが提供され、記憶装置は、符号部分を記憶し、符号部分は、処理要素によって実行されるとき、データ処理システムに、複数の可変長符号を取得させ、各々の可変長符号は、可変長の第１の部分及び第２の部分を有し、可変長符号を可変長符号の第１の部分及び可変長符号の第２の部分に分離させ、可変長符号の第１の部分からのデータを含む処理済みストリームの各々のチャンクに対し、第１の部分からのデータが、制御ルールに従って判定されたサイズを有する処理済みストリームのチャンク内のサブストリームを形成するように、制御ルールのセットを使用して、チャンク内の処理済みストリームを形成させる。

【0043】

[0043]第６の実施形態に従って、処理要素及び記憶装置を含むデータ処理システムが提供され、記憶装置は、符号部分を記憶し、符号部分は、処理要素によって実行されるとき、データ処理システムに、複数の可変長符号に関連するデータを含む処理済みデータストリームを取得させ、各々の可変長符号は、可変長の第１の部分及び第２の部分を含み、処理済みストリームは、チャンク内で形成され、処理済みストリームの少なくとも１つのチャンクは、可変長符号の第１の部分から形成されたデータのサブストリームを含み、フロー制御ルールのセットを使用して、処理済みデータストリームのチャンク内のサブストリームを識別及び抽出させる。

【0044】

[0044]ここで、図面を参照して特定の実施形態が説明される。

【0045】

[0045]図２は、全てではないがニューラル処理ユニット（ＮＰＵ）の構成要素２の一部を示し、構成要素２は、人工知能アプリケーションに関連する計算、特に、ニューラルネットワークに関連する計算を実行する特殊チップである。言い換えると、ＮＰＵは、ニューラルネットワークに関連する特定の計算のハードウェア加速化を可能にする。構成要素２は、活性化値をＮＰＵの外部のＤＲＡＭ（図示せず）に書き込む構成要素である。

【0046】

[0046]ニューラルネットワークに関連する計算を実行するとき、計算は、ニューラルネットワークの各々の層に対して実行されてもよい。それらの計算は、活性化データとして知られる出力を生成し、活性化データは、大容量であることがあり、そのデータを使用して更なる計算を実行することができる前に記憶される必要がある。活性化データをメモリに記憶すること、及び活性化データをメモリから取り出すことは、外部メモリからプロセッサへのデータ転送に対する制約に起因して、相対的に低速の処理であることがある。したがって、プロセッサ性能を改善するために、ゴロムライス符号を使用して活性化層からのデータを圧縮することが望ましい。

【0047】

[0047]構成要素２は、記憶のために活性化データを処理するように構成される。活性化データが受信され、データのタイルにグループ化される。データのタイルは、要素の８×８のグループとして定義され、要素は、８ビットの圧縮されていない活性化データである。エンコーダ２０の形式にある処理要素は、活性化データをゴロムライス符号に変換することによって、受信された活性化データを圧縮するように構成される。以下で説明される更なるステップは次いで、活性化データを復号するのをより容易にするために実行される。

【0048】

[0048]ゴロムライス符号などの可変長符号を復号するとき、高レートにおいて構文解析することが困難である。これは、先行するゴロムライス符号の長さが、次のゴロムライス符号を識別及び復号することができる前に既知である必要があるように、ゴロムライス符号の間の直列依存性が存在することを理由とする。したがって、ゴロムライス符号を復号する典型的なハードウェア実装態様は、単一のパーサを使用して直接構文解析するとき、クロックサイクルごとに１つまたは２つのゴロムライス符号のレートを達成することができる。

【0049】

[0049]第１の特定の実施形態において説明される技術は、異なるアプローチを取る。図３は、圧縮されていない活性化データを受信するエンコーダ２０によって実行されるステップを示すフローチャートである。ステップＳ３０では、このケースでは、エンコーダ２０による変換によって、ゴロムライス符号が取得される。次いで、ステップＳ３１では、エンコーダ２０は、ゴロムライス符号を単項値のストリーム及び余り値のストリームに分離し、それらを図２に示されたＲＡＭ２１に記憶する。

【0050】

[0050]図４は、３つのデータストリームを示す。ソースデータストリーム４０は、ゴロムライス符号のストリームである。ソースデータストリーム４０は、値ＧＲ１～ＧＲ５によって示される一連のゴロムライス符号を含む。各々のゴロムライス符号は、関連する技術の説明において説明されるタイプの可変長単項部分及び固定長二値部分を有する。３ビットの固定長二値部分が図３に示されるが、二値部分の長さは重要ではなく、他の長さが使用されてもよい。エンコーダ２０は、ゴロムライス符号を２つの部分に分割して、図４に示される２つの更なるストリーム４１及び４２を生成する。第１のストリーム４１は、単項ストリームであり、第２のストリーム４２は、余りのストリームであり、各々の二値は、固定長を有する。

【0051】

[0051]ステップＳ３２では、図２に示されたスティッチプロセッサ２２は、第１のストリーム及び第２のストリームを共にスティッチして、処理済みストリームを形成する。これは、セルごとに行われ、各々のセルは、２１１２バイトスロットに記憶された圧縮されていないデータの３２個のタイル（２、０４８個の要素）を表す。何らかのオーバヘッドを許容し、６４バイトの全体数に切り上げるために、スロットは、セルよりも大きい。

【0052】

[0052]各々のセルは、スティッチプロセッサ２２によって複数のチャンク内で形成される。セルの第１のチャンクは、ヘッダを常に含む。ストリーム４からの単項データは、スティッチプロセッサ２２によって、３２ビットの部分において処理済みストリームのチャンクに常にスティッチされる。

【0053】

[0053]図５及び６を参照してここで説明されるように、セルは、スティッチプロセッサ２２によって、フロー制御ルールのセットを使用して形成される。図５は、スティッチプロセッサ２２がセルを形成するために使用することができるチャンクの異なる構造を示し、図６は、セルを形成するときにスティッチプロセッサ２２によって実行されることになるステップを示す。

【0054】

[0054]上で言及されたように、セルの第１のチャンクは、ヘッダを含む必要があり、ヘッダは、セルの長さ及びセル内に含まれる単項サブストリームの長さに関する情報を提供する。セル内の余り値の長さは、ヘッダに含まれないが、セルの長さ及び単項サブストリームの長さから導出されることが可能である。

【0055】

[0055]図５は、構文解析の効率性のために、ゴロムライス符号を復号するデコーダの単一のクロックサイクルにおいて各々のチャンクが消費されることを可能にするために設計された、利用可能なチャンクフォーマットを示す。示されるチャンク構造は、２つのカテゴリに分割され、図５に示される最上部の２つのチャンク構造５１及び５２は、セルに対する第１のチャンク構造であり、セルの第１のチャンクを形成するときの使用のために選択されてもよい。両方のチャンクフォーマット構造は、３２ビット長のヘッダ部分を含む。図５における第１のチャンク構造５１及び５２の下の、次の５つのチャンク構造５３～５７は、セルに含まれることになる圧縮されていないデータの３２個のタイルに対応する第１のストリーム及び第２のストリームからの残りの単項データ及び余りデータを含むために、セル内の第１のチャンクがエンコーダ２０によって放出された後に使用される。

【0056】

[0056]使用する適切なチャンク構造を選択するために、エンコーダ２０は、フロー制御ルールのセットを使用する。次のチャンクに対するチャンク構造が識別されると、チャンク構造は、適切なデータによりポピュレートされてもよく、放出されてもよい。スティッチプロセッサ２２によって使用されるフロー制御ルールは、以下の通りである。セルに対する第１のチャンク構造を選択するとき、図５に示される第１のチャンク構造５１は、チャンクに含めるためのスティッチプロセッサ２２に対して利用可能なセル内に単項データの３２ビットよりも多いビットが存在するときに選択される。そうでなければ、チャンク５２がいずれの単項データをも必要としないことを理由に、チャンク構造５２は、セルの第１のチャンクを形成するために使用される。単項データの３２ビットが利用可能でない状況は、セルに対する圧縮されていない活性化データのいずれもが単項部分を有さない、すなわち、各々の値がゴロムライス符号を生成するために使用される除数未満である場合に起こることがある。このケースでは、エンコーダ２０は、ストップビットを単項データとして符号化しない。

【0057】

[0057]第１のチャンクが放出された後にエンコーダ２０によって放出されたセル内の後続のチャンクに対し、セルに含めるための残っている単項データの１２８ビットよりも多くのビットが存在する場合、チャンク構造５３が使用される。単項データが３２ビット部分内のチャンクに含まれるので、最終的に、セルに対して符号化されないで残っている単項データの１２８ビットに満たないビットが存在する。セルに対して符号化されないで残っている単項データの９６ビットが存在する場合、次いで、チャンク構造５４が使用され、セルに対して符号化されないで残っている単項データの６４ビットが存在する場合、次いで、チャンク構造５５が使用され、セルに対して符号化されないで残っている単項データの３２ビットが存在する場合、次いで、チャンク構造５６が使用される。セルの全ての単項データが符号化されたケースでは、次いで、余りデータを放出するためにチャンク構造５７が使用される。異なるタイル及び／または要素からの単項データを同一のチャンクに含めることができるように、下位にある活性化データの下位にあるタイル及び要素のグループ化に関わらず、上記チャンク構造に含まれる単項データが選択されることに留意されるべきである。

【0058】

[0058]上記方法が図６に示される。ステップＳ６０では、図５に示されたチャンク構造５１及び５２から第１のチャンク構造が選択される。この選択は、上記説明されたような単項データの３２ビットの利用可能性に依存する。チャンク構造を選択した後、スティッチプロセッサ２２は、ヘッダ部分を生成する。スティッチプロセッサ２２は、圧縮されていないデータの３２個のタイルに基づいて、セルに含まれることになる単項サブストリームの長さを評価し、その長さを示す情報をヘッダ部分に追加する。セルに含まれることになる全てのデータの長さも評価され、ヘッダ部分に追加される。必要とされる場合、単項データ４１の第１のストリームからのデータ、及び余りデータの第２のストリームからのデータは、スティッチプロセッサ２２によって選択された、選択されたチャンク構造に従ってチャンクに追加される。

【0059】

[0059]ステップＳ６１では、上で説明されたフロー制御ルールに従ってチャンク構造５３～５７から適切なチャンク構造を選択することによって、処理済みデータストリームの次のチャンクが形成される。チャンク構造を選択した後、単項データ４１の第１のストリームからのデータ及び余りデータの第２のストリームからのデータにより、チャンク構造の関連部分を埋めることによって、チャンクが形成される。

【0060】

[0060]ステップＳ６２では、スティッチプロセッサ２２は、より多くのデータがチャンクに形成されるかどうかを判定する。より多くのデータがチャンクに形成される場合、方法は、次のチャンクを形成するようＳ６１に進む。これ以上データが処理されない場合、方法は、Ｓ６３に進み、終了する。

【0061】

[0061]上で説明された方法は、セル内の３２個のタイルから完全な１２８ビットのチャンクを形成することができること、及び単項部分を３２ビットの部分にスティッチすることができることを想定している。実際には、単項部分の第１のストリーム及び余り部分の第２のストリームが、それらが所望のサイズに到達するまでパディングするためのストップビット「０」を使用してパディングされるケースでは、それらの条件が満たされないことがある。セルに追加されるデータの長さがヘッダに記憶されるにつれて、セル内のデータの長さを識別すること、及び処理済みデータストリームを復号するときにパディングが開始する場所を識別することが可能である。

【0062】

[0062]次に、デコーダによって記憶された活性化データを復号する方法が図７及び８を参照して説明される。このケースでは、デコーダは、更なる計算における使用のために活性化データがＤＲＡＭから読み出されることを可能にするＮＰＵの一部である。デコーダは、処理済みストリームをＲＡＭに記憶するためにエンコーダ２０によって使用された、図５に示されたチャンク構造の複製を記憶する。図７のステップＳ７０では、デコーダは、復号するための活性化データのセルの第１のチャンクをＲＡＭから受信する。デコーダは、ヘッダを読み出し、セル内の単項データの長さを識別する。ステップＳ７１では、デコーダは、ヘッダにおいて指定された単項データの長さが３２ビット以上であるかどうかを識別する。単項の長さが３２ビット以上である場合、次いで、セルの第１のチャンクは、チャンク構造５１に従って形成され、単項データ及び余りデータは、既知のチャンク構造に従ってチャンクから抽出されてもよい。ヘッダにおいて識別された単項データの長さが３２ビット未満である場合（単項データが３２ビット部分においてスティッチされることを理由に、ゼロである）、第１のチャンクは、チャンク構造５２に従って形成され、それに従って、第１のチャンクが復号される。データを復号するとき、デコーダは、パラメータＵ＿ｌｅｆｔを維持し、パラメータＵ＿ｌｅｆｔは、セルのヘッダが検査されるときにセル内の単項の長さの値に最初に設定され、セル内の残っている単項データの量を記録するよう、単項データがチャンクから取り出されるたびに更新される。したがって、チャンク構造５１が第１のチャンクに対して使用される場合、次いで、第１のチャンクから単項データの３２ビットを抽出した後、パラメータＵ＿ｌｅｆｔは３２ビットだけ減少する。

【0063】

[0063]図８は、各々の後続のチャンクに対してチャンク構造を判定するためにデコーダによって使用される方法を示す。ステップＳ８０では、記憶された活性化データの後続のチャンクが受信される。ステップＳ８１では、パラメータＵ＿ｌｅｆｔは、セルに対して抽出されないで残っている単項データの量が１２８ビット以上であるかどうかを判定するよう検査される。抽出されることになる単項データの量が１２８ビット以上である場合、デコーダは、チャンク構造５３が使用されると判定する。ステップＳ８２では、デコーダは、チャンク構造５３に従って、チャンクからデータを抽出し、抽出された単項データの量を構成するよう、パラメータＵ＿ｌｅｆｔを更新する。

【0064】

[0064]単項データの１２８ビット未満のビットが抽出されないで残っている場合、方法は、ステップＳ８３に進む。ステップＳ８３では、パラメータＵ＿ｌｅｆｔは、セルに対して抽出されないで残っている単項データの量が９６ビットに等しいかどうかを判定するよう検査される。抽出されることになる単項データの量が９６ビットに等しい場合、デコーダは、チャンク構造５４が使用されると判定する。ステップＳ８４では、デコーダは、チャンク構造５４に従って、チャンクからデータを抽出し、抽出された単項データの量を構成するよう、パラメータＵ＿ｌｅｆｔを更新する。

【0065】

[0065]単項データの９６ビットよりも多いビットが抽出されないで残っている場合、方法は、ステップＳ８５に進む。ステップＳ８５では、パラメータＵ＿ｌｅｆｔは、セルに対して抽出されないで残っている単項データの量が６４ビットに等しいかどうかを判定するよう検査される。抽出されることになる単項データの量が６４ビットに等しい場合、デコーダは、チャンク構造５５が使用されると判定する。ステップＳ８６では、デコーダは、チャンク構造５５に従って、チャンクからデータを抽出し、抽出された単項データの量を構成するよう、パラメータＵ＿ｌｅｆｔを更新する。

【0066】

[0066]単項データの６４ビット未満のビットが抽出されないで残っている場合、方法は、ステップＳ８７に進む。ステップＳ８７では、パラメータＵ＿ｌｅｆｔは、セルに対して抽出されないで残っている単項データの量が３２ビットに等しいかどうかを判定するよう検査される。抽出されることになる単項データの量が３２ビットに等しい場合、デコーダは、チャンク構造５６が使用されると判定する。ステップＳ８６では、デコーダは、チャンク構造５６に従って、チャンクからデータを抽出し、抽出された単項データの量を構成するよう、パラメータＵ＿ｌｅｆｔを更新する。抽出されることになる単項データの量が３２ビットに等しくない場合（ゼロに等しい）、デコーダは、チャンク構造５７が使用されると判定する。ステップＳ８９では、デコーダは、チャンク構造５７に従って、チャンクからデータを抽出する。

【0067】

[0067]図７及び８と関連して上で説明された処理に基づいて、デコーダは、エンコーダ２０によってＲＡＭに記憶されたデータの処理済みストリームから、単項データ４１の第１のストリーム及び余りデータ４２の第２のストリームを効率的に再生成することができる。図７及び８に示されるフロー制御ルールを使用することによって、デコーダは、入来する圧縮されたデータストリーム内のデータタイプを示すビットコストなしに、入来するストリーム内のいずれかのポイントにおいて発見されるデータのタイプを決定することができる。

【0068】

[0068]処理済みデータストリームから単項データ及び余りデータを抽出すると、デコーダは、ゴロムライス符号を復号して、圧縮されていない活性化データを再生成する必要がある。余りデータの第２のストリーム４２は、固定長二値の配列であり、本分野において既知の技術を使用して復号するのに単純である。したがって、この処理はここでは更には議論されない。

【0069】

[0069]ここで、単項データ４１の第１のストリームを復号することが図９ａと関連して説明される。ステップＳ９０では、単項データの８ビットブロックは、二値形式に変換され、二値形式は、二値ブロック内のストップビットの位置または位置（複数可）を示す。これは、ルックアップテーブルの使用によって行われる。ステップＳ９１では、単項符号が８ビットブロックにわたって及ぶことがあるので、４個の８ビットブロックは３２ビットブロックに組み合わされ、次いで、４個の３２ビットブロックは、１２８ビットブロックに組み合わされる。１２８ビットブロックは再度、ストップビット位置の位置のリストである。単項値を取り出すために、ステップＳ９２では、単項符号の値を与える、各々の隣接するストップビット位置の値の間の差が取られる。

【0070】

[0070]単項データの８ビットブロックを中間形式に分析するためにルックアップテーブルを使用することによって、図９ａの方法を達成することができる。これは、最上部の行９４がその下に示される各々のバイト内のビット位置を識別する、図９ｂに示される。各々のバイトにおける最初のビットが「０」であり、最後のビットが「７」である。第２の行９５は、単項データのバイトを示す。単項データにおけるストップビットが「０」であることが想起されよう。第３の行９６に示される中間形式では、各々のバイトは、バイト内のストップビットの位置を示す最大で３ビット符号のリストに拡張される。３２ビットセグメントへの４個の８ビットセグメントのＲａｄｉｘ－４の組み合わせが実行され、図９ｂの第４の行９７及び第５の行９８に示される。第４の行９７では、識別するビットのペアは、符号への最上位ビット（ＭＳＢ）として追加される。最初のバイトに対し、値「００」が３ビット符号に追加され、第３のバイトに対し、値「１０」が３ビット符号に追加される、などである。第５の行では、５ビット符号が連結されて、３２ビットワード内のストップビット位置のリストを形成する。１２８ビットセグメントへの４個の３２ビットセグメントの後続のＲａｄｉｘ－４の組み合わせは、同様の処理を使用して、単項ストップビットの位置を示す７ビット符号のリストを生成する。ステップＳ９２にあるように、隣接する値の減算は、単項データの長さ、よって、単項データの値を得る。

【0071】

[0071]上で説明されたように、第１の特定の実施形態は、セル内のゴロムライス符号の単項部分及び余り部分を組み合わせる。各々のセルは、単項部分及び余り部分の両方を含んでもよい。このセル内の活性化データの単項部分及び余り部分を混合することは、ＤＲＡＭから取り出される処理済みデータストリームにわたって単項部分及び余り部分を拡散する利点を有する。これは、復号の前に単項データを記憶するためのデコーダにおける構文解析バッファのサイズを低減させることを可能にし、それによって、ハードウェア要件を低減させる。

【0072】

[0072]第１の特定の実施形態では、活性化データの圧縮が議論された。第２の特定の実施形態では、重み値の圧縮にその技術が適用される。図１０ａは、第２の特定の実施形態のモバイルデバイス１０を示す。モバイルデバイス１０が本明細書で説明されるが、説明される技術は、それらに限定されないが、タブレットコンピュータ、ラップトップコンピュータ、パーソナルコンピュータ（ＰＣ）、サーバなどを含む、ニューラルネットワークと関連付けられた重み値を取り出す、いずれかのタイプのコンピューティングデバイスに適用されてもよい。図１０ｂは、モバイルデバイス１０のハードウェアを示す。モバイルデバイス１０は、ＣＰＵ１００の形式にある処理要素及びニューラル処理ユニット（ＮＰＵ）の形式にある特殊プロセッサ１０１を含む。モバイルデバイス１０は加えて、ランダムアクセスメモリ（ＲＡＭ）１０２の形式にある記憶装置を含む。図１０ｂには示されないが、追加の不揮発性記憶装置も設けられる。モバイルデバイス１０は、ユーザに情報を表示するためのディスプレイ１０３、並びにＷｉ－Ｆｉ（商標）及びＬＴＥ（商標）などの技術を使用して、様々なデータネットワークを通じてデータを転送及び受信するようモバイルデバイス１０を接続することを可能にする通信システム１０４を含む。

【0073】

[0073]図１１は、ＮＰＵ１０１と関連付けられたモバイルデバイス１０にインストールされたシステムアーキテクチャを示す。システムアーキテクチャは、ニューラルネットワークに関連する計算のハードウェア加速化のために、ソフトウェアアプリケーション１１０がＮＰＵ１０１にアクセスすることを可能にする。システムアーキテクチャは、携帯電話またはタブレットコンピュータなどの上での使用のための、Ａｎｄｒｏｉｄ（登録商標）ソフトウェアアーキテクチャである。

【0074】

[0074]ニューラルネットワーク処理に関連して特定の処理のハードウェア加速化のために、機械学習ライブラリ１１１を利用するソフトウェアアプリケーション１１０が開発されてきた。アプリケーション１１０から命令及びデータを受信する、Ａｎｄｒｏｉｄ（登録商標）ニューラルネットワークランタイムとして知られる、ランタイム環境１１２がライブラリの下に設けられる。ランタイム環境１１２は、ソフトウェアアプリケーション１１０とＮＰＵ１０１との間の通信、及び最も適切なハードウェアに対する実行タスクのスケジューリングに関与する中間層である。ランタイム環境１１２の直下に、少なくとも１つのプロセッサドライバ及び関連する特殊プロセッサ、このケースではＮＰＵ１０１が設けられる。デジタルシグナルプロセッサ、ニューラルネットワークプロセッサ、及びグラフィックプロセッサ（ＧＰＵ）など、複数のプロセッサ及び関連するドライバがランタイム環境１１２の直下に設けられてもよい。しかしながら、冗長な説明を回避するために、第２の特定の実施形態と関連して、ＮＰＵ１０１及び関連するプロセッサドライバ１１３のみが説明される。

【0075】

[0075]図１２は、ＮＰＵ１０１の部分構成要素を示す。ＮＰＵ１０１は、モバイルデバイス１０のＲＡＭ１０２への外部インタフェース上でのデータ転送を扱う、直接メモリアクセス構成要素１２１に接続された重みデコーダ１２０を含む。重みデコーダ１２０からの復号された値は、ＮＰＵ１０１による後続の処理のために、乗算器アキュムレータユニット１２２に送信される。

【0076】

[0076]第２の特定の実施形態では、プロセッサドライバ１１３は、フロー制御ルールのセットによって判定されたチャンク構造に従って、重み値をＲＡＭ１０２に記憶する。続いて、直接メモリアクセス構成要素１２１は、ＲＡＭ１０２から重み値を取り出し、重みデコーダ１２０は、チャンク構造からデータを抽出する。

【0077】

[0077]プロセッサドライバ１１３は、ニューラルネットワークに対する圧縮されていない（未処理の）重み値のセットを取得する。圧縮されていない重み値のソースは、ここで議論される技術を目的として考慮されない。しかしながら、一実施例では、圧縮されていない重み値は、アプリケーション１１０によって、Ａｎｄｒｏｉｄニューラルネットワークランタイムに提供されてもよい。

【0078】

[0078]重み値は、二値データなどの圧縮されていないフォーマットにおいて受信される。プロセッサドライバ１１３によって実行される第１のステップは、ゼロランコーディングである。ゼロランコーディングは、値０を有する重み値が重みストリームにおいて頻繁にある場合に利点を有する。ｎ個の非ゼロ重み値を含む重み値のシーケンスに対し、重み値（ｗｅｉｇｈｔ＿ｖａｌｕｅｓ）の配列は、非ゼロ重み値のシーケンスとしてプロセッサドライバ１１３によって形成される。プロセッサドライバ１１３は、非ゼロ重み値の間のゼロラン長（ｚｒｕｎｓ）の配列をも識別する。ゼロランの配列は、ｎ＋１の長さを有する。ｚｒｕｎｓのシーケンスでは、ｚｒｕｎｓ［０］は、最初のゼロラン長であり、ｚｒｕｎｓ［ｎ］は、最後のゼロランである。

【0079】

[0079]例えば、以下の重みシーケンス、０、５、６、０、０、０、７、０を考える。プロセッサドライバ１１３は、３つの非ゼロ値が存在することを理由に、ｎ＝３をコーディングする。重み値のシーケンスは、ｗｅｉｇｈｔ＿ｖａｌｕｅｓ＝｛５，６，７｝であり、ゼロランのシーケンスは、ｚｒｕｎｓ＝｛１，０，３，１｝である。それらの２つのシーケンスから、元の重みシーケンスが再構築されてもよい。このようにして、プロセッサドライバ１１３は、重み値の入来するストリームをｗｅｉｇｈｔ＿ｖａｌｕｅｓのシーケンス及びｚｒｕｎｓのシーケンスに分離する。

【0080】

[0080]ｗｅｉｇｈｔ＿ｖａｌｕｅｓは、第１の除数を使用してゴロムライス符号に変換され、ｚｒｕｎｓは、第２の除数を使用してゴロムライス符号に変換される。第１の特定の実施形態と同一の方式では、ゴロムライス符号は、プロセッサドライバ１１３によって、単項ストリーム及び余りストリームに分離される。したがって、プロセッサドライバ１１３は、ＲＡＭ１０２に記憶するためのチャンクに含まれることになる４個の異なるデータストリーム、ｗｅｉｇｈｔ＿ｖａｌｕｅｓの単項部分（ｗｕｎａｒｙ）、ｗｅｉｇｈｔ＿ｖａｌｕｅｓの余り部分（ｗｒｅｍａｉｎ）、ｚｒｕｎｓの単項部分（ｚｕｎａｒｙ）、及びｚｒｕｎｓの余り部分（ｚｒｅｍａｉｎ）を生成する。それらの異なるデータタイプは、以下で説明されるように、フロー制御ルールのセットを使用してチャンク構造に追加される。

【0081】

[0081]プロセッサドライバ１１３によって受信された重み値は、各々のスライスの始めにあるスライスヘッダを有する、スライスにおいてコーディングされる。スライスヘッダは、ｗｅｉｇｈｔ＿ｖａｌｕｅゴロムライス符号を生成するために使用される除数及びｚｒｕｎゴロムライス符号を生成するために使用される除数に関する情報を含む。スライスヘッダはまた、スライスの長さに関する情報を含む。スライスヘッダの後、上で言及された異なるデータタイプを符号化するいくつかのチャンクが続く。チャンクは、単項値を含むことと余り値を含むこととの間で交互になり、余り値（ｗｒｅｍａｉｎ及びｚｒｅｍａｉｎ）は、対応する単項値（ｗｕｎａｒｙ及びｚｕｎａｒｙ）を含むチャンクの後にチャンクに含まれる。単項値（ｗｕｎａｒｙ及びｚｕｎａｒｙ）を符号化する各々のチャンクは、１２個の重みシンボル及び１２個のゼロランシンボル（各々のシンボルは、ゴロムライス符号の第１の部分に対応する）の最大値を符号化する。数が変化する理由は、シンボルに対応する単項値が可変長の値であり、シンボルの長さが短いケースよりもシンボルの長さが長い場合、より少ない単項値を符号化することができることである。単項チャンクの長さは、デコーダの特性に基づいて選択される最大の予め定義された値を有する。単項データに続き、余り値を含むチャンクは、上で言及されたように、それらが先行するチャンクに含まれる単項シンボルに対応する余り値を含むことを理由に、可変長のチャンクである。

【0082】

[0082]単項データを含むチャンクに対し、単項値の追加は、それまでにスライス内のチャンクに追加されたｗｕｎａｒｙ値の数から、それまでにスライス内のチャンクに追加されたｚｕｎａｒｙ値の数を差し引いた値であるバランスを記録することによって制御される。バランスが８以上である場合、次いで、ｚｕｎａｒｙ値のみが次の単項チャンクに含まれる。バランスが０未満である場合、次いで、ｗｕｎａｒｙ値のみが次の単項チャンクに含まれる。

【0083】

[0083]単項データを含む第１のチャンクを形成するために、最大チャンクサイズを超えない限り、ｗｕｎａｒｙ値に値する最大で１２個のシンボルがチャンクに追加される。チャンクの余りは次いで、ｚｒｕｎシンボルに対応するｚｕｎａｒｙ値により埋められる。第２のチャンクは、第１のチャンクに追加されたシンボルの単項部分と関連付けられた余り値（ｗｒｅｍａｉｎ及びｚｒｅｍａｉｎ）を含む。第３のチャンクを形成するとき、３つの可能性が存在する。第１に、上で説明されたバランスが０～７である場合、次いで、ｚｒｕｎシンボルに対応するｚｕｎａｒｙ値により埋めることがそれに続く、チャンクに追加されたｗｕｎａｒｙデータの最大で１２個のシンボルにより、第１のチャンクについての同一の処理が続く。第２に、バランスが８以上である場合、次いで、チャンクがｚｕｎａｒｙ値のみにより埋められる。これは、より多くのｗｕｎａｒｙ値が符号化されている場合、ｚｕｎａｒｙ値が追いつくことを可能にする。第３に、バランスが０未満である場合、次いで、チャンクがｗｕｎａｒｙ値のみにより埋められる。これは、より多くのｚｕｎａｒｙ値が符号化されている場合、ｗｕｎａｒｙ値が追いつくことを可能にする。第４のチャンクは、第３のチャンクに含まれるシンボルに対応する余り値を含む。上で説明されたフロー制御ルールのロジックが図１３に示される。この処理は、スライスの全てのデータが符号化されるまで続く。

【0084】

[0084]後に、重みデータは、直接メモリアクセス構成要素１２１によって重みデコーダ１２０における使用のために取り出される。重みデコーダ１２０は、次の通りに、直接メモリアクセス構成要素１２１によって取り出された処理済みデータのストリームからの抽出された値を識別する。チャンクを復号するロジックが図１４に示される。前に説明された符号化と同様に、バランス値は、重みデコーダ１２０によって維持される。重みデコーダ１２０におけるバランス値は、それまでにスライス内のチャンクから抽出されたｗｕｎａｒｙ値の数から、それまでにスライス内のチャンクから抽出されたｚｕｎａｒｙ値の数を差し引いた値である。

【0085】

[0085]復号されることになる第１のチャンクでは、重みデコーダ１２０は、チャンクからの全てのデータが抽出されるまで、またはｗｕｎａｒｙ値に値する１２個のシンボルが抽出されるまでのいずれかで、ｗｕｎａｒｙ値を抽出することを開始する。第１のチャンク内の後続の値は、ｚｕｎａｒｙ値として抽出される。

【0086】

[0086]符号化することと関連して議論されるように、単項チャンクに続くチャンクは、先行するチャンク内のシンボルに対応する余り値を含む。先行するチャンク内のｗｕｎａｒｙ値に値するシンボルの数は既知である。したがって、先行するチャンク内のｗｕｎａｒｙ値に対応する同一の数のｗｒｅｍａｉｎ値が抽出され、いずれかの後続の値がｚｒｅｍａｉｎ値として抽出される。後続の単項チャンクに対し、バランスが検査される。バランスがゼロ未満である場合、重みデコーダ１２０は、全ての単項値をｗｕｎａｒｙ値として抽出する。バランスが８またはそれよりも大きい場合、重みデコーダは、全ての値をｚｕｎａｒｙ値として抽出する。バランスが０～７である場合、最大で１２個のシンボルの第１の単項データがｗｕｎａｒｙ値として抽出され、いずれかの後続の値がｚｕｎａｒｙ値として抽出される。

【0087】

[0087]このようにして、重みデコーダ１２０は、データのタイプを識別するためのデータのストリーム内のビットコストなしに、ｚｒｕｎデータ及び重みシーケンスデータの両方の単項部分及び余り部分を抽出する。

【0088】

[0088]抽出されたｚｒｕｎデータ及び重みシーケンスデータはその後、下位の重み値を回復するよう復号される。ゴロムライス符号の単項部分及び余り部分の復号が第１の実施形態と関連して議論されており、その説明は、ここでは繰り返されない。

【0089】

[0089]上記実施形態は、例示的な実施例として理解されることになる。更なる実施形態が想定される。例えば、第１の実施形態では、単項データが３２ビット部分内のチャンクに追加される。しかしながら、部分のサイズは重要ではなく、図５に示されるチャンク構造は、チャンクを構文解析することになるプロセッサの特定の要件に応じて適合される。

【0090】

[0090]第２の実施形態は、Ａｎｄｒｏｉｄニューラルネットワークアーキテクチャを利用する。しかしながら、本明細書で説明される技術は、状況に応じて異なるソフトウェアアーキテクチャに適用されてもよい。例えば、サーバに基づく実装態様のコンテキストにおいて異なるソフトウェアアーキテクチャが使用されてもよい。
［項目１］
処理要素による使用のための方法であって、
複数の可変長符号を取得することであって、各々の可変長符号は、可変長の第１の部分及び第２の部分を有する、取得することと、
前記可変長符号を前記可変長符号の第１の部分及び前記可変長符号の第２の部分に分離することと、
前記可変長符号の前記第１の部分からのデータを含む処理済みストリームの各々のチャンクに対し、前記第１の部分からの前記データが、制御ルールに従って判定されたサイズを有する前記処理済みストリームのチャンク内のサブストリームを形成するように、前記制御ルールのセットを使用して、前記チャンク内の前記処理済みストリームを形成することと、
を備えた、方法。
［項目２］
前記可変長符号の前記第１の部分は、単項部分であり、前記可変長符号の前記第２の部分は、仮数部分である、項目１に記載の方法。
［項目３］
前記可変長符号の前記仮数部分は、切り捨てられた二値部分である、項目２に記載の方法。
［項目４］
各々の可変長符号の前記単項部分は、前記可変長符号によって表される元の値の商を表す、項目２または３に記載の方法。
［項目５］
各々の可変長符号の前記仮数部分は、前記可変長符号によって表される値の余りを表す固定長の二値符号である、項目２～４のいずれか１項に記載の方法。
［項目６］
前記可変長符号は、ゴロムライス符号である、項目１～５のいずれか１項に記載の方法。
［項目７］
前記処理済みストリームの各々のチャンクは、前記可変長符号の前記第１の部分からのデータ及び前記可変長符号の前記第２の部分からのデータを含むことができ、前記可変長符号の前記第１の部分からのデータを含むことができ、及び前記可変長符号の前記第２の部分からのデータを含まず、または前記可変長符号の前記第２の部分からのデータを含むことができ、及び前記可変長符号の前記第１の部分からのデータを含まない、項目１～６のいずれか１項に記載の方法。
［項目８］
前記制御ルールは、各々のチャンク内の前記単項サブストリームのサイズを直列に判定するように構成されている、項目２～５のいずれか１項に記載の方法。
［項目９］
前記制御ルールは、前記処理済みストリームに追加されないで残っている前記可変長符号の前記単項部分の量に基づいて、各々のチャンク内の前記単項サブストリームの前記サイズのサイズを判定するように構成されている、項目８に記載の方法。
［項目１０］
前記処理済みストリームは、予め定められた長さのセルから形成され、前記処理済みストリームに追加されないで残っている前記可変長符号の前記単項部分の前記量は、前記処理済みストリームに追加されないで残っているセルと関連付けられた前記可変長符号の前記単項部分のビットの数である、項目９に記載の方法。
［項目１１］
前記処理済みストリームは、予め定められた長さのセルから形成され、前記処理済みストリームの各々のセルは、ヘッダ及び複数のチャンクを有し、前記ヘッダは、前記セルの長さ及び前記セル内の前記可変長符号の前記単項部分の長さを示す、項目１～１０のいずれか１項に記載の方法。
［項目１２］
第２の複数の可変長符号を取得することと、
前記第２の複数の可変長符号を前記可変長符号の第１の部分及び前記可変長符号の第２の部分に分離することと、を更に備え、
チャンク内の処理済みストリームを形成する前記ステップは、第１の複数の可変長符号及び第２の複数の可変長符号のうちの少なくとも１つの第１の部分からのデータを含む前記処理済みストリームの各々のチャンクに対し、フロー制御ルールが前記第１の複数の可変長符号の第１の部分の数及び前記第２の複数の可変長符号の第１の部分の数が前記チャンクに含まれると判定するように、前記制御ルールのセットを使用する、
項目１に記載の方法。
［項目１３］
処理済みストリームを形成することは、チャンクに含まれた前記第１の複数の可変長符号の第１の部分の数とチャンクに含まれた前記前記第２の複数の可変長符号の第１の部分の数との間の差を記録するバランス値を維持することを含み、前記フロー制御ルールは、前記バランス値に基づいて、チャンクに含まれる前記第１の複数の可変長符号の前記第１の部分の数及び前記第２の複数の可変長の前記第１の部分の数を判定するために使用される、項目１２に記載の方法。
［項目１４］
前記複数の可変長符号は、ニューラルネットワークにおける使用のための重み値を表す、項目１～１３のいずれか１項に記載の方法。
［項目１５］
前記複数の可変長符号は、ニューラルネットワークの層の出力である活性化ストリーム内の値を表す、項目１～１４のいずれか１項に記載の方法。
［項目１６］
処理済みデータストリームを復号する方法であって、
複数の可変長符号に関連するデータを含む処理済みデータストリームを取得することであって、各々の可変長符号は、可変長の第１の部分及び第２の部分を有し、前記処理済みストリームは、チャンク内で形成され、前記処理済みストリームの少なくとも１つのチャンクは、前記可変長符号の第１の部分から形成されたデータのサブストリームを含む、取得することと、
フロー制御ルールのセットを使用して、前記処理済みデータストリームの前記チャンク内の前記サブストリームを識別及び抽出することと、
を備えた、方法。
［項目１７］
前記可変長符号の各々の第１の部分は、ストップビットを有する単項データとして符号化され、前記方法は、
前記処理済みデータの複数のチャンクから、複数の識別及び抽出されたサブストリームを取得することと、
各々の抽出されたサブストリームを、前記サブストリーム内のストップビットのビット位置のリストを表す中間形式に変換することと、
複数の前記変換されたサブストリームを組み合わせて、ビット位置の拡大されたリストを形成することと、
ビット位置の前記拡大されたリスト内の前記ストップビットの間の距離を測定して、前記第１のストリーム内の前記可変長符号の前記第１の部分の前記値を回復することと、
を更に備えた、項目１６に記載の方法。
［項目１８］
処理要素及び記憶装置を備えたデータ処理システムであって、前記記憶装置は、符号部分を記憶し、前記符号部分は、前記処理要素によって実行されるとき、前記データ処理システムに、
複数の可変長符号を取得させ、各々の可変長符号は、可変長の第１の部分及び第２の部分を有し、
前記可変長符号を前記可変長符号の第１の部分及び前記可変長符号の第２の部分に分離させ、
前記可変長符号の前記第１の部分からのデータを含む処理済みストリームの各々のチャンクに対し、前記第１の部分からの前記データが、制御ルールに従って判定されたサイズを有する前記処理済みストリームのチャンク内のサブストリームを形成するように、前記制御ルールのセットを使用して、前記チャンク内の前記処理済みストリームを形成させる、
データ処理システム。

【図1】